广西地球物理学会

电子邮箱

密码

注册 忘记密码?
人工智能的基石——神经网络理论以及它的工作原理
来源: | 作者:原创 欧拉格朗日 电气设备多场耦合分析 | 发布时间: 2025-03-12 | 126 次浏览 | 分享到:

原创 船长 E等于mc平方2024年10月26日 22:23广东

      神经网络——严格地讲,应该叫人工神经网络(Artificial Neural Network,即ANN ),是20世纪80年代以来人工智能领域兴起的研究热点,也是现代人工智能的核心基础之一。它从信息处理角度对人脑神经元网络进行抽象,建立一种相似模型,按不同的连接

方式组成不同的网络,旨在模仿人类大脑结构和功能的计算模型。在工程与学术界也常直接简称为神经网络或类神经网络(所以,以下统一用“神经网络”代指“人工神经网络”)。

人工神经元我们先从神经网络的基本单元——人工神经元讲起:

人工神经元模型是一个包含输入,输出与计算功能的模型。输入可以类比为神经元的树突,而输出可以类比为神经元的轴突,计算则可以类比为细胞核。


下图是一个人工神经元的标准形式,x1、x2…xn为输入,Wk1、Wk2…Wkn是神经元的输入权重,b为偏置值,Z为加权求和值,φ为激活函数,y为最终的输出。


每个人工神经元接收来自前一层的输入,执行以下步骤。

加权求和(Weighted Sum)神经元将每个输入乘以一个权重,然后求和。这一步可以表示为:其中, 是输入  的权重,b 是偏置项,z 是线性组合的结果。

激活函数(Activation Function)线性组合结果 z 经过激活函数(通常为非线性函数),添加非线性变换,以增强模型的表达能力。常见的激活函数及输出响应曲线图:


以下是一个典型的人工神经元模型:包含有4个输入、1个偏置值,1个输出,以及2个计算(求和计算、非线性激活函数计算)功能。



可以看到当权重值变化时,输出也在变化。一个神经网络的训练算法就是让所有人工神经元的权重值调整到最佳,以使得整个网络的预测或分类效果最好。

神经网络

神经网络是由大量的人工神经元(也称节点)相互连接构成的一种计算模型。

神经网络的基本结构通常包括输入层、隐藏层和输出层。

神经网络基本结构:输入层(Input Layer)输入层接收来自外部的数据,每个节点对应一个输入特征。隐藏层(Hidden Layers)隐藏层位于输入层和输出层之间。神经网络的复杂性通常来源于隐藏层的数量和每一层中神经元的数量。每个隐藏层中的节点通过加权

连接接收来自上一层的输入信号,并通过激活函数进行非线性变换。输出层(Output Layer)输出层的节点输出最终的结果,这些结果可以是分类标签、回归值等。多层神经网络中,输出也是按照一层一层的方式来计算。从最外面的层开始,算出所有单元的值以后,再继续计算更深一层。只有当前层所有单元的值都计算完毕以后,才会算下一层。有点像计算向前不断推进的感觉。所以这个过程也叫做“正向传播”、“前向传播”或通俗一点讲就是推理过程。




以下为一个数字识别的多层神经网络,网络的权重已经训练好(后续的章节我们会讲解神经网络是如何学习的,也就是网络权重训练过程),青蓝色的粗线表示权重值较大,黑色细线表示权重值较小。左侧的图像(4×3大小,共计12个像素,你可以看出来,其实就是

数字“0”)作为神经网络的输入,经过前向传播,也就是上文中描述的逐层计算过程;最终代表数字“0”的输出值较大,代表“1”的输出值较小,表明网络的推理判断认为输入的图像属于数字“0”的概率更大。


神经网络的特点和优越性

第一,具有自学习功能。例如实现图像识别时,只在先把许多不同的图像样板和对应的应识别的结果输入神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。

第二,具有联想存储功能。用神经网络的反馈网络就可以实现这种联想。

第三,具有高速寻找优化解的能力。寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型神经网络,发挥计算机的高速运算能力,可能很快找到优化解。最近十多年来,神经网络的研究工作不断深入,随着卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、生成对抗网络(GAN)、转换器Transformer等的技术发展,以神经网络为基础的深度学习技术在图像识别,自然语言处理,语音识别和机器翻译等多种任务中取得了重大进展,它现在是人工智能最活跃

和最有前途的研究领域之一。其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了优秀的智能特性,已经成为现代人工智能技术的基石。