04 | 神经网络控制 ¶
约 2157 个字 预计阅读时间 8 分钟
人工神经网络概述 ¶
人工神经网络的基本概念 ¶
- ANN(Artificial Neural Network)是由大量简单的处理单元(神经元)互联而成的并行分布式系统,是对人脑的抽象和模拟。
- 建立在神经科学、数学、物理学、计算机科学基础上,是一种新的计算机制和模型。
- 可用硬件(电子线路)或软件(计算机程序)实现,硬件实现时计算效率高。
- 是机器学习的核心算法,具有强大的从数据中学习模式和特征的能力。
生物神经元模型 ¶
- 生物神经元由树突(输入
) 、细胞体(处理) 、轴突(输出)和突触(连接)构成。 - 神经元接收多个输入信号,进行加权求和,超过阈值则产生输出(兴奋或抑制
) 。
人工神经元模型 ¶
- 输入输出关系为:
\(I_i = \sum_{j=1}^n w_{ij} x_j - \theta_i, \quad y_i = f(I_i)\)
- 其中 \(w_{ij}\) 为连接权值,\(\theta_i\) 为阈值,\(f(\cdot)\) 为激发函数。
常用激发函数 ¶
| 类型 | 函数表达式 | 特点 |
|---|---|---|
| $$ | ||
| f(x) = begin{cases} 1, & x geq 0 \ 0, & x < 0 end{cases} | ||
| $$ | S 型(Sigmoid) | \(f(x) = \frac{1}{1 + e^{-\beta x}}\) |
| 双曲正切 | \(f(x) = \tanh(x)\) | 输出在 (-1,1),中心对称 |
| 高斯型(RBF) | \(f(x) = e^{-x^2/\delta^2}\) | 局部响应,常用于径向基网络 |
神经网络学习算法 ¶
学习方式分类 ¶
- 有师学习:根据期望输出与网络输出的误差调整权值(如 δ 规则、BP 算法
) 。 - 无师学习:网络根据输入模式自动调整权值(如 Hebb 规则、竞争学习
) 。 - 强化学习:通过“评论员”评价输出优度,调整权值(介于有师与无师之间
) 。
Delta(δ)学习规则 ¶
- 误差准则函数:
\(E = \frac{1}{2} \sum_{p=1}^{P} (d_p - y_p)^2\)
- 权值调整公式:
\(\Delta W_i = \eta \sum_{p=1}^{P} (d_p - y_p) f'(\theta_p) X_{ip}\)
- 只适用于线性可分函数,无法直接用于多层网络。
概率式学习(模拟退火算法)¶
- 引入“能量”概念,能量对应目标函数值。
- 状态接受概率遵循 Metropolis 准则:
\(P = \exp\left(-\frac{\Delta E}{kT}\right)\)
- 步骤:
- 初始化解 \(S_0\) 和温度 \(T_0\)
- 在温度 \(T_k\) 下随机扰动生成新解
- 若新解更优则接受,否则以一定概率接受
- 降温并重复,直至达到终止温度
- 能跳出局部极小,趋向全局最优。
Hebb 学习规则 ¶
- 规则:两个神经元同时激活时,连接强度增强:
\(w_{ij}(k+1) = w_{ij}(k) + y_i y_j\)
- 是一种无师学习,基于相关性调整权值。
竞争式学习 ¶
- 神经元之间竞争激活,胜者增强其权值。
- 常用于自组织神经网络(如 ART 模型
) 。 - 权值调整公式:
$$ Delta w_{ij} = begin{cases} alpha (u_i - w_{ij}), & i in N_c \ 0, & i notin N_c end{cases} $\(+ 其中\) N_c $ 为胜者邻域。
前馈神经网络 ¶
感知器 ¶
- 最简单的线性阈值神经元网络。
- 单层感知器只能解决线性可分问题。
- 学习算法:
\(w_i(k+1) = w_i(k) + \eta [d(k) - y(k)] x_i\)
多层感知器(MLP)¶
- 含一个或多个隐层,可解决非线性问题(如异或
) 。 - 每一层为单层感知器的组合,学习算法采用 δ 规则。
误差反向传播网络(BP 网络)¶
- 结构:输入层、隐层(可多层
) 、输出层,单向传播。 - 激发函数常用 Sigmoid 函数:
\(f(x) = \frac{1}{1+e^{-x}}, \quad f'(x) = f(x)[1-f(x)]\)
- BP 算法步骤:
- 前向传播计算输出
- 计算输出层误差:
\(\delta_k = (d_k - O_k) f'(net_k)\)
3. 反向传播误差至隐层:
\(\delta_j = f'(net_j) \sum_{k} \delta_k w_{jk}\)
4. 权值调整:
\(w_{ij}(t+1) = w_{ij}(t) + \eta \delta_j O_i + \alpha [w_{ij}(t) - w_{ij}(t-1)]\)
5. 其中 $\alpha$ 为平滑因子。
BP 网络的优缺点 ¶
- 优点:
- 可逼近任意非线性函数
- 具有自学习能力
- 缺点:
- 易陷入局部极小
- 学习速度慢
- 结构选择依赖经验
- 泛化能力与训练能力矛盾(易过拟合)
改进方法 ¶
- 增加惯性项(动量项)
- 自适应学习率
- 与全局优化算法结合(如遗传算法、模拟退火)
- 正则化、早停等防止过拟合
基于神经网络的系统建模与辨识 ¶
辨识三要素 ¶
- 输入 / 输出数据
- 模型类(结构)
- 等价原则(优化目标)
神经网络辨识特点 ¶
- 不依赖系统数学模型,直接利用网络拟合输入输出关系
- 可辨识本质非线性系统
- 收敛速度与系统维数无关
- 网络权值对应模型参数
常用辨识模型 ¶
- 并联模型:网络输出反馈作为输入(动态反馈)
- 串 - 并联模型:实际系统输出作为网络输入(静态前馈)
基于 BP 网络的系统辨识示例 ¶
- 系统模型:
\(y_p(k+1) = f[y_p(k), \cdots, y_p(k-n+1); u(k), \cdots, u(k-m+1)]\)
- 网络结构:输入层 \((n+m)\) 节点,隐层节点数 \(\geq n+m\),输出层 1 节点
- 性能指标:
\(J = \frac{1}{2} \sum [y(k) - \hat{y}(k)]^2\)
- 采用 BP 算法调整权值
神经控制的结构方案 ¶
基于神经网络的监督式控制 ¶
- 使用参考控制器(如线性控制器)作为“教师”训练神经网络控制器。
神经网络逆模型控制 ¶
- 训练网络作为系统的逆模型,串接在系统前:
\(u(k) = \phi(y_d(k+1), y(k), \cdots, u(k-1), \cdots)\)
- 问题:逆模型可能不稳定,需结合 PID 增强鲁棒性。
神经网络内模控制 ¶
- 系统模型与实际系统并行,误差反馈经滤波器处理后由逆模型控制器调节。
神经网络自适应控制 ¶
- 自校正控制:在线辨识模型并调整控制器参数
- 模型参考自适应控制:使系统输出跟踪参考模型输出
神经网络预测控制 ¶
- 使用神经网络作为预测模型,结合滚动优化与反馈校正。
神经网络 PID 控制 ¶
基于 BP 网络的 PID 控制 ¶
- 神经网络调节 PID 参数 \(K_P, K_I, K_D\)
- 网络输入:误差 \(e(k), e(k-1), e(k-2)\) 等
- 网络输出:\(K_P, K_I, K_D\)
- 性能指标:
\(J = \frac{1}{2} [r(k+1) - y(k+1)]^2\)
- 权值调整需估计 \(\partial y(k+1)/\partial u(k)\),常用符号函数近似。
改进型 BP 网络 PID 控制 ¶
- 结合预测模型(线性或非线性)提供输出估计,替代实际系统 Jacobian。
应用实例:板带材轧制厚度控制 ¶
问题描述 ¶
- 轧制过程为强非线性系统,传统 AGC 基于线性近似,性能受限。
- 采用神经网络自适应厚度控制(NNA-AGC
) 。
控制策略 ¶
- 神经网络控制器输入:
\([h(k-1), H(k), H(k-1), h_{ref}(k)]\)
- 输出:空载辊缝 \(S_0(k-1)\)
- 性能指标:
\(E_k = \frac{1}{2} [h_{ref}(k) - h(k)]^2\)
- 采用惯性 BP 算法:
\(w_{ij}(k+1) = w_{ij}(k) - \eta \frac{\partial E_k}{\partial w_{ij}} + \beta \cdot \Delta w_{ij}(k)\)
- \(\partial h(k)/\partial S_0(k-1)\) 用符号函数近似。
仿真结果 ¶
- 与传统 PID 相比,NNA-AGC 具有更好的跟随性和抗扰性(对入口厚度波动、塑性系数变化等
) 。
神经网络控制的特点与展望 ¶
特点 ¶
- 结构多样,各有适用场景
- 需大量训练数据,对象需充分激励
- 泛化能力有限,依赖网络结构与训练质量
学习算法发展趋势 ¶
- 经典 BP → Lyapunov 稳定性理论结合
- 与模糊逻辑、遗传算法等融合
- 强化学习、深度学习在控制中的应用
总结 ¶
本课程系统介绍了神经网络在控制中的基本原理、学习算法、控制结构与典型应用。重点包括:
- 神经元模型与常用激发函数
- 各类学习规则(δ、Hebb、竞争、模拟退火)
- 前馈网络(感知器、BP 网络)及其训练算法
- 神经网络在系统辨识与控制中的多种结构方案
- 神经网络 PID 控制及其改进方法
- 实际工业应用案例(轧制厚度控制)
神经网络控制为解决复杂非线性、不确定性系统的控制问题提供了有效工具,其发展仍在不断深入,与其它智能方法的融合是未来重要方向。
笔记根据浙江大学刘山老师《智能控制技术》PPT 整理,仅供参考学习使用。