04 | 神经网络控制 ¶

约 2157 个字预计阅读时间 8 分钟

人工神经网络概述 ¶

人工神经网络的基本概念 ¶

ANN（Artificial Neural Network）是由大量简单的处理单元（神经元）互联而成的并行分布式系统，是对人脑的抽象和模拟。
建立在神经科学、数学、物理学、计算机科学基础上，是一种新的计算机制和模型。
可用硬件（电子线路）或软件（计算机程序）实现，硬件实现时计算效率高。
是机器学习的核心算法，具有强大的从数据中学习模式和特征的能力。

生物神经元模型 ¶

生物神经元由树突（输入）、细胞体（处理）、轴突（输出）和突触（连接）构成。
神经元接收多个输入信号，进行加权求和，超过阈值则产生输出（兴奋或抑制）。

人工神经元模型 ¶

输入输出关系为：

$I_i = \sum_{j=1}^n w_{ij} x_j - \theta_i, \quad y_i = f(I_i)$

其中 $w_{ij}$ 为连接权值，$\theta_i$ 为阈值，$f(\cdot)$ 为激发函数。

常用激发函数 ¶

类型	函数表达式	特点
$$
f(x) = begin{cases} 1, & x geq 0 \ 0, & x < 0 end{cases}
$$	S 型（Sigmoid）	$f(x) = \frac{1}{1 + e^{-\beta x}}$
双曲正切	$f(x) = \tanh(x)$	输出在 (-1,1)，中心对称
高斯型（RBF）	$f(x) = e^{-x^2/\delta^2}$	局部响应，常用于径向基网络

神经网络学习算法 ¶

学习方式分类 ¶

有师学习：根据期望输出与网络输出的误差调整权值（如 δ 规则、BP 算法）。
无师学习：网络根据输入模式自动调整权值（如 Hebb 规则、竞争学习）。
强化学习：通过“评论员”评价输出优度，调整权值（介于有师与无师之间）。

Delta（δ）学习规则 ¶

误差准则函数：

$E = \frac{1}{2} \sum_{p=1}^{P} (d_p - y_p)^2$

权值调整公式：

$\Delta W_i = \eta \sum_{p=1}^{P} (d_p - y_p) f'(\theta_p) X_{ip}$

只适用于线性可分函数，无法直接用于多层网络。

概率式学习（模拟退火算法）¶

引入“能量”概念，能量对应目标函数值。
状态接受概率遵循 Metropolis 准则：

$P = \exp\left(-\frac{\Delta E}{kT}\right)$

步骤：
1. 初始化解 $S_0$ 和温度 $T_0$
2. 在温度 $T_k$ 下随机扰动生成新解
3. 若新解更优则接受，否则以一定概率接受
4. 降温并重复，直至达到终止温度
能跳出局部极小，趋向全局最优。

Hebb 学习规则 ¶

规则：两个神经元同时激活时，连接强度增强：

$w_{ij}(k+1) = w_{ij}(k) + y_i y_j$

是一种无师学习，基于相关性调整权值。

竞争式学习 ¶

神经元之间竞争激活，胜者增强其权值。
常用于自组织神经网络（如 ART 模型）。
权值调整公式：

$$ Delta w_{ij} = begin{cases} alpha (u_i - w_{ij}), & i in N_c \ 0, & i notin N_c end{cases} $$+ 其中$ N_c $ 为胜者邻域。

前馈神经网络 ¶

感知器 ¶

最简单的线性阈值神经元网络。
单层感知器只能解决线性可分问题。
学习算法：

$w_i(k+1) = w_i(k) + \eta [d(k) - y(k)] x_i$

多层感知器（MLP）¶

含一个或多个隐层，可解决非线性问题（如异或）。
每一层为单层感知器的组合，学习算法采用 δ 规则。

误差反向传播网络（BP 网络）¶

结构：输入层、隐层（可多层）、输出层，单向传播。
激发函数常用 Sigmoid 函数：

$f(x) = \frac{1}{1+e^{-x}}, \quad f'(x) = f(x)[1-f(x)]$

BP 算法步骤：
1. 前向传播计算输出
2. 计算输出层误差：

$\delta_k = (d_k - O_k) f'(net_k)$

3. 反向传播误差至隐层：

$\delta_j = f'(net_j) \sum_{k} \delta_k w_{jk}$

4. 权值调整：

$w_{ij}(t+1) = w_{ij}(t) + \eta \delta_j O_i + \alpha [w_{ij}(t) - w_{ij}(t-1)]$

5. 其中 $\alpha$ 为平滑因子。

BP 网络的优缺点 ¶

优点：
- 可逼近任意非线性函数
- 具有自学习能力
缺点：
- 易陷入局部极小
- 学习速度慢
- 结构选择依赖经验
- 泛化能力与训练能力矛盾（易过拟合）

改进方法 ¶

增加惯性项（动量项）
自适应学习率
与全局优化算法结合（如遗传算法、模拟退火）
正则化、早停等防止过拟合

基于神经网络的系统建模与辨识 ¶

辨识三要素 ¶

输入 / 输出数据
模型类（结构）
等价原则（优化目标）

神经网络辨识特点 ¶

不依赖系统数学模型，直接利用网络拟合输入输出关系
可辨识本质非线性系统
收敛速度与系统维数无关
网络权值对应模型参数

常用辨识模型 ¶

并联模型：网络输出反馈作为输入（动态反馈）
串 - 并联模型：实际系统输出作为网络输入（静态前馈）

基于 BP 网络的系统辨识示例 ¶

系统模型：

$y_p(k+1) = f[y_p(k), \cdots, y_p(k-n+1); u(k), \cdots, u(k-m+1)]$

网络结构：输入层 $(n+m)$ 节点，隐层节点数 $\geq n+m$，输出层 1 节点
性能指标：

$J = \frac{1}{2} \sum [y(k) - \hat{y}(k)]^2$

采用 BP 算法调整权值

神经控制的结构方案 ¶

基于神经网络的监督式控制 ¶

使用参考控制器（如线性控制器）作为“教师”训练神经网络控制器。

神经网络逆模型控制 ¶

训练网络作为系统的逆模型，串接在系统前：

$u(k) = \phi(y_d(k+1), y(k), \cdots, u(k-1), \cdots)$

问题：逆模型可能不稳定，需结合 PID 增强鲁棒性。

神经网络内模控制 ¶

系统模型与实际系统并行，误差反馈经滤波器处理后由逆模型控制器调节。

神经网络自适应控制 ¶

自校正控制：在线辨识模型并调整控制器参数
模型参考自适应控制：使系统输出跟踪参考模型输出

神经网络预测控制 ¶

使用神经网络作为预测模型，结合滚动优化与反馈校正。

神经网络 PID 控制 ¶

基于 BP 网络的 PID 控制 ¶

神经网络调节 PID 参数 $K_P, K_I, K_D$
网络输入：误差 $e(k), e(k-1), e(k-2)$ 等
网络输出：$K_P, K_I, K_D$
性能指标：

$J = \frac{1}{2} [r(k+1) - y(k+1)]^2$

权值调整需估计 $\partial y(k+1)/\partial u(k)$，常用符号函数近似。

改进型 BP 网络 PID 控制 ¶

结合预测模型（线性或非线性）提供输出估计，替代实际系统 Jacobian。

应用实例：板带材轧制厚度控制 ¶

问题描述 ¶

轧制过程为强非线性系统，传统 AGC 基于线性近似，性能受限。
采用神经网络自适应厚度控制（NNA-AGC）。

控制策略 ¶

神经网络控制器输入：

$[h(k-1), H(k), H(k-1), h_{ref}(k)]$

输出：空载辊缝 $S_0(k-1)$
性能指标：

$E_k = \frac{1}{2} [h_{ref}(k) - h(k)]^2$

采用惯性 BP 算法：

$w_{ij}(k+1) = w_{ij}(k) - \eta \frac{\partial E_k}{\partial w_{ij}} + \beta \cdot \Delta w_{ij}(k)$

$\partial h(k)/\partial S_0(k-1)$ 用符号函数近似。

仿真结果 ¶

与传统 PID 相比，NNA-AGC 具有更好的跟随性和抗扰性（对入口厚度波动、塑性系数变化等）。

神经网络控制的特点与展望 ¶

特点 ¶

结构多样，各有适用场景
需大量训练数据，对象需充分激励
泛化能力有限，依赖网络结构与训练质量

学习算法发展趋势 ¶

经典 BP → Lyapunov 稳定性理论结合
与模糊逻辑、遗传算法等融合
强化学习、深度学习在控制中的应用

总结 ¶

本课程系统介绍了神经网络在控制中的基本原理、学习算法、控制结构与典型应用。重点包括：

神经元模型与常用激发函数
各类学习规则（δ、Hebb、竞争、模拟退火）
前馈网络（感知器、BP 网络）及其训练算法
神经网络在系统辨识与控制中的多种结构方案
神经网络 PID 控制及其改进方法
实际工业应用案例（轧制厚度控制）

神经网络控制为解决复杂非线性、不确定性系统的控制问题提供了有效工具，其发展仍在不断深入，与其它智能方法的融合是未来重要方向。

笔记根据浙江大学刘山老师《智能控制技术》PPT 整理，仅供参考学习使用。

类型	函数表达式	特点
$$
f(x) = begin{cases} 1, & x geq 0 \ 0, & x < 0 end{cases}
$$	S 型（Sigmoid）	\(f(x) = \frac{1}{1 + e^{-\beta x}}\)
双曲正切	\(f(x) = \tanh(x)\)	输出在 (-1,1)，中心对称
高斯型（RBF）	\(f(x) = e^{-x^2/\delta^2}\)	局部响应，常用于径向基网络