跳转至

04 | 神经网络控制

2157 个字 预计阅读时间 8 分钟

人工神经网络概述

人工神经网络的基本概念

  • ANN(Artificial Neural Network)是由大量简单的处理单元(神经元)互联而成的并行分布式系统,是对人脑的抽象和模拟。
  • 建立在神经科学、数学、物理学、计算机科学基础上,是一种新的计算机制和模型。
  • 可用硬件(电子线路)或软件(计算机程序)实现,硬件实现时计算效率高。
  • 是机器学习的核心算法,具有强大的从数据中学习模式和特征的能力。

生物神经元模型

  • 生物神经元由树突(输入、细胞体(处理、轴突(输出)和突触(连接)构成。
  • 神经元接收多个输入信号,进行加权求和,超过阈值则产生输出(兴奋或抑制

人工神经元模型

  • 输入输出关系为:

\(I_i = \sum_{j=1}^n w_{ij} x_j - \theta_i, \quad y_i = f(I_i)\)

  • 其中 \(w_{ij}\) 为连接权值,\(\theta_i\) 为阈值,\(f(\cdot)\) 为激发函数。

常用激发函数

类型 函数表达式 特点
$$
f(x) = begin{cases} 1, & x geq 0 \ 0, & x < 0 end{cases}
$$ S 型(Sigmoid) \(f(x) = \frac{1}{1 + e^{-\beta x}}\)
双曲正切 \(f(x) = \tanh(x)\) 输出在 (-1,1),中心对称
高斯型(RBF) \(f(x) = e^{-x^2/\delta^2}\) 局部响应,常用于径向基网络

神经网络学习算法

学习方式分类

  • 有师学习:根据期望输出与网络输出的误差调整权值(如 δ 规则、BP 算法
  • 无师学习:网络根据输入模式自动调整权值(如 Hebb 规则、竞争学习
  • 强化学习:通过“评论员”评价输出优度,调整权值(介于有师与无师之间

Delta(δ)学习规则

  • 误差准则函数:

\(E = \frac{1}{2} \sum_{p=1}^{P} (d_p - y_p)^2\)

  • 权值调整公式:

\(\Delta W_i = \eta \sum_{p=1}^{P} (d_p - y_p) f'(\theta_p) X_{ip}\)

  • 只适用于线性可分函数,无法直接用于多层网络。

概率式学习(模拟退火算法)

  • 引入“能量”概念,能量对应目标函数值。
  • 状态接受概率遵循 Metropolis 准则:

\(P = \exp\left(-\frac{\Delta E}{kT}\right)\)

  • 步骤:
    1. 初始化解 \(S_0\) 和温度 \(T_0\)
    2. 在温度 \(T_k\) 下随机扰动生成新解
    3. 若新解更优则接受,否则以一定概率接受
    4. 降温并重复,直至达到终止温度
  • 能跳出局部极小,趋向全局最优。

Hebb 学习规则

  • 规则:两个神经元同时激活时,连接强度增强:

\(w_{ij}(k+1) = w_{ij}(k) + y_i y_j\)

  • 是一种无师学习,基于相关性调整权值。

竞争式学习

  • 神经元之间竞争激活,胜者增强其权值。
  • 常用于自组织神经网络(如 ART 模型
  • 权值调整公式:

$$ Delta w_{ij} = begin{cases} alpha (u_i - w_{ij}), & i in N_c \ 0, & i notin N_c end{cases} $\(+ 其中\) N_c $ 为胜者邻域。


前馈神经网络

感知器

  • 最简单的线性阈值神经元网络。
  • 单层感知器只能解决线性可分问题。
  • 学习算法:

\(w_i(k+1) = w_i(k) + \eta [d(k) - y(k)] x_i\)

多层感知器(MLP)

  • 含一个或多个隐层,可解决非线性问题(如异或
  • 每一层为单层感知器的组合,学习算法采用 δ 规则。

误差反向传播网络(BP 网络)

  • 结构:输入层、隐层(可多层、输出层,单向传播。
  • 激发函数常用 Sigmoid 函数:

\(f(x) = \frac{1}{1+e^{-x}}, \quad f'(x) = f(x)[1-f(x)]\)

  • BP 算法步骤
    1. 前向传播计算输出
    2. 计算输出层误差:

\(\delta_k = (d_k - O_k) f'(net_k)\)

3. 反向传播误差至隐层:

\(\delta_j = f'(net_j) \sum_{k} \delta_k w_{jk}\)

4. 权值调整:

\(w_{ij}(t+1) = w_{ij}(t) + \eta \delta_j O_i + \alpha [w_{ij}(t) - w_{ij}(t-1)]\)

5. 其中 $\alpha$ 为平滑因子。

BP 网络的优缺点

  • 优点
    • 可逼近任意非线性函数
    • 具有自学习能力
  • 缺点
    • 易陷入局部极小
    • 学习速度慢
    • 结构选择依赖经验
    • 泛化能力与训练能力矛盾(易过拟合)

改进方法

  • 增加惯性项(动量项)
  • 自适应学习率
  • 与全局优化算法结合(如遗传算法、模拟退火)
  • 正则化、早停等防止过拟合

基于神经网络的系统建模与辨识

辨识三要素

  • 输入 / 输出数据
  • 模型类(结构)
  • 等价原则(优化目标)

神经网络辨识特点

  • 不依赖系统数学模型,直接利用网络拟合输入输出关系
  • 可辨识本质非线性系统
  • 收敛速度与系统维数无关
  • 网络权值对应模型参数

常用辨识模型

  • 并联模型:网络输出反馈作为输入(动态反馈)
  • - 并联模型:实际系统输出作为网络输入(静态前馈)

基于 BP 网络的系统辨识示例

  • 系统模型:

\(y_p(k+1) = f[y_p(k), \cdots, y_p(k-n+1); u(k), \cdots, u(k-m+1)]\)

  • 网络结构:输入层 \((n+m)\) 节点,隐层节点数 \(\geq n+m\),输出层 1 节点
  • 性能指标:

\(J = \frac{1}{2} \sum [y(k) - \hat{y}(k)]^2\)

  • 采用 BP 算法调整权值

神经控制的结构方案

基于神经网络的监督式控制

  • 使用参考控制器(如线性控制器)作为“教师”训练神经网络控制器。

神经网络逆模型控制

  • 训练网络作为系统的逆模型,串接在系统前:

\(u(k) = \phi(y_d(k+1), y(k), \cdots, u(k-1), \cdots)\)

  • 问题:逆模型可能不稳定,需结合 PID 增强鲁棒性。

神经网络内模控制

  • 系统模型与实际系统并行,误差反馈经滤波器处理后由逆模型控制器调节。

神经网络自适应控制

  • 自校正控制:在线辨识模型并调整控制器参数
  • 模型参考自适应控制:使系统输出跟踪参考模型输出

神经网络预测控制

  • 使用神经网络作为预测模型,结合滚动优化与反馈校正。

神经网络 PID 控制

基于 BP 网络的 PID 控制

  • 神经网络调节 PID 参数 \(K_P, K_I, K_D\)
  • 网络输入:误差 \(e(k), e(k-1), e(k-2)\)
  • 网络输出:\(K_P, K_I, K_D\)
  • 性能指标:

\(J = \frac{1}{2} [r(k+1) - y(k+1)]^2\)

  • 权值调整需估计 \(\partial y(k+1)/\partial u(k)\),常用符号函数近似。

改进型 BP 网络 PID 控制

  • 结合预测模型(线性或非线性)提供输出估计,替代实际系统 Jacobian

应用实例:板带材轧制厚度控制

问题描述

  • 轧制过程为强非线性系统,传统 AGC 基于线性近似,性能受限。
  • 采用神经网络自适应厚度控制(NNA-AGC

控制策略

  • 神经网络控制器输入:

\([h(k-1), H(k), H(k-1), h_{ref}(k)]\)

  • 输出:空载辊缝 \(S_0(k-1)\)
  • 性能指标:

\(E_k = \frac{1}{2} [h_{ref}(k) - h(k)]^2\)

  • 采用惯性 BP 算法:

\(w_{ij}(k+1) = w_{ij}(k) - \eta \frac{\partial E_k}{\partial w_{ij}} + \beta \cdot \Delta w_{ij}(k)\)

  • \(\partial h(k)/\partial S_0(k-1)\) 用符号函数近似。

仿真结果

  • 与传统 PID 相比,NNA-AGC 具有更好的跟随性和抗扰性(对入口厚度波动、塑性系数变化等

神经网络控制的特点与展望

特点

  • 结构多样,各有适用场景
  • 需大量训练数据,对象需充分激励
  • 泛化能力有限,依赖网络结构与训练质量

学习算法发展趋势

  • 经典 BPLyapunov 稳定性理论结合
  • 与模糊逻辑、遗传算法等融合
  • 强化学习、深度学习在控制中的应用

总结

本课程系统介绍了神经网络在控制中的基本原理、学习算法、控制结构与典型应用。重点包括:

  • 神经元模型与常用激发函数
  • 各类学习规则(δ、Hebb、竞争、模拟退火)
  • 前馈网络(感知器、BP 网络)及其训练算法
  • 神经网络在系统辨识与控制中的多种结构方案
  • 神经网络 PID 控制及其改进方法
  • 实际工业应用案例(轧制厚度控制)

神经网络控制为解决复杂非线性、不确定性系统的控制问题提供了有效工具,其发展仍在不断深入,与其它智能方法的融合是未来重要方向。


笔记根据浙江大学刘山老师《智能控制技术》PPT 整理,仅供参考学习使用。