执行器约束下基于轨迹学习的核正则化最优迭代学习控制

杨亮亮; 陈泓; 鲁文其

doi:10.3969/j.issn.1004-132X.2025.10.014

中国机械工程 ›› 2025, Vol. 36 ›› Issue (10) : 2274 -2283. DOI: 10.3969/j.issn.1004-132X.2025.10.014

机械基础工程

执行器约束下基于轨迹学习的核正则化最优迭代学习控制

作者信息 +

Kernel Regularization Optimal Iterative Learning Control Based on Trajectory Learning under Actuator Constraints

Author information +

文章历史 +

PDF (1687K)

摘要

针对非重复性轨迹跟踪和执行器可能超限的问题，提出了一种基于先前轨迹学习的核正则化最优迭代学习控制算法（KROILC），在迭代过程中利用输入输出的测量值，使用基于核的正则化方法估计系统的脉冲响应，展示了脉冲响应估计领域几种常用核的零均值高斯过程实现，估计得到的脉冲响应被应用于最优迭代学习控制器。通过目标函数加权实现对执行器的约束，迭代过程中参考轨迹变化后的初始前馈力通过轨迹学习得到。在直流无刷电机上的实验验证结果表明，所提出的算法能够在执行器约束下实现非重复性轨迹的全轨迹和稳定段的最优跟踪性能。

Abstract

To address the issues of non-repetitive trajectories tracking and potential actuator saturation， a kernel regularization optimal iterative learning control （KROILC） algorithm was proposed. The kernel-based regularization method was used to estimate the system's impulse response from input-output data. Several zero-mean Gaussian process kernels were demonstrated for this purpose. The estimated impluse response was applied to the controller， and actuator constraints were weighted in the objective function. Initial feedforward input after trajectory changes was learned iteratively. Experimental results on a brushless DC motor show that the proposed algorithm achieves optimal tracking for non-repetitive trajectories while maintaining actuator stability.

Graphical abstract

关键词

执行器约束 / 数据驱动 / 非重复性轨迹 / 轨迹学习 / 核正则化 / 迭代学习控制

Key words

actuator constraint / data-driven / non-repetitive trajectory / trajectory learning / kernel regularization / iterative learning control

引用本文

引用格式 ▾

[Author(id=1261762428540248830, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, orderNo=0, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=yangliangliang@zstu.edu.cn, emailSecond=null, emailThird=null, correspondingAuthor=1, authorType=1, ext={EN=AuthorExt(id=1261762428603163396, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, authorId=1261762428540248830, language=EN, stringName=Liangliang YANG, firstName=Liangliang, middleName=null, lastName=YANG, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical Engineering，Zhejiang Sci-Tech University，Hangzhou，310018, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1261762428653495049, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, authorId=1261762428540248830, language=CN, stringName=杨亮亮, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=浙江理工大学机械工程学院, 杭州, 310018, bio={"content":"

杨亮亮^*（通信作者），男，1978年生，副教授。研究方向为高速高精运动控制。E-mail：yangliangliang@zstu.edu.cn。

"}, bioImg=null, bioContent=

杨亮亮^*（通信作者），男，1978年生，副教授。研究方向为高速高精运动控制。E-mail：yangliangliang@zstu.edu.cn。

, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1261762428456362743, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, xref=null, ext=[AuthorCompanyExt(id=1261762428473139960, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, companyId=1261762428456362743, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical Engineering，Zhejiang Sci-Tech University，Hangzhou，310018), AuthorCompanyExt(id=1261762428489917177, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, companyId=1261762428456362743, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=浙江理工大学机械工程学院, 杭州, 310018)])]), Author(id=1261762428703826699, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, orderNo=1, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1261762428766741261, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, authorId=1261762428703826699, language=EN, stringName=Hong CHEN, firstName=Hong, middleName=null, lastName=CHEN, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical Engineering，Zhejiang Sci-Tech University，Hangzhou，310018, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1261762428812878606, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, authorId=1261762428703826699, language=CN, stringName=陈泓, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=浙江理工大学机械工程学院, 杭州, 310018, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1261762428456362743, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, xref=null, ext=[AuthorCompanyExt(id=1261762428473139960, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, companyId=1261762428456362743, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical Engineering，Zhejiang Sci-Tech University，Hangzhou，310018), AuthorCompanyExt(id=1261762428489917177, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, companyId=1261762428456362743, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=浙江理工大学机械工程学院, 杭州, 310018)])]), Author(id=1261762428867404560, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, orderNo=2, firstName=null, middleName=null, lastName=null, nameCn=null, orcid=null, stid=null, country=null, authorPic=null, dead=0, email=null, emailSecond=null, emailThird=null, correspondingAuthor=0, authorType=1, ext={EN=AuthorExt(id=1261762428934513426, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, authorId=1261762428867404560, language=EN, stringName=Wenqi LU, firstName=Wenqi, middleName=null, lastName=LU, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=School of Mechanical Engineering，Zhejiang Sci-Tech University，Hangzhou，310018, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null), CN=AuthorExt(id=1261762428984845075, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, authorId=1261762428867404560, language=CN, stringName=鲁文其, firstName=null, middleName=null, lastName=null, prefix=null, suffix=null, authorComment=null, nameInitials=null, affiliation=null, department=null, xref=null, address=浙江理工大学机械工程学院, 杭州, 310018, bio=null, bioImg=null, bioContent=null, aboutCorrespAuthor=null)}, companyList=[AuthorCompany(id=1261762428456362743, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, xref=null, ext=[AuthorCompanyExt(id=1261762428473139960, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, companyId=1261762428456362743, language=EN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=School of Mechanical Engineering，Zhejiang Sci-Tech University，Hangzhou，310018), AuthorCompanyExt(id=1261762428489917177, tenantId=1045748351789510663, journalId=1155139928303341765, articleId=1212799527859119100, companyId=1261762428456362743, language=CN, country=null, province=null, city=null, postcode=null, companyName=null, departmentName=null, remark=浙江理工大学机械工程学院, 杭州, 310018)])])] 杨亮亮,陈泓,鲁文其. 执行器约束下基于轨迹学习的核正则化最优迭代学习控制[J]. 中国机械工程, 2025, 36(10): 2274-2283 DOI:10.3969/j.issn.1004-132X.2025.10.014

登录浏览全文

4963

注册一个新账户忘记密码

0 引言

迭代学习控制（iterative learning control，ILC）旨在实现系统在有限区间内的完美跟踪，消除系统在执行重复性任务时的误差，已被证明是处理具有周期性或准周期性特征跟踪任务的有效方法^［1］。ILC被广泛运用于高精度运动系统，如晶片扫描仪和印刷系统^［2-3］。GU等^［4］将P型迭代学习算法应用在单边Lipschitz非线性系统，使系统输出在整个时间间隔内收敛于期望输出。FREEMAN^［5］应用ILC方案提高了辅助康复机器人跟踪精度。FIORENTINO等^［6］利用迭代学习控制，在不需要模型信息的情况下，提高了复杂几何形状铝增量成形的精度。

研究发现，被控对象模型的精度对迭代学习控制的性能存在较大影响。BALTA等^［7］利用过程的标称模型并使用高斯过程回归学习模型的不确定性，结果表明，由于使用了更精确的系统模型，实验结果表现出了更好的跟踪性能。WIJDEVEN等^［8］引入了具有基函数的迭代学习控制（basis function optimal iterative learning control，BFOILC），通过多项式基函数对前馈信号进行参数化，然而该方法在描述灵活系统动力学方面受到限制。近年来，系统辨识与迭代学习控制并行发展，线性系统辨识领域出现了许多新的方法，PILLONETTO等^［9］提出了一种基于核的稳定线性系统辨识方法，通过将脉冲响应看成为高斯随机过程，将系统平滑度、稳定性等信息嵌入到核矩阵中，实现了较好的辨识效果。特别是，使用机器学习的概念如高斯过程（GP）和核（kernel）的非参数模型辨识方法取得了较大的进步，在文献［10］中，动态系统被表示为GP，用嵌入在核中的先验来替换模型结构和阶数选择，使用这种正则化的辨识技术可以在系统辨识中对模型复杂性进行不同的规范^［11-14］。THORPE等^［15］将核方法与数据驱动相结合，用于弹簧质量阻尼器和F-16飞机状态预测任务。YU等^［16］将核正则化方法运用到非重复时变系统的迭代学习控制，获得了较小的均方差。

现有基于数据驱动的ILC方法虽减少了模型依赖，但仍存在部分缺陷。JANSSENS等^［17］针对LTI（linear time-invariant）系统提出一种数据驱动范数最优迭代学习控制框架，实现了电机跟踪精度，且能最小化跟踪误差，但未能考虑非重复性轨迹的情况。杨亮亮等^［18］提出了基于数据驱动的最优迭代学习控制（data-driven optimal iterative learning control，DDOILC）算法，但该算法的控制效果很大程度上依赖于数据驱动的初始模型，一旦模型选择不当，迭代过程中的输入输出数据便难以将名义模型修正到接近模型真值，从而影响迭代学习更新率的设计，而且该算法未考虑执行器的饱和边界，可能导致最优前馈力超出执行器的输出范围，引起执行器失稳，且该算法无法应对执行器输入非重复性轨迹任务的情况。

本文针对上述问题，在文献［18］的基础上提出一种基于先前轨迹学习的核正则化最优迭代学习控制（kernel regularization optimal iterative learning control，KROILC）算法，使用目标函数加权系数对前馈信号进行约束，考虑部分实验平台无法通过常规方法获取其脉冲响应，使用基于核正则化的方法，通过系统迭代过程中的输入输出数据对系统脉冲响应进行辨识，避免对系统直接输入脉冲来获取脉冲响应。再者，将处理重复性任务的最优迭代学习控制拓展到处理非重复性最优迭代学习控制，通过变更轨迹任务后对轨迹的学习来对ILC进行初始化，从而加快变轨迹任务后轨迹误差的收敛速度。

1 伺服系统数学模型

本文的研究对象是具有非重复运动特性的伺服系统设计控制器，使其能实现良好的轨迹跟踪性能。伺服系统控制框图见图 1。

图1中，伺服系统

G (z)

为被控对象，

C (z)

为反馈控制器，调节其参数可以保持系统闭环稳定。其中，

r

为参考轨迹信号；

v

为噪声；

e k

、

u k

、

y k

分别为第k次迭代的误差信号、前馈信号与输出信号。伺服系统在一定的迭代次数内重复执行参考轨迹

r

，每次迭代运行时间为T，设采样周期为

T s

，对信号进行离散，采样点数

N = T / T s

，采样点序列t=｛0，1，…，N

-

1｝则第k次迭代的输出为

y k = [y k (0) y k (1) ⋯ y k (N - 1)] T

（1）

e k

、

u k

与

y k

是形式相同的列矩阵，即

e k = [e k (0) e k (1) ⋯ e k (N - 1)] T

（2）

u k = [u k (0) u k (1) ⋯ u k (N - 1)] T

（3）

忽略噪声影响，系统输出可表示为

y k = T r r + T u u k

（4）

T u = h (0) h (1) ⋮ h (N - 1) 0 h (0) ⋮ h (N - 2) ⋯ ⋯ ⋯ 00 ⋮ h (0)

（5）

其中，

T u ∈ R N × N

，表示系统

G (z) / (1 + G (z) C (z))

的Toeplitz矩阵，是由单位脉冲响应系数组成的下三角矩阵；

T r ∈ R N × N

，表示系统

G (z) C (z) / (1 + G (z) C (z))

的Toeplitz矩阵，其定义与

T u

类似。

系统第

k

次与

k - 1

次输出之差表示为

Δ y k (0) Δ y k (1) ⋮ Δ y k (N - 1) = h (0) h (1) ⋮ h (N - 1) 0 h (0) ⋮ h (N - 2) ⋯ ⋯ ⋯ 00 ⋮ h (0)

Δ u k (0) Δ u k (1) ⋮ Δ u k (N - 1)

（6）

根据

h (t)

与

Δ u k (t)

之间的卷积关系，式（6）可重新表述为

Δ y k (0) Δ y k (1) ⋮ Δ y k (N - 1) =

Δ u k (0) Δ u k (1) ⋮ Δ u k (N - 1) 0 Δ u k (0) ⋮ Δ u k (N - 2) ⋯ ⋯ ⋯ 00 ⋮ Δ u k (0) h (0) h (1) ⋮ h (N - 1)

（7）

用矩阵形式表示如下：

y k = U k τ k

（8）

其中，

τ k

∈ R N × 1

，是系统

G (z) / (1 + G (z) C (z))

的单位脉冲响应系数，即式（5）中

T u

的第一列。

采用图 2所示的迭代学习控制框架，图中

y r = T r r

，

y u = T u u k

，

Z - 1 I N

为延时环节，

T u

在其中作为闭环过程灵敏度矩阵，迭代学习算法表示为

u k + 1 = u k + L e k

（9）

其中，

L

∈ R N × N

，为需要设计的迭代学习更新律，根据最优化理论建立性能目标函数，对目标函数最小化便可得到

L

的表达式。

2 基于数据驱动的最优迭代学习控制

2.1 DDOILC控制器设计

DDOILC本质上是最优迭代学习控制和模型辨识算法的结合，在迭代过程中辨识系统的名义模型

T u

。根据图 2，建立性能目标函数：

J k + 1 = e k + 1 T W e e k + 1 + Δ u k + 1 T W Δ u Δ u k + 1

（10）

式中：

Δ u k + 1 = u k + 1 - u k

；

W e

、

W Δ u

分别为轨迹跟踪误差加权矩阵和前馈信号变化量加权矩阵，用于平衡系统性能和收敛速度之间的关系。

迭代学习更新律 L 可以表示为

L = (W Δ u + T^u T W e T^u) - 1 T^u T W e

（11）

一般情况下，

W e = I

，

W Δ u = η I

，

η

为前馈信号变化量的加权系数，

η

∈ R +

，改变其大小可以调节算法的收敛速度。

L

为要设计的最优迭代学习更新率，

T^u

为

T u

的辨识值。接下来采用基于数据驱动的方法对

T^u

进行辨识。

建立性能目标函数如下：

J (τ^k) = Δ y k - τ^k - 1 Δ u k 2 +

μ (τ^k - τ^k - 1 2 - δ)

（12）

式中：

⋅

表示矢量的2-范数；

τ^k

为系统名义模型

T^u

中非零元素

τ k

的估计值；δ为对迭代步长约束的系数，

δ ∈ R +

；μ为拉格朗日算子，

μ ∈ R

。

将式（12）相对于

τ^k

最小化，得到以下更新公式：

τ^k = τ^k - 1 + (Δ y k - τ^k - 1 Δ u k) Δ u k T μ + Δ u k 2

（13）

根据辨识公式式（13），系统的名义模型估计值

T^u

可以通过

τ^k

获得，从而更新迭代学习控制律式（9）和式（11）以实现最优迭代学习控制。

2.2 执行器超限对DDOILC的影响

DDOILC根据迭代过程中的输入和输出信号来确定系统的名义模型，通过更新迭代学习控制律式（9）和式（11）来实现自适应最优迭代学习控制。虽然它可以处理系统的时变问题，但它没有考虑实际系统的执行器饱和问题。

在更新率式（11）中，当

η = 0

时

L^= T^u - 1

（14）

此时，更新律为闭环系统的逆，当系统是一个非最小相位系统时，

L^

可能趋于不稳定。将式（11）代入式（9）得

u k + 1 = u k + T^u - 1 e k

（15）

计算得到的

| u k + 1 |

可能趋于无穷大。当

η ≠ 0

时，

η

的作用是对前馈信号步长进行约束，若

η

值选择相对较小，对于存在执行器饱和约束的系统，同样会导致超出执行器的饱和边界。此外，

η

值的选择是由经验决定的，

η

和

u k

之间并没有直接的映射关系。综上，

η

的值选取不当可能会导致执行器超过饱和边界。

2.3 非重复轨迹任务对DDOILC的影响

常见工况下，为处理不同的任务，执行器的参考轨迹通常是非重复性的，这对DDOILC的适应性提出了更高的要求。分析式（13），记轨迹变化后的输入输出分别为

Δ u k'

与

Δ y k'

，式（13）中的校正项可表示为

E k' = Δ y k' - τ^k - 1 Δ u k'

（16）

轨迹变化前的校正项则是

E k = Δ y k - τ^k - 1 Δ u k

（17）

迭代过程的轨迹变化导致

Δ E k = (Δ y k' - Δ y k) - τ^k - 1 (Δ u k' - Δ u k)

（18）

分析上述公式，当轨迹变化较大时，系统输出

y k

与轨迹变化前几次迭代输出值

y k - 1

、

y k - 2

、…、

y k - m

（m=1，2，…，

k - 1

）之间存在较大差异，这种输入突变影响了辨识公式中的校正项，

Δ E k

的绝对值随之增大，进而影响辨识参数的更新，使辨识值

τ^k

大幅偏离真实值，在下一次迭代沿用上一次辨识得到的

τ^k

作为

τ^k - 1

，也将使得本次迭代的

τ^k

大幅偏离真实值。

另一方面，前馈信号变化

Δ u k

和输出信号变化

Δ y k

是基于之前轨迹和系统模型之间关系得到的，这种关系在轨迹变化后不再适用，此时基于旧数据辨识更新

τ^k

引导参数朝着错误的方向调整，使估计值偏离真实值。

辨识参数的偏离将对系统稳定性产生影响，最终表现为控制信号的异常增大。若轨迹变化后辨识得到的系统名义模型记为

T ˜ u

，根据更新率式（11）可得

L ˜ = (W Δ u + T ˜ u T W e T ˜ u) - 1 T ˜ u T W e

（19）

不准确的名义模型

T ˜ u

将导致更新率

L ˜

异常，从而影响到下一次迭代的前馈信号：

u k + 1 = u k + L ˜ e k

（20）

通过式（20）计算得到的

u k + 1

可能趋于无穷大，导致执行器超过饱和边界，或使前馈信号无法起到减小轨迹跟踪误差的作用，轨迹跟踪性能恶化。

除此之外，由于轨迹的变化是突发性的，辨识公式（13）在几次迭代中可能无法适应新的系统特性，辨识误差随着迭代不断积累，使得后续迭代中的

τ^k

迅速偏离真实值，且难以收敛到

τ k

上，进而影响ILC的效果。

上述分析了执行器超限和非重复性轨迹任务对DDOILC的影响。针对该执行器约束的问题，使用目标函数加权约束的方法解决；对于非重复性轨迹任务，使用轨迹学习的方法计算轨迹变更后第一次迭代的最优前馈信号，同时使用基于核正则化的非参数模型辨识方法，获取更精确的名义模型，进而加快ILC的收敛过程。

3 基于先前轨迹学习的KROILC

3.1 执行器约束的情况

考虑执行器运行过程中可能出现的执行器超限问题，引入对执行器的约束。在式（10）的基础上构建对前馈力加权约束的目标函数：

J k + 1 = e k + 1 W e 2 + u k + 1 W u 2 + Δ u k + 1 W Δ u 2

（21）

其中，

W u

为前馈信号加权矩阵，且

W e

、

W u

、

W Δ u

均为半正定矩阵。除跟踪误差和前馈信号变化量加权外，在目标函数中引入前馈信号加权项，一方面，加权矩阵

W Δ u

可以调节收敛速度，使得从

u k

到

u k + 1

过渡得更为平滑，对控制算法的鲁棒性有所改善，另一方面加权矩阵

W u

可以实现对前馈力

u k + 1

的约束。

根据式（4）可得

e k + 1 = r - T r r - T u u k + 1

（22）

结合式（21）和式（22），对

u k + 1

求偏导，经推导可得

u k + 1 = (T u T W e T u + W Δ u + W u) - 1 ×

[T u T W e e k + (T u T W e T u + W Δ u) u k]

（23）

式（23）可改写为

u k + 1 = Q^(u k + L^e k)

（24）

Q^= (T^u T W e T^u + W u + W Δ u) - 1 (T^u T W e T^u + W Δ u)

（25）

L^= (T^u W e T^u + W Δ u + W u) - 1 T^u W e

（26）

其中，控制器更新率

Q^∈ R N × N

、

L^∈ R N × N

。

通常，误差加权矩阵

W e = I

；前馈信号加权矩阵

W u = ω I

，

ω

表示前馈信号的加权系数，

ω ∈ R +

；前馈信号变化量加权矩阵

W Δ u = η I

。通过选取合理的

ω

和

η

可调整前馈信号约束惩罚和算法收敛速度。

3.2 收敛性分析

根据线性系统理论、迭代学习控制系统的收敛性条件，引入描述系统状态或误差的更新矩阵

M

，其谱半径表达式为

ρ (M) = m a x i = 1,2, ⋯, n λ i (M)

（27）

其中，

λ i (M)

是矩阵 M （

M ∈ R n × n

）的第

i

个特征值，其最大奇异值为

σ ¯ (M) = ρ (M T M)

（28）

最大奇异值基于

M x ≤ σ ¯ (M) x

给出了矩阵增益的界限。由式（4）以及式（24）可得

u k + 1 = Q (I - L T u) u k + Q L (I - T r) r

（29）

迭代学习更新率

Q

和

L

在设计好后不变，为了让前馈控制信号收敛，仅需满足系统稳定性条件：

ρ (Q (I - L T u)) < 1

（30）

实际过程中滤波器

Q^

和控制器

L^

通过系统名义模型

T^u

计算获得，式（30）可以改写为

ρ (Q^(I - L^T^u)) < 1

（31）

对于KROILC算法，系统的稳定运行需要满足收敛条件式（31），以提高伺服系统的轨迹跟踪性能。

为了计算式（25）和式（26）中的迭代学习更新率

Q^

和

L^

，除了经验选取的加权矩阵外，重要的是获取系统的名义模型

T^u

。辨识公式式（13）中，当

k = 2

时，迭代运行两次便可根据

Δ y k

与

Δ u k

进行辨识，此时等式右侧初始模型

τ^1

的选取很大程度上决定了整体的辨识性能。文献［15］通过简单实验获取系统脉冲响应，并未考虑部分平台无法输入单位脉冲的情况，一旦初始模型选取不当，迭代过程中的输入输出数据便难以将名义模型修正到接近模型真实值，从而影响ILC的更新率，最终影响轨迹跟踪性能。针对上述缺点，引入基于核正则化的脉冲响应辨识算法，该算法可通过引入对脉冲响应的先验知识，更好地辨识系统模型。

3.3 基于核正则化的非参数模型辨识

在贝叶斯的观点中，要估计的参数本身是一个高斯随机变量，根据观测数据便可寻求该参数的后验分布。为了在迭代学习控制中实现基于核的正则化，单位脉冲响应系数被视为具有零均值和协方差矩阵

Π

的高斯分布的随机变量，即

τ k ∼ 𝒩 (0, Π)

（32）

其中，

Π

是一个半正定矩阵，称为核矩阵，

Π ∈ R N × N

。参考文献［12］，参数

τ k

的核正则化最小二乘估计为

τ^k R = a r g m i n τ y k - U k τ k 2 + γ τ k T Π - 1 τ k =

[U k T U k + γ Π - 1] - 1 U k T y k

（33）

式（33）中，

γ

（

γ

∈ R +

）为正则化系数，用来平衡观测数据与惩罚项

τ k T Π - 1 τ k

。通过引入一些偏差为代价，改善估计的数值性质并降低其方差。根据文献［19］，式（33）可写作

τ^k R = Π U k T (U k Π U k T + γ I) - 1 y k

（34）

核矩阵

Π

应当被仔细选取，其中一个典型的方法是将其参数化为矩阵族

Π

(φ)

，

φ ∈ R n

，

φ

被称为超参数，

n

则是超参数

φ

的维数。假设v是高斯分布的，具有零均值和方差

σ 2

，

y k

和

τ k

的联合高斯分布如下：

τ k y k ~ 𝒩 00, Π Π U k T U k Π U k Π U k T + σ 2 I

（35）

由式（35）可见，

y k

是一个高斯随机变量，具有零均值和协方差矩阵：

Σ (φ) = U k Π U k T + σ 2 I

（36）

为辨识单位脉冲响应系数

τ k

，

Π (φ)

应当反映出对脉冲响应的合理假设。若选择了核矩阵

Π (φ)

，随后便可使用边际似然法获取超参数

φ

，该方法也被称为经验贝叶斯方法，其公式如下：

φ^= a r g m i n η y k T Σ (φ) - 1 y k + l n d e t (Σ (φ))

（37）

此时便将估计

τ k

的问题转化为描述

τ k

分布的核矩阵

Π φ

选取的问题。

3.4 核的设计与选择

在脉冲响应辨识领域中，已经开发出了多种核用于嵌入各种类型的先验知识^［11］，例如：

DC核（对角相关核）

Π i j (φ) = λ α (i + j) / 2 ρ | i - j |

（38）

λ ≥ 0 0 ≤ α < 1 ρ ≤ 1 φ = (λ, α, ρ)

TC核（调谐相关核）

Π i j (φ) = λ α m a x (i, j)

（39）

λ ≥ 0 0 ≤ α < 1 φ = (λ, α)

SS核（稳定样条核）

Π i j (φ) = λ (α i + j + m a x (i, j) 2 - α 3 m a x (i, j) 6)

（40）

λ ≥ 0 0 ≤ α < 1 φ = (λ, α)

在上述核中，

Π i j (φ)

代表具有超参数

φ

的核矩阵

Π

的第

i

行、第

j

列元素，超参数

φ

中的参数值

λ

、

α

、

ρ

可根据（37）进行优化，得到

φ

后通过（34）计算脉冲响应，其中

γ = σ 2

。这种估计方法在某些情况下可提供更好的模型，避免了模型阶数难以确定的问题。

文献［14］提出了设计核的两种方法：一种从机器学习的角度，另一种从系统理论的角度，并演示了秩1核与平稳核的作用。本文将以同样的方式演示DC、TC、SS核的零均值高斯过程实现（GPR），以及各自超参数对其高斯过程实现的影响。

图3~图5分别为DC、TC、SS核的零均值高斯过程实现。由图3可以看出，当

ρ

逐渐变小时，对应零均值高斯过程实现变化得更快，特别是

ρ = - 0.99

，其符号往往在相邻时刻间变化。由图4可以看出，与DC核类似，

α

越大，图像衰减越慢，反之衰减越快。由图5可以看出，与前面两种核类似，

α

的大小同样可以调节衰减和收敛的速度，不同的是，SS核对应图像相比之下更加平滑，各采样点之间的相关性更高。

以上三种核经过适当的超参数选取后，均可描述脉冲响应振荡衰减并收敛的特性，将

τ k

视为由式（38）~式（40）作为协方差函数的零均值高斯过程实现是合理的。在解决脉冲响应辨识问题后，下一节将着重处理ILC的前馈力初始化问题。

3.5 KROILC的轨迹学习初始化

ILC的核心是假设系统轨迹在每次迭代中是固定的，其劣势是对非重复性轨迹任务的适应性和鲁棒性不足，当迭代过程中的轨迹改变时，其历史数据失效、更新率滞后和收敛性破坏等问题将导致控制性能显著下降，为解决该问题，本文提出基于轨迹学习的ILC初始化方法。

将式（6）写成如下向量形式：

y k = T u u k

（41）

针对轨迹

s 1

，所需的最优前馈信号

u o p t 1 = T u - 1 y s 1

（42）

假设ILC已经学习了最优前馈信号

u o p t 1

来跟踪所需的参考轨迹

s 1

，此时系统被要求跟踪一个相同采样时间和采样点数的其他轨迹，用

s 2

表示，ILC通过多次迭代获取针对该轨迹的最优前馈信号

u o p t 2

。将学习到的输出轨迹

y s 1

和新轨迹

s 2

分别构建为下三角Toeplitz矩阵

Y s 1

和

Y s 2

，引入转换矩阵

K

：

K = Y s 1 - 1 Y s 2

（43）

此处假设

Y s 1

可逆，实际过程中可使用广义逆来处理。将转换矩阵

K

应用到先前轨迹的最优前馈信号

u o p t 1

，便可估计轨迹变化后的最优前馈信号

u^o p t 2

：

u^o p t 2 = K u o p t 1

（44）

该方法可以很好地初始化ILC，显著加快ILC在应对变轨迹任务时的收敛速度。

4 仿真与实验

4.1 仿真分析

使用MATLAB和Simulink对上述算法进行仿真，参考轨迹选用图6所示的四阶S型点对点轨迹，

t m a x = 1.0235 s

，采样周期

T s = 0.0005 s

。

仿真对象由带有一个谐振模块的二阶系统组成，其伯德图如图7所示，模型表示为

G (z) = 10 - 8 ×

154.7862 z 4 + 9.1737 z 3 - 291.9428 z 2 + 7.7381 z + 154.0684 z 4 - 3.9106 z 3 + 5.8099 z 2 - 3.8878 z + 0.9886

（45）

仿真系统采用反馈和前馈的控制策略，控制结构如图1所示。

C (z)

是一个反馈控制器，调节参数使系统稳定，其模型表示为

C (z) = 104 × 1.6359 z 2 - 3.1718 z + 1.5359 z 2 - 0.5423 z - 0.4577

（46）

通过Simulink获取系统模型

T u

的真值，设置运行次数为36，输入

-

1到1之间的随机数，分别使用DDOILC和KROILC辨识方法对

T u

进行辨识，参照文献［12］中的式（5）定义拟合度：

F I T = 100 [1 - (∑ k = 1 36 τ k 0 - τ^k 2 ∑ k 36 τ k 0 - τ ¯ 0 2) 12]

（47）

τ ¯ 0 = 136 ∑ k = 1 36 τ k 0

F I T = 100

表示辨识值

τ^k

与真实值

τ k 0

的脉冲响应系数之间完美拟合，

F I T

越大表明拟合度越好。表1显示了使用DDOILC与KROILC辨识方法得到辨识结果的均方差（MSE）与拟合度

F I T

之间的对比，在KROILC中分别选用DC、TC、SS三种核，正则化系数

γ = 1 × 10 - 14

，使用式（37）对超参数优化。由表1可见，基于核的正则化方法在辨识方面的效果优于数据驱动的方法，相比之下，前者表现出更小的辨识均方差和更高的辨识拟合度，使用三种核的辨识结果相近，其中选用DC核的正则化方法得到的MSE最小、辨识拟合度最高，明显优于数据驱动的方法。

随后进行控制部分的仿真，选取

γ = 1 × 10 - 14

，

W e = I

，令图1中

r

为图6所示的四阶S型点到点轨迹，选用辨识效果最好的DC核并使用KROILC算法，迭代次数设置为36，在第17次迭代时改变参考轨迹并用式（44）对ILC初始化，即前17次迭代采用参考轨迹1，第18~36次迭代采用参考轨迹2，轨迹变化如图8所示。

表2展示了参考轨迹1与参考轨迹2的参数（角度

r

、速度v、加速度a）的最大值和其对应的变化率，以表示变轨迹时轨迹参数的变化程度。

表3显示了

η = 2 × 10 - 7

时不同

ω

取值情况下最大控制信号的变化情况。图9展示了

η = 2 × 10 - 7

时不同

ω

取值情况下的全轨迹误差二范数的变化趋势，从表3与图9中可以看出，随着前馈信号加权系数

ω

的增大，稳定段误差二范数收敛值增大，最大控制信号减小，表明前馈信号加权系数

ω

对最大控制信号起到约束作用。

由图9作出推断，可通过调整

ω

对误差二范数收敛值和最大控制信号进行权衡，使得执行器在满足约束条件而不超过执行器限制的情况下尽可能地减小轨迹跟踪误差。

仿真发现，当加权系数

ω = 2 × 10 - 11

和

η = 2 × 10 - 7

时，可以在不超出执行器输出范围的前提下确保误差收敛到一个较小的值同时实现较快的收敛速度。图10所示为

ω = 2 × 10 - 11

、

η = 2 × 10 - 7

时仿真得到的迭代误差，可见，随着迭代次数增加，全轨迹迭代误差和稳定段迭代误差都减小，最大误差数量级从第1次迭代的

10 - 1

（°）降到第36次迭代的

10 - 4

（°），稳定段误差数量级也从第1次迭代的

10 - 5

（°）降到第36次迭代的

10 - 6

（°）。

迭代学习控制领域中的另一个常用方法是基于基函数的最优迭代学习控制，该方法针对非重复性轨迹具有一定的鲁棒性，在前馈反馈控制策略中被广泛使用^［20］。采用上述加权系数

ω = 2 × 10 - 11

、

η = 2 × 10 - 7

并将KROILC与DDOILC和使用三个基函数的BFOILC仿真效果进行对比，如图11所示。

从图11中可以看出，三种算法均在4次迭代后趋于收敛，随着迭代次数的增加，它们都能使得误差二范数下降，但在第17次迭代时由于参考轨迹的改变，使得DDOILC逐渐趋于发散，性能严重恶化，而KROILC与BFOILC则在改变轨迹后很快趋于收敛。图11中小图为第30~36次迭代中KROILC与BFOILC的误差二范数变化情况，很显然，虽然BFOILC能够很好地处理非重复轨迹任务，但是KROILC表现出了更好的轨迹跟踪性能，其稳定段误差更小。由此可得出结论，当参考轨迹在系统迭代过程中发生改变时，DDOILC的误差二范数迅速增大，轨迹跟踪性能恶化，KROILC的误差二范数则迅速收敛，并在之后的迭代过程中表现出比BFOILC更好的轨迹跟踪性能。

4.2 实验验证

实验平台如图 12所示。运动控制平台由无刷直流电机组成，电机的额定电压为24 V，额定电流为1.17 A，额定转速为6000 r/min，锁定转子扭矩为104 mN·m，扭矩常数为27.8 mN·m/A，编码器为2000线。主计算机是一台PC机，从计算机是一个用ARM芯片设计的四轴驱动控制集成控制卡。

平台采用图13所示的控制结构。

G (z)

代表由无刷直流电机和负载组成的机械系统，

P (z)

代表运动控制卡内设计的参数扰动模拟器。

G (z)

和

P (z)

共同构成了伺服系统的被控对象。

图13中，

P (z)

的传递函数为

P (z) = z 2 + 2 β z e r o ω z e r o z + ω z e r o 2 z 2 + 2 β p o l e ω p o l e z + ω p o l e 2 ω p o l e 2 ω z e r o 2

（48）

ω z e r o = 2 π f z e r o

ω p o l e = 2 π f p o l e

本文中，取

f z e r o

=12，

f p o l e

=12，

β z e r o

=0.25，

β p o l e

=0.25。实验中的反馈控制器

C (z)

是一个PID反馈控制器，控制器比例单元

K p

=18.75、积分单元

K i

=0.39、微分单元

K d

=1250。

实验共迭代运行36次，与仿真类似，在第17次迭代时将参考轨迹1改为参考轨迹2，即前17次迭代采用参考轨迹1，第18~36次迭代采用参考轨迹2，并在轨迹变化时使用式（44）对ILC进行初始化，非重复性轨迹如图8所示，选用DC核并使用本文提出的KROILC算法，控制参数选取

γ = 1 × 10 - 2

，

W e = I

。迭代过程通过改变参考轨迹，验证所提出的方法是否能在执行器约束下实现非重复性轨迹的最优跟踪性能。

表4显示了

η = 1.6 × 10 - 7

时不同

ω

取值情况下最大控制信号的变化情况。图14所示为

η = 1.6 × 10 - 7

时

ω

对全轨迹误差二范数的影响，由表4与图14可以看出，随着前馈信号加权系数

ω

的增大，误差二范数收敛值也增大，最大控制信号减小，表明前馈信号加权系数

ω

对最大控制信号起到约束作用。

实验证明，通过调整加权系数

ω

可以有效地调节误差二范数收敛值和最大控制信号，使得执行器在满足约束条件而不超过执行器限制的情况下尽可能地减小轨迹跟踪误差，这一结论与仿真结果吻合。

根据上述分析，后续实验选取

ω = 2 × 10 - 8

、

η = 1.6 × 10 - 7

，图15所示为第1次、第2次和第36次迭代的全轨迹误差。随着迭代次数的增加，全轨迹误差和稳定段误差都减小，第1次迭代的最大误差数量级为

100

，而第36次迭代降为

10 - 1

（°），稳定段误差数量级从第1次迭代的

10 - 1

（°）降到第36次迭代的

10 - 3

（°），实验结果与仿真结果一致。

下面将KROILC与DDOILC和使用三个基函数的BFOILC的实验效果进行对比，如图16所示，可以看出，随着迭代次数的增加，它们都能使得误差二范数下降，但第17次迭代参考轨迹的改变使得DDOILC误差二范数迅速增大，性能严重恶化，而KROILC与BFOILC则在改变轨迹后很快趋于收敛。虽然BFOILC能够很好地处理非重复轨迹任务，但是KROILC表现出了更好的轨迹跟踪性能，其稳定段误差更小，且KROILC的整体误差二范数均低于另外两种算法。总的来说，当参考轨迹在系统迭代过程中发生改变时，DDOILC的误差二范数迅速增大，轨迹跟踪性能恶化，KROILC的误差二范数则能迅速收敛，并且在迭代过程中表现出比DDOILC和BFOILC更好的轨迹跟踪性能，实验与仿真结果一致。

5 结束语

DDOILC算法可以有效避免因系统参数变化而导致的性能下降，但它不适用于非重复参考轨迹，迭代过程中参考轨迹的改变将使算法性能恶化，其次算法对前馈信号没有约束，可能导致实际系统的前馈信号超出饱和边界，并且该辨识算法的精度有限，对迭代学习控制器的性能存在一定影响。仿真和实验结果表明，针对有执行器约束的线性时不变系统，本文提出的基于先前轨迹学习的KROILC算法有效提高了非参数模型的辨识精度，可以使系统在执行非重复性轨迹任务时实现全轨迹及稳定段的最优跟踪性能，与DDOILC相比能够处理非重复性轨迹，具有更好的鲁棒性，与BFOILC相比则表现出更小的轨迹跟踪误差，具有更好的轨迹跟踪性能。

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	GOUBEJ M， MEEUSEN S， MOOREN N， et al. Iterative Learning Control in High-performance Motion Systems：from Theory to Implementation［C］∥2019 24th IEEE International Conference on Emerging Technologies and Factory Automation （ETFA）. Zaragoza， 2019：851-856.

[2]	OOMEN T， ROJAS C R. Sparse Iterative Learning Control with Application to a Wafer Stage：Achieving Performance， Resource Efficiency， and Task Flexibility［J］. Mechatronics， 2017， 47：134-147.

[3]	BOEREN F， BAREJA A， KOK T， et al. Frequency-domain ILC Approach for Repeating and Varying Tasks：with Application to Semiconductor Bonding Equipment［J］. IEEE/ASME Transactions on Mechatronics， 2016， 21（6）：2716-2727.

[4]	GU P， TIAN S. P-type Iterative Learning Control with Initial State Learning for One-sided Lipschitz Nonlinear Systems［J］. International Journal of Control， Automation and Systems， 2019， 17：2203-2210.

[5]	FREEMAN C T. Newton-method Based Iterative Learning Control for Robot-assisted Rehabilitation Using FES［J］. Mechatronics， 2014， 24（8）：934-943.

[6]	FIORENTINO A， CERETTI E， FERITI G C， et al. Improving Accuracy in Aluminum Incremental Sheet Forming of Complex Geometries Using Iterative Learning Control［J］. Key Engineering Materials， 2015， 651：1096-1102.

[7]	BALTA E C， BARTON K， TILBURY D M， et al. Learning-based Repetitive Precision Motion Control with Mismatch Compensation［C］∥2021 60th IEEE Conference on Decision and Control （CDC）. Austin， TX， 2021：3605-3610.

[8]	van de WIJDEVEN J， BOSGRA O H. Using Basis Functions in Iterative Learning Control：Analysis and Design Theory［J］. International Journal of Control， 2010， 83（4）：661-675.

[9]	PILLONETTO G， de NICOLAO G. A New Kernel-based Approach for Linear System Identification［J］. Automatica， 2010， 46（1）：81-93.

[10]	BLANKEN L， OOMEN T. Kernel-based Identification of Non-causal Systems with Application to Inverse Model Control［J］. Automatica， 2020， 114：108830.

[11]	PILLONETTO G， DINUZZO F， CHEN T， et al. Kernel Methods in System Identification， Machine Learning and Function Estimation：a Survey［J］. Automatica， 2014， 50（3）：657-682.

[12]	CHEN T， OHLSSON H， LJUNG L. On the Estimation of Transfer Functions， Regularizations and Gaussian Processes—Revisited［J］. Automatica， 2012， 48（8）：1525-1535.

[13]	LJUNG L， CHEN T， MU B. A Shift in Paradigm for System Identification［J］. International Journal of Control， 2020， 93（2）：173-180.

[14]	CHEN T. On Kernel Design for Regularized LTI System Identification［J］. Automatica， 2018， 90：109-122.

[15]	THORPE A J， NEARY C， DJEUMOU F， et al. Physics-informed Kernel Embeddings：Integrating Prior System Knowledge with Data-driven Control［C］∥2024 American Control Conference （ACC）. Toronto， 2024：3130-3137.

[16]	YU X， FANG X， MU B， et al. Kernel-based Regularized Iterative Learning Control of Repetitive Linear Time-varying Systems［J］. Automatica， 2023， 154：111047.

[17]	JANSSENS P， PIPELEERS G， SWEVERS J. A Data-driven Constrained Norm-optimal Iterative Learning Control Framework for LTI Systems［J］. IEEE Transactions on Control Systems Technology， 2012， 21（2）：546-551.

[18]	杨亮亮，袁锐，史伟民，等. 基于数据驱动的自适应最优迭代学习控制研究［J］. 机械工程学报， 2021， 57（17）：207-216.

[19]	YANG Liangliang， YUAN Rui， SHI Weimin， et al. Research on Data Driven Adaptive Optimal Iterative Learning Control［J］. Journal of Mechanical Engineering， 2021， 57（17）：207-216.

[20]	MURPHY K P. Machine Learning：a Probabilistic Perspective ［M］. Cambridge， MA：MIT Press， 2012.

[21]	BOLDER J， OOMEN T， KOEKEBAKKER S， et al. Using Iterative Learning Control with Basis Functions to Compensate Medium Deformation in a Wide-format Inkjet Printer［J］. Mechatronics， 2014， 24（8）：944-953.