Автоматика и телемеханика, № 1, 2023

Интеллектуальные системы управления,

анализ данных

Ю.П. ЕМЕЛЬЯНОВА, канд. физ.-мат. наук (emelianovajulia@gmail.com)

(Арзамасский политехнический институт (филиал)

Нижегородского государственного технического

университета им. Р.Е. Алексеева)

УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ

ДИСКРЕТНОЙ СИСТЕМОЙ ПРИ ЗАПАЗДЫВАНИИ

ВДОЛЬ ТРАЕКТОРИИ ПОВТОРЕНИЯ

И АМПЛИТУДНЫХ ОГРАНИЧЕНИЯХ¹

Рассматривается линейная дискретная система, функционирующая в

повторяющемся режиме, задачей которой является слежение за эталон-

ной траекторией с требуемой точностью при условии, что управление

запаздывает вдоль траектории повторения и при амплитудных ограни-

чениях типа насыщения. Предлагается новый метод синтеза управления

с итеративным обучением, зависящего от запаздывания и позволяющего

обеспечить необходимую точность слежения. Приведен пример, демон-

стрирующий эффективность метода.

Ключевые слова: управление с итеративным обучением, амплитуд-

ные ограничения, запаздывание, повторяющиеся процессы, 2D-системы,

устойчивость, стабилизация, векторная функция Ляпунова, линейные

матричные неравенства.

DOI: 10.31857/S0005231023010063, EDN: LUKRYD

1. Введение

Управление с итеративным обучением (УИО) является эффективным ин-

струментом повышения точности в системах, работающих в повторяющемся

режиме [1]. Простым характерным примером таких систем может служить

портальный робот-манипулятор, устанавливающий детали в требуемые по-

зиции на конвейере. В настоящее время алгоритмы управления с итератив-

ным обучением находят применение в медицинских роботах для реабили-

тации больных, перенесших инсульт [2, 3], в устройствах поддержки желу-

дочка сердца [4], в установках высокоточного многослойного лазерного на-

пыления [5, 6] и в других приложениях, где процессы носят повторяющийся

характер [6-8].

¹ Работа выполнена при поддержке Российского научного фонда, грант № 22-21-00612,

https://rscf.ru/project/22-21-00612/.

121

Большинство работ, посвященных синтезу алгоритмов УИО, базируется на

линейных моделях [9, 10]. В то же время исполнительные органы робототех-

нических систем, как правило, являются электромеханическими устройства-

ми, для которых характерны нелинейности типа насыщения, зоны нечувстви-

тельности, люфта и гистерезиса. Влияние этих нелинейностей может сделать

недостижимой требуемую точность и поэтому требует детального исследо-

вания. Другим фактором, не учитываемым в линейных моделях, являются

запаздывания, которые, в частности, возникают при удаленном управлении.

Исследованию указанных факторов в задачах УИО в текущей литературе

посвящен ряд работ, но они не дают исчерпывающего решения связанных с

этими факторами задач. В данной работе ограничимся рассмотрением ши-

роко распространенной нелинейности с характеристикой типа насыщения.

В [11-17] предложены различные алгоритмы УИО для систем с насыщени-

ем, но ни в одной из них не обсуждается влияние величины насыщения на

точность. Показано, что эти алгоритмы обеспечивают уменьшение ошибки

обучения, но нигде не отмечено, как величина насыщения влияет на устано-

вившееся значение этой ошибки при неограниченном увеличении числа по-

вторений.

Управление с итеративным обучением учитывает особенность повторяю-

щихся процессов, которая заключается в том, что сигналы ошибок обучения

от предыдущих повторений содержат существенную информацию и все ал-

горитмы УИО эффективно используют эту информацию на текущем шаге.

УИО отличается от других стратегий управления с обучением, таких как

адаптивное управление и нейросетевое управление. Стратегии адаптивного

управления изменяют параметры регулятора, тогда как УИО изменяет толь-

ко входной сигнал. Кроме того, адаптивные регуляторы обычно не использу-

ют информацию, содержащуюся в повторяющихся командных сигналах. Точ-

но так же обучение нейронной сети включает в себя изменение параметров

регулятора, модифицируя обучаемую нейронную сеть. Эти сети обычно тре-

буют большого объема обучающих данных, и бывает трудно гарантировать

быструю сходимость, тогда как алгоритмы УИО обычно сходятся адекватно

всего за несколько итераций [9] и список литературы в [9].

В соответствии с отмеченной особенностью УИО, здесь возможны различ-

ные варианты запаздываний: это могут быть запаздывания по состоянию и

управлению на каждом повторении и запаздывания вдоль повторений, т.е. на

текущем повторении может быть доступна информация не с предыдущего,

а с более раннего повторения. В [18-23] предложены различные алгоритмы

УИО для систем с запаздыванием по состоянию на повторениях. Другие виды

запаздываний в известной авторам литературе не рассматривались.

Данная статья развивает результаты [24] для систем с нелинейностью ти-

па насыщения и запаздыванием вдоль траектории повторения. Одновремен-

ный учет этих факторов ранее в литературе не рассматривался, хотя, как

показывает приводимый далее пример, их сочетание вполне естественно в

122

технических системах. Как и в [24], здесь используется подход, основанный

на построении 2D-модели в виде повторяющегося процесса [25] в сочетании

с дивергентным методом векторных функций Ляпунова [26], что позволяет в

итоге применить для получения конечных результатов эффективную технику

линейных матричных неравенств. Предложенный алгоритм УИО зависит от

запаздывания. Приведен пример и сформулированы возможные пути даль-

нейших исследований.

2. Постановка задачи

Рассмотрим линейную дискретную систему в повторяющемся режиме, ко-

торая на k-м повторении описывается следующей моделью в пространстве

состояний:

x_k(p + 1) = Ax_k(p) + Bψ_k(p - d),

(2.1)

ψ_k(p) = sat(u_k

(p)),

y_k(p) = Cx_k(p), p ∈ [0,N - 1], k = 0,1,... ,

где x_k(p) ∈ Rnx

вектор состояния, u_k(p) ∈ Rnu

вектор управления

y_k(p) ∈ Rny вектор выходных переменных, называемый профилем повторе-

ния, k номер повторения, N продолжительность повторения, d число

шагов запаздывания, ψ_k(p) ∈ Rnu функция насыщения, которая задается

следующим образом:





U_j если u_k,j(p) > U_j,

(2.2)

ψ_k(p)_j = sat(u_k(p))_j =

u_k,j(p) если - Uj ≤ uk,j(p) ≤ Uj,



−U_j если u_k,j(p) < -U_j,

для 1 ≤ j ≤ n_u, k ≥ 0, где u_k,j(p) j-я компонента u_k(p), а U_j положитель-

ная постоянная.

Пусть y_ref (p), 0 ≤ p ≤ N

заданная эталонная траектория (желаемый

профиль повторения). Тогда

(2.3)

e_k(p) = y_ref(p) - y_k

(p)

является ошибкой обучения на повторении k.

Задача состоит в нахождении такой последовательности управлений u_k(p),

которая, оставаясь ограниченной при всех k = 0, 1, . . . , обеспечивает дости-

жение заданной точности воспроизведения эталонной траектории за конечное

число повторений k^∗ и сохранение этой точности при дальнейших повторе-

ниях, т.е.

(2.4)

||e_k(p)|| ≤ e^∗, k ≥ k^∗

0≤p≤N.

123

3. Переход к эквивалентной 2D модели в виде

повторяющегося процесса

Поставленная задача будет решена, если указанная последователь-

ность u_k(p) удовлетворяет условиям

lim

||e_k(p)|| = ||e_∞(p)||,

k→∞

(3.1)

||e_k(p)|| ≤ κ̺^k

+ µ, κ > 0, µ ≥ 0,

0 < ̺ < 1,

lim

||u_k(p)|| = ||u_∞(p)||,

k→∞

где u_∞(p) ограниченная переменная, обычно называемая обученным управ-

лением.

Закон управления с итеративным обучением на текущем будем формиро-

вать следующим образом

(3.2)

ψ_k+1(p) = sat(u_k+1(p)), u_k+1(p) = sat(ψ_k(p) + δu_k+1

(p)),

где δu_k+1(p)

корректирующая поправка, которая должна быть выбрана

так, чтобы обеспечить условия сходимости (3.1).

Следуя стандартной технике, перейдем от (2.1) к эквивалентной рас-

ширенной модели, c этой целью введем вспомогательный вектор x_k раз-

мерности dn_u, компоненты которого определяются как x_ki(p) = ψ_k(p - i),

i = 1,...,d. Этот вектор, очевидно, будет удовлетворять уравнению

(3.3)

x_k(p + 1) = A_dx_k(p) + B_dψ_k

(p),

где

















I ...

A_d =



, B_d = [I 0 0...0]^T.









... I

С учетом этого первое уравнение из (2.1) можно записать в виде

(3.4)

x_k(p + 1) = Ax_k(p) + BC_dx_k

(p),

где C_d = [0 . . . 0|{z} I].

d-1

Обозначим x_k+1(p) = [x^Tk+1(p) x^Tk+1(p)]^T запишем (3.3), (3.4) в виде одного

уравнения

x_k(p + 1)

Ax_k(p) + Bψ_k(p),

(3.5)

y_k(p)

Cx_k

(p),

124

где

[

]

[

]

A BC_d

C = [C 0].

A_d

B_d

Предположим, что вектор состояния доступен для формирования управления

и матрица CB является невырожденной. При отсутствии запаздывания по-

следнее условие позволяет достаточно просто записать уравнение для ошибки

обучения, как функции числа повторений. Для расширенной модел

C B = 0,

что приводит к необходимости дополнительных преобразований. Сначала за-

пишем уравнения для приращений расширенного вектора состояния. Для

этого введем вспомогательную переменную

(3.6)

η_k+1(p + 1) = x_k+1(p) - x_k

(p).

В соответствии с (3.5) этa переменная удовлетворяют уравнению

(3.7)

η_k+1(p + 1)

Aη_k+1(p) +BΔψ_k+1

(p - 1),

где Δψ_k+1(p - 1) = ψ_k+1(p - 1) - ψ_k(p - 1). Учитывая структуру матриц

и B, нетрудно непосредственно убедиться, что

(3.8)

A^dB

=CB.

Введем в рассмотрение смещенную ошибку обучения e¯_k(p) = e_k(p + d). В со-

ответствии с (2.3) , (3.5)-(3.7) она будет описываться уравнением

(3.9)

ek+1(p) =

CAˆ^d+1η_k+1(p) + e_k(p) - CBΔψ_k+1(p - 1).

Заметим, что при формировании управления в (3.2), кроме переменных со-

стояния, доступна также переменная x_kd. Это дает дополнительную инфор-

мацию для формирования управления, поэтому корректирующую поправку

зададим в виде

(3.10)

δu_k+1(p) = K₁η_k+1(p + 1) + K₂e_k

(p + 1),

где матрица K₁ имеет вид

K₁ = [K₁₁

0...0

|{z}

{z }

{z}

nx (d-1)nu nu

Подставляя (3.10) в (3.7), (3.9), получим

(3.11)

η_k+1(p + 1) =

A +BK₁)η_k+1(p) +BK₂e_k(p) + Bϕ_k

(p),

ek+1(p) = -

CAˆ^d+1 + CBK₁)η_k+1(p) +

+ (I - CBK₂)e_k(p) - CBϕ_k(p),

125

где ϕ_k(p) = Δψ_k+1(p - 1) - δu_k+1(p - 1). Обозначим

[

]

[

]_T

K =

K₁

K₂

, ζ_k(p) =

η^Tk+1(p)

eTk (p)

Из (2.2) следует ограничение

(3.12)

-2U_j ≤ sat(u_k+1(p))_j - sat(u_k(p))_j ≤ 2U_j , j = 1, . . . , n_u.

В соответствии с (2.2), (3.10) нетрудно видеть, что компоненты функции ϕ_k(p)

удовлетворяют ограничениям

[

]

(3.13) F_j [(ϕ_k(p))_j , (ζ_k(p))_j ] =

((ϕ_k(p))_j + (Kζ_k(p))_j ) ×

2U_j

[

]

× 1-

((ϕ_k(p))_j + (Kζ_k(p))_j )

≥ 0, j = 1, 2, . . . , n_u.

2U_j

Система (3.11) относится к классу нелинейных повторяющихся процессов,

которые представляют собой наиболее распространенный частный случай так

называемых 2D систем [25].

4. Синтез на основе дивергентного метода

векторных функций Ляпунова

Рассмотрим векторную функцию Ляпунова, определенную на траекториях

системы (3.11):

[

]

1(ηk+1(p))

(4.1)

V (η_k+1(p), e_k(p)) =

V₂(e_k(p))

где V₁(η_k+1(p)) > 0, η = 0, V₂(e_k(p)) > 0,

ek(p) = 0, V1(0) = 0, V2(0) = 0, и

определим аналог оператора дивергенции вдоль траекторий этой системы

как

D_dV (η_k+1(p), e_k(p)) = V₁(η_k+1(p + 1)) - V₁(η_k+1(p)) +

(4.2)

+ V₂(e_k+1(p)) - V₂(e_k(p)).

Теорема 1. Если существуют векторная функция Ляпунова (4.1), по-

ложительные числа c₁, c₂, c₃ и неотрицательное число γ такие, что

(4.3)

c₁||η_k(p)||² ≤ V₁(η_k(p)) ≤ c₂||η_k(p)||²,

(4.4)

c₁||e_k(p)||² ≤ V₂(e_k(p)) ≤ c₂||e_k(p)||²,

(4.5)

D_dV (η_k+1(p), e_k(p)) ≤ γ - c₃(||η_k+1(p)||² + ||e_k(p)||²

то для системы (3.11) выполняются условия сходимости (3.1).

126

Доказательство. Для случая γ = 0 доказательство совпадает с при-

веденным в [26] (Теорема 1). При γ = 0, следуя технике указанного доказа-

тельства, получим

(4.6)

||e_k(p - 1)||² ≤









∑

1 λk



≤

λ^p-1-qV₂(e₀(q)) + γ

λ^p-1-q λ^k-1-n,

q=0

n=0

q=0

где 0 < λ < 1. Поскольку ||e₀(q)||² ограничена для всех 0 ≤ q ≤ N - 1, суще-

ствует µ > 0, такое что ||e₀(q)||² ≤ µ и в соответствии с (4.4)

∑

c₂ µ

(4.7)

λ^p-1-qV₂(e₀(q)) ≤ c₂ µ

λ^p-1-q =

1-λ

q=0

Из (4.6) с учетом (4.7) получим

||e_k(p - 1)||² ≤ αλ^k + β,

(4.8)

c₂ µ

α=

β =

1≤p≤N.

c₁(1 - λ)

c₁(1 - λ)²

Поскольку e_k(p - 1) по определению является смещенной ошибкой обучения,

из (4.8) получим второе неравенство из (3.1) с параметрами κ =

√α, ̺ =√λ

и µ=

√β. Кроме того, по аналогии с выводом (4.8) приходим к следующей

оценке:

(4.9)

||η_k(p)|| ≤ κ̺^k

+ µ,

0 ≤ p ≤ N - 1.

Поскольку δu_k+1(p) определяется выражением (3.10), из (4.8) и (4.9) следует

существование κ и µ таких, что

||δu_k+1(p)|| ≤ κ̺^k + µ

для всех k и 0 ≤ p ≤ N - 1. Из второго равенства в (3.2) имеем:

||u_k+1(p)|| ≤ ||ψ_k(p)|| + ||δu_k+1(p)||.

Откуда, с учетом ограниченности ψ_k(p) и предыдущего неравенства следует,

что ||u_k(p)|| ограничена для всех k и 0 ≤ p ≤ N - 1 и ||u_∞(p)|| = lim

||u_k(p)||

k→∞

также ограничена. Таким образом, все условия из (3.1) выполнены. Теорема

доказана.

Обозначим

[

]

[

]

(4.10)

A^d+1

-CB

D_U = diag[1/4U^2j], T_U = D^-1U, j = 1,2... ,n_u

127

и определим матрицу P = diag[P₁ P₂] ≻ 0 как решение дискретного алгебра-

ического неравеннства Риккати

(4.11)

A^T

A-(1-σ)P

A^T PB[BT PB + R]^-1 B^T PA

+ Q ≼ 0,

где 0 < σ < 1 и Q ≻ 0 и R ≻ 0. Это неравенство вводится с целью выде-

ления в правой части выражения для дивергенции соотношений, близких

к используемым в классической теории линейно-квадратичного регулятора.

В частности, матрицы Q и R по смыслу аналогичны весовым матрицам в упо-

мянутой теории, а параметр σ дает дополнительную возможность влияния

на запас устойчивости. После таких преобразований, детально изложенных

в [27], удается эффективно применить технику линейных матричных нера-

венств (ЛМН). С помощью леммы о дополнении Шура (4.11) легко сводится

к ЛМН относительно переменной X = diag[X₁ X₂] с X₁ = P^-11 и X₂ = P^-12 :





(1 - σ)X

XA¯^T





(4.12)



AX X +BR^-1 B^T

 ≽ 0, X ≻ 0.

Q^-1

Если это ЛМН разрешимо, то P = X^-1 и в соответствии с результата-

ми [27] линейный закон управления без ограничений с корректирующей по-

правкой (3.10), которую компактно можно записать как δu_k+1(p) = Kζ_k(p),

гарантирует сходимость ошибки обучения к нулю при k → ∞, где

(4.13)

K = [K₁ K₂] = -[ BTP B + R]^-1 B^TPAΘ,

Θ блочно диагональная матрица вида

[

]

Θ₁

Θ=

, Θ₁ = diag[Θ₁₁

0...0

|{z}

Θ₂

nx (d-1)nu nu

удовлетворяющая ЛМН

[

√

]

M - MΘ - ΘM - Q Θ

(4.14)

√

≼ 0,

MΘ

-I

A^T PB[BT PB + R]^-1 B^T

A. Соотношение (4.14) отражает структурные

ограничения на матрицу K₁ в (3.10), при отсутствии таких ограничений оно

заведомо выполняется. Матрица корректирующей поправки для случая от-

сутствия ограничений может быть также вычислена альтернативным мето-

дом. Пусть переменные X, Y , Z являются решением системы матричных

неравенств и уравнений





AX +BY H)^T X (Y H)^T







AX +BY H



(4.15)





≽ 0,



Q^-1



R^-1

HX = ZH, X = diag[X₁ X₂] ≻ 0,

128

где





Inx





H =

 0

Inu

.

Iny

В этом случае в соответствии с леммой о дополнении Шура справедливо

неравенство

(4.16)

A+BKH)^TP

A+BKH)-P +Q+(KH)^TRK

H ≼ 0,

где P = diag[P₁ P₂] = X^-1 ≻ 0,

(4.17)

K= Y Z^-1,

из которого следует, что выполняются условия теоремы 1 из [26] с компонен-

тами векторной функции Ляпунова в виде квадратичных форм

V₁(η_k+1(p)) = η^Tk+1(p)P₁η_k+1(p),

(4.18)

V₂(e_k(p)) = e^Tk (p)P₂e_k

(p)

и корректирующая поправка δu_k+1(p) =KHζ_k(p) гарантирует сходимость

ошибки обучения в системе без ограничений к нулю при k → ∞.

Теорема 2. Пусть для заданных ограничений (3.13) и некоторых мат-

риц Q ≻ 0, R ≻ 0 и Θ существует решение X = diag[X₁ X₂] ≻ 0 систе-

мы (4.12), (4.14), такое что ЛМН





-W

-(KW )^T

AW +BKW)^T





(4.19)



-KW

-TT_U

TT_U B^T

≺0

AW +BKW)

BTT_U

-W

разрешимо относительно переменных W = diag[W₁ W₂] ≻ 0, T = diag[T_j ] ≻ 0,

j = 1,...,n_u, при K, определяемым (4.13). Тогда закон управления с итера-

тивным обучением (3.2), (3.10) обеспечивает условия сходимости (3.1).

Доказательство. Выберем компоненты векторной функции (4.1) в ви-

де квадратичных форм вида (4.18), где P₁ ≻ 0 и P₂ ≻ 0 и образуем блоч-

ную матрицу P = diag[P₁ P₂]. Поскольку система (4.12), (4.14) разрешима,

определим K по формуле (4.13). Вычисляя дивергенцию (4.2) вдоль траек-

торий (3.11), получим

(4.20)

D_dV (η, e) = [

A+BKH)ζ +Bϕ]^TP[

A + BKH)ζ + Bϕ] - ζ^T

Pζ.

Поскольку V₁(η_k+1(p)) ≻ 0 и V₂(e_k(p)) ≻ 0, то справедливы условия (4.3)

и (4.4) Теоремы 1.

129

Для выполнения условия (4.5) Теоремы 1 при выполнении ограниче-

ний (3.13) достаточно, чтобы для всех ϕ и ζ выполнялось неравенство

∑

(4.21)

D_dV (η, e) +

d_jF_j[(ϕ_k)_j,(ζ_k)_j] ≤ γ - ǫ||ζ||²,

j=1

где d_j, j = 1, . . . , n_u

положительные постоянные и ǫ достаточно малое

положительное число [28]. При выполнении (4.21) получим что

D_dV (η, e) ≤ γ - ǫ||ζ||²,

для всех ϕ и ζ, и, следовательно, при ограничениях (3.13). Таким образом,

все условия теоремы 1 будут выполнены, а условие (4.21) можно переписать

в виде

(4.22) D_dV (η, e) - ζ^T (KH)^T DD_U KHζ - 2ζ^T (KH)^T DD_U ϕ -

- ϕ^TDD_Uϕ + tr(D) ≤ γ - ǫ||ζ||²,

где D = diag[d_j ], j = 1, 2 . . . , n_u и ǫ достаточно малое положительное число.

В случае, когда n_u = 1, этот подход, известный как S-процедура, гаранти-

рует, что (4.21) является не только достаточным, но и необходимым условием

выполнения (4.5) при ограничениях (3.13) [29].

Выбирая γ = tr(D), получим, что условие (4.5) теоремы 1 выполняется,

если

(4.23)

[

A+BKH)ζ +Bϕ]^TP[

A + BKH)ζ + Bϕ] - ζ^TPζ -

- 2ζ^T (KH)^T DD_U ϕ - ϕ^T (t)DD_U ϕ < 0,

или

[ζ^T ϕ^T

M_i[ζ^T ϕ^T ]^T ≺ 0,

где

[

]

A+BKH)^TP

A+BKH) - P

(BT P

A+BKH) - DD_UKH)

B^TP

A+BKH) - DD_UKH

B^TPB - DD_U

МатрицаM может быть переписана как

[

]

[

-P

-(KH)^T DD_U

A+BKH)^T ]

P [

A + BKH)B].

−DD_U KH

-DD_U

По лемме о дополнении ШураMi ≺ 0 если и только если





-P

-(KH)^T DD_U

A_i +BKH)^T





(4.24)

-DD_U

 -DDU (KH)

 ≺ 0.

A_i +BKH)

-P^-1

Обозначим W = P^-1, T = D^-1. Умножая (4.24) на diag[P^-1 [DD_U ]^-1 I] спра-

ва и слева, получим, что справедливо (4.19). Теорема доказана.

130

Используя другой метод вычисления матрицы K, сформулируем альтерна-

тивную версию теоремы.

Теорема 3. Пусть для заданных ограничений (3.13) и некоторых мат-

риц Q ≻ 0, R ≻ 0 существует решение X = diag[X₁ X₂] ≻ 0, Y, Z систе-

мы (4.15), такое что ЛМН

(4.19) разрешимо относительно перемен-

ных W = diag[W₁ W₂] ≻ 0, T = diag[T_j] ≻ 0, j = 1, . . . , n_u, при K =KH, где

K определяется из (4.17). Тогда закон управления с итеративным обучени-

ем (3.2), (3.10) обеспечивает условия сходимости (3.1).

5. Пример

Рассмотрим модель экспериментальной установки из [30]. Она состоит из

двух синхронных двигателей с постоянными магнитами, валы которых со-

единены муфтой. Первый двигатель (A) является приводом, а второй дви-

гатель (Б) создает крутящий момент нагрузки. Целью управления является

воспроизведение валом привода заданной траектории изменения углового по-

ложения θ(t). Непрерывная модель динамики установки имеет вид

d²θ(t)

dθ(t)

(5.1)

T_e(t) = i_A(t)k_tA = J

+T_l

(t),

dt²

где T_e(t) крутящий момент, создаваемый двигателем А, k_tA постоянная

крутящего момента двигателя А, J общий момент инерции, b резуль-

тирующий коэффициент трения, T_l(t) крутящий момент нагрузки (дви-

гателя Б). Численные значения параметров следующие: T_cA = 0,8 · 10^-3 с,

k_tA = 0,93 Н·м/А, J = 9,3 · 10^-4 кг·м², b = 2,4 · 10^-3 кг·м²/с.

Дискретный сигнал управления вычисляется с шагом дискретности

T_s = 2 мс при запаздывании на 1 шаг. Этот сигнал преобразуется в управляю-

щий ток с помощью экстраполяции нулевого порядка и последующего уси-

ления. Результирующая дискретная модель в пространстве состояний имеет

вид

x_k(p + 1) = Ax_k(p) + Bu_k(p) + Ed_k(p),

(5.2)

y_k(p) = Cx_k(p),

где













0,0020

-0,0021

[

]













0 0,9949

1,9948, B=

0, E=

-2,1450, C =





θ_k(p)





x_k(p) =

ωk(p), uk(p) = iAek(p), dk(p) = Tlk(p),

i_Ak(p)

θ_k(p) угол поворота вала на k-м повторении, ω_k(p) угловая скорость вала

на k-м повторении, i_Ak(p) величина тока на двигателе А на k-м повторении,

131

10¹

U = 4.0

U = 4.1

10⁰

U = 4.2

U = 4.3

10^-1

10^-2

10^-3

10^-4

10^-5

100

200

300

400

500

600

Рис. 1. Изменение среднеквадратической ошибки обучения при различных

уровнях насыщения.

i^refAk(p)

величина управляющего тока на k-м повторении, T_lk(p) величина

крутящего момента нагрузки на k-м повторении.

В соответствии с результатами предыдущего раздела закон управления с

итеративным обучением имеет вид

(

)

(5.3)

u_k(p) = sat

u_k-1(p) + K₁(x_k(p) - x_k-1(p)) + K₂e_k-1(p + 2)

где K₁ и K₂ вычисляются в соответствии с условиями теоремы 2. При этом

при решении (4.12), (4.14) использованы следующие параметры:

Q = diag[0,2 · 10⁶

10⁴

10¹⁰], R = 1,5, σ = 0,9,

Θ = diag[1 1 1 1,2].

Для этих параметров неравенство (4.19) выполняется для всех рассматривае-

мых далее значений величины насыщения. В результате получим

K₁ = [-30,1869

- 0,5717

- 1,0856], K₂ = 14,3028.

При отсутствии ограничений на управление максимальное значение управ-

ляющего сигнала составляет 4.7 А. Оценку влияния величины ограничения

на точность слежения проведем по среднеквадратической ошибке обучения

∑

√1

(5.4)

RMS(e_k) =

||e_k(p)||².

p=0

132

-2

600

400

200

500

400

300

200

100

Рис. 6. Изменение ошибки обучения в зависимости от числа повторений при

уровне насыщения U = 4,3.

при уменьшении уровня насыщения с 4,3 до 4,0 А установившаяся ошибка

увеличивается примерно в 100 раз. На рис. 2 представлена эталонная траек-

тория изменения угла. Рисунки 3 и 4 показывают характер изменения угла и

угловой скорости привода в зависимости от числа повторений. На рис. 5 и 6

показаны характер изменения управляющего сигнала и ошибки обучения в

зависимости от числа повторений.

6. Заключение

Полученный закон управления с итеративным обучением построен для

определенной величины запаздывания и не гарантирует сходимость ошибки

обучения при другом запаздывании. В то же время интересно получить ре-

зультат для случая переменного запаздывания из определенного диапазона.

Как было отмечено во введении, УИО корректирует входной сигнал, не ме-

няя структуры системы, и достижение требуемой точности зависит как от

информационной структуры, так и от мощности входного сигнала. В случае

нелинейности типа насыщения на входе, мощность сигнала ограничивает-

ся, предельная ошибка при k → ∞ стабилизируется относительно некоторого

значения, отличного от нуля, и требуемая точность может не достигаться.

С другой стороны, при отсутствии насыщения обученное управление име-

ет естественную границу и наилучший результат будет достигнут, когда эта

граница лежит внутри области насыщения. В противном случае необходи-

135

мо тщательно изучить влияние насыщения на снижение точности, которое,

как показывает пример, может быть существенным, на практике этот анализ

может служить рекомендацией для выбора привода нужной мощности.

Определенным недостатком предложенного подхода является отсутствие

явных зависимостей скорости сходимости ошибки обучения и достижимой

точности от величины запаздывания и уровня насыщения.

Существенный интерес в дальнейшем представляет разработка алгорит-

мов УИО при запаздывании вдоль повторений, которое возможно при уда-

ленном управлении, и при смешанном запаздывании вдоль повторений и

относительно повторений одновременно.

СПИСОК ЛИТЕРАТУРЫ

Arimoto S., Kawamura S., Miyazaki F. Bettering Operation of Robots by Learn-

ing // J. Robot. Syst. 1984. V. 1. P. 123-140.

Freeman C.T., Rogers E., Hughes A.-M., Burridge J.H., Meadmore K.L. Iterative

learning control in health care: electrical stimulation and robotic-assisted upper-limb

stroke rehabilitation // IEEE Control Syst. Magaz. 2012. V. 47. P. 70-80.

Meadmore K.L., Exell T.A., Hallewell E., Hughes A.-M., Freeman C.T., Kutlu M.,

Benson V., Rogers E., Burridge J.H. The application of precisely controlled func-

tional electrical stimulation to the shoulder, elbow and wrist for upper limb stroke

rehabilitation: a feasibility study // J. of NeuroEngineer. and Rehabilitation. 2014.

P. 11-105.

Ketelhut M., Stemmler S., Gesenhues J., Hein M., Abel D. Iterative learning con-

trol of ventricular assist devices with variable cycle durations // Control Engineer.

Practice. 2019. V. 83. P. 33-44.

Sammons P.M., Gegel M.L., Bristow D.A., Landers R.G. Repetitive Process Control

of Additive Manufacturing with Application to Laser Metal Deposition // IEEE

Transact. Control Syst. Technol. 2019. V. 27. No. 2. P. 566-575.

Lim I., Hoelzle D.J., Barton K.L. A multi-objective iterative learning control ap-

proach for additive manufacturing applications // Control Engineer. Practice. 2017.

V. 64. P. 74-87.

Sornmo O., Bernhardsson B., Kroling O., Gunnarsson P., Tenghamn R. Frequency-

domain iterative learning control of a marine vibrator // Control Engineer. Practice.

2016. V. 47. P. 70-80.

Hladowski L., Galkowski K., Cai Z., Rogers E., Freeman C., Lewin P. Experimen-

tally Supported 2D Systems Based Iterative Learning Control Law Design for Error

Convergence and Performance // Control Engineer. Practice. 2010. V. 18. P. 339-348.

Bristow D.A., Tharayil M., Alleyne A.G. A Survey of Iterative Learning Control:

A Learning-Based Method for High-Performance Tracking Control // IEEE Control

Syst. Magaz. 2006. V. 26. No. 3. P. 96-114.

10.

Ahn H-S., Chen Y.Q., Moore K.L. Iterative Learning Control: Survey and Catego-

rization // IEEE Trans. Syst. Man Cybern. Part C: Appl. Rev. 2007. V. 37. No. 6.

P. 1099-1121.

11.

Xu J-X., Tan Y., Lee T-H. Iterative learning control design based on composite

energy function with input saturation // Automatica. 2004. V. 40. P. 1371-1377.

136

12.

Mishra S., Topcu U., Tomizuka M. Iterative Learning Control with Saturation Con-

straints // Proc. 2009 American Control Conf. 2009. P. 943-948.

13.

Zhang R., Chi R. Iterative Learning Control for a Class of MIMO Nonlinear System

with Input Saturation Constraint // Proc. 36th Chinese Control Conf. 2017. P. 3543-

3547.

14.

Lješnjanin M., Tan Y., Oetomo D., Freeman C.T. Spatial Iterative Learning Control:

Systems with Input Saturation // 2017 American Control Conf. 2017. P. 5121-5126.

15.

Wei Z-B., Quan Q., Cai K-Y. Output Feedback ILC for a Class of Nonminimum

Phase Nonlinear Systems With Input Saturation: An Additive-State-Decomposition-

Based Method // IEEE Trans. Autom. Control. 2017. V. 62. P. 502-508.

16.

Sebastian G., Tan Y., Oetomo D., Mareels I. Iterative Learning Control for Linear

Time-varying Systems with Input and Output Constraints // 2018 Australian and

New Zealand Control Conf. (ANZCC). 2018. P. 87-92.

17.

Sebastian G., Tan Y., Oetomo D. Convergence analysis of feedback-based iterative

learning control with input saturation // Automatica. 2019. V. 101. P. 44-52.

18.

Chen Y., Gong Z., Wen C. Analysis of a High-Order Iterative Learning Control

Algorithm for Uncertain Nonlinear Systems with State Delays // Automatica. 1998.

V. 34. P. 345-353.

19.

Liu T., Gao F., Wang Y. IMC-based iterative learning control for batch processes

with uncertain time delay // Journal of Process Control. 2010. V. 20. P. 173-180.

20.

Wang L., Mo S., Zhou D., Gao F., Chen X. Delay-range-dependent robust 2D it-

erative learning control for batch processes with state delay and uncertainties //

Journal of Process Control. 2013. V. 23. P. 715-730.

21.

Tao H., Paszke W., Yang H., Galkowski K. Finite frequency range robust iterative

learning control of linear discrete system with multiple time-delays // Journal of the

Franklin Institute. 2019. V. 356. P. 2690-2708.

22.

Tao H., Paszke W., Rogers E., Yang H., Galkowski K. Finite frequency range iter-

ative learning fault-tolerant control for discrete time-delay uncertain systems with

actuator faults // ISA Transactions. 2019. V. 95. P. 152-163.

23.

Browne F., Rees B., Chiu G.T.-C., Jain N. Iterative Learning Control With Time-

Delay Compensation: An Application to Twin-Roll Strip Casting // IEEE Trans.

Control Systems Technology. 2021. V. 29. P. 140-149.

24.

Pakshin P., Emelianova J., Rogers E., Galkowski K. Iterative Learning Control with

Input Saturation // IFAC PapersOnLine. 2019. V. 52. No. 29. P. 338-343.

25.

Rogers E., Galkowski K., Owens D.H. Control Systems Theory and Applications

for Linear Repetitive Processes / Lect. Notes Control Inform. Sci. Berlin: Springer-

Verlag, 2007. V. 349.

26.

Pakshin P., Emelianova J., Emelianov M., Galkowski K., Rogers E. Dissipivity and

Stabilization of Nonlinear Repetitive Processes // Syst. & Control Lett. 2016. V. 91.

P. 14-20.

27.

Емельянова Ю.П., Пакшин П.В. Синтез управления с итеративным обучением

на основе наблюдателя состояния // АиТ. 2019. № 9. С. 9-24.

Emelianova J.P., Pakshin P.V. Iterative Learning Control Design Based on State

Observer // Automation and Remote Control. 2019. V 80. P. 1561-1573.

28.

Tarbouriech S., Garcia G., Gomes da Silva Jr. J.M., Queinnec I. Stability and Sta-

bilization of Linear Systems with Saturating Actuators.- London: Springer-Verlag.

2011.

137