Автоматика и телемеханика, № 8, 2022
Робастное, адаптивное и сетевое
управление
© 2022 г. М.М. КОГАН, д-р физ.-мат. наук (mkogan@nngasu.ru)
(Нижегородский государственный
архитектурно-строительный университет)
АДАПТИВНОЕ H-ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ1
Для линейных динамических объектов рассматривается новый класс
регуляторов с настраиваемыми параметрами, синтезируемых с целью
уменьшения интегральных показателей влияния начального и внешне-
го возмущений. Параметры регулятора настраиваются согласно диффе-
ренциальному уравнению в направлении убывания локальной целевой
функции. Формулируются условия, при выполнении которых достигается
цель управления, и приводятся потери по сравнению со стационарными
линейно-квадратичным и H-оптимальным регуляторами, в том числе
и в случае вырожденных функционалов. Показано, как эти регуляторы
применяются в адаптивном линейно-квадратичном и H-оптимальном
управлении для неопределенных объектов, параметры которых принад-
лежат заданному многограннику, а также в адаптивном отслеживании
выхода эталонной модели.
Ключевые слова: адаптивное управление, H-оптимальное управление,
линейно-квадратичное управление, линейные матричные неравенства.
DOI: 10.31857/S0005231022080074, EDN: AHHFHC
1. Введение
В статье развивается подход к синтезу законов управления в условиях
неопределенности, берущий свое начало в работах Ю.И. Неймарка, связан-
ных с адаптивным управлением по скорости убывания функции Ляпунова
[1; 2, c. 304], и А.Л. Фрадкова по скоростному градиенту [3, 4]. Основная идея
этого подхода состоит в следующем. Пусть динамическая система при неко-
торых постоянных значениях параметров допускает квадратичную функцию
Ляпунова, обеспечивающую асимптотическую устойчивость состояния рав-
новесия. Если параметры системы настраивать в направлении убывания про-
изводной этой функции Ляпунова по траектории системы, то ее состояние бу-
дет стремиться к тому же равновесию. Такой подход позволил с единых пози-
ций рассмотреть многие из известных к тому времени алгоритмов адаптации
1 Работа выполнена при финансовой поддержке Научно-образовательного математиче-
ского центра “Математика технологий будущего” (соглашение № 075-02-2021-1394).
123
и идентификации в задачах управления и наблюдения в условиях неопреде-
ленности. Из недавних обзоров [5, 6] можно узнать о конкретных результатах,
полученных по этой теме за последние 40 с лишним лет.
Основное внимание в работах этого направления уделялось решению за-
дач стабилизации или асимптотического отслеживания и лишь в некоторых
из них рассматривались задачи адаптивного управления с оценкой функцио-
нала качества и, в частности, задачи оптимального гашения возмущений. Так,
в [7] для квадратных систем, в которых размерности векторов управления и
целевого выхода совпадают, синтезируется система адаптивного управления,
обеспечивающая гарантированное значение H-нормы при асимптотическом
отслеживании выхода эталонной модели. В [8] заданный уровень гашения воз-
мущений при адаптивном управлении, основанном на методе пассификации
(см. [9]), обеспечивается за счет введения дополнительного шунтирования
в алгоритм настройки для ограничения роста настраиваемых параметров.
В [10] показано, что при некоторых дополнительных условиях стандартное
адаптивное управление гарантирует заданный уровень гашения возмущений
для систем, в которых вектор управления не входит в целевой выход.
В настоящей работе адаптивное управление синтезируется на основе неста-
ционарных регуляторов, предназначенных для минимизации максимального
отношения L2-нормы целевого выхода z к L2-норме внешнего возмущения v
и/или евклидовой норме начального возмущения x0. Это максимальное отно-
шение называется уровнем гашения возмущений системы, а точнее: при внеш-
нем возмущении и нулевых начальных условиях H-нормой, при неизвест-
ных начальных условиях в отсутствиe внешнего возмущения γ0-нормой и
при неизвестных начальных условиях и внешнем возмущении обобщенной
H-нормой. В общих чертах синтез заключается в следующем. Если в объ-
екте управления с линейной обратной связью уровень гашения возмущений
меньше заданного числа γ, то найдется положительно определенная функция
Ляпунова V (x) = xTP x такая, что по траектории замкнутой системы при лю-
V
бых возмущениях выполняется неравенство
+ |z|2 - γ2|v|2 < 0, в котором
V
производная по времени функции V (x) в силу системы. Левую часть это-
го неравенства, рассматриваемую как функцию параметров обратной связи,
назовем локальной целевой функцией и будем настраивать параметры регу-
лятора в направлении убывания этой функции. Оказывается, что если при
каких-либо, вообще говоря, неизвестных значениях параметров локальная це-
левая функция является отрицательно определенной, уровень гашения воз-
мущений в системе, замкнутой таким нестационарным регулятором, также
будет меньше γ. Для этих регуляторов указываются оценки потерь по срав-
нению с соответствующими оптимальными регуляторами.
Статья структурирована следующим образом. После введения во втором
разделе описывается синтез регуляторов с настраиваемыми параметрами для
гашения возмущений и доказывается основная теорема. В третьем разделе
приводится анализ нестационарной системы управления при измеряемом со-
стоянии, решается обратная задача H-оптимального управления и находят-
124
ся условия, при которых система управления с данным алгоритмом настрой-
ки параметров обеспечивает требуемый уровень гашения возмущений. В чет-
вертом разделе показано, как на основе предлагаемого подхода синтезиро-
вать адаптивные линейно-квадратичные, γ-оптимальные и H-оптимальные
управления для неопределенной системы, у которой элементы матриц при-
надлежат заданному многограннику, а в пятом разделе - как синтезировать
адаптивное оптимальное отслеживание выхода эталонной модели.
2. Синтез нестационарных регуляторов
для гашения возмущений
Пусть уравнения управляемой системы имеют вид
x = Ax + Buu + Bvv,
(2.1)
y = Cyx,
z = Cx + Du,
в которых x ∈ Rnx состояние системы, u ∈ Rnu управление, y ∈ Rny
измеряемый выход, z ∈ Rnz целевой выход, v ∈ Rnv возмущение, принад-
лежащее классу L2 на соответствующем интервале времени. Примем ради
упрощения выкладок, что CTD = 0.
Сформулируем следующее предположение, которое будет неоднократно
применяться в дальнейшем.
Предположение A. Для системы (2.1) существует квадратичная функ-
ция V (x) = xTP x с постоянной положительно определенной матрицей P и
стационарный закон управления u = Θy такие, что выполняется условие
(2.2)
V
+ |z|2 - γ2|v|2
<0
∀ x,v,
гдеV обозначает производную по времени от функции V (x) в силу уравнений
замкнутой системы.
Известно, что если предположение A выполнено, то уровень гашения воз-
мущений в замкнутой системе с учетом начальных условий меньше γ, т.е.
(2.3)
∥z∥2[0,T] < γ2∥v∥2[0,T] + xT0P x0
∀T.
В этом случае в дальнейшем будем говорить, что функция V (x) обеспечива-
ет уровень гашения возмущений, меньший γ. Величина γ является верхней
границей γ0-нормы, H-нормы и обобщенной H-нормы замкнутой системы,
т.е.
∥z∥
∥z∥
γ0 = sup
< γ,
∥H∥ = sup
< γ,
x0=0, v≡0 |x0|
v=0, x0=0 ∥v∥
(2.4)
∥z∥
∥H∥g∞ =
sup
< γ,
xT0Rx0+∥v∥2=0 xT0
Rx0 + ∥v∥2
125
где R = RT > 0. Заметим, что при отсутствии внешнего возмущения из (2.3)
следует, что ∥z∥2 < xT0P x0. Поэтому для того, чтобы γ0 < γ, нужно дополни-
тельно потребовать выполнение неравенства P < γ2I. При наличии внешнего
возмущения и ненулевых начальных условий из (2.3) следует, что для того,
чтобы ∥H∥g∞ < γ, требуется дополнительное неравенство P < γ2R.
Рассмотрим закон управление вида u = Θ(t)y, в котором матрица пара-
метров Θ(t) настраивается с целью минимизации функции
Φ(x, v, Θ) =V + |z|2 - γ2|v|2.
А именно, пусть в каждый момент времени скорость изменения матрицы на-
страиваемых параметров регулятора составляет острый угол с направлением
наискорейшего убывания этой функции, т.е. определяется в соответствии с
уравнением
(
)
Θ=-(1/2)M-1Θ
V
(2.5)
+ |z|2 - γ2|v|2
с начальным условием Θ(0) = Θ0, где (nu × nu)-матрица M = MT > 0 и
Θ обозначает градиент по Θ, т.е. (nu × ny)-матрицу, элементы которой есть
частные производные функции Φ(x, v, Θ) по соответствующим элементам
матрицы Θ. Задача заключается в нахождении условий, при которых в за-
мкнутой системе при управлении u = Θ(t)y, (2.5) уровень гашения возмуще-
ний будет меньше γ.
Запишем функцию
Φ(x, v, Θ) = 2xTP (Ax + BuΘy + Bvv) +
(2.6)
+ xTCTCx + yTΘTDTDΘy - γ2vTv
и вычислим ее градиент
(1/2)∇ΘΦ(x, v, Θ) = BTuP xyT + DTDΘyyT.
Допустим, что найдется постоянная (nu × ny)-матрица K, удовлетворяющая
уравнению
(2.7)
KCy = -BTuP.
Тогда уравнение настройки параметров (2.5) примет вид
(
)
Θ=-M-1
(2.8)
DTDΘ - K
yyT.
В случае DTD = S > 0, который будем называть невырожденным, пара-
метры настраиваются в соответствии с уравнением
Θ=-M-1S(Θ-ζ)yyT,
(2.9)
126
где матрица ζ = S-1K согласно
(2.7) удовлетворяет уравнению ζCy =
= -S-1BTu P. При D = 0 уравнение (2.8) записывается как
Θ=M-1KyyT,
(2.10)
где матрица K удовлетворяет (2.7). Отметим, что уравнение (2.10) совпадает
с уравнением настройки параметров по скорости убывания функции Ляпу-
нова или с уравнением скоростного градиента.
Для того, чтобы представить, как выглядит уравнение (2.8) в вырожден-
ном случае, когда DTD ≥ 0 и D = 0, используем известную декомпозицию
)
(
)(
S
0
WT
1
DTD = (W1 W2)
,
0
0
WT
2
(2.11)
(
)
WT
1
S = ST > 0,
(W1 W2) = I,
WT
2
где столбцы матрицы W1 образуют базис образа матрицы DT, а столбцы
матрицы W2 - базис ядра матрицы D, т.е. DW2 = 0. Обозначим
(2.12)
u1 = WT1u, u2 = WT2u, Bu1 = BuW1, Bu2 = BuW2
и запишем уравнения системы (2.1) с управлением u = Θ(t)y как
x = Ax + Bu1u1 + Bu2u2 + Bvv,
(2.13)
y = Cyx,
z=Cx+S1/2u1,
где u1 = Θ1(t)y, u2 = Θ2(t)y, Θ1(t) = WT1Θ(t), Θ2(t) = WT2Θ(t). При этом
уравнение (2.8) с M = αI для матрицы Θ(t) трансформируется в следующие
уравнения для матриц Θ1(t) и Θ2(t):
Θ1 = -α-1S(Θ1 - ζ1)yyT,
(2.14)
Θ2 = α-1K2yyT,
в которых ζ1 = S-1K1, а K1 и K2 удовлетворяют уравнениям
K1Cy = -BTu1P, K2Cy = -BTu2P.
В следующей теореме находятся условия, при которых синтезируемый
нестационарный регулятор обеспечивает уровень гашения возмущений, мень-
ший γ.
Теорема 2.1. Пусть предположение A выполнено для V (x) = xTPx и
существует матрица K, удовлетворяющая уравнению KCy = -BTuP . Тогда
в замкнутой системе (2.1), u = Θ(t)y, (2.8) выполняется условие
(2.15)
∥z∥2[0,T] + ∥D(u - u)∥2[0,T] < γ2∥v∥2[0,T] + ψ0
∀T,
127
где
[
]
(2.16)
ψ0 = xT0Px0 + tr
0 - Θ)TM(Θ0 - Θ)
Из доказательства теоремы 2.1, приведенного в Приложении, следует, что
для функции
[
]
(2.17)
Ψ(x, Θ) = V (x) + tr
(Θ - Θ)TM(Θ - Θ)
по траекториям замкнутой системы выполняется
Ψ+ |z|2 - γ2|v|2 = Φ(x,v,Θ) - yT(Θ - Θ)TDTD(Θ - Θ)y < 0.
В силу этого все переменные системы ограничены
Ψ(x(t), Θ(t)) ≤ Ψ(x0, Θ0) + γ2∥v∥2[0,t]
∀t
и выполняются соотношения
lim
z(t) = 0, lim
D[u(t) - u(t)] = 0.
t→∞
t→∞
Для сходимости матрицы Θ(t) к Θ требуется выполнение дополнительных
условий в частности, так называемых условий неисчезающего возбужде-
ния. Этот вопрос в данной статье не рассматривается.
Заметим также, что из (2.15) следует
∥z∥
sup
x0,v,Θ0
xT0Rx0 + ∥v∥2 + tr(Θ0 - Θ)T0 - Θ)
при условии P < γ2R, M < γ2I. По аналогии с обобщенной H-нормой (2.4)
стационарной системы эту величину можно интерпретировать как уровень
гашения внешнего возмущения и начальных возмущений по состоянию и на-
страиваемым параметрам в нестационарной системе (2.1), u = Θ(t)y, (2.8).
Таким образом, если обобщенная H-норма системы при некотором стацио-
нарном законе управления меньше γ, то указанный уровень гашения возму-
щений в рассматриваемой нестационарной системе будет также меньше γ.
Если возмущения отсутствуют, то для функции Ψ(x, Θ) > 0, заданной в
(2.17), верно неравенство
Ψ+ |z|2 + |D(u - u)|2 ≤ 0,
означающее, что независимо от поведения настраиваемых параметров ука-
занный нестационарный регулятор обеспечивает выполнение условия
∥z∥2 + ∥D(u - u)∥2 ≤ ψ0.
128
Фазовые портреты замкнутой нестационарной системы управления:
a) вырожденный случай z = x; б) невырожденный случай z = col(x; 0, 5u).
Если u = Θy является линейно-квадратичным законом управления, при ко-
тором min ∥z∥2 = xT0P x0, то “потери” соответствующего нестационарного ре-
гулятора u = Θ(t)y, (2.8) по сравнению с оптимальным регулятором не пре-
вышают согласно (2.16) величину tr [(Θ0 - Θ)TM(Θ0 - Θ)].
Отметим, что в пространстве состояний (x, Θ) нелинейной динамической
системы
x = (A + BuΘCy)x,
(2.18)
(
)
Θ=-M-1
DTDΘ - K
CyxxTCTy,
описывающей динамику замкнутой системы управления без возмущения,
имеется многообразие состояний равновесия, в которых x = 0. Именно нали-
чие целого многообразия равновесий по параметрам Θ делает необходимым
дополнительные механизмы для обеспечения сходимости Θ(t) к Θ и в целом
осложняет анализ динамики этой системы. Исследование линейной динами-
ческой системы, полученной путем линеаризации системы (2.18) в окрестно-
сти произвольной фиксированной точкиΘ этого многообразия, показывает,
что для техΘ, для которых матрица A + Bu ΘCy гурвицева, соответствующее
равновесие системы (2.18) будет устойчивым по Ляпунову (но не асимптоти-
чески устойчивым), а там где эта матрица негурвицева будет неустойчи-
вым. Предположение A состоит в том, что множество устойчивых точек в
этом многообразии не пусто, т.е. некоторая точка Θ должна принадлежать
этому множеству.
Для иллюстрации на рисунке приведены фазовые портреты двумерной
замкнутой системы, состоящей из одномерного объекта x = x + u с нестацио-
129
нарным регулятором u = θ(t)x при выборе V (x) = x2 в двух случаях: а) вы-
рожденный случай, когда целевой выход z = x, θ = -2 и алгоритм настройки
параметра регулятора˙θ = -α-1x2; б) невырожденный случай, когда целевой
выход z = col (x; 0,5u), θ = -4 и алгоритм˙θ = -α-1(θ + 4)x2. Здесь col(a,b)
обозначает вектор-столбец, состоящий из векторов a и b. Интегральные кри-
вые в этих двух случаях задаются уравнениями: а) α-1x2 + (θ + 1)2 = const;
б) (2α)-1x2 + θ - 3 ln |θ + 4| = const. Все траектории стремятся к устойчивым
состояниям равновесия x = 0, θ < -1, отмеченным на рисунке кружочками.
Крестиками отмечены неустойчивые состояния равновесия x = 0, θ ≥ -1.
3. Анализ нестационарной системы управления
при измеряемом состоянии
В этом разделе выясняются условия, при которых синтезированный неста-
ционарный регулятор приводит к достижению цели. В приводимом здесь ана-
лизе предполагается, что матрицы в уравнении объекта полностью известны.
В последующих разделах будет показано, как эти регуляторы могут быть
применены в адаптивном управлении.
В случае измеряемого состояния объекта (2.1), т.е. при Cy = I, вернемся
к предположению A и выясним условия, при которых оно выполняется. Оче-
видно, что неравенство (2.2) при постоянной матрице Θ может быть записано
как матричное неравенство
 (A + BuΘ)TP + P (A + BuΘ)
(3.1)
BTvP
2I
 < 0.
C+DΘ
0
-I
Умножая это неравенство слева и справа на матрицу diag (P-1, I, I) и обозна-
чая Y = P-1, Z = ΘY , стандартным образом получим линейное матричное
неравенство
 AY + Y AT + BuZ + ZTBTu
(3.2)
BTv
2I
<0
CY +DZ
0
-I
относительно Y > 0, Z и γ2. Следовательно, если Y удовлетворяет неравен-
ству (3.2), то регулятор u = Θ(t)x, в котором параметры настраиваются со-
гласно уравнению
(
)
(3.3)
Θ=-M-1
DTDΘ - K
xxT
с матрицей K = -BTu Y -1, обеспечивает достижение цели (2.15).
Покажем, что предположение A выполняется тогда и только тогда, когда
существует такое µ > 0, что регуляризованный центральный H-оптималь-
ный закон управления
(3.4)
u = Θpx, ΘP = -D-1µBTu P, Dµ = DTD + µ2W2WT2
>0
130
обеспечивает уровень гашения возмущений, меньший γ. Заметим, что для
функции V (x) = xTP x по траектории системы (2.1) при законе управле-
ния (3.4) выполняется условие
V
(3.5)
+ |z|2 - γ2|v|2
<0
∀ x,v,
где
z= col(z,µWT2 u) и µ
некоторый параметр. В частности, когда
DTD = S > 0, имеем Dµ = DTD и этот закон управления совпадает с так
называемым центральным H-оптимальным законом управления
(3.6)
u = -(DTD)-1BTuPx,
где матрица P удовлетворяет соответствующему матричному неравенству,
следующему из (2.2), и неравенству P < γ2I или P < γ2R для критерия γ0
или ∥H∥g∞ соответственно, а при D = 0 имеет вид u = -µ-2BTuP x.
Теорема 3.1. Следующие два утверждения относительно системы
(2.1) эквивалентны:
(i) существует положительно определенная матрица P такая, что при
некотором стационарном законе управления u = Θx для всех x и v вы-
полняется неравенствоV + |z|2 - γ2|v|2 < 0, в котором V (x) = xTP x;
(ii) линейное матричное неравенство
 AY + Y AT - BuD-1µBTu
(3.7)
BTv
2I
 < 0,
CY
0
-I
в котором D-1µ = (DTD)+ + µ-2W2WT2 > 0 и верхний “+” обознача-
ет псевдообращение, разрешимо относительно Y = YT > 0 и µ-2 > 0.
В этом случае при регуляризованном центральном H-оптимальном
законе управления u = ΘP x, где ΘP = -D-1µBTuP и P = Y-1, уровень га-
шения возмущений меньше γ.
Теперь с учетом теорем 2.1 и 3.1 приходим к следующему выводу.
Следствие 3.1. Если матрица Y > 0 удовлетворяет неравенству (3.7),
то при законе управления u = Θ(t)x, в котором параметры настраиваются
согласно уравнению
(
)
Θ=-M-1
(3.8)
DTDΘ - K
xxT
с матрицей K = -BTuY-1, выполняется условие (2.15).
В рассматриваемом синтезе нестационарных регуляторов при измеряемом
состоянии можно исключить матрицу P и непосредственно характеризовать
множество всех матриц K в уравнении (3.8), при которых достигается цель.
Для этого, подставляя равенство K = -BTuP в (3.1), получим неравенство
 ATP + PA - ΘTK - KTΘ
(3.9)
BTvP
2I
 < 0.
C+DΘ
0
-I
131
Таким образом, если при данной матрице K линейное матричное неравен-
ство (3.9) разрешимо относительно постоянных матриц P > 0, Θ и γ2 таких,
что K = -BTuP , то нестационарный регулятор u = Θ(t)x, (3.3) обеспечивает
достижение цели.
Кроме того, можно поступить следующим образом. Если обозначить ζ =
= D-1µK, то для непосредственной характеризации множества всех матриц K,
при которых достигается цель, согласно теореме 3.1 требуется выяснить, при
каких условиях для заданной матрицы ζ существует решение Y неравенства
(3.7) такое, что ζ = -D-1µBTuY-1. Так как в правой части последнего равен-
ства стоит матрица параметров закона управления (3.4), то задача сводится к
решению следующей обратной задачи центрального H-оптимального управ-
ления: при каких условиях закон управления u = ζx с заданной матрицей ζ
является центральным H-оптимальным управлением (3.4), при котором для
системы (2.1) выполняется неравенство
(
)
(3.10)
xTQx + uTDµu - γ2vTv
dt ≤ xT0P x0
0
для некоторых Q ≥ CTC и P > 0.
Введем матричные функции
W(s) = (Wu(s) Wv(s)) , Wz(s) = C(sI - A)-1(Bu Bv),
(3.11)
Wu(s) = I - ζ(sI - A)-1Bu, Wv(s) = -ζ(sI - A)-1Bv.
Здесь Wu(s) является передаточной матрицей системы
(3.12)
x = Ax + Buu + Bvv
от входа u к выходу u - ζx, которая в теории управления называется воз-
вратной разностью для заданного закона управления u = ζx, Wv(s) пере-
даточная матрица от входа v к выходу -ζx, а Wz(s) передаточная матрица
от входа col (u, v) к выходу z = Cx.
Теорема 3.2. Для системы (2.1), в которой пара (A,(Bu Bv)) управляе-
ма, CTD = 0 и матрица DTD представлена в виде декомпозиции (2.11), за-
кон управления u = Θ(t)x с матрицей Θ(t), настраиваемой согласно уравне-
нию (3.8) при заданной матрице K, обеспечивает достижение цели (2.15),
если выполнено одно из следующих эквивалентных условий, в которых Dµ =
= DTD + µ2W2WT2 > 0:
(i) закон управления u = ζx с ζ = D-1µK является регуляризованным опти-
мальным законом управления вида (3.4), обеспечивающим уровень гаше-
ния возмущений меньше γ;
(ii) в предположении, что при ζ = D-1µK матрица A + Buζ гурвицева, для
передаточных матриц W(s) и Wz(s), определенных в (3.11), выполнено
132
обобщенное частотное условие возвратной разности:
)
( Dµ
0
(3.13)
WT(-jω)DµW(jω) - WTz(-jω)Wz(jω) ≥
∀ω.
0
2I
Доказательство теоремы 3.2, приведенное в Приложении, основано на при-
менении частотной теоремы [11] (леммы Калмана-Якубовича-Попова). Заме-
тим, что частотное условие (3.13) дает решение обратной задачи централь-
ного H-оптимального управления, сформулированной перед теоремой 3.2.
В отсутствие возмущений частотное условие (3.13) принимает вид
WTu(-jω)DµWu(jω) - WTzu(-jω)Wzu(jω) ≥ Dµ
∀ω,
где Wzu(s) = C(sI - A)-1Bu. При C = 0 и в невырожденном случае, т.е. когда
µ = 0, это условие переходит в хорошо известное частотное условие возврат-
ной разности [12]
(3.14)
WTu(-jω)SWu
(jω) ≥ S
∀ω.
При выполнении (3.14) заданный закон управления u = ζx является опти-
мальным по отношению к невырожденному квадратичному функционалу
вида J(u) = (xTQx + uTSu) dt для некоторой матрицы Q ≥ 0 или, други-
0
ми словами, этот закон управления обеспечивает выполнение неравенства
V
+ uTSu < 0. Обратная задача минимаксного управления, в которой задан-
ной является не только стратегия управления, но и стратегия возмущения,
была рассмотрена в [13].
4. Синтез адаптивных H-оптимальных регуляторов
Применим управление u = Θ(t)x, (3.3) для гашения возмущений в неопре-
деленной системе. Предполагается, что матрицы Bu и D заданы, а остальные
матрицы или их некоторые элементы, вообще говоря, не известны, начальные
условия x0 не определены и возмущения не измеряются. А именно, пусть в
системе (2.1) матрицы A, Bv и C принадлежат симплексу
{
}
A = (A Bv C) = αi(Ai Bvi Ci), αi ≥ 0,
αi = 1
i=1
i=1
с известными вершинами. Допустим, что для каждой вершины этого сим-
плекса найдется своя обратная связь u = Θix, при которой функция V (x) =
= xTPx обеспечивает уровень гашения возмущений, меньший γ. Согласно
теореме 3.1 это означает, что линейные матричные неравенства
 AiY + Y ATi - BuD-1µBTu
i
(4.1)
BTvi
2I
 < 0, i = 1,...,N,
CiY
0
-I
133
в которых D-1µ
= (DTD)+ + µ-2iW2WT2 > 0, разрешимы относительно Y =
i
= Y T > 0 и µ-2i > 0. Суммируя эти неравенства с коэффициентами αi, полу-
чим, что для любой неопределенной системы с матрицами, принадлежащими
симплексу A, при законе управления u = Θαx, в котором Θα = -D-1µBTuY-1
N
при D-1µ = (DTD)+ + µ-2W2WT2 и µ-2 =
αiµ-2i, выполняется условие
i=1
V
+ |z|2 - γ2|v|2 < 0, где V (x) = xTY -1x. Следовательно, предположение A
выполняется и адаптивное управление с алгоритмом адаптации (3.3), в кото-
ром K = -BTuY-1, приводят к достижению цели для всех объектов из сим-
плекса A. Заметим, что здесь в отличие от синтеза робастного управления,
основанного на существовании общей функции V (x), не требуется, чтобы су-
ществовал единый для всех вершин симплекса закон управления, при ко-
тором уровень гашения возмущений меньше γ. Таким образом, адаптивное
управление u = Θ(t)x, (3.3) в этой задаче может обеспечить, вообще гово-
ря, меньшее значение уровня гашения возмущений, чем указанное робастное
управление.
Если внешнее возмущение в системе не принимается во внимание, то мат-
рица Y в уравнении адаптивного регулятора находится при решении линей-
ных матричных неравенств (4.1), в которых удалены вторые блочные строки
и столбцы. Тогда для квадратичного функционала при адаптивном управле-
нии верна оценка
[
]
∥z∥2 ≤ xT0Y-1x0 + tr
0 - Θ)TM(Θ0 - Θ)
Если в этом случае к неравенствам (4.1) с удаленными вторыми блоч-
ными строками и столбцами добавить неравенство diag (Y, γ2I) > 0 и най-
ти минимальное γ2 такое, что все эти неравенства разрешимы, то придем
к адаптивному γ0-оптимальному управлению, при котором ∥z∥2 < γ2|x0|2+
+ tr [(Θ0 - Θ)TM(Θ0 - Θ)].
Для иллюстрации возьмем модель динамики ракеты, близкую к описанной
в [15] уравнениями вида (2.1), в которых матрица A принадлежит многогран-
нику с вершинами
-0,001
0
1
0
0
0
0
δi
1
0
0
1
Ai =
Bu =
Bv =
,
0
,
0
,
0
i
0
1
0
0
0
-30
30
1
C = (1
0
0,1
0) , D = 0,
где (δi, ηi) ∈ {(0,2 , 6), (0,2 , 106), (4, 6), (4, 106)}. Минимальное значение уров-
ня гашения возмущений, достигаемое в этой системе при робастном управле-
нии, получилось γ = 0,017, в то время, как для рассматриваемого адаптив-
ного управления эта величина равна γ = 0,013. Для расчетов использовался
Matlab с дополнительным пакетом cvx.
134
5. Адаптивное отслеживание выхода эталонной модели
Пусть неопределенный объект описывается уравнениями вида
(5.1)
x = Ax + Buu + Bvv, y = Cy
x, z = Cx.
Цель управления состоит в том, чтобы обеспечить заданный уровень гаше-
ния возмущений по отношению к отклонению целевого выхода z объекта от
целевого выхода zm эталонной модели, заданной уравнениями
(5.2)
xm = Amxm, ym = Cyxm, zm = Cxm.
Будем предполагать, как это принято в теории адаптивного управления с эта-
лонной моделью, что выполнено так называемое условие адаптируемости: для
любой, вообще говоря, неизвестной матрицы объекта A найдется матрица Θ
такая, что A + BuΘCy = Am. Это условие определяет множество объектов,
для которых требуется обеспечить указанный уровень гашения возмущений.
При этом предположении отклонения состояния и выходов объекта от состоя-
ния и соответствующих выходов модели подчиняются уравнениям
(5.3)
ė = Ame + Bu(Θ - Θ)y + Bvv, ey = Cye, ez
= Ce,
где e = x - xm, ey = y - ym, ez = z - zm.
В соответствии с изложенным подходом выберем квадратичную функцию
V (e) = eTP e и определим адаптивный закон управления в виде
(
)
Θ=-(1/2)M-1Θ
V
(5.4)
u = Θy,
+ |ez |2 - γ2|v|2
,
где
V обозначает производную по времени функции V (e) = eTP e в силу си-
стемы (5.3). Вычисляя
(
)
V
Θ
+ |ez|2 - γ2|v|2
= 2BTu P eyT,
приходим к алгоритму адаптации
(5.5)
Θ=M-1KeyyT
при условии, что найдется матрица K, удовлетворяющая уравнению KCy =
= -BTuP. Предположение A в данном случае состоит в том, что для уравне-
ния (5.3) при Θ = Θ, т.е. для уравнения
(5.6)
ė=Ame+Bvv, ez
= Ce,
должно выполняться неравенствоV + |ez|2 - γ2|v|2 < 0 для всех e и v. Други-
ми словами, функция V (e) = eTP e должна обеспечивать для эталонной мо-
дели уровень гашения возмущений, меньший γ. В результате, если находится
матрица P > 0, удовлетворяющая соотношениям
 ATmP + PAm
(5.7)
 BvP
2I
 < 0, BuP = -KCy,
C
0
-I
135
то при адаптивном управлении u = Θ(t)y, (5.5) выполняется условие
[
]
∥ez2 < γ2∥v∥2 + eT0P e0 + tr
0 - Θ)TM(Θ0 - Θ)
6. Заключение
Для линейных динамических объектов рассмотрен новый класс законов
управления: линейные регуляторы, имеющие вид статической обратной свя-
зи, параметры которых настраиваются в соответствии с дифференциальным
уравнением в направлении убывания локальной целевой функции. Получе-
ны условия в терминах линейных матричных неравенств или частотных нера-
венств, при которых эти регуляторы обеспечивают уровень гашения возмуще-
ний в замкнутой системе, меньший заданного, и приведены потери по сравне-
нию с соответствующими стационарными линейно-квадратичными и H-оп-
тимальными регуляторами. Установлено и проиллюстрировано на примере,
что для объектов, уравнения которых содержат неопределенные матрицы,
принадлежащие многограннику, адаптивное управление, синтезируемое на
основе этих регуляторов, обеспечивает уровень гашения возмущений, вообще
говоря, меньший, чем при так называемом робастном квадратичном управ-
лении, основанном на применении единой функции Ляпунова.
Автор выражает признательность анонимным рецензентам, замечания ко-
торых помогли улучшить рукопись.
ПРИЛОЖЕНИЕ
Доказательство теоремы 2.1. Вычислим производную функции
[
]
Ψ(x, Θ) = V (x) + tr
(Θ - Θ)TM(Θ - Θ)
в силу системы (2.1), u = Θ(t)y, (2.8) и составим выражение
[
]
(Π.1)
Ψ+ |z|2 - γ2|v|2 = Φ(x,v,Θ) - 2tr
(Θ - Θ)T(DTDΘ - K)yyT
Представим функцию Φ(x, v, Θ), заданную в (2.6), в виде
Φ(x, v, Θ) = 2xTP (Ax + BuΘy + Bvv) + xTCTCx +
(Π.2)
+ yTΘTDTDΘy - γ2vTv = Φ(x,v,Θ) - 2yTKT(Θ - Θ)y +
+ yTTDTDΘ - ΘT∗ DT)y,
где матрица K удовлетворяет уравнению (2.7). Подставляя в (Π.1) представ-
ление функции Φ(x, v, Θ) из (Π.2), получим
Ψ+ |z|2 - γ2|v|2 = Φ(x,v,Θ) - yT(Θ - Θ)TDTD(Θ - Θ)y.
Так как согласно предположению A имеем Φ(x, v, Θ) < 0, то верно неравен-
ство
Ψ+ |z|2 - γ2|v|2 < -|D(u - u)|2,
136
интегрирование которого показывает, что выполняются неравенства (2.15).
Теорема доказана.
Доказательство теоремы
3.1. (i) → (ii) Если функция V (x) =
= xTPx обеспечивает уровень гашения возмущений, меньший γ при неко-
тором законе управления u = Θx, то для всех x и v верно неравенство
V
+ |z|2 - γ2|v|2 < 0. Тогда для достаточно малого µ > 0 будет выполняться
V
+ |z|2 - γ2|v|2 < 0, где z = col (z,µWT2 u). Выделим в левой части последне-
го неравенства “полный квадрат” и придем к неравенству
ATP + PA + γ-2PBvBTvP + CTC - PBuD-1µBTuP +
+ (Θ + D-1µBTu P )TDµ(Θ + D-1µBTu P ) < 0.
Если оно выполнено при некотором Θ, то
(Π.3)
ATP + PA + γ-2PBvBTvP + CTC - PBuD-1µBTuP < 0.
V+
Это значит, что для функции V (x) = xTP x выполняется неравенство
V
+|z|2 - γ2|v|2 < 0, а следовательно, и неравенство
+ |z|2 - γ2|v|2 < 0 при
законе управления u = ΘP x, где ΘP = -D-1µBTuP и
(
)(
)
S-1
0
WT1
D-1µ = (W1 W2)
= (DTD)+ + µ-2W2WT2 .
0
µ-2I
WT
2
Осталось заметить, что умножая неравенство (Π.3) слева и справа на матрицу
P-1 = Y и применяя лемму Шура, получим неравенство (3.7).
(ii) → (i) Если матрица Y удовлетворяет неравенству (3.7), то для функ-
ции V (x) = xTY-1x при законе управления u = ΘP x выполняетсяV + |z|2-
2|v|2 < 0 и, значит,
V
+ |z|2 - γ2|v|2 < 0. Теорема доказана.
Доказательство теоремы 3.2. Если выполнены условия, сформули-
рованные в пункте (i), то функция V (x) = xTY-1x с матрицей Y , удовлетво-
ряющей неравенству (3.7), обеспечивает уровень гашения возмущений, мень-
ший γ при законе управления u = ζx, где ζ = -D-1µBTuY-1. Таким образом,
условия теоремы 2.1 выполнены при K = Dµζ и, следовательно, при законе
управления u = Θ(t)x, (3.8) достигается цель (2.15). Следовательно, остается
установить эквивалентность пунктов (i) и (ii).
(i) ↔ (ii) По определению регуляризованного оптимального закона управ-
ления в (3.4) матрица его параметров ζ удовлетворяет уравнению Dµζ =
= -BTuP и неравенству (3.5). Запишем эти условия в виде неравенства
[
(
)]
u
(
)
( u)
2xTP (A + Buζ)x + (Bu Bv)
+ 2xT
ζTDµ 0
+
v
v
)
)(
( u)T( 0
0
u
+xTCTCx + yTζTDµζy -
≤0
∀ u, v,
v
0
γ2I
v
137
которое эквивалентно следующему:
[
(
)]
(
)
u
u
2xTP Ax + (Bu Bv)
+ 2xTTDµ 0)
+
v
v
)
( u)T( 0
0
)( u
+xTCTCx - yTζTDµζy -
≤0
∀ u, v.
v
0
γ2I
v
Согласно частотной теореме [11] (лемме Калмана-Попова-Якубовича) необ-
ходимым и достаточным условием существования матрицы P > 0, удовлетво-
ряющей этому неравенству, является при сделанных предположениях выпол-
нение для всех ω ∈ (-∞, ∞) частотного условия
(
)
(
)
(
)
0
0
LT(-jω)
ζTDµζ - CTC
L(jω) - 2Re LT(-jω)
ζTDµ 0
+
≥ 0,
0
γ2I
где L(s) = (sI - A)-1(Bu Bv). С учетом обозначений (3.11) последнее нера-
венство преобразуется к виду (3.13). Теорема доказана.
СПИСОК ЛИТЕРАТУРЫ
1.
Неймарк Ю.И., Ронин Е.И., Берман В.Ш., Коган М.М. Адаптивная стабилиза-
ция динамических объектов // Тезисы докладов VII Всесоюзного совещания по
проблемам управления. Минск, 1977. С. 38-39.
2.
Неймарк Ю.И. Динамические системы и управляемые процессы. М.: Наука,
1978.
3.
Фрадков А.Л. Схема скоростного градиента в задачах адаптивного управле-
ния // Сб. тр. 9-й Всесоюзной школы-семинара по адаптивным системам,
КазПТИ, Алма-Ата, 1979, C. 139-143.
4.
Фрадков А.Л. Адаптивное управление в сложных системах: беспоисковые мето-
ды. М.: Наука, 1990.
5.
Андриевский Б.Р., Фрадков А.Л. Метод скоростного градиента и его приложе-
ния // АиТ. 2021. № 9. С. 3-72.
Andrievsky B.R., Fradkov A.L. Speed Gradient Method and Its Applications //
Autom. Remote Control. 2021. V. 82. No. 9. P. 1463-1518.
6.
Annaswamy A.A., Fradkov A.L. A Historical Perspective of Adaptive Control and
Learning // Annual Reviews in Control. 2021. V. 52. P. 18-41.
7.
Ben Yamin R., Yaesh I., Shaked U. Robust simple adaptive model following with
guaranteed H-performance // Proc. 16th Mediterranean Conference on Control
and Automation. 2008. P. 238-243.
8.
Peaucelle D., Fradkov A. Robust adaptive L2-gain control of polytopic MIMO LTI
systems — LMI results // Syst. Control Lett. 2008. V. 57. P. 881-887.
9.
Андриевский Б.Р., Фрадков А.Л. Метод пассификации в задачах адаптивного
управления, оценивания и синхронизации // АиТ. 2006. № 11. С. 3-37.
Andrievskii B.R., Fradkov A.L. Method of passification in adaptive control, estima-
tion, and synchronization // Autom. Remote Control. 2006. V. 67. P. 1699-1731.
138
10. Allerhand L. Stability of adaptive control in the presence of input disturbances and
H performance // IFAC-PapersOnLine. 2015. V. 48. No. 14. P. 76-81.
11. Якубович В.А. Частотная теорема в теории управления // Сиб. мат. журн. 1973.
№ 5. С. 1100-1129.
12. Kalman R.E. When is a Linear Control System Optimal? // Trans. ASME Ser. D:
J. Basic Eng. 1964. V. 86. P. 1-10.
13. Kogan M.M. Solution to the Inverse Problem of Minimax Control and Worst Case
Disturbance for Linear Continuous-Time Systems // IEEE Trans. Autom. Control.
1998. V. 43. No. 5. P. 670-674.
14. Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных
матричных неравенств. М.: Физматлит, 2007.
15. Gahinet P., Nemirovski A., Laub A.J., Chilali M. LMI Control Toolbox for Use with
MATLAB. The Mathworks Inc. 1995.
Статья представлена к публикации членом редколлегии А.Л. Фрадковым.
Поступила в редакцию 23.12.2021
После доработки 11.04.2022
Принята к публикации 28.04.2022
139