Автоматика и телемеханика, № 10, 2019
© 2019 г. М.В. ХЛЕБНИКОВ, д-р физ.-мат. наук (khlebnik@ipu.ru)
(Институт проблем управления им. В.А. Трапезникова РАН, Москва),
П.С. ЩЕРБАКОВ, д-р физ.-мат. наук (cavour118@mail.ru)
(Институт проблем управления им. В.А. Трапезникова РАН, Москва;
Федеральный исследовательский центр “Информатика и управление” РАН,
Москва)
ЗАДАЧА ЛИНЕЙНО-КВАДРАТИЧНОГО УПРАВЛЕНИЯ:
II. РОБАСТНЫЕ ПОСТАНОВКИ ЗАДАЧИ1
Классическая задача синтеза линейно-квадратичного регулятора рас-
сматривается в робастных постановках, когда матрица системы и/или на-
чальные условия известны неточно. Рассмотрено несколько подходов, при
которых квадратичный функционал минимизируется против наихудших
неопределенностей. Отыскание такого регулятора осуществляется сведе-
нием матричного неравенства Риккати с неопределенностью к одному ли-
нейному матричному неравенству. Обсуждаются свойста решения, прово-
дится сравнение с ранее известными подходами.
Ключевые слова: линейно-квадратичный регулятор, неопределенность,
робастность, линейные матричные неравенства.
DOI: 10.1134/S0005231019100064
1. Введение
Необходимость учета неопределенности в модели систем при синтезе регу-
ляторов всегда была в центре внимания исследователей на всех этапах раз-
вития теории управления; сама идея обратной связи возникла именно как
средство борьбы с неопределенностью. Регулятор, работоспособный в услови-
ях неопределенности, называется робастным. Имеется очень много постано-
вок задач робастности: при параметрической и частотной неопределенностях,
внешних возмущениях и др. В начале 80-х годов прошлого столетия, после
появления знаменитой публикации В.Л. Харитонова [1], вопросы парамет-
рической робастности привлекли исключительное внимание специалистов по
управлению и вызвали шквал работ в этой области. В нашей стране энтузи-
астом и пионером этого направления исследований становится Яков Залма-
нович Цыпкин; около 50 его публикаций по робастности систем управления,
первые из которых [2-4] датируются 1990-м г., собрали огромное количество
ссылок. Именно Яков Залманович сформулировал требование “робастизации”
теории управления, которое успешно воплощалось в жизнь в последующие
десятилетия.
Во второй половине 90-х гг. теория параметрической робастности систем
управления приобретает черты сложившегося направления теории управле-
ния, включающего в себя новые постановки задач и использование совершен-
но иных подходов (например, таких, как линейные матричные неравенства,
1 Работа выполнена при частичной финансовой поддержке Российского фонда фунда-
ментальных исследований (проект № 18-08-00140).
115
вероятностные методы и др.), а развитие вычислительной техники позволяет
в настоящее время решать задачи существенно более высоких размерностей.
Тем не менее данная область остается живой и развивающейся дисципли-
ной, результаты которой находят многочисленные применения на практике,
а некоторые вопросы требуют дальнейшего изучения.
В настоящей статье авторы продолжают эту линию исследований, обраща-
ясь к классической задаче о линейно-квадратичном регуляторе (LQR), но в
робастной постановке, когда матрицы системы известны с точностью до адди-
тивного возмущения, ограниченного по норме; в этой ситуации ищется регу-
лятор, который минимизирует квадратичный функционал против наихудшей
допустимой неопределенности. Второй естественный источник неопределен-
ности — начальные условия, которые, как правило, тоже известны лишь с
точностью до некоторой области и которые также должны учитываться при
синтезе регулятора.
Работа является непосредственным продолжением публикации [5], в ко-
торой рассматривалась задача LQR без неопределенности в матрицах си-
стемы, а ее решение находилось с помощью аппарата линейных матричных
неравенств (LMI) [6]. Этот подход обладает большой гибкостью, сопровож-
дается удобными вычислительными средствами и, как будет показано да-
лее, весьма удобен при решении робастных постановок задачи. По-видимому,
впервые LMI-формулировка линейно-квадратичной задачи была предложе-
на в [7], а связь между LQR-задачей и техникой линейных матричных нера-
венств была четко сформулирована в [6]. Большой вклад в изучение линейно-
квадратичной задачи и ее LMI-решения внесли отечественные исследователи
Д.В. Баландин и М.М. Коган, см., например, [8, 9].
В публикациях имеются результаты по синтезу робастного регулятора для
задачи LQR c неопределенностью; первыми из них, по-видимому, являют-
ся [10, 11]. Эта тематика привлекала внимание исследователей и в дальней-
шем; например, отметим обзор [12]; небольшой обзор по данной проблематике
приведен в [5]. Более свежие результаты относятся к синтезу робастного регу-
лятора при ограничении на управление [13], на случай наличия неопределен-
ности в матрице синтезируемого регулятора [14] (так называемая проблема
нехрупкости) и др.; см. также [15]. Отдельно отметим публикацию [8], в ко-
торой решается проблема робастности линейно-квадратичного регулятора по
отношению к начальным условиям.
В настоящей статье некоторые из имеющихся результатов обобщаются по
следующим направлениям. Приводится “явная” численная процедура отыс-
кания решения робастной LQR-задачи на основе линейных матричных нера-
венств, приводятся формулировки, в которых синтезируемый робастный ре-
гулятор не зависит от начальных условий и доказывается инвариантность
полученного решения к преобразованиям координат. Принципиально новы-
ми представляются формулировки в теоремах 6 и 7, приводящие к робастным
регуляторам, обладающим указанными привлекательными свойствами.
Также обсуждаются некоторые альтернативные формулировки и подходы
к решению и демонстрируются их недостатки. Часть результатов представ-
ляет собой непосредственную “робастизацию” — перенесение результатов из
116
неробастной постановки на случай наличия неопределенности. Рассматрива-
ется простейшая постановка задачи в рамках статической линейной обратной
связи по состоянию, без привлечения более гибких инструментов, таких как,
например, динамический регулятор по выходу.
2. Линейно-квадратичная задача без неопределенности
Для полноты изложения напомним постановку задачи о линейно-квадра-
тичном регуляторе без неопределенности, приведем ее классическое решение
и совпадающее с ним решение, получаемое с использованием линейных мат-
ричных неравенств.
Рассматривается система
(1)
x = Ax + Bu,
x(0) = x0,
где x ∈ Rn и u ∈ Rm — состояние и управление, A ∈ Rn×n, B ∈ Rn×m, па-
ра (A, B) управляема, а начальное условие x0 фиксировано, но произвольно.
В простейшей форме задача LQR заключается в синтезе управления в
форме линейной обратной связи по состоянию
(2)
u = Kx,
K ∈Rm×n,
которое минимизирует следующий квадратичный критерий качества:
(3)
J = (xRx + u
Su) dt,
0
где R ∈ Rn×n и S ∈ Rm×m — заданные положительно определенные весовые
матрицы (так что J 0).
Для того чтобы функционал J был конечен, необходимо и достаточно, что-
бы система (1), замкнутая обратной связью (2), была устойчива. Управляе-
мость пары (A, B) гарантирует существование стабилизирующих обратных
связей.
Классический метод решения (например, см. [16]) основан на рассмотре-
нии алгебраического уравнения Риккати
(4)
AQ + QA - QBS-1B
Q+R=0
относительно матрицы Q ≻ 0. При этом оптимальный регулятор дается вы-
ражением
(5)
Kric = -S-1BQric,
а минимальное значение функционала (3) равно
Jric = x0Qricx0,
117
где Qric — положительно определенное решение уравнения (4). Такое реше-
ние существует и единственно в предположении об управляемости системы и
невырожденности весовых матриц; при этом форма
V (x) = xQricx
является квадратичной функцией Ляпунова для замкнутой системы.
Принципиально важно, что в полученном решении от начальных условий
зависит лишь значение функционала, но не сам оптимальный регулятор Kric
(и матрица Qric).
В дальнейшем будем рассматривать модификацию задачи, когда в матри-
цах системы присутствует неопределенность. В этом случае получить реше-
ние через уравнение Риккати уже не удастся — для каждой реализовавшейся
допустимой неопределенности следует решать свое уравнение Риккати. По-
этому встанем на позиции робастности и будем строить регулятор, робаст-
но стабилизирующий систему против всех допустимых неопределенностей и
минимизирующий некоторый схожий с (3) функционал. Для этого восполь-
зуемся подходом, основанным на линейных матричных неравенствах.
Напомним следующий результат, позволяющий находить оптимальный
регулятор (5) через решение задачи полуопределенного программирования
(SDP); он восходит к [6] и был подробно обсужден в [5].
Теорема 1. Пусть Plmi — решение задачи SDP
γ -→ min
при ограничениях
(
)
AP + P A - BS-1B P
(6)
0,
P
-R-1
(γ x0)
0,
x0
P
где минимизация проводится по матричной переменной P = P и скаляр-
ной переменной γ.
Тогда регулятор (2) с матрицей
Klmi = -S-1BP-1lmi
стабилизирует систему (1), квадратичная форма V (x) = xP-1lmix является
функцией Ляпунова для замкнутой системы, а величина x0P-1lmix0 опреде-
ляет минимальное значение функционала (3) на решениях замкнутой си-
стемы.
Как видно из формулировки теоремы 1, LMI-регулятор зависит от на-
чальных условий. Таким образом, при их изменении задачу приходится ре-
шать заново; более того, примеры показывают, что отличие таким образом по-
лучаемого x0-зависимого регулятора от Риккати-регулятора (5) может быть
118
довольно существенным. Следующий результат позволяет получить в рамках
LMI-подхода регулятор, не зависящий от начальных условий и совпадающий
с Риккати-решением.
Теорема 2 [5]. Пусть Pric — решение задачи полуопределенного програм-
мирования
tr Z -→ min
при ограничениях
(
)
(
)
AP + P A - BS-1B P
Z I
0,
0,
1
P
-R
I P
где минимизация проводится по матричным переменным P = P и Z = Z.
Тогда
Qric = P-1ric,
Kric = -S-1BP-1ric,
где Qric и Kric определены в (4) и (5) через решение уравнения Риккати.
Численное решение оптимизационных задач как из теорем 1 и 2, так и
из всех теорем, приведенных далее в тексте, может быть эффективно полу-
чено с помощью имеющихся специализированных пакетов в среде Matlab,
например, cvx [17].
Ключевым в теоремах 1 и 2 является первое ограничение. Оно представ-
ляет собой неравенство Риккати, соответствующее уравнению (4), но запи-
санное в форме линейного матричного неравенства относительно матричной
переменной P = Q-1. Любому положительно определенному решению P это-
го неравенства соответствует регулятор по состоянию, стабилизирующий си-
стему. Во всех приводимых далее робастных формулировках задачи LQR это
неравенство будет записано для матриц, содержащих неопределенность, и пе-
реписано в удобной эквивалентной форме с помощью так называемой леммы
Питерсена. На решениях неравенства Риккати и вспомогательных LMI будет
минимизироваться та или иная линейная целевая функция, приводящая к
тому или иному робастному решению задачи.
3. Ограниченная по норме неопределенность
3.1. Общая постановка задачи
Пусть в матрице системы присутствует неопределенность:
(7)
x = (A + FΔH)x + Bu, x(0) = x0,
где F и H — постоянные матрицы соответствующих размерностей, а мат-
ричная неопределенность Δ ограничена в спектральной (или фробениусовой)
норме:
(8)
Δ δ.
119
Такого рода неопределенность часто рассматривается в задачах робастной
устойчивости матриц [15].
Требуется найти управление в форме линейной обратной связи по состоя-
нию
(9)
u = Kx,
которое робастно стабилизирует систему (7) против всех неопределенно-
стей (8) и минимизирует некоторый интегральный критерий качества, ана-
логичный (3), вид которого уточним далее.
В отличие от неробастной постановки, где конечность оптимизируемого
функционала обеспечивалась существованием стабилизирующего регулято-
ра, здесь необходимо гарантировать робастную стабилизацию. Везде далее
под оптимизацией функционала будет пониматься отыскание его миниму-
ма в более узком классе квадратично стабилизирующих регуляторов, по-
скольку построение просто стабилизирующей обратной связи для семейства
систем является существенно более трудной задачей. Поскольку наличие об-
щей функции Ляпунова у семейства замкнутых систем лишь достаточно для
их робастной устойчивости, то ограничимся отысканием верхней оценки для
функционала. Таким образом, оптимальность будем обеспечивать лишь на
множестве робастно квадратично стабилизирущих регуляторов, не оговари-
вая это в соответствующих утверждениях.
3.2. Радиус квадратичной стабилизируемости
Ясно, что робастная стабилизация (в том числе и квадратичная), вообще
говоря, возможна не при любом уровне неопределенности Δ. Введем в рас-
смотрение радиус робастной квадратичной стабилизируемости δmax — мак-
симальное значение величины δ, при которой все еще существует такое K,
которое стабилизирует систему робастно квадратично при всехΔ∥ < δ:2
{
(
)
(
δstmax = sup δ:
A + FΔH + BK
P +P
A + FΔH + BK
) 0
}
при некотором P ≻ 0, регуляторе K и всехΔ δ
Отыскание этой величины может быть эффективно осуществлено через
решение задачи SDP.
Теорема 3 [15]. Пусть δ — решение задачи полуопределенного програм-
мирования
δ -→ max
при ограничениях
(AP + P A + BY + YB + δF F P H)
0,
P ≻ 0,
HP
-I
2 Интересно заметить, что радиус квадратичной стабилизируемости может не быть ко-
нечным, см. примеры в [15].
120
относительно матричных переменных P = P Rn×n, Y ∈ Rp×n и скаляр-
ной переменной δ. Тогда радиус квадратичной стабилизируемости систе-
мы (7)-(9) равен δstmax =
δ.
Без потери общности считаем, что δ < δstmax (в противном случае робастная
квадратичная стабилизация невозможна), и далее полагаем, чтоΔ 1, а
матрица F в (7) соответствующим образом отмасштабирована: F →
δF.
3.3. Применение леммы Питерсена
Для неопределенной системы (7), (8) неравенство Риккати
(
)
AP + P A - BS-1B P
(10)
0,
P
-R-1
принимает вид
(
)
(A + F ΔH)P + P (A + F ΔH) - BS-1B P
(11)
0,
P
-R-1
выполнение которого при всех допустимыхΔ|| 1 и некотором P ≻ 0 га-
рантирует существование регулятора вида (9), стабилизирующего систему
робастно квадратично.
Представим (11) в виде
(
)
( )
AP + P A - BS-1B P
F
)
(PH)
(
)
+
Δ
(HP
0
+
Δ
F
0
0.
P
-R-1
0
0
Воспользовавшись леммой Питерсена [18, 19], заключаем, что полученное
матричное неравенство выполняется при всех допустимых значениях мат-
ричной неопределенностиΔ 1 тогда и только тогда, когда существуют
число ε и матрица P ≻ 0 такие, что
AP + P A - BS-1B + εF F P P H
(12)
-R-1
0
⎠ ≼ 0.
-εI
Это означает, что соответствующий регулятор K = -S-1BP-1 робастно
стабилизирует систему (7). Неравенство (12) называем робастным анало-
гом (6).
Замечание. Обратим внимание, что неравенству (12) можно придать
эквивалентную форму
AP + P A - BS-1B + εF F P R P H
-R
0
⎠ ≼ 0,
-εI
при этом можно рассматривать положительно полуопределенные весовые
матрицы R.
121
4. Робастные формулировки линейно-квадратичной задачи
С учетом изложенного, теперь будем рассматривать различные робастные
постановки задачи LQR и давать их решения. Прежде всего для каждой из
них важно сформировать свой функционал качества; начнем с простейшей
постановки.
4.1. Решение, зависящее от начальных условий
Считаем, что начальное условие x0 задано. Тогда за критерий качества
стабилизирующего регулятора естественно принять
(13)
J = max
(xRx + u
Su) dt,
Δ1
0
характеризующий “потери” при наихудшей реализовавшейся неопределенно-
сти Δ.
Заменяя в теореме 1 неравенство (6) на (12), немедленно приходим к ее
робастному аналогу.
Теорема 4. Пусть Plmi — решение задачи полуопределенного програм-
мирования
γ -→ min
при ограничениях
AP + P A - BS-1B + εF F P P H
(γ x0)
-R-1
0
⎠ ≼ 0,
0,
x0
P
-εI
где минимизация проводится по матричной переменной P = P и скаляр-
ным переменным γ и ε.
Тогда регулятор (9) с матрицей
Klmi = -S-1BP-1lmi
робастно стабилизирует систему (7), квадратичная форма V (x) = xP-1lmix
является общей функцией Ляпунова для замкнутой системы при всех
неопределенностях (8), а минимальное значение функционала (13) на ре-
шениях системы (7) равно x0P-1lmix0.
Этот результат немедленно получается из неробастной формулировки
в [5]. Среди “естественных” свойств полученного регулятора отметим его пе-
реход в свою неробастную (номинальную) версию при уменьшении до нуля
уровня возмущения Δ.
Хотя полученный регулятор (квадратично) робастно оптимален против
всех допустимых неопределенностей, он, как и в неробастной постановке, за-
висит от начальных условий и либо должен пересчитываться для иных x0,
либо может давать для них очень низкое качество, см. обсуждение и примеры
в [5].
122
4.2. “Дважды робастная” постановка
Попробуем избавиться от зависимости от начальных условий, встав на
позиции робастности не только по отношению к неопределенности в матрице
системы, но и в начальных условиях.
Для этого, считая без ограничения общности, что начальное условие x0
лежит в единичном евклидовом шаре, в качестве функционала качества при-
мем
(14)
J = max
max
(xRx + u
Su) dt.
∥x01
Δ1
0
В неробастном случае такая естественная постановка — против наихудших
начальных условий из единичного шара — впервые была предложена в [8].
Поскольку требование ∥x0 1 эквивалентно
(15)
x0x0
I,
то потребуем, чтобы (15) влекло выполнение целевого неравенства
x0P-1x0 γ
при минимальном значении параметра γ. Это условие эквивалентно выпол-
нению
I(γP)-1,
или относительно (подлежащей максимизации) вспомогательной переменной
t
= 1 — условию
PtI.
Итак, приходим к следующему утверждению, которое является робастным
аналогом теоремы 3 из [5].
Теорема 5. Пусть Prob — решение задачи полуопределенного програм-
мирования
t -→ max
при ограничениях
AP + P A - BS-1B + εF F P P H
-R-1
0
⎠ ≼ 0,
PtI,
-εI
где минимизация проводится по матричной переменной P = P и скаляр-
ным переменным t и ε.
Тогда регулятор (9) с матрицей
Krob = -S-1BP-1rob
робастно стабилизирует систему (7) и доставляет минимум функциона-
лу (14) на решениях системы (7).
123
Заключаем, что минимальное значение функционала (14) равно
Jopt = max
xP-1robx = ∥P-1rob∥,
∥x∥1
и оно достигается на единичном собственном векторе, соответствующем мак-
симальному собственному значению матрицы P-1rob.
Таким образом, регулятор Krob “дважды робастен”: и против возмущений
в матрице, и против начальных условий. Однако, будучи рассчитанным на
“наихудшее” начальное условие, такой регулятор может давать сильно кон-
сервативные оценки функционала при других x0, см. обсуждение и приме-
ры в [5]. Кроме того, при уменьшении уровня неопределенности Δ до нуля
он не переходит в свою неробастную форму из-за присутствия неравенства
PtI. Наконец, как увидим далее, управление u = Krobx неинвариантно к
линейным преобразованиям координат, тогда как это свойство представляет-
ся очень привлекательным, см. обсуждение далее.
4.3. Усреднение по начальным условиям
Чтобы смягчить условие робастности по начальным условиям, использу-
ем идею усреднения по x0, считая, что x0 — случайная величина, равномерно
распределенная по поверхности единичного шара. При отсутствии неопреде-
ленности Δ эта идея, восходящая к [20], использовалась в [5], приводя к тео-
реме 2. В этой теореме минимизировалась величина E(x0P-1x0) =1n tr P-1
по всем P ≻ 0, удовлетворяющим (6).
Следуя той же логике, при наличии неопределенности вместо функциона-
ла (14) будем рассматривать функционал
(16)
J = E max
(xRx + u
Su) dt.
Δ1
0
В робастном (по Δ) варианте, заменяя в теореме 2 неравенство (6) на (12),
приходим к следующему результату.
Теорема 6. Пусть Pavr — решение задачи полуопределенного програм-
мирования
tr Z -→ min
при ограничениях
AP + P A - BS-1B + εF F P P H
)
(Z I
-R-1
0
⎠ ≼ 0,
0,
I P
-εI
где минимизация проводится по матричным переменным P = P и Z = Z
и скалярной переменной ε.
124
Тогда регулятор (9) с матрицей
Kavr = -S-1BP-1avr
робастно стабилизирует систему (7), квадратичная форма V (x) = xP-1avrx
является общей функцией Ляпунова для замкнутой системы при всех
неопределенностях (8), а минимальное значение функционала (16) на ре-
шениях системы (7) равно1ntr P-1avr.
Полученный регулятор переходит в свою неробастную версию приΔ∥ →
0, и, как увидим далее, соответствующее управление инвариантно к ли-
нейной замене координат.
4.4. Еще одна робастная формулировка
Предложим еще один способ “починить” найденный в подразделе 4.2 ре-
гулятор Krob, который в равной мере противостоит как всем допустимым
неопределенностям, так и всем начальным условиям из единичного шара.
Фактически, при его отыскании единичный шар {x ∈ Rn : ∥x∥ 1} помеща-
ется внутрь эллипсоида
E = {x ∈ Rn: xP-1x 1},
задаваемого матрицей P (которая удовлетворяет LMI (12)), и максимизиру-
ется его радиус. При такой постановке все начальные точки x0 равноправны.
Поступим по-другому — откажемся от равноправия начальных точек и
будем внутрь эллипсоида помещать не шар, а “неробастный” эллипсоид с
матрицей Pric, вычисляемой согласно теореме 2 и характеризующей поведе-
ние номинальной системы. Таким образом, в теореме 5 второе ограничение
заменим на
PtPric
и получим следующий результат.
Теорема 7. Пусть Pinv — решение задачи полуопределенного програм-
мирования
t -→ max
при ограничениях
AP + P A - BS-1B + εF F P P H
-R-1
0
⎠ ≼ 0,
PtPric,
-εI
где минимизация проводится по матричной переменной P = P и скаляр-
ным переменным t и ε.
Тогда регулятор с матрицей
Kinv = -S-1BP-1inv
робастно стабилизирует систему (7), доставляя функционалу (14) значе-
ние ∥P-1inv∥.
125
Вполне понятно, что регулятор Kinv будет давать несколько худшее значе-
ние функционала (14) по сравнению с Krob. Однако соответствующее управ-
ление также не зависит от преобразования координат; покажем это.
5. Инвариантность к преобразованию фазовых координат
Решив тем или иным из описанных выше способов LQR-задачу, естествен-
но ожидать, что найденное оптимальное управление uopt, формально завися-
щее от фазовых координат, не изменится при их линейном преобразовании.
Так ли это?
Сначала рассмотрим неробастный случай. Напомним, что решение соот-
ветствующей LQR-задачи предоставляется теоремой 1 (x0-зависимое реше-
ние) и теоремой 2 (это решение совпадает с Riccati-решением и не зависит от
начальных условий).
При переходе к новым фазовым координатам путем невырожденного пре-
образования
(17)
x=Tx
система (1) примет вид
(18)
x
Ax
Bu,
x(0) = x0,
где u — какое-то управление, а
A = T-1AT,
B=T-1B,
x0 = T-1x0.
При этом очевидным образом преобразуется и весовая матрица R:
R= TRT.
Далее, для системы (18) неравенство (10) будет иметь вид
)
( ̃A ̃P + ̃P ̃A- ̃BS-1 ̃B
P
0
P
-R-1
или
(
)
T-1A
P
PTAT⊤-1 - T-1BS-1BT⊤-1
P
0.
P
-T-1R-1T⊤-1
Домножив полученное неравенство слева на матрицу diag
{T T} и справа
{
}
на матрицу diag
T T
, приходим к соотношению
(
)
A
PT +
PTA - BS-1B
PT
(19)
0.
T
PT
-R-1
126
Из полученного соотношения вытекает, что LMI (10) для системы (1) вы-
полняется при некотором P тогда и только тогда, когда оно выполняется для
системы (18) при
(20)
P = T-1P(T)-1.
При этом
K= -S-1
B
P-1 = -S-1BT⊤-1TP-1T = -S-1BP-1T = KT
и
x0P-1x0 = x0T⊤-1TP-1TT-1x0 = x0P-1x0.
Следовательно, решение задачи из теоремы 1 будет давать то же значение
для функционала J, и при этом
u
= Kx = KTT-1x = Kx = u.
Таким образом, управление в LQR-задаче, предоставляемое теоремой 1,
инвариантно относительно линейных преобразований фазовых координат.
Этим же свойством в силу (20) обладают и решения, получаемые в со-
ответствии с теоремой 2 (обратим внимание, что второе LMI-ограничение в
оптимизационной задаче из теоремы 2 для системы (1) выполняется при неко-
тором P тогда и только тогда, когда оно выполняется для системы (18) при
условии (20)).
Перейдем к робастной постановке задачи. При преобразовании (17) систе-
ма (7) примет вид
(21)
x=
A
FΔH)x
Bu,
x(0) = x0,
где матриц
A
B - те же, что и в неробастном случае, а
F =T-1F,
H= HT.
Нетрудно видеть, что и в этом случае, если P — решение линейного
матричного неравенства (12) для исходной системы, то для преобразован-
ной системы (21) ему будет удовлетворять матрица (20). Дословно повторяя
приведенные выше рассуждения, убеждаемся в инвариантности управления,
предоставляемого теоремой 4, относительно линейных преобразований фазо-
вых координат.
Аналогичным образом легко показать инвариантность управления, дава-
емого теоремой 6.
Теперь рассмотрим формулировки теоремы 5 и ее “обновленной” версии —
теоремы 7. Первая из них предполагает максимизацию шара, помещенного в
эллипсоид с матрицей P . При переходе к новым координатам соответствую-
щее услови
PtI в исходных фазовых переменных будет иметь вид
PtTT.
127
Геометрически это означает, что внутрь эллипсоида с матрицей P помеща-
ется уже не шар, а некий эллипсоид, зависящий от матрицы T линейного
преобразования (и подлежащий максимизации). Таким образом, это условие
не инвариантно относительно замены координат, и поэтому такой подход при-
водит к потере инвариантности оптимального управления.
Второй из предлагаемых подходов (теорема 7), в отличие от рассмотрен-
ного выше “сферического”, свободен от этого недостатка. В самом деле, усло-
вие P tPric инвариантно относительно линейных преобразований коорди-
нат, поскольку матрицы P и Pric преобразуются “синхронно”:
P
Pric
эквивалентно
T-1PT⊤-1 tT-1PricT⊤-1,
т.е.
PtPric.
Итак, лишь при подходах, предоставляемых теоремами 6 и 7, получаем
управление: а) инвариантное относительное линейных преобразований фазо-
вых координат, и б) не зависящее от начальной точки x0.
6. Моделирование
Из изложенного следует, что из всех предложенных регуляторов, робаст-
ных к возмущениям в матрице системы, “перспективными” являются те, кото-
рые предоставляются теоремами 6 и 7. Формально такие регуляторы несрав-
нимы, так как оптимизируют разные критерии; тем не менее, проведем чис-
ленный эксперимент, основанный на “здравом смысле”, а именно: для систем,
замкнутых регуляторами Kavr и Kinv, будем случайно генерировать началь-
ные условия и матричную неопределенность и сравнивать значение крите-
рия (3) для каждой реализовавшейся системы без неопределенности.
В качестве численного примера рассмотрим уже изучавшуюся в первой
части настоящей статьи (см. [5]) систему HE3 из библиотеки COMPleib [21].
Она имеет физическое происхождение, описывая линеаризованную модель
динамики вертолета Bell 201A-1 с восемью состояниями и четырьмя управ-
лениями. В целях экономии места численные значения матриц не приводятся;
они могут быть найдены в [21] или в [5].
Итак, имеем систему (7) с соответствующими матрицами из HE3 [21]. Для
простоты положим матрицы F , H в описании неопределенности единичны-
ми, как и весовые матрицы R, S в функционале (3). Теорема 3 дает δstmax =
= 0,4293 в качестве радиуса квадратичной стабилизируемости; зададим уро-
вень неопределенности δ = 0,5δstmax и отмасштабируем матрицу F , как описа-
но в подразделе 3.2. Применяя теоремы 6 и 7 (во втором случае предваритель-
но вычислив матрицу Pric для номинальной системы), получаем регуляторы
Kavr и Kinv и соответствующие устойчивые замкнутые системы вида x = Ax
128
с матрицами Aavr = A + BKavr и Ainv = A + BKinv. Отметим, что регуляторы
значительно различаются:
-1,7480
12,2237
3,1609
-0,1018
-0,1010
-0,8759
8,6800
-1,0742
50,6250
-2,1931
1,2001
-0,4471
169,4253 -15,9611
Kavr =-17,5487-1,5843
,
2,4958
-0,3716
-1,5772
-11,3201 -19,7139
-7,4171
-20,9467
-77,7225
0,0849
0,9821
3,2791
-7,2089
-5,5924
8,9587
4,4428
-29,6456
-1,7625
8,3937
5,2542 -0,0626
-0,0590
-0,9951
14,7034
-1,3580
-4,6138
5,7284
0,2433
406,2243 -29,5940
Kinv =-31,8986-1,4810124,4712
.
4,5303 -0,2872
-9,8906 -8,1329 -19,1855
-6,9424
-51,7030
-63,5409
0,4900
0,7269
6,4580 -5,2043
-4,3559
7,6171
12,2136
-24,9439
Далее, сгенерируем M = 1000 начальных условий xi0 R8, равномерно
распределенных на единичной сфере в евклидовой норме, и для каждого из
них N = 10000 неопределенностей Δij R8×8, равномерно распределенных
на единичной сфере во фробениусовой норме. Для каждой пары (xi0, Δij) с
помощью леммы Беллмана вычислим значение
avr функционала (3) для си-
стемы
x = (Aavr + Δij)x, x0 = xi0,
и составим (M × N)-матрицу Javr. Проделав то же самое для системы с мат-
рицей Ainv, получаем матрицу Jinv. Сравним эти две матрицы по нескольким
признакам.
Наихудшее значение критерия:
maxJavr = 2,6760 · 103,
maxJinv = 5,4840 · 103.
i,j
i,j
Среднее значение критерия:
1
1
Jijavr = 0,6482 · 103,
Jijinv = 1,2459 · 103.
MN
MN
i,j
i,j
Процент событий {
avr < Jijinv}:
88,04 %.
Процент событий {maxi
}:
88 %.
avr < maxi J
nv
Процент событий {1Nj
avr <1
Jijinv}:
88 %.
N j
Проведенный эксперимент свидетельствует о значительном преимуществе
регулятора Kavr для данной системы по всем показателям. Однако более по-
дробный анализ матриц Javr и Jinv показывает, что существуют начальные
условия, для которых наблюдается обратный результат. Кроме того, разме-
ры выборки (M, N) для задачи данной размерности невелики, чтобы считать
полученные результаты достаточно весомыми. Наконец, аналогичные экспе-
рименты для случайно сгенерированных маломерных пар (A, B) нередко де-
монстрировали преимущество регулятора Kinv.
Отметим также, что в соответствии с теоретическими результатами с
уменьшением уровня неопределенности Δ регуляторы Kavr и Kinv совпадают.
129
7. Заключение
В статье приведены робастные формулировки задачи о линейно-квадра-
тичном регуляторе при наличии ограниченной по норме неопределенности в
матрице системы и кратко обсуждены их достоинства и недостатки. Резуль-
таты немедленно обобщаются на случай дискретного времени и на наличие
неопределенности в матрице B.
Дальнейшие исследования предполагают изучение возможностей иных ре-
гуляторов (например, динамических), а также проведение численных экс-
периментов, в которых, во-первых, явно демонстрируются эти недостатки,
и, во-вторых, сравнивается качество регуляторов Kavr и Kinv (как меж-
ду собой, так и с “дважды робастным” регулятором Krob). В частности,
интересно проанализировать взаимное расположение эллипсоидов Eavr =
= {x ∈ Rn : xP-1avrx 1} и Einv = {x ∈ Rn : xP-1invx 1} в духе публика-
ции [22].
Наконец, возможно развитие подхода, при котором системные неопреде-
ленности предполагаются случайными (наравне с начальными условиями), и
регулятор строится, исходя из минимизации среднего значения по совокуп-
ности системных неопределенностей и начальных условий.
СПИСОК ЛИТЕРАТУРЫ
1.
Харитонов В.Л. Асимптотическая устойчивость семейства систем линейных
дифференциальных уравнений // Дифф. уравнения. 1978. Т. 1. № 11. С. 2086-
2088.
2.
Цыпкин Я.З., Поляк Б.Т. Частотные критерии робастной модальности линей-
ных дискретных систем // Автоматика АН УССР. 1990. № 4. С. 3-9.
3.
Цыпкин Я.З. Робастные адаптивные системы управления // ДАН СССР. 1990.
Т. 315. № 6. С. 1314-1317.
4.
Поляк Б.Т., Цыпкин Я.З. Частотные критериии робастной устойчивости и апе-
риодичности линейных систем // АиТ. 1990. № 9. С. 45-54.
Polyak B.T., Tsypkin Ya.Z. Frequency Domain Criteria for Robust Stability and
Aperiodicity of Linear Systems // Autom. Remote Control. 1990. V. 51. No. 9.
P. 1192-1201.
5.
Хлебников М.В., Щербаков П.С., Честнов В.Н. Задача линейно-квадратичного
управления. I. Новое решение // АиТ. 2015. № 12. С. 65-79.
Khlebnikov M.V., Shcherbakov P.S., Chestnov V.N. Linear-Quadratic Regulator. I.
A New Solution // Autom. Remote Control. 2015. V. 76. No. 12. P. 2143-2155.
6.
Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in
System and Control Theory. Philadelphia: SIAM, 1994.
7.
Willems J.S. Least Squares Stationary Optimal Control and the Algebraic Riccati
Equation // IEEE TAC. 1971. V. 16. No. 6. P. 621-634.
8.
Баландин Д.В., Коган М.М. Синтез оптимальных линейно-квадратичных зако-
нов управления на основе линейных матричных неравенств // АиТ. 2007. № 3.
С. 3-18.
Balandin D.V., Kogan M.M. Synthesis of Linear Quadratic Control Laws on Basis of
Linear Matrix Inequalities // Autom. Remote Control. 2007. V. 68. No. 3. P. 371-385.
130
9.
Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных
матричных неравенств. М.: Физматлит, 2007.
10.
Petersen I.R., McFarlane D.C. Optimal Guaranteed Cost Control and Filtering for
Uncertain Linear Systems // IEEE TAC. 1994. V. 39. No. 9. P. 1971-1977.
11.
Douglas J., Athans M. Robust Linear Quadratic Designs with Real Parameter
Uncertainty // IEEE TAC. 1994. V. 39. No. 1. P. 107-111.
12.
Bernhard P. Survey of Linear Quadratic Robust Control // Macroeconomic
Dynamics. 2002. No. 6. P. 19-39.
13.
Yu L., Han Q.-L., Sun M.-X. Optimal Guaranteed Cost Control of Linear Uncertain
Systems with Input Constraints // Int. J. Contr. Autom. Syst. 2005. V. 3. No. 3.
P. 397-402.
14.
Хлебников М.В., Щербаков П.С. Синтез оптимальной обратной связи при огра-
ниченном управлении // АиТ. 2014. № 2. С. 177-192.
Khlebnikov M.V., Shcherbakov P.S. Optimal Feedback Design under Bounded
Control // Autom. Remote Control. 2014. V. 75. No. 2. P. 320-332.
15.
Поляк Б.Т., Хлебников М.В., Щербаков П.С. Управление линейными система-
ми при внешних возмущениях: Техника линейных матричных неравенств. М.:
ЛЕНАНД, 2014.
16.
Anderson B.D.O., Moore J.B. Linear Optimal Control. N.Y.: Prentice-Hall, 1971.
17.
Grant M., Boyd S. CVX: Matlab Software for Disciplined Convex Programming
(web page and software), URL http://stanford.edu/~boyd/cvx
18.
Petersen I.R. A Stabilization Algorithm for a Class of Uncertain Linear Systems //
Syst. Control Lett. 1987. V. 8. P. 351-357.
19.
Хлебников М.В., Щербаков П.С. Лемма Питерсена о матричной неопределенно-
сти и ее обобщения // АиТ. 2008. № 11. С. 125-139.
Khlebnikov M.V., Shcherbakov P.S. Petersen’s Lemma on Matrix Uncertainty and
Its Generalization // Autom. Remote Control. 2008. V. 69. No. 11. P. 1932-1945.
20.
Levine W.S., Athans M. On the Determination of the Optimal Constant Output
Feedback Gains for Linear Multivariable Systems // IEEE TAC. 1970. V. 46. No. 9.
P. 1420-1426.
21.
Leibfritz F., Lipinski W. Description of the Benchmark Examples in COMPleib 1.0.
Technical report. University of Trier, 2003. URL http://www.complib.de
22.
Хлебников М.В. Сравнение квадратичных критериев качества: эллипсоидаль-
ный подход // Стохастическая оптимизация в информатике. 2014. Т. 10. № 1.
С. 145-156.
Статья представлена к публикации членом редколлегии А.В. Назиным.
Поступила в редакцию 19.07.2018
После доработки 14.09.2018
Принята к публикации 08.11.2018
131