Автоматика и телемеханика, № 10, 2019

(Институт проблем управления им. В.А. Трапезникова РАН, Москва),

П.С. ЩЕРБАКОВ, д-р физ.-мат. наук (cavour118@mail.ru)

(Институт проблем управления им. В.А. Трапезникова РАН, Москва;

Федеральный исследовательский центр “Информатика и управление” РАН,

Москва)

ЗАДАЧА ЛИНЕЙНО-КВАДРАТИЧНОГО УПРАВЛЕНИЯ:

II. РОБАСТНЫЕ ПОСТАНОВКИ ЗАДАЧИ¹

Классическая задача синтеза линейно-квадратичного регулятора рас-

сматривается в робастных постановках, когда матрица системы и/или на-

чальные условия известны неточно. Рассмотрено несколько подходов, при

которых квадратичный функционал минимизируется против наихудших

неопределенностей. Отыскание такого регулятора осуществляется сведе-

нием матричного неравенства Риккати с неопределенностью к одному ли-

нейному матричному неравенству. Обсуждаются свойста решения, прово-

дится сравнение с ранее известными подходами.

Ключевые слова: линейно-квадратичный регулятор, неопределенность,

робастность, линейные матричные неравенства.

DOI: 10.1134/S0005231019100064

1. Введение

Необходимость учета неопределенности в модели систем при синтезе регу-

ляторов всегда была в центре внимания исследователей на всех этапах раз-

вития теории управления; сама идея обратной связи возникла именно как

средство борьбы с неопределенностью. Регулятор, работоспособный в услови-

ях неопределенности, называется робастным. Имеется очень много постано-

вок задач робастности: при параметрической и частотной неопределенностях,

внешних возмущениях и др. В начале 80-х годов прошлого столетия, после

появления знаменитой публикации В.Л. Харитонова [1], вопросы парамет-

рической робастности привлекли исключительное внимание специалистов по

управлению и вызвали шквал работ в этой области. В нашей стране энтузи-

астом и пионером этого направления исследований становится Яков Залма-

нович Цыпкин; около 50 его публикаций по робастности систем управления,

первые из которых [2-4] датируются 1990-м г., собрали огромное количество

ссылок. Именно Яков Залманович сформулировал требование “робастизации”

теории управления, которое успешно воплощалось в жизнь в последующие

десятилетия.

Во второй половине 90-х гг. теория параметрической робастности систем

управления приобретает черты сложившегося направления теории управле-

ния, включающего в себя новые постановки задач и использование совершен-

но иных подходов (например, таких, как линейные матричные неравенства,

¹ Работа выполнена при частичной финансовой поддержке Российского фонда фунда-

ментальных исследований (проект № 18-08-00140).

115

вероятностные методы и др.), а развитие вычислительной техники позволяет

в настоящее время решать задачи существенно более высоких размерностей.

Тем не менее данная область остается живой и развивающейся дисципли-

ной, результаты которой находят многочисленные применения на практике,

а некоторые вопросы требуют дальнейшего изучения.

В настоящей статье авторы продолжают эту линию исследований, обраща-

ясь к классической задаче о линейно-квадратичном регуляторе (LQR), но в

робастной постановке, когда матрицы системы известны с точностью до адди-

тивного возмущения, ограниченного по норме; в этой ситуации ищется регу-

лятор, который минимизирует квадратичный функционал против наихудшей

допустимой неопределенности. Второй естественный источник неопределен-

ности — начальные условия, которые, как правило, тоже известны лишь с

точностью до некоторой области и которые также должны учитываться при

синтезе регулятора.

Работа является непосредственным продолжением публикации [5], в ко-

торой рассматривалась задача LQR без неопределенности в матрицах си-

стемы, а ее решение находилось с помощью аппарата линейных матричных

неравенств (LMI) [6]. Этот подход обладает большой гибкостью, сопровож-

дается удобными вычислительными средствами и, как будет показано да-

лее, весьма удобен при решении робастных постановок задачи. По-видимому,

впервые LMI-формулировка линейно-квадратичной задачи была предложе-

на в [7], а связь между LQR-задачей и техникой линейных матричных нера-

венств была четко сформулирована в [6]. Большой вклад в изучение линейно-

квадратичной задачи и ее LMI-решения внесли отечественные исследователи

Д.В. Баландин и М.М. Коган, см., например, [8, 9].

В публикациях имеются результаты по синтезу робастного регулятора для

задачи LQR c неопределенностью; первыми из них, по-видимому, являют-

ся [10, 11]. Эта тематика привлекала внимание исследователей и в дальней-

шем; например, отметим обзор [12]; небольшой обзор по данной проблематике

приведен в [5]. Более свежие результаты относятся к синтезу робастного регу-

лятора при ограничении на управление [13], на случай наличия неопределен-

ности в матрице синтезируемого регулятора [14] (так называемая проблема

нехрупкости) и др.; см. также [15]. Отдельно отметим публикацию [8], в ко-

торой решается проблема робастности линейно-квадратичного регулятора по

отношению к начальным условиям.

В настоящей статье некоторые из имеющихся результатов обобщаются по

следующим направлениям. Приводится “явная” численная процедура отыс-

кания решения робастной LQR-задачи на основе линейных матричных нера-

венств, приводятся формулировки, в которых синтезируемый робастный ре-

гулятор не зависит от начальных условий и доказывается инвариантность

полученного решения к преобразованиям координат. Принципиально новы-

ми представляются формулировки в теоремах 6 и 7, приводящие к робастным

регуляторам, обладающим указанными привлекательными свойствами.

Также обсуждаются некоторые альтернативные формулировки и подходы

к решению и демонстрируются их недостатки. Часть результатов представ-

ляет собой непосредственную “робастизацию” — перенесение результатов из

116

неробастной постановки на случай наличия неопределенности. Рассматрива-

ется простейшая постановка задачи в рамках статической линейной обратной

связи по состоянию, без привлечения более гибких инструментов, таких как,

например, динамический регулятор по выходу.

2. Линейно-квадратичная задача без неопределенности

Для полноты изложения напомним постановку задачи о линейно-квадра-

тичном регуляторе без неопределенности, приведем ее классическое решение

и совпадающее с ним решение, получаемое с использованием линейных мат-

ричных неравенств.

Рассматривается система

(1)

x = Ax + Bu,

x(0) = x₀,

где x ∈ Rⁿ и u ∈ R^m — состояние и управление, A ∈ R^n×n, B ∈ R^n×m, па-

ра (A, B) управляема, а начальное условие x₀ фиксировано, но произвольно.

В простейшей форме задача LQR заключается в синтезе управления в

форме линейной обратной связи по состоянию

(2)

u = Kx,

K ∈R^m×n,

которое минимизирует следующий квадратичный критерий качества:

∫∞

(3)

J = (x^⊤Rx + u^⊤

Su) dt,

где R ∈ R^n×n и S ∈ R^m×m — заданные положительно определенные весовые

матрицы (так что J ≥ 0).

Для того чтобы функционал J был конечен, необходимо и достаточно, что-

бы система (1), замкнутая обратной связью (2), была устойчива. Управляе-

мость пары (A, B) гарантирует существование стабилизирующих обратных

связей.

Классический метод решения (например, см. [16]) основан на рассмотре-

нии алгебраического уравнения Риккати

(4)

A^⊤Q + QA - QBS-1B^⊤

Q+R=0

относительно матрицы Q ≻ 0. При этом оптимальный регулятор дается вы-

ражением

(5)

K_ric = -S-1B^⊤Q_ric,

а минимальное значение функционала (3) равно

J_ric = x⊤0Q_ricx₀,

117

где Q_ric — положительно определенное решение уравнения (4). Такое реше-

ние существует и единственно в предположении об управляемости системы и

невырожденности весовых матриц; при этом форма

V (x) = x^⊤Q_ricx

является квадратичной функцией Ляпунова для замкнутой системы.

Принципиально важно, что в полученном решении от начальных условий

зависит лишь значение функционала, но не сам оптимальный регулятор K_ric

(и матрица Q_ric).

В дальнейшем будем рассматривать модификацию задачи, когда в матри-

цах системы присутствует неопределенность. В этом случае получить реше-

ние через уравнение Риккати уже не удастся — для каждой реализовавшейся

допустимой неопределенности следует решать свое уравнение Риккати. По-

этому встанем на позиции робастности и будем строить регулятор, робаст-

но стабилизирующий систему против всех допустимых неопределенностей и

минимизирующий некоторый схожий с (3) функционал. Для этого восполь-

зуемся подходом, основанным на линейных матричных неравенствах.

Напомним следующий результат, позволяющий находить оптимальный

регулятор (5) через решение задачи полуопределенного программирования

(SDP); он восходит к [6] и был подробно обсужден в [5].

Теорема 1. Пусть P_lmi — решение задачи SDP

γ -→ min

при ограничениях

(

)

AP + P A^⊤ - BS-1B^⊤ P

(6)

≼ 0,

-R-1

⁽γ x⊤0)

≽ 0,

x₀

где минимизация проводится по матричной переменной P = P^⊤ и скаляр-

ной переменной γ.

Тогда регулятор (2) с матрицей

K_lmi = -S-1B^⊤P-1lmi

стабилизирует систему (1), квадратичная форма V (x) = x^⊤P-1lmix является

функцией Ляпунова для замкнутой системы, а величина x⊤0P-1lmix₀ опреде-

ляет минимальное значение функционала (3) на решениях замкнутой си-

стемы.

Как видно из формулировки теоремы 1, LMI-регулятор зависит от на-

чальных условий. Таким образом, при их изменении задачу приходится ре-

шать заново; более того, примеры показывают, что отличие таким образом по-

лучаемого x₀-зависимого регулятора от Риккати-регулятора (5) может быть

118

довольно существенным. Следующий результат позволяет получить в рамках

LMI-подхода регулятор, не зависящий от начальных условий и совпадающий

с Риккати-решением.

Теорема 2 [5]. Пусть P_ric — решение задачи полуопределенного програм-

мирования

tr Z -→ min

при ограничениях

(

)

(

)

AP + P A^⊤ - BS-1B^⊤ P

Z I

≼ 0,

≽ 0,

−1

-R

I P

где минимизация проводится по матричным переменным P = P^⊤ и Z = Z^⊤.

Тогда

Q_ric = P-1ric,

K_ric = -S-1B^⊤P-1ric,

где Q_ric и K_ric определены в (4) и (5) через решение уравнения Риккати.

Численное решение оптимизационных задач как из теорем 1 и 2, так и

из всех теорем, приведенных далее в тексте, может быть эффективно полу-

чено с помощью имеющихся специализированных пакетов в среде Matlab,

например, cvx [17].

Ключевым в теоремах 1 и 2 является первое ограничение. Оно представ-

ляет собой неравенство Риккати, соответствующее уравнению (4), но запи-

санное в форме линейного матричного неравенства относительно матричной

переменной P = Q-1. Любому положительно определенному решению P это-

го неравенства соответствует регулятор по состоянию, стабилизирующий си-

стему. Во всех приводимых далее робастных формулировках задачи LQR это

неравенство будет записано для матриц, содержащих неопределенность, и пе-

реписано в удобной эквивалентной форме с помощью так называемой леммы

Питерсена. На решениях неравенства Риккати и вспомогательных LMI будет

минимизироваться та или иная линейная целевая функция, приводящая к

тому или иному робастному решению задачи.

3. Ограниченная по норме неопределенность

3.1. Общая постановка задачи

Пусть в матрице системы присутствует неопределенность:

(7)

x = (A + FΔH)x + Bu, x(0) = x₀,

где F и H — постоянные матрицы соответствующих размерностей, а мат-

ричная неопределенность Δ ограничена в спектральной (или фробениусовой)

норме:

(8)

∥Δ∥ ≤ δ.

119

Такого рода неопределенность часто рассматривается в задачах робастной

устойчивости матриц [15].

Требуется найти управление в форме линейной обратной связи по состоя-

нию

(9)

u = Kx,

которое робастно стабилизирует систему (7) против всех неопределенно-

стей (8) и минимизирует некоторый интегральный критерий качества, ана-

логичный (3), вид которого уточним далее.

В отличие от неробастной постановки, где конечность оптимизируемого

функционала обеспечивалась существованием стабилизирующего регулято-

ра, здесь необходимо гарантировать робастную стабилизацию. Везде далее

под оптимизацией функционала будет пониматься отыскание его миниму-

ма в более узком классе квадратично стабилизирующих регуляторов, по-

скольку построение просто стабилизирующей обратной связи для семейства

систем является существенно более трудной задачей. Поскольку наличие об-

щей функции Ляпунова у семейства замкнутых систем лишь достаточно для

их робастной устойчивости, то ограничимся отысканием верхней оценки для

функционала. Таким образом, оптимальность будем обеспечивать лишь на

множестве робастно квадратично стабилизирущих регуляторов, не оговари-

вая это в соответствующих утверждениях.

3.2. Радиус квадратичной стабилизируемости

Ясно, что робастная стабилизация (в том числе и квадратичная), вообще

говоря, возможна не при любом уровне неопределенности Δ. Введем в рас-

смотрение радиус робастной квадратичной стабилизируемости δ_max — мак-

симальное значение величины δ, при которой все еще существует такое K,

которое стабилизирует систему робастно квадратично при всех ∥Δ∥ < δ:²

{

(

)

(

δ^stmax = sup δ:

A + FΔH + BK

P +P

A + FΔH + BK

)^⊤ ≺ 0

}

при некотором P ≻ 0, регуляторе K и всех ∥Δ∥ ≤ δ

Отыскание этой величины может быть эффективно осуществлено через

решение задачи SDP.

Теорема 3 [15]. Пусть δ — решение задачи полуопределенного програм-

мирования

δ -→ max

при ограничениях

⁽AP + P A^⊤ + BY + Y^⊤B^⊤ + δF F^⊤ P H^⊤)

≼ 0,

P ≻ 0,

-I

² Интересно заметить, что радиус квадратичной стабилизируемости может не быть ко-

нечным, см. примеры в [15].

120

относительно матричных переменных P = P^⊤ ∈ R^n×n, Y ∈ R^p×n и скаляр-

ной переменной δ. Тогда радиус квадратичной стабилизируемости систе-

√

мы (7)-(9) равен δ^stmax =

δ.

Без потери общности считаем, что δ < δ^stmax (в противном случае робастная

квадратичная стабилизация невозможна), и далее полагаем, что ∥Δ∥ ≤ 1, а

√

матрица F в (7) соответствующим образом отмасштабирована: F →

δF.

3.3. Применение леммы Питерсена

Для неопределенной системы (7), (8) неравенство Риккати

(

)

AP + P A^⊤ - BS-1B^⊤ P

(10)

≼ 0,

-R-1

принимает вид

(

)

(A + F ΔH)P + P (A + F ΔH)^⊤ - BS-1B^⊤ P

(11)

≼ 0,

-R-1

выполнение которого при всех допустимых ∥Δ|| ≤ 1 и некотором P ≻ 0 га-

рантирует существование регулятора вида (9), стабилизирующего систему

робастно квадратично.

Представим (11) в виде

(

)

( )

AP + P A^⊤ - BS-1B^⊤ P

)

⁽PH^⊤)

(

)

⁽HP

Δ^⊤

F^⊤

≼ 0.

-R-1

Воспользовавшись леммой Питерсена [18, 19], заключаем, что полученное

матричное неравенство выполняется при всех допустимых значениях мат-

ричной неопределенности ∥Δ∥ ≤ 1 тогда и только тогда, когда существуют

число ε и матрица P ≻ 0 такие, что

⎛

⎞

AP + P A^⊤ - BS-1B^⊤ + εF F^⊤ P P H^⊤

⎜

⎟

(12)

⎝

∗

-R-1

⎠ ≼ 0.

∗

-εI

Это означает, что соответствующий регулятор K = -S-1B^⊤P-1 робастно

стабилизирует систему (7). Неравенство (12) называем робастным анало-

гом (6).

Замечание. Обратим внимание, что неравенству (12) можно придать

эквивалентную форму

⎛

⎞

AP + P A^⊤ - BS-1B^⊤ + εF F^⊤ P R P H^⊤

⎜

⎟

⎝

∗

-R

⎠ ≼ 0,

∗

-εI

при этом можно рассматривать положительно полуопределенные весовые

матрицы R.

121

4. Робастные формулировки линейно-квадратичной задачи

С учетом изложенного, теперь будем рассматривать различные робастные

постановки задачи LQR и давать их решения. Прежде всего для каждой из

них важно сформировать свой функционал качества; начнем с простейшей

постановки.

4.1. Решение, зависящее от начальных условий

Считаем, что начальное условие x₀ задано. Тогда за критерий качества

стабилизирующего регулятора естественно принять

∞

∫

(13)

J = max

(x^⊤Rx + u^⊤

Su) dt,

∥Δ∥≤1

характеризующий “потери” при наихудшей реализовавшейся неопределенно-

сти Δ.

Заменяя в теореме 1 неравенство (6) на (12), немедленно приходим к ее

робастному аналогу.

Теорема 4. Пусть P_lmi — решение задачи полуопределенного програм-

мирования

γ -→ min

при ограничениях

⎛

⎞

AP + P A^⊤ - BS-1B^⊤ + εF F^⊤ P P H^⊤

⎜

⎟

⁽γ x⊤0)

⎝

∗

-R-1

⎠ ≼ 0,

≽ 0,

x₀

∗

-εI

где минимизация проводится по матричной переменной P = P^⊤ и скаляр-

ным переменным γ и ε.

Тогда регулятор (9) с матрицей

K_lmi = -S-1B^⊤P-1lmi

робастно стабилизирует систему (7), квадратичная форма V (x) = x^⊤P-1lmix

является общей функцией Ляпунова для замкнутой системы при всех

неопределенностях (8), а минимальное значение функционала (13) на ре-

шениях системы (7) равно x⊤0P-1lmix₀.

Этот результат немедленно получается из неробастной формулировки

в [5]. Среди “естественных” свойств полученного регулятора отметим его пе-

реход в свою неробастную (номинальную) версию при уменьшении до нуля

уровня возмущения Δ.

Хотя полученный регулятор (квадратично) робастно оптимален против

всех допустимых неопределенностей, он, как и в неробастной постановке, за-

висит от начальных условий и либо должен пересчитываться для иных x₀,

либо может давать для них очень низкое качество, см. обсуждение и примеры

в [5].

122

4.2. “Дважды робастная” постановка

Попробуем избавиться от зависимости от начальных условий, встав на

позиции робастности не только по отношению к неопределенности в матрице

системы, но и в начальных условиях.

Для этого, считая без ограничения общности, что начальное условие x₀

лежит в единичном евклидовом шаре, в качестве функционала качества при-

мем

∞

∫

(14)

J = max

max

(x^⊤Rx + u^⊤

Su) dt.

∥x₀∥≤1

∥Δ∥≤1

В неробастном случае такая естественная постановка — против наихудших

начальных условий из единичного шара — впервые была предложена в [8].

Поскольку требование ∥x₀∥ ≤ 1 эквивалентно

(15)

x₀x⊤0

≼I,

то потребуем, чтобы (15) влекло выполнение целевого неравенства

x0⊤P-1x₀ ≤ γ

при минимальном значении параметра γ. Это условие эквивалентно выпол-

нению

I ≽ (γP)-1,

или относительно (подлежащей максимизации) вспомогательной переменной

= 1/γ — условию

P ≽ tI.

Итак, приходим к следующему утверждению, которое является робастным

аналогом теоремы 3 из [5].

Теорема 5. Пусть P_rob — решение задачи полуопределенного програм-

мирования

t -→ max

при ограничениях

⎛

⎞

AP + P A^⊤ - BS-1B^⊤ + εF F^⊤ P P H^⊤

⎜

⎟

⎝

∗

-R-1

⎠ ≼ 0,

P ≽ tI,

∗

-εI

где минимизация проводится по матричной переменной P = P^⊤ и скаляр-

ным переменным t и ε.

Тогда регулятор (9) с матрицей

K_rob = -S-1B^⊤P-1rob

робастно стабилизирует систему (7) и доставляет минимум функциона-

лу (14) на решениях системы (7).

123

Заключаем, что минимальное значение функционала (14) равно

J_opt = max

x^⊤P-1robx = ∥P-1rob∥,

∥x∥≤1

и оно достигается на единичном собственном векторе, соответствующем мак-

симальному собственному значению матрицы P-1rob.

Таким образом, регулятор K_rob “дважды робастен”: и против возмущений

в матрице, и против начальных условий. Однако, будучи рассчитанным на

“наихудшее” начальное условие, такой регулятор может давать сильно кон-

сервативные оценки функционала при других x₀, см. обсуждение и приме-

ры в [5]. Кроме того, при уменьшении уровня неопределенности Δ до нуля

он не переходит в свою неробастную форму из-за присутствия неравенства

P ≽ tI. Наконец, как увидим далее, управление u = K_robx неинвариантно к

линейным преобразованиям координат, тогда как это свойство представляет-

ся очень привлекательным, см. обсуждение далее.

4.3. Усреднение по начальным условиям

Чтобы смягчить условие робастности по начальным условиям, использу-

ем идею усреднения по x₀, считая, что x₀ — случайная величина, равномерно

распределенная по поверхности единичного шара. При отсутствии неопреде-

ленности Δ эта идея, восходящая к [20], использовалась в [5], приводя к тео-

реме 2. В этой теореме минимизировалась величина E(x⊤0P-1x₀) =1n tr P-1

по всем P ≻ 0, удовлетворяющим (6).

Следуя той же логике, при наличии неопределенности вместо функциона-

ла (14) будем рассматривать функционал

∞

∫

(16)

J = E max

(x^⊤Rx + u^⊤

Su) dt.

∥Δ∥≤1

В робастном (по Δ) варианте, заменяя в теореме 2 неравенство (6) на (12),

приходим к следующему результату.

Теорема 6. Пусть P_avr — решение задачи полуопределенного програм-

мирования

tr Z -→ min

при ограничениях

⎛

⎞

AP + P A^⊤ - BS-1B^⊤ + εF F^⊤ P P H^⊤

)

⎜

⎟

⁽Z I

⎝

∗

-R-1

⎠ ≼ 0,

≽ 0,

I P

∗

-εI

где минимизация проводится по матричным переменным P = P^⊤ и Z = Z^⊤

и скалярной переменной ε.

124

Тогда регулятор (9) с матрицей

K_avr = -S-1B^⊤P-1avr

робастно стабилизирует систему (7), квадратичная форма V (x) = x^⊤P-1avrx

является общей функцией Ляпунова для замкнутой системы при всех

неопределенностях (8), а минимальное значение функционала (16) на ре-

шениях системы (7) равно1ntr P-1avr.

Полученный регулятор переходит в свою неробастную версию при ∥Δ∥ →

→ 0, и, как увидим далее, соответствующее управление инвариантно к ли-

нейной замене координат.

4.4. Еще одна робастная формулировка

Предложим еще один способ “починить” найденный в подразделе 4.2 ре-

гулятор K_rob, который в равной мере противостоит как всем допустимым

неопределенностям, так и всем начальным условиям из единичного шара.

Фактически, при его отыскании единичный шар {x ∈ Rⁿ : ∥x∥ ≤ 1} помеща-

ется внутрь эллипсоида

E = {x ∈ Rⁿ: x^⊤P-1x ≤ 1},

задаваемого матрицей P (которая удовлетворяет LMI (12)), и максимизиру-

ется его радиус. При такой постановке все начальные точки x₀ равноправны.

Поступим по-другому — откажемся от равноправия начальных точек и

будем внутрь эллипсоида помещать не шар, а “неробастный” эллипсоид с

матрицей P_ric, вычисляемой согласно теореме 2 и характеризующей поведе-

ние номинальной системы. Таким образом, в теореме 5 второе ограничение

заменим на

P ≽ tP_ric

и получим следующий результат.

Теорема 7. Пусть P_inv — решение задачи полуопределенного програм-

мирования

t -→ max

при ограничениях

⎛

⎞

AP + P A^⊤ - BS-1B^⊤ + εF F^⊤ P P H^⊤

⎜

⎟

⎝

∗

-R-1

⎠ ≼ 0,

P ≽ tP_ric,

∗

-εI

где минимизация проводится по матричной переменной P = P^⊤ и скаляр-

ным переменным t и ε.

Тогда регулятор с матрицей

K_inv = -S-1B^⊤P-1inv

робастно стабилизирует систему (7), доставляя функционалу (14) значе-

ние ∥P-1inv∥.

125

Вполне понятно, что регулятор K_inv будет давать несколько худшее значе-

ние функционала (14) по сравнению с K_rob. Однако соответствующее управ-

ление также не зависит от преобразования координат; покажем это.

5. Инвариантность к преобразованию фазовых координат

Решив тем или иным из описанных выше способов LQR-задачу, естествен-

но ожидать, что найденное оптимальное управление u_opt, формально завися-

щее от фазовых координат, не изменится при их линейном преобразовании.

Так ли это?

Сначала рассмотрим неробастный случай. Напомним, что решение соот-

ветствующей LQR-задачи предоставляется теоремой 1 (x₀-зависимое реше-

ние) и теоремой 2 (это решение совпадает с Riccati-решением и не зависит от

начальных условий).

При переходе к новым фазовым координатам путем невырожденного пре-

образования

(17)

x=Tx

система (1) примет вид

(18)

Bu,

x(0) = x₀,

где u — какое-то управление, а

A = T-1AT,

B=T-1B,

x₀ = T-1x₀.

При этом очевидным образом преобразуется и весовая матрица R:

R₌ T^⊤RT.

Далее, для системы (18) неравенство (10) будет иметь вид

)

( ̃A ̃_P+ ̃P ̃_A⊤ _- ̃_BS-1 ̃_B⊤

≼0

-R-1

или

(

)

T-1A

PT^⊤A^⊤T⊤-1 - T-1BS-1B^⊤T⊤-1

≼ 0.

-T-1R-1T⊤-1

Домножив полученное неравенство слева на матрицу diag

^{T T^} и справа

{

}

на матрицу diag

T^⊤ T^⊤

, приходим к соотношению

(

)

PT^⊤ +

PT^⊤A^⊤ - BS-1B^⊤

PT^⊤

(19)

≼ 0.

PT^⊤

-R-1

126

Из полученного соотношения вытекает, что LMI (10) для системы (1) вы-

полняется при некотором P тогда и только тогда, когда оно выполняется для

системы (18) при

(20)

P = T-1P(T^⊤)-1.

При этом

K₌ -S-1

B^⊤

P-1 = -S-1B^⊤T⊤-1T^⊤P-1T = -S-1B^⊤P-1T = KT

x⊤₀P-1x0 = x⊤0T⊤-1T⊤P-1TT-1x0 = x0P-1x0.

Следовательно, решение задачи из теоремы 1 будет давать то же значение

для функционала J, и при этом

= Kx = KTT-1x = Kx = u.

Таким образом, управление в LQR-задаче, предоставляемое теоремой 1,

инвариантно относительно линейных преобразований фазовых координат.

Этим же свойством в силу (20) обладают и решения, получаемые в со-

ответствии с теоремой 2 (обратим внимание, что второе LMI-ограничение в

оптимизационной задаче из теоремы 2 для системы (1) выполняется при неко-

тором P тогда и только тогда, когда оно выполняется для системы (18) при

условии (20)).

Перейдем к робастной постановке задачи. При преобразовании (17) систе-

ма (7) примет вид

(21)

FΔ^H)x

Bu,

x(0) = x₀,

где матриц

B - те же, что и в неробастном случае, а

F =T-1F,

H₌ HT.

Нетрудно видеть, что и в этом случае, если P — решение линейного

матричного неравенства (12) для исходной системы, то для преобразован-

ной системы (21) ему будет удовлетворять матрица (20). Дословно повторяя

приведенные выше рассуждения, убеждаемся в инвариантности управления,

предоставляемого теоремой 4, относительно линейных преобразований фазо-

вых координат.

Аналогичным образом легко показать инвариантность управления, дава-

емого теоремой 6.

Теперь рассмотрим формулировки теоремы 5 и ее “обновленной” версии —

теоремы 7. Первая из них предполагает максимизацию шара, помещенного в

эллипсоид с матрицей P . При переходе к новым координатам соответствую-

щее услови

P ≽ tI в исходных фазовых переменных будет иметь вид

P ≽ tTT^⊤.

127

Геометрически это означает, что внутрь эллипсоида с матрицей P помеща-

ется уже не шар, а некий эллипсоид, зависящий от матрицы T линейного

преобразования (и подлежащий максимизации). Таким образом, это условие

не инвариантно относительно замены координат, и поэтому такой подход при-

водит к потере инвариантности оптимального управления.

Второй из предлагаемых подходов (теорема 7), в отличие от рассмотрен-

ного выше “сферического”, свободен от этого недостатка. В самом деле, усло-

вие P ≽ tP_ric инвариантно относительно линейных преобразований коорди-

нат, поскольку матрицы P и P_ric преобразуются “синхронно”:

P ≽

P_ric

эквивалентно

T-1PT⊤-1 ≽ tT-1P_ricT⊤-1,

т.е.

P ≽ tP_ric.

Итак, лишь при подходах, предоставляемых теоремами 6 и 7, получаем

управление: а) инвариантное относительное линейных преобразований фазо-

вых координат, и б) не зависящее от начальной точки x₀.

6. Моделирование

Из изложенного следует, что из всех предложенных регуляторов, робаст-

ных к возмущениям в матрице системы, “перспективными” являются те, кото-

рые предоставляются теоремами 6 и 7. Формально такие регуляторы несрав-

нимы, так как оптимизируют разные критерии; тем не менее, проведем чис-

ленный эксперимент, основанный на “здравом смысле”, а именно: для систем,

замкнутых регуляторами K_avr и K_inv, будем случайно генерировать началь-

ные условия и матричную неопределенность и сравнивать значение крите-

рия (3) для каждой реализовавшейся системы без неопределенности.

В качестве численного примера рассмотрим уже изучавшуюся в первой

части настоящей статьи (см. [5]) систему HE3 из библиотеки COMPl_eib [21].

Она имеет физическое происхождение, описывая линеаризованную модель

динамики вертолета Bell 201A-1 с восемью состояниями и четырьмя управ-

лениями. В целях экономии места численные значения матриц не приводятся;

они могут быть найдены в [21] или в [5].

Итак, имеем систему (7) с соответствующими матрицами из HE3 [21]. Для

простоты положим матрицы F , H в описании неопределенности единичны-

ми, как и весовые матрицы R, S в функционале (3). Теорема 3 дает δ^stmax =

= 0,4293 в качестве радиуса квадратичной стабилизируемости; зададим уро-

вень неопределенности δ = 0,5δ^stmax и отмасштабируем матрицу F , как описа-

но в подразделе 3.2. Применяя теоремы 6 и 7 (во втором случае предваритель-

но вычислив матрицу P_ric для номинальной системы), получаем регуляторы

K_avr и K_inv и соответствующие устойчивые замкнутые системы вида x = Ax

128

с матрицами A_avr = A + BK_avr и A_inv = A + BK_inv. Отметим, что регуляторы

значительно различаются:

⎛

⎞

-1,7480

12,2237

3,1609

-0,1018

-0,1010

-0,8759

8,6800

-1,0742

50,6250

-2,1931

1,2001

-0,4471

169,4253 -15,9611

K_avr =⎝-17,5487-1,5843

⎠,

2,4958

-0,3716

-1,5772

-11,3201 -19,7139

-7,4171

-20,9467

-77,7225

−0,0849

0,9821

3,2791

-7,2089

-5,5924

8,9587

4,4428

-29,6456

⎛

⎞

-1,7625

8,3937

5,2542 -0,0626

-0,0590

-0,9951

14,7034

-1,3580

-4,6138

5,7284

0,2433

406,2243 -29,5940

K_inv =⎝-31,8986-1,4810124,4712

⎠.

4,5303 -0,2872

-9,8906 -8,1329 -19,1855

-6,9424

-51,7030

-63,5409

−0,4900

0,7269

6,4580 -5,2043

-4,3559

7,6171

12,2136

-24,9439

Далее, сгенерируем M = 1000 начальных условий xi0 ∈ R⁸, равномерно

распределенных на единичной сфере в евклидовой норме, и для каждого из

них N = 10000 неопределенностей Δ^ij ∈ R8×8, равномерно распределенных

на единичной сфере во фробениусовой норме. Для каждой пары (xi0, Δ^ij) с

помощью леммы Беллмана вычислим значение

avr функционала (3) для си-

стемы

x = (A_avr + Δ^ij)x, x₀ = xi0,

и составим (M × N)-матрицу J_avr. Проделав то же самое для системы с мат-

рицей A_inv, получаем матрицу J_inv. Сравним эти две матрицы по нескольким

признакам.

Наихудшее значение критерия:

maxJavr = 2,6760 · 103,

maxJinv = 5,4840 · 103.

i,j

Среднее значение критерия:

∑

Jijavr = 0,6482 · 10³,

Jijinv = 1,2459 · 10³.

i,j

Процент событий {

avr < Jijinv}:

88,04 %.

Процент событий {max_i

88 %.

avr < maxi J

∑

Процент событий {1Nj

avr <¹

Jijinv}:

88 %.

N j

Проведенный эксперимент свидетельствует о значительном преимуществе

регулятора K_avr для данной системы по всем показателям. Однако более по-

дробный анализ матриц J_avr и J_inv показывает, что существуют начальные

условия, для которых наблюдается обратный результат. Кроме того, разме-

ры выборки (M, N) для задачи данной размерности невелики, чтобы считать

полученные результаты достаточно весомыми. Наконец, аналогичные экспе-

рименты для случайно сгенерированных маломерных пар (A, B) нередко де-

монстрировали преимущество регулятора K_inv.

Отметим также, что в соответствии с теоретическими результатами с

уменьшением уровня неопределенности Δ регуляторы K_avr и K_inv совпадают.

129

7. Заключение

В статье приведены робастные формулировки задачи о линейно-квадра-

тичном регуляторе при наличии ограниченной по норме неопределенности в

матрице системы и кратко обсуждены их достоинства и недостатки. Резуль-

таты немедленно обобщаются на случай дискретного времени и на наличие

неопределенности в матрице B.

Дальнейшие исследования предполагают изучение возможностей иных ре-

гуляторов (например, динамических), а также проведение численных экс-

периментов, в которых, во-первых, явно демонстрируются эти недостатки,

и, во-вторых, сравнивается качество регуляторов K_avr и K_inv (как меж-

ду собой, так и с “дважды робастным” регулятором K_rob). В частности,

интересно проанализировать взаимное расположение эллипсоидов E_avr =

= {x ∈ Rⁿ : x^⊤P-1avrx ≤ 1} и E_inv = {x ∈ Rⁿ : x^⊤P-1invx ≤ 1} в духе публика-

ции [22].

Наконец, возможно развитие подхода, при котором системные неопреде-

ленности предполагаются случайными (наравне с начальными условиями), и

регулятор строится, исходя из минимизации среднего значения по совокуп-

ности системных неопределенностей и начальных условий.

СПИСОК ЛИТЕРАТУРЫ

Харитонов В.Л. Асимптотическая устойчивость семейства систем линейных

дифференциальных уравнений // Дифф. уравнения. 1978. Т. 1. № 11. С. 2086-

2088.

Цыпкин Я.З., Поляк Б.Т. Частотные критерии робастной модальности линей-

ных дискретных систем // Автоматика АН УССР. 1990. № 4. С. 3-9.

Цыпкин Я.З. Робастные адаптивные системы управления // ДАН СССР. 1990.

Т. 315. № 6. С. 1314-1317.

Поляк Б.Т., Цыпкин Я.З. Частотные критериии робастной устойчивости и апе-

риодичности линейных систем // АиТ. 1990. № 9. С. 45-54.

Polyak B.T., Tsypkin Ya.Z. Frequency Domain Criteria for Robust Stability and

Aperiodicity of Linear Systems // Autom. Remote Control. 1990. V. 51. No. 9.

P. 1192-1201.

Хлебников М.В., Щербаков П.С., Честнов В.Н. Задача линейно-квадратичного

управления. I. Новое решение // АиТ. 2015. № 12. С. 65-79.

Khlebnikov M.V., Shcherbakov P.S., Chestnov V.N. Linear-Quadratic Regulator. I.

A New Solution // Autom. Remote Control. 2015. V. 76. No. 12. P. 2143-2155.

Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in

System and Control Theory. Philadelphia: SIAM, 1994.

Willems J.S. Least Squares Stationary Optimal Control and the Algebraic Riccati

Equation // IEEE TAC. 1971. V. 16. No. 6. P. 621-634.

Баландин Д.В., Коган М.М. Синтез оптимальных линейно-квадратичных зако-

нов управления на основе линейных матричных неравенств // АиТ. 2007. № 3.

С. 3-18.

Balandin D.V., Kogan M.M. Synthesis of Linear Quadratic Control Laws on Basis of

Linear Matrix Inequalities // Autom. Remote Control. 2007. V. 68. No. 3. P. 371-385.

130

Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных

матричных неравенств. М.: Физматлит, 2007.

10.

Petersen I.R., McFarlane D.C. Optimal Guaranteed Cost Control and Filtering for

Uncertain Linear Systems // IEEE TAC. 1994. V. 39. No. 9. P. 1971-1977.

11.

Douglas J., Athans M. Robust Linear Quadratic Designs with Real Parameter

Uncertainty // IEEE TAC. 1994. V. 39. No. 1. P. 107-111.

12.

Bernhard P. Survey of Linear Quadratic Robust Control // Macroeconomic

Dynamics. 2002. No. 6. P. 19-39.

13.

Yu L., Han Q.-L., Sun M.-X. Optimal Guaranteed Cost Control of Linear Uncertain

Systems with Input Constraints // Int. J. Contr. Autom. Syst. 2005. V. 3. No. 3.

P. 397-402.

14.

Хлебников М.В., Щербаков П.С. Синтез оптимальной обратной связи при огра-

ниченном управлении // АиТ. 2014. № 2. С. 177-192.

Khlebnikov M.V., Shcherbakov P.S. Optimal Feedback Design under Bounded

Control // Autom. Remote Control. 2014. V. 75. No. 2. P. 320-332.

15.

Поляк Б.Т., Хлебников М.В., Щербаков П.С. Управление линейными система-

ми при внешних возмущениях: Техника линейных матричных неравенств. М.:

ЛЕНАНД, 2014.

16.

Anderson B.D.O., Moore J.B. Linear Optimal Control. N.Y.: Prentice-Hall, 1971.

17.

Grant M., Boyd S. CVX: Matlab Software for Disciplined Convex Programming

(web page and software), URL http://stanford.edu/~boyd/cvx

18.

Petersen I.R. A Stabilization Algorithm for a Class of Uncertain Linear Systems //

Syst. Control Lett. 1987. V. 8. P. 351-357.

19.

Хлебников М.В., Щербаков П.С. Лемма Питерсена о матричной неопределенно-

сти и ее обобщения // АиТ. 2008. № 11. С. 125-139.

Khlebnikov M.V., Shcherbakov P.S. Petersen’s Lemma on Matrix Uncertainty and

Its Generalization // Autom. Remote Control. 2008. V. 69. No. 11. P. 1932-1945.

20.

Levine W.S., Athans M. On the Determination of the Optimal Constant Output

Feedback Gains for Linear Multivariable Systems // IEEE TAC. 1970. V. 46. No. 9.

P. 1420-1426.

21.

Leibfritz F., Lipinski W. Description of the Benchmark Examples in COMPleib 1.0.

Technical report. University of Trier, 2003. URL http://www.complib.de

22.

Хлебников М.В. Сравнение квадратичных критериев качества: эллипсоидаль-

ный подход // Стохастическая оптимизация в информатике. 2014. Т. 10. № 1.

С. 145-156.

Статья представлена к публикации членом редколлегии А.В. Назиным.

Поступила в редакцию 19.07.2018

После доработки 14.09.2018

Принята к публикации 08.11.2018

131