Автоматика и телемеханика, № 8, 2021
Линейные системы
© 2021 г. Д.В. БАЛАНДИН, д-р физ.-мат. наук (dbalandin@yandex.ru)
(Нижегородский государственный университет им. Н.И. Лобачевского),
Р.С. БИРЮКОВ, канд. физ.-мат. наук (biryukovrs@gmail.com),
М.М. КОГАН, д-р физ.-мат. наук (mkogan@nngasu.ru)
(Нижегородский государственный архитектурно-строительный университет)
МНОГОКРИТЕРИАЛЬНЫЕ МИНИМАКСНЫЕ ЗАДАЧИ:
ЛОКАЛИЗАЦИЯ МНОЖЕСТВА ПАРЕТО И СИНТЕЗ
СУБОПТИМАЛЬНЫХ УПРАВЛЕНИЙ1
Рассматриваются задачи многокритериальной минимаксной оптимиза-
ции с критериями вида максимумов функционалов, к которым относят-
ся индуцированные нормы линейных операторов, отображающих входы
системы и/или ее начальное состояние в выходы. Показано, что заме-
на трудновыполнимой минимизации линейной свертки таких критери-
ев на минимизацию максимума линейной свертки соответствующих им
функционалов приводит к субоптимальным решениям с оценкой степени
субоптимальности по отношению к оптимальным по Парето решениям.
Этот подход применяется к синтезу субоптимальных по Парето законов
управления линейными нестационарными на конечном горизонте и ста-
ционарными на бесконечном горизонте непрерывными и дискретными си-
стемами при неопределенных начальных состояниях и/или возмущениях.
Приводятся результаты численного моделирования.
Ключевые слова: многокритериальное управление, множество Парето,
обобщенная H норма, линейные матричные неравенства.
DOI: 10.31857/S000523102108002X
1. Введение
Реальные задачи управления всегда многокритериальны. Нахождение
множества Парето, а следовательно, и оптимальных по Парето решений, т.е.
неулучшаемых одновременно для всех критериев, представляет собой слож-
ную задачу. Известно, что замена многокритериальной задачи на однокри-
териальную с критерием в виде линейной комбинации исходных критериев
обеспечивает в общем случае нахождение некоторого подмножества множе-
ства Парето (Парето-оптимального фронта). Но и такая замена в многокри-
териальных минимаксных задачах, в которых отдельные критерии являют-
ся максимумами некоторых функционалов по неопределенным переменным
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных
исследований (проект № 19-01-00289), Министерства науки и высшего образования РФ
(проект № 0729-2020-0055) и Научно-образовательного математического центра “Матема-
тика технологий будущего” (соглашение № 075-02-2021-1394).
39
или функциям, приводит к трудной задаче оптимизации линейной комбина-
ции максимумов некоторых функционалов. Можно привести лишь несколь-
ко многокритериальных задач управления, в которых удалось описать оп-
тимальные по Парето решения: линейно-квадратичные гауссовские управле-
ния [1] и H2 оптимальные управления [2] на основе Q-параметризации ста-
билизирующих регуляторов линейных стационарных систем на бесконечном
интервале времени, а также обобщенные H2 оптимальные управления [3, 4]
для линейных нестационарных систем на конечном горизонте и стационар-
ных систем на бесконечном горизонте.
В [5] для задач многокритериальной оптимизации с критериями в виде H
и γ0 норм в детерминированной и стохастической постановках были найдены
субоптимальные по Парето законы управления, относительные потери кото-
рых по сравнению с оптимальными по Парето не превышают 1 -
N /N , где
N - число критериев. В многокритериальных задачах управления с крите-
риями, включающими H норму, удавалось синтезировать субоптимальные
управления, как правило, только при дополнительном ограничении типа ра-
венства матриц функций Ляпунова [6-11], которое неявно присутствует и в
концепции так называемого смешанного H2/H управления, или типа равен-
ства вспомогательных матричных переменных [12, 13], налагаемых на мат-
ричные уравнения или линейные матричные неравенства, характеризующие
каждый из критериев. В [14] для синтеза двукритериального управления при-
менялся подход, состоящий в получении конечномерных Q-аппроксимаций
оптимальных по Парето регуляторов. При этом до сих пор остается без от-
вета вопрос о том, в какой мере значения отдельных критериев при много-
критериальных законах управления, синтезируемых с учетом дополнитель-
ных ограничений или на основе аппроксимаций, превышают соответствую-
щие значения критериев при оптимальных по Парето законах управления.
Результаты, полученные в данной статье, в каком-то смысле проливают
свет на эту проблему. А именно показано, как в многокритериальных мини-
максных задачах, к которым, в частности, относятся и задачи с критериями
типа обобщенной H нормы, можно оценивать границы области критериаль-
ного пространства, в которой расположены точки, отвечающие минимумам
линейной свертки критериев и, следовательно, принадлежащие множеству
Парето. При этом определяются субоптимальные по Парето решения много-
критериальной задачи, которым соответствует одна из получаемых границ,
и оценивается степень их субоптимальности. В двукритериальных задачах
эти границы суть верхняя и нижняя кривые, между которыми находится
указанное множество. Наличие этих границ позволяет оценить, в какой мере
значения отдельных критериев при многокритериальных законах управле-
ния, получаемых при дополнительных предположениях и ограничениях, от-
личаются от значений критериев при оптимальных по Парето управлениях.
Далее в статье получены характеризации обобщенной H нормы в терминах
линейных матричных неравенств для линейных непрерывных и дискретных
нестационарных систем на конечном горизонте и стационарных систем на
бесконечном горизонте и синтезированы субоптимальные по Парето управле-
ния в многокритериальных задачах с обобщенными H нормами в качестве
критериев. Приводятся иллюстративные примеры, в которых для различных
40
двукритериальных задач управления находятся субоптимальные решения и
строятся границы области, содержащей точки множества Парето.
2. Двусторонние границы области,
содержащей подмножество Парето-фронта
Задача состоит в нахождении оптимальных по Парето решений в много-
критериальной задаче минимизации с критериями Ji(Θ), i = 1, . . . , N, каж-
дый из которых представляет собой максимум некоторой неотрицательной
функции Fi, ω) 0 по отношению к некоторым переменным ω из множе-
ства Ω, т.е.
(2.1)
Ji(Θ) = sup Fi
, ω), i = 1, . . . , N.
ω∈Ω
Напомним, что решение ΘP называется оптимальным по Парето, если не
существует такого решения Θ, что выполняются неравенства Ji(Θ) JiP ),
i = 1,...,N, в которых по меньшей мере одно является строгим. Множество
точек в N-мерном критериальном пространстве, соответствующее всем таким
решениям, называется множеством Парето
P = {JP) = (J1P),...,JNP))}.
Оптимальные по Парето решения — это множество неулучшаемых решений
в том смысле, что для каждого из них не существует решения, при котором
значения всех критериев были бы не больше, чем при данном, а значение
хотя бы одного критерия было бы строго меньше.
Самым распространенным методом нахождения оптимальных по Парето
решений многокритериальной задачи является метод скаляризации, т.е. вы-
бора единого критерия в виде, например, линейной свертки этих критериев
{
}
Jα(Θ) = αiJi(Θ), α ∈ S = α = (α1,... ,αN ) : αi > 0,
αi = 1
i=1
i=1
Назовем линейную свертку Jα(Θ) оптимальной целевой функцией. Как из-
вестно [15], параметры Θα, для которых выполняется
minJα(Θ) = Jαα) = μ(α),
Θ
являются оптимальными по Парето решениями многокритериальной задачи.
Обозначим соответствующее им множество точек в критериальном простран-
стве через
PL = {Jα) = (J1α),... ,JNα))
∀α∈S}.
В общем случае ими может не исчерпываться все множество Парето, т.е.
PL ⊆ P.
Непосредственное нахождение параметров Θα для многокритериальных
минимаксных задач представляется затруднительным, так как оптимальная
41
а
б
J2
J2
^
J(
)
J(
)
J(
)
0
0
0
J1
J1
Рис. 1. Построение области Σ0, содержащей точки множества Парето.
целевая функция для таких задач оказывается линейной комбинацией мак-
симумов разных функций. В связи с этим оценим ее снизу, заменяя сумму
максимумов на максимум суммы
(2.2)
Jα(Θ) =
αi sup
Fi, ω) sup
αiFi) = sup Fα)
Jα
(Θ).
ω∈Ω
ω∈Ω
i=1
ω∈Ω i=1
N
Назове
Jα(Θ) = supω∈Ωi=1 αiFi) субоптимальной целевой функцией,
а параметрыΘα, оптимальные по отношению
Jα(Θ), при которых
(2.3)
minJα(Θ)
Jαα) = μ-
(α),
Θ
назовем субоптимальными по Парето решениями многокритериальной зада-
чи. Покажем, что для рассматриваемых задач можно указать границы обла-
сти критериального пространства, в которой находится подмножество PL, и
тем самым оценить степень субоптимальности решенийΘα.
Равенство
Jαα) = αiJiα) = μ(α)
i=1
означает, что в критериальном пространстве точка Jα) принадлежит ги-
перплоскости Πα с вектором нормали nTα = (α1, . . . , αN ), уравнение которой
nTαJ = μ(α) (см. рис. 1,a). Это плоскость отстоит от начала координат на рас-
стояние dα = |nα|-1μ(α). Так как
(2.4)
μ+(α) = αiJiα)
αiJiα
) = μ(α),
i=1
i=1
42
то субоптимальным по Парето решениямΘα соответствует точка Jα),
принадлежащая гиперплоскости Π+α, уравнение которой nTαJ = μ+(α). Эта
плоскость отстоит от начала координат на расстояние d+α = |nα|-1μ+(α)
dα.
Из справедливости неравенств
(2.5)
μ(α) = αiJiα)
Jαα)
Jαα) = μ-
(α)
i=1
следует, что точка Jα) удалена от начала координат не меньше, чем на
d = |nα|-1μ-(α) - расстояние от плоскости Π с уравнением nTαJ = μ-(α) до
начала координат, т.е. dα d. Таким образом, точка Jα) Πα находится
между двумя параллельными гиперплоскостями Π и Π+α.
Определим в пространстве критериев для любого набора α ∈ S следующие
множества:
{
}
Σ = (J1,... ,JN ) :
αiJi
Jαα), Ji 0, i = 1,... ,N
,
i=1
{
}
(2.6)Σ+
α
= (J1, . . . , JN ) :
αiJi
αiJiα), Ji 0, i = 1,... ,N
,
i=1
i=1
Σ- = Σ, Σ+ = Σ+α, Σ0 = Σ+\Σ-.
α∈S
α∈S
Докажем, что точки Jα) ∈ PL ⊆ P принадлежат множеству Σ0 (см.
рис. 1,б ).
Действительно, так как
αiJiα)
αiJiα) = μ+(α),
i=1
i=1
то Jα) Σ+. Покажем, что для произвольного фиксированного набо-
ра α ∈ S точка Jα) Σ-, т.е. Jα) Σ для любого α ∈ S. Из (2.5)
следует, что Jα) Σ-̂α. Предположим, что для некоторого α = α выпол-
N
нено Jα) Σ, т.е.
αiJiα) < μ-(α). Так как
Jαα)
Jαα)
i=1
Jαα) = μ(α), то
αiJiα) <
αiJiα),
i=1
i=1
т.е. Jαα) < Jαα). Это противоречит тому, что Θα обеспечивает минимум
линейной свертки Jα(Θ). Таким образом, Θα Σ0, и можно сформулировать
следующее утверждение.
Теорема 2.1. Множество точек PL ⊆ P критериального простран-
ства, которые соответствуют оптимальным по Парето парамет-
рам Θα, минимизирующим оптимальную целевую функцию Jα(Θ) =
43
N
=
αi supω∈Ω Fi), принадлежит множеству Σ0, которое определе-
i=1
но в (2.2), (2.3), (2.6).
В двукритериальных задачах нижней и верхней границами области, кото-
рой принадлежит множество PL в пространстве критериев (J1, J2), являются
“огибающие” семейства прямых
αJ1 + (1 - α)J2
Jαα),
αJ1 + (1 - α)J2 = αJ1α) + (1 - α)J2α)
∀α ∈ (0,1).
Заметим, что значениям α = 1 и α = 0 отвечают прямые J1 = minΘ J1(Θ) и
J2 = minΘ J2(Θ) соответственно.
Для количественной оценки близости значений функционалов при найден-
ных субоптимальных решенияхΘα и неизвестных оптимальных решениях Θα
введем показатель субоптимальности
d+α - d
μ+(α) - μ-(α)
η = max
= max
,
α∈S dα
α∈S
μ+(α)
определяемый по относительной величине максимального “расстояния” меж-
ду границами множества Σ0. Чем ближе η к нулю, тем точнее оценка множе-
ства Парето и тем ближе друг к другу значения соответствующих критериев
при субоптимальных и оптимальных решениях.
Заметим, что приведенный в данном разделе анализ и полученный резуль-
тат без всяких изменений переносятся на случай, когда критериями являются
функционалы, а “переменными” ω и решениями Θ - функции.
3. Обобщенная H норма
В этом разделе рассматриваются характеристики системы, которые далее
будут выбираться в качестве отдельных критериев при синтезе управления.
Пусть линейная нестационарная система описывается уравнениями
∂x = A(t)x(t) + B(t)v(t), x(t0) = x0,
(3.1)
z(t) = C(t)x(t) + D(t)v(t), t ∈ [t0, tf ],
в которых обозначает оператор дифференцирования для системы в непре-
рывном времени или оператор сдвига, т.е. ∂x(t) = x(t + 1), для системы в
дискретном времени; x ∈ Rnx - состояние, v ∈ Rnv - возмущение и z ∈ Rnz -
целевой выход. Обобщенной H нормой системы (3.1) на конечном интервале
[t0, tf ] от входа v к выходу z при неопределенном начальном состоянии для
заданных весовых матриц начального состояния R = RT > 0 и терминально-
го состояния S = ST 0 называется квадратный корень из максимального
значения интегрального показателя выхода с учетом терминального состоя-
ния системы, нормированного суммой квадратичной формы начального со-
стояния и квадрата L2-нормы возмущения для непрерывной системы или
l2-нормы возмущения для дискретной системы, т.е.
)1/2
( ∥z∥2
+ xT(tf)Sx(tf)
[t0, tf ]
(3.2)
γ∞,0 = sup
,
x0, v
xT0R-1x0 + ∥v∥2
[t0, tf ]
44
где супремум берется по всем начальным состояниям x(t0) = x0 и всем v ∈ L2
или v ∈ l2, одновременно не обращающимся в ноль. Здесь для систем в непре-
рывном или дискретном времени используются обозначения
tf
tf-1
∥ξ∥2[t
=
(t)|2dt,
∥ξ∥2[t
=
(t)|2.
0,tf]
0, tf
]
t=t0
t0
При S = 0 в обобщенной H норме терминальное состояние не учитывается.
Эта характеристика, которая для систем в непрерывном времени была вве-
дена в [16] под названием “H norm with transients”, а для систем в дискрет-
ном времени - в [17], содержит в себе как частные случаи многие критерии,
применяемые при синтезе управления. Так, при отсутствии внешнего возму-
щения, т.е. при v(t) 0, этот показатель принимает вид так называемой γ0
нормы
∥z∥[t0, tf )
γ0 = sup
(
)1/2
x0=0
xT0R-1x0
и характеризует “наихудшее” значение квадратичного функционала на тра-
екториях системы при начальном состоянии, принадлежащем эллипсоиду
xTR-1x 1. Когда начальное состояние нулевое, обобщенная H норма пе-
реходит в стандартную H норму
(
)1/2
+ xT(tf)Sx(tf)
∥z∥2[t0, tf
)
γ = sup
v=0
∥v∥[t0, tf )
В частном случае при C(t) 0, D(t) 0 в (3.1) обобщенная H норма харак-
теризует так называемое максимальное уклонение выхода S1/2x(t) в конеч-
ный момент времени, определяемое как
|S1/2x(tf )|
(3.3)
γv,0 = sup
(
)1/2 .
x0, v
xT0R-1x0 + ∥v∥2
[t0, tf ]
Все эти показатели являются индуцированными нормами соответствующих
линейных операторов, порождаемых системой и отображающих начальное
состояние и/или возмущение в выход и/или терминальное состояние, и с со-
ответствующими скалярными произведениями в линейных пространствах.
В [16] было установлено, что для нахождения обобщенной H нормы ли-
нейной непрерывной нестационарной системы на конечном горизонте тре-
буется найти решение дифференциального матричного уравнения Риккати,
удовлетворяющее определенным начальным и конечным условиям. В следую-
щей теореме, доказательство которой приведено в Приложении, показано, что
обобщенная H норма на конечном горизонте в непрерывном и дискретном
случаях может быть вычислена как решение задачи оптимизации линейной
функции при ограничениях, заданных дифференциальными или разностны-
ми линейными матричными неравенствами.
45
Теорема 3.1. Пусть выполняется неравенство
(3.4)
γ2I - DT(t)D(t) > 0
∀t ∈ [t0,tf
].
Обобщенная H норма системы (3.1) удовлетворяет неравенству γ∞,0 < γ
тогда и только тогда, когда дифференциальные линейные матричные нера-
венства
-˙(t) + Y (t)AT(t) + A(t)Y (t)
(3.5)
BT(t)
-I
0, t ∈ [t0, tf
],
⎠≤
C(t)Y (t)
D(t)
2I
для непрерывной системы или линейные матричные неравенства
-Y (t + 1)
Y (t)AT(t)
-Y (t)
(3.6)
⎟ ≤ 0, t = t0,...,tf
1,
T(t)
0
-I
B
0
C(t)Y (t) D(t)
2I
для дискретной системы, а также равенство
(3.7)
Y (t0
)=R
и линейное матричное неравенство
(
)
Y (tf )
(3.8)
>0
S1/2Y (tf) γ2I
имеют решения относительно неизвестных Y (t) > 0 и γ2.
Для вычисления обобщенной H нормы предварительно проводится дис-
кретизация соответствующего дифференциального линейного матричного
неравенства, а затем решается стандартная задача полуопределенного про-
граммирования.
Для устойчивого стационарного объекта вида (3.1), в котором A(t) = A,
B(t) = B, C(t) = C, D(t) = D - заданные постоянные матрицы и все соб-
ственные значения матрицы A расположены для системы в непрерывном
времени строго слева от мнимой оси, а для системы в дискретном време-
ни — строго внутри единичного круга комплексной плоскости, обобщенная
H норма, стандартная H норма (т.е. при нулевых начальных условиях) и
γ0 норма на бесконечном интервале определяются как
∥z∥[0,∞)
∥z∥[0,∞)
γs∞,0 = sup
(
)1/2 , γ = sup
,
x0, v
v=0 ∥v∥[0,∞)
xT0R-1x0 + ∥v∥2
[0,∞)
∥z∥[0,∞)
γs0 = sup
(
)1/2 ,
x0=0
xT0R-1x0
где верхний индекс s указывает на стационарность системы.
46
Теорема 3.2. Обобщенная H норма устойчивой стационарной систе-
мы (3.1) на бесконечном интервале времени удовлетворяет неравенству
γs∞,0 < γ тогда и только тогда, когда линейные матричные неравенства
Y AT + AY
(3.9)
BT
−I
< 0, Y > R,
CY
D -γ2I
для системы в непрерывном времени [18] или
-Y
Y AT -Y
(3.10)
< 0, Y > R,
BT
0
-I
0
CY D
2I
для системы в дискретном времени [17] имеют решения относительно
неизвестных Y и γ2.
В отличие от теоремы 3.1 линейные матричные неравенства в теореме 3.2
являются строгими, так как на бесконечном горизонте дополнительно тре-
буется обеспечить асимптотическую устойчивость системы при наихудшем
возмущении. Из теоремы 3.2 следует, что уровень гашения начального воз-
мущения для системы в непрерывном времени удовлетворяет неравенству
γs0 < γ тогда и только тогда, когда разрешимы неравенства (3.9), в первом из
которых следует вычеркнуть вторые блочные строку и столбец, а для систе-
мы в дискретном времени, когда разрешимы неравенства (3.10), в первом из
которых следует вычеркнуть третьи блочные строку и столбец. В свою оче-
редь H норма передаточной матрицы от v к z меньше γ тогда и только то-
гда, когда разрешимо первое неравенство в (3.9) для системы в непрерывном
времени или первое неравенство в (3.10) для системы в дискретном време-
ни. Каждый из показателей находится путем минимизации γ2 на множестве,
определяемом соответствующими линейными матричными неравенствами.
4. Синтез субоптимальных по Парето управлений
в задачах с обобщенными H нормами
Рассмотрим многокритериальную задачу управления системой c N целе-
выми выходами
∂x = A(t)x(t) + Bv(t)v(t) + Bu(t)u(t),
(4.1)
zi(t) = Ci(t)x(t) + Dvi(t)v(t) + Dui(t)u(t), i = 1,... ,N,
с обратной связью u = Θ(t)x, критериями в которой являются квадраты обоб-
щенных H норм выходов zi
+ xT(tf)Six(tf)
∥zi2[t0,tf ]
Ji[Θ(t)] = sup
,
i = 1,...,N,
x0,v
xT0R-1x0 + ∥v∥2
[t0,tf ]
47
рассматриваемых как функционалы от матрично-значных функций Θ(t),
t ∈ [t0,tf]. Для этой задачи субоптимальный целевой функциионал имеет вид
∥zα2[t0, tf ]+xT(tf)Sαx(tf),
Jα[Θ(t)] = sup
x0, v
xT0R-1x0 + ∥v∥2[t0, tf ]
где
zα(t) = [Cα(t) + D(t)Θ(t)]x(t) + D(t)v(t), Sα =
αiSi,
i=1
α1/21C1(t)
α1/21Du1(t)
(4.2)
Cα(t) =
···
,D(t) =
···
,
α1/2NCN(t)
α1/2NDuN(t)
α1/21Dv1(t)
D(t) =
···
.
α1/2NDvN(t)
Это значит, чт
Jα[Θ(t)] является обобщенной H нормой комбинированного
выхода zα системы (4.1) с матрицей терминального состояния Sα, а субоп-
тимальными по Парето решениями являются обобщенные H оптимальные
управления по отношению к этой норме для всех α ∈ S. Матрицы параметров
этих законов управления вычисляются какΘα(t) = Z(t)Y-1(t) при решении
линейных матричных неравенств, получаемых из (3.5) и (3.8) для системы в
непрерывном времени (из (3.6) и (3.8) для системы в дискретном времени)
с начальным условием Y (t0) = R и с матрицей терминального состояния Sα
при замене в них соответствующих матриц на матрицы A(t) + Bu(t)Θ(t),
Bv(t), Cα(t) + D(t)Θ(t), D(t) и при введении вспомогательных перемен-
ных Z(t) = Θ(t)Y (t). Заметим, что для приближенного вычисления матриц
параметров обратной связи Θ(t) в системах с непрерывным временем предва-
рительно проводится дискретизация дифференциального линейного матрич-
ного неравенства.
В частном случае для системы с нулевыми начальными условиями при
критериях вида стандартных H норм и максимальных уклонений субопти-
мальные по Парето управления находятся при решении линейных матричных
неравенств (3.5) и (3.8) (или (3.6) и (3.8)) с соответствующими системными
матрицами и при Y (t0) = 0. В другом частном случае, когда отсутствуют
возмущения, т.е. v(t) 0, субоптимальные по Парето управления в многокри-
териальной задаче с критериями вида γ0 норм и максимальных уклонений
выходов в конечный момент времени при неопределенных начальных усло-
виях находятся в результате решения линейных матричных неравенств, по-
лученных из (3.5) и (3.8) (или (3.6) и (3.8)) с соответствующими системными
матрицами при B(t) 0 и Y (t0) = R.
Когда все критерии являются максимальными уклонениями в конечный
момент времени N выходов zi(tf ) системы (4.1) при Dvi(t) 0, i = 1, . . . , N,
48
возможен синтез оптимальных по Парето управлений. Действительно, выбе-
рем в этом случае в качестве единого критерия свертку Гермейера [15]
{
}
J[Θ(t)] = max
α-1jJj[Θ(t)]
∀αj > 0.
j=1,...,N
Представим ее в виде
2
|zj (tf )|
J[Θ(t)] = max
α-1j sup
=
j=1,...,N
x0, v xT0R-1x0 + ∥v∥2
[t0, tf ]
max
-1/2jzj (tf )|2
j=1,...,N
|zα(tf )|2g∞
= sup
= sup
,
x0, v xT0R-1x0 + ∥v∥2
x0, v xT0R-1x0 + ∥v∥2
[t0, tf]
[t0, tf ]
где
zα = col(α-1/21z1,... ,α-1/2NzN ),
|zα|g∞ = max
-1/2jzj |.
j=1,...,N
Таким образом, свертка Гермейера для этой задачи представляет собой квад-
рат максимального уклонения в конечный момент времени комбинированного
выхода zα, состоящего из взвешенных выходов системы (4.1), где под мак-
симальным уклонением комбинированного вектора принимается величина,
равная максимуму из евклидовых норм составляющих его векторов. Следо-
вательно, оптимальные по отношению к J[Θ(t)] матрицы Θα(t), которые яв-
ляются оптимальными по Парето решениями рассматриваемой многокрите-
риальной задачи, находятся как Θα(t) = Z(t)Y-1(t) в результате решения за-
дачи inf γ2 при ограничениях в форме дифференциальных матричных нера-
венств
(4.3)
- Y (t)+Y (t)AT(t)+A(t)Y (t)+ZT(t)BTu (t)+Bu(t)Z(t)+Bv(t)BTv
(t) 0
при t = [t0, tf ] для системы в непрерывном времени,
(
)
-Y (t + 1) + Bv(t)BTv(t)
(4.4)
0
Y (t)AT(t) + ZT(t)BTu (t) -Y (t)
при t = t0, . . . , tf - 1 для системы в дискретном времени, а также
(
)
Y (t
f)
(4.5)
Y (t0) = R,
> 0, i = 1, . . . , N.
CiY (tf ) + DuiZ(tf) αiγ2I
Теперь покажем, как синтезировать субоптимальные по Парето стацио-
нарные обратные связи u = Θx в задачах многокритериальной оптимизации
для стационарных систем вида (4.1), критериями в которых являются обоб-
щенные H нормы на бесконечном интервале
∥zi2[0,∞)
Ji(Θ) = sup
,
i = 1,...,N.
x0, v xT0R-1x0 + ∥v∥2
[0, ∞)
49
В этом случае субоптимальная целевая функция имеет вид
∥zα2[0,∞)
Jα(Θ) = sup
,
x0, v xT0R-1x0 + ∥v∥2
[0, ∞)
где комбинированный выход zα(t) определен как в (4.2) при всех стацио-
нарных матрицах. Субоптимальными по Парето решениями данной задачи
являются оптимальные управления по отношению к обобщенной H норме
выхода zα стационарной системы (4.1) для всех α ∈ S. ПараметрыΘα этих
законов управления находятся при решении линейных матричных неравенств
(3.9) или (3.10), в которых соответствующие матрицы следует заменить на
A + BuΘ, Bv, Cα + DΘ и D.
5. Примеры
5.1. Система первого порядка
Начнем с простого примера для системы первого порядка
x = -x + v + u, x(0) = 0,
(5.1)
z1 = x, z2 = u,
рассматриваемого аналитически. Зададим управление в виде u = -θx и вы-
берем два критерия
∥zi2[0,∞)
(5.2)
Ji(θ) = sup
,
i = 1,2.
v=0 ∥v∥2
[0, ∞)
В данном случае субоптимальная целевая функци
Jα(θ) - квадрат H нор-
мы передаточной функции H(s) замкнутой системы от v к комбинированному
выходу
(
zα(t) = α1/2
- (1 - α)1/2θ
)T x(t), α ∈ (0, 1).
Так как
2
α + (1 - α)θ
|H()|2 =
,
ω2 + (1 + θ)2
то
2
α + (1 - α)θ
Jα(θ) = max
|H()|2 =
ω∈[0,∞)
(1 + θ)2
Проводя минимизаци
Jα(θ), получаем
θα =α
,
Jα(θα) = α(1 - α).
1
50
Cогласно (2.3) и (2.4) имеем
μ-(α) = μ+(α) = α(1 - α).
Таким образом, нижняя и верхняя границы области, в которой находится
искомое множество решений двукритериальной задачи, совпадают, а само
это множество определяется как огибающая на плоскости (J1, J2) семейства
прямых
αJ1 + (1 - α)J2 = α(1 - α).
Решение этой несложной задачи о нахождении огибающей семейства прямых
дает при J1 [0, 1] и J2 [0, 1] кривую в неявной форме
2J1 + 2J2 - (J1 - J2)2 = 1
или в явной форме
J2 = (
J1 - 1)2, J1 (0, 1).
Наконец, заметим, что в данном примере
2
1
θ
J1(θ) =
,
J2(θ) =
(1 + θ)2
(1 + θ)2
и, следовательно
Jα(Θ) = Jα(Θ).
5.2. Виброизоляция упругого объекта
Рассмотрим механическую систему с двумя степенями свободы, показан-
ную на рис. 2 и представляющую собой упругий объект, который модели-
руется двумя материальными точками 2 и 3, связанными между собой ли-
нейными упругим и диссипативным элементами; этот упругий объект связан
такими же линейными упругим и диссипативным элементами и управляемым
элементом (называемым далее виброизолятором) с другим телом 1, который
моделирует подвижное основание. Динамика данной механической системы
(в безразмерных переменных и параметрах) описывается дифференциальны-
ми уравнениями
x1 = -2β x1 + β x2 - 2x1 + x2 + v + u, x1(0) = x10,
x1(0) = x30,
x2 =( x2 - x1) - x2 + x1 + v,
x2(0) = x20,
x2(0) = x40,
где x1 и x2 - координаты материальных точек 2 и 3 относительно подвижно-
го основания, u - усилие, создаваемое виброизолятором при его деформации
(т.е. при смещении точки 2 относительно точки 1), v - с точностью до знака
ускорение основания (материальной точки 1), β = 0,1 - заданный положи-
тельный параметр демпфирования. Задача виброизоляции состоит в поиске
управления u = θ1x1 + θ2x2 + θ3 x1 + θ4 x2, обеспечивающего как наименьшую
возможную деформацию механической системы, так и минимальную силу,
51
x2
3
x1
2
u
4
1
v
Рис. 2. Схема упругого объекта с виброизолятором.
J2
10
8
B
6
A
4
2
4
6
8
10
J1
Рис. 3. Оценка множества Парето в задаче виброизоляции.
противодействующую смещению упругого объекта относительно основания.
С этой целью рассмотрим целевые выходы
z1 = (x1, x2 - x1)T, z2 = -x1 - β x1 + u.
Обобщенные H нормы относительно указанных выходов можно трактовать
как искомые характеристики системы. Используя неравенства теоремы 3.2,
52
найдем множество Σ0 (см. рис. 3). В этом случае показатель субоптималь-
ности равен η = 0,2768. На верхней границе множества Σ0 указана точка
A(4,256; 5,582), отвечающая значению α = 0,64.
Для сравнения были вычислены регуляторы на основе линейных матрич-
ных неравенств, характеризующих каждую из указанных обобщенных H
норм при дополнительном предположении, что функции Ляпунова для каж-
дой из этих норм равны между собой. А именно матрицы обратных свя-
зей определялись при решении задачи inf J2(Θ) при условии, что J1(Θ) < γ2
с параметром γ. Они находились какΘγ = Zγ Y-1γ, где Yγ и Zγ - решения
задачи inf γ2 при ограничениях, определяемых парой линейных матричных
неравенств вида (3.9), в одном из которых матрицы A, B, C, D заменены
матрицами A + BuΘ, Bv, C1 + Du1Θ, Dv1 соответственно, а в другом — мат-
рицами A + BuΘ, Bv, C2 + Du2Θ, Dv2 и Zγ = ΘYγ. Точка B(4,959; 5,913) на
рис. 3 соответствует одному из найденных регуляторов с параметрами Θ =
= (-0,472; 0,252; -1,745; -1,385)T.
5.3. Гашение параметрических колебаний линейного осциллятора
Рассмотрим уравнение Матьё
x1 = x2,
(5.3)
x2 =2(1 + εsin t)x1 + u + v
с параметрами δ = 0,5 и ε = 0,3, описывающее параметрические колеба-
ния линейного осциллятора. Зададим на интервале времени длительностью
T = 10 равномерную сетку с шагом h = 0,05 и дискретизируем систему (5.3),
заменяя производные конечно-разностными отношениями. Выберем в каче-
стве первого критерия обобщенную H норму этой системы с целевым вы-
ходом z = x1 + u, т.е. с матрицами C1 = (1 0), D1 = 1, и весовой матрицей
терминального состояния S1 = 0. В качестве второго критерия возьмем мак-
симальное уклонение вектора (1/2)col (x1, x2) в конечный момент времени,
т.е. C2 = (0 0), D2 = 0 и S2 = 0,25I. Таким образом, функционалы имеют вид:
∥z∥2[0,T]
xTfS2xf
(5.4) J1[Θ(t)] = sup
,
J2[Θ(t)] = sup
x0,v xT0R-1x0 + ∥v∥2[0,T]
x0,v xT0R-1x0 + ∥v∥2
[0,T ]
В дальнейших численных экспериментах R = 0,5I. Применим подход,
изложенный в разделе 2, для построения границ области Σ0, содержащей
множество Парето. На рис. 4 серым цветом изображено множество Σ0. Видно,
что оно получилось достаточно “узким” и значение показателя субоптималь-
ности η = 0,125 подтверждает этот вывод. Отметим, что точки верхней грани-
цы множества Σ0 соответствуют субоптимальным по Парето решениямΘα,
которые находятся с использованием описанного в разделе 4 подхода. В част-
ности, при α = 0,18 были найдены коэффициенты обратной связиΘα и для
них вычислены значения функционалов. Точка, отвечающая этим значени-
ям, на рис. 4 обозначена через A, ее координаты — (0,898; 0,249). Значения
функционалов в случае, когда управление в системе (5.3) отсутствует, рав-
ны J1 = 185,259 и J2 = 0,966. Таким образом, использование управления поз-
воляет уменьшить обобщенную H норму системы практически в 200 раз!
53
J2
0,8
B
0,7
0,6
0,5
0,4
0,3
A
0,2
0,1
0
0,5
1,0
1,5
2,0
2,5
3,0
J1
Рис. 4. Оценка множества Парето в задаче гашения параметрических колебаний.
^
1
0,9
1,0
,1
0
2
4
6
8
10
t
^
2
0,0
0,1
0,2
0
2
4
6
8
10
t
Рис. 5. Графики зависимостей от времени субоптимальных по Парето коэф-
фициентов обратной связи.
Также представляет интерес сравнить полученные результаты с простейшим
регулятором вида u = -x1. Нетрудно видеть, что в этом случае J1 = 0, по-
скольку z = x1 + u = 0. Значение J2 = 0,750, что примерно в 3 раза больше,
чем значение J2 для точки A. На рис. 4 точка с координатами (0; 0,750) обо-
значена через B.
54
На рис. 5 приведены графики зависимости от времени субоптимальных
по Парето коэффициентов обратной связиΘTα(t) = (θ1(t)θ2(t)), отвечающих
точке A. Заметим, что практически все время функционирования системы
коэффициенты обратной связи сохраняют “постоянные” значения. Значения
функционалов при стационарном регуляторе, отвечающим этим “постоян-
ным” значениям θ1(t) ≡ -0,13 и θ2(t) ≡ -1,0, равны J1 = 0,900 и J2 = 0,249,
т.е. отличия в значениях критериев при использовании такого стационар-
ного регулятора вместо нестационарного субоптимального регулятораΘα(t)
незначительны.
6. Заключение
Рассмотрены многокритериальные задачи минимаксной оптимизации,
критериями в которых являются максимумы некоторых функционалов.
В статье показано, что при минимизации единого критерия в виде максиму-
ма линейной свертки функционалов (вместо линейной свертки максимумов)
находятся субоптимальные по Парето решения и оцениваются их потери по
сравнению с минимальными. В критериальном пространстве строятся гра-
ницы области, содержащей точки множества Парето, в которых линейная
свертка критериев принимает манимальные значения. Тем самым появляет-
ся возможность сравнивать значения отдельных критериев при выбираемых
тем или иным способом решениях многокритериальных задач и при опти-
мальных по Парето решениях. Этот подход в сочетании с аппаратом ли-
нейных матричных неравенств применяется для решения новых многокри-
териальных линейно-квадратичных задач управления при неопределенных
начальных условиях и возмущениях с критериями вида обобщенной H нор-
мы или γ0 нормы для непрерывных и дискретных нестационарных систем на
конечном горизонте и стационарных систем на бесконечном горизонте. При-
водятся примеры двукритериальных задач управления, в которых находятся
субоптимальные по Парето решения и строятся области, содержащие точки
множества Парето.
ПРИЛОЖЕНИЕ
Доказательство теоремы 3.1. Покажем, что выполнение неравен-
ства γ∞,0 < γ влечет выполнение неравенств (3.5) (или (3.6)), (3.8) и равен-
ства (3.7). На траекториях системы (3.1) определим функционал
[
]
(Π.1)
J (v) = γ2
∥v∥2[t
+xT0R-1
x0
- ∥z∥2[t
0,tf]
0,tf]
Заметим, что неравенство γ∞,0 < γ эквивалентно неравенству
(Π.2)
J (v) > xT(tf )Sx(tf )
∀x0 Rnx, ∀v ∈ L2 : xT0R-1x0 + ∥v∥2[t
= 0.
0,tf]
Поставим задачу минимизации этого функционала относительно v, которую
будем решать методом динамического программирования.
С этой целью введем вдоль траектории системы функцию Беллмана
{
[
]
}
(Π.3)
V (t, x) = min
γ2
∥v∥2[t
+xT0R-1
x0
- ∥z∥2
,
0,t]
[t0, t]
v(τ), τ∈[t0,t]
55
где x = x(t) - состояние системы в момент времени t. Запишем соответствую-
щее уравнение Беллмана
(
)
(Π.4)
min
-∂V - |z|2 + γ2|v|2
= 0, V (t0, x) = γ2xTR-1
x,
v(t)
которое в непрерывном случае приводит к следующему уравнению в частных
производных
Vt + Vx[A(t)x + B(t)v] + [C(t)x + D(t)v]T[C(t)x + D(t)v] - γ2|v|2 = 0,
где
v(t) = [γ2I - DT(t)D(t)]-1[2-1BT(t)VTx + DT(t)C(t)x]
и нижние индексы t и x обозначают частные производные от функции Белл-
мана по соответствующим переменным. Решением этого уравнения в част-
ных производных является функция в виде квадратичной формы V (t, x) =
= xTQ-1(t)x, где матрица Q удовлетворяет дифференциальному уравнению
Риккати
Q=AQ+QAT+QCTCQ+(BT+DTCQ)T(γ2I-DTD)-1(BT+DTCQ),
(Π.5)
Q(t0) = γ-2R,
в котором для сокращения записи у всех матриц опущен аргумент t. Заме-
тим, что из положительной полуопределенности квадратичных слагаемых в
правой части дифференциального уравнения (Π.5) и положительной опре-
деленности матрицы Q(t0) следует положительная определенность решения,
т.е. Q(t) > 0, t ∈ [t0, tf ], и, следовательно, матрица Q(t) обратима на всем рас-
сматриваемом отрезке.
Обратимся опять к уравнению Беллмана (Π.4), из которого следует, что
вдоль траектории системы (3.1) при любых возмущениях v(t) для найденной
функции Беллмана V (t, x) = xTQ-1(t)x выполняется неравенство
V
(Π.6)
+ |z|2 - γ2|v|2
0,
которое принимает вид квадратичного неравенства ξT 0, ξT = (xT vT)
с отрицательно полуопределенной матрицей
(
)
-Q-1Q˙ Q-1 + ATQ-1 + Q-1A + CTC
M =
BTQ-1 + DTC
-(γ2I - DTD)
Умножая матрицу M слева и справа на положительно определенную матрицу
L = diag(Q I), получим
(
)
-Q˙ + QAT + AQ + QCTCQ
LML =
0.
BT + DTCQ
-(γ2I - DTD)
56
Применяя к последнему неравенству лемму Шура и делая замену Q = γ-2Y ,
получаем матричное неравенство
- Y + AY + Y AT + γ-2Y CTCY +
(Π.7)
+ (BT + γ-2DTCY )T(I - γ-2DTD)-1(BT + γ-2DTCY ) 0,
которое повторным применением леммы Шура приводится к линейному мат-
ричному неравенству (3.5). Заметим далее, что согласно (Π.5) Y (t0) = R. На-
конец, используя неравенство (Π.2), получаем квадратичное неравенство
J (v) = γ2xT(tf )Y-1(tf )x(tf ) > xT(tf )Sx(tf )
или матричное неравенство
(Π.8)
γ2Y-1(tf
) > S,
которое с применением леммы Шура приводится к линейному матричному
неравенству (3.8). Необходимое условие теоремы 3.1 для системы в непрерыв-
ном времени доказано.
Для системы в дискретном времени покажем, что функцией Беллмана
является квадратичная форма V (t, x) = xTQ-1(t)x, где матрица Q(t) удов-
летворяет уравнению
)
(
]-1 (
)
(
)
)(
)
[(Q(t + 1)
B
A
(Π.9)
AT CT
-2
BT DT
-Q-1
(t) = 0
0
I
D
C
с начальным условием Q(t0) = γ-2R. Действительно, уравнение (Π.9) полу-
чено из (Π.4), где минимум достигается при наихудшем возмущении
(
)
(
)
A
v(t) = Γ-1(t + 1)
BT DT
Q-1(t + 1)
x(t).
C
Здесь введены обозначения
(
)
(
)
B
Γ(t + 1) = γ2I -
BT DT
Q-1(t + 1)
> 0,
D
)
( Q-1(t + 1)
Q-1(t + 1) =
0
I
Так как Q(t0) > 0, то матрица, стоящая в квадратных скобках в (Π.9) при
t = t0, является положительно определенной. Следовательно, в силу усло-
вия (3.4) имеем Q(t0 + 1) > 0. Продолжая этот процесс, получим Q(t) > 0
для всех t t0. Далее, поскольку для любого v(t) = v(t) выполняется нера-
венство ΔV + |z|2 - γ2|v|2 0, то с учетом известной формулы обращения
блочной матрицы приходим к следующему неравенству:
(
)
(
)
A
AT CT
Q-1(t + 1)
- Q-1(t) +
C
(Π.10)
(
)
(
)
(
)
(
)
B
A
+
AT CT
Q-1(t+1)
Γ-1(t+1)
BT DT
Q-1(t+1)
0.
D
C
57
После введения новых переменных Y (t) = γ2Q(t), для которых Y (t0) = R, и
применения леммы Шура неравенство (Π.10) преобразуется в (3.6). Необхо-
димое условие теоремы 3.1 в дискретном случае доказано.
Докажем достаточное условие. Пусть линейные матричные неравенства
(3.5) (или (3.6)), (3.8), а также равенство (3.7) разрешимы относительно
Y (t) > 0 при t ∈ [t0, tf ] и γ2 > 0. Тогда непосредственно проверяется, что для
квадратичной формы V = γ2xTY-1(t)x на траекториях системы (3.1) выпол-
няется неравенство
(Π.11)
∂V + |z|2 - γ2|v|2
0.
Интегрируя или суммируя неравенства (Π.11) на отрезке [t0, tf ] и учитывая
(Π.8), получаем, что
[
]
∥z∥2[t
+ xT(tf)Sx(tf) < γ2
∥v∥2[t
+xT0R-1
x0
0,tf]
0,tf]
для любых допустимых возмущений v и начальных условий системы x0. От-
сюда следует γ∞,0 < γ, и это завершает доказательство теоремы 3.1.
СПИСОК ЛИТЕРАТУРЫ
1.
Mäkilä P.M. On Muptiple Criteria Stationary Linear Quadratic Control // IEEE
Trans. Autom. Control. 1989. V. 34. No. 12. P. 1311-1313.
2.
Khargonekar P.P., Rotea M.A. Muptiple Objective Optimal Control of Linear
Systems: the Quadratic Norm Case // IEEE Trans. Autom. Control. 1991. V. 36.
No. 1. P. 14-24.
3.
Баландин Д.В., Бирюков Р.С., Коган М.М. Оптимальное управление макси-
мальными уклонениями выходов линейной нестационарной системы на конеч-
ном интервале времени // АиТ. 2019. № 10. C. 37-61.
Balandin D.V., Biryukov R.S., Kogan M.M. Optimal Control of Maximum Output
Deviations of a Linear Time-Varying System on a Finite Horizon // Autom. Remote
Control. 2019. V. 80. No. 10. P. 1783-1802.
4.
Balandin D.V., Biryukov R.S., Kogan M.M. Finite-Horizon Multi-Objective
Generalized H2 Control with Transients // Automatica. 2019. V. 106. No. 8. P. 27-34.
5.
Баландин Д.В., Коган М.М. Субоптимальные по Парето регуляторы против коа-
лиций возмущений // АиТ. 2017. № 2. С. 3-26.
Balandin D.V., Kogan M.M. Pareto Suboptimal Controllers Versus Coallitions of
Disturbances // Autom. Remote Control. 2017. V. 78. No. 2. P. 197-216.
6.
Bernstein D.S., Haddad W.M. LQG Control with an H Performance Bound: a
Riccati Equation Approach // IEEE Trans. Autom. Control. 1989. V. 34. No. 3.
P. 293-305.
7.
Khargonekar P.P., Rotea M.A. Mixed H2/H Control: a Convex Optimization
Approach // IEEE Trans. Autom. Control. 1991. V. 36. No. 7. P. 824-831.
8.
Zhou K., Glover K., Bodenheimer B., Doyle J. Mixed H2 and H Performance
Objectives I: Robust Performance Analysis // IEEE Trans. Autom. Control. 1994.
V. 39. No. 8. P. 1564-1574.
9.
Doyle J., Zhou K., Glover K., Bodenheimer B. Mixed H2 and H Performance
Objectives II: Optimal Control // IEEE Trans. Autom. Control. 1994. V. 39. No. 8.
P. 1575-1587.
58
10.
Scherer C., Gahinet P., Chilali M. Multiobjective Output-Feedback Control via LMI
Optimization // IEEE Trans. Autom. Control. 1997. V. 42. No. 7. P. 896-911.
11.
Chen X., Zhou K. Multiobjective H2/H Control Design // SIAM J. Control Optim.
2001. V. 40. No. 2. P. 628-660.
12.
Oliveira M.C., Bernussou J., Geromel J.C. A New Discrete-time Robust Stability
Condition // System Control Lett. 1999. V. 37. P. 261-265.
13.
Ebihara Y., Hagiwara T. New Dilated LMI Characterisations for Continuous-
time Control Multi-objective Controller Synthesis // Automatica. 2004. V.
40.
P. 2003-2009.
14.
Hindi H.A., Hassibi B., Boyd S.P. Multi-objective H2/H-Optimal Control via
Finite Dimensional Q-Parametrization and Linear Matrix Inequalities // Proc. 1998
Amer. Control Conf., Philadelphia, USA. 1998. P. 3244-3249.
15.
Гермейер Ю.Б. Введение в теорию исследования операций. М.: Наука, 1971.
16.
Khargonekar P.P., Nagpal K.M., Poolla K.R. H Control with Transients // SIAM
J. Control Optim. 1991. V. 29. No. 6. P. 1373-1393.
17.
Баландин Д.В., Коган М.М., Кривдина Л.Н., Федюков А.А. Синтез обобщенного
H-оптимального управления в дискретном времени на конечном и бесконечном
интервалах // АиТ. 2014. № 1. С. 3-22.
Balandin D.V., Kogan M.M., Krivdina L.N., Fedyukov A.A. Design of generalized
discrete-time H-optimal control over finite and infinite intervals // Autom. Remote
Control. 2019. V. 75. No. 1. P. 1-17.
18.
Баландин Д.В., Коган М.М. Обобщенное H-оптимальное управление как ком-
промисс между H-оптимальным и γ-оптимальным управлениями // АиТ. 2010.
№ 6. С. 20-38.
Balandin D.V., Kogan M.M. Generalized H-optimal Control as a Trade-off between
the H-optimal and γ-optimal Controls // Autom. Remote Control. 2010. V. 71.
No. 6. P. 993-1010.
Статья представлена к публикации членом редколлегии М.В. Хлебниковым.
Поступила в редакцию 27.08.2020
После доработки 15.02.2021
Принята к публикации 16.03.2021
59