Автоматика и телемеханика, № 3, 2022
Стохастические системы
© 2022 г. М.Е. ШАЙКИН, канд. техн. наук (shaykin36@mail.ru)
(Институт проблем управления им. В.А. Трапезникова РАН, Москва)
АНАЛИЗ ДИНАМИЧЕСКОГО РЕГУЛЯТОРА
ПО ВЫХОДНОМУ СИГНАЛУ
ДЛЯ СТОХАСТИЧЕСКИХ СИСТЕМ
МУЛЬТИПЛИКАТИВНОГО ТИПА
Важнейшей нерешенной задачей теории управления является задача
оптимизации мультипликативной стохастической системы в классе регу-
ляторов по выходному сигналу, наблюдаемому в шумах. Регулятор в це-
пи обратной связи должен быть допустимым, т.е. обеспечивать устойчи-
вость замкнутой системы и гарантировать требуемый уровень подавления
внешних возмущений, действующих на регулируемый объект. В статье в
рамках стохастической теории H2/H-управления при наличии помех
решается задача анализа, т.е. нахождения условий существования допу-
стимых регуляторов. Полученные результаты могут использоваться да-
лее в задаче синтеза при условной оптимизации мультипликативной сто-
хастической системы в классе допустимых регуляторов динамического
типа.
Ключевые слова: H2/H-теория управления, диффузионное уравнение
Ито, индуцированная норма оператора, мультипликативная стохастиче-
ская система, регулируемый выходной сигнал, динамический регулятор
по выходному сигналу.
DOI: 10.31857/S0005231022030059
1. Введение
Областью исследования в статье являются сложные стохастические систе-
мы, определенные векторными стохастическими дифференциальными урав-
нениями, при априорных ограничениях на класс регуляторов в цепи обратной
связи от наблюдаемого выходного сигнала на вход регулируемого объекта.
Цель статьи получение условий разрешимости задачи о динамическом ре-
гуляторе в условиях действия внешних возмущений и шумов приборов, реги-
стрирующих выходной сигнал объекта. Объект вырабатывает регулируемый
выходной сигнал, и вредное влияние на этот сигнал внешнего возмущения тем
сильнее, чем больше норма оператора передачи возмущения на регулируемый
выход. Любая задача синтеза регулятора для заданного объекта состоит не
только в том, чтобы минимизировать, например, энергетические затраты на
регулирование, но прежде всего в том, чтобы выбором регулятора обеспечить
54
устойчивость замкнутой им системы и ограничить эффект вредного влияния
внешнего возмущения на полезный регулируемый сигнал, поддерживая этот
эффект в априори заданных пределах. Этим обстоятельством обусловлена
важность задачи анализа условий, при которых такой, называемый допусти-
мым, регулятор существует. Задача анализа, вообще актуальная для теории
и практики управления и достаточно трудная сама по себе, особенно важна
в стохастическом разделе H2/H-теории, где она осложняется стохастиче-
ской природой внешних возмущающих воздействий и шумов измерительных
датчиков.
В рамках теории H2/H-управления задача оптимизации естественно
принимает характер теоретико-игрового взаимодействия природы и кон-
структора регулятора. Плодотворной взаимосвязи теории управления и
теории игр должное внимание уделяется и в оптимизационных задачах
H2/H-управления. В теоретико-игровой постановке внешнее возмущение
оказывается активным игроком, максимизирующим выбранный функционал
потерь.
Классические теории управления LQR и LQG, для детерминизованных
и гауссовских систем соответственно, можно называть теориями безуслов-
ной оптимизации. Современная H2/H-теория является теорией условной
оптимизации, осуществляемой на классе допустимых регуляторов, гаранти-
рующих ограниченность заданным числом γ индуцированной нормы опера-
тора L передачи случайной функции υ(·) ∈ L2([0, T ); L2(Ω, Rl)) внешнего
возмущения υ на случайную функцию z(·) ∈ L2([0, T ); L2(Ω, Rm)) регулируе-
мого выхода z замкнутой системы. Здесь [0, T )
интервал значений па-
раметра t > 0 на конечном (T < ∞) или бесконечном (T = ∞) горизонте;
L2([0,T);D) пространство квадратично интегрируемых функций перемен-
ной t со значениями в пространстве D; L2(Ω, Rm) пространство m-значных
случайных величин на вероятностном пространстве (Ω, F, P) с σ-алгеброй F
и вероятностной мерой P. Индуцированная норма оператора L (в данном
случае на горизонте R+ := [0, ∞)) определяется по формуле
∥z(·)∥L2(R+;L2(Ω,Rm))
∥L =
sup
υ∈L2(R+;L2(Ω,Rl)),υ=0
∥υ(·)∥L2(R+;L2(Ω,Rl))
Норма же на пространстве L2 := L2([0, T ); L2(Ω, Rk)) случайных процессов
T
y(·) = (y(t))t∈[0,T) определяется интегралом
E(∥y(t)∥2)dt < ∞, где E опе-
0
ратор вычисления математического ожидания. Не существует аналитическо-
го способа вычисления индуцированной нормы в общем случае, но возможно
компьютерное вычисление ее с заданной точностью.
Стохастическая H2/H-теория имеет дело со стохастическими объектами,
описываемыми стохастическими уравнениями Ито. В уравнении Ито вида
(1.1)
dx(t) = ϕ(t)dt + Φ(t)dW (t), ϕ = Ax + B1υ + B2
u,
Φ dW = A0xdw0 + B01υdw1 + B02udw2,
55
где x, υ, u векторы состояния, внешнего возмущения и сигнала управле-
ния, диффузионная компонента Φ dW имеет специфическое строение, даю-
щее основание называть уравнение мультипликативным по каждой из этих
трех переменных. Важные результаты по H2/H-теории мультипликатив-
ных систем получены в публикациях [1-9]. C идеями H2/H-теории связаны
и задачи робастного управления. В детерминированном случае эти связи про-
слеживаются в [10-12].
К теме синтеза регуляторов по вектору состояния для мультипликатив-
ных объектов относятся публикации [13, 14]. Важнейшей особенностью при-
нятого в них метода решения является теоретико-игровая формулировка
задачи управления с ее понятием равновесной по Нэшу пары (u, υ) то-
чек, определяющих оптимальное управление u при наименее благоприят-
ном внешнем возмущении υ [15]. Нахождение равновесной пары сводится
к решению системы из двух связанных матричных уравнений Риккати, но
не классических, квадратичных по искомым переменным, а скорее дробно-
рациональных по искомым переменным, и потому названных обобщенными
уравнениями Риккати. Настоящая статья, тоже для стохастического объекта,
имеет целью выяснение структуры регулятора, но не вида u(t) = K(t, x(·)|t0),
как в [13, 14], а регулятора по выходному сигналу u(t) = K(t, y(·)|t0), t > 0.
Аналогичная задача для менее общего объекта, мультипликативного только
по векторам состояния и внешнего возмущения, рассматривалась в [7]. Для
удобства читателя в п. 1 Приложения приведен пример детерминированной
LQG/H-задачи, решение которой имеет структуру оптимального наблюда-
теляx = Ak x + Bky, совмещенного с оптимальным регулятором û = Ck x по
вектору состояния x(·) [16]. Структура допустимого регулятора вида u(t) =
= K(t, x(·)|t0), где x = (x, x) вектор состояния расширенной замкнутой си-
стемы, является более общей. Регулятор по выходу u(t) = K(t, y(·)|t0), рас-
смотренный в [17], является еще более общим.
Изложим содержание статьи по разделам. В разделе 2 дана постановка
задачи. В разделе 3 получено стохастическое уравнение объекта, замкнутого
динамическим регулятором. В разделах 4 и 5 получено обобщенное уравне-
ние Риккати, коэффициенты которого подсчитаны с помощью применения
формулы Ито замены переменной. Необходимое условие допустимости дина-
мического регулятора получено в разделе 6, в разделе 7 достаточное усло-
вие. Два приложения, краткое заключение и список литературы завершают
статью.
2. Постановка задачи анализа
Задача оптимизации мультипликативных систем является разделом тео-
рии H2/H-управления, обобщающей LQ-теорию синтеза регуляторов для
линейных систем по квадратическому критерию. От внешнего возмущения υ
в уравнении Ито (1.1) зависят как снос, так и диффузионная компонента.
Предполагается, что все винеровские процессы wi(t), i = 0, 1, 2, скалярные,
что не является ограничением. Не является ограничением и зависимость сно-
са ϕ(t) и диффузии Φ(t)dW (t) от одного и того же возмущения υ(t). Наконец,
56
процессы wi(t) статистически зависимые, не обязательно с единичной мат-
рицей интенсивности. Используя общий формализм H2/H-теории и специ-
альные обозначения, введенные в [18], удается свести задачу с несколькими
возмущениями к задаче об объекте с одним мультипликативным векторным
возмущением.
Как уже отмечалось в разделе 1, с задачей оптимизации при требовании
одновременного подавления внешних возмущений ассоциируется дифферен-
циальная теоретико-игровая задача, позволяющая найти пару υ, u страте-
гий (наихудшее возмущение, наилучшее управление). Для постановки зада-
чи о дифференциальной игре рассмотрим стохастическое дифференциальное
уравнение Ито вида
dx(t) = (Ax(t) + B1υ(t) + B2u(t))dt + A0x(t)dw0(t) +
+ B01υ(t)dw1(t) + B02u(t)dw2(t), x0 ∈ Rn,
(2.1)
Σ:
z(t) = C1x(t) + D11υ(t) + D12u(t),
y(t) = C2x(t) + D21υ(t), t ∈ [0,T].
Уравнение описывает стохастический объект Σ. В этом объекте векторы
u, υ входные сигналы, представляющие управление и внешнее возмущение;
векторы z, y
сигналы выходные, называемые соответственно регулируе-
мым и наблюдаемым выходом. Регулятором в цепи обратной связи является
детерминированная динамическая система с вектором состояния x, заданная
уравнениями
(2.2)
dx(t) = Ak x(t)dt + Bk y(t)dt, u(t) = Ck x(t) + Dk
y(t)
c матричными коэффициентами, пока не определенными. См. п. 2 Приложе-
ния.
Теоретико-игровая формулировка задачи управления предполагает зада-
ние пары функционалов JT1 (u, υ), JT2 (u, υ) и нахождение пары функций u, υ
таких, что (i) JT1 (u, υ) ≤ JT1 (u, υ) на траекториях xt = xt(x0, u, υ) урав-
нения Σ и (ii) JT2 (u, υ) ≥ JT2 (u, υ) на его траекториях xt = xt(x0, u, υ).
Такая пара (u, υ), если она существует, и является равновесной по Нэшу
точкой теоретико-игровой задачи. Можно сказать, выражаясь кратко, что
определение функции υ(·) есть задача анализа, а определение u(·) задача
синтеза. В более подробном изложении задача анализа состоит в нахождении
условий допустимости регулятора и преобразования их к виду, удобному для
получения обобщенного матричного уравнения Риккати, через решение ко-
торого выражается искомое представление возмущения υ. Условие допусти-
мости для задачи на конечном горизонте t ∈ [0, T ] вытекает из требования
∥L < γ к замкнутой системе, которому должен удовлетворять регуля-
тор. Конечная цель анализа состоит в описании класса допустимых регу-
ляторов. На бесконечном горизонте t ∈ [0, ∞) к требованию ограниченности
∥L < γ добавляется условие устойчивости замкнутой системы. В этой
статье ограничиваемся случаем конечного горизонта T < ∞.
57
3. Уравнение объекта, замкнутого динамическим регулятором
Вектор состояния системы, замкнутой регулятором, обозначим через x, по-
лагая x := (x, x). Стохастическое уравнение для x получается как результат
некоторых громоздких, но элементарных вычислений, и нетрудно убедиться,
что функции t → x(t), t → z(t) должны удовлетворять уравнениям
dx(t) = Aclx(t)dt + Bclυ(t)dt + A0clx(t)dw0(t) +
(3.1)
Σ2 :
+ B0clυ(t)dw1(t) + A1clx(t)dw2(t) + B1clυ(t)dw2(t),
z(t) = Ccl x(t) + Dclυ(t), t ∈ [0, T ].
Непосредственно устанавливаются формулы, выражающие коэффициенты
уравнений замкнутой системы Σ2. Прежде всего заметим, что
u(t) = Ck x(t) + Dk(C2x(t) + D21υ(t)),
z(t) = C1x(t) + D11υ(t) + D12(DkC2x(t) + Ck x(t) + DkD21υ(t)),
откуда z(t) = Ccl x(t) + Dclυ(t), где
(3.2)
Ccl = [C1 + D12DkC2, D12Ck], Dcl = D11 + D12DkD21
(здесь Ccl блочная 1 × 2 матрица). Далее получаем, что
)
(D
kC2
O
(B01)
(DkD21)
(3.3)
A1
=B02
,
B0cl =
,
B1
=B02
cl
cl
O Ck
O
O
Блочные матрицы Acl, A0cl, B0cl, Bcl равны:
)
(A + B
2DkC2 B2Ck
(A0 O)
Acl =
,
A0cl =
,
BkC2
Ak
O O
)
(B
01
(B1 + B2DkD21)
B0cl =
,
Bcl =
O
BkD21
Матрицы Acl, Bcl, Ccl, Dcl получают представление через матрицу
)
(A
Mk =k Bk
Ck Dk
параметров динамического регулятора. Соответствующие формулы имеют
вид аффинных относительно Mk соотношений
(3.4)
Acl = A0 + BIMkCI, Bcl = B0 + BIMkD021,
(3.5)
Ccl = C0 + D012MkCI, Dcl = D11 + D012MkD021
58
с матричными коэффициентами
(
)
(
)
A O
B1
A0 =
,
B0 =
,
C0 = (C1,O), D012 = (O,D12),
O O
O
(3.6)
(
)
(
)
(
)
O B2
O I
O
BI
=
,
CI =
,
D021 =
I O
C2
O
D21
Стохастический объект Σ2 является здесь мультипликативным не только по
векторам состояния и внешнего возмущения, но и по вектору управления;
а на вход регулятора подается теперь не вектор состояния объекта, а его
выходной сигнал y(·), см. (2.1), измеряемый в шумах; наконец, регулятор
берется не безынерционным, а динамическим (2.2) с вектором внутреннего
состояния x, определяемым некоторым дифференциальным уравнением.
4. Применение формулы Ито замены переменной
Дальнейшие преобразования имеют целью получить обобщенное уравне-
ние Риккати, ассоциированное с системой (3.1) и функционалом υ → JT2 (u, υ),
которое позволит представить наихудшее возмущение υ через решение урав-
нения Риккати. Эти преобразования связаны с применением формулы Ито
замены переменной (точнее, следствия из формулы Ито) в стохастическом
исчислении. Если
dx(t) = ϕ(t)dt + Φ(t)dw(t)
уравнение состояния и Ls дифференциальный оператор вида
(
)
(Lsf)(t, x) = ∂tf(t, x)ϕ(s, x) + 1/2 tr
2¯x¯xf(t, x)ν(t)
,
где ν(t)dt = var(Φ(t, x(t))d w(t)|x(t)), то согласно формуле Ито имеет место
интегральное соотношение [19-21]
t
(4.1)
Ef(t, x(t)) - Ef(0, x(0)) = E
(∂/∂s + Ls
)f(s, x(s))ds,
0
где E - оператор осреднения. В рассматриваемом здесь конкретном случае
функции f в виде квадратичной формы f(t, x) = 〈x, P (t)x〉 и уравнения Ито
(3.1), представленного в интегральном виде
t
(4.2)
x(t) = x(0) + (Acl x(s) + Bclυ(s))ds +
0
t
t
(w0(s))
(w2(s))
+
[A0cl x(s) B1clυ(s)]d
+
[A1cl x(s) B0clυ(s)]d
,
t ∈ [0,T],
w2(s)
w1(s)
0
0
59
сумму подынтегральных диффузионных компонент в (4.2) запишем в ви-)
(
(
)
w0
w2
де ΦdW := Φ1dW1 + Φ2dW2, где W1 =
, W2 =
. Пусть Qijdt =
w2
w1
= E[dWidW′j], i, j = 1, 2, матрицы 2 × 2 и
[
]
[
]
(4.3)
Φ1 =
A0clx B1clυ
,
Φ2 =
A1clx B0clυ
Обозначим матрицы интенсивности винеровских процессов через
)
)
)
(q
00
q02
(q22 q12
(q02 q01
q1 := Q11 =
,
q2 := Q22 =
,
Q12 =
q02
q22
q12
q11
q22
q12
Подынтегральная функция в (4.1) принимает вид
(4.4)
(∂/∂s + Ls)f(s, x(s)) = 〈x(s),P (s)x(s)〉 +
+ 2〈P (s)x(s), Ax(s) + B1υ(s)〉 + 1/2 tr{2P (s)ν(s)},
где
(
)
∑∑
ν(s)ds = var
Φ1(s)dW1(s) + Φ2(s)dW2(s)|x(s)
=
Φi(s)QijΦ′j(s).
i=1 j=1
В правой части (4.4) первое слагаемое есть квадратичная форма перемен-
ной x(s) и
˙P(s)
матрица этой формы; второе слагаемое квадратичная
форма на пространстве значений пары переменных (x(s), υ(s)). Вычислим
третье слагаемое tr{P (s)ν(s)}.
Для первого cлагаемого (при i = j = 1) в двойной сумме имеем
{
}
(4.5) tr
Φ′1(s)P(s)Φ1(s)q1(s)
=
}
)
{( x(s)(A0
)
[
]
cl
= tr
P (s)
A0clx B1clυ(s)
q1(s)
=
υ(s)(B1cl)
(
*(
)
1
x(s)
q00(A0cl)P(s)A0cl q02(A0cl)P(s)B
)(x(s))+
cl
=
,
υ(s)
q02(B1cl)P(s)A0cl q22(B1cl)P(s)B1
υ(s)
cl
Аналогично
{
}
(4.6) tr
Φ′2(s)P(s)Φ2(s)q2(s)
=
}
)
{( x(s)(A1
)
[
]
cl
= tr
P (s)
A1clx B0clυ(s)
q2(s)
=
υ(s)(B0cl)
(
*(
)
0
x(s)
q22(A1cl)P(s)A1cl q12(A1cl)P(s)B
)(x(s))+
cl
=
,
υ(s)
q12(B0cl)P(s)A1cl q11(B0cl)P(s)B0
υ(s)
cl
60
Продолжая вычисления, имеем (при i = 1, j = 2)
{
}
(4.7) tr
Φ′2(s)P(s)Φ1(s)Q12(s)
=
}
)
{( x(s)(A1)
[
]
0
= tr
P (s)
A0clx B1clυ(s)
Q12(s)
=
υ(s)(B0cl)
(
*(
)
1
x(s)
q02(A1cl)P(s)A0cl q22(A1cl)P(s)B
)(x(s))+
cl
=
,
υ(s)
q01(B0cl)P(s)A0cl q12(B0cl)P(s)B1
υ(s)
cl
и аналогично
{
}
(4.8) tr
Φ′1(s)P(s)Φ2(s)q2(s)
=
}
)
{( x(s)(A0
)
[
]
cl
= tr
P (s)
A1clx B0clυ(s)
Q21(s)
=
υ(s)(B1cl)
(
*(
)
0
x(s)
q02(A0cl)P(s)A1cl q22(A0cl)P(s)B
)(x(s))+
cl
=
,
υ(s)
q01(B1cl)P(s)A1cl q12(B1cl)P(s)B0
υ(s)
cl
Сумму четырех блочных 2 × 2 матриц в формулах (4.5)-(4.8) обозначим
через S(P ). Блочные элементы Sij этой суммарной матрицы равны
S11 = q00(A0cl)P(s)A0cl + q02(A0cl)P(s)A1cl + q02(A1cl)P(s)A0cl +
(4.9)
+ q22(A1cl)P(s)A1cl,
S12 = q01(A0cl)P(s)B0cl + q12(A1cl)P(s)B0cl + q02(A0cl)P(s)B1cl +
+ q22(A1cl)P(s)B1cl,
S22 = q11(B0cl)P(s)B0cl + q12(B0cl)P(s)B1cl + q12(B1cl)P(s)B0cl +
+ q22(B1cl)P(s)B1cl
и, разумеется, S21 = S′12.
В правой части (4.4) последний член, как и второй, тоже есть квадратич-
ная форма на пространстве переменных (x, υ), и их сумма задана матрицей
D(P ) + S(P ), где D(P ) - матрица второй квадратичной формы в (4.4). Полу-
ченные формулы используются при выводе обобщенного уравнения Риккати
в разделе 6.
5. Функционал потерь в задаче анализа
Проверка условия ∥L < γ в требовании допустимости решения была
бы простой, если бы существовал явный способ вычисления индуцирован-
ной нормы оператора L. Однако такого способа не существует. Проверку
61
условия ∥L < γ без вычисления нормы ∥L можно осуществить, при-
влекая к рассмотрению функционал
T
(5.1)
JT2 (u,υ) = E (γ2υ(t)υ(t) - z
(t)z(t))dt
0
при фиксированном u = u. Этот функционал квадратичный, но не знако-
определенный, и для него существует представление, удобное для последую-
щего анализа:
(5.2) JT2 (u, υ) = E〈x(0), P (0)x(0)〉 - E〈x(T ), P (T )x(T )〉 +
T
(
)
(x(t))
(x(t))
˙
+E
〈x(t),P
(t)x(t)〉 +
, M(γ, P (t))
dt,
υ(t)
υ(t)
0
где M(γ, P ) := S(P ) + D(P ) + C. Здесь
(
)
(
)
PAcl + AclP PBcl
-C′clCcl
-C′clDcl
(5.3)
D(P ) =
,
C =
,
B′clP
O
−D′clCcl γ2I - D′clDcl
а матрица S(P ) определена своими блоками (4.9) в разделе 4.
Важность функционала JT2 в H-теории состоит в том, что с его помо-
щью можно дать необходимое условие допустимости регулятора. Согласно
лемме 2.10 из публикации [7] из условия ∥L < γ (и требования внутрен-
ней устойчивости системы, если последняя рассматривается на бесконечном
горизонте) вытекает неравенство JT2 (υ) ≥ -c|x(0)|2 для некоторого регуля-
тора K и некоторого числа c > 0 при любых υ ∈ L2[0, T ] (x(0) - произволь-
ное начальное условие для уравнения состояния системы). Это неравенство
в случае стационарной системы используется в [7] при доказательстве важ-
ного характеристического свойства индуцированной нормы оператора L.
Именно: для любого числа γ > 0 равносильны утверждения (i) ∥L < γ и
(ii) существует матричная функция P (·) < 0 такая, что M(P ) > 0. Матрич-
ное обобщенное уравнение Риккати, которому удовлетворяет функция P (t),
выводится далее в разделе 6.
6. Обобщенное уравнение Риккати
Из исходной системы Σ, см.(2.1), в разделе 3 была получена система (3.1),
обозначенная через Σ2. В системе Σ2 нет в явном виде сигнала u(t), но есть
внешнее возмущение υ(t). Для систем такого вида в H2-теории cтандартным
является критерий JT2 (u, υ) в (5.1), неявно зависящий от u, где в формуле
для z(t), приведенной в (2.1), полагают D12 = 0. Заметим, что система Σ2
в (3.1)
такого именно вида. Таким образом, для системы Σ2 можно в си-
лу (3.2) принять, что
T
(
)
(6.1)
JT2 (u,υ) = E
γ2I - (Cclx(t) + Dclυ(t))(Cclx(t) + Dclυ(t))
dt.
0
62
Функционал JT2 (u, υ), квадратичный по исходным переменным x, υ, остается
квадратичным и по новым переменным x, υ. Далее, решая LQ-задачу вычис-
ления экстремального значения υ переменной υ, воспользуемся одним про-
стым тождеством, применявшимся в [14]. Приведем его здесь. Рассмотрим
представление критерия JT2 (u, υ) в виде (5.1), считая, что x(t) в подынте-
гральном выражении есть решение уравнения (3.1), полученное при фикси-
рованном u = u.
Лемма. Квадратичная форма с матрицей M(γ,P(t)), т.е. сумма
〈x,M11x〉 + 〈x,M12υ〉 + 〈υ,M21x〉 + 〈υ,M22υ〉,
записывается в виде
(6.2)
〈x,(M11 + M12F)x〉 + 〈υ - F x,M22
(υ - F x)〉,
где матрица F определяется соотношением M21 + M22F = 0. Если M22 -
неособенная матрица, то F = -M-122M21 и υ = F x - экстремальная точка
функционала JT2 (u, υ).
Утверждение леммы относительно υ(t) справедливо при фиксированном
u = u, но оно верно при любом допустимом управлении u(·), обеспечиваю-
щем устойчивость замкнутой системы и ограниченность заданным числом γ
индуцированной нормы оператора L на классе функций υ(·) с интегрируе-
мым квадратом. Обозначения M(γ, P ), Mγij , введенные выше, естественны,
поскольку от γ зависит матрица Mγ22 = γ2I + S22(P ) - D′clDcl. Из леммы сле-
дует, что
(
)-1 (
)
(6.3)
υ = -
γ2I + S22(P) - D′clDcl
B′clP + S21(P) - D′clCcl
x,
если матрица Mγ22(P ) обратима. Согласно лемме при υ = F x в (6.2) матрич-
ная функция P (t) определяется как решение матричного дифференциального
уравнения
˙
P
+ M γ11(P) - M γ12(P)(M γ22)-1(P)M γ21
(6.4)
(P ) = 0, P (T ) = 0, t ∈ [0, T ].
В подробной записи имеем
(6.5)
-P˙ = PAcl + A′clP + Sγ11(P) - C′clCcl -
- (P Bcl + S12(P )- C′clDcl)(γ2I + S22(P )- D′clDcl)-1(B′clP + S21(P )- D′clCcl).
Начальным условием является P (T ) = 0. Функции Sij(P ), определенные
в (4.9), линейно зависят от P .
Полученными результатами исчерпывается формальная проблема анали-
за, если решение обобщенного матричного дифференциального уравнения
Риккати (6.5) для P (t) существует. Следующий этап это проблема суще-
ствования решения уравнения (6.5), т.е. определения условий допустимости
динамического регулятора вида (2.2).
63
7. Условия допустимости регулятора
В теории управления с безынерционным регулятором по вектору состоя-
ния задача определения структуры оптимального регулятора ставится как
оптимизационная с применением критерия JT1 (u, υ) при фиксированном зна-
чении υ наименее благоприятного возмущения υ. В рассматриваемом случае
структура регулятора уже предопределена уравнениями в (2.2), и только зна-
чения матричных параметров следует определить исходя из условия допусти-
мости регулятора такой структуры. Критерий допустимости сформулируем
как условие существования точки минимума функционала (-1)JT2 (υ), квад-
ратичного, но не знакоположительного. Предполагаем заданным значение
параметра γ > 0, а функционал JT2 (υ) - представленным в виде (4.2) с мат-
рицей M(γ, P ) = S(P ) + D(P ) + C подынтегральной квадратичной формы.
Как уже отмечалось в разделе 5, условие допустимости ∥L < γ равно-
сильно существованию отрицательно определенной функции P (t) < 0 такой,
что M(γ, P (t)) > 0 для всех t ∈ [0, T ]. Для последующего удобно записать
условие M(γ, P ) > 0 в эквивалентной форме, заменив блочно-диагональную
матрицу diag{M(P ), I} блочной 3 × 3 матрицей T N (P )T > 0, где
PAcl +A′clP +S11 PBcl +S12 C′cl
I O
-C′cl
N (P ) =
 B′clP + S21
γ2I + S22 D′cl, T =
O I
-D′cl.
Ccl
Dcl
I
O O I
Подставим в матрицу N (P ) выражения для коэффициентов Acl, Bcl, . . ., по-
лученные в (3.4). Тогда для блоков-подматриц Nij неотрицательно опреде-
ленной матрицы N (P ) получим формулы:
(
)
(
(7.1) N11 = P
A0 + BIMkCI
+
A0 + BIMkCI
) P + S11,
(
)
(
)
N12 = P
B0 + BIMkD021 + S12
,
N13 =
C0 + D012MkCI
,
(
)
N22 = γ2I + S22, N23 =
D11 + D012MkD021
,
N33 = I.
Представим матрицу N(P ) в виде суммы матрицы H, от Mk не зависящей,
и двух матриц, линейно зависящих от Mk. Получим сумму H + QM′kR +
+RMkQ с некоторыми матрицами Q и R и неотрицательно определенной
матрицей H. Согласно полученному в [7] стохастическому обобщению леммы
о проекции из теории линейных матричных неравенств (см., например, [6])
линейное матричное неравенство
(7.2)
H+QM′kR+RMk
Q>O
имеет решение Mk тогда и только тогда, когда матрица H является поло-
жительно определенной на нулевых подпространствах kerQ и kerR мат-
риц Q, R.
Лемма о проекции дает необходимое и достаточное условие выполнимо-
сти условия ∥L < γ. Условие формулируется не на языке теории мат-
ричных дифференциальных уравнений, а на языке нелинейных матричных
64
неравенств. Лемма не только решает вопрос об условиях допустимости ре-
гулятора Mk, но и позволяет вычислить значения Ak, Bk, Ck, Dk параметров
регулятора, если они неизвестны. Далее в п. 2 Приложения приводится част-
ное решение задачи идентификации параметров регулятора, допустимого в
рамках представлений H-теории управления.
8. Заключение
Областью исследований в статье явилась H-теория управления стоха-
стическими системами, определенными стохастическими дифференциальны-
ми уравнениями Ито, диффузионная компонента каждого из которых за-
дана суммой A0xdw0 + B01υdw1 + B02udw2, в которой матрицы A0, B01, B02
известны, а интенсивности винеровских процессов xw0, υw1, uw2 определены
соответственно вектором состояния x, внешним возмущением υ и управлени-
ем u. Векторы x, υ неизвестны, вектор u поступает с выхода H-регулятора
и обеспечивает поддержание в заданных пределах вредного действия воз-
мущения на регулируемый выходной сигнал объекта управления. Взаимные
интенсивности qij, i = j, винеровских процессов wi, i = 0, 1, 2, удобно считать
ненулевыми, если из общей модели желательно исключить некоторые из про-
цессов wi(t) для получения частных стохастических моделей. Таким образом,
рассмотренная в статье модель мультипликативного стохастического объекта
является довольно общей, чего нельзя, к сожалению, утверждать о принятой
здесь модели регулятора по выходному сигналу. Действительно, в детерми-
нированном варианте H-теории регулятор по выходному сигналу получа-
ется представленным в виде регулятора по cостоянию x некоторой вспомо-
гательной системы, осуществляющей фильтрацию ненаблюдаемого вектора
состояния x исходной системы по измеряемому выходному сигналу. См. п. 1
Приложения. С другой стороны, в представленной статье искомому регулято-
ру по выходному сигналу a priori навязывается (см. п. 2 Приложения) такая
же, как и в детерминированном случае, структура фильтра, вырабатывающе-
го оценку x неизвестного сигнала x, подаваемую затем на регулятор частно-
го вида, а именно на регулятор по состоянию. Структура же общего вида
регулятора по выходному сигналу для мультипликативной стохастической
системы остается, по существу, неизвестной.
Несмотря на отмеченную особенность постановки задачи об H-регуля-
торе, принятую в статье, эта задача представляется важной и интересной.
Эта задача важна для поиска общей структуры допустимого регулятора и
представляет самостоятельный интерес в качестве необходимого этапа при
решении последующей более трудной задачи синтеза cубоптимального регу-
лятора.
ПРИЛОЖЕНИЕ
1. В H2/H-теории оптимального регулятора по выходному сигналу рас-
сматривается линейный объект x = Ax + Bυ1 + Bu c регулируемым сигналом
z = (z1,z2), z1 = Cx, z2 = u и наблюдаемым выходным сигналом y = Cx + υ2.
65
Возмущение υ = (υ1, υ2) является гауссовским белым шумом с нулевым сред-
ним и единичной спектральной плотностью (для простоты употребляем обо-
значение υ = (υ1, υ2) вместо более сложного υ = [υ′1, υ′2]; то же для z). Кри-
терий для регулятора - квадратический,
T
1
J (u, υ) = lim
E
(〈x(t), CCx(t)〉 + 〈u(t), u(t)〉)dt.
T→∞
T
0
Существуют неотрицательно определенные решения P1, P2 уравнений регу-
лятора и фильтра соответственно:
(
)
AP1 + P1A -
1-γ-2
P1BBP1 + CC = 0,
(
)
AP2 + P2A -
1-γ-2
P2CCP2 + BB = 0.
(
)-1
Определим Z :=
I-γ-2P2P1
. Регулятор Mk = (Ak, Bk, Ck) (с коэффици-
ентом Dk = 0) в цепи обратной связи имеет структуру регулятора по состоя-
нию u = Ck x = -BP1Z x, где x есть вектор состояния оптимального наблю-
дателя
(
)
x=Ak x + Bky =
A - (1 - γ-2)P2CC - BBP1Z
x+P2Cy.
Решение, приведенное в п. 1 Приложения, получено в [15]. Оно является след-
ствием изложенной в статье теории, если применить ее к детерминированно-
му объекту и рассмотреть предельный случай γ → ∞.
2. Задача о регуляторе по измеряемому в шумах выходному сигналу объ-
екта, мультипликативного по вектору состояния и вектору внешнего возму-
щения, завершается идентификацией параметров регулятора. В [7] для объ-
екта, который не предполагался мультипликативным по вектору управления,
значения Mk параметров регулятора вычислялись с помощью решения мат-
ричного неравенства (7.2). Без ограничения общности принимались предпо-
ложения так называемого регулярного случая [5]
D11 = 0, D′12D12 = I, D21D′21 = I, D′12C1 = 0, D21B′1 = 0.
В предположении Pcl > 0 вводятся обозначения
)
)
(S N)
(R M
11 Π12
Pcl =
,
P-1
=
,
M11(γ,Pcl) =
cl
N Q
M T
Π′12
Π22
Матрицы S и R эрмитовы, являются матрицами квадратичных форм в
пространстве состояний вектора x(t). Матрица S удовлетворяет матричному
линейному неравенству Риккати (неравенству наблюдателя, или фильтра),
матрица R квадратичному неравенству регулятора. Неравенство для S -
автономное, неравенство для R зависит от S. В итоге анализа, проведенного
66
в [7], выясняется, что условию допустимости регулятора Mk удовлетворя-
ют следующие значения его параметров (при выборе N = R-1 - S = -Q для
матрицы Pcl):
(
)-1
Bk = γ2
R-1 - S
C′2, Ck = B′2R-1, Dk = 0,
[
Ak = - N-1 SB2B′2R-1 + AN -
]
(
)(
-
SB1 + q12A′0SB0
γ2I + q22B′0SB0
)-1 B′1N + Π11
СПИСОК ЛИТЕРАТУРЫ
1.
McLane P.J. Optimal Stochastic Control of Linear Systems with State and Control-
Dependent Disturbances // IEEE Trans. Automat. Control.
1971. V. AC-16.
P. 292-299.
2.
Willems J.L., Willems J.S. Feedback Stabilizability for Stochastic Systems with
State and Control Dependent Noise // Automatica. 1976. V. 12. P. 277-283.
3.
Krylov N.V. Introduction to the Theory of Diffusion Processes // Providence. 1995.
RI. Amer. Math. Soc.
4.
Крылов Н.В. Управляемые процессы диффузионного типа. М.: Изд-во Наука,
1977.
5.
Doyle J., Glover K., Khargonekar P.P., Francis B. State Space Solutions to Standard
H2 and H Control Problems // IEEE Trans. Automat. Control. 1989. V. AC-34.
P. 831-847.
6.
Gahinet P., Apkarian P. A Linear Matrix Inequality Approach to H Control //
Int. J. Robust Nonlin. Control. 1994. V. 4. P. 421-448.
7.
Hinrichsen D., Pritchard A.J. Stochastic H // SIAM J. Control Optim.
1998.
V. 36. No. 5. P. 1504-1538.
8.
Petersen I.R., Ugrinovsky V.A., Savkin F.V. Robust Control Design Using H-
methods. London: Springer, 2006.
9.
Gershon E., Shaked U., Yaesh I. H-control and Estimation of State-multiplicative
Linear Systems // Lect. Notes in Control and Information Sciences. 2005. V. 318.
London.
10.
Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных
матричных неравенств. М.: Физматлит, 2007.
11.
Поляк Б.Т., Хлебников М.В., Щербаков П.С. Управление линейными система-
ми при внешних возмущениях. Техника линейных матричных неравенств. М.:
ЛЕНАРД, 2014.
12.
Dragan V., Morozan T., Stoica A.M. Mathematical methods in robust control of
linear stochastic systems / Mathematical concepts and methods in science and en-
gineering. SPRINGER, 2006.
13.
Шайкин М.Е. Синтез оптимального по состоянию регулятора, робастного к
внешним возмущениям для одного класса нестационарных стохастических си-
стем // АиТ. 2015. № 7. С. 122-134.
Shaikin M.E. Design of optimal state controller robust to external disturbance for
one class of nonstationary stochastic systems // Autom. Remote Control.
2015.
V. 76. No. 7. P. 1242-1251.
67
14. Шайкин М.Е. Мультипликативные стохастические системы. Оптимизация и
анализ // Дифференциальные уравнения. 2017. Т. 53. № 3. С. 391-406.
Shaikin M.E. Multiplicative Stochastic Systems: Optimization and Analysis // Dif-
ferential Equations. 2017. V. 53. No. 3. P. 1-16.
15. Limebeer D.J.N., Anderson B.D.O., Khargonekar, Green M. A Game Theretic Ap-
proach to H Control for Time-Varying Systems // SIAM J. Control Optim. 1992.
V. 30. P. 262-283.
16. Mustafa D., Glover K. Minimum entropy H control. Berlin: Springer-Verlag, 1990.
17. Ugrinovskii V.A. Robust H-Control in the Presense of Stochastic Unsertainty //
Int. J. Control. 1998. V. 71. No. 2. P. 219-237.
18. Шайкин M.E. Мультипликативные стохастические системы с несколькими
внешними возмущениями // АиT. 2018. № 2. С. 122-134.
Shaikin M.E. Multiplicative Stochastic Systems with Multiple External Distur-
bances // Autom. Remote Control. 2018. V. 79. No. 2. P. 300-310.
19. Kallianpur G. Stochastic Filtering Theory. N.Y.-Heidelberg-Berlin: Springer-
Verlag, 1980.
20. Булинский А.В., Ширяев А.Н. Теория случайных процессов. М.: Физматлит,
2003.
21. Вентцель А.Д. Курс теории случайных процессов. М.: Наука, 1975.
Статья представлена к публикации членом редколлегии М.В. Хлебниковым.
Поступила в редакцию 22.02.2021
После доработки 29.10.2021
Принята к публикации 20.11.2021
68