Автоматика и телемеханика, № 4, 2023
Стохастические системы
Автор посвящает эту статью
светлой памяти своего учителя и друга
Бориса Теодоровича Поляка
© 2023 г. М.В. ХЛЕБНИКОВ, д-р физ.-мат. наук (khlebnik@ipu.ru)
(Институт проблем управления им. В.А. Трапезникова РАН, Москва;
Национальный исследовательский университет
“Московский физико-технический институт”)
СРАВНЕНИЕ ГАРАНТИРУЮЩЕГО
И КАЛМАНОВСКОГО ФИЛЬТРОВ1
Предлагается новый подход к задаче фильтрации при произвольных
ограниченных внешних возмущениях, основанный на ее сведении к за-
даче оптимизации. Подход обладает невысокой вычислительной сложно-
стью, предполагая на каждом итерационном шаге лишь решение уравне-
ний Ляпунова. При этом его преимуществами, существенными с инже-
нерно-практической точки зрения, являются возможность ограничения
величины матрицы фильтра, а также возможность строить оптимальные
матрицы фильтра по каждой из координат вектора состояния системы в
отдельности.
Выписан градиентный метод для отыскания матрицы фильтра. Как
показывают примеры, предлагаемая рекуррентная процедура является
весьма эффективной и приводящей к вполне удовлетворительным резуль-
татам. Статья продолжает серию работ, посвященную синтезу обратной
связи в задачах управления с позиций оптимизации.
Ключевые слова: линейная система, внешние возмущения, фильтрация,
фильтр Калмана, наблюдатель Люенбергера, оптимизация, уравнение
Ляпунова, градиентный метод, метод Ньютона, сходимость.
DOI: 10.31857/S0005231023040050, EDN: QIBUNX
1. Введение
Классическая постановка задачи фильтрации (т.е. оценки состояния ди-
намической системы по измерениям) при случайных возмущениях допускает
практически исчерпывающее решение с помощью фильтра Калмана [1]; см.
подробнее монографию [2], а также [3]. Однако часто известно лишь, что все
возмущения являются ограниченными, а в остальном произвольными; в этом
1 Исследование выполнено при частичной финансовой поддержке Российского научного
фонда (проект № 21-71-30005), https://rscf.ru/project/21-71-30005/
64
случае можно строить гарантирующие (а не вероятностные) оценки состоя-
ний. В начале 1970-х гг. в работах Швеппе [4], Куржанского [5] и Черно-
усько [6] была развита эллипсоидальная техника фильтрации. Позже в [7, 8]
рассматривалась проблема фильтрации с ограниченными неслучайными воз-
мущениями для стационарных задач: искалась оценка состояния такая, что
ее ошибка гарантированно заключена в единый эллипсоид для всех моментов
времени, т.е. оценка является равномерной, а сам фильтр искался в классе
линейных стационарных фильтров. В этом классе задач и оценок проблема
оказалась полностью разрешимой: удалось построить оптимальный фильтр
и оценку состояния. С технической точки зрения в [7, 8] был применен аппа-
рат линейных матричных неравенств (ЛМН) [9], а исходная задача сведена к
параметрической задаче полуопределенного программирования. Системати-
ческое изложение этой техники можно найти в монографии [10].
С другой стороны, в последнее время стал очень популярным подход к за-
дачам управления линейными системами как к задачам оптимизации, однако
обоснование подобных методов появилось лишь недавно, см. [11-15]. В [16] по-
добный подход был впервые применен к задачам с внешними возмущениями,
в [17] — к задаче синтеза обратной связи по выходу при помощи наблюдателя,
а в [18] — к задаче синтеза ПИД-регуляторов.
Настоящая статья, цель которой состоит в упрощении алгоритма вычис-
ления гарантирующего фильтра и его численном сравнении с фильтром Кал-
мана, продолжает обе эти линии исследований. В ней предлагается оптимиза-
ционный алгоритм решения задачи фильтрации при неслучайных ограничен-
ных внешних возмущениях. Он обладает невысокой вычислительной сложно-
стью, предполагая на каждом итерационном шаге лишь решение уравнений
Ляпунова. При этом существенным с инженерно-практической точки зрения
преимуществом предлагаемого подхода по сравнению с ЛМН-подходом явля-
ется возможность ограничения величины матрицы фильтра. Как показыва-
ют примеры, предлагаемая рекуррентная процедура является эффективной
и приводящей к вполне удовлетворительным результатам.
При этом важно отметить, что в отличие от фильтра Калмана в рамках
предлагаемого подхода оказывается возможным строить оптимальные мат-
рицы фильтра по каждой из координат вектора состояния системы в отдель-
ности.
Структура статьи следующая: раздел 2 содержит постановку задачи, в
разделе 3 обсуждается предлагаемый подход к построению гарантирующего
фильтра, в разделе 4 приводится и обосновывается алгоритм вычисления
оптимальной матрицы фильтра, раздел 5 посвящен непрерывной постановке
задачи, раздел 6 содержит описание и обсуждение результатов вычислений
для нескольких примеров, в заключении обсуждаются возможные обобщения
полученных результатов.
Всюду далее | · | — евклидова норма вектора, ∥ · ∥ — спектральная нор-
ма матрицы, ∥ · ∥F — фробениусова норма матрицы,T — символ транспо-
65
нирования, tr — след матрицы, 〈·, ·〉 — скалярное произведение Фробениуса
для матриц, I — единичная матрица соответствующей размерности, λi(A) —
собственные значения матрицы A, σi(A) — сингулярные числа матрицы A,
а σ(A) = - maxRe (λi(A)) — степень устойчивости гурвицевой матрицы A,
i
ρ(A) = maxi(A)| — спектральный радиус шуровской матрицы A. Все мат-
i
ричные неравенства понимаются в смысле знакоопределенности матриц.
2. Постановка задачи
Рассмотрим систему в дискретном времени
xk+1 = Axk + B1uk + D1wk,
(1)
yk = Cxk + B2uk + D2wk,
zk = C1xk,
где A ∈ Rn×n, B1 Rn×p, B2 Rℓ×p, C ∈ Rℓ×n, C1 Rr×n, D1 Rn×m,
D2 Rℓ×m, с состоянием xk Rn, начальным условием x0, входом uk Rp,
наблюдаемым выходом yk R, оцениваемым выходом zk Rr и внешним
возмущением (шумом) wk Rm, ограниченным в каждый момент времени:
|wk| 1
для всех k = 0, 1, . . . ;
пара (A, D1) управляема, пара (A, C) наблюдаема.
Пусть состояние xk системы недоступно измерению и информация о систе-
ме предоставляется ее выходом yk. Для оценивания выхода zk будем использо-
вать фильтр, описываемый линейным разностным уравнением относительно
оценки состояния xk:
(2)
xk+1 = Axk + B1uk + L(yk - Cxk - B2uk),
x0
= 0,
где L ∈ Rn×ℓ. Подчеркнем, что структура фильтра задается заранее — он
является линейным стационарным, подлежит выбору лишь постоянная мат-
рица L. Эта структура фильтра такая же, как и в известном наблюдателе
Люенбергера [19, 20]. По сути, можно рассматривать этот фильтр как обоб-
щение наблюдателя Люенбергера на задачи с помехами.
Задачей является минимизация ошибки оценки
zk - zk = C1(xk - xk) = C1ek,
где ek = xk - xk — невязка, удовлетворяющая согласно (1), (2) разностному
уравнению
(3)
ek+1 = (A - LC)ek + (D1 - LD2)wk, e0 = x0.
Обратим внимание, что допустимая матрица фильтра L стабилизирует си-
стему (3), обращая матрицу A-LC в шуровскую. Ее существование вытекает
из свойства наблюдаемости исходной системы.
66
Важно отметить, что здесь рассматривается случай неслучайных ограни-
ченных помех. Для случайного, гауссовского шума вполне естественно приме-
нять калмановскую фильтрацию, однако одна из целей настоящей статьи —
привлечь внимание к фильтрации с ограниченными шумами. Также на де-
монстрационных примерах будет рассмотрено, как работает фильтр Калмана
с ограниченными помехами и наоборот — к чему приведет применение к слу-
чайным помехам рассматриваемой модели с ограниченным шумом.
Заметим также, что в настоящей статье рассматривается более общая по-
становка задачи, чем в [7]: в описании системы присутствует вход uk.
Наконец, учет ограничения на внешнее возмущение вида
|wk| γ для всех k = 0, 1, . . .
производится очевидным путем масштабирования матриц: D1 := γD1, D2 :=
:= γD2.
3. Гарантирующий фильтр
В настоящей статье предлагается гарантирующий подход к решению за-
дачи фильтрации при ограниченных шумах, для которого можно явным об-
разом выписать прямые формулы, основанные на градиентом спуске. Он ос-
новывается на концепции инвариантных эллипсоидов, см. подробнее [10, 21].
Один из основных результатов статьи представлен следующим утвержде-
нием.
Теорема 1. Пусть L, P — решение оптимизационной задачи
(4)
min f(L, α), f(L, α) = tr C1P CT1 + ρ∥L∥2F ,
при ограничении
1
1
(5)
(A - LC)P (A - LC)T - P +
(D1 - LD2)(D1 - LD2)T
=0
α
1
относительно матричных переменных P = PT Rn×n, L ∈ Rn×ℓ и скаляр-
ного параметра 0 < α < 1.
Тогда ошибка оценки zk - zk выхода системы (1) с нулевым начальным
условием при помощи наблюдателя (2) с матрицей L заключена в мини-
мальный ограничивающий эллипсоид с матрицей
C1PCT1.
Переходя к обоснованию теоремы, напомним следующий результат [22].
Лемма 1. Пусть матрица A шуровская, ρ = maxi(A)| < 1, пара (A, D)
i
управляема, а матрица P(α) 0, ρ2 < α < 1, удовлетворяет дискретному
уравнению Ляпунова
1
1
(6)
AP AT - P +
DDT
= 0.
α
1
67
Тогда:
1) задача об оптимальном ограничивающем эллипсоиде для выхода систе-
мы
xk+1 = Axk + Dwk,
zk = Cxk,
с начальным условием x0 и ограниченными внешними возмущениями |wk|
1 сводится к минимизации одномерной функции f(α) = trCP(α)CT на
интервале ρ2 < α < 1;
2) если α — точка минимума и x0 удовлетворяет условию
xT0P-1(α)x0 1,
то гарантируется оценка
|zk|2 f(α), k = 0, 1, . . .
Итак, рассмотрим величину C1ek в качестве линейного выхода системы (3).
Тогда если заключить невязку ek в инвариантный эллипсоид
{
}
E =
e∈Rn: eTP-1e1
,
P ≻ 0,
то C1ek будет содержаться в ограничивающем эллипсоиде
{
}
(7)
Ez =
ez Rr : eTz(C1PCT1)-1ez 1
,
размер которого и будем минимизировать. Таким образом, оценивается
асимптотическая (а при малых уклонениях и равномерная по k) точность
фильтрации.
В соответствии с леммой 1 исходная задача свелась к матричной оптимиза-
ционной задаче (4)-(5). Обратим внимание, что в минимизируемую функцию
f (L, α) помимо компоненты, определяющей размер ограничивающего эллип-
соида (7) по критерию следа, введен штраф за величину матрицы фильтра
(при этом коэффициент ρ > 0 регулирует его важность). В то же время его
наличие гарантирует коэрцитивность минимизируемой функции по L. Запись
f (L, α) подчеркивает, что при заданных L и α матрица P находится из урав-
нения Ляпунова (5); тем самым независимыми переменными являются L и α.
Сделаем важное
Замечание 1. Рассматриваемый гарантирующий подход позволяет
строить оптимальные матрицы фильтра по каждой из координат вектора
состояния системы в отдельности (этой возможности нет в фильтре Калма-
на). Действительно, положив в задаче из теоремы 1 в качестве матрицы C1
транспонированный i-й координатный вектор, приходим к матрице фильтра,
минимизирующей невязку x(i)k - x(i)k.
68
4. Вычисление оптимальной матрицы фильтра
Напомним, что в [7] был предложен вариант гарантирующего подхода к
решению задачи фильтрации при ограниченных шумах, который основан на
технике линейных матричных неравенств и предполагает решение парамет-
рической задачи полуопределенного программирования. В рамках рассмат-
риваемой оптимизационной задачи (4)-(5) нет необходимости применять этот,
технически сравнительно сложный, аппарат (несмотря на то, что и мини-
мизирумая функция, и ограничение невыпуклы по совокупности перемен-
ных P , L и α). В этом разделе будет предложен регулярный итеративный
подход к ее решению, в основе которого лежит применение градиентного ме-
тода по переменной L и минимизации по α по методу Ньютона. Приведем
принципиальную схему алгоритма.
Алгоритм 1 для минимизации f(L,α):
1. Задаемся параметрами ε > 0, γ > 0, 0 < τ < 1 и начальным допустимым
(
)
приближением L0. Вычисляем величину α0 =
1 + ρ2(A - L0C)
/2.
2. На j-й итерации, имея величины Lj и αj, находим градиент Hj =
= Lf(Ljj). Если ∥Hj ε, то Lj принимаем за приближенное решение.
3. Делаем шаг градиентного метода
Lj+1 = Lj - γjHj,
при этом длину шага γj > 0 подбираем дроблением γ до выполнения условий:
а. Lj+1 обращает матрицу (A - LC)/√αj в шуровскую;
б. f(Lj+1) f(Lj) - τγj ∥Hj2.
4. Для полученного Lj+1 решаем задачу минимизации f(Lj+1, α) по α по
методу Ньютона:2
f(αj)
αj+1 = αj -
f′′(αj)
и получаем αj+1. Переходим к п. 2.
В Алгоритме 1 величиныLf(L,α), f(α) и f′′(α) определяются следую-
щим образом:
(
)
1
1
Lf(L,α) = 2 ρL -
Y (A - LC)P CT -
Y (D1 - LD2)DT
,
2
α
1
(
)
1
1
f(α) = tr Y
(D1 - LD2)(D1 - LD2)T -
(A - LC)P (A - LC)T ,
(1 - α)2
α2
(
1
f′′(α) = 2tr Y
(D1 - LD2)(D1 - LD2)T +
(1 - α)3
)
1
+
(A - LC)(P - X)(A - LC)T
,
α3
2 Реально требуется не более трех-четырех итераций для получения решения с
большой точностью, если начальная точка не слишком близка к границам интервала
(
)
ρ2(A - Lj+1C), 1
69
где матрицы P , Y и X являются решениями дискретных уравнений Ляпуно-
ва (5),
1
(8)
(A - LC)TY (A - LC) - Y + CT1C1
=0
α
и
1
1
(A - LC)X(A - LC)T - X +
(D1 - LD2)(D1 - LD2)T-
α
(1 - α)2
1
-
(A - LC)P (A - LC)T = 0
α2
соответственно.
Обоснование Алгоритма 1 с выводом соответствующих формул помещено
в Приложение 1.
Важным моментом является выбор пробного шага градиентного метода.
Весьма перспективным является его выбор из следующих соображений. Най-
дем для некоторого допустимого L решение P дискретного уравнения Ляпу-
нова
(A - LC)P (A - LC)T - P = -I.
Рассмотрим приращение по L:
L → L - γH, H = Lf(L,α),
и найдем, для каких γ матрица P останется матрицей квадратичной функции
Ляпунова для A - (L - γH)C, т.е.
(A - (L - γH)C) P (A - (L - γH)C)T - P ≺ 0
или по лемме Шура
(
)
P
A - (L - γH)C
0.
(A - (L - γH)C)T
P-1
Полученное матричное неравенство, которому можно придать вид
(
)
(
)
P
A - LC
0
HC
+γ
0,
(A - LC)T P-1
(HC)T
0
выполняется при
((
)
(
))
0
HC
P
A - LC
γ<λ-1
,
max (HC)T
0
(A - LC)T P-1
70
5. Непрерывный случай
Рассмотрим непрерывную систему
x = Ax + B1u + D1w, x(0) = x0,
(9)
y=Cx+B2u+D2w,
z = C1x,
где A ∈ Rn×n, B1 Rn×p, B2 Rℓ×p, C ∈ Rℓ×n, C1 Rr×n, D1 Rn×m,
D2 Rℓ×m, с состоянием x(t) Rn, входом u(t) Rp, наблюдаемым выходом
y(t) R, оцениваемым выходом z(t) Rr и внешним возмущением (шумом)
w(t) Rm, ограниченным в каждый момент времени:
|w(t)| 1 для всех t 0;
пара (A, D1) управляема, пара (A, C) наблюдаема.
Для оценивания выхода z используется фильтр, описываемый линейным
диференциальным уравнением относительно оценки состояния x:
(10)
x = Ax + B1u + L(y - Cx- B2
u),
x(0) = 0,
где L ∈ Rn×ℓ.
Как и в дискретном случае, задачей является минимизация ошибки оценки
z - z = C1(x - x) = C1e,
где e(t) = x(t) - x(t) — невязка, удовлетворяющая согласно (9), (10) диффе-
ренциальному уравнению
(11)
ė = (A - LC)e + (D1 - LD2)w, e(0) = x0.
При этом допустимая матрица фильтра L стабилизирует систему (11), обра-
щая матрицу A - LC в гурвицевую. Ее существование вытекает из свойства
наблюдаемости исходной системы.
Следующая лемма является непрерывным аналогом леммы 1.
Лемма 2 [9, 10]. Пусть матрица A гурвицева, σ = -maxRe (λi(A)) > 0,
i
пара (A, D) управляема, а матрица P (α) 0, 0 < α < 2σ, удовлетворяет
уравнению Ляпунова
(
)
(
)T
α
α
1
A+
I P +P A+
I
+
DDT = 0.
2
2
α
Тогда:
1) задача об оптимальном ограничивающем эллипсоиде для выхода систе-
мы
x = Ax + Dw, x(0) = x0,
z=Cx
71
с ограниченными внешними возмущениями |w(t)| 1 сводится к минимиза-
ции одномерной функции f(α) = tr CP (α)CT на интервале 0 < α < 2σ;
2) если α — точка минимума и x(0) удовлетворяет условию
xT(0)P-1(α)x(0) 1,
то гарантируется оценка
|z(t)|2 f(α),
0 t < ∞.
Рассуждая аналогично дискретному случаю и воспользовавшись лем-
мой 2, приходим к следующему результату.
Теорема 2. Пусть L, P — решение оптимизационной задачи
min f(L, α), f(L, α) = tr C1P CT1 + ρ∥L∥2F ,
при ограничении
(
)
(
)T
α
α
1
(12)
A-LC +
I P +P A-LC +
I
+
(D1 - LD2)(D1 - LD2)T
=0
2
2
α
относительно матричных переменных P = PT Rn×n, L ∈ Rn×ℓ и скаляр-
ного параметра α > 0.
Тогда ошибка оценки z - z выхода системы (9) с нулевым начальным
условием при помощи наблюдателя (10) с матрицей L заключена в ми-
нимальный ограничивающий эллипсоид с матрицей
C1PCT1.
Свойства минимизируемой функции и ее производных, установленные в
Приложении 2, позволяют построить метод минимизации и обосновать его
сходимость.
Алгоритм 2 для минимизации f(L,α):
1. Задаемся параметрами ε > 0, γ > 0, 0 < τ < 1 и начальным допустимым
приближением L0. Вычисляем величину α0 = σ(A - L0C).
2. На j-й итерации, имея величины Lj и αj, находим градиент Hj =
= Lf(Ljj). Если ∥Hj ε, то Lj принимаем за приближенное решение.
3. Делаем шаг градиентного метода
Lj+1 = Lj - γjHj,
при этом длину шага γj > 0 подбираем дроблением γ до выполнения условий:
а. Lj+1 обращает матрицу A - LC +αj2Iвгурвицевую;
б. f(Lj+1) f(Lj) - τγj ∥Hj2.
4. Для полученного Lj+1 решаем задачу минимизации f(Lj+1, α) по α и по-
лучаем αj+1. Переходим к п. 2.
72
В Алгоритме 2 величиныLf(L,α), f(α) и f′′(α) определяются следую-
щим образом:
(
)
1
Lf(L,α) = 2 ρL - Y PCT -
Y (D1 - LD2)DT
,
2
α
(
)
1
f(α) = tr Y P -
(D1 - LD2)(D1 - LD2)T
,
α2
(
)
1
f′′(α) = 2tr Y X +
(D1 - LD2)(D1 - LD2)T
,
α3
где матрицы P , Y и X являются решениями дискретных уравнений Ляпуно-
ва (12),
(
)T
(
)
α
α
(13)
A - LC +
I
Y + Y A - LC +
I
+CT1C1
=0
2
2
и
(
)
(
)T
α
α
(14)
A - LC +
I X + X A - LC +
I
+
2
2
1
+P -
(D1 - LD2)(D1 - LD2)T = 0.
α2
Обоснование Алгоритма 2 с выводом соответствующих формул помещено
в Приложение 2.
Выбор пробного шага градиентного метода предлагается проводить из сле-
дующих соображений. Найдем для некоторого допустимого L решение P
уравнения Ляпунова
(A - LC)P + P (A - LC)T = -I.
Рассмотрим приращение по L:
L → L - γH, H = Lf(L,α),
и найдем, для каких γ матрица P останется матрицей квадратичной функции
Ляпунова для A - (L - γH)C, т.е.
(A - (L - γH)C) P + P (A - (L - γH)C)T 0.
С учетом исходного уравнения имеем
(
)
γ
HCP + P(HC)T
≺I,
откуда
(
)
γ<λ-1max
HCP + P(HC)T
73
6. Примеры и обсуждение
Рассмотрим дискретную модель объекта в пространстве состояний:
xk+1 = Axk + B1uk + Gwk,
(15)
yk = Cxk + B2uk + vk,
с состоянием xk Rn, начальным условием x0, входом uk Rp, наблюдаемым
выходом yk R, шумом wk Rm и ошибкой измерений vk R; здесь A, B1,
B2, C и G — известные матрицы соответствующих размерностей; величи-
ны wk и vk предполагаются независимыми.
Применительно к системе (15) фильтр Калмана имеет следующий вид
(в предположении, что величины wk и vk распределены нормально с нулевым
математическим ожиданием и ковариационными матрицами Q и R соответ-
ственно).
Этап экстраполяции:
xk+1|k = Axk|k + B1uk,
Pk+1|k = APk|kAT + GQGT.
Этап коррекции:
Kk = Pk|k-1CT(CPk|k-1CT + R)-1,
xk|k = xk|k-1 + Kk(yk - Cxk|k-1 - B2uk),
Pk|k = (I - KkC)Pk|k-1.
Будем рассматривать три следующие постановки задачи.
1. Модель M1 со случайными помехами: шум wk распределен по нормаль-
ному закону с нулевым математическим ожиданием и ковариационной мат-
рицей Q, а погрешность измерений vk имеет нормальное распределение с
нулевым математическим ожиданием и ковариационной матрицей R:
wk ∼ N(0,Q), vk ∼ N(0,R).
2. Модель M2 со случайными ограниченными помехами: величина wk рав-
номерно распределена на кубе [-w, w]m, а величина vk равномерно распреде-
лена на кубе [-v, v]:
wk ∼ U([-w,w]m), vk ∼ U([-v,v]).
3. Модель M3 с неслучайными ограниченными помехами: величины wk
и vk могут принимать произвольные значения на кубах [-w,w]m и [-v,v]
соответственно:
|wk| w,
|vk| v.
74
В рамках этих моделей сравним работоспособность фильтра Калмана и
гарантирующего подхода на следующих примерах (несмотря на то, что га-
рантирующие оценки не обоснованы для модели M1, а фильтр Калмана —
для модели M3).
На приводимых ниже рисунках показаны истинная траектория системы,
ее наблюдение (если оно имеется) и оценки, предоставляемые калмановским
(ФК) и гарантирующим (ГФ) фильтром; в последнем случае также показана
трубка, в которой заведомо содержится оценка при всех допустимых помехах.
Пример 1. Рассмотрим вагонетку, которая может двигаться без трения
по бесконечным рельсам [23]. В начальный момент вагонетка находится в
нулевом положении и на нее воздействуют внешние возмущения. Положе-
ние вагонетки измеряется каждые Δt секунд, при этом измерения неточны.
Задача состоит в отслеживании положения s и скорости s = v вагонетки.
Соответствующая система представима в формате (15) при
)
(s
xk =
,
x0 = 0,
s
)
(1 Δt
(
)
(t)2/2)
A=
,
B1 = B2 = 0, C =
1
0
,
G=
0
1
Δt
1. В рамках модели M1 предполагается, что на k-м такте вагонетка дви-
жется с постоянным ускорением, распределенным по нормальному закону
с нулевым математическим ожиданием и среднеквадратическим отклонени-
ем σx, а погрешность измерений имеет нормальное распределение с нулевым
математическим ожиданием и среднеквадратическим отклонением σy:
wk ∼ N(0x), vk ∼ N(0y).
Построим фильтр Калмана, а также воспользуемся гарантирующим под-
ходом, объединив помехи wk и vk в общий вектор возмущений
)
(wk
(16)
wk =
vk
При этом матрицы D1 и D2 в системе (1) примут вид
(
)
(
)
D1 = 3σx
2
G 0
,
D2 = 3σy
2
0
1
,
что позволит варьировать величины wk и vk независимо друг от друга на
интервалах
|wk| 3σx,
|vk| 3σy.
Гарантирующий подход привел к оптимальным матрицам фильтра
)
(0,2359
L1 =
0,1412
75
a
б
4
2,0
Траектория
Траектория
3
Наблюдение
ГФ: оценка
1,5
ГФ: оценка
ФК: оценка
ФК: оценка
ГФ: границы
2
ГФ: границы
1,0
1
0,5
0
0
1
0.5
2
1,0
3
4
1,5
5
2,0
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
t, сек
t, сек
Рис. 1. Динамика координат и их оценок в примере 1 (модель M1).
для координаты x(1) = s и
)
(0,1122
L2 =
0,0386
для координаты x(2) = s.
Результаты сравнения с фильтром Калмана при
Δt = 0,1, σx = 0,1, σy = 0,5
показаны на рис. 1,а и 1,б .
2. В рамках модели M2 будем предполагать, что на k-м такте вагонетка
движется с постоянным ускорением, равномерно распределенным на отрезке
[-a, a], а погрешность измерений равномерно распределена на отрезке [-v, v]:
wk ∼ U(-a,a), vk ∼ U(-v,v).
Построим фильтр Калмана (при σx = a/3, σy = v/3), а также воспользу-
емся гарантирующим подходом — для возмущения (16) и матриц
(
)
(
)
D1 = a
2
G 0
,
D2 = v
2
0
1
Гарантирующий подход привел к оптимальным матрицам фильтра
)
(0,1393
L1 =
0,0489
для координаты x(1) = s и
)
(0,0574
L2 =
0,0101
для координаты x(2) = s.
76
a
б
6
2,0
Траектория
Траектория
Наблюдение
ГФ: оценка
4
ГФ: оценка
1,5
ФК: оценка
ФК: оценка
ГФ: границы
ГФ: границы
1,0
2
0,5
0
0
2
0.5
4
1,0
6
1,5
0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
t, сек
t, сек
Рис. 2. Динамика координат и их оценок в примере 1 (модель M2).
Результаты сравнения с фильтром Калмана при
Δt = 0,1, a = 0,1, v = 2
показаны на рис. 2,а и 2,б .
3. В рамках модели M3 будем предполагать, что wk и vk принимают про-
извольные значения на отрезках [-a, a] и [-v, v] соответственно:
|wk| a,
|vk| v.
Применим фильтр Калмана (для σx = a, σy = v), а также воспользуемся
гарантирующим подходом — для возмущения (16) и матриц
(
)
(
)
D1 = a
2
G 0
,
D2 = v
2
0
1
Гарантирующий подход привел к оптимальным матрицам фильтра
)
(0,1397
L1 =
0,0492
для координаты x(1) = s и
)
(0,0574
L2 =
0,0101
для координаты x(2) = s.
Результаты сравнения с фильтром Калмана при
Δt = 0,1, a = 0,1, v = 2
показаны на рис. 3,а и 3,б .
77
a
б
60
4
Траектория
Траектория
Наблюдение
ГФ: оценка
50
ГФ: оценка
ФК: оценка
3
ФК: оценка
ГФ: границы
ГФ: границы
40
2
30
1
20
0
10
1
0
10
2
0
5
10
15
20
25
30
0
5
10
15
20
25
30
t, сек
t, сек
Рис. 3. Динамика координат и их оценок в примере 1 (модель M3).
Пример 2. Следующий пример [24] связан с оцениванием движения сна-
ряда по баллистической траектории при наличии внешних возмущений и до-
ступных наблюдению (зашумленных) координатах. Соответствующая систе-
ма имеет вид (15), где
sx
sy
x=
vx
vy
есть вектор состояния системы, состоящий из проекций координаты и скоро-
сти снаряда на горизонтальную и вертикальную оси, а
1 0 Δt
0
0
01
0
Δt
0
A=
u=
001-b
,
,
0
0
0
0
0
1-b
-gΔt
(
)
1
0
0
0
B1 = G = I, B2 = 0, C =
0
1
0
0
Здесь Δt — интервал между измерениями, 0 < b ≪ 1 — коэффициент со-
противления воздуха, g — гравитационная постоянная, шум wk распределен
нормально с нулевым математическим ожиданием и ковариационной мат-
рицей Qk 0, а помехи измерения vk распределены нормально с нулевым
математическим ожиданием и ковариационной матрицей Rk 0. При этом
Δt = 0,1, b = 10-4, g = 9,8, Q = 0,1I, R = 500I.
1. В рамках “стандартной” модели M1 предполагается, что
wk ∼ N(0xI), σ2x = 0,1,
vk ∼ N(0yI), σ2y = 500.
78
a
б
12 000
700
Траектория
Траектория
Наблюдение
ГФ: оценка
10 000
ГФ: оценка
600
ФК: оценка
ФК: оценка
ГФ: границы
ГФ: границы
500
8000
400
6000
300
4000
200
2000
100
0
0
2000
100
0
2
4
6
8
10
12
14
16
18
20
0
2
4
6
8
10
12
14
16
18
20
t, сек
t, сек
Рис. 4. Динамика координат и их оценок в примере 2 (модель M1).
Как и в предыдущем примере, для того чтобы воспользоваться гарантирую-
щим подходом, объединим помехи wk и vk в общий вектор возмущений, а
матрицы D1 и D2 в системе (1) примут вид
(
)
(
)
D1 = 3σx
2
G 0
,
D2 = 3σy
2
0
I
,
что позволит варьировать величины wk и vk независимо друг от друга на
интервалах
|wk| 3σx,
|vk| 3σy.
Гарантирующий подход доставил следующие оптимальные матрицы филь-
тра для каждой из четырех координат (здесь и далее в матрицах фильтра
обнулены элементы, по абсолютной величине не превосходящие 10-6):
0,5946
0
0,7277
0
0
0,6822
0
0,6340
L1 =
L2 =
0,8467
,
1,2376
,
0
0
0
1,0590
0
0,9879
0,0971
0
0,1393
0
0
0,1389
0
0,0975
L3 =
L4 =
0,0284
0
,
0,0459
0
.
0
0,0456
0
0,0285
Результаты сравнения для координат sy и vy показаны на рис. 4,а и 4,б.
Обратим внимание, что поведение траекторий оценок на начальном участ-
ке обусловлено тем, что фактическая начальная точка
0
0
x0 =
300
600
79
a
б
8000
800
Траектория
Траектория
7000
Наблюдение
700
ГФ: оценка
ГФ: оценка
ФК: оценка
ФК: оценка
ГФ: границы
6000
ГФ: границы
600
5000
500
4000
400
3000
300
2000
200
1000
100
0
0
1000
100
0
5
10
15
0
5
10
15
t, сек
t, сек
Рис. 5. Динамика координат и их оценок в примере 2 (модель M2).
a
б
14 000
700
Траектория
Траектория
Наблюдение
ГФ: оценка
12 000
600
ГФ: оценка
ФК: оценка
ФК: оценка
ГФ: границы
10 000
ГФ: границы
500
8000
400
6000
300
4000
200
2000
100
0
0
2000
100
0
5
10
15
20
25
0
5
10
15
20
25
t, сек
t, сек
Рис. 6. Динамика координат и их оценок в примере 2 (модель M3).
оказалась вне минимального инвариантного эллипсоида для невязки. Однако
в силу того, что инвариантный эллипсоид обладает свойством притягиваемо-
сти, после нескольких шагов гарантирующие оценки начинают охватывать
истинную траекторию.
2. В рамках модели M2 будем предполагать, что
wk ∼ U(-w,w), vk ∼ U(-v,v),
где w = 3σx, v = 3σy.
Поскольку в этом случае
(
)
(
)
D1 = w
2
G 0
,
D2 = v
2
0
I
,
то гарантирующий подход приводит к тем же матрицам фильтра, что и в
модели M2. Результаты его сравнения с фильтром Калмана для координат sy
и vy показаны на рис. 5,а и 5,б.
80
3. В рамках модели M3 будем предполагать, что
|wk| σx,
|vk| σy.
Гарантирующий подход при
(
)
(
)
D1 = σx
2
G 0
,
D2 = σy
2
0
I
привел к оптимальным матрицам фильтра
0,6362
0
0,6697
0
0
0,7256
0
0,5747
L1 =
L2 =
0,9779
0
,
1,0517
0
,
0
1,2126
0
0,8206
0,0971
0
0,1393
0
0
0,1389
0
0,0975
L3 =
L4 =
0,0284
,
0,0459
.
0
0
0
0,0456
0
0,0285
Результаты его сравнения с фильтром Калмана для координат sy и vy пока-
заны на рис. 6,а и 6,б .
Как видно из примеров, и фильтр Калмана, и гарантирующий фильтр,
с одной стороны, не слишком сильно отличаются по своим результатам,
а с другой — во всех трех моделях они вполне работоспособны. При этом, как
ожидалось, для гауссовских помех фильтр Калмана дает немного (но не кар-
динально) лучшее поведение оценки по сравнению с гарантирующим филь-
тром, тогда как для неслучайных ограниченных помех преимущество оста-
ется за гарантирующим фильтром.
Отметим также, что ширина трубки, в которую гарантированно заключе-
на соответствующая оценка, довольно сильно завышена, что хорошо видно
на рисунках; это — характерное поведение методов гарантированного оцени-
вания, направленных на противодействие “наихудшей” из возможных реали-
заций неопределенности.
Наконец, гарантирующий фильтр позволяет получить равномерную оцен-
ку точности фильтрации; здесь уместно обратить внимание на поведение га-
рантирующей и калмановской оценок на начальном участке траектории (при
этом последняя также имеет явно выраженный всплеск).
7. Заключение
Предложен новый подход к задаче синтеза гарантирующего фильтра, ос-
нованный на сведении проблемы к задаче матричной оптимизации, где пе-
ременной является матрица фильтра. Далее эта задача решается градиент-
ным методом; его сходимость теоретически обосновывается для ряда важных
частных случаев.
81
Рассмотренные примеры демонстрируют работоспособность и эффектив-
ность предлагаемого алгоритма; проведено его сравнение с фильтром Кал-
мана на трех различных постановках задач.
В статье рассматривалась задача построения стационарного фильтра;
представляет явный интерес обобщение данного подхода и на динамическую
задачу фильтрации в духе работ [25, 26] с помощью инструментария [27, 28].
ПРИЛОЖЕНИЕ 1
Лемма П.1.1. Пусть X и Y — решения двойственных дискретных урав-
нений Ляпунова с шуровской матрицей A:
ATXA - X + W = 0 и AY AT - Y + V = 0.
Тогда tr (XV ) = tr (Y W ).
Доказательство леммы П.1.1. В самом деле, прямым вычислением
имеем
(
)
tr (XV ) = tr
X(Y - AY AT)
= tr (XY ) - tr (XAY AT) =
(
)
= tr (Y X) - tr (Y ATXA) = tr
Y (X - ATXA)
= tr (Y W ).
Лемма П.1.1 доказана.
Лемма П.1.2. Для решения P дискретного уравнения Ляпунова
AP AT - P + Q = 0
с шуровской матрицей A и Q ≻ 0 справедливы оценки:
λmin(Q)
λmin(Q)
(П.1.1)
λmax(P)
,
λmin(P)
,
12
1 - σ2min(A)
где ρ = maxi(A)|, а σmin(A) — наименьшее сингулярное число матрицы A.
i
Если же Q = DDT и пара (A, D) управляема, то
2
∥uD∥
(П.1.2)
λmax(P)
> 0,
12
где
uA = λu,
|λ| = ρ,
∥u∥ = 1,
т.е. u — левый собственный вектор матрицы A, отвечающий собствен-
ному значению λ матрицы A с наибольшим модулем. Вектор u и число λ
могут быть комплексными; здесь u означает комплексное сопряжение и
транспонирование.
82
Доказательство леммы П.1.2. Оценки (П.1.1) хорошо известны, см.,
например, [29]. Докажем справедливость оценки (П.1.2). Явное решение дис-
кретного уравнения Ляпунова для шуровской матрицы A имеет вид
P = AkDDT(AT)k.
k=0
Умножая это равенство справа на u и слева на u и учитывая, что uAk =
= λku, (AT)ku = (λ)ku, получаем, что
uD∥2
λmax(P) uPu = uAkDDT(AT)ku = (λλ)kuDDTu =
,
12
k=0
k=0
причем ∥uD∥ > 0 в силу управляемости пары (A, D), см., например, [10, тео-
рема Д.1.5]. Лемма П.1.2 доказана.
Итак, начнем с оптимизации функции f(α) и рассмотрим оптимизацион-
ную задачу
min f(α), f(α) = tr CP CT
при ограничении
1
1
AP AT - P +
DDT = 0
α
1
относительно матричных переменных P = PT Rn×n и скалярного парамет-
ра 0 < α < 1.
Здесь наложены более жесткие требования к постановке задачи, чем обыч-
но: будем предполагать, что матрица C выхода системы — квадратная невы-
рожденная. Это предположение можно было бы ослабить, но цель сейчас —
получить наиболее простые и наглядные результаты.
Лемма П.1.3. Пусть матрица A шуровская, ρ — спектральный радиус
матрицы A, ρ2 < α < 1, пара (A, D) управляема, а матрица C такова, что
CTC ≻ 0. Тогда функция f(α) = tr CP(α)CT обладает следующими свой-
ствами:
а) функция f(α) определена, положительна и сильно выпукла на интер-
вале ρ2 < α < 1, а ее значения стремятся к бесконечности на концах ин-
тервала, причем существует c > 0 такое, что
α
(П.1.3)
f (α)
c, ρ2
< α < 1;
(1 - α)(α - ρ2)
б) производная функции f(α) имеет вид
(
)
1
1
f(α) = tr Y
DDT -
AP AT
,
(1 - α)2
α2
83
где P и Y — решения дискретных уравнений Ляпунова
1
1
(П.1.4)
AP AT - P +
DDT
=0
α
1
и
1
(П.1.5)
ATY A - Y + CT
C = 0.
α
в) вторая производная функции f(α) определяется формулой
(
)
1
1
f′′(α) = 2tr Y
DDT +
A(P - X)AT
,
(1 - α)3
α3
где P , Y и X — решения дискретных уравнений Ляпунова (П.1.4) и (П.1.5)
и
1
1
1
AXAT - X +
DDT -
AP AT = 0,
α
(1 - α)2
α2
причем f′′(α) > 0 и f′′(α) монотонно возрастает слева и справа от α.
Доказательство леммы П.1.3.
а. Уравнение (6) представимо в виде
(
)
(
)T
1
1
1
-P =-
DDT
√αAP
√αA
1
и согласно [10, лемма 1.2.6] имеет единственное решение тогда и только тогда,
1
когда матрица
A шуровская:i
α
√αA)|<1,т.е.приρ2 <α<1.
Оценим величину f(α) = tr CP (α)CT, используя лемму П.1.2 с очевидны-
ми заменами:
f (α) = tr CP (α)CT λmin(CTC)λmax (P (α))
∥uD∥2λmin(CTC)
α
∥uD∥2λmin(CTC),
(1 - α) (1 - ρ2(A/√α))=
(1 - α)(α - ρ2)
где u имеет тот же смысл, что и в лемме П.1.2, а величина ∥uD∥2 положи-
тельна в силу предположения об управляемости пары (A, D), а тем самым и
пары (A/√α,D).
Покажем теперь, что функция f(α) = tr CP (α)CT строго выпукла на ин-
тервале (ρ2, 1). В соответствии с [10, лемма 1.2.6] решение уравнения (П.1.4)
представимо в явном виде как
(
)k
(
)k
1
1
1
1
P (α) =
DDT
AT
=
AkDDT(AT)k
√αA
1
√α
(1 - α)αk
5
67
8
k=0
k=0
5
67
8
Hk
g(α,k)
84
Но Hk 0 и g(α, k) > 0 при 0 < α < 1, поэтому на интервале (ρ2, 1) имеем
P (α) = g(α, k)Hk 0
k=0
и
f (α) = tr P (α)CTC > 0.
Прямым вычислением получаем
(
)
1
k
g(α,k) =
-
g(α, k),
1
α
((
)2
)
1
k
1
k
1
g′′(α,k) =
-
+
+
g(α, k)
g(α, k)
1
α
(1 - α)2
α2
(1 - α)2
(здесь дифференцирование производится по α), так что
1
1
f′′(α) =
g′′(α,k)tr CHkCT
f (α)
f (α) > 0.
(1 - α)2
(1 - ρ2)2
k=0
Таким образом, вторая производная функции f(α) положительна и стре-
мится к бесконечности на концах интервала (ρ2, 1).
Далее, прямым вычислением четвертой производной получаем
k(k + 1)(k + 2)(k + 3)
24
24
g(IV)(α,k) =
+
,
αk+4
(1 - α)4
(1 - α)4
k=0
так что
f(IV)(α) =
g(IV)(α,k)tr CHkCT
k=0
24
24
tr CHkCT >
tr CHkCT > 0,
(1 - α)4
(1 - ρ2)4
k=0
k=0
т.е. вторая производная f′′(α) сама является выпуклой и растет на границах
интервала.
б. Выведем теперь формулу для производной функции f(α). В уравне-
нии (П.1.4) решение P является функцией от α. Продифференцируем это
уравнение; под P будем понимать производную по α:
1
1
1
(П.1.6)
APAT - P +
DDT -
AP AT
= 0.
α
(1 - α)2
α2
85
Применяя лемму П.1.1 к двойственным уравнениям (П.1.6) и (П.1.5), полу-
чаем желаемую формулу
(
)
1
1
f(α) = tr CPCT = tr PCTC = tr Y
DDT -
AP AT
(1 - α)2
α2
в. Аналогично получим выражение для второй производной f(α). Диффе-
ренцируя уравнение (П.1.6) по α, получаем
1
2
2
2
AP′′AT - P′′ +
DDT +
AP AT -
APAT = 0.
α
(1 - α)3
α3
α3
Вновь применяя лемму П.1.1 к этому уравнению и уравнению (П.1.5) (и имея
в виду, что X = P), получаем
(
)
1
1
f′′(α) = tr CP′′CT = tr P′′CTC = 2tr Y
DDT +
A(P - X)AT
(1 - α)3
α3
Лемма П.1.3 доказана.
Заметим, что для вычисления функции f(α) и двух ее производных до-
статочно решить три дискретных уравнения Ляпунова.
Указанные свойства функции позволяют применить метод Ньютона для ее
минимизации. Задаемся начальным приближением ρ2(A) < α0 < 1, например
(
)
α0 =
1 + ρ2(A)
/2, и применяем итерационный процесс
f(αj)
(П.1.7)
αj+1 = αj -
f′′(αj)
Следующая теорема гарантирует глобальную сходимость алгоритма; ее
справедливость устанавливается аналогично сходному результату в [16].
Теорема П.1.1
[16]. В методе (П.1.7) справедливы оценки
f′′(α0)
j - α|
0 - α|,
j+1 - α| c|αj - α|2,
2j f′′(α)
где c > 0 — некоторая константа (она может быть выписана явно).
Первая оценка гарантирует глобальную сходимость метода (быстрее, чем
геометрическая прогрессия с коэффициентом 1/2), а вторая — квадратич-
ную сходимость в окрестности решения. Реально требуется не более трех -
четырех итераций для получения решения с большой точностью (если только
начальная точка не слишком близка к границам интервала).
Вернемся к оптимизационной задаче (4)-(5) и займемся минимизацией
функции
f (L) = min f(L, α),
α
предварительно исследовав ее свойства.
Лемма П.1.4. Функция f(L) определена и положительна на множе-
стве S допустимых матриц фильтра.
86
Действительно, если матрица A - LC шуровская, то ρ(A - LC) < 1 и для
ρ2(A - LC) < α < 1 существует решение P 0 дискретного уравнения Ля-
пунова (5). Тем самым определена строго положительная функция f(L, α),
при этом f(L) > 0 в силу (П.1.3). Как и в непрерывном случае, множество
ее определения S может быть невыпуклым и несвязным, а его границы —
негладкими.
Лемма П.1.5. На множестве S функция f(L) коэрцитивна (т.е. стре-
мится к бесконечности на границе области), причем справедливы следующие
оценки:
1
λmin(C1CT1)
(П.1.8)
f (L)
∥D1 - LD22F ,
1 - ρ2(A - LC) 1 - σ2min(A - LC)
f (L) ρ∥L∥2.
Доказательство леммы П.1.5. Рассмотрим последовательность до-
пустимых матриц {Lj } ⊆ S такую, что Lj → L ∈ ∂S, т.е. ρ(A - LC) = 1. Это
означает, что для любого ε > 0 найдется число N = N(ε) такое, что неравен-
ство
(A - Lj C) - ρ(A - LC)| = 1 - ρ(A - LjC) < ε
справедливо для всех j N(ε).
Пусть Pj — решение уравнения (5), ассоциированного с матрицей филь-
тра Lj :
1
1
(A - LjC)Pj (A - LjC)T - Pj +
(D1 - Lj D2)(D1 - LjD2)T = 0,
αj
1j
а Yj — решение двойственного к нему дискретного уравнения Ляпунова
1
(A - LjC)TYj(A - LjC) - Yj + C1CT1 = 0.
αj
Тогда с учетом леммы П.1.2 имеем:
(
)
f (Lj) = tr (C1Pj CT1) + ρ∥Lj2F tr
PjC1CT1
=
(
)
1
= tr Yj
(D1 - LjD2)(D1 - Lj D2)T
1j
1
1
λmin(C1CT1)
λmin(Yj)∥D1 - LjD22F
∥D1 - LjD22F
1j
1 - αj 1 - σ2min(A - LjC)
1
λmin(C1CT1)
∥D1 - LjD22F
1 - ρ2(A - LjC) 1 - σ2min(A - LjC)
1
λmin(C1CT1)
∥D1 - LjD22F
-−-→ +∞,
ε 1 - σ2min(A - LjC)
ε→0
поскольку ρ2(A - LjC) < αj < 1.
87
C другой стороны,
f (Lj) = tr (C1Pj CT1) + ρ∥Lj2F ρ∥Lj2F ρ∥Lj2
-−-----→ +∞.
∥Lj ∥→+
Лемма П.1.5 доказана.
Введем в рассмотрение множество уровня
S0 = {L ∈ S : f(L) f(L0)}.
Из леммы П.1.5 вытекает очевидное
Следствие П.1.1. Для любых L0 ∈ S множество S0 ограничено.
C другой стороны, у функции f(L) на множестве S0 существует точка
минимума (как у непрерывной — в силу свойств решения дискретного урав-
нения Ляпунова — функции на компактном множестве), но множество S0 не
имеет общих точек с границей S в силу (П.1.8). Далее будет показано, что
f (L) дифференцируема на S0. Следовательно, справедливо
Следствие П.1.2. Существует точка минимума L на множестве S,
и в ней градиент функции f(L) обращается в нуль.
Перейдем к свойствам градиента функции f(L, α).
Лемма П.1.6. Функция f(L,α) определена на множестве стабилизи-
рующих L и для ρ2(A - LC) < α < 1. На этом допустимом множестве она
дифференцируема, причем градиент дается выражениями
(
1
(П.1.9)
αf(L,α) = tr Y
(D1 - LD2)(D1 - LD2)T -
(1 - α)2
)
1
-
(A - LC)P (A - LC)T ,
α2
(
)
1
1
(П.1.10)
Lf(L,α) = 2 ρL -
Y (A - LC)P CT -
Y (D1 - LD2)DT
2
,
α
1
где матрицы P и Y являются решениями дискретных уравнений Ляпуно-
ва (5) и (8).
Минимум f(L,α) достигается во внутренней точке допустимого мно-
жества и определяется условиями
Lf(L,α) = 0,
αf(L,α) = 0.
При этом f(L, α) как функция от α строго выпукла на ρ2(A - LC) < α < 1
и достигает минимума во внутренней точке этого интервала.
Доказательство леммы П.1.6. Имеем задачу:
min f(L, α), f(L, α) = tr C1P CT1 + ρ∥L∥2F
при ограничении в виде дискретного уравнения Ляпунова (5) относительно
матрицы P инвариантного эллипсоида.
88
Следуя лемме П.1.3, дифференцирование по α производится в соответ-
ствии с соотношениями (П.1.9), (5) и (8). Для дифференцирования по L да-
дим ему приращение ΔL и обозначим соответствующее приращение P
че-
рез ΔP ; в результате (5) примет вид
1
(A - (L + ΔL)C) (P + ΔP ) (A - (L + ΔL)C)T - (P + ΔP )+
α
1
+
(D1 - (L + ΔL)D2) (D1 - (L + ΔL)D2)T = 0.
1
Оставляя обозначение ΔP для главной части приращения, получаем
1
(
(A - LC)P (A - LC)T - ΔLCP (A - LC)T - (A - LC)PLC)T+
α
)
+(A - LCP (A - LC)T
- (P + ΔP )+
(
1
+
(D1 - LD2)(D1 - LD2)T - ΔLD2(D1 - LD2)T -
1
)
- (D1 - LD2)(ΔLD2)T
= 0.
После вычитания уравнения (12) из этого уравнения, имеем:
1
(П.1.11)
(A - LCP (A - LC)T -
α
1
(
)
- ΔP -
ΔLCP(A - LC)T + (A - LC)PLC)T
-
α
1
(
)
ΔLD2(D1 - LD2)T + (D1 - LD2)(ΔLD2)T
= 0.
1
Вычислим приращение функционала f(L), линеаризуя соответствующие
величины:
Δf(L) = tr C1ΔPCT1 + ρtr LTΔL + ρtr (ΔL)TL = tr ΔPCT1C1 + 2ρtr LTΔL.
По лемме П.2.1 из двойственных уравнений (П.1.11) и (8) имеем
(1
Δf(L) = -2tr Y
ΔLCP(A - LC)T +
α
)
1
+
ΔLD2(D1 - LD2)T
+ 2ρ tr LTΔL =
1
(
)
1
1
= 2tr ρLTΔL -
CP(A - LC)TY -
D2(D1 - LD2)TY ΔL =
α
1
9 (
)
:
1
1
=
2
ρL -
Y (A - LC)P CT -
Y (D1 - LD2)DT
,ΔL
2
α
1
Таким образом, приходим к соотношению (П.1.10). Лемма П.1.6 доказана.
89
Градиент функции f(L) не является липшицевым на множестве S, однако
можно показать, что он обладает этим свойством на его подмножестве S0
(аналогично тому, как это было сделано в [16]).
Установленные свойства минимизируемой функции и ее производных обос-
новывают метод минимизации, реализованный в виде Алгоритма 1.
ПРИЛОЖЕНИЕ 2
Лемма П.2.1
[16]. Пусть X и Y — решения двойственных уравнений
Ляпунова с гурвицевой матрицей A:
ATX + XA + W = 0 и AY + Y AT + V = 0.
Тогда tr (XV ) = tr (Y W ).
Свойства функции f(α), установленные в [16], полностью переносятся на
рассматриваемый случай. В частности, функция f(α) определена, положи-
тельна и сильно выпукла на интервале 0 < α < 2σ(A - LC), а ее значения
стремятся к бесконечности на концах интервала, причем существует c > 0
такое, что
c
(П.2.1)
f (α)
,
0 < α < 2σ(A - LC).
α(2σ - α)
Минимизацию функции f(α) можно эффективно осуществлять при по-
мощи метода Ньютона. Зададимся начальным приближением
00 <
< 2σ(A - LC), например α0 = σ(A - LC), и применим итерационный процесс
f(αj)
αj+1 = αj -
,
f′′(αj)
где согласно [16]
(
)
1
(П.2.2)
f(α) = tr Y P -
(D1 - LD2)(D1 - LD2)T
,
α2
(
)
1
f′′(α) = 2tr Y X +
(D1 - LD2)(D1 - LD2)T
,
α3
а P, Y и X — решения уравнений Ляпунова (12), (13) и (14). При этом тео-
рема П.1.1 сохраняет свою силу.
Следующая лемма является непрерывным аналогом леммы П.1.4.
Лемма П.2.2. Функция f(L) определена и положительна на множе-
стве S допустимых матриц фильтра.
Действительно, если матрица A - LC гурвицева, то σ(A - LC) > 0 и для
0 < α < 2σ(A - LC) существует решение P0 уравнения Ляпунова (12).
Тем самым определена строго положительная функция f(L, α), при этом
f (L) > 0 в силу (П.2.1). Множество ее определения S может быть невыпук-
лым и несвязным, причем его границы могут быть негладкими, см. [16].
90
Лемма П.2.3. На множестве S допустимых матриц функция f(L) ко-
эрцитивна (т.е. стремится к бесконечности на границе области), причем
справедливы следующие оценки:
λmin(C1CT1)∥D1 - LD22F
(П.2.3)
f (L)
,
4σ(A - LC) (∥A - LC∥ + σ(A - LC))
f (L) ρ∥L∥2.
Доказательство леммы П.2.3. Рассмотрим последовательность до-
пустимых матриц {Lj } ⊆ S такую, что Lj → L ∈ ∂S, т.е. σ(A - LC) = 0. Это
означает, что для любого ε > 0 найдется число N = N(ε) такое, что неравен-
ство
(A - LjC) - σ(A - LC)| = σ(A - LjC) < ε
справедливо для всех j N(ε).
Пусть Pj — решение уравнения (12), ассоциированного с матрицей филь-
тра Lj :
(
)
(
)T
αj
αj
A-LjC+
I Pj +Pj A-LjC+
I
+
2
2
1
+
(D1 - LjD2)(D1 - LjD2)T = 0,
αj
а Yj — решение двойственного к нему уравнения Ляпунова
(
)T
(
)
αj
αj
A-LjC+
I
Yj + Yj A - LjC +
I
+ C1CT1 = 0.
2
2
Тогда с учетом [16, лемма П.3] имеем:
f (Lj) = tr (C1Pj CT1) + ρ∥Lj2F
(
)
1
tr (Pj C1CT) = tr Yj (D1 - LjD2)(D1 - LjD2)T
1
αj
1
1
λmin(C1CT1)
λmin(Yj)∥D1 - LjD22F
αj
αj 2∥A - LjC +αj2I∥∥D1 -LjD2F
1
λmin(C1CT1)
4σ(A - LjC) ∥A - LjC +αj2I∥∥D1 -Lj D2F
λmin(C1CT1)
∥D1 - LjD22F
-−-→ +∞,
4ε(∥A - Lj C∥ + ε)
ε→0
поскольку 0 < αj < 2σ(A - Lj C) и
αj
αj
∥A - Lj C +
I∥ ∥A - LjC∥ +
2
2
91
C другой стороны,
f (Lj) = tr (C1Pj CT1) + ρ∥Lj2F ρ∥Lj2F ρ∥Lj2
-−-----→ +∞.
∥Lj ∥→+
Лемма П.2.3 доказана.
Введем в рассмотрение множество уровня
S0 = {L ∈ S : f(L) f(L0)}.
Из леммы П.2.3 вытекает очевидное
Следствие П.2.3. Для любых L0 ∈ S множество S0 ограничено.
C другой стороны, у функции f(L) на множестве S0 существует точка ми-
нимума (как у непрерывной — в силу свойств решения уравнения Ляпунова —
функции на компактном множестве), но множество S0 не имеет общих точек с
границей S в силу (П.2.3). Далее будет показано, что f(L) дифференцируема
на S0. Следовательно, справедливо
Следствие П.2.4. Существует точка минимума L на множестве S,
и в ней градиент функции f(L) обращается в нуль.
Перейдем к свойствам градиента функции f(L, α).
Лемма П.2.4. Функция f(L,α) определена на множестве допустимых L
и для 0 < α < 2σ(A - LC). На этом допустимом множестве она дифферен-
цируема, причем градиент дается выражениями
(
)
1
αf(L,α) = tr Y P -
(D1 - LD2)(D1 - LD2)T
,
α2
(
)
1
(П.2.4)
Lf(L,α) = 2 ρL - Y PCT -
Y (D1 - LD2)DT
,
2
α
где матрицы P и Y являются решениями уравнений Ляпунова (12) и (13).
Минимум f(L,α) достигается во внутренней точке допустимого мно-
жества и определяется условиями
Lf(L,α) = 0,
αf(L,α) = 0.
При этом f(L, α) как функция от α строго выпукла на 0 < α < 2σ(A - LC)
и достигает минимума во внутренней точке этого интервала.
Доказательство леммы П.2.4. Имеем задачу:
min f(L, α), f(L, α) = tr C1P CT1 + ρ∥L∥2F
при ограничении в виде уравнения Ляпунова (12) относительно матрицы P
инвариантного эллипсоида.
Дифференцирование по α производится в соответствии с соотношения-
ми (П.2.2), (12) и (13). Для дифференцирования по L дадим ему приращение
92
ΔL и обозначим соответствующее приращение P через ΔP; в результате (12)
примет вид
(
)
(
)T
α
α
A - (L + ΔL)C +
I (P + ΔP ) + (P + ΔP ) A - (L + ΔL)C +
I
+
2
2
1
+
(D1 - (L + ΔL)D2) (D1 - (L + ΔL)D2)T = 0.
α
Оставляя обозначение ΔP для главной части приращения, получаем
(
)
(
)T
α
α
A - (L + ΔL)C +
I P + P A - (L + ΔL)C +
I
+
2
2
(
)
(
)T
α
α
+ A - LC +
I ΔP + ΔP A - LC +
I
+
2
2
(
1
+
(D1 - LD2)(D1 - LD2)T - ΔLD2(D1 - LD2)T -
α
)
- (D1 - LD2)(ΔLD2)T
= 0.
После вычитания уравнения (12) из этого уравнения, имеем:
(
)
(
)T
α
α
(П.2.5)
A - LC +
I ΔP + ΔP A - LC +
I
-
2
2
1
(
)
ΔLCP - PLC)T -
ΔLD2(D1 - LD2)T + (D1 - LD2)(ΔLD2)T
= 0.
α
Вычислим приращение функционала f(L), линеаризуя соответствующие
величины:
Δf(L) = tr C1ΔPCT1 + ρtr LTΔL + ρtr (ΔL)TL = tr ΔPCT1C1 + 2ρtr LTΔL.
По лемме П.2.1 из двойственных уравнений (П.2.5) и (13) имеем
(
)
1
Δf(L) = - tr 2Y ΔLCP +
ΔLD2(D1 - LD2)T
+ 2ρ tr LTΔL =
α
(
)
1
= 2tr ρLTΔL - CPY ΔL -
D2(D1 - LD2)TY ΔL
=
α
9 (
)
:
1
=
2
ρL - Y P CT -
Y (D1 - LD2)DT
2
,ΔL
α
Таким образом, приходим к соотношению (П.2.4). Лемма П.2.4 доказана.
СПИСОК ЛИТЕРАТУРЫ
1. Kalman R.E. A New Approach to Linear Filtering and Prediction Problems // J.
Basic Engineer. 1960. V. 82. I. 1. P. 35-45.
2. Kailath T., Sayed A.H., Hassibi B. Linear Estimation. N.J.: Prentice Hall, 2000.
93
3.
Матасов А.И. Основы теории фильтра Калмана. М.: Изд-во МГУ, 2021.
4.
Schweppe F.C. Uncertain Dynamic Systems. N.J.: Prentice Hall, 1973.
5.
Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.:
Наука, 1977.
6.
Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.: На-
ука, 1988.
7.
Поляк Б.Т., Топунов М.В. Фильтрация при неслучайных возмущениях: метод
инвариантных эллипсоидов // Докл. РАН. 2008. Т. 418. № 6. С. 749-753.
Polyak B.T., Topunov M.V. Filtering under Nonrandom Disturbances: The Method
of Invariant Ellipsoids // Dokl. Math. 2008. V. 77. No. 1. P. 158-162.
8.
Хлебников М.В., Поляк Б.Т. Фильтрация при произвольных ограниченных
внешних возмущениях: техника линейных матричных неравенств
//
13-я
Мультиконференция по проблемам управления (МКПУ-2020). Матер. XXXII
Конференции памяти выдающегося конструктора гироскопических приборов
Н.Н. Острякова. Санкт-Петербург, 6-8 октября 2020 г. СПб.: Концерн “ЦНИИ
“Электроприбор”, 2020. С. 291-294.
9.
Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in
System and Control Theory. Philadelphia: SIAM, 1994.
10.
Поляк Б.Т., Хлебников М.В., Щербаков П.С. Управление линейными система-
ми при внешних возмущениях: Техника линейных матричных неравенств. М.:
ЛЕНАНД, 2014.
11.
Fazel M., Ge R., Kakade S., Mesbahi M. Global Convergence of Policy Gradient
Methods for the Linear Quadratic Regulator // Proc. 35th Int. Conf. Machine
Learning. Stockholm, Sweden, July 10-15, 2018. V. 80. P. 1467-1476.
12.
Mohammadi H., Zare A., Soltanolkotabi M., Jovanović M.R. Global Exponential
Convergence of Gradient Methods Over the Nonconvex Landscape of the Linear
Quadratic Regulator // Proc. 2019 IEEE 58th Conf. Decision Control. Nice, France,
December 11-13, 2019. P. 7474-7479.
13.
Zhang K., Hu B., Basar T. Policy Optimization for H2 Linear Control with H
Robustness Guarantee: Implicit Regularization and Global Convergence // Proc. 2nd
Conference on Learning for Dynamics and Control (2nd L4DC). Zürich, Switzerland,
June 11-12, 2020. P. 179-190.
14.
Bu J., Mesbahi A., Fazel M., Mesbahi M. LQR through the Lens of First Order
Methods: Discrete-Time Case // arXiv:1907.08921, 2019.
15.
Fatkhullin I., Polyak B. Optimizing Static Linear Feedback: Gradient Method //
SIAM J. Control Optim. 2021. V. 59. No. 5. P. 3887-3911.
16.
Поляк Б.Т., Хлебников М.В. Синтез статического регулятора для подавления
внешних возмущений как задача оптимизации // АиТ. 2021. № 9. С. 86-115.
Polyak B.T., Khlebnikov M.V. Static Controller Synthesis for Peak-to-Peak Gain
Minimization as an Optimization Problem // Autom. Remote Control. 2021. V. 82.
No. 9. P. 1530-1553.
17.
Поляк Б.Т., Хлебников М.В. Синтез обратной связи по выходу при помощи на-
блюдателя как задача оптимизации // АиТ. 2022. № 3. С. 7-32.
Polyak B.T., Khlebnikov M.V. Observer-Aided Output Feedback Synthesis as an
Optimization Problem // Autom. Remote Control. 2022. V. 83. No. 3. P. 303-324.
94
18.
Поляк Б.Т., Хлебников М.В. Новые критерии настройки ПИД-регуляторов //
АиТ. 2022. № 11. С. 62-82.
Polyak B.T., Khlebnikov M.V. New Criteria for Tuning PID Controllers // Autom.
Remote Control. 2022. V. 83. No. 11. P. 1724-1741.
19.
Luenberger D.G. Observing the State of a Linear System // IEEE Transactions on
Military Electronics. 1964. V. 8. P. 74-80.
20.
Luenberger D.G. An Introduction to Observers // IEEE Trans. Autom. Control.
1971. V. 35. P. 596-602.
21.
Поляк Б.Т., Хлебников М.В., Щербаков П.С. Линейные матричные неравенства
в системах управления с неопределенностью // АиТ. 2021. № 1. С. 3-54.
Polyak B.T., Khlebnikov M.V., Shcherbakov P.S. Linear Matrix Inequalities in
Control Systems with Uncertainty // Autom. Remote Control. 2021. V. 82. No. 1.
P. 1-40.
22.
Назин С.А., Поляк Б.Т., Топунов М.В. Подавление ограниченных внешних воз-
мущений с помощью метода инвариантных эллипсоидов // АиТ. 2007. № 3.
С. 106-125.
Nazin S.A., Polyak B.T., Topunov M.V. Rejection of Bounded Exogenous Distur-
bances by the Method of Invariant Ellipsoids // Autom. Remote Control.
2007.
V. 68. No. 3. P. 467-486.
23.
URL en.wikipedia.org/wiki/Kalman_filter
24.
Humpherys J., Redd P., West J. A Fresh Look at the Kalman Filter // SIAM Rev.
2012. V. 54. Iss. 4. P. 801-823.
25.
Tang W., Zhang Q., Wang Z., Shen Y. Ellipsoid Bundle and its Application to Set-
Membership Estimation // IFAC-PapersOnLine. 2020. V. 53. I. 2. P. 13688-13693.
26.
Tang W., Zhang Q., Wang Z., Shen Y. Set-Membership Filtering with Incomplete
Observations // Inform. Sci. 2020. V. 517. P. 37-51.
27.
Polyak B.T., Nazin S.A., Durieu C., Walter E. Ellipsoidal Parameter or State Esti-
mation under Model Uncertainty // Automatica. 2004. V. 40. I. 7. P. 1171-1179.
28.
Durieu C., Walter E., Polyak B. Multi-Input Multi-Output Ellipsoidal State Bound-
ing // J. Optim. Theory Appl. 2001. V. 111. No. 2. P. 273-303.
29.
Kwon W.H., Moon Y.S., Ahn S.C. Bounds in Algebraic Riccati and Lyapunov Equa-
tions: A Survey and Some New Results // Int. J. Control. 1996. V. 64. P. 377-389.
Статья представлена к публикации членом редколлегии Е.Я. Рубиновичем.
Поступила в редакцию 23.09.2022
После доработки 21.12.2022
Принята к публикации 29.12.2022
95