Автоматика и телемеханика, № 6, 2020
Нелинейные системы
© 2020 г. А.И. КАЛИНИН, д-р физ.-мат. наук (kalininai@bsu.by),
Л.И. ЛАВРИНОВИЧ, канд. физ.-мат. наук (lavrinovich@bsu.by)
(Белорусский государственный университет, Минск)
АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ
ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
НА ТРАЕКТОРИИ
Рассматривается задача об управлении с минимальными энергетиче-
скими затратами линейной сингулярно возмущенной системой, в которой
на правый конец траекторий наложены линейные ограничения. Строят-
ся асимптотические приближения в виде программы и обратной связи
к оптимальному управлению в этой задаче. Основное достоинство пред-
лагаемых алгоритмов состоит в том, что при их применении происходит
декомпозиция исходной задачи на две невозмущенные задачи оптималь-
ного управления меньшей размерности.
Ключевые слова: оптимальное управление, линейная система, квадратич-
ный функционал, сингулярные возмущения, асимптотические приближе-
ния, субоптимальный синтез.
DOI: 10.31857/S0005231020060037
1. Введение
Системы обыкновенных дифференциальных уравнений с малыми пара-
метрами при части производных принято называть сингулярно возмущенны-
ми. В рамках математической теории оптимальных процессов задачам оп-
тимизации таких систем уделяется значительное внимание (см. [1-4]). Инте-
рес к таким задачам вызван эффективностью асимптотических методов их
решения, при применении которых исходные задачи оптимального управле-
ния распадаются на задачи меньшей размерности. Кроме того, асимптотиче-
ский подход позволяет избежать интегрирования сингулярно возмущенных
систем, которые являются жесткими [5].
Настоящая статья посвящена построению асимптотических приближений
в виде программы и обратной связи к решению сингулярно возмущенной
линейно-квадратичной задачи оптимального управления с линейными терми-
нальными ограничениями на траектории. Ее можно трактовать как задачу
управления с минимальными энергетическими затратами. Суть предлагае-
мых алгоритмов состоит в асимптотическом разложении по целым степеням
малого параметра множителей Лагранжа, соответствующих в силу принци-
па максимума [6] оптимальному управлению. Предлагаемые вычислительные
процедуры являются очередной реализацией методики исследования задач
29
оптимизации возмущенных динамических систем, в основу которой положена
идея специальной конечномерной параметризации оптимальных управлений
(см. [2]).
Следует отметить, что сингулярно возмущенным линейно-квадратичным
задачам оптимального управления посвящено значительное число публика-
ций (см., например, [7-11]), однако в них, за исключением [11], ограничения на
траектории не накладывались. Настоящая статья обобщает результаты, полу-
ченные в [11], где рассматривалась задача с фиксированным правым концом
траекторий.
2. Постановка задачи
В классе r-мерных управляющих воздействий u(t), t ∈ T = [t, t], с
кусочно-непрерывными компонентами рассмотрим следующую задачу опти-
мального управления:
y = A1(t)y + A2(t)z + B1(t)u, y(t) = y,
(2.1)
µŻ = A3(t)y + A4(t)z + B2(t)u, z(t) = z,
(2.2)
H1y(t) = g1, H2z(t) = g2,
t
1
(2.3)
J (u) =
uT
P (t)udt → min,
2
t
где µ малый положительный параметр, t, t заданные моменты вре-
мени (t < t), y
n-вектор медленных переменных, z m-вектор быст-
рых переменных, g1, g2
векторы размерностей n1, m1 соответственно
(n1 ≤ n, m1 ≤ m), H1 и H2 матрицы полного ранга, P (t) положительно
определенная симметрическая матрица для всех t ∈ T .
Предположение 1. Действительные части всех собственных значений
матрицы A4(t), t ∈ T , отрицательны.
Предположение 2. Элементы всех матриц, формирующих задачу, бес-
конечно дифференцируемы.
Управление с кусочно-непрерывными компонентами принято называть
допустимым, если для порожденной этим управлением траектории систе-
мы (2.1) выполнены терминальные ограничения (2.2). Допустимое управле-
ние, на котором критерий качества (2.3) принимает наименьшее значение,
называют оптимальным. Наряду с этими общеупотребительными понятиями
определим то, что будет пониматься под асимптотическими приближениями
к решению рассматриваемой задачи.
Определение 1. Управление u(N)(t,µ), t ∈ T, с кусочно-непрерывными
компонентами назовем (программным) асимптотически субоптимальным
управлением N-го порядка (N = 0, 1, 2, . . .), в задаче (2.1)-(2.3), если оно от-
клоняется (о кри)терию качества (2.3) от оптимального управления на
величину O
µN+1
, а порожденная им траектория y (t,µ), z (t,µ), t ∈ T,
30
системы (2.1) удовлетворяет терминальным ограничениям (2.2) с точно-
стью того же порядка малости.
Определение 2. Вектор-функцию u(N)(y,z,t,µ) назовем асимптоти-
чески субоптимальной обратной связью N-го порядка, если для любого на-
чального состояния (y, z, t), t < t, имеет место равенство
u(N)(y,z,t,µ) = u(N)(t,µ),
где u(N)(t, µ), t ∈ T , - асимптотически субоптимальное управление N-го по-
рядка в задаче (2.1)-(2.3).
В настоящей статье предлагается и обосновывается алгоритм, с помощью
которого для заданного числа N можно построить асимптотически субопти-
мальное управление N-го порядка в рассматриваемой задаче. В статье также
показывается, как можно построить асимптотически субоптимальную обрат-
ную связь нулевого порядка.
В дальнейшем для сокращения записи будем использовать обозначения:
(
)
A1 (t)
A2 (t)
A (t, µ) =
,
A3 (t) /µ A4 (t) /µ
(2.4)
(
)
(
)
B1 (t)
y
B (t, µ) =
,
x =
B2 (t)/µ
z
3. Первая базовая задача
Вычисления при построении асимптотически субоптимальных управлений
начинаются с решения вырожденной задачи
y = A0(t)y + B0(t)u, y(t) = y, H1y(t) = g1,
t
(3.1)
1
J1(u) =
uTP(t)udt → min,
2
t
где
(3.2)
A0(t) = A1(t) - A2(t)A-14(t)A3(t), B0(t) = B1(t) - A2(t)A-14(t)B2
(t).
В дальнейшем эту задачу будем называть первой базовой.
Предположение 3. Динамическая система в задаче (3.1) является
управляемой на отрезке [τ, t] относительно подпространства H1y = 0 при
любом τ ∈ [t, t) [12].
Это предположение выполняется тогда и только тогда (см., напри-
мер, [13]), когда при любом τ ∈ [t, t) и любом ненулевом векторе l размер-
ности n1 имеет место соотношение
(3.3)
lTH1F0(t)B(t) ≡ 0, τ ≤ t ≤ t,
31
где F0(t), t ∈ T ,
(n × n)-матричная функция, являющаяся решением на-
чальной задачи
˙
(3.4)
F
0 = -F0A0 (t), F0(t) = En
с единичной матрицей En. Заметим, что условие (3.3), которое называют
неявным критерием управляемости на подпространство, для стационарной
динамической системы эквивалентно требованию [12]
(
)
(3.5)
rank
H1B0, H1A0B0, ... , H1An-10B0
=n1.
При выполнении предположения 3 в первой базовой задаче существуют
допустимые управления, а тогда эта задача имеет единственное решение [14],
которое является нормальной экстремалью. Последнее означает, что принцип
максимума [6, 15] в данном случае может быть сформулирован следующим
образом: пусть u0(t), y0(t), t ∈ T ,
оптимальные управление и траектория
в задаче (3.1), тогда существует такой вектор множителей Лагранжа λ0 раз-
мерности n1, что выполняется условие
1
ψ0T(t)B0(t)u0(t) -
u0T(t)P(t)u0(t) =
2
(
)
1
= max
ψ0T(t)B0(t)u -
uTP(t)u
,
t∈T,
u∈Rr
2
где ψ0(t), t ∈ T , решение сопряженной системыψ = -AT0(t)ψ, ψ(t) = HT1λ0.
Отсюда непосредственно следует, что
(3.6)
u0(t) = P-1(t)BT0(t)ψ0
(t), t ∈ T.
Заметим, что
(3.7)
ψ0T (t) = λT0H1F0 (t), ψ0T(t)B0(t) = λT0H1Φ0
(t) , t ∈ T,
где
(3.8)
Φ0 (t) = F0 (t)B0
(t) , t ∈ T.
В силу (3.6), (3.7) и формулы Коши имеем равенство
(3.9)
H1y0(t) = H1F0 (t)y + H1C1HT1λ0 = g1,
где
t
(3.10)
C1 = Φ0 (t) P-1 (t)ΦT0
(t) dt.
t
При выполнении предположения 3 матрица H1C1HT1 будет невырожденной, в
чем можно легко убедиться, опираясь на неявный критерий управляемости на
подпространство. Поскольку λ0 определяется однозначно, то оптимальному
управлению в первой базовой задаче соответствует, в силу сформулирован-
ного принципа максимума, единственный вектор сопряженных переменных.
32
4. Вторая базовая задача
На втором этапе вычислений решается задача оптимального управления
с бесконечной длительностью процесса
dz
= A4(t)z + B2(t)u,
ds
(
)
H2z(0) = H2A-14 (t)
A3(t)y0 (t) + B2(t)u0(t)
+g2,
(4.1)
0
1
z(-∞) = 0, J2(u) =
uTP(t)uds → min,
2
-∞
которую будем называть второй базовой.
Предположение 4. Выполнен критерий управляемости на подпро-
странство
(
)
rank
H2B2(t), H2A4(t)B2(t), ... , H2Am-14(t)B2(t)
=m1.
Это предположение гарантирует существование допустимых управлений
во второй базовой задаче. Отсюда, в свою очередь, следует, что задача (4.1)
имеет единственное решение [14] и является нормальной. В этом случае прин-
цип максимума [6] для нее может быть сформулирован следующим образом:
пусть u (s), z (s), s ≤ 0,
оптимальные управление и траектория в зада-
че (4.1), тогда существует такой вектор множителей Лагранжа ν0 размерно-
сти m1, что выполняется условие
1
ΠψT (s) B2 (t) u (s) -
u∗T (s)P (t)u (s) =
2
(
)
1
= max
ΠψT (s) B2 (t) u -
uTP (t) u
,
s ≤ 0,
u∈Rr
2
где Πψ (s), s ≤ 0, решение сопряженной системы
d
Πψ = -AT4(t)Πψ, Πψ(0) = HT2ν0.
ds
Отсюда непосредственно следует, что
(4.2)
u(s) = P-1(t)BT2(t
)Πψm(s), s ≤ 0.
Заметим, что
(4.3)
ΠψT (s) = νT0H2G (s) , ΠψT (s) B2 (t) = νT0H2
ΠΦ (s) , s ≤ 0,
где
(4.4)
ΠΦ (s) = G (s) B2 (t
), s ≤ 0,
33
а G(s), s ≤ 0, (m × m)-матричная функция, удовлетворяющая дифферен-
циальному уравнению
dG
(4.5)
= -GA4 (t) , G(0) = Em.
ds
Введем обозначение
0
(
)
(4.6)
C3 =
ΠΦ(s)P-1(t)ΠΦT(s)
ds.
−∞
В силу предположения 4 матрица H2C3HT2 будет невырожденной, а посколь-
ку, как следует из (4.2), (4.3) и формулы Коши,
(4.7)
H2z (0) = H2C3HT2ν0,
то оптимальному управлению во второй базовой задаче соответствует, в силу
принципа максимума, единственный вектор сопряженных переменных.
Подчеркнем, что единственная информация о решении второй базовой за-
дачи, которая используется в дальнейшем при построении асимптотически
субоптимальных управлений, это вектор множителей Лагранжа ν0. Нет
необходимости строить оптимальное управление u(s), s ≤ 0, что, впрочем, и
невозможно, если задача решается численно.
После решения базовых задач формируется матрица
(
)
H
1C1H1
0n1×m1
(4.8)
I0 =
H2C2HT1
H2C3HT
2
размеров (n1 + m1) × (n1 + m1). Матрицы C1, C3 определены ранее форму-
лами (3.10), (4.6), а
(
)
C2 = -A-14(t)
A3(t)C1 + B2 (t) P-1 (t)BT0 (t)
Как было отмечено, H1C1HT1, H2C3HT2 невырожденные матрицы, а тогда
det I0 = 0.
5. Асимптотический анализ решения исходной задачи
Говорить об асимптотически субоптимальных управлениях можно лишь в
том случае, когда исходная задача имеет решение. Убедимся, что при сделан-
ных предположениях в задаче (2.1)-(2.3) с достаточно малым µ существует
оптимальное управление. Доказательство будет конструктивным и предопре-
делит дальнейшие вычисления при построении асимптотически субоптималь-
ных управлений.
Пусть ψ1 (t, λ, ν, µ), ψ2 (t, λ, ν, µ), t ∈ T , решение начальной задачи
ψ1 = -AT1 (t)ψ1 - AT3 (t)ψ2, ψ1 (t) = HT1λ,
(5.1)
µ ψ2 = -AT2 (t)ψ1 - AT4 (t)ψ2, ψ2 (t) = HT2 ν,
34
где λ, ν
векторы размерности n1 и m1 соответственно. Обозначим через
y (t, λ, ν, µ), z (t, λ, ν, µ), t ∈ T , траекторию системы (2.1), порожденную управ-
лением
u(t,λ,ν,µ) =
(5.2)
(
)
= P-1 (t)
BT1 (t)ψ1 (t,λ,ν,µ) + BT2 (t)ψ2 (t,λ,ν,µ)
,
t∈T.
Теорема. При выполнении предположений 1-4 в задаче (2.1)-(2.3) с до-
статочно малым µ существует единственное оптимальное управление, ко-
торое является нормальной экстремалью и представимо в виде
(5.3)
u0
(t, µ) = u (t, λ (µ) , ν (µ) , µ) , t ∈ T.
Оптимальному управлению соответствует, в силу принципа максимума,
вектор сопряженных переменных
1 (t, λ (µ) , µν (µ) , µ) , µψ2 (t, λ (µ) , µν (µ) , µ)) , t ∈ T ,
при этом векторы λ(µ), ν (µ), являющиеся решением системы уравнений
(5.4)
H1y (t,λ,ν,µ) - g1 = 0, H2z (t,λ,ν,µ) - g2
= 0,
допускают асимптотические разложения
(5.5)
λ(µ) ∼ λ0 + µkλk, ν (µ) ∼ ν0 + µkνk,
k=1
k=1
старшие коэффициенты которых есть векторы множителей Лагранжа в
базовых задачах.
Доказательство. Прежде всего покажем, что левые части уравне-
ний (5.4) допускают асимптотические разложения по целым степеням ма-
лого параметра, и получим формулы для коэффициентов этих разложений.
Для сокращения записи введем обозначения η = (λ, ν), η0 = (λ0, ν0), и пусть
x(t, η, µ) = (y(t, η, µ), z(t, η, µ)), t ∈ T . В силу формулы Коши, используя обо-
значения (2.4), имеем
t
(5.6)
x(t, η, µ) = F (t, µ) x +
F (t,µ)B (t,µ) u(t,η,µ) dt,
t
где F (t, µ), t ∈ T , матричная функция размеров (n + m) × (n + m), которая
является решением начальной задачи
˙
(5.7)
F
= -FA(t,µ) , F (t) = En+m.
Решение этого сингулярно возмущенного уравнения удобно представлять в
блочном виде
(
)
F1 (t, µ) F2 (t, µ)
F (t, µ) =
,
F3 (t,µ) F4 (t,µ)
35
где F1, F2, F3, F4
матрицы размеров n × n, n × m, m × n и m × m соот-
ветственно. С помощью метода пограничных функций [16] они могут быть
разложены в асимптотические ряды:
Fi(t, µ) ∼
µk (Fik(t) + ΠkFi (s)) ,
(5.8)
k=0
s = (t - t)/µ, t ∈ T, i = 1,2,3,4.
Подчеркнем, что выражения (5.8) равномерные по t ∈ T асимптотические
разложения. Отметим как существенный факт также то, что для матричных
функций ΠkFi (s), s ≤ 0, называемых пограничными членами, имеют место
оценки
(5.9)
∥ΠkFi (s)∥ ≤ αk exp (βk
s), i = 1,2,3,4, k = 0,1,... ,
где αk, βk положительные постоянные. Приведем несколько старших коэф-
фициентов разложений (5.8), которые понадобятся при доказательстве тео-
ремы:
F10 = F0 (t), F20 = 0n×m, F30 = -A-14 (t) A3 (t) F0 (t),
F40 = 0m×m, F21 = -F0 (t)A2 (t) A-14 (t),
(5.10)
F41 = A-14 (t)A3 (t)F0 (t)A2 (t) A-14 (t),
Π0F1 = 0n×n, Π0F2 = 0n×m, Π0F3 = G(s) A-14 (t)A3 (t),
Π0F4 = G(s), Π1F2 = A2 (t)A-14 (t)G(s),
где F0 (t), t ∈ T , и G (s), s ≤ 0, решения начальных задач (3.4) и (4.5) со-
ответственно.
Запишем (5.6) в блочном виде
y(t, η, µ) = F1 (t, µ) y + F2 (t, µ) z +
t
+ (F1 (t, µ) B1 (t) + F2 (t, µ) B2 (t) /µ) u (t, η, µ) dt,
t
(5.11)
z(t, η, µ) = F3 (t, µ) y + F4 (t, µ) z +
t
+ (F3 (t, µ) B1 (t) + F4 (t, µ) B2 (t) /µ) u (t, η, µ) dt.
t
Заметим, что
ψT1(t,η,µ) = λTH1F1 (t,µ) + µνTH2F3 (t,µ) ,
ψT2(t,η,µ) = λTH1F2 (t,µ)/µ + νTH2F4 (t,µ).
36
Отсюда и из формул (5.8), (5.10) следует, что имеют место асимптотические
разложения
ψi(t,η,µ) ∼
µkik(t,η) + Πkψi (s,η)) ,
(5.12)
k=0
s = (t - t)/µ, t ∈ T, i = 1,2,
в которых
ψT10(t,η) = λTH1F0 (t), ψT20(t,η) = -λTH1F0 (t) A2 (t)A-14 (t) ,
(
)
ΠT0ψ1(s,η) = 0, ΠT0ψ2 (s,η) =
λTH1A2 (t)A-14 (t) + νTH2
G(s),
ψT1k(t,η) = λTH1F1k (t) + νTH2F3,k-1 (t),
(5.13)
ψT2k(t,η) = λTH1F2,k+1 (t) + νTH2F4k (t),
ΠTkψ1(s,η) = λTH1ΠkF1 (s) + νTH2Πk-1F3 (s) ,
ΠTkψ2(s,η) = λTH1Πk+1F2 (s) + νTH2ΠkF4 (s) ,
k ≥ 0, t ∈ T, s ≤ 0.
Эти разложения будут равномерными в области ∥η - η0∥ < ε0, t ∈ T , где ε0
некоторое положительное число. Отметим, что в силу формул (3.7), (4.3)
имеют место равенства:
(
)T
(5.14)
ψT10(t,η0) = ψ0 (t) , ψT20(t,η0) = -
A2 (t)A-14 (t)
ψ0
(t), t ∈ T,
Π0ψ2 (s,η0) = Πψ (s), s ≤ 0.
Управление (5.2) также допускает равномерное асимптотическое разложение
(5.15)
u(t, η, µ) ∼
µk (uk(t,η) + Πku(s,η)) , s = (t - t
)/µ, t ∈ T,
k=0
где
(
)
uk (t,η) = P-1 (t)
BT1 (t)ψ1k (t,η) + BT2 (t)ψ2k (t,η)
,
(5.16)
Πk
u(s,η) =
)
sj
(dj
dj
=
(P-1BT1)(tk-j ψ1(s, η) +
(P-1BT2)(tk-jψ2(s, η)
,
j! dtj
dtj
j=0
t ∈ T, s ≤ 0, k = 0,1,...
Поскольку наряду с формулами (3.2), (3.6), (4.2) и (5.14) имеет место равен-
ство Π0ψ1(s, η) = 0, то
(5.17)
u0(t,η0) = u0 (t), t ∈ T, Π0u(s,η0) = u
(s) , s ≤ 0.
37
Из (5.8)-(5.10), (5.12), (5.13), (5.15) и (5.16) следует, что вектор-функции
(5.11) разлагаются в асимптотические ряды
(5.18)
y(t, η, µ) ∼
µkyk (η) , z(t,η,µ) ∼
µkzk
(η),
k=0
k=0
в которых
t
y0(η) = F0 (t) y + F0(t)B0(t)u0 (t,η) dt,
t
0
z0(η) = -A-14(t)A3(t)y0(η) +
G(s)B2(t)(u0(t, η) + Π0u(s, η))ds,
-∞
tk
(5.19)
yk(η) = F1k (t)y + F2k (t) z +
F1j (t)B1 (t) uk-j
(t, η) dt +
tj=0
+
F2j (t)B2 (t)uk-j+1 (t,η) dt +
tj=1
0
∑sj dj
+
(F1,k-p-j-1B1)(t) Πpu(s,η) ds +
j! dtj
p=0
j=0
-∞
0
∑sj dj
+
(F2,k-p-j-1B2)(t) Πpu(s,η) ds +
j! dtj
p=0 j=0
-∞
0
)
∑sj
(djB1
j
+
Πk-p-j-1F1(s)
(t) Πpu (s, η) +
(B1up) (t, η) ds +
j!
dtj
∂tj
p=0
j=0
−∞
0
)
∑sj
(djB2
j
+
Πk-p-jF2 (s)
(t) Πpu (s, η) +
(B2up) (t, η) ds,
j!
dtj
∂tj
p=0 j=0
−∞
k ≥ 1.
Для zk(η), k ≥ 1, имеет место аналогичная формула с той лишь разницей, что
F1j заменяется на F3j, а F2j на F4j и что вместо ΠjF1, ΠjF2 соответственно
имеем Πj F3, ΠjF4, j = 0, 1, . . .
С помощью теоремы о неявной функции убедимся, что система уравне-
ний (5.4) однозначно разрешима относительно η при достаточно малых µ.
Запишем (5.4) в виде
(5.20)
R(η,µ) = 0.
38
В силу (5.18) имеет место равномерное в области ∥η - η0∥ < ε0 асимптотиче-
ское разложение
(5.21)
R (η, µ) ∼
µkRk
(η) ,
k=0
в котором R0(η) = (H1y0(η) - g1, H2z0(η) - g2), Rk(η) = (H1yk(η), H2zk(η)),
k = 1,2,... Положим R(η,0) = R0(η), тогда вектор-функция R(η,µ) будет
непрерывной вместе со своими частными производными по компонентам век-
тора η в области ∥η - η0∥ < ε0, 0 ≤ µ < µ0, где µ0 достаточно малое поло-
жительное число.
В силу (5.17), (5.19) и формулы Коши имеем H1y00) = H1y0 (t) = g1.
Матричная функция G (s), s ≤ 0, является решением начальной задачи (4.5),
и поскольку G (s) → 0 при s → -∞, то
0
G(s)B2 (t) u0(t0)ds =
-∞
(5.22)
0
dG
=-
(s)A-14 (t) B2 (t)u0(t)ds = -A-14 (t)B2 (t) u0(t).
ds
-∞
Вместе с тем из (5.17) и формулы Коши следует, что
0
G(s)B2 (t) Π0u(s,η0)ds = z (0) .
-∞
Отсюда и из формул (4.1), (5.19), (5.22) получаем H2z00) = g2. Таким об-
разом, R (η0, 0) = R00) = 0.
Непосредственным дифференцированием вектор-функции (5.19), учиты-
вая
(3.7),
(4.4),
(5.10),
(5.13),
(5.16), убеждаемся, что
∂R0 0,0) /∂η =
= ∂R0 0) /∂η = I0 (см. (4.8)). Поскольку эта матрица Якоби является невы-
рожденной, то для системы (5.20) или, что то же самое, для системы (5.4)
выполнены условия теоремы о неявной функции. Согласно этой теореме в
некоторой правосторонней окрестности нуля 0 ≤ µ < µ1 однозначно определе-
на вектор-функция η (µ) = (λ (µ) , ν (µ)), удовлетворяющая уравнениям (5.4).
Она непрерывна, и η (0) = η0 = (λ0, ν0) .
Как уже отмечалось, разложение (5.21) является равномерным в области
∥η - η0∥ < ε0, а его коэффициенты линейные функции. Тогда для реше-
ния (λ (µ) , ν (µ)) системы (5.4) будут иметь место асимптотические разложе-
ния (5.5).
Рассмотрим управление (5.3). Оно будет допустимым в задаче (2.1)-(2.3),
поскольку для порожденной им траектории y0 (t, µ) = y (t, λ (µ) , ν (µ) , µ),
z0 (t,µ) = z (t,λ(µ),ν (µ),µ), t ∈ T, выполняются условия H1y0(t,µ) = g1,
H2z0(t,µ) = g2. По построению управление (5.3) является нормальной экс-
тремалью Понтрягина с вектором множителей Лагранжа (λ (µ) , µν (µ)). Ему
39
соответствует в силу принципа максимума вектор сопряженных перемен-
ных ψ01 (t, µ) = ψ1(t, λ (µ) , µν (µ) , µ), ψ02 (t, µ) = µψ2(t, λ (µ) , µν (µ) , µ), t ∈ T .
По доказанному в исходной задаче с достаточно малым µ существует допу-
стимое управление. Тогда эта задача имеет единственное решение [14]. Им
будет управление (5.3), поскольку в задачах минимизации выпуклых инте-
гральных функционалов на траекториях линейных систем нормальная экс-
тремаль является оптимальным управлением (см., например, [17]). Теорема
доказана.
6. Построение асимптотически субоптимальных управлений
Продолжим изложение алгоритма построения асимптотических прибли-
жений к решению задачи (2.1)-(2.3), опираясь на утверждения теоремы и
формулы, полученные при ее доказательстве.
Вектор-функция
(
)
u(0)(t,µ) = P-1 (t)
BT1 (t)ψ1(t,η0,µ) + BT2 (t)ψ2(t,η0,µ)
,
t∈T,
будет асимптотически субоптимальным управлением нулевого порядка в ис-
ходной задаче. Заметим, что ее можно сформировать непосредственно после
решения базовых задач. Асимптотически субоптимальное управление N-го
порядка (N ≥ 1) имеет вид
(
)
(6.1)
u(N)(t,µ) = P-1 (t) BT1 (t) ψ1(t,η(N) (µ),µ) + BT2 (t)ψ2(t,η(N) (µ),µ) ,
где
(6.2)
η(N) (µ) =
µkηk, ηk = (λkk
),
k = 1,...,N.
k=0
Для построения управления (6.1) нужно найти коэффициенты λk, νk, k =
= 1, . . . , N, асимптотических рядов (5.5), что можно сделать методом неопре-
деленных коэффициентов, опираясь на разложение (5.21). Для этого разло-
жим с помощью формулы Тейлора вектор-функцию
(
)
µkRk η(N) (µ)
k=0
по степеням µ до порядка N включительно и приравняем коэффициенты
разложения нулю (начиная с коэффициента при µ). В результате получим
невырожденные системы линейных алгебраических уравнений для последо-
вательного нахождения векторов ηk, k = 1, . . . , N:
∂Ri
(6.3)
I0η1 = -R10) , I0ηk = -R20) -
0) ηk-i
,
k ≥ 2.
∂η
i=1
40
Здесь учтено, что коэффициенты разложений (5.19) есть линейные вектор-
функции. Заметим, что в силу структуры (4.8) матрицы Якоби I0 систе-
мы (6.3) расщепляются. Последовательно решая эти системы, находим век-
торы ηk, k = 1, . . . , N, и составляем полиномы (6.2). Чтобы построить управ-
ление (6.1), нужно найти решение начальной задачи (5.1) для сопряженной
системы с
λ= µkλk, ν = µkνk.
k=0
k=0
Сопряженная система является сингулярно возмущенной и, следовательно,
жесткой. Интегрирования жестких систем можно избежать, заменив в (6.1)
вектор-функции ψi (t, η, µ), i = 1, 2, их асимптотическими приближениями
ψ(N)i(t,η,µ) =
µkik (t,η) + Πkψi (s,η)) ,
k=0
s = (t - t)/µ, t ∈ T, i = 1,2.
Вектор-функция
(
(
)
u(N)(t,µ) = P-1 (t) BT1 (t) ψ(N)
t,η(N) (µ),µ
+
1
(
))
+ BT2 (t)ψ(N)2 t,η(N) (µ),µ
,
t∈T,
наряду с (6.1) будет асимптотически субоптимальным управлением N-го по-
рядка в задаче (2.1)-(2.3). В частности, как следует из (3.6), (3.7), (4.2), (5.13)
и (5.14),
(
)
u(0)(t,µ) = P-1(t)
BT0(t)ψ0(t) + BT2(t)Πψ ((t - t)/µ)
=
(6.4)
= u0 (t) + u((t - t)/µ), t ∈ T.
Вектор-функция (6.4) есть асимптотически субоптималное управление нуле-
вого порядка, что также видно из формул (5.15), (5.17). Заметим, что управ-
ление (6.4) не зависит от начального состояния z вектора быстрых перемен-
ных и при малых µ будет существенно отличатся от решения u0(t), t ∈ T ,
первой базовой задачи лишь в пограничном слое, т.е. в некоторой левосто-
ронней окрестности точки t.
Замечание 1. Для построения асимптотически субоптимального управле-
ния N-го порядка в исходной задаче достаточно найти асимптотическое при-
ближение для R (η, µ) с точностью порядка µN+1. Это предъявляет к гладко-
сти элементов матриц, формирующих задачу, следующее требование [16]: они
должны иметь непрерывные производные до порядка N + 1 включительно.
Замечание 2. Из доказательства теоремы видно, что допустимое управле-
ние вида (5.3) существует и в случае, когда элементы матриц, формирую-
щих динамическую систему в задаче (2.1)-(2.3), непрерывно дифференци-
руемы, а поскольку в этой задаче (y, z) произвольное начальное состоя-
ние, то такое предположение вместе с предположениями 1 и 3 гарантирует
41
управляемость динамической системы на отрезке [t, t] относительно под-
пространства H1y = 0, H2z = 0. Это утверждение в случае полной управляе-
мости (H1 = En, H2 = Em) приводит к результату, полученному в [18].
Построенные асимптотические приближения множителей Лагранжа, ко-
торые являются решением системы уравнений (5.20), можно использовать
для нахождения оптимального управления в задаче (2.1)-(2.3) с заданным
значением µ. Для этого нужно применить процедуру доводки [19], т.е. най-
ти методом Ньютона корни системы (5.20), взяв в качестве начального при-
ближения η(N) (µ). Чтобы избежать интегрирования жестких систем, вместо
матрицы ∂R (η, µ) /∂η можно воспользоваться ее асимптотическим прибли-
жением I0.
7. Асимптотически субоптимальный синтез
Программные асимптотически субоптимальные управления, разумеется,
зависят от начального состояния (y, z, t) динамической системы. Ранее та-
кая зависимость не учитывалась, поскольку начальное состояние считалось
заданным. В настоящем разделе, который посвящен построению асимптоти-
чески субоптимальной обратной связи нулевого порядка, будем интересовать-
ся именно этой зависимостью. В дальнейшем будем рассматривать матри-
цу C1 как функцию t, t < t. Момент t по-прежнему считается заданным.
Из равенства (3.9) следует, что
(
)-1
(7.1)
λ0 =
H1C1 (t)HT1
(g1 - H1F0(t)y
),
а так как ψ0 (t) = FT0 (t) ψ0 (t) = FT0 (t) HT1 λ0, то
(7.2)
ψ0 (t) = M1(t)(g1 - H1F0(t)y
),
(
)-1
где M1 (t) = FT0 (t)T1
H1C1 (t)HT1
В силу (4.1) и (4.7) справедливо равенство
(
)-1
ν0 =
H2C3HT2
H2z (0) =
(
)-1 (
(
)
)
=
H2C3HT2
H2A-14 (t)
A3 (t)y0 (t) + B2 (t)u0 (t)
+g2
,
из которого и формул (3.6) (3.10), (7.1), (7.2) следует, что
Πψ(s) = GT(s)Πψ(0) = GT(s)HT2ν0 =
(7.3)
= M2(s)(H2A-14(t)(A3(t)y0(t) + B2(t)u0(t)) + g2
)=
= M2(s)(H2A-14(t)(A3(t)F0(t)y + M3(t)(g1 - H1F0(t)y)) + g2), s ≤ 0,
где
(
M2 (s) = GT (s)HT2
H2C3HT2
)-1 ,
(
)
(
)-1
M3 (t) =
A3 (t) C1 (t) + B2 (t) P-1 (t)BT0 (t)
HT1
H1C1 (t)HT1
42
Как видно из (6.4), (7.2) и (7.3), асимптотически субоптимальное управ-
ление нулевого порядка в начальный момент времени представимо в виде
(
u(0)(t,µ) = P-1(t) BT0(t)M1 (t)H1 - BT2(t)M2 ((t - t)/µ)×
)
× H2A-14 (t)(A3 (t) - M3 (t) H1) F0 (t) y -
- P-1(t)(M1 (t)g1 + M2 ((t - t) /µ) (g2 + M3 (t) g1)).
Поскольку (y, z, t) произвольное начальное состояние динамической си-
стемы, то по определению 2 вектор-функция
u(0)(t,y,z,µ) =
(
= P-1(t) BT0 (t)M1(t)H1 - BT2 (t)M2((t - t)/µ)H2A-14(t) ×
)
(7.4)
× (A3(t) - M3(t)H1) F0(t)y -
(
)
− P-1(t) M1(t)g1 + M2((t - t)/µ)(g2 + M3(t)g1)
представляет собой асимптотически субоптимальную обратную связь нуле-
вого порядка в исходной задаче. Отметим, что построенная обратная связь
не зависит от текущей позиции вектора быстрых переменных z.
8. Пример
Рассмотрим задачу переориентации динамически симметричного твердого
тела, вращающегося вокруг оси симметрии:
y1 = z1,
y2 = z2, µŻ1 = -cz1 - kz2 + bu1, µ Ż2 = kz1 - cz2 + bu2,
y1 (t) = y∗1, y2 (t) = y∗2,
z1 (t) = 0, z2 (t) = 0,
(8.1)
y1 (t) = 0, z1 (t) = 0,
t
1
(
)
J (u) =
u21 + u22
dt → min .
2
t
Постоянные µ, b, c, k положительны, при этом µ ≪ 1. Построим асимптоти-
чески субоптимальные управление и обратную связь нулевого порядка в этой
задаче. Предположения 1 и 2 в данном случае выполнены.
Для динамической системы в первой базовой задаче
cbu1 - kbu2
kbu1 + cbu2
y1 =
,
y2 =
,
c2 + k2
c2 + k2
y1 (t) = y∗1, y2 (t) = y∗2, y1 (t) = 0,
t
1
(
)
J1 (u) =
u21 + u22
dt → min
2
t
43
выполнено требование (3.5) и, следовательно, выполнено предположение 3.
Оптимальное управление в этой задаче представимо в виде
cy∗1
ky∗1
u01 (t) = -
,
u02 (t) =
,
t ∈ T = [t,t],
b (t - t)
b(t - t)
и не зависит от времени.
Вторая базовая задача имеет вид
dz1/ds = -cz1 - kz2 + bu1, dz2/ds = kz1 - cz2 + bu2z1 (0) = y∗1/ (t - t) ,
zi (-∞) = 0, i = 1,2,
0
1
(
)
J2 (u) =
u21 + u22
ds → min .
2
−∞
Предположение 4 в данном случае выполнено. Решением второй базовой за-
дачи является управление
2c exp(cs) cos (ks)
2c exp(cs) sin (ks)
u∗1 (s) =
y∗1, u∗2 (s) =
y∗1, s ≤ 0.
b(t - t)
b(t - t)
Согласно формуле (6.4) асимптотически субоптимальное управление ну-
левого порядка в задаче (8.1) представимо в виде
(8.2)
u(0)i(t,µ) = u0i (t) + u∗i ((t - t
) /µ) , t ∈ T, i = 1, 2.
Асимптотически субоптимальная обратная связь нулевого порядка, кото-
рая строится по формуле (7.4), имеет вид:
u(0)1 (y,z,t,µ) =2cexp(c(t-t)/µ)cos(k(t-t)/µ)-cy1,
b (t - t)
(8.3)
)/µ) + k
u(0)2 (y,z,t,µ) =2cexp(c(t-t)/µ)sin(k(t-t
y1.
b (t - t)
Заметим, что в данном примере выражение (8.3) для асимптотически суб-
оптимальной обратной связи следует не только из общей формулы (7.4), но
и из формулы (8.2) и приведенных выше выражений для решения базовых
задач.
Для оценки качества построенных асимптотических приближений к ре-
шению задачи (7.2) были найдены состояния (y1(t, µ), z1(t, µ)), в которые
управление (8.2) (обратная связь (8.3)) переводит динамическую систему при
конкретных значениях малого параметра в случае, когда b = 4, c = 3, t = 0,
t = 4, k = 1, y∗1 = -2, y∗2 = 1. В частности, оказалось, что
y1(4, 0,1) = -0,03, z1(4, 0,1) = 0, y1(4, 0,001) = 0,0003, z1(4, 0,001) = 0.
Результаты вычислений приведены с точностью до 10-6.
44
9. Заключение
В статье предложены и обоснованы вычислительные процедуры построе-
ния асимптотических приближений к решению рассмотренной задачи в виде
программы и обратной связи. При реализации предлагаемых алгоритмов ис-
ходная задача оптимального управления распадается на две невозмущенные
задачи меньшей размерности. Такая декомпозиция позволяет эффективно ре-
шать задачи оптимизации динамических систем с большим числом фазовых
переменных. Кроме того, вычислительные процедуры алгоритмов не содер-
жат интегрирований жестких систем.
СПИСОК ЛИТЕРАТУРЫ
1.
Дмитриев М.Г. Курина Г.А. Сингулярные возмущения в задачах управления //
АиТ. 2006. № 1. С. 3-51.
Dmitriev M.G., Kurina G.A. Singular Perturbation in Control Problems // Autom.
Remote Control. 2006. V. 67. No. 1. P. 1-43.
2.
Калинин А.И. Асимптотика решений возмущенных задач оптимального управ-
ления // Изв. РАН. Техн. кибернетика. 1994. № 3. C. 104-114.
Kalinin A.I. Asymptotics of the Solutions of Perturbed Optimal Control Problems //
J. Comput. Syst. Sci. 1995. V. 33. No. 6. P. 75-84.
3.
Zhang Y., Naidu D.S., Cai C., Zou Y. Singular Perturbations and Time Scales in
Control Theories and Applications: An Overview 2002-2012 // Int. J. Inform. Syst.
Sci. 2014. V. 9. No. 1. P. 1-36.
4.
Kokotovic P.V., Khalil H.K. Singular Perturbations in Systems and Control.
N.Y.: IEEE Press, 1986.
5.
Ракитский Ю.В. Устинов С.М., Черноруцкий И.Г. Численные методы решения
жестких систем. М.: Наука, 1979.
6.
Понтрягин Л.С., Болтянский В.Г. Гамкрелидзе Р.В., Мищенко Е.Ф. Матема-
тическая теория оптимальных процессов. М.: Наука, 1983.
7.
Kokotovic P.V., Jackel R.A. Singular Perturbation of Linear Regulators: Basic The-
orems // IEEE Trans. Automat. Control. 1972. V. 17. No. 1. P. 29-37.
8.
Wilde R.R., Kokotovic P.V. Optimal Open- and Closed Loop Control of Singularly
Perturbed Linear Systems // IEEE Trans. Automat. Control. 1973. V. 18. No. 6.
P. 616-626.
9.
Глизер В.Я., Дмитриев М.Г. Сингулярные возмущения в линейной задаче опти-
мального управления с квадратичным функционалом // Докл. АН СССР. 1975.
Т. 225. № 5. C. 997-1000.
10.
O’Malley R.E.Jr. Singular Perturbation and Optimal Control // Lect. Notes. Math.
1978. V. 680. P. 171-218.
11.
Калинин А.И., Лавринович Л.И. Применение метода малого параметра к сингу-
лярно возмущенной линейно-квадратичной задаче оптимального управления //
АиТ. 2016. № 5. С. 3-18.
Kalinin A.I., Lavrinovich L.I. Application of the Small Parameter Method to the
Singularly Perturbed Linear-Quadratic Optimal Control Problem // Autom. Remote
Control. 2016. V. 77. No. 5. P. 751-763.
12.
Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов.
М.: Наука, 1971.
45
13. Калинин А.И. О проблеме синтеза оптимальных систем управления // Журн.
вычисл. матем. и матем. физ. 2018. Т. 58. № 3. С. 397-402.
Kalinin A.I. To the Synthesis of Optimal Control Systems // Comput. Math. Math.
Phys. 2018. V. 58. No. 3. P. 378-383.
14. Мордухович Б.Ш. Существование оптимальных управлений // Соврем. пробл.
матем. (Итоги науки и техники). М.: ВИНИТИ, 1976. Т. 6. C. 207-271.
15. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. М.: Мир,
1972.
16. Васильева А.Б., Бутузов В.Ф. Асимптотические разложения решений сингу-
лярно возмущенных уравнений. М.: Наука, 1973.
17. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М: Наука, 1972
18. Giиev T.R., Dontchev A.L. Singular Perturbation in Optimal Control Problems with
Fixed Final State // Докл. Болгар. АН. 1978. Т. 31. No. 8. C. 935-955.
19. Габасов Р., Кириллова Ф.М. Конструктивные методы оптимизации. Ч. 2. Минск:
Изд-во Университетское, 1984.
Статья представлена к публикации членом редколлегии М.М. Хрусталевым.
Поступила в редакцию 27.02.2019
После доработки 23.07.2019
Принята к публикации 28.11.2019
46