Автоматика и телемеханика, № 1, 2022
Линейные системы
© 2022 г. А.Р. ДАНИЛИН, д-р физ.-мат. наук (dar@imm.uran.ru),
А.А. ШАБУРОВ, канд. физ.-мат. наук (alexandershaburov@mail.ru)
(Институт математики и механики им. Н.Н. Красовского РАН, Екатеринбург)
АСИМПТОТИКА РЕШЕНИЯ СИНГУЛЯРНО
ВОЗМУЩЕННОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
С ЭЛЛИПСОИДАЛЬНЫМ ОГРАНИЧЕНИЕМ НА УПРАВЛЕНИЕ
Основное отличие статьи от предыдущих публикаций авторов заклю-
чается в том, что интегральная часть функционала качества имеет более
общий вид и ограничения на управление определяются не шаром, а эл-
липсоидом. Доказано, что в случае конечного числа точек смены вида
оптимального управления можно построить асимптотику начального век-
тора сопряженного состояния lε, который определяет вид оптимального
управления. Показано, что асимптотика имеет степенной характер.
Ключевые слова: оптимальное управление, сингулярно возмущенные за-
дачи, асимптотические разложения, малый параметр.
DOI: 10.31857/S0005231022010019
1. Введение
Статья посвящена исследованию асимптотики вектора сопряженного со-
стояния в задаче оптимального управления [1-3] линейной системой с быст-
рыми и медленными переменными (см. обзор [4]), с интегральным выпуклым
функционалом качества [3, гл. 3] и ограничениями на управление в виде эл-
липсоида.
В публикациях [5, 6] рассматривались проблемы, связанные с предельной
задачей для задач оптимального управления линейной системой с быстры-
ми и медленными переменными. В других постановках асимптотика реше-
ний возмущенных задач управления рассматривалась в [7-9]. Отметим, что
данный вид управляемой системы, но с терминальным критерием качества,
зависящим только от медленных переменных, был рассмотрен в [8]. В [10]
рассмотрена задача с функционалом качества, зависящим от медленных и
быстрых переменных, но с верхнетреугольной матрицей системы.
В данной статье получено полное асимптотическое разложение вектора
сопряженной системы, определяющего оптимальное управление. Главной от-
личительной особенностью задачи от рассмотренной в [11] является более
общий вид критерия управления и ограничивающего множества для допу-
стимых управлений.
3
Отметим, что в отличие от [11] в рассматриваемом случае оптимальное
управление определяется неявно заданной функцией и построение асимпто-
тического разложения по сравнению с [11] существенно усложняется.
2. Постановка задачи
Пусть управляемая система содержит быстрые и медленные переменные,
а терминальная часть функционала качества зависит только от медленных
переменных:
xε = A11xε + A12yε
B1u,
t ∈ [0,T],
∥Du∥ ≤ 1,
εyε =A21xε +A22yε
B2u,
xε(0) = x0, yε(0) = y0,
(1)
T
D
E
Qu(t), u(t) dt → min,
ε(u):= ϕ(xε(T)) +
J
0
где xε ∈ Rn, yε ∈ Rm, u ∈ Rr; Aij ,
Bi, i,j = 1,2,
постоянные веществен-
нозначные матрицы соответствующей размерности, квадратная веществен-
нозначная матрица D невырожденная, вещественнозначная матрицаQ сим-
метрическая и положительная, а ϕ(·) - непрерывно дифференцируемая на Rn
строго выпуклая и кофинитная функция (в смысле выпуклого анализа)
[12, § 13].
Нормы во всех рассматриваемых пространствах будем обозначать через
∥ · ∥, а скалярные произведения через 〈·,·〉.
Если M матрица, то, как и в [1, с. 134, формула (5)], M оператор,
сопряженный к оператору M, т.е. оператор, определяемый матрицей, полу-
чающейся из матрицы M транспонированием.
Приведем задачу (1) к некоторому “каноническому” виду.
Обозначив v := Du, получим, что ∥v∥ ≤ 1, а
D
E D
E
Qu(t), u(t)
= (D-1) QD-1v(t), v(t)
Так как матрицаD := (D-1) QD-1 > 0, то существует ортогональная мат-
рица P такая, что Q := P-1 DP = diag{q1, . . . , qr} (см., например, [13, гл. 4, § 7,
теорема 2]).
Обозначив u := P-1v, а Bi :
BiD-1P (i = 1,2), в силу ∥Pu∥ = ∥u∥ получим
следующую задачу оптимального управления
xε = A11xε + A12yε + B1u,
t ∈ [0,T],
∥u∥ ≤ 1,
εyε = A21xε + A22yε + B2u,
xε(0) = x0, yε(0) = y0,
T
(2)
Jε(u):= ϕ(xε(T)) +
〈Qu(t), u(t)〉 dt → min,
0
где Q = diag{q1, . . . , qr} > 0.
4
Отметим, что функция 〈Qu, u〉 строго выпукла по u.
В дальнейшем будем изучать задачу (2), при этом, не ограничивая общ-
ности, будем считать, что
(3)
0<q1 ≤...≤qr.
При каждом фиксированном ε > 0 управляемая система из (2) имеет вид:
Żε = Aεzε + Bεu,
где
(
)
(
)
xε(t)
x0
zε(t) =
,
zε(0) = z0
:=
,
yε(t)
y0
(
)
(
)
A
11
A12
B1
Aε :=
,
Bε :=
ε-1A21
ε-1A22
ε-1B2
Определение 1. Будем говорить, что пара матриц (A,B) вполне
управляема, если вполне управляема система x = Ax + Bu.
Предположение 1. При всех достаточно малых ε > 0 пара матриц
(
(Aε, Bε) вполне управляема, т.е. rank
Bε,AεBε,... ,An+m-1εBε) = n + m.
Отметим, что пара матриц (Aε, Bε) из (2) вполне управляема тогда и толь-
ко тогда, когда вполне управляема пара матриц (Aε
Bε) из (1).
Предположение 2. Все собственные значения матрицы A22 имеют
отрицательные вещественные части.
Определение 2. Вырожденной задачей для (2) называется задача
x0 = A0x0 + B0u,
A0 := A11 - A12A-122A21,
x0(0) = x0, t ∈ [0,T],
∥u∥ ≤ 1,
B0 := B1 - A12A-122B2,
(4)
T
J0(u):= ϕ(x0(T)) +
〈Qu(t), u(t)〉 dt → min,
0
которая определяется формальной подстановкой ε = 0 в (2).
Предположение 3. Пары матриц (A0,B0) и (A22,B2) вполне управ-
ляемы.
Отметим, что выполнение предположений 2 и 3 влечет выполнение пред-
положения 1 [6, теорема 1].
В рассматриваемом интегральном выпуклом функционале качества Jε
первое слагаемое можно интерпретировать как штраф за ошибку управле-
ния в конечный момент времени T , а второе как учет энергозатрат на
реализацию управления.
5
Основная задача, которая ставится для (2), есть нахождение полного
асимптотического разложения по степеням малого параметра ε оптимального
управления u, оптимального значения функционала качества Jε и оптималь-
ного процесса (xε(t), yε(t)).
3. Основное уравнение
При выполнении предположения 1 принцип максимума Понтрягина есть
необходимое и достаточное условие оптимальности, которое дает единствен-
ное решение задачи (2) [3, п. 3.5, теорема 14]. Для рассматриваемой задачи
этот принцип имеет следующий вид: существует единственная пара (z, η)
решение системы уравнений
{
Żε = Aεzε + Bεuopt,
(5)
η = -A∗εη
с граничными условиями
 zε(0) = z0,
)
(6)
( ∇ϕ(x(T))
η(T ) = -
,
0
где единственное управление uopt определяется из принципа максимума
[3, с. 258]:
- Quopt(t),uopt(t)
+ B∗εη(t),uopt(t) =
(7)
= max
(-〈Qu, u〉 + 〈B∗εη(t), u〉) = - min
(〈Qu, u〉 - 〈B∗ε
η(t), u〉)
∥u∥≤1
∥u∥≤1
и является оптимальным управлением в задаче (2).
Здесь и далее ∇ϕ(·) градиент выпуклой функции ϕ(·).
В общем случае оптимальное управление uopt(t) зависит от параметра ε
и в дальнейшем будет обозначаться как uεpt(t).
Применяя условие максимума
(7), выразим оптимальное управление
uεpt(t) через функцию B∗εη(t).
Если при фиксированном значении t максимум в (7) достигается во внут-
ренней точке, то согласно теореме Ферма градиент функции
(-〈Qu, u〉 + 〈B∗εη(t), u〉)
по переменной u равен нулю. Откуда получаем:
1
uoptε(t) =
Q-1B∗εη(t).
2
Из условия ∥uεpt(t)∥ < 1 получим, что ∥Q-1B∗εη(t)∥ < 2.
6
Для нахождения значения оптимального управления, которое достигается
на границе ∥uεpt(t)∥ = 1, т.е. для нахождения соответствующего максимума
в (7), можно применить теорему о достаточных условиях условного экстрему-
ма в форме множителей Лагранжа (или с учетом выпуклости 〈Qu, u〉 и ∥u∥2
теорему Куна-Таккера о задаче выпуклого программирования, рассмотрев
задачу на минимум в (7)). Функция Лагранжа в рассматриваемом случае
имеет вид
(
)
L(u, µ) = -〈Qu, u〉 + 〈B∗εη(t), u〉 - µ
∥u∥2 - 1
Поскольку∂∂u L(u, µ) = -2Qu + B∗εη(t) - 2µu, то u, на котором достигается
максимум, удовлетворяет уравнению
L(u, µ) = 0 и условию ∥uεpt(t)∥ = 1.
∂u
Поэтому
1
uoptε(t) =
(Q + µI)-1B∗εη(t)
2
и, следовательно,
(8)
(Q + µI)-1B∗εη(t)
= 2.
2
Так как
L(u, µ) = -2Q - 2Iµ, то для локального максимума доста-
∂u2
точно выполнения неравенства Q + µI > 0, т.е. µ > -q1. Но на интервале
(-q1, +∞) уравнение (8) имеет единственное решение µ, которое при усло-
вии ∥Q-1B∗εη(t)∥ ≥ 2 неотрицательно.
Таким образом, оптимальное управление uεpt(t) имеет вид
(9)
uoptε(t) = S(B∗ε
η(t)),
где функция S(·) определена следующим образом:
1
Q-1ξ,
∥Q-1ξ∥ < 2,
2
(10)
S(ξ) :=
(Q + µ(ξ)I)-1ξ
S(ξ) :=
,
∥(Q + µ(ξ)I)-1ξ∥ = 2,
2
∥Q-1ξ∥ ≥ 2, µ(ξ) ≥ 0.
Пусть λε := η(T ), тогда в силу (5) и (6):
(
)
lε
η(t) = eAε(T-t)λε, где λε =
0
Обозначим:
)
( W11(t,ε) W12(t,ε)
eAεt =: W(t,ε) =
,
W21(t,ε) W22(t,ε)
Cε(t):= W11(t,ε)B1 + ε-1W12(t,ε)B2.
7
Тогда
B∗εη(t) = B∗εeAε(T-t)λε = C∗ε(T - t)lε
и в силу (9)
(11)
uoptε(t) = S(C∗ε(T - t)lε
).
Для нахождения асимптотического разложения вектора lε удобно продол-
жить функци
S(ξ) на более широкое множество. Поскольку функция
2
(12)
F (ξ, µ) :=
(Q + µI)-1ξ
−4
по переменной ξ - непрерывна, строго убывает при µ ∈ (-q1, +∞) и
F (ξ, +∞) = -4 < 0,
то естественным расширение
S(ξ) будет новая функция (обозначение этой
функции оставим старое), определенная на множестве
{
}
D
S):= ξ:∃µ>-q1
F (ξ, µ) > 0
,
и такая, чт
S(ξ) единственное решение уравнения
F (ξ, µ) = 0, µ > -q1.
Замечание 1. Функци
S(ξ) совпадает с S(ξ) только при ∥Q-1ξ∥ ≥ 2,
поэтому функци
S(B∗εη(t)), вообще говоря, не есть оптимальное управление
и не удовлетворяет (7).
Утверждение 1. Функци
S(ξ) бесконечно дифференцируема на D
S)
и
S(ξ)
Δξ =
∂ξ
D
E
(13)
-2 ξ,Δξ
(Q + µ(ξ)I)
1
=-
D
E (Q + µ(ξ)I)-2 ξ - (Q + µ(ξ)I)-1 Δξ .
2
(Q + µ(ξ)I)-3 ξ,ξ
D
E
S(ξ)
Утверждение 2. При всех ξ∈D
S) и при всех Δξ:
Δξ,Δξ
≥ 0.
∂ξ
Утверждение 3. Функция S(ξ) бесконечно дифференцируема при
∥Q-1ξ∥ = 2 и липшицева на Rr.
Из этого утверждения следует, что оптимальное управление непрерывно
на [0, T ]. Кроме этого, если lε - вектор, определяющий оптимальное управле-
ние, а lN,ε - его приближение, которое удовлетворяет условию
∥lε - lN,ε∥ = O(εN ), ε → +0,
8
то
uoptε(t) - S(C∗ε(T - t)lN,ε)= O(εN ), ε → +0.
Поэтому асимптотическое разложение вектора lε дает асимптотическое
разложение оптимального управления, следовательно, и состояния управляе-
мой системы.
В силу формулы Коши, вида оптимального управления (11) и свойств
кофинитных функций [12, теорема 26.6] второе равенство из (6) эквивалентно
соотношению (в интеграле сделана замена переменной τ := T - t)
T
(14)
∇ϕ(-lε) = W11(T,ε)x0 + W12(T,ε)y0 + Cε(t)S(C∗ε(t)lε
)dt,
0
где ϕ - сопряженная функция к функции ϕ в смысле выпуклого анализа.
Отметим, что свойства функци
S(ξ) таковы, что построение и обоснова-
ние асимптотического разложения вектора lε можно проводить по стандарт-
ной схеме (см., например, [11]). Кратко эта схема описана в разделах 4-6.
4. Асимптотика матричной экспоненты
и основные соотношения
Рассматривая eAεt как фундаментальную матрицу W(t, ε) решения систе-
мы в задаче (2) в случае uε ≡ 0 и следуя методу пограничных функций [14]
при выполнении предположения 2, получаем для W(t, ε) равномерное на от-
резке [0, T ] асимптотическое разложение при ε → 0:
∑ (
)
t
eAεt =: W(t,ε) ∼
εk Wk(t) +Wk(τ) ,
τ :=
,
ε
k=0
где для блоков Wij (t, ε) справедливы асимптотические разложения, равно-
мерные на t ∈ [0, T ] при каждом фиксированном k ≥ 0:
(
)
)
( W11,k(t) W12,k(t)
W11,k(τ)
W12,k(τ)
Wk(t) =
,
Wk(τ) =
W21,k(t) W22,k(t)
W21,k(τ)
W22,k(τ)
Здесь Wk(t),
Wk(τ) бесконечно дифференцируемые матричнозначные
функции, которые определяются из равенстваddt W(t, ε) = AεW(t, ε) и началь-
ных условий W(0, ε) = I. В [15, формулы (2.4)-(2.8), с. 125] приведены фор-
мулы для построения этих разложений. В частности (при τ := t/ε),
W11,0(t) = eA0t,
W12,0(t) ≡ 0,
W21,0(t) = -A-122A21eA0t,
W11,0(τ) ≡ 0,
W12,0(τ) ≡ 0,
W21,0(0) = eA22τ A-122A21,
(15)
W22,0(t) ≡ 0,
W22,0(τ) = eA22τ , W12,1(t) = -eA0tA12A-122,
W1
2,1(τ) = A12A
eA22τ .
2
9
Отметим, что всеWij,k(τ) экспоненциально убывают при τ → +∞ (см.,
например, [15, утверждение 2.1]).
Из формул (15) простым вычислением получим, что при ε → +0 [15, фор-
мулы (2.19)-(2.21)]
Cε(t) = C0(t) + A12A-122eA22τ B2 + O(ε2),
d
(16)
Cε(t) =
C0(t) + ε-1A12eA22τ B2 + A12eA22τ A-122A21B1 +
∂t
dt
(
)
+ A11A12A-122eA22τ + A12
B22,1(τ) B2 + O(ε).
Теорема 1. Пусть выполнены предположения 1 и 2. Тогда
lε → l0 при ε → +0,
где lε - единственное решение уравнения (14), а l0 - единственное решение
уравнения
T
(17)
∇ϕ(-l0) = eA0tx0 + C0(t)S(C∗0(t)l0
)dt.
0
Доказательство этой теоремы почти дословно (с соответствующими изме-
нениями) повторяет доказательство теоремы 1 из [11].
Отметим также, что uopt0(t) = S(C∗0(T - t)l0) есть единственное оптималь-
ное управление в вырожденной задаче (4).
5. Точки смены вида подынтегрального выражения
Если на промежутке [t1, t2] ⊂ [0, T ] выполняется условие
∀t ∈ [t1,t2]
Q-1C∗ε(t)lε
< 2
либо
∀t ∈ [t1,t2]
Q-1C∗ε(t)lε
> 2,
то S(C∗ε(t)lε) на этом промежутке определяется одной из двух формул
Q-1C∗ε(t)lε
(18)
либо
S(C∗ε(t)lε
).
2
Интеграл из равенства (14) на этом промежутке будет иметь вид
t2
t2
1
CεQ-1C∗ε(t)lεdt
либо
Cε(t
S(C∗ε(t)lε)dt.
2
t1
t1
Определение 3. Точки ti,ε решения уравнения ∥Q-1C∗ε(t)lε∥ = 2 бу-
дем называть точками смены вида подынтегрального выражения в (14), а
точки ti,0 решения уравнения ∥Q-1C∗0(t)l0∥ = 2 будем называть точками
смены вида подынтегрального выражения в (17).
10
Замечание 2. В дальнейшем точки смены вида подынтегрального вы-
ражения будем называть просто точками смены в (14) или в (17) соответ-
ственно.
Отметим, что в силу формулы (14) решения уравнения ∥Q-1C∗ε(t)lε∥ = 2
не будут временами смены вида оптимального управления. Если tε ре-
шение этого уравнения, то соответствующее ему время смены оптимального
управления равно T - tε.
Из формул (16) следует, что при t ∈ [√ε, T ] справедливы асимптотические
формулы
d
Cε(t) = C0(t) + O(ε),
Cε(t) =
C0(t) + O(ε), ε → 0.
∂t
dt
При t ∈ [0,
√ε] функция Cε(t) после замены переменной τ := t/ε перепи-
шется ка
Cε(τ):= Cε(ετ), которая при τ ∈ [0,1/√ε] определяется асимпто-
тической формулой
Cε(τ) = ψ(τ) + O(ε),
Cε(τ) = A12eA22τ B2 + O(ε), ε → 0,
∂τ
где
ψ(τ) := B0 + A12A-122eA22τ B2.
Таким образом, существуют K1 > 0 и ε0 > 0 такие, что при всех ε ∈ (0, ε0)
иt∈[√ε, T ] справедливы неравенства
∂
d
∥C∗ε(t) - C∗0(t)∥ ≤ K1ε,
ε
(t) -
C∗0(t)
K1ε.
≤
∂tC
dt
Следовательно, можно ожидать, что решения уравнения ∥Q-1C∗ε(t)lε∥ = 2
при t ∈ [√ε,T] находятся вблизи решений уравнения ∥Q-1C∗0(t)l0∥ = 2, т.е.
вблизи точек смены в (17), а при τ ∈ [0, 1/√ε] вблизи решений уравнения
(19)
∥Q-1ψ(τ)l0∥ = 2,
где
ψ(τ):= B∗0 + B∗2eA22τ (A∗22)-1A∗12.
Определение 4. Решение t уравнения ∥Q-1C∗0(t)l0∥ = 2 будем назы-
вать регулярным, еслиddt ∥Q-1C∗0(t)l02 = 0.
Аналогично τ
решение уравнения ∥Q-1ψ(τ)l0∥ = 2 будем называть
регулярным, еслиddτ ∥Q-1ψ)l02 = 0.
Предположение 4. Матрицы Q, B∗0 и вектор l0 таковы, что выпол-
няется следующее соотношение: ∥Q-1B∗0l0∥ = 2.
Утверждение 4. При выполнении предположений
3,
4
уравнение
∥Q-1C∗0(t)l0∥ = 2 при t ∈ [0, T ] и уравнение ∥Q-1ψ(τ)l0∥ = 2 при τ > 0 име-
ют не более чем конечное число решений.
11
Доказательство утверждения следует из аналитичности функций
(20)
∥Q-1C∗ε(t)lε2 - 4,
∥Q-1C∗0(t)l02 - 4,
∥Q-1ψ(τ)l02
− 4.
Как и в случае Q = I (см., [15, теорема 2.1]) справедлива теорема о коли-
честве точек смены в (14).
Теорема 2. Пусть выполнены предположения 1-4, {ti}p1 ⊂ [0,T] все
решения уравнения ∥Q-1C∗0(t)l0∥ = 2, а {τj}q1 ⊂ [0,+∞) все решения урав-
нения (19). Кроме того, при i = 1,... ,p и j = 1,... ,q все такие решения -
регулярные.
Тогда существует ε0 > 0 такое, что для любого ε ∈ (0, ε0) существуют
{ti,ε}p1 ⊂ [√ε, T ] и {τj,ε}q1 ⊂ [0, 1/√ε] - точки смены в (14). Других точек сме-
ны в (14) нет, и при всех i = 1,... ,p, j = 1,... ,q справедливы соотношения
ti,ε → ti, τj,ε → τj, ε → 0.
Таким образом, при выполнении условий теоремы 2 интеграл из (14) разо-
бьется в конечную сумму интегралов с подынтегральными функциями ви-
да (18).
6. Построение асимптотики вектора lε
Для технического упрощения, и не ограничивая общности рассуждений,
будем вести это построение в случае, когда имеется лишь одна точка t0 смены
вида в (17), а в (19) таких точек две, т.е. выполнено предположение 5.
Предположение 5. Пусть t1 = ετ1, t2 = ετ2, где τ1, τ2 все решения
уравнения (19), а у уравнения ∥Q-1C∗0(t)l0∥ = 2 имеется единственное ре-
шение t0. Решения t0, τ1, τ2 регулярны.
Отметим, что все условия в предположении 5 есть условия общего поло-
жения.
В силу теоремы 2 у рассматриваемой управляемой системы будут три
точки смены вида в (14): t1,ε := ετ1,ε, t2,ε := ετ2,ε и t0,ε. При этом τ1,ε → τ1,
T
τ2,ε → τ2 и t0,ε → t0 при ε → 0, а интеграл
Cε(t)S(C∗ε(t)lε)dt разбивается в
0
сумму четырех интегралов
T
Cε(t)S (C∗ε(t)lε)dt =
0
1
= Cε(t
S(C∗ε(t)lε)dt +
Cε(t)Q-1C∗ε(t)lε dt +
2
0
t1,ε
T
1
+ Cε(t
S(C∗ε(t)lε)dt +
Cε(t)Q-1C∗ε(t)lε dt.
2
t2,ε
t0,ε
12
Пусть
Δlε := lε - l0, Δtε := t0,ε - t0, Δτ1,ε := τ1,ε - τ1, Δτ2,ε := τ2,ε - τ2.
Тогда
Δlε = o(1), Δtε = o(1), Δτ1,ε = o(1), Δτ2,ε = o(1) при ε → 0.
Величины Δlε, Δτ1,ε, Δτ2,ε и Δtε, являются решением следующей системы
уравнений, зависящей от параметра ε > 0:
0 = F(ε,Δl,Δt,Δτ1,Δτ2):=-∇ϕ(-l) + ∇ϕ(-l0) +
+ εW11,1(T, ε)x0 + εW12,1(T, ε)y0 +
Cε(t
S(C∗ε(t)l)dt +
0
1
+
Cε(t)Q-1C∗ε(t)l dt +
Cε(t
S(C∗ε(t)l)dt +
2
ε(τ1+Δτ1)
ε(τ2+Δτ2)
T
t0
1
(21)
+
Cε(t)Q-1C∗ε(t)l dt - C0(t
S(C∗0(t)l)dt -
2
t0+Δt
0
T
1
C0(t)Q-1C∗0(t)l dt,
2
t0
0 = G1(ε,Δl,Δτ1):=Q-1C∗ε(ε(τ1 + Δτ1))(l0 + Δl)2 - 4,
0 = G2(ε,Δl,Δτ2):=Q-1C∗ε(ε(τ2 + Δτ2))(l0 + Δl)2 - 4,
 0 = G3(ε,Δl,Δt):=Q-1C∗ε(t0 + Δt)(l0 + Δl)2 -
Q-1C∗0(t0)l0
2 .
Здесь и в дальнейшем индекс ε у вектора lε, а также у величин Δlε, Δτ1,ε,
Δτ2,ε, Δtε опустим.
Согласно (20) функции F и Gi (при i = 1, 2, 3) непрерывны, а Gi бес-
конечно дифференцируемые. Рассмотрим их асимптотические разложения
относительно бесконечно малых Δl, Δτ1, Δτ2 и Δt.
Поскольку функции ϕ и Gi бесконечно дифференцируемые, то их степен-
ные асимптотические разложения есть ряды Тейлора, построенные в окрест-
ности точки (ε, Δl, Δτ1, Δτ2, Δt) = 0, в частности,
(22)
-∇ϕ(-l0 - Δl) + ∇ϕ(-l0) ∼ D2ϕ(-l0)Δl + Φk
(Δl),
k=2
13
где D2ϕ(-l0)
дифференциал второго порядка от ϕ в точке (-l0),
а Φk(Δl) однородные степени k известные функции (многочлены от ком-
понент вектора Δl).
Степенное асимптотическое разложение интегральных слагаемых из (21)
строится так же, как и в случае Q = I (см. [15, раздел 3]): в частности, ис-
пользуется прeдставление интегралов из (21) в следующем виде:
Cε(t
S(C∗ε(t)l)dt =
+
,
0
0
ετ1
Cε(t)Q-1C∗ε(t)l dt =
+
+
,
ε(τ1+Δτ1)
ε(τ1+Δτ1)
ετ1
ετ2
t0
Cε(t
S(C∗ε(t)l)dt =
+
+
,
ε(τ2+Δτ2)
ε(τ2+Δτ2)
ετ2
t0
T
t0
T
Cε(t)Q-1C∗ε(t)l dt =
+
t0+Δt
t0+Δt
t0
Отметим, что продолжение функци
S требовалось для возможности та-
кого представления интегралов из (21).
Покажем, что оператор первого приближения в системе (21) обратим.
Обозначим линейную часть по △l функции F как F(Δl). В силу пред-
ставления (22) непосредственным вычислением (используя формулу (13), в
которой нужно ξ заменить на C∗0(t)l0, а Δξ на C∗0(t)Δl), получаем равенство
F (ε, Δl, Δτ1, Δτ2, Δt) =
= D2ϕ(-l0)Δl + εf1 + F2(ε,Δl,Δt,Δτ1,Δτ2) +
t0
T
(23)
S
1
+ C0(t)
(C∗0(t)l0)C∗0(t)Δldt +
C0(t)Q-1C∗0(t)Δldt =:
∂ξ
2
0
t0
=: F(Δl) + εf1 + F2(ε,Δl,Δt,Δτ1,Δτ2),
где
(
)
F2(ε,Δl,Δt,Δτ1,Δτ2) = O ε2 + ∥Δl∥2 + (Δt)2 + (Δτ1)2 + (Δτ2)2 ,
аf1
известная величина.
14
Аналогично для функций Gi:
D
E
G1(ε, Δl, Δτ1) = 2 Q-1ψ1)l0, Q-1ψ1)Δl + Q-1B∗2eA22τ1 A
12
Δτ1l0
+
D
E
+2 Q-1ψ1)l0, εQ-1B∗1W∗11,1(t0)l0 + εQ-1B∗1A∗21(A-122)eA22τ1 (A-122)A
12
l0
+
+ 2 Q-1ψ1)l0,εQ-1B∗2W∗12,2(t0)l0 + G1,2(ε, Δl, Δτ1),
D
E
G2(ε, Δl, Δτ2) = 2 Q-1ψ2)l0, Q-1ψ2)Δl + Q-1B∗2eA22τ2 A
Δτ2l0
+
12
(24)
D
E
+2 Q-1ψ2)l0, εQ-1B∗1W∗11,1(t0)l0 + εQ-1B∗1A∗21(A-122)eA22τ2 (A-122)A
12
l0
+
+ 2 Q-1ψ2)l0,εQ-1B∗2W∗12,2(t0)l0 + G2,2(ε, Δl, Δτ2),
G3(ε, Δl, Δt) = 2 Q-1C∗0(t0)l0, Q-1C∗0(t0)Δl + Q-1
C∗0(t0)l0Δt
+
∂t
+ 2 Q-1C∗0(t0)l0,εQ-1B∗1W∗11,1(t0)l0 + εQ-1B∗2W∗12,2(t0)l0 + G3,2(ε, Δl, Δt),
где
(
)
G1,2(ε,Δl,Δτ1) = O ε2 + ∥Δl∥2 + (Δτ1)2 ,
(
)
G2,2(ε,Δl,Δτ2) = O ε2 + ∥Δl∥2 + (Δτ2)2 ,
(
)
G3,2(ε, Δl, Δt) = O ε2 + ∥Δl∥2 + (Δt)2
Согласно равенствам (23), (24) оператор первого приближения для систе-
мы (21) имеет вид
 F(Δl)
2
Q-1ψ1)l0, Q-1ψ1)Δl
+ 2Δτ1 Q-1ψ1)l0, Q-1B∗2eA22τ1A∗12l0
H := 
,
 2 Q-1ψ2)l0,Q-1ψ2)Δl
+ 2Δτ2 Q-1ψ2)l0, Q-1B∗2eA22τ2A∗12l0
2
Q-1C∗0(t0)l0, Q-1C∗0(t0)Δl
+ 2Δt Q-1C∗0(t0)l0, Q-1 ∂
C∗0(t0)l0
∂t
а система первого приближения для (21) запишется в виде
F (Δl1) = -εf1,
2
Q-1ψ1)l0,Q-1ψ1)Δl1 + Q-1B∗2eA22τ1 A∗12l0Δτ1,1 = εg1,1,
(25)
2
Q-1ψ2)l0,Q-1ψ2)Δl1 + Q-1B∗2eA22τ2 A∗12l0Δτ2,1 = εg2,1,
 2 Q-1C∗0(t0)l0,Q-1C∗0(t0)Δl1 + Q-1 ∂∂tC∗0(t0)l0Δt1 = εg3,1,
где gi,1, i = 1, 2, 3,
известные величины (в силу (24)).
В силу условий строгой выпуклости функции ϕ (из постановки задачи)
линейный оператор D2ϕ(-l0) - положительный, а в силу утверждения 2
15
остальные слагаемые в определении линейного оператора F - неотрицатель-
ны (после скалярного умножения на вектор Q-1C(t)△l подынтегрального
выражения в (23)). Поэтому оператор F > 0 и, таким образом, из первого
уравнения в системе (25) однозначно находится значение Δl1 = εF-1(-f1) =:
=: εl1.
Поскольку в силу регулярности точек τj,0 при j = 1, 2 и t0:
D
E
Q-1ψj)l0,Q-1B∗2eA22τj A
l0
= 0,
12
то из второго и третьего уравнения в системе (25) по Δl1 однозначно нахо-
дятся значения Δτ1,1, Δτ2,1 и они имеют вид Δτ1,1 = ετ1, Δτ2,1 = ετ2 и
Q-1C∗0(t0)l0,Q-1C∗0(t0)l0 = 0,
а из четвертого уравнения в (25) по Δl1 однозначно находится Δt1, имеющее
вид Δt1 = εt1.
Таким образом, оператор первого приближения обратим. Построение и
обоснование асимптотики величин происходит аналогично случаю Q = I
[15, раздел 3]. Справедлива теорема 3.
Теорема 3. Пусть выполнены предположения 2-5. Тогда вектор lε и
моменты времени ti,ε, i = 0, 1, 2, раскладываются в степенные асимптоти-
ческие ряды
= ετ1 + ε εkτ1,k,
k=1
k=1
k=1
= ετ2 + ε εkτ2,k, ε → 0,
k=1
коэффициенты которых находятся рекуррентным образом.
В общем случае оператор F(Δl) (см. (23)) имеет вид
F (Δl) = D2ϕ(-l0)Δl + F0,
где
C0(t)Q-1C∗1,0(t)Δl
S
F0 :=
dt + C0(t)
(C∗0(t)l0) · C∗0(t)Δldt,
2
∂ξ
E1
E2
{
}
E1 =
t ∈ [0,T] : ∥Q-1C∗0(t)l0∥ ≤ 2
,
{
}
E2 =
t ∈ [0,T] : ∥Q-1C∗0(t)l0∥ ≥ 2
,
и F0 ≥ 0.
16
Теорема 4. Пусть выполнены предположения 2-4, условия теоремы 2.
Тогда вектор lε и моменты времени {t1,ε, t2,ε, . . . , tp,ε} раскладываются в
степенные асимптотические ряды на промежутке [√ε, T ]
= ti + εkti,k, i = 1,...,p, ε → 0,
k=1
k=1
и дополнительные точки {τ1,ε2,ε,... ,τq,ε} раскладываются в степенные
асимптотические ряды на промежутке
= τj + εkτj,k,ε → 0,
k=1
коэффициенты которых находятся рекуррентным образом.
В силу теоремы 4 в общем случае для нахождения асимптотического раз-
ложения указанных в теореме 4 величин можно сразу искать их в виде рядов
с неопределенными коэффициентами. Коэффициенты этих рядов находят-
ся стандартным образом приравниванием в формальном асимптотическом
разложении основного уравнения слагаемых одного порядка малости по ε.
7. Заключение
Статья носит теоретический характер. Результаты статьи дополняют тео-
рию асимптотических разложений решений сингулярно возмущенных задач
оптимального управления для системы с медленными и быстрыми перемен-
ными и гладкими геометрическими ограничениями на управление с инте-
грально выпуклым критерием качества. Терминальная часть функционала
качества есть непрерывно дифференцируемая на Rn строго-выпуклая и ко-
финитная функция, а интегральная часть содержит строго выпуклую функ-
цию, зависящую от управления. Показано, что решение задачи с ограниче-
ниями на управление в виде эллипсоида сводится к решению задачи с огра-
ничением на управление в виде шара.
В статье предложен алгоритм определения всех коэффициентов асимпто-
тического разложения по малому параметру определяющего вектора lε, кото-
рый задает вид оптимального управления. Главная особенность и сложность
рассматриваемой задачи определяются тем, что оптимальное управление в
ней определяется через неявно заданную функцию.
Авторы статьи выражают благодарность рецензенту, сделавшему ряд цен-
ных замечаний, учет которых при подготовке статьи к печати позволил ав-
торам улучшить ее текст.
ПРИЛОЖЕНИЕ
Доказательство утверждения 1. Рассмотрим функцию µ(ξ). Она
задана неявно уравнение
F (ξ, µ) = 0.
17
Функци
F (ξ, µ) ∈ D
S), определенная в (12), бесконечно дифференцируе-
ма на области {(ξ, µ) : ξ ∈ D
S), µ > -q1}. При этом
∂F(ξ,µ)
Δξ = 2 (Q + µI)-2ξ,Δξ ,
∂ξ
(Π.1)
∂F(ξ,µ)
= -2 (Q + µI)-3ξ,ξ ∈R
∂µ
и
(Q + µ(ξ)I)-3ξ, ξ =0
при всех ξ ∈ D
S) силу положительности (Q + µ(ξ)I). Поэтому по теореме о
дифференцируемости функции, заданной неявно, функция µ(ξ) бесконечно
дифференцируема при ξ ∈ D
S) и в силу (Π.1)
)
∂µ(ξ)
(∂F(ξ,µ))-1 (∂F(ξ,µ)
Δξ = -
Δξ
=
∂ξ
∂µ
∂ξ
(Π.2)
(Q + µ(ξ)I)-2ξ, Δξ
=
∈ R.
〈(Q + µ(ξ)I)-3ξ, ξ〉
Поскольк
S(ξ) = (Q + µ(ξ)I)-1ξ/2, то
)
S(ξ)
d
(1
Δξ =
(Q + µ(ξ + tΔξ)I)-1(ξ + tΔξ)
=
∂ξ
dt
2
t=0
(
(
)
)
1
∂µ(ξ)
=
-(Q + µ(ξ)I)-2ξ
Δξ
=
2
∂ξ
(
)
(Π.2)
1
(Q + µ(ξ)I)-2
ξ,Δξ
= -
(Q + µ(ξ)I)-2ξ - (Q + µ(ξ)I)-1Δξ
2
〈(Q + µ(ξ)I)-3ξ, ξ〉
Утверждение 1 доказано.
Доказательство утверждения
2. При любом ξ ∈ D
S) в силу
определения D
S) : (Q + µ(ξ)I)-1 > 0, поэтому в Rr можно ввести новое ска-
лярное произведение 〈ξ1, ξ2µ := (Q + µ(ξ)I)-1ξ1, ξ2 .
Тогда
*
+
∂S(ξ)
Δξ,Δξ
=
∂ξ
(
1
=
(Q + µ(ξ)I)-1Δξ, Δξ -
2
)
(Q + µ(ξ)I)-2ξ,Δξ
-
(Q + µ(ξ)I)-2ξ, Δξ
=
〈(Q + µ(ξ)I)-3ξ, ξ〉
18
1
=
×
2〈(Q + µ(ξ)I)-3ξ,ξ〉
(
)
× ∥Δξ∥ · ∥(Q + µ(ξ)I)-1ξ∥ - (Q + µ(ξ)I)-1ξ, Δξ2
µ
Выражение в скобках неотрицательно в силу неравенства Коши-Буняков-
ского.
Утверждение 2 доказано.
Доказательство утверждения 3. Справедливость первого утвер-
ждения следует из определения функции S(·) из (10) и утверждения 1.
Пусть ∥Q-1ξ∥ > 2, тогда ∥(Q + µ(ξ)I)-1ξ∥ = 2 и µ(ξ) > 0.
Теперь оценим знаменатель в первом слагаемом из (13):
ξ2k
∥ξ∥2
(Q + µ(ξ)I)-3ξ, ξ
=
(3)
(qk + µ(ξ))3
(qr + µ(ξ))3
k=1
Таким образом, в силу (13)
S(ξ)
∂ξ
)
3
1
( ∥(Q + µ(ξ)I)-22∥ξ∥2(qr + µ(ξ))
(Π.3)
+ ∥(Q + µ(ξ)I)-1
=
2
∥ξ∥2
)
3
1
( (qr + µ(ξ))
1
=
+
→ 0 при µ(ξ) → +∞.
2
(q1 + µ(ξ))4
(q1
+ µ(ξ))
S(ξ)
Поэтому существует такое K
S), что
≤K
S) при всех ξ: ∥Q-1ξ∥ >
∂ξ
2.
Если ∥Q-1ξ∥ = 2, то µ(ξ) = 0, поэтому
S(ξ) = ∥Q-1ξ∥. Таким образом,
функци
S непрерывна на Rk.
Если ∥Q-1ξi∥ < 2 (i = 1, 2), то ∥S(ξ2) - S(ξ1)∥ ≤12 ∥Q-1∥ · ∥ξ2 - ξ1∥.
Если ∥Q-1ξi∥ > 2 (i = 1, 2), то в силу формулы конечных приращений
Лагранжа из (Π.3) получим
∥S(ξ2) - S(ξ1)∥ =
S(ξ2)
S(ξ1)∥ ≤ K
S)∥ξ2 - ξ1∥.
Наконец, пусть ∥Q-1ξ1∥ < 2 и ∥Q-1ξ2∥ ≥ 2. Тогда найдется единственная
точкаξ ∈ [ξ1, ξ2] такая, что ∥Q-1 ξ∥ = 2. Поэтому
∥S(ξ2) - S(ξ1)∥ ≤ ∥S(ξ2) - S(ξ)∥ + ∥S(ξ) - S(ξ1)∥ ≤
≤K
S)∥ξ2 -ξ∥ +1∥Q-1∥ · ∥ξ- ξ1∥ ≤ K1(∥ξ2 -ξ∥ + ∥ξ- ξ1∥).
2
Но ∥ξ2 -ξ∥ + ∥ξ- ξ1∥ = ∥ξ2 - ξ1∥.
Утверждение 3 доказано.
19
СПИСОК ЛИТЕРАТУРЫ
1.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Матема-
тическая теория оптимальных процессов. М.: Физматгиз, 1961.
2.
Красовский Н.Н. Теория управления движением. Линейные системы. М.: Наука,
1968.
3.
Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.
4.
Васильева А.Б., Дмитриев М.Г. Математический анализ. Итоги науки и тех-
ники. М.: ВИНИТИ. 1982. Т. 20. С. 3-77. https://doi.org/10.1007/BF01262406.
Vasil’eva A.B., Dmitriev M.G. Singular perturbations in problems of optimal con-
trol // J. Soviet Math. 1986. V. 34. No. 3. P. 1579-1629.
https://doi.org/10.1007/BF01262406.
5.
Дончев А. Системы оптимального управления. Возмущения, приближения и
анализ чувствительности. М.: Мир, 1987.
6.
Kokotovic P.V., Haddad A.H. Controllability and Time-Optimal Control of Systems
with Slow and Fast Models // IEEE Trans. Automat. Control. 1975. V. 20. No. 1.
P. 111-113.
7.
Данилин А.Р., Коврижных О.О. О задаче управления точкой малой массы
в среде без сопротивления // Докл. РАН. 2013. Т. 451. № 6. С. 612-614.
https://doi.org/10.7868/S086956521325004X.
Danilin A.R., Kovrizhnykh O.O. Time-Optimal Control of a Small Mass Point
without Environmental Resistance // Doklady Mathematics. 2013. V. 88. No. 1.
P. 465-467. https://doi.org/10.7868/S086956521325004X.
8.
Данилин А.Р., Парышева Ю.В. Асимптотика оптимального значения функцио-
нала качества в линейной задаче оптимального управления в регулярном слу-
чае // Тр. ИММ УрО РАН. 2007. Т. 13. № 2. С. 55-65.
https://doi.org/10.1134/S0081543807060053.
Danilin A.R., Parysheva Yu.V. The Asymptotics of the Optimal Value of the Perfor-
mance Functional in a Linear Optimal Control Problem in the Regular Case // Proc.
Steklov Institute of Mathematics (Supplementary issues). 2007. V. 259. suppl. 2.
S83-S94. https://doi.org/10.1134/S0081543807060053.
9.
Калинин А.И., Семeнов К.В. Асимптотический метод оптимизации линейных
сингулярно возмущенных систем с многомерными управлениями // Журн. вы-
числ. математики и мат. физики. 2004. Т. 44. № 3. С. 432-443.
Kalinin A.I., Semenov K.V. The Asymptotic Optimization Method for Linear Sin-
gularly Perturbed Systems with the Multidimensional Control // Comput. Math.
Math. Phys. 2004. V. 44. No. 3. P. 407-417.
10.
Данилин А.Р., Шабуров А.А. Асимптотическое разложение решения сингуляр-
но возмущенной задачи оптимального управления с интегральным выпуклым
критерием качества, терминальная часть которого зависит от медленных и
быстрых переменных // Уфимск. матем. журн. 2019. Т. 11. № 2. C. 83-98.
https://doi.org/10.13108/2019-11-2-82.
Danilin A.R., Shaburov A.A. Asymptotic Expansion of Solution to Singularly Per-
turbed Optimal Control Problem with Convex Integral Quality Functional with Ter-
minal Part Depending on Slow and Fast Variables // Ufa Math. J. 2019. V. 11. No. 2.
P. 82-96. https://doi.org/10.13108/2019-11-2-82.
20
11. Шабуров А.А. Асимптотическое разложение решения одной сингулярно возму-
щенной задачи оптимального управления в пространстве Rn с интегральным вы-
пуклым критерием качества // Тр. ИММ УрО РАН. 2017. Т. 23. № 2. С. 303-310.
https://doi.org/10.21538/0134-4889-2017-23-2-303-310.
12. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
13. Беллман Р. Введение в теорию матриц. М.: Наука, 1976.
14. Васильева А.Б., Бутузов В.Ф. Асимптотические разложения решений сингу-
лярно возмущенных уравнений. М.: Наука, 1973.
15. Шабуров А.А. Асимптотическое разложение решения сингулярно возмущенной
задачи оптимального управления с гладкими ограничениями на управление и
с интегральным выпуклым критерием качества, терминальная часть которого
зависит только от медленных переменных // Вестн. российских университетов.
Математика. 2019. Т. 24. № 125. С. 119-136.
https://doi.org/10.20310/1810-0198-2019-24-125-119-136.
Статья представлена к публикации членом редколлегии М.В. Хлебниковым.
Поступила в редакцию 19.02.2021
После доработки 16.08.2021
Принята к публикации 29.08.2021
21