ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2023, том 59, № 3, с.422-431
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977+517.925
О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ,
СВЯЗАННЫХ С ПЕРЕМЕЩЕНИЕМ В ПОЛЕ СКОРОСТЕЙ
© 2023 г. П. В. Николенко
Исследованы экстремали принципа максимума Понтрягина задач, связанных с перемеще-
нием в поле скоростей. Управления являются непрерывными функциями. Показано, что в
фазовом пространстве существует окрестность финальной точки, через каждую точку ко-
торой проходит единственная траектория экстремали, ведущая в финальную точку. Также
показано, что если траектория экстремали содержит точку, через которую проходит дру-
гая экстремаль с таким же значением функционала, то эта точка отсекает от траектории
неоптимальную часть. Доказано, что оставшаяся часть, ведущая в финальную точку, оп-
тимальна.
DOI: 10.31857/S0374064123030135, EDN: QVTYWS
1. Постановка задачи. Рассмотрим перемещения в фазовом пространстве R2, подчи-
няющиеся закону
x = v(x) + u. Здесь v: R2 R2 - векторное поле класса C2, v(0) = 0;
управление u - кусочно-непрерывная, непрерывная справа, с разрывами первого рода вектор-
функция такая, что ∥u∥ 1, где ∥u∥2 = u21 + u22. Рассмотрим управления, которые переводят
объект из положения x0 в начало координат. Пусть поставлен вопрос о выборе управления,
которое минимизирует величину
(1+α∥u∥2)dt. Таким образом, рассматриваются следующие
задачи:
0
J (x, u) =
(1 + α∥u(t)2) dt → min,
t0
x = v(x) + u,
∥u∥ 1,
x(t0) = x0, x(0) = 0, α 0.
(1)
Здесь t = 0 - момент завершения процесса, момент начала процесса t0 не фиксирован.
При α = 0 получается задача быстродействия. Если α > 0, то экономится не только
время, но и “энергия”, затраченная на перемещение. Варьируя значение α, можем менять
значимость указанных факторов. Для того чтобы выделить экстремали задачи (1), восполь-
зуемся принципом максимума Понтрягина (см. [1, c. 25]).
Пусть (x, u) - оптимальный процесс. Составим функцию Понтрягина
H = ψ0(1 + α∥u∥2) + ψ(v(x) + u),
где константа ψ0 принимает значения либо нуль, либо минус единица. Согласно принципу
максимума для некоторого решения системы
ψ=-ψv(x(t))(v-матрицаЯкобиотображе-
ния v) функция H принимает максимальное значение по параметру u.
ψ=-ψv(x),тоψ
Рассмотрим случай ψ0 = 0. Поскольку вектор (ψ0, ψ) нетривиален и
не обращается в нуль. Следовательно, H принимает максимальное значение при u = ψ/∥ψ∥.
Так как в финальный момент H = 0 и v(0) = 0, получаем u(0) = 0, что противоречит
условию не обращения в нуль вектора ψ. Таким образом, случай ψ0 = 0 экстремалей не
выявляет.
Для случая ψ0 = -1
H = -α∥u∥2 + ψu + ψv - 1 = -α∥u∥2 + ∥ψ∥∥u∥cos β + ψv - 1,
422
О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ
423
где β - угол между векторами ψ и u. Очевидно, что максимальное по u значение величина H
будет достигать при β = 0. При
(
)2
∥ψ∥
∥ψ∥2
H = -α ∥u∥ -
+
+ ψv - 1
2α
4α
имеем
{
ψ/(2α), если ∥ψ∥ < 2α,
u=
ψ/∥ψ∥, если ∥ψ∥ 2α.
Запишем функцию u в виде g(∥ψ∥)ψ, где
{
1/2α при x < 2α,
g(x) =
1/x при x 2α.
Используем условие H = 0 при t = 0. Поскольку v(0) = 0, имеем равенства
- αg2(∥ψ∥)ψ2 + g(∥ψ∥)ψ2 - 1 = 0,
ψ2(-αg2(∥ψ∥) + g(∥ψ∥)) = 1.
Если ∥ψ(0) 2α, то ψ2 = 4α, ∥ψ(0) = 2√α при α 1 (при α < 1 решений нет). Если
∥ψ(0) 2α, то
(
)
1
1
ψ2(0)
+
= 1,
∥ψ(0)2
∥ψ(0)
откуда получаем, что ∥ψ(0) = 1 + α при α 1 (при α > 1 решений нет).
Таким образом, экстремали задачи (1) определяются решением следующей задачи Коши
с пятью компонентами фазового пространства и моментом завершения t = 0:
ψ=-ψv(x),
x0 = 1 + αg2(∥ψ∥)ψ2,
x = v(x) + g(∥ψ∥)ψ,
x0(0) = 0, x(0) = (0,0), ψ(0) = b(cos s,sin s),
(2)
где
{
2√α при α 1,
b=
1 + α при 0 α < 1.
Решение задачи (2) определяет экстремаль задачи (1): x = (x1, x2) - координаты траекто-
рии экстремали, u = g(∥ψ∥)ψ - управление, |x0| - значение функционала.
Через заданную точку x0 фазовой плоскости R2 могут проходить две (или больше) траек-
тории экстремали. Это может свидетельствовать о том, что хотя бы одна из этих траекторий
содержит неоптимальную часть. Как отделять заведомо неоптимальную часть траектории?
Будет ли оптимален остаток? Могут ли подобные точки x0 располагаться как угодно близко
от начала координат? Отметим, что этими и другими вопросами, связанными с перемещением
в поле скоростей, занимались разные авторы (см., например, работы [2-4]).
2. Теорема единственности.
Теорема 1. Пусть первые производные отображения υ удовлетворяют условию Липши-
ца в некоторой области, содержащей начало координат. Существует окрестность начала
координат, через каждую точку которой проходит единственная траектория экстремали,
ведущая в начало координат.
Доказательство. Для доказательства потребуются следующие утверждения. Пусть F :
Rn Rn в области U ограничена константой K и липшицева, т.е. справедливо неравенство
∥F (x) - F (y) L∥x - y∥; x = x(t) - решение уравнения x = F(x), x(t) ∈ U для t ∈ [0,Δt].
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
9
424
НИКОЛЕНКО
Согласно теореме о среднем и следствию из неё (см. [5, c. 148]) выполняются оценки
∥ xt) - x(0) = ∥F(xt)) - F(x(0))
L∥xt) - x(0) L max x(ΘΔt)∥|Δt| LK|Δt|,
(3)
0Θ1
∥xt) - x(0) - x(0)Δt∥ max
∥ x(ΘΔt) - x(0)∥|Δt| = max ∥F(x(ΘΔt)) - F(x(0))∥|Δt|
0Θ1
0Θ1
Lmax∥x(ΘΔt) - x(0)∥|Δt| L max ∥x(ΘΔt)Δ2t LKΔ2t.
(4)
0Θ1
Рассмотрим сначала случай α = 1. Траектория экстремали определяется X-компонентой
решения (X, Ψ) задачи Коши (компоненту x0 не записываем)
ψ=-ψv(x),
x = v(x) + g(∥ψ∥)ψ,
x(0) = (0, 0), ψ(0) = b(cos s, sin s),
(5)
где s - действительное число.
При α = 1 b - точка гладкости функции g, поэтому можно указать число δ > 0 такое,
что решение (X(t, s), Ψ(t, s)) является гладким при всех t ∈ [-δ, 0]. Пусть (X(t, s), Ψ(t, s)) -
решение задачи (5). При t ∈ [-δ, 0] рассмотрим отображения
(
)
(
)
(
)
(
)
(
)
t
t cos s
y1
t
x1(t,s)
ρ:
=
,
X:
,
s
t sin s
y2
s
x2(t,s)
где xi - компоненты вектора X.
Поскольку X(0, s) = (0, 0)т при всех s, то отображение Φ(y1, y2) = X(t, s) корректно
определено. Для того чтобы записать формулу, задающую отображение Φ, воспользуемся
обозначением (X, Ψ)(t, z) - решение задачи (5) с финальным условием z ∈ R4 : (X, Ψ)(0) = z.
Из определения имеем t = -∥y∥, cos s = -y1/∥y∥, sin s = -y2/∥y∥ при t < 0.
Тогда
(
(
))
-by1
-by2
X -∥y∥,
0, 0,
,
при y = (0, 0)т,
∥y∥
∥y∥
Φ(y1, y2) =
(0, 0)т
при y = (0, 0)т.
Отображение ρ при t < 0 является локальным диффеоморфизмом. Возьмём окрестность
точки (t, s), которая отображением ρ взаимно-однозначно переводится в окрестность точ-
ки (y1, y2). В полученной окрестности отображение Φ можно записать в виде Φ = X(ρ-1).
Проверим, что отображение Φ непрерывно дифференцируемо при ∥y∥ < δ, причём Φ(0, 0) -
невырожденная матрица. Отсюда, в силу теоремы об обратной функции, следует утвержде-
ние теоремы при α = 1. Рассмотрим lim Φ(λy),
∥y∥ = δ. Убедимся в том, что указанный
λ→0+0
предел есть невырожденная матрица и стремление к ней равномерно по y
(∥y∥ = δ):
lim
Φ = lim X(ρ)-1,
λ→0+0
t→0
предел в правой части считается при фиксированном s. Запишем матрицы
(
)
(
)
cos s
sin s
cos s
-tsin s
ρ =
,
(ρ)-1
=
1
1
sin s t cos s
-
sin s
cos s
t
t
Для того чтобы записать матрицу X, проведём предварительно рассуждения в общем виде.
Пусть F : R4 R4, ϕ: R R4 и Y (t, s) - решение задачи Коши
Y
= F(Y ), Y (0) = ϕ(s),
P : R4R2 - проекция на первые две координаты.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ
425
Опишем как устроена матрица Якоби отображения P Y : (P Y ) = P Y. (P Y ) состоит
из первых двух строк матрицы Y, её первый столбец (Y)1 = Yt есть F (Y (t, s)), если нас
интересует этот вектор при малых Δt, то можем записать
Ytt,s) = Yt(0,s) + Ot) = F(ϕ(s)) + Ot).
(6)
Второй столбец (Y)2 = Ys есть Z-компонента решения системы в вариациях, соответствую-
щих системе
Y
Ż
= F(Y ),
= F(Y )Z, Y (0) = ϕ(s), Z(0) = ϕ(s).
(7)
При малых Δt можем записать
Yt, s) = ϕ(s) + F (ϕ(s))Δt + ot), Zt, s) = ϕ(s) + F(ϕ(s))ϕ(st + ot).
(8)
Отметим, что если отображение (Y, Z) (F (Y ), F(Y )Z) ограничено константой K и
липшицево с константой L в окрестности образа отображения (ϕ, ϕ) и этот образ компактен,
то согласно оценкам (3), (4) можно указать число δ такое, что при |Δt| δ для величин
Ot), ot) из формул (6), (8) выполняются оценки
∥Ot) LK|Δt|,
∥ot) LKΔ2t.
(9)
В нашем случае вектор из R4 записывается в виде (x, ψ),
(
)
v(x) + g(∥ψ∥)ψ
F (x, ψ) =
,
ϕ(s) = (0, 0, b cos s, b sin s).
-ψv(x)
Согласно (6) первый столбец матрицы X определяется по формуле
(
)
cos s
(X)1t, s) = Xtt, s) = P F (ϕ(s)) + Ot) = bg(b)
+ Ot).
sin s
Второй столбец (X)2 матрицы X состоит из первых двух компонент вектора Z из фор-
мул (8). Чтобы его записать, потребуются первые две строки матрицы F :
2
ψ
ψ1ψ2
1
g(∥ψ∥)
+ g(∥ψ∥)
g(∥ψ∥)
∥ψ∥
∥ψ∥
F =
(x)
v
ψ1ψ2
ψ2
.
2
g(∥ψ∥)
g(∥ψ∥)
+ g(∥ψ∥)
∥ψ∥
∥ψ∥
Вычислим
(
)
(X)2t, s) = P Zt, s) = υ(0)bg(b)cos2 s+g(b)bg(b)cosssins
×
bg(b) cos s sin s
bg(b) sin2 s + g(b)
0
(
)
0
- sin s
×
Δt + ot) = bg(b)
Δt + ot).
(10)
-bsin s
cos s
b cos s
Производная отображения Φ в точке y = (Δt cos s, Δt sin s) равна Φ(y) = X(g)-1 =
= bg(b)(E + Ot)), где E - единичная матрица. Следовательно, lim Φ(λy) = bg(b)E.
λ→0+0
Рассмотрим случай α = 1. Тогда в формулах (5) b = 2,
{
1/2, x 2,
g(x) =
1/x, x > 2.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
426
НИКОЛЕНКО
Выберем последовательность гладких функций gn, равномерно сходящуюся к g, такую, что
0 < gn1/2,
|g′n| 1/4. Далее убедимся, что можно выбрать числа δ и C таким образом,
что оценки (9) запишутся в виде
∥Ot) C|Δt|,
∥ot) CΔ2t
(11)
при |Δt| δ для всех gn. Чтобы исключить путаницу, функции Φ припишем индекс Φgn , Φg.
Функции Φgn равномерно сходятся к Φg для |t| δ. В силу следствия из теоремы о среднем
и вида Φ′gn выполняется неравенство
Φgn (b) - Φgn (a) - Φ′g
(0)(b - a) sup
Φ′g
(c) - Φ
g′n
(0)∥∥(b - a)∥,
n
n
c∈[a,b]
следовательно, можно указать d > 0 и δ1 > 0 такие, чтоΦgn (b) - Φgn (a) d∥(b - a)
для всех a и b с нормой меньше δ1. Тогда в силу равномерной сходимости в последнем
неравенстве вместо gn можно записать g. Следовательно, Φg инъективно в круге ∥y∥ <
< δ1. Кроме того, в силу обратимости отображений Φgn образ шара ∥y∥ < δ1 содержит шар
∥y∥ < dδ1 : Φgn (Bδ10 ) ⊃ B0δ2 . Но тогда и Φg(B01 ) ⊃ B0δ1 . Действительно, пусть y ∈ B0δ1 ,
zn = Φ-1g
y, в силу компактности можем считать, что zn → z. Тогда Φg(z) = y.
n
Обоснуем теперь оценки (11). Заметим, что в первом неравенстве (9) константы L и K
определяются отображением F, т.е. величинами υ, υ, g (но не g). Это объясняет первое
из неравенств (11). Чтобы обосновать второе неравенство (11), матрицу F представим в виде
суммы F
F + G, где
(
)⎞
υ(x) g(∥ψ∥)E
g(∥ψ∥)
ψ21
ψ1ψ2
F =
·
·
, G =0
∥ψ∥
ψ1ψ2
ψ2
.
2
·
·
0
0
Если в системе (7) вместо F записать
F, то в формулах (9) константы L, K будут
определяться величинами υ, υ, константой Липшица для υ, g (но не g), т.е. можно L и
K взять общими для всех n. Далее, если Y, Z - решение (7), то поскольку G(ϕ(s))ϕ(s) =
= 0, можно указать константы A и a такие, что при |t| A выполняется неравенство
∥G(Y (t))Z(t) a|t|. Окончательно оценки (11) получаются после применения к сумме
F +
+ G следующего утверждения.
Лемма. Пусть f : Rn Rn, r : Rn Rn, x и y - соответственно решения задач Коши
Ż = f(z), z(0) = x0
и
Ż = f(z) + r(z), z(0) = x0
на промежутке [-A,A]. Функция f липшицева в достаточно большой окрестности образа
x: ∥f(z1)-f(z2)L∥z1 -z2∥, для r(y) выполняется неравенство ∥r(y(t))a|t|. Тогда на
промежутке [-A, A] выполняется неравенство ∥x(t) - y(t) ct2, где c = c(a, A, L).
Доказательство. Проводится аналогично доказательству теоремы 4 из книги [6, гл. 1].
Пусть z = x - y, тогда Ż = f(x) - f(y) - r(y). Умножив на z, получим
1 d
∥z∥2 = (f(x) - f(y))z - r(y)z.
2 dt
В силу предположений о свойствах f и r имеем неравенство
1 d
∥z(t)2 L∥z(t)2 + a|t|∥z(t)∥,
2 dt
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ
427
после сокращения которого на ∥z(t) получим d∥z(t)∥/dt L∥z(t)+a|t|. Умножив последнее
неравенство на e-Lt и проинтегрировав в промежутке [0, t], будем иметь соотношения
t
t
d
a
a
a
(e-Lτ ∥z(τ)) a τe-Lτ dτ, e-Lτ ∥z(t) -
te-Lτ -
e-Lτ +
dt
L
L2
L2
0
0
или
(
)
θ
a
a
a
e
∥z(t) -
t-
+
1 + Lt +
L2t2
L
L2
L2
2
Таким образом, ∥z(t) ct2, где c aeLA/2. Аналогично оцениваем ∥z(t) для отрица-
тельных t, проводя интегрирование по промежутку [t, 0]. Лемма доказана.
Теорема 1 доказана.
Замечание 1. Отметим, что условия гладкости функции v не могут быть ослаблены.
Так, например, для поля v(x1, x2) = (x3/22, 0) из каждой точки вида (p, 0) (p < 0) в начало
координат ведет несколько траекторий (см. [7]).
3. Множество разреза. Если через заданную точку фазовой плоскости проходят две
траектории с одинаковыми значениями функционала, то указанная точка отсекает от тра-
ектории неоптимальную часть. Дадим точную формулировку. Пусть процессы (x, u),
(x, u)
являются экстремалями, определены на промежутках [t0, t1],
t0,
t1] соответственно, причём
t1
t0 <
t0 < t1, x
t0) = x
t0), u
t0) = u
t0) и
(1 + α∥u2(t)) dt =
t1 (1 + α∥u2(t))dt. Тогда
t0
t0
процесс (x, u) на промежутке [t0, t1] не оптимален. Действительно, определим процесс (x, u)
на промежутке [t0,
t1], положив
x = x,
û=u для t<
t0,
x = x,
û = ũ для
t0 t
t1.
Значение функционала J для обоих процессов одинаково. Но процесс (x, û) имеет разрыв-
ное управление, а оптимальный процесс, в силу системы (2), имеет непрерывное управление,
поэтому (x, û) не оптимален. Следовательно, не оптимален и (x, u). Таким образом, точка
x
t0) отделяет от траектории экстремали неоптимальную часть. Такие точки называют точ-
ками разреза, поиск которых связан с решением следующего уравнения.
Запишем задачу (2), переобозначив (ψ1, ψ2) = (x3, x4), в виде
X
= f(X), X(0) = ϕ(s),
(12)
где f : R5 R5, ϕ(s) = (0, 0, 0, b cos s, b sin s).
Рассмотрим отображения
Ψ(t, s) = (x0(t, s), s), Φ(t, s) = (x1(t, s), x2(t, s)),
где X(t, s) = (x0, . . . , x4)(t, s) - решение задачи (12); g = ΦΨ-1 (отображение Ψ-1 определено,
поскольку
x0 > 0).
Если g(x0, τ) = g(x0, s), τ = s + 2πk, k ∈ Z, то g(x0, τ) - точка разреза.
Тройку (x0, τ, s) назовём параметрами разреза. Саму точку g(x0, τ) назовём правильной,
если два параметра из тройки (x0, τ, s) являются функцией третьего, причём производные по
третьему параметру отличны от нуля. Кроме того, матрица Φ невырождена на полуинтервале
вдоль траектории между точкой разреза и финальной точкой.
Предельную траекторию для точек разреза, для которой параметры имеют вид (x0, τ, τ),
назовём особой.
Замечание 2. Отметим, что на траектории экстремали может находиться целый набор то-
чек разреза. Из всей указанной совокупности следует выбрать точку, ближайшую к финаль-
ной, а остальные точки интереса не представляют, поскольку находятся на неоптимальной
части траектории.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
428
НИКОЛЕНКО
Совокупность точек разреза, обладающих указанным в замечании свойством, образуют
множество разреза. Множество разреза рассматриваемых задач изучалось в работах [7-9].
В работе [9] предложена конструкция для численного вычисления множества разреза.
Рассмотрим примеры.
Пример 1. Задача быстродействия с полем v(x1, x2) = (x22, 0), α = 0.
Для s ∈ (-π/2, π/2) траектории экстремалей представляют собой “синусоиды”. Из всей
траектории оптимальной может быть лишь последняя полуволна, поскольку начало полувол-
ны - точка на левой полуоси Ox1, которая является точкой разреза, образуемой пересечением
“синусоиды” с “синусоидой”, симметричной ей относительно оси Ox1.
Для s ∈ [-π, -π/2]
[π/2, π] траектории экстремалей представляют собой кривые, не пе-
ресекающиеся между собой (кривые 12 -16 на рисунке). Особой является точка
(-π/
v′′(0),0) = (-π/
2,0).
Параметры точек разреза могут быть записаны в виде (α(τ), τ, -τ), где τ ∈ (0, π/2), |α(τ)| -
время перемещения по соответствующей полуволне. Производная α(τ) < 0, lim α(τ) =
τ→0
= -π/
2, lim α(τ) = -∞.
τ→π/2
Рисунок. Траектории экстремалей для разных s.
Пусть Ω - часть полосы в пространстве R2 :
Ω = {(t,s): t 0, если s ∈ [-π,-π/2]
[π/2, π]; α(s) t 0, если s ∈ (-π/2, π/2)}.
Отображение g переводит область Ω в R2, причём
g(0, s) = (0, 0), g(t, -π) = g(t, π), g(α(τ), -τ) = g(α(τ), τ)
для 0 < τ < π/2.
Во внутренней части множества Ω отображение g взаимно-однозначно. Введём в Ω отно-
шение эквивалентности, cчитая z1 ∼ z2, если g(z1) = g(z2). Тогда, поскольку g открыто на
Ω и согласовано с эквивалентностью, оно определяет гомеоморфизм g фактор-пространства
Ω в R2. Кроме того, отображение (·)1 - проекция на первую координату, также согласова-
но с эквивалентностью. Поэтому отображение ω = (g-1)1 непрерывно. Величина ω(x) есть
время перемещения в начало координат по траектории экстремали.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ
429
Пример 2. Рассмотрим задачу быстродействия с полем
Таблица. Значения параметров
задачи быстродействия
{
(x22, 0),
если x2 < 0,
№ Время t Значение ϕ
v(x1, x2) =
α = 0.
(x22 + 0.1x62, 0), если x2 0,
1
Множество разреза
2
[-7, 0]
-1.55
3
[-7, 0]
1.51
Вычисления производились для t ∈ [-7, 0] (таблица).
4
[-6.4, 0]
-1.54
Для значений s ∈ [π/2, 3π/2] траектории экстремалей
5
[-6.4, 0]
1.49
(кривые 12 -16 на рисунке) не пересекают других траекто-
6
[-5.5, 0]
-1.52
рий. Для значений s ∈ [-π/2, π/2] траектории экстремалей
7
[-5.5, 0]
1.45
представляют собой деформированные “синусоиды”. Часть из
8
[-4.3, 0]
-1.44
точек пересечения “синусоид” между собой и составляют мно-
9
[-4.3, 0]
1.34
жество разреза, которое на рисунке представлено кривой 1.
10
[-3.1, 0]
-1.05
Время перемещения от точки разреза до начала координат
11
[-3.1, 0]
0.98
по траекториям 2 -3, . . . , 10 -11 одинаково. Множество раз-
12
[-3.5, 0]
-
реза остоит из правильных точек. Особой является точка
13
[-5, 0]
-
(-π/
2, 0), параметры разреза могут быть записаны в виде
14
[-5.5, 0]
-
15
[-7, 0]
-
(α(τ), β(τ), τ). Согласно проведённым вычислениям опреде-
16
[-7, 0]
-
лим область Ω как часть полосы в R2, положив
(t, s): - 7 t 0, если s ∈ [-π,-1.55]
[1.51, π],
Ω=
(t, s): α(s) t 0, если s ∈ [0, -1.51],
(t, s): α(τ) t 0, если s = β(τ), τ ∈ [0, -1.51].
Как и в предыдущем примере, введём в Ω отношение эквивалентности, полагая, что
z1 ∼ z2, если g(z1) = g(z2). Получаем гомеоморфизм g фактор-пространства
Ω на область
G в R2. Отображение (·)1 - проекция на первую координату, также согласовано с эквива-
лентностью. Поэтому на G определена и непрерывна величина ω = (g-1(x))1.
4. Оптимальность траекторий. Установим, что при выполнении некоторых условий
траектории экстремалей, не содержащие точек разреза, оптимальны.
Пусть t0 < 0 - некоторое число, X(t, s) - решение системы (12). Для каждого s ∈ [-π, π]
определим t(s)
(t0) так, что (x1(t(s), s), x2(t(s), s)) - точка разреза либо особая точка, а
если таковых нет, то полагаем t(s) = t0.
Положим
Ω = {(t,s): t(s) t 0,
s π}.
−→ (x1(t, s), x2(t, s)). Бу-
дем предполагать выполненными следующие условия:
- на множествеΩ = {(t, s): t(s) < t < 0, -π s π} матрица Φ не вырождена;
- множество разреза состоит из правильных точек;
- функция ω = (ΨΦ-1)1, где (·)1 обозначает первую компоненту, ω(x1, x2) = x0, опреде-
лённая на Φ(Ω), доопределяется на Φ(Ω) по непрерывности;
- множество с ∥ψ∥ =(x3, x4) = 2α - кусочно-гладкая кривая.
Полагаем, что выполняется следующая априорная оценка: пусть x0 Φ(Ω) и управление
u переводит x0 в 0, x - соответствующая траектория, тогда J(x, u) c.
Теорема 2. Пусть s ∈ [-π, π] и -ω(x1(t(s), s), x2(t(s), s)) < c. Тогда оптимальна траек-
тория (x1(t,s),x2(t,s)), где t(s) t 0.
Доказательство. Установим, что в области Φ(Ω) выполняется (исключая множество раз-
реза и множество, где |ψ∥ = 2α) неравенство Беллмана ω · (f1, f2) f0, а вдоль траектории
(x1(t, s), x2(t, s)), где t(s) < t < 0, выполняется уравнение Беллмана ω · (f1, f2) = f0. Как
показано в [10, c. 241], этого достаточно для оптимальности траектории.
Для доказательства нам потребуются уравнения в вариациях, соответствующие уравнени-
ям (2). Запишем их.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
430
НИКОЛЕНКО
При x23 + x24 4α2 имеем
x3
x4
x0 = 1 + α,
x1 = v1(x1,x2) +
,
x2 = v2(x1,x2) +
,
x23 + x24
x23 + x2
4
x3 = -x31v1 - x41v2,
x4 = -x32v1 - x42v2,
x24y3
x3x4y4
y0 = 0,
y1 =1v1y1 +2v1y2 +
-
,
x23 + x24
x23 + x2
4
x3x4y3
x23y4
y2 =1v2y1 +2v2y2 -
+
,
y3 = ... ,
y4 = ...
x23 + x24
x23 + x2
4
При x23 + x24 < 4α2 имеем
x23 + x24
x3
x4
x0 = 1 +
,
x1 = v1(x1,x2) +
,
x2 = v2(x1,x2) +
,
4α
2α
2α
x3 = -x31v1 - x41v2,
x4 = -x32v1 - x42v2,
1
1
y0 =
(x3y3 + x4y4),
y1 =1v1y1 +2v1y2 +
y3,
2α
2α
1
y2 =1v2y1 +2v2y2 +
y4,
y3 = ... ,
y4 = ...
2α
Запишем выражение для ω. Значения функций берутся в точках фазового пространства,
соответствующих значениям t, s:
ω = (Ψ)1 ·)-1 = (f0,y0)(Φ)-1,
здесь (·)1 - первая строка матрицы
(
)-1
(
)-1
(
)
tx1
sx1
f1
y1
1
y2
-y1
)-1 =
=
=
,
tx2
sx2
f2
y2
Δ
-f2
f1
где Δ = f1y2 - f2y1,
(
(
)
(
))
1
1
f0
f2
f1
f0
ω =
(f0y2 - y0f2, -f0y1 + y0f1) =
det
, det
Δ
Δ
y0
y2
y1
y0
Таким образом, согласно формулам Крамера ω является решением системы уравнений
(
)
(
)
(
)
f1
f2
f0
z1
+z2
=
,
y1
y2
y0
в частности, ω · f = f0 вдоль экстремалей. Далее увидим, что ω = ψ, где ψ = ψ(t, s) -
компоненты экстремали. Согласно принципу максимума Понтрягина функция H = ψ1f1 +
+ ψ2f2 - f0 вдоль экстремалей равна нулю. Таким образом, функция ψ является решением
первого уравнения последней системы. Для проверки верности второго уравнения заметим,
что при t = 0
ψ1y1 + ψ2y2 - y0 = 0.
Вычислим d(ψy - y0)/dt. Если ∥ψ∥ 2α
((ψ1, ψ2) := (x3, x4)), то
[
)
)]
(x24y3 - x3x4y4
(-x3x4y3 + x23y4
ψy + ψ y - y0 = -ψvy + ψvy + x3
+x4
= 0.
x23 + x24
x23 + x2
4
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023
О НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ
431
Если ∥ψ∥ 2α, то
[
]
1
1
1
ψy + ψ y - y0 = -ψvy + ψvy +
x3y3 +
x4y4
-
(x3y3 + x4y4) = 0.
2α
2α
2α
Таким образом, вдоль экстремали ψy - y0 - константа, и она равна нулю.
В силу принципа максимума функция H вдоль траектории принимает максимальное зна-
чение по u, поэтому ω(x)f(x, u) f0(x, u). Теорема доказана.
СПИСОК ЛИТЕРАТУРЫ
1. Арутюнов А.В., Магарил-Ильяев Г.Г., Тихомиров В.М. Принцип максимума Понтрягина. Доказа-
тельство и приложения. М., 2006.
2. Bin Li, Chao Xu, Kok Lay Teo, Jian Chu. Time optimal Zermelo’s navigation problem with moving and
fixed obstacles // Appl. Math. and Comput. 2013. V. 224. P. 866-875.
3. Chertovskih R., Karamzin D., Khalil N.T., Pereira F.L. An indirect numerical method for a time-optimal
state-constrained control problem in a steady two-dimensional fluid flow // Proc. of the 2018 IEEE
Oceanics Engineering Society Autonomous Underwater Vehicle Sympos. 2019. P. 1-6.
4. Chertovskih R., Karamzin D., Khalil N.T., Lobo Pereira F. Regular path-constrained time-optimal
control problems in three-dimensional flow fields // Eur. J. of Control. 2020. V. 56. P. 98-106.
5. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М., 1979.
6. Зубов В.И. Теория колебаний. М., 1979.
7. Николенко П.В. О наискорейших перемещениях в поле скоростей // Дифференц. уравнения. 2011.
Т. 47. № 5. С. 738-745.
8. Николенко П.В. Множество неоднозначности и задача о наискорейших перемещениях в поле ско-
ростей // Дифференц. уравнения. 2014. Т. 50. № 3. С. 372-381.
9. Николенко П.В. О множестве разреза в некоторых экстремальных задачах, связанных с перемеще-
нием в поле скоростей // Изв. вузов. Северо-Кавказский регион. Естеств. науки. 2017. № 4. С. 37-44.
10. Болтянский В.Г. Математические методы оптимального управления. М., 1969.
Ростовский государственный
Поступила в редакцию 26.09.2019 г.
экономический университет
После доработки 17.11.2022 г.
Принята к публикации 20.01.2023 г.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№3
2023