ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2023, том 59, № 4, с.520-530
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977.5
ОБ ОДНОМ КЛАССЕ ЗАДАЧ УПРАВЛЕНИЯ
СО СМЕШАННЫМИ ОГРАНИЧЕНИЯМИ
© 2023 г. А. В. Арутюнов, Д. Ю. Карамзин
Исследована задача оптимального управления с нерегулярным смешанным ограничением,
линейным по переменной управления. Предложены необходимые условия оптимальности
в форме принципа максимума Понтрягина для такого класса задач. Рассмотрены соответ-
ствующие примеры.
DOI: 10.31857/S037406412304009X, EDN: ANTGIC
Введение. В работе исследуется один класс задач оптимального управления с нерегу-
лярным смешанным ограничением, которое линейно по управляющему параметру. Приведём
пример такой нерегулярной задачи.
Пример 1. Зафиксируем произвольную точку a ∈ (0, 1). На фиксированном отрезке [0, 1]
рассмотрим следующую одномерную задачу оптимального управления с закреплёнными кон-
цами:
1
⎪∫
x(t) dt → min,
0
(1)
x(t) = u(t),
(t - a)u(t) - x(t) 0,
x(0) = 0, x(1) = 1.
В этой задаче существует допустимое управление, которое имеет вид u(t) = 0 при t a,
u(t) = 1/(1 - a) при t > a. Соответствующая ему траектория имеет вид x(t) = 0 при t a,
x(t) = (t - a)/(1 - a) при t > a. Покажем, что этот процесс оптимален.
Для произвольного допустимого процесса (x(·), u(·)), используя интегрирование по частям,
имеем
1
1
1
1
x(t) dt (t - a)u(t) dt = (t - a) x(t) dt = (t - a)x(t)|10 - x(t) dt.
0
0
0
0
Следовательно, справедливо неравенство
1
1-a
x(t) dt
2
0
Однако в то же время
1
1-a
x(t) dt =
,
2
0
что доказывает искомое утверждение.
В задаче (1) нарушаются условия регулярности смешанных ограничений при t = a. При-
меним формально к этой задаче известные условия оптимальности. Имеем
H(x, u, t, ψ, λ) = ψu - λx.
520
ОБ ОДНОМ КЛАССЕ ЗАДАЧ УПРАВЛЕНИЯ
521
Поэтому
ψ(t) = λ + ν(t) - измеримая ограниченная неотрицательная функция, где λ 0 -
константа, ν - множитель Лагранжа, отвечающий за смешанные ограничения. Вместе с тем
условие Эйлера-Лагранжа даёт
ψ(t) = (t - a)ν(t).
Из этих двух равенств следует, что ν(t) - непрерывно дифференцируемая функция при t = a
и имеет место равенство (t - a) ν(t) = λ. Отсюда получим
t
λ
ν(t) = ν(0) +
ds.
s-a
0
Однако функция ν(t) неотрицательна, поэтому неограниченность интеграла влечёт за собой,
что λ = 0 и, следовательно, ν(t) постоянна при t < a и t > a. Поскольку λ = ψ(a) = 0, то
здесь известное условие нетривиальности
λ + (t)| > 0 для любого t ∈ [0,1]
нарушено в точке t = a, в которой условие максимума неинформативно.
Рассмотрим ещё один двумерный пример задачи с фиксированным левым и свободным
правым концами.
Пример 2. На отрезке [0, 1] рассмотрим задачу оптимального управления
1
- x1(t)dt → min,
0
x1(t) = u(t),
(2)
x2(t) = 2t,
tu(t) - x2(t) 0,
x(0) = 0.
Здесь очевиден оптимальный процесс
u(t) = t,
x(t) = (x1(t), x2(t)) = (t2/2, t2). Условие
регулярности смешанных ограничений нарушается при t = 0. Применим формально принцип
максимума. Имеем
H(x, u, ψ, t, λ) = ψ1u + 22 + λx1.
Значит,
ψ1(t) = -λ, ψ1(1) = 0, в то время как
ψ2(t) =(t), ψ2(1) = 0. Условие Эйлера-
Лагранжа даёт равенство
ψ1(t) =(t) для п.в. t ∈ [0,1].
Отсюда, поскольку ν(t) ограничена, ψ1(0) = 0, следовательно, ψ1 = 0 и λ = 0. Значит,
ν = 0 и, таким образом, ψ2 = 0. Получили, что все множители Лагранжа равны нулю одно-
временно. Поэтому следует вывод, что функция ν(t) может не быть ограниченной в задаче с
нерегулярными смешанными ограничениями.
Эти примеры демонстрируют, что класс существенно ограниченных измеримых функций
является слишком узким, чтобы гарантировать включение для множителя Лагранжа, отве-
чающего нерегулярным смешанным ограничениям. Поэтому возникает естественный вопрос о
более широком пространстве для этого множителя и соответственно об уточнённых необхо-
димых условиях оптимальности для задач со смешанными ограничениями, которые не удо-
влетворяют известному условию регулярности. В настоящей работе предпринимается попытка
найти такие пространство и условия, в частном случае, ограничений, линейных по переменной
управления. Оказывается, что, как и в случае чистых фазовых ограничений, здесь возможно
ограничиться запасом борелевских мер.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
522
АРУТЮНОВ, КАРАМЗИН
1. Постановка задачи, определения и основной результат. На фиксированном от-
резке времени рассмотрим задачу оптимального управления со смешанными ограничениями
1
Φ(x0, u(·)) := ϕ(p) + f0(x(t), u(t), t) dt → min,
0
x(t) = f(x(t), u(t), t), t ∈ [0, 1],
(3)
g(x(t), t) + 〈u(t), a(t) 0,
u(t) ∈ U для п.в. t,
p ∈ S.
Здесь p = (x0, x1), x0 = x(0), x1 = x(1),
〈· , ·〉 означает скалярное произведение векторов.
Множества U ⊆ Rm и S ⊆ R2n выпуклы и компактны. Отображения ϕ : R2n R, f : Rn ×
× Rm × R1 Rn, f0 : Rn × Rm × R1 R, g : Rn × R R, a : R Rm предполагаются
непрерывно дифференцируемыми. При этом считается, что f - линейное отображение по
переменной управления u, т.е.
f (x, u, t) = f1(x, t) + F (x, t)u,
а f0 - выпуклая функция по u.
Пара функций (x, u) называется процессом управления, если x(·) абсолютно непрерывна,
u(·) измерима и существенно ограничена, и
x(t) = f(x(t), u(t), t) для п.в. t ∈ [0, 1]. Процесс
управления называется допустимым, если он удовлетворяет всем наложенным ограничениям
задачи (3). Напомним, что допустимый процесс (x, u) называется сильным минимумом в
задаче (3), если существует число ε0 > 0 такое, что для любого допустимого процесса (x, u)
такого, что |x(t) - x(t)| ε0 для любого t ∈ [0, 1], имеет место неравенство Φ(x0, u(·))
Φ(x0,u(·)), где x0 = x(0).
Введём обозначение
U (x, t) := {u ∈ U : r(x, u, t) 0},
где r(x, u, t) := g(x, t) + 〈a(t), u〉. Рассмотрим подмножество UR(x, t) множества U(x, t), ко-
торое состоит из точек u ∈ U(x, t), отвечающих следующему условию непрерывности: для
любой окрестности Ou точки u найдётся окрестность Ox точки x такая, что U(y, t)
Ou =
= при всех y ∈ Ox. На простом примере проиллюстрируем как устроено множество точек
непрерывности UR(x, t).
Рассмотрим случай, когда U = {u ∈ Rm : |u| 1} - единичный шар. Зафиксируем точку
t [0,1] и пусть a = a(t) = 0. Пусть Γ(x) обозначает гиперплоскость g(x,t) + 〈a,u〉 = 0.
Тогда имеют место несколько случаев.
1. Гиперплоскость Γ(x) касается сферы Sm-1 = ∂U в точке u, и векторы u и a
сонаправлены. В этом случае UR(x, t) = U(x, t) как следствие непрерывности функции g.
2. Гиперплоскость Γ(x) пересекает сферу Sm-1 более чем в одной точке. Тогда, очевидно,
также имеем UR(x, t) = U(x, t).
3. Гиперплоскость Γ(x) касается сферы Sm-1 в точке u, и векторы u и a разнона-
правлены. При этом в любой окрестности x существует хотя бы одно положительное значение
функции g( · , t) + 〈a, u〉. В этом случае UR(x, t) =.
4. Гиперплоскость Γ(x) касается сферы Sm-1 в точке u, и векторы u и a разнона-
правлены. При этом g(y, t) -〈a, u для всех y из некоторой окрестности точки x. Тогда
UR(x,t) = U(x,t) = {u}.
5. Гиперплоскость Γ(x) не пересекает сферу Sm-1. В этом случае UR(x, t) = U(x, t).
Таким образом, в разобранном примере всегда имеем равенство UR(x, t) = U(x, t), за
исключением случая 3, в котором UR(x, t) = = U(x, t).
Положим Θ(x, t) := cl UR(x, t), если a(t) = 0, и Θ(x, t) := U, если a(t) = 0.
Условие непрерывности, с помощью которого определяется Θ(x, t), является некоторым
общим предположением. Необходимо привести достаточные условия для проверки включения
u ∈ UR(x,t). Сделаем это.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
ОБ ОДНОМ КЛАССЕ ЗАДАЧ УПРАВЛЕНИЯ
523
Обозначим через NU (u) нормальный конус ко множеству в точке, т.е.
NU (u) = {v ∈ Rm : 〈v,w - u〉 0 для любых w ∈ U}.
Будем говорить, что точка u ∈ U(x, t) регулярна, если при u ∈ U0(x, t) выполняется условие
a(t) ∈ -NU (u), где U0(x,t) = {u ∈ U : r(x,u,t) = 0}. Для каждой регулярной точки u ∈
∈ U(x,t) имеет место включение u ∈ UR(x,t). Этот факт вытекает из теоремы устойчивости
Робинсона [1]. Действительно, регулярность точки u означает выполнение условия Робинсона
для вариационной системы
(
)
r(x, u, t)
(-∞, 0] × U,
u
которое заключается в том, что ядро сопряжённого оператора производной по u отображения
слева имеет тривиальное пересечение с нормальным конусом ко множеству справа.
Рассмотрим функцию
γ(x, t) := min
max
〈a(t), q〉,
u∈U0(x,t)
q∈NU (u)
B1(0)
где K означает сопряжённый конус, Bε(x) - замкнутый шар радиуса ε с центром в x.
Если U0(x, t) =, то по определению γ(x, t) = +∞. Из того, что многозначные отобра-
жения U0(x, t) и NU (u) полунепрерывны сверху, а значит, NU (u) полунепрерывно снизу,
непосредственно вытекает, что γ(x, t) является полунепрерывной снизу функцией. Отсюда
также имеем, что эта функция - борелевская, что используем ниже. Кроме того, γ(x, t) 0.
Пусть E - заданное измеримое множество на прямой и τ ∈ E. Обозначим через F(τ; E)
семейство замкнутых подмножеств D ⊆ E, которые обладают тем свойством, что τ ∈ D и
точка τ является точкой плотности множества D.
Рассмотрим функцию Гамильтона-Понтрягина (см. [2, гл. 1, с. 24])
H(x, u, t, ψ, λ) := 〈ψ, f(x, u, t)〉 - λf0(x, u, t).
Cформулируем принцип максимума.
Определение 1. Процесс управления (x, u) удовлетворяет принципу максимума, если
существуют множители Лагранжа: число λ 0, вектор-функция с ограниченным изменением
ψ(t) и борелевская мера η 0 такие, что выполняются следующие условия:
условие нетривиальности
λ + (0)| + ∥η∥ = 0;
сопряжённое уравнение
t
ψ(t) = ψ(0) - H′x(x(s), u(s), s, ψ(s), λ) ds +
g′x(x(s),s)dη, t ∈ (0,1];
(4)
0
[0,t]
условия трансверсальности
(ψ(0), -ψ(1)) ∈ λϕ(p) + NS (p);
(5)
условие максимума
max H(x(t), u, t, ψ(t), λ) H(x(t), u(t), t, ψ(t), λ) для п.в. t ∈ [0, 1];
(6)
u∈Θ(x(t),t)
условие Эйлера-Лагранжа, которое принимает вид: для п.в. t ∈ [0, 1] существует множе-
ство D ∈ F(t; [0, 1]) такое, что
H′u(x(t), u(t),t,ψ(t)) ∈ a(t)Dη(t;D) + NU (u(t)),
(7)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
524
АРУТЮНОВ, КАРАМЗИН
где Dη(t; D) - обобщённая производная меры η в смысле предела)
η(D
Bε(t))
Dη(t;D) := Lim sup
;
ε→0
2ε
условие дополняющей нежёсткости, которое состоит из двух частей:
(a) для п.в. t ∈ E := {s ∈ [0, 1] : r(x(s), u(s), s) < 0} существует множество D ∈ F(t; E)
такое, что
Dη(t;D) = {0};
(8)
(b) для любого отрезка [c, d] ⊆ {t ∈ [0, 1] : a(t) = 0} имеет место равенство
g(x(t),t) = 0.
[c,d]
Кроме того, при каждых t ∈ [0, 1] и ε > 0 таких, что
Bε(t)
[0, 1] ⊆ {s ∈ [0, 1] : UR(x(s), s) =},
имеет место оценка
γ(x(s),s) const · ε.
(9)
Bε(t)
[0,1]
Множество D в условиях (7) и (8) можно взять одним и тем же для п.в. t ∈ E.
Основной результат данной работы содержится в следующей теореме.
Теорема. Пусть процесс управления (x(·), u(·)) является сильным минимумом в задаче
(3). Тогда (x(·), u(·)) удовлетворяет принципу максимума.
Приведём небольшой комментарий. Условие максимума (6) принимает нестандартную фор-
му, так как максимум берётся по некоторому подмножеству Θ(x(t), t) исходного допустимого
множества U(x(t), t) . Это подмножество содержит замыкание регулярных точек допустимого
множества, но может оказаться пустым. В таком случае максимум полагается равным -∞.
Заметим, что неравенство (6) может быть строгим, а условие максимума в форме (6) обобщает
аналогичное условие из статьи [3].
Обратимся к условию Эйлера-Лагранжа (7). Поскольку скалярная монотонная функция
η([0, t]) почти всюду дифференцируема, а её производная почти всюду совпадает с плотно-
стью абсолютно непрерывной компоненты меры m(t) :=ac/dt, из (7) несложно с помощью
леммы об измеримом селекторе выводится существование такой функции ξ ∈ L1([0, 1]; R), что
справедливо включение
H′u(x(t), u(t),t,ψ(t)) - ξ(t)a(t) ∈ NU (u(t)).
При этом ξ(t) [0, m(t)] для п.в. t ∈ [0, 1]. Поскольку множество D можно взять одним и
тем же и в (7), и в (8), то для функции ξ(·) из (8) также имеем равенство
ξ(t)r(x(t), u(t), t) = 0 для п.в. t.
Приходим к условию Эйлера-Лагранжа в форме, предложенной в книге [4, гл. 1]. Осуществим
и обратный переход, а значит, имеют место эквивалентные формы записи некоторых условий
оптимальности из числа представленных здесь и в [4].
Рассмотрим условие дополняющей нежёсткости. Вторая часть этого условия, справедливая
при a(t) = 0, стандартна, т.е. такая же, как и в обычном принципе максимума для задачи
с фазовыми ограничениями. Относительно же первой его части, ввиду условия “п.в.” в (8),
) Здесь Lim sup означает множество всех предельных точек, или так называемый верхний предел в смысле
Куратовского (см. [3]).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
ОБ ОДНОМ КЛАССЕ ЗАДАЧ УПРАВЛЕНИЯ
525
ничто не “запрещает” мере η иметь атом в любой точке отрезка [0, 1], где a(t) = 0. Однако
этот факт может оказаться в противоречии с оценкой (9) при наличии подходящих условий
регулярности. Перейдём к таким условиям.
Определение 2. Траектория x(·) называется регулярной в точке t0 [0,1] относитель-
но смешанных ограничений, если для любой точки u ∈ U0(x(t0), t0) существует такое d =
= d(u, t0) ∈ NU (u)
Sm-1, что выполняется неравенство 〈a(t0),d〉 > 0. Траектория регу-
лярна относительно смешанных ограничений, если она регулярна в каждой точке t ∈ [0, 1]
равномерно по t, т.е. существует α0 > 0 такое, что 〈a(t), d(u, t)〉 > α0 для всех t ∈ [0, 1] и
u ∈ U0(x(t),t).
Рассмотрим точку t0 [0, 1], в которой траектория регулярна относительно смешанных
ограничений. Из теоремы устойчивости Робинсона [1] вытекает, что UR(x(t), t) = для всех
t из некоторой окрестности точки t0. С другой стороны, в силу определений и свойства ком-
пактности несложно проверяется, что γ(x(t0), t0) > 0. Поскольку γ полунепрерывна снизу,
отсюда в силу (9) следует, что мера η абсолютно непрерывна в окрестности точки t0 и,
более того, липшицева (т.е. её производная Радона-Никодима существенно ограничена). Тог-
да, как несложно видеть, в окрестностях таких регулярных точек t0 принцип максимума из
определения 1 превращается в обычный принцип максимума, справедливый для регулярных
смешанных ограничений (см. [5-7]).
Рассмотрим теперь точку t0 [0, 1] такую, что a(t) = 0 для всех t из некоторой окрестно-
сти t0. В такой окрестности, очевидно, будут выполнены условия обычного принципа макси-
мума для задач с фазовыми ограничениями, и, в частности, если a(t) = 0 для любого t ∈ [0, 1],
то определение 1 представляет собой известный принцип максимума в форме Дубовицкого-
Милютина [8, 9].
2. Доказательство теоремы 1. Предположения линейности и выпуклости позволяют
воспользоваться методом штрафов (см. [6, гл. 2]). Пусть i - произвольное натуральное число.
Зафиксируем ε > 0 и рассмотрим штрафную задачу
1
Φi(x0,u(·)) := Φ(x0,u(·)) + i (r(x(t),u(t),t)+)2 dt +
0
1
+ |p - p|2 + ε
|u(t) - u(t)|2 dt → min,
0
(10)
x(t) = f(x(t), u(t), t),
p ∈ S,
x(t) - x(t)| ε для любого t ∈ [0, 1],
|
u(t) ∈ U для п.в. t ∈ [0, 1].
В силу предположений линейности и выпуклости, поскольку U - компакт, решение задачи
(10) существует по теореме А.Ф. Филиппова [10]. Обозначим это решение через (x0,i, ui(·)), а
через xi(·) и pi - траекторию и концевой вектор соответственно. Используя стандартные рас-
суждения, основанные на секвенциальной компактности, переходя к подпоследовательности,
→ u слабо в L2([0,1];Rm) для некоторых p = (x0,x1) и u(·).
Тогда xi(t) x(t) равномерно на отрезке [0, 1], где x(·) - абсолютно непрерывная функция
такая, что x(t) = f(x(t), u(t), t) и x(0) = x0.
Покажем что процесс управления (x(·), u(·)) допустим в исходной задаче (3). Действитель-
но, имеем Φi(x0,i, ui(·)) Φi(x0, u(·)), откуда
1
const
(r(xi(t), ui(t), t)+)2 dt
i
0
Отсюда при i → ∞ следует, что u(t) ∈ U(x(t), t) для п.в. t ∈ [0, 1], так как выпуклый функ-
ционал, стоящий в левой части, слабо полунепрерывен снизу. При этом также используется
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
526
АРУТЮНОВ, КАРАМЗИН
тот факт, что выпуклое замкнутое множество в гильбертовом пространстве слабо замкнуто.
Также очевидно, что p ∈ S. Таким образом, (x(·), u(·)) - допустимый процесс в задаче (3).
Докажем, что x(·) = x(·) и u(·) = u(·). Имеем
1
Φ(x0,i, ui(·)) + |pi - p|2 + ε
|ui(t) - u(t)|2 dt Φi(x0,i, ui(·)) Φi(x0, u(·)) = Φ(x0, u(·)).
0
Используя слабую полунепрерывность снизу и переходя к пределу в последнем выражении,
получаем неравенство
1
Φ(x0, u(·)) + |p - p|2 + ε
|u(t) - u(t)|2 dt Φ(x0, u(·)).
0
Однако процесс (x(·), u(·)) допустим, поэтому Φ(x0, u(·)) Φ(x0, u(·)). Тогда x(·) = x(·),
u(t) при i → ∞, t ∈ [0, 1].
Более того, в силу полученной оценки ui(·) u(·) сильно в пространстве L2 после перехода
к подпоследовательности можно считать, что ui(t) u(t) для п.в. t ∈ [0, 1].
Используя то, что |xi(t) - x(t)| < ε для всех t и всех достаточно больших i, применим
к штрафной задаче известный принцип максимума (см., например, [11, теорема 6.27]). Су-
ществуют число λi 0 и абсолютно непрерывная функция ψi(·), которые одновременно не
равны нулю, такие, что имеют место равенства
ψi(t) = -H′x(xi(t),ui(t),t,ψi(t)i) + 2λiir(xi(t),ui(t),t)+g′x(xi(t),t),
(11)
(ψi(0), -ψi(1)) ∈ λiϕ(pi) + NS(pi) + 2λi(pi - p),
(12)
max(H(xi(t), u, t, ψi(t), λi) - λii(r(xi(t), u, t)+)2 - λiε|u - u(t)|2) =
u∈U
= H(xi(t),ui(t),t,ψi(t)i) - λii(r(xi(t),ui(t),t)+)2 - λiε|ui(t) - u(t)|2
(13)
для п.в. t ∈ [0, 1].
Из условия максимума (6) вытекает уравнение Эйлера-Лагранжа в форме
H′u(xi(t),ui(t),t,ψi(t)i) - 2λiir(xi(t),ui(t),t)+a(t) - 2λiε(ui(t) - u(t)) ∈ NU (ui(t))
(14)
для п.в. t ∈ [0, 1].
Из метода штрафов следует, что
1
i (r(xi(t), ui(t), t)+)2 dt → 0 при i → ∞.
(15)
0
Обозначим через ηi абсолютно непрерывную борелевскую меру такую, что
ηi(B) = 2λii r(xi(t),ui(t),t)+ dt.
B
Пронормируем множители Лагранжа следующим образом:
λi +i(0)| + ∥ηi = 1.
(16)
Из (16), используя слабую-* секвенциальную компактность в пространстве борелевских
→ η для некоторой борелев-
ской меры η на σ([0, 1]). При этом ∥ηi∥ → ∥η∥. Также в силу компактности имеем λi → λ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
ОБ ОДНОМ КЛАССЕ ЗАДАЧ УПРАВЛЕНИЯ
527
для некоторого числа λ 0 и ψi(t) → ψ(t) для некоторой функции ψ с ограниченным
изменением на [0, 1]. Причём сходимость имеет место для всех точек непрерывности функ-
ции ψ, включая концы отрезка времени. Здесь учтено то, что последовательность функций
ψi(t) равномерно ограничена. Это несложно вытекает из (11), (16) и неравенства Гронуолла.
Существование искомой функции ψ(t) следует из теоремы Хелли.
Теперь перейдём последовательно к пределу в условиях (11)-(14). Переходя к пределу
в (11) стандартным образом, используя интегральную форму представления, получаем (4).
Переходя к пределу в (12), используя свойство полунепрерывности сверху предельного нор-
мального конуса, приходим к условию (5).
Перейдём к пределу в условии максимума (13). По определению множества UR(x, t) для
всех t ∈ [0, 1] : a(t) = 0 и u ∈ UR(x(t), t) при каждом достаточно большом i существует
вектор vi ∈ U(xi(t), t) такой, что |vi - u| → 0 при i → ∞. Поэтому, подставляя при заданном
t в условие максимума (13) в качестве u вектор vi и переходя к пределу при i → ∞, приходим
к условию
H(x(t),u,t,ψ(t)) - λε|u - u(t)|2 H(x(t), u(t),t,ψ(t))
для любого u ∈ UR(x(t), t) и п.в. t таких, что a(t) = 0. При этом мы использовали тот факт,
что в силу (15) с точностью до подпоследовательности можно считать, что
i(r(xi(t), ui(t), t)+)2 0 для п.в. t ∈ [0, 1].
Для п.в. t ∈ [0, 1] таких, что a(t) = 0, очевидно, имеем
max(H(x(t), u, t, ψ(t), λ) - λε|u - u(t)|2) = H(x(t), u(t), t, ψ(t), λ).
u∈U
Перейдём к пределу в (14). По теореме Егорова для любого δ > 0 существует измеримое
множество Eδ :(Eδ) 1 - δ, на котором последовательность функций ui(t) сходится равно-
мерно к u(t)). Рассмотрим точку t0 ∈ Eδ такую, что t0 есть точка плотности Eδ и одновре-
менно точка аппроксимативной непрерывности u(t). Известно, что почти все точки множества
обладают такими свойствами. Рассмотрим измеримое подмножество D = D(t0, δ) ⊆ Eδ, для
которого t0и справедливы равенства:
(D
[t0 - h, t0 + h])
i) lim
= 1;
h→0
2h
ii) lim
u(t) = u(t0).
t→t0
Модификация множества D, которая для упрощения изложения опускается, позволяет
считать, что D - замкнутое множество с сохранением свойств i), ii), и более того, что пре-
дельная мера η непрерывна в точках τj , σj, где τj, σj определяются из следующей формулы
для открытого дополнения:
(0, 1) \ D = (τj, σj ).
j
Здесь используется тот факт, что любое измеримое множество можно аппроксимировать по
мере изнутри замкнутым множеством.
Интегрируя (14) на множестве D
Bϵ(t0), где ϵ > 0 выбрано так, что точки t0 ± ϵ суть
точки непрерывности η, и переходя к пределу сначала при i → ∞, а потом и по ϵ → 0, с
учётом равномерной сходимости функций ui(t) и сходимости по построению
a(t)i
a(t)
D
Bϵ(t0)
D
Bϵ(t0)
приходим к равенству (7) в точке t0. При этом конвексификация правой части в (7) возника-
ет из-за интегрирования. Поскольку множествами Eδ можно исчерпать с точностью до п.в.
отрезок [0, 1], получаем условие (7) для п.в. t ∈ [0, 1].
) Здесь означает меру Лебега на прямой.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
528
АРУТЮНОВ, КАРАМЗИН
Докажем условие дополняющей нежёсткости (8). Положим
Z := {t ∈ [0, 1] : r(x(t), u(t), t) < 0}.
Рассмотрим точку t0 ∈ Z
Eδ, являющуюся точкой плотности ZEδ. Как и выше, рас-
смотрим замкнутое множество D ⊆ Z
Eδ, удовлетворяющее свойству i), такое, что мера η
непрерывна в точках τj, σj (см. выше). Тогда в силу равномерной сходимости на множестве
D при малом ϵ > 0 таком, что точки t0 ± ϵ также точки непрерывности η, имеем
ηi(D
Bϵ(t0)) = 2λii
r(xi(t), ui(t), t)+ dt = 0.
D
Bϵ(t0)
Отсюда в силу слабой-* сходимости мер имеем, что η(D
Bϵ(t0)) = 0. Поскольку множе-
ствами Eδ можно исчерпать с точностью до п.в. всё множество Z, приходим к условию (3).
Вторая часть условий, справедливая при a(t) = 0, вытекает непосредственно из предела (15).
Докажем оценку (9). Возьмём число α > 0 и положим
Uα(x,t) := {u ∈ U : |r(x,u,t)| α},
γα(t) :=
min
max
〈a(t), q〉.
u∈Uα(Bα(x(t)),t)
q∈(NU (u))
B1(0)
Заметим, что функция γα(t) полунепрерывна снизу и γα1 (t) γα2 (t) при α2 < α1. Также
очевидно, что γ0(t) = γ(x(t), t).
Рассмотрим точку t0 [0, 1], в некоторой окрестности O = (t0-ϵ, t0+ϵ) которой множество
UR(x(t),t) всюду непусто. Пусть η непрерывна на границе такой окрестности. Из условия
непустоты множества и условия максимума (13) следует, что r(xi(t), ui(t), t)+ 0 равномерно
на O. Поэтому, умножая скалярно (13) на произвольный вектор q ∈ (NU (ui(t)))
B1(0),
приходим к оценке
γα(t)i const · ℓ(O).
O
Переходя здесь к пределу, используя свойства полунепрерывности снизу и слабой-* сходимости
мер, получаем соотношения
γα(t) lim inf
γα(t)i
const · ℓ(O).
i→∞
O
O
Остаётся заметить, что lim
γα(t) = γ0(t). Поэтому по теореме Б. Леви (см. [12, с. 299]), пе-
α→0
реходя к пределу в последнем неравенстве, приходим к оценке (9). Если η имеет атомы на
границе O, то γ0(t) автоматически обнуляется в таких точках, и поэтому все предельные
переходы выше сохраняются.
Полученные множители Лагранжа зависят от ε > 0, поэтому нужен ещё один предельный
переход по ε → 0 в полученных условиях. Но этот предельный переход совершается по схеме,
аналогичной описанной выше. Теорема доказана.
3. Приложение. Рассмотрим приложение полученной теоремы к двум примерам, разо-
бранным во введении. Для этого будем рассматривать задачи (1) и (2) с дополнительным
ограничением u ∈ Bc(0), где c := ∥u∥L + 1. Такое ограничение введено формально, чтобы
удовлетворить требованиям теоремы о компактности множества U. Оно не влияет на минимум
задачи и дальнейшие рассуждения.
Начнём с задачи (1). Из оценки (9) следует, что мера η абсолютно непрерывна при t = a.
Положим m(t) := dη/dt для п.в. t. Сопряжённое уравнение (4) имеет вид
(t) = λ dt + dη,
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
ОБ ОДНОМ КЛАССЕ ЗАДАЧ УПРАВЛЕНИЯ
529
поэтому при t = a функция ψ(t) также абсолютно непрерывна, и имеют место соотношения
ψ(t) = λ + m(t), ψ(t) = (t - a)m(t),
где последнее равенство справедливо в силу условия Эйлера-Лагранжа (7).
Тогда функция m(t) непрерывно дифференцируема при t = a и (t - a) m(t) = λ. Значит,
m(t) = λ ln(t - a) + const при t > a, что влечёт за собой λ = 0, так как m(t) 0. Пока-
жем, что η({a}) = 0. Действительно, в противном случае из сопряжённого уравнения имеем,
что ψ(t) разрывна в точке t = a. Однако из условия Эйлера-Лагранжа вытекает, что ψ(t)
непрерывна в t = a, поскольку m(t) интегрируема. Таким образом, получаем следующий
набор множителей: λ = 0, η = c1 на [0, a] и η = c2 на [a, 1], ψ(t) = c1(t - a) на [0, a] и
ψ(t) = c2(t - a) на [a, 1], где c1 и c2 - неотрицательные константы такие, что c1 + c2 > 0.
Перейдём ко второму примеру. Условия принципа максимума дают равенства
1(t) = -λ dt, dψ2(t) = - dη, ψ1(t) dt = t dη.
Вместе с тем ψ1(1) = 0, ψ2(1) = 0.
Из (9) следует, что мера η абсолютно непрерывна при t > 0. Поэтому для п.в. t имеем
ψ1(t) = -λ,
ψ2(t) = -m(t), ψ1(t) = tm(t),
где m(t) = dη/dt.
Отсюда, поскольку m(t) суммируема, ψ1(0) = 0, из условий трансверсальности имеем,
что ψ1(t) 0 и λ = 0. Значит, m(t) = 0 для п.в. t. Поэтому единственный с точностью до
нормировки набор множителей Лагранжа, удовлетворяющий условиям оптимальности, будет
следующим:
{
-1, t = 0,
λ = 0, η = δ(0), ψ1(t) = 0, ψ2(t) =
0,
t > 0.
Одной из первых работ по задачам со смешанными ограничениями является статья [13].
Смешанные ограничения рассматривались также, например, в работах [14, гл. 6, c. 282; 15,
гл. 5; 16, c. 283; 17-21].
Заключение. Теорема дополняет результаты других авторов о необходимых условиях
оптимальности в задачах управления с нерегулярными смешанными ограничениями.
Работа выполнена при финансовой поддержке Российского научного фонда (проект 20-11-
20131).
СПИСОК ЛИТЕРАТУРЫ
1. Robinson Stephen M. Regularity and stability for convex multivalued functions // Mathematics of
Operations Research. 1976. V. 1. № 2. P. 130-143.
2. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оп-
тимальных процессов. М., 1983.
3. Arutyunov A.V., Karamzin D.Y., Pereira F.L., Silva G.N. Investigation of regularity conditions in
optimal control problems with geometric mixed constraints // Optimization. 2016. V. 65. P. 185-206.
4. Милютин А.А. Принцип максимума в общей задаче оптимального управления. М., 2001.
5. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М., 1979.
6. Арутюнов А.В. Условия экстремума. М., 1997.
7. Милютин А.А., Дмитрук А.В., Осмоловский Н.П. Принцип максимума в оптимальном управле-
нии. М., 2004.
8. Дубовицкий А.Я., Милютин А.А. Задачи на экстремум при наличии ограничений // Журн. вы-
числит. математики и мат. физики. 1965. Т. 5. № 3. С. 395-453.
9. Dmitruk A.V. On the development of Pontryagin’s maximum principle in the works of A.Ya. Dubovitskii
and A.A. Milyutin // Control and Cybernetics. 2009. V. 38. № 4a. P. 923-958.
7
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023
530
АРУТЮНОВ, КАРАМЗИН
10. Филиппов А.Ф. О некоторых вопросах теории оптимального регулирования // Вестн. Моск. ун-та.
Сер. 3. Физ. Астрон. 1959. № 2. C. 25.
11. Mordukhovich B.S. Variational Analysis and Generalized Differentiation. V. II. Applications. Berlin, 2006.
12. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М., 1968.
13. Дубовицкий А.Я., Милютин А.А. Необходимые условия слабого экстремума в задачах оптималь-
ного управления со смешанными ограничениями типа неравенства // Журн. вычислит. математики
и мат. физики. 1968. Т. 8. № 4. С. 725-779.
14. Neustadt L.W. Optimization. Princeton, 1976.
15. Тер-Крикоров А.М. Оптимальное управление и математическая экономика. М., 1977.
16. Milyutin A.A., Osmolovskii N.P. Calculus of Variations and Optimal Control. Providence, 1998.
17. de Pinho M.R., Vinter R.B., Zheng H. A maximum principle for optimal control problems with mixed
constraints // IMA J. Math. Control Inform. 2001. V. 18. P. 189-205.
18. Clarke F., de Pinho M.R. Optimal control problems with mixed constraints // SIAM J. Control Optim.
2010. V. 48. P. 4500-4524.
19. Дубовицкий А.Я., Милютин А.А. Необходимые условия слабого минимума в общей задаче опти-
мального управления. М., 1971.
20. Дубовицкий А.Я., Милютин А.А. Принцип максимума в линейных задачах с выпуклыми смешан-
ными ограничениями // Zeitschift fur Analysis und Anvwendungen. 1985. Bd. 4 (2). S. 133-191.
21. Becerril J.A., de Pinho M.D.R. Optimal control with nonregular mixed constraints: an optimization
approach // SIAM J. on Control and Optimization. 2021. V. 59. № 3. P. 2093-2120.
Институт проблем управления
Поступила в редакцию 22.01.2023 г.
имени В.А. Трапезникова РАН, г. Москва,
После доработки 22.01.2023 г.
Федеральный исследовательский центр
Принята к публикации 24.02.2023 г.
“Информатика и управление” РАН, г. Москва
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№4
2023