Автоматика и телемеханика, № 4, 2022
Стохастические системы
© 2022 г. К.Б. МАНСИМОВ, д-р физ.-мат. наук (kamilbmansimov@gmail.com)
(Бакинский государственный университет;
Институт систем управления НАН Азербайджана, Баку),
Р.О. МАСТАЛИЕВ, д-р философии по математике (mastaliyevrashad@gmail.com)
(Институт систем управления НАН Азербайджана, Баку)
К НЕОБХОДИМЫМ УСЛОВИЯМ ОПТИМАЛЬНОСТИ ОСОБЫХ
УПРАВЛЕНИЙ В СТОХАСТИЧЕСКИХ СИСТЕМАХ ГУРСА-ДАРБУ
Рассмотрена задача оптимального управления стохастической систе-
мой, динамика которой описывается стохастическим дифференциальным
уравнением с частными производными второго порядка гиперболического
типа с краевыми условиями Гурса. Получен стохастический аналог прин-
ципа максимума Понтрягина и исследованы на оптимальность особые в
смысле принципа максимума управления.
Ключевые слова: нелинейная стохастическая система Гурса-Дарбу, необ-
ходимые условия, оптимальность, принцип максимума Понтрягина, фор-
мула приращения критерия качества, особое управление.
DOI: 10.31857/S0005231022040043, EDN: AAHNYR
1. Введение
Как известно [1-7], качественная теория задач оптимального управления
системами Гурса-Дарбу к настоящему времени достаточно полно изучена.
При этом получены необходимые условия оптимальности первого порядка,
в том числе типа принципа максимума Понтрягина. Также в публикациях
[2, 3, 5-7] исследованы особые случаи, связанные с вырождением принципа
максимума Понтрягина и его следствий.
В перечисленных и других публикациях исследованы детерминированные
системы Гурса-Дарбу, т.е. не учитывающие воздействие на объект регулиро-
вания случайных возмущений, присутствующих в реальных системах управ-
ления. По этой причине естественно особый интерес вызывают исследования
задач управления стохастическими системами Гурса-Дарбу, поведение ко-
торых не может быть описано с полной определенностью. Подобные задачи
имеют широкий спектр технических и физических приложений. Они возни-
кают, например, при исследовании процессов сорбции и десорбции газов, про-
цессов сушки и др. при наличии случайных воздействий типа “белых шумов”
на плоскости [8-10].
Ряд вопросов, связанных с выводом необходимых условий оптимальности
первого порядка в задачах управления, описываемых стохастическими систе-
мами Гурса-Дарбу, изучены в публикациях [8, 11-16 и др.].
47
В предлагаемой статье, используя некоторые идеи из [5-7], предложена
схема вывода необходимых условий оптимальности первого и второго поряд-
ков при достаточно естественных условиях гладкости, наложенных на данные
рассматриваемой задачи управления стохастической системой Гурса-Дарбу.
Установлен стохастический аналог принцип максимума Понтрягина и иссле-
дованы на оптимальность особые управления.
2. Постановка задачи
Пусть D = T × X = [t0, t1] × [x0, x1] — заданный прямоугольник, а поток
σ-алгебр Fy = Ftx(y = (t, x)) есть семейство σ-алгебр Fy ∈ F , определенных
на основном вероятностном пространстве (Ω, F, P ), причем Fy ⊂ Fy , если
y ≤ y, (т.е. t ≤ t, x ≤ x).
Здесь F = σ(W (τ, s), t0 ≤ τ ≤ t, x0 ≤ s ≤ x) — σ-алгебра, порожденная
двухпараметрическим винеровским процессом W (t, x), (t, x) ∈ D.
Допустим, что управляемый процесс в заданной области D описывается
системой стохастических дифференциальных уравнений в частных производ-
ных гиперболического типа
2W(t,x)
(1)
ztx = f(t,x,z,zt,zx,u) + g(t,x,z)
,
(t, x) ∈ D,
∂t∂x
с краевыми условиями типа Гурса
z(t0, x) = a(x), x ∈ X,
(2)
z(t, x0) = b(t), t ∈ T, a(x0) = b(t0
).
Здесь f(t, x, p, u) — заданная n-мерная вектор функция, непрерывная по
совокупности переменных вместе с частными производными по p до второго
порядка включительно, где p = (z, zt, zx), а () здесь и далее обозначает опе-
рацию транспонирования; g(t, x, z) — заданная (n × n) матричная функция,
непрерывная по совокупности переменных вместе с частными производными
по z до второго порядка включительно; n-мерные краевые вектор функции
a(x), b(t), заданные на X и T соответственно, удовлетворяют условию Лип-
шица;2W(t,x)∂t∂x n-мерный двухпараметрический “белый шум” на плоскости
[8, 17].
В качестве допустимых управлений выберем измеримые относительно бо-
релевской σ-алгебры, ограниченные r-мерные вектор-функции u(t, x), удо-
влетворяющие условию типа включения
(3)
u(t, x) ∈ U, (t, x) ∈ D,
где U — заданное непустое и ограниченное множество из Rr.
48
Заметим, что краевая задача (1)-(2) эквивалентна следующему двумерно-
му интегральному уравнению типа Вольтерра:
t
x
z(t, x) = a(x) + b(t) - a(x0) +
f (τ, s, z, zτ , zs, u)dsdτ +
t0
x0
t
x
2W(τ,s)
(4)
+
g(τ, s, z)
dsdτ.
∂τ∂s
t0
x0
В соотношении (4) последнее слагаемое понимается как стохастический ин-
теграл по W (t, x) (см., например, [8, 11]).
Отметим, что под решением задачи (1)-(2) понимается случайная функ-
ция z(t, x), подчиненная потоку σ-алгебр {Ftx, (t, x) ∈ D}, такое что интегра-
лы в правой части (4) существуют и (4) выполняется с вероятностью единица
(см., например, [8, 18, 19]).
Предполагается, что выполняются все предположения из [8], обеспечиваю-
щие для каждого допустимого управления u(t, x) существование и единствен-
ность решения z(t, x) краевой задачи (1)-(2).
На решениях краевой задачи (1)-(2), порожденных всевозможными допу-
стимыми управлениями u(t, x), (t, x) ∈ D, определим терминальный функ-
ционал качества
(5)
S(u) = Eϕ(z(t1, x1
)),
где ϕ(z) — заданная, дважды непрерывно-дифференцируемая скалярная
функция, E — знак математического ожидания.
Рассмотрим следующую задачу оптимального управления: найти такое до-
пустимое управление u(t, x), чтобы функционал качества (5) принимал наи-
меньшее возможное значение.
Цель настоящей статьи — получение стохастического аналога принци-
па максимума Понтрягина и изучение особых управлений (т.е. управлений,
вдоль которых принцип максимума Понтрягина вырождается) для рассмат-
риваемой задачи (1)-(5).
3. Формула приращения второго порядка
Пусть u(t, x) и u(t, x) = u(t, x) + Δu(t, x), (t, x) ∈ D, — некоторые допусти-
мые управления, а z(t, x) и z(t, x) = z(t, x) + Δz(t, x), (t, x) ∈ D, — соответ-
ствующие им решения краевой задачи (1)-(2).
Для удобства далее введем обозначения:
H(t, x, p, u, ψ) = ψf(t, x, p, u),
Δu H[t,x] = H(t,x,p(t,x),u(t,x)(t,x)) - H(t,x,p(t,x),u(t,x)(t,x)),
Hp[t,x] = Hp(t,x,p(t,x),u(t,x)(t,x)),
49
fp[t,x] = fp(t,x,p(t,x),u(t,x)), gz[t,x] = gz(t,x,z(t,x)),
Δu f[t,x] = f(t,x,p(t,x),u(t,x)) - f(t,x,p(t,x),u(t,x)).
Здесь случайные процессы (ψ(t, x), β(t, x)) ∈ L(D, Rn) × L(D, Rn×n) явля-
ются решением стохастического линейного двумерного интегрального урав-
нения типа Вольтерра (сопряженная система):
t1
x1
∂ϕ(z(t1, x1))
ψ(t, x) = -
+ Hzx[τ,x]+ Hzt[t,s]ds +
∂z
t
x
x1
t1
x1
t1
2W(τ,s)
+
Hz[τ,s]dsdτ +
β(τ, s)
dsdτ,
∂τ∂s
t x
t x
штрих означает транспонирование.
С учетом принятых обозначений, используя формулу Тейлора, прираще-
ние функционала (4), соответствующее управлениям u(t, x), u(t, x), можно
представить в виде
ΔS(u) = S(u) - S(u) =
x1
t1
1
2ϕ(z(t1,x1))
ΔuH[t,x]dxdt +
Δz(t1,x1)
Δz(t1,x1)-
=E-
2
∂z2
t0
x0
t1
x1
t1
x1
-
ΔuH′z[t,xz(t,x)dxdt -
ΔuH′z
[t, xzt(t, x)dx dt -
t
t0 x0
t0
x0
t1
x1
t1
x1
(6)
1
-
ΔuH′z
[t, xzx(t, x)dx dt -
Δz(t,x)Hzz[t,xz(t,x)dxdt-
x
2
t0 x0
t0 x0
t1
x1
1
-
Δz′t(t,x)Hztz
[t, xzt(t, x)dx dt -
t
2
t0 x0
t1
x1
1
-
Δz′x(t,x)Hzxz
[t, xzx(t, x)dx dt
+ η1u(t,x)),
x
2
t0
x0
где по определению
x1
⎨ (
) t1
(
)
η1u(t,x)) = E
o1
Δz(t1, x1)2
-
o2
Δp(t, x)2 dx dt -
t0 x0
t1
x1
1
-
Δp(t,xuHpp[t,xp(t,x)dxdt
2
t0
x0
50
Здесь величины o1(·), o2(·) определяются соответственно из разложений
∂ϕ(z(t1, x1))
ϕ(z(t1,x1)) - ϕ(z(t1,x1)) =
Δz(t1,x1) +
∂z
(
)
1
2ϕ(z(t1,x1))
+
Δz(t1,x1)
Δz(t1,x1) + o1
Δz(t1, x1)2 ,
2
∂z2
H (t, x, p(t, x), u(t, x), ψ(t, x)) - H (t, x, p(t, x), u(t, x), ψ(t, x)) =
1
= H′p[t,xp(t,x) +
Δp(t,x)Hpp (t,x,p(t,x),u(t,x)(t,x)) Δp(t,x) +
2
(
)
+o2
Δp(t, x)2
С другой стороны, учитывая систему (1)-(2), согласно формуле Тейлора
можно доказать, что приращение Δz(t, x) состояния z(t, x) является решени-
ем стохастической линеаризованной задачи:
(7)
Δztx = f′z[t,xz(t,x) + f′z
[t, xzt(t, x) + f′z
[t, xzx
(t, x) +
t
x
2W(t,x)
uf[t,x] + gz[t,x]
+ r1(t,x),
∂t∂x
(8)
Δz(t0,x) = 0, x ∈ X,
Δz(t,x0
) = 0, t ∈ T.
Здесь по определению
2W(t,x)
r1(t,x) = Δuf′p[t,xp(t,x) + o3(Δp(t,x)) + o4(Δp(t,x))
,
∂t∂x
а величины o3(·), o4(·) определяются соответственно из разложений
f (t, x, p(t, x), u(t, x)) - f (t, x, p(t, x), u(t, x)) =
= f′p (t,x,p(t,x),u(t,x))Δp(t,x) + o3 (Δp(t,x)).
Интерпретируя уравнение (7) как линейное стохастическое неоднородное
уравнение относительно приращения Δz(t, x), на основе формулы об инте-
гральном представлении решений линейных стохастических гиперболических
уравнений [19] решение линеаризованной системы (7)-(8) можно представить
в виде
t
x
(9)
Δz(t,x) =
R(t, x; τ, su
f [τ, s]dsdτ + α(t, x),
t0
x0
где
x
t
α(t, x) =
R(t, x; τ, s)r1(τ, s)dsdτ,
t0
x0
51
а R(t,x;τ,s) — измеримая и ограниченная (n × n) матрица Римана систе-
мы (7)-(8), являющаяся решением двумерного стохастического интегрально-
го уравнения Вольтерра:
t
x
R(t, x; τ, s) = I +
R(t, x; α, β)fz [α, β]dαdβ +
τ s
t
x
(10)
+ R(t,x;α,s)fzx [α,s] + R(t,x;τ,β)fzt [τ,β] +
τ
s
t
x
2W(α,β)
+
R(t, x; α, β)gz[α, β]
dαdβ.
∂α∂β
τ s
Здесь I — (n × n) единичная матрица.
Можно показать, что по первой паре аргументов R(t, x; τ, s) является ре-
шением стохастической задачи [19]:
Rtx(t,x;τ,s) = fz[t,x]R(t,x;τ,s) + fzt[t,x]Rt(t,x;τ,s) +
2W(t,x)
(11)
+ fzx[t,x]Rx(t,x;τ,s) + gz[t,x]R(t,x;τ,s)
,
∂t∂x
Rt(t,s;τ,s) = fzx[t,s]R(t,s;τ,s),
Rx(τ,x;τ,s) = fzt[τ,x]R(τ,x;τ,s),
R(τ, s; τ, s) = I.
Далее из представления (9) следует, что
x
(12)
Δzt(t,x) = R(t,x;t,suf[t,s]ds + r2
(t, x),
x0
t
(13)
Δzx(t,x) = R(t,x;τ,xuf[τ,x] + r3
(t, x).
t0
Здесь по определению
t
x
r2(t,x) =
Rt(t,x;τ,suf(τ,s)dsdτ + αt(t,x),
t0
x0
t
x
r3(t,x) =
Rx(t,x;τ,suf(τ,s)dsdτ + αx(t,x).
t0
x0
52
Используя формулы (12), (13) с учетом теоремы Фубини и формулы (Ди-
рихле) [20] имеем
t1
x1
t1
x1
ΔuHzt[t,xzt(t,x)dxdt =
ΔuHzt[t,x]r2(t,x)dxdt +
t0 x0
t0
x0
x1
⎡∫x1
t1
(14)
+
ΔuHzt[t,s]R(t,s;t,x)dsΔu
f [t, x]dx dt,
t0 x0
x
t1
x1
t1
x1
ΔuHzx[t,xzx(t,x)dxdt =
ΔuHzx[t,x]r3(t,x)dxdt +
t0 x0
t0
x0
t1
x1
t1
(15)
+
ΔuHzx[τ,x]R(τ,x;t,x) Δu
f [t, x]dx dt.
t0 x0
t
Следуя [5-7], введем в рассмотрение (n × n) матричные функции
t1
(16)
K(x, τ, s) =
R(t,x;τ,x)Hzxzx
[t, x]R(t, x; s, x)dt,
max(τ,s)
x1
M (t, τ, s) =
R(t,x;t,τ)Hztzt[t,x]R(t,x;t,s)dx.
max(τ,s)
Используя формулы (12), (13) и рассуждая так же, как в [5-7], можно
убедиться в справедливости соотношений:
t1
x1
Δz′t(t,x)Hztz
[t, xzt(t, x)dx dt =
t
t0
x0
x1
x1
t1
=
Δuf[t,τ]M(t,τ,suf[t,s]dsdτdt +
t0
x0 x0
x1
x
t1
+
R(t,x;t,suf[t,s]ds Hztz
[t, x]r2(t, x)dx dt +
t
t0 x0
x0
x1
t1
(17)
+
r2(t,x)Hztz
[t, x]Δzt
(t, x)dx dt,
t
t0
x0
53
t1
x1
Δz′x(t,x)Hzxz
[t, xzx(t, x)dx dt =
x
t0
x0
x1
x1
t1
=
Δuf[τ,x]K(x,τ,suf[s,x]ds dxdτ +
t0
x0 x0
t1
x1
t
+
R(t,x;τ,xuf[τ,x] Hzxz
[t, x]r3(t, x)dx dt +
x
t0 x0
t0
t1
x1
(18)
+
r3(t,x)Hzxz
[t, xzx
(t, x)dx dt.
x
t0
x0
Учитывая (14)-(18), формулу приращения (6) можно представить в ком-
пактном и удобном для дальнейших исследований виде:
x1
t1
ΔS(u) = E
-
ΔuH [t,x]dxdt -
t0 x0
t1
x1
x1
1
-
Δuf [t,τ] M(t,τ,suf [t,s] ds dτ dt -
2
t0 x0 x0
t1
x1
t1
1
-
Δuf [τ,x]K(x,τ,suf [s,x]ds dxdτ -
2
t0
x0 t0
t1
x1
t1
-
ΔuHzx [τ,x] R(τ,x;t,x) +
t0 x0
t
x1
+ ΔuHzt [t,s]R(t,s;t,x)ds Δuf [t,x] dxdt
+
x
(19)
+η2
u(t, x)),
где
x1
⎨∫t1
[
η2u(t,x)) = η1u(t,x)) + E
ΔuH′z
[t, x]r2(t, x) +
t
t0
x0
]
uH′z
[t, x]r3(t, x) + ΔuH′z[t, xz(t, x) dx dt -
x
54
t1
x1
[
1
-
Δz(t,xuHzz
[t, xzt(t, x) + Δz′t(t, xuHz
t
tz[t,xz(t,x)+
2
t0
x0
+ Δz(t,xuHzz
[t, xzx(t, x) + Δz′x(t, xuHz
x
xz[t,xz(t,x)+
+ Δz′t(t,xuHz
tzx[t,xzx(t,x)+Δz′x(t,xuHzxzt[t,xzt(t,x)+
]
+ Δz(t,xuHzz[t,xz(t,x) dxdt -
⎡⎛
t1
x1
x
1
(20)
-
⎣⎝R(t,x;t,suf[t,s]ds Hztz
[t, x]r2
(t, x) +
t
2
t0 x0
x0
+ r2(t,x)Hztzt[t,xzt(t,x) + r3(t,x)Hzxz
[t, xzx(t, x) +
x
t
+ R(t,x;τ,xuf[τ,x] Hzxz
[t, x]r3(t, x) dx dt
x
t0
Таким образом, получили формулу (19) представления второго порядка
для приращения критерия качества (5), которая позволит в дальнейшем по-
лучить ряд критериев оптимальности первого и второго порядков.
4. Стохастический аналог принципа максимума Понтрягина
При помощи формулы приращения (19) доказывается теорема 1.
Теорема 1. Для оптимальности допустимого управления u(t,x) в за-
даче (1)-(5) необходимо, чтобы неравенство
(21)
v
H[θ, ξ] 0
выполнялось для всех (θ, ξ) [t0, t1) × [x0, x1) и при v ∈ U.
Здесь ΔvH[θ, ξ] = H(θ, ξ, p(θ, ξ), v, ψ(θ, ξ)) - H(θ, ξ, p(θ, ξ), u(θ, ξ), ψ(θ, ξ)), а
(θ, ξ) [t0, t1) × [x0, x1) — произвольная точка Лебега (правильная точка [4]
управления u(t, x)).
Соотношение (21) представляет собой стохастический аналог принципа
максимума Понтрягина [4, 7, 21] для рассматриваемой задачи (1)-(5).
5. Необходимые условия оптимальности, особые в смысле принципа
максимума Понтрягина, управлений
Известно, что принцип максимума Понтрягина является самым сильным
необходимым условием оптимальности первого порядка. Но нередки случаи,
когда принцип максимума Понтрягина, вырождаясь, становится неэффек-
тивным. Такие случаи называются особыми, а соответствующие управле-
ния — особыми управлениями [3, 7, 22].
Дадим определение особого управления.
55
Определение. Допустимое управление u(t,x) называется особым, в
смысле принципа максимума Понтрягина, управлением в задаче (1)-(5), ес-
ли для всех (θ, ξ) [t0, t1) × [x0, x1) и при v ∈ U
vH[θ,ξ] = 0.
Полученные формулы приращения второго порядка (19) позволяют до-
казать необходимые условия оптимальности типа максимума Понтрягина и
исследовать случаи их вырождения (особый случай).
Имеет место теорема 2.
Теорема 2. Вдоль особого, в смысле принцип максимума Понтрягина,
оптимального управления в задаче (1)-(5) для всех (θ,ξ) [t0,t1) × [x0,x1) и
при v ∈ U выполняются следующие соотношения:
{
}
E
Δvf[θ,ξ]K(ξ,θ,θvf[θ,ξ] + ΔvHzx[θ,ξvf[θ,ξ]
0,
{
}
E
Δvf[θ,ξ]M(θ,ξ,ξvf[θ,ξ] + ΔvHzt[θ,ξvf[θ,ξ]
0.
Из формул (16) следует, что
t1
K(ξ, θ, θ) = R(t, ξ; θ, ξ)Hzxzx [t, ξ]R(t, ξ; θ, ξ)dt,
θ
x1
M (θ, ξ, ξ) = R(θ, x; θ, ξ)Hztzt [θ, x]R(θ, x; θ, ξ)dx.
ξ
Кроме этого, матричная функция R(t, x; τ, s) является решением уравне-
ния (10). Используя эти факты, можно показать, что матричные функции
Ψ1(θ,ξ) = K(ξ,θ,θ) и Ψ2(θ,ξ) = M(θ,ξ,ξ) соответственно удовлетворяют сле-
дующим системам дифференциальных уравнений:
Ψ1(θ,ξ)
= -Ψ1(θ,ξ)fzx[θ,ξ] - f′z
x
[θ, ξ1[θ, ξ] - Hzxzx [θ, ξ],
(22)
∂θ
Ψ1(t1) = 0,
Ψ2(θ,ξ)
= -Ψ2(θ,ξ)fzt[θ,ξ] - f′z
t
[θ, ξ2[θ, ξ] - Hztzt [θ, ξ],
(23)
∂ξ
Ψ2(θ,x1) = 0.
Заметим, что системы (22), (23) являются стохастическими аналогами си-
стем уравнений, показанных в работах [5-7]. С другой стороны, такие си-
стемы типа (22), (23) различными методами введены в детерминированном
случае в публикациях [2, 3] при исследовании особых управлений в системах
Гурса-Дарбу.
Доказательства теорем 1 и 2 даны в Приложении.
56
6. Заключение
Применяя стохастический аналог метода приращений, доказана формула
приращения второго порядка функционала качества в рассматриваемой сто-
хастической задаче оптимального управления системами Гурса-Дарбу. На
основе этой формулы сначала доказано необходимое условие оптимальности
типа принципа максимума Понтрягина. Затем, с помощью специальных ва-
риаций, доказываются необходимые условия оптимальности особых (в смыс-
ле принципа максимума Понтрягина) управлений.
Авторы выражают глубокую благодарность рецензентам за ценные заме-
чания по содержанию статьи.
ПРИЛОЖЕНИЕ
Доказательство теоремы 1. Пусть u(t,x) — оптимальное управ-
ление. Определим специальное приращение (аналог вариация Макшейна)
Δuε(t,x) управления u(t,x) в виде
{v - u(t,x), (t,x) ∈ Dε = [θ,θ + ϵ) × [ξ,ξ + ε),
(Π.1)
Δuε(t,x) =
0,
(t, x) ∈ D\Dε.
Здесь и в дальнейшем (θ, ξ) [t0, t1) × [x0, x1) — произвольная правильная
точка (точка Лебега) управления u(t, x), v ∈ U — произвольный вектор, а
ε > 0 — произвольное достаточно малое число.
Через Δzε(t, x) обозначим специальное приращение состояния z(t, x), со-
ответствующее приращению (П.1) управления u(t, x).
Пусть Di, i = 1, 4, — подмножества прямоугольника D, определяемые со-
ответственно в виде:
Dε = [θ,θ + ε) × [ξ,ξ + ε), D2 = [θ,θ + ε) × [ξ + ε,x1),
D3 = [θ + ε,t1) × [ξ,ξ + ε), D4 = [θ + ε,t1) × [ξ + ε,x1),
D1 = D\(Dε ∪ D2 ∪ D3 ∪ D4).
Тогда согласно оценкам, полученным в [16], получаем, что
{0,
(t, x) ∈ D1,
(Π.2)
EΔzε(t, x)∥ ≤
2, (t,x) ∈ Dε ∪ D2 ∪ D3 ∪ D4,
0, (t,x) ∈ D1,
(Π.3)
Ezε(t, x))t∥ ≤
Lε, (t, x) ∈ Dε ∪ D2,
2, (t,x) ∈ D3 ∪ D4,
0, (t,x) ∈ D1,
(Π.4)
Ezε(t, x))x∥ ≤
Lε, (t, x) ∈ Dε∪D3,
2, (t,x) ∈ D2 ∪ D4.
57
Рассмотрим специальное приращение функционала (19) на игольчатой ва-
риации (П.1) управления u(t, x). Учитывая оценки (П.2)-(П.4), нетрудно убе-
диться в том, что остаточный член η2uε(t, x)) в формуле (20) является
величиной o(ε4). Поэтому получим, что
ΔSε(u) = S(u + Δuε) - S(u) = E
-
ΔvH[t,x]dxdt -
θ ξ
1
-
Δvf[t,τ]M(t,τ,suf[t,s]ds dτ dt -
2
θ ξ ξ
1
-
Δuf[τ,x]K(x,τ,suf[s,x]ds dxdτ -
2
θ ξ θ
t1
θ+ε
-
ΔuH′z
[τ, x]R(τ, x; t, x) +
x
θ ξ
t
x1
+ ΔuH′z
[t, s]R(t, s; t, x)ds Δuf[t, x]dx dt
+ o(ε4).
t
x
Отсюда, учитывая теорему о среднем, получаем, что вдоль оптимального
управления
{
[
ΔSε(u) = E -0,5ε2ΔvH[θ, ξ] - 0,5ε3 Δvf[θ, ξ]M(θ, ξ, ξvf[θ, ξ] +
+ Δvf[θ,ξ]K(ξ,θ,θvf[θ,ξ] + ΔvH′z
[θ, ξvf[θ, ξ] +
x
]}
vH′z
[θ, ξvf[θ, ξ]
+ o(ε4) 0.
t
Из последнего неравенства в силу произвольности ε > 0 следует справед-
ливость утверждения теоремы 1. Теорема 1 доказана.
Доказательство теоремы 2. Пусть u(t,x) — особое в смысле прин-
ципа максимума Понтрягина оптимальное управление в задаче (1)-(5), а его
специальное приращение определим так:
{v - u(t, x), (t, x) ∈ Dε = [θ, θ + ε) × [ξ, ξ + ε2),
(Π.5)
Δuε(t,x) =
0,
(t, x) ∈ D\Dε.
Отсюда на основе оценок из публикации [16] следует, что
{0,
(t, x) ∈ D1,
(Π.6)
EΔzε(t, x)∥ ≤
3, (t,x) ∈ Dε ∪ D2 ∪ D3 ∪ D4,
58
0,(t,x)∈D1,
(Π.7)
Ezε(t, x))
t
∥≤2,(t,x)∈Dε ∪D2,
3, (t,x) ∈ D3 ∪ D4,
0,
(t, x) ∈ D1,
Lε,
(t, x) ∈ Dε,
(Π.8)
Ezε(t, x))x∥ ≤
2, (t,x) ∈ D3,
3, (t,x) ∈ D2 ∪ D4.
Здесь L = const > 0, D2 = [θ, θ + ε) × [ξ + ε2, x1), D3 = [θ + ε, t1) × [ξ, ξ + ε2),
D4 = [θ + ε,t1) × [ξ + ε2,x1), D1 = D\(Dε ∪ D2 ∪ D3 ∪ D4).
Учитывая полученные оценки (П.6)-(П.8), из формулы (20) получаем,
что в особом случае на специальной вариации (П.5) управления u(t, x)
η2uε(t,x)) = o(ε4).
Тогда из разложения (19) следует, что
(Π.9)
ΔSε(u) = S(u + Δuε
) - S(u) =
=E
-0,5
Δvf[τ,x]K(x,τ,svf[s,x]ds dxdτ -
θ
ξ
θ
θ+ε
t1
-
ΔvH′z
[τ, x]R(τ, x; t, x)Δvf[t, x]dx dt
+ o(ε4) =
x
θ
ξ
t
{
}
= -0,5ε4E
Δvf[θ,ξ]K(ξ,θ,θvf[θ,ξ] + ΔvH′z
[θ, ξvf[θ, ξ]
+ o(ε4).
x
Если же специальное приращение управления u(t, x) определить по фор-
муле
{v - u(t, x), (t, x) [θ, θ + ε2) × [ξ, ξ + ε),
Δuε(t,x) =
0,
(t, x) ∈ D\[θ, θ + ε2) × [ξ, ξ + ε),
то симметричными рассуждениями доказательства формулы (П.9) можно
убедиться в справедливости разложения
{
(Π.10) ΔSε(u) = -0,5ε4E Δvf[θ, ξ]M(θ, ξ, ξvf[θ, ξ] +
}
vH′z
[θ, ξvf[θ, ξ]
+ o(ε4).
t
Из разложений (П.9), (П.10) следует утверждение теоремы 2. Теорема 2
доказана.
СПИСОК ЛИТЕРАТУРЫ
1. Егоров А.И. Об оптимальном управлении процессами в некоторых системах с
распределенными параметрами // АиТ. 1964. Т. 25. № 5. С. 613-623.
59
Egorov A.I. Concerning Optimum Control of Processes in Some Systems with
Distributed Parameters // Autom. Remote Control. 1964. Vol. 25. No. 5.
2.
Срочко В.А. Условия оптимальности для одного класса систем с распределен-
ными параметрами // Сиб. математический журнал. 1976. № 5. C. 1108-1115.
3.
Ащепков Л.Т., Васильев О.В., Коваленок И.Л. Усиленное условие оптимально-
сти особых управлений в системе Гурса-Дарбу // Диффер. уравнения. 1980.
№ 6. С. 1054-1059.
4.
Новоженов М.М., Сумин В.И., Сумин М.И. Методы оптимального управления
системами математической физики. Горький: Изд-во ГГУ, 1986.
5.
Мансимов К.Б. Многоточечные необходимые условия оптимальности квазиосо-
бых управлений // АиТ. 1982. № 10. С. 53-58.
Mansimov K.B. Multile Point Necessary Conditions for Optimality of Quasisingular
Controls // Autom. Remote Control. 1982. Vol. 43. No. 10. P. 1271-1275.
6.
Мансимов К.Б. Интегральные необходимые условия оптимальности квазиосо-
бых управлений в системах Гурса-Дарбу // АиТ. 1993. № 5. C. 36-43.
Mansimov K.B. Integral Necessary Conditions for Optimality of Quasisingular
Controls in Goursat-Darboux Systems // Autom. Remote Control. 1993. Vol. 54.
No. 5. P. 732-739.
7.
Мансимов К.Б., Марданов М.Дж. Качественная теория оптимального управле-
ния системами Гурса-Дарбу. Баку: Изд-во Элм, 2010.
8.
Ермольев Ю.М., Гуленко В.П., Царенко Т.И. Конечно-разностный метод в за-
дачах оптимального управления. Киев: Наукова Думка, 1978.
9.
Рачинский В.В. Введение в общую теорию динамики сорбции и хроматографии.
М.: Наука, 1964.
10.
Тихинов А.Н., Самарский А.А. Уравнения математической физики. М.: Наука,
1972.
11.
Шайхет Л.Е. Об оптимальном управлении одним классом стохастических диф-
ференциальных уравнений в частных производных // Математ. заметки. 1982.
№ 6. С. 933-936.
12.
Shaikhet L.E. Optimal Control of Certain Hyperbolic and Integral Stochastic
Equations // J. Soviet Mathematics. 1991. No. 4. P. 457-462.
13.
Shaikhet L.E. About an Unsolved Optimal Control Problem for Stochastic Partial
Differential Equation // XVI Int. Conf. Dynamical Systems Modelling and Stability
Investigation. Kiev: 2013. P. 332-334.
14.
Qi Lu, Xu Zhang. Control Theory for Stochastic Distributed Parameter Systems, an
Engineering Perspective // Annual Reviews in Control. 2021. V. 51. P. 268-330.
15.
Qi Lu, Xu Zhang. Mathematical control theory for stochastic partial differential
equations. Springer, 2021.
16.
Масталиев Р.О. Необходимые условия оптимальности первого порядка в стоха-
стических системах Гурса-Дарбу // Дальневост. матем. журн. 2021. Т. 21. № 1.
С. 89-104.
17.
Walsh J.B. An introduction to stochastic partial differential equations. Berlin, 1986.
18.
Пономаренко Л.Л. Стохастическая бесконечномерная задача Гурса / Матема-
тический анализ и теория вероятностей. Киев: 1978. С. 140-143.
19.
Мансимов К.Б., Масталиев Р.О. Представление решения задачи Гурса для ли-
нейных стохастических гиперболических дифференциальных уравнений второ-
го порядка // Изв. Иркутского гос. ун-та. Сер. математика, Т. 36. № 2. С. 29-43.
60
20. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: На-
ука, 1979.
21. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управ-
ления. М.: URSS, 2011.
22. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М.: URSS, 2011.
Статья представлена к публикации членом редколлегии А.В. Назиным.
Поступила в редакцию 07.06.2021
После доработки 25.12.2021
Принята к публикации 30.12.2021
61