ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2022, том 58, № 11, с. 1525-1536
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977+519.633.9
ОБ ОДНОЙ МОДИФИКАЦИИ
МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
ДЛЯ ЛИНЕЙНЫХ ГИПЕРБОЛИЧЕСКИХ УРАВНЕНИЙ
© 2022 г. В. И. Максимов
Рассматривается задача восстановления распределённых входных воздействий (возмуще-
ний) в линейных гиперболических уравнениях. Предлагается алгоритм решения этой зада-
чи. В случае, когда входное воздействие - функция с ограниченной вариацией, устанавли-
вается оценка сверху скорости сходимости. Алгоритм, основанный на соединении методов
оптимального программного и позиционного управлений, позволяет осуществить процесс
восстановления на основе неточных измерений решений уравнений в дискретные моменты
времени.
DOI: 10.31857/S0374064122110085, EDN: MBCWVN
Введение. Пусть V и H - действительные гильбертовы пространства. Пространство V
вложено в пространство H, плотно и непрерывно: V ⊂ H = H ⊂ V. Символы |·|V , |·|V и
|·|H означают соответственно нормы в V, V и H, а символы (·,·) и 〈·,·〉 - соответственно
скалярное произведение в H и двойственность между V и V.
Рассматривается гиперболическое уравнение
x(t) + Ax(t) = Bu(t), t ∈ T = [t0, ϑ],
(1)
с начальными условиями
x(t0) = x0,
x(t0) = x1.
Здесь ϑ ∈ (t0, +), A : V → V - линейный, непрерывный и симметричный оператор, удо-
влетворяющий (для некоторого c > 0) условию коэрцитивности
〈Ay, y〉 c|y|2V для любого y ∈ V,
(2)
U - гильбертово пространство с нормой | · |U (пространство возмущений), производная
x(·)
понимается в смысле пространства распределений [1, с. 95], B - линейный непрерывный опе-
ратор, действующий из пространства U в пространство H (B ∈ L(U; H)).
Следуя [1, с. 91], функцию x(·) ∈ C(T ; V ) такую, что
x(·) ∈ W (T ; V ) = {z(·) ∈ C(T ; H) :
Ż(·) ∈ L2(T ; V)} и выполняется соотношение
〈x(t),v〉 + 〈Ax(t),v〉 = (Bu(t),v) для любой v ∈ V при п.в. t ∈ T,
будем называть решением (слабым) уравнения (1) и обозначать
x(·) = x(· ; t0, x0, x1, u(·)).
В дальнейшем полагаем, что вложение пространства V в пространство H компактно. Кроме
того, x0 ∈ V, x1 ∈ H. Тогда (см. [1, с. 93]) при любой функции u(·) ∈ L2(T ; U) уравнение (1)
имеет единственное решение (слабое).
Исследуемая в настоящей работе задача формулируется следующим образом. Имеется
уравнение (1) с некоторым входным воздействием (возмущением) u = u(·). Заранее как это
воздействие, так и отвечающее ему решение x(·) = x(· ; t0, x0, x1, u(·)) уравнения не заданы.
В дискретные, достаточно частые, моменты времени
τi Δ =i}mi=0 (τ0 = t0, τm = ϑ, τi+1 = τi + δ)
1525
1526
МАКСИМОВ
измеряются (с ошибкой) величины x(τi) и
x(τi). Результаты измерений - элементы ψhi ∈ V
и ξhi ∈ H - удовлетворяют неравенствам
hi - x(τi)|V h,
hi - x(τi)|H h, i = 0, m - 1.
(3)
Здесь число h ∈ (0, 1) характеризует “ошибку” вычислений { x(τi), x(τi)}. Задача заключается
в том, чтобы построить алгоритм приближённого восстановления неизвестного возмущения,
порождающего решение x(·) уравнения (1).
Заметим, что одно и то же решение уравнения (1) может порождаться не единственным
возмущением. Пусть символ U(x(·)) означает множество всех возмущений, совместимых с
выходом x(t), t ∈ T, т.е.
U (x(·)) = {u(·) ∈ L2(T ; U) : (Bu(t), z) = 〈x(t) + Ax(t), z〉 при п.в. t ∈ T и всех z ∈ V }.
Как нетрудно видеть, множество U(x(·)) выпукло и замкнуто в пространстве L2(T ; U). По-
этому оно содержит единственный элемент минимальной L2(T ; U)-нормы - u(·). Следуя
принятому в теории некорректных задач подходу, будем восстанавливать u(·).
Первый из алгоритмов динамической регуляризации, основанный на известном в теории
гарантированного управления принципе экстремального сдвига [2, с. 57-59], был предложен
в статье [3]. Впоследствии данный алгоритм был распространен на дифференциальные урав-
нения с распределёнными параметрами (см. [1, с. 44-51; 4, с. 10-29; 5; 6]). Здесь упомянуты
лишь монографии и обзорные статьи, в которых можно найти дополнительные ссылки. Среди
более поздних работ, в которых рассматривались гиперболические уравнения, отметим, на-
пример, [7-10]. В соответствии с описанным в этих работах методом задача восстановления
неизвестного возмущения по результатам измерения заменяется некоторой другой задачей, а
именно, задачей позиционного управления вспомогательной системой (уравнением) M, назы-
ваемой моделью. При этом управление в модели определялось путём локальной регуляриза-
ции по методам сглаживающего функционала или невязки, известного в теории позиционных
дифференциальных игр, экстремального сдвига. В настоящей работе будет предложен ал-
горитм решения рассматриваемой задачи, который можно трактовать как метод локальной
регуляризации экстремального сдвига путём решения вспомогательной задачи оптимального
программного управления с квадратичным критерием качества.
1. Алгоритм решения. Опишем алгоритм решения рассматриваемой задачи. Пусть име-
, τh,i+1 = τh,i+δ(h), i = 0,mh - 1, τh,0 = t0, τh,mh =
ется семейство разбиений Δh =h,i}
=0
= ϑ, h ∈ (0,1), отрезка T, а также функция α = α(h) : (0,1) (0,1). Всюду ниже для
упрощения полагаем t0 = 0, h, δ(h) (0, 1).
До начала работы алгоритма фиксируются погрешность h, разбиение Δh =i}mi=0 (τi =
= τh,i, m = mh) отрезка T с шагом δ = δ(h) и число α = α(h). Работа алгоритма разбивается
на m - 1 однотипных шагов. На i-м шаге (i = 1, m - 1) алгоритма, осуществляемом на
промежутке времени [τi, τi+1], выполняются следующие операции. Сначала решается задача
оптимального программного управления уравнением
ÿ(τ) + Ay(τ) = Bf(τ), τ ∈ [0, δ], y(0) = ψhi-1,
y(0) = ξhi-1
(4)
c квадратичным критерием качества
δ
I(f(·), y(·); δ, α, ξhi , ψhi) = δ| y(δ) - ξhi|2H + δ|y(δ) - ψhi|2V + α
|f(τ)|2U dτ.
(5)
0
Здесь y(·) = y(· ; 0, ψhi-1, ξhi-1, f(·)) - решение уравнения (4). Решением задачи (4), (5) является
пара {f(i-1)opt(·), y(i-1)opt(·)}, где y(i-1)opt = y(· ; 0, ψhi-1, ξhi-1f(i-1)opt(·)), такая, что
I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi) =
= min{I(f(·),y(·);δ,α,ξhi hi ) : f(·) ∈ L2([0];U), y(·) = y(·;0hi-1hi-1,f(·))}.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1527
После этого вычисляется функция
uh(t) = vhi(t - τh,i), t ∈ [τii+1),
(6)
где
{
0
при τ ∈ [0, δ), i = 0,
vhi(τ) = Uh(τihi-1hihi-1hi) =
(7)
f(i-1)opt(τ) при τ ∈ [0), i = 1,m - 1.
Работа алгоритма заканчивается в момент ϑ.
Замечание 1. Решение задачи оптимального программного управления с квадратичным
критерием качества приведено, например, в монографии [11, гл. 4, §§ 2, 3].
Справедлива
Теорема 1. Пусть δ(h) 0, α(h) 0, hδ-2(h) 0, α(h)δ-5/2(h) 0 при h → 0.
Тогда имеет место сходимость
uh(·) → u(·) в L2(T;U) при h → 0.
(8)
Таким образом, для реализации описанного выше алгоритма модель не требуется, однако
она необходима для обоснования его сходимости (см. доказательство теоремы 1, в котором
используются оценки из теоремы 2).
Прежде чем перейти к доказательству теоремы 1 приведём вспомогательные построения.
Следуя работам [1, с. 15; 7-10], введём вспомогательную управляемую систему (модель), опи-
сываемую уравнением
{
uh(t)
при п.в. t ∈ [0, δ(h)),
wh(t) =
(9)
-Awh(t) + Buh(t)
при п.в. t ∈ [δ(h), ϑ].
Начальное состояние модели определяют условия wh(0) = ψh0,
wh(0) = ξh0. Управление мо-
делью осуществляется синхронно с процессом восстановления. На промежутке [τi, τi+1], τi =
= τh,i, на вход модели (9) подается управление uh(·) вида (6). После этого формируется
решение wh(t) = wh(t; τi, wh(τi),w˙h(τi), uh(·)), t ∈ [τi, τi+1], уравнения (9), т.е. осуществляется
корректировка памяти.
Имеет место следующая
Теорема 2. Справедливы неравенства
εh,δ = max{| x(τi) -w˙h(τi+1)|2H + c|x(τi) - wh(τi+1)|2V : i ∈ [0 : mh - 1]} Cχ(h,α,δ),
(10)
|uh(·)|L
(11)
2(T )|u(·)|L2(T )+C∗∗h1/2α-1/2.
Здесь χ(h, α, δ) =-2 + αδ-5/2 + h1/2δ-1 + δ1/2, C и C∗∗ - некоторые постоянные, не
зависящие от h, α, δ, символ | · |L2(T ) означает норму в пространстве L2(T ; U).
Доказательство. Введём обозначение
z(t) = y(i-1)opt(t - τi-1) при t ∈ δi = [τi-1, τi).
Тогда функция z(·) на отрезке [τi-1, τi] является решением уравнения
z(t) + Az(t) = Buh(t)
(12)
с начальными условиями
z(τi-1) = ψhi-1,
Ż(τi-1) = ξhi-1
и управлением
uh(t) = f(i-1)opt(t - τi-1) при п.в. t ∈ [τi-1i).
(13)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1528
МАКСИМОВ
Таким образом, из (9), (7), (6), (12) и (13) следует соотношение
μ(t) +(t) = 0 при п.в. t ∈ [τi-1i] и всех i = 1,m - 1,
(14)
где μ(t) = z(t)-wh(t+δ). Умножив правую и левую части равенства (14) на μ(t) (скалярно
в H) и проинтегрировав полученное выражение, будем иметь
| μ(t)|2H + 〈Aμ(t)(t) =hi-1 -w˙h(τi)|2H + 〈Aμ(τi-1)(τi-1)〉, t ∈ [τi-1i].
(15)
В свою очередь, учитывая правило определение функции z(·), а также условие (2), из (15)
получаем
|y(i-1)opt(δ) - wh(τi+1)|2H + ei =hi-1 -w˙h(τi)|2H + νi,
(16)
где
ei = 〈A(y(i-1)opt(δ) - wh(τi+1)),y(i-1)opt(δ) - wh(τi+1) 0, i = 1,m - 1,
νi = 〈A(ψhi-1 - wh(τi))hi-1 - wh(τi) 0, ν1 = 0.
Рассмотрим задачу оптимального управления уравнением (4) с начальными условиями
y(0) = x(τi-1),
y(0) = x(τi-1)
и критерием качества I(f(·), y(·); δ, α,x˙(τi), x(τi)) вида (5). Обозначим оптимальное управле-
ние в этой задаче символом fδi-1(·), а оптимальную траекторию через
yδi-1(·) = y(·;0,x(τi-1), x(τi-1),fδi-1(·)).
Легко видеть, что верно неравенство
I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi) = δ| y(δ; 0, ψhi-1, ξhi-1, f(i-1)opt(·)) - ξhi|2H +
δ
+ δ|y(δ;0hi-1hi-1,f(i-1)opt(·)) - ψhi |2V + α
|f(i-1)opt(τ)|2U
0
δ
δ| y(δ;0hi-1hi-1,fδi-1(·))hi |2H +δ|y(δ;0hi-1hi-1,fδi-1(·))hi |2V +α
|fδi-1(τ)|2U dτ.
(17)
0
Заметим, что вложение пространства V в пространство H непрерывно, т.е. существует число
C1 > 0 такое, что для любых x ∈ V : |x|H C1|x|V . Поэтому, учитывая линейность оператора
A, а также (2), (3), нетрудно показать, что верно неравенство
| yδi-1(δ) - y(δ;0hi-1hi-1,fδi-1(·))|H + |yδi-1(δ) - y(δ;0hi-1hi-1,fδi-1(·))|V C2h.
В таком случае из (17) и (3) следует, что
I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi) δ{| yδi-1(δ) - x(τi)|H + C3h}2 +
δ
+ δ{|yδi-1(δ) - x(τi)|V + C4h}2 + α
|fδi-1(τ)|2U dτ.
(18)
0
Далее имеем
δ
α
|f(i-1)opt(τ)|2U I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi).
(19)
0
Кроме того, как нетрудно видеть,
sup{| x(t)|H + |x(t)|V } C5.
(20)
t∈T
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1529
Действительно, умножив правую и левую части уравнения (1) на x(t), будем иметь
0.5d| x(t)|2H /dt + 〈Ax(t), x(t) |Bu(t)|H | x(t)|H .
После интегрирования получим
t
ϑ
| x(t)|2H +〈Ax(t),x(t) | x(0)|2H +〈Ax(0),x(0)+
|Bu(t)|2H dt+
| x(t)|2H dt для любого t ∈ T.
0
0
Отсюда, учитывая (2), включение u(·) ∈ L2(T ; U) и лемму Гронуолла, получаем неравен-
ство (20). Пусть y(·) - решение уравнения
r(t) + Ar(t) = 0, t ∈ [0, δ],
(21)
с начальными условиями r(0) = x(τi-1),
r(0) = x(τi-1). Умножив (скалярно) правую и левую
части (21) на r(·) и проинтегрировав, будем иметь
|r(t)|2H + 〈Ar(t),r(t) = |r(0)|2H + 〈Ar(0),r(0)〉.
Отсюда, воспользовавшись (2), получим
|r(δ)|2H + c|r(δ)|2V |x(τi-1)|2H + |A|L(V ;V)|x(τi-1)|2V .
Здесь |A|L(V;V) - норма линейного непрерывного оператора A : V → V. Таким образом,
ввиду последнего неравенства, а также (20),
sup
{| y(δ; 0, x(τi-1), x(τi-1), u0(·))|H , |y(δ; 0, x(τi-1), x(τi-1), u0(·))|V } C6,
(22)
i∈[1:mh]
где C6 не зависит от h,
u0(t) = 0 при п.в. t ∈ [0].
Далее, имеем
I(fδi-1(·), yδi-1(·); δ, α,x˙(τi), x(τi)) I(u0(·), y(· ; 0, x(τi-1), x(τi-1), u0(·)); δ, α,x˙(τi), x(τi)) =
= δ| y(δ;0,x(τi-1), x(τi-1),u0(·)) - x(τi)|2H + δ|y(δ;0,x(τi-1), x(τi-1),u0(·)) - x(τi)|2V .
Отсюда и из (20) и (22) следует существование числа C7 (0, +) такого, что
sup{| y(δ;0,x(τi-1), x(τi-1),fδi-1(·))|H,
|y(δ; 0, x(τi-1), x(τi-1), fδi-1(·))|V : δ ∈ (0,1), i = 1,m} C7.
(23)
Поэтому, используя (20) и (23), выводим оценку
{| yδi-1(δ) - x(τi)|H + C3h}2 + {|yδi-1(δ) - x(τi-1)|V + C4h}2
| yδi-1(δ) - x(τi)|2H + |yδi-1(δ) - x(τi-1)|2V + C8h.
(24)
Таким образом, в силу (6), (7), (18), (19) и (24) получаем
δ
α
|uh(τ)|2U = α
|f(i-1)opt(τ)|2U
(25)
τi
0
δ
δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V + C8δh + α
|fδi-1(τ)|2U dτ.
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1530
МАКСИМОВ
Учитывая правило определения управления fδi-1(·), устанавливаем неравенство
δ
δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V + α
|fδi-1(τ)|2U
0
τi
α
|u(τ)|2U = I(u(·), y(·); δ, α,x˙(τi), x(τi)),
(26)
τi-1
где y(·) = y(· ; τi-1, x(τi-1), x(τi-1), u(·)). Воспользовавшись этим неравенством, а также (25),
получаем
τi
α
|uh(τ)|2U α
|u(τ)|2U + C8δh,
(27)
τi
τi-1
откуда следует неравенство (11). Осталось проверить неравенство (10). Оценим изменение
величины ε(τi) = | x(τi) - w˙h(τi + δ)|2H + c|x(τi) - wh(τi + δ)|2V при изменении i = 0, m - 1 и
t ∈ [τii+1) (τi = τh,i, m = mh). Из (18) и (24) вытекает оценка
I(u(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi , ψhi) δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V +
δ
+α
|fδi-1(τ)|2U + C8δh.
(28)
0
В свою очередь, из (28) и (26) следует неравенство
δ| y(i-1)opt(δ) - ξhi|2H + δ|y(i-1)opt(δ) - ψhi|2V
τi
δ
δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V + α
|fδi-1(τ)|2U + C8δh C8δh + α
|u(τ)|2U dτ.
0
τi-1
Таким образом,
τi
| y(i-1)opt(δ) - ξhi |2H + |y(i-1)opt(δ) - ψhi |2V C8h + αδ-1
|u(τ)|2U dτ.
(29)
τi-1
Умножим обе части уравнения (9) на
wh(t). После интегрирования полученного равенства
в силу (2) будем иметь
t
wh(t)|2H + c|wh(t)|2V
|Buh(τ)|H |wh(τ)|H + |w˙h(0)|2H .
0
Отсюда в силу неравенства Гронуолла находим
sup{|w˙h(t)|H + |wh(t)|V } C9, h ∈ (0,1).
(30)
t∈T
Из (16) и (30) также следует (δ = δ(h), m = mh), что
sup
|y(i-1)opt(δ)|V C10, h ∈ (0,1).
(31)
i=1,m-1
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1531
Далее, учитывая (29)-(31), выводим оценку
νi+1 = 〈A(y(i-1)opt(δ) - wh(τi+1))hi - wh(τi+1) + 〈A(ψhi - y(i-1)opt(δ))hi - wh(τi+1)
〈A(y(i-1)opt(δ) - wh(τi+1)), ψhi - wh(τi+1) + C11φi ei + C12φi,
(32)
где
(
τi
)1/2
φi
= h + αδ-1
|u(τ)|2U
τi-1
Воспользовавшись (16), (29), (32), получаем (i = 1, m - 1) неравенства
hi -
wh(τi+1)|2H + νi+1 (| y(i-1)opt(δ) -w˙h(τi+1)|H + | y(i-1)opt(δ) - ξhi|H)2 + ei + C12φi
(1 + C13δ){|ξhi-1 - wh(τi)|2H + νi} + (1 + δ-1)| y(i-1)opt(δ) - ξhi |2H + C12φi
(
τi
)
(1 + C12δ){|ξhi-1 - w˙h(τi)|2H + νi} + (1 + δ-1) C8h + αδ-1
|u(τ)|2U
+C12φi,
τi-1
откуда в силу леммы из работы [12] следует оценка
{
hi - wh(τi+1)|2H + c|ψhi - wh(τi+)|2V
h0 - w˙h(τ1)|2H + ν1 +
(
τi
)
∑ }
+ (1 + δ-1) C13-1 + αδ-1
|u(τ)|2
+C14
φj exp{C12τi}.
(33)
U
j=1
0
Заметим, что ν1 = 0 и
τi
φi h1/2 + αδ-3/2 + δ1/2
|u(τ)|2U dτ,
τi-1
поэтому
{
τi
}
φj C14
h1/2δ-1 + αδ-5/2 + δ1/2
|u(τ)|2U
(34)
j=1
0
Из неравенств (33) и (34) получаем оценку
ε(τi) (h +hi - w˙h(τi+1)|H )2 + c(h +hi - wh(τi+1)|V )2 C15χ(h, α, δ).
Теорема доказана.
Доказательство теоремы 1. Покажем, что для произвольной последовательности hj
0+ при j → ∞ и любого семейства {Δhj} =hj,i}
=0
разбиений промежутка T имеет
место сходимость
uhj (·) → u(·) в L2(T;U) при j → ∞.
Здесь и ниже управления uhj (·) определены по правилу (6), (7), в которых h = hj . Предпо-
лагая противное, заключаем, что найдётся подпоследовательность последовательности uhj (·)
(обозначим её для упрощения тем же символом uhj (·)) такая, что
uhj (·) → f0(·) слабо в L2(T;U) при j → ∞,
(35)
f0(·) = u(·).
(36)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1532
МАКСИМОВ
Введём оператор C : L2(T ; U) → L2(T ; V) по формуле
Cf(·) = x(·;0,x0,x1,f(·)),
где x(·) - решение уравнения (1). В силу неравенства (1.7) из работы [1], а также непре-
рывности вложения пространства H в пространство V, оператор C является линейным и
непрерывным. Тогда, учитывая (35), имеем
〈 x(·;uhj (·)),φ〉 = 〈Cuhj (·),φ〉 = 〈uhj (·),Cφ〉U при j → ∞,
〈f0(·), Cφ〉U = 〈Cf0(·), φ〉 = x(· ; f0(·)), φ〉 при всех φ ∈ L2(T ; V ).
Здесь 〈 · , · 〉 означает двойственность между пространствами L2(T ; V ) и L2(T ; V), 〈·,·〉U -
скалярное произведение в пространстве U, x(· ; f0(·)) = x(· ; 0, x0, x1, f0(·)), а
x(· ; uhj (·)) -
производную решения x(· ; 0, x0, x1, uhj (·)) уравнения (1). Таким образом,
x(· ; uhj (·)) x(· ; f0(·)) слабо в L2(T ; V).
(37)
Заметим, что whj (t - δ(hj )) = x(t; uhj(·)) при t ∈ [δ(hj ), ϑ]. Поэтому справедливо равенство
ϑ
〈 x(t;uhj (·)) - x(t;f0(·))(t)〉dt = Ih
+ Jhj для любой φ ∈ L2(T;V ),
(38)
j
0
где
Ihj =
〈 x(t;uhj (·)) - x(t;f0(·))(t)〉dt,
0
ϑ
Jhj =
〈 whj(t - δ(hj)) - x(t;f0(·))(t)〉dt.
δ(hj )
В силу неравенства (11) аналогично оценке (20) устанавливается равномерная ограничен-
ность в метрике пространства C(T ; H) множества { x(· ; uhj (·))}∞j=1. Вследствие этого,
Ihj 0
при j → ∞.
(39)
Учитывая (37)-(39), непрерывность в среднем функции x(· ; f0(·)), а также ограниченность в
C(T ; H) множества {w˙hj (·)}∞j=1 (см. (30)), получаем
Jhj =
〈 whj(t) - x(t + δ(hj);f0(·))(t)〉dt → 0 при j → ∞ для любой φ(·) ∈ L2(T;V ).
0
Значит,
whj (·) x(·;f0(·)) слабо в L2(T;V) при j → ∞.
(40)
В силу теоремы 1 (см. (10)) получаем
max
whj (t) - x(t)|V 0 при j → ∞,
(41)
t∈T
где x(·) = x(· ; 0, x0, x1, u(·)), т.е.
whj (·) x(·) в C(T;V) при j → ∞.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1533
Из (40) и (41) следует равенство
x(t; 0, x0, x1, f0(·)) = x(t; 0, x0, x1, u(·)) при всех t ∈ T,
значит f0(·) ∈ U(x(·)) и, следовательно,
|f0(·)|L2 |u(·)|L2 .
(42)
Символ | · |L2 означает норму в пространстве L2(T ; U). Кроме того, в силу известных свойств
слабого предела из сходимости (35) вытекает, что
lim
|uhj (·)|L2 |f0(·)|L2 .
(43)
j→∞
Ввиду (11) справедливо неравенство
|uhj (·)|2L
|u(·)|2L
+ C∗∗h1/2jα1/2(hj),
2
2
откуда следует, что
lim
|uhj (·)|L2 |u(·)|L2 ,
(44)
j→∞
т.е. (см. (42)-(44))
lim
|uhj (·)|L2 |u(·)|L2 |f0(·)|L2 lim
|uhj (·)|L2 .
(45)
j→∞
j→∞
Так как множество U(x(·)) содержит единственный элемент минимальной L2-нормы (а имен-
но u(·)), то из (45) получаем равенство
f0(·) = u(·).
(46)
Воспользовавшись (35), (46), заключаем, что
uhj (·) → u(·) слабо в L2 при j → ∞.
(47)
Сходимость (47) противоречит (35) и (36). Теорема доказана.
Замечание 2. Пусть управления f(i-1)opt(·) находятся приближённо, т.е. вместо них вычис-
ляются управления f(i-1)opt(·) ∈ L2([0, δ]; U) такие, что
|f(i-1)opt(·) - f(i-1)opt(·)|L
2([0];U)γ(h).
Тогда естественно полагать (см. (7))
{
0
при τ ∈ [0, δ], i = 0,
Uh(τihi-1hihi-1hi) =
f(i-1)opt(τ) при τ ∈ [0], i = 1,m - 1.
В этом случае справедливы неравенства
|f(i-1)opt(·)|2L
(γ(h) + |f(i-1)opt(·)|L
(·)|2L
,
2(δ;U)
2(δ;U))2(1+α-1)γ(h)2 +(1+α)|
opt
2(δ;U)
поэтому
δ
δ
α
|uh(τ)|2U = α
|f(i-1)opt(τ)|2U α(1 + α)
|f(i-1)opt(τ)|2U + αγ2(h)(1 + α-1).
τi
0
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1534
МАКСИМОВ
Значит (см. (13), (27)),
τi
α
|uh(τ)|2U α(1 + α)
|u(τ)|2U + C8δh + αγ2(h)(1 + α-1)
τi
τi-1
и, следовательно, вместо (11) выполняется неравенство
|uh(·)|L
2(T )(1+α)|u(·)|L2(T )+C∗∗(h1/2α-1/2 +γ2(h)δ-1)(1+α-1).
В свою очередь, нетрудно показать, что вместо неравенства (10) будет выполняться нера-
венство
ε(t) C(h, δ, α) + γ2(h)δ-1α-1} при t ∈ [0, ϑ - δ].
В таком случае имеет место сходимость (8), если выполнены условия теоремы 3, а также
следующее условие: γ2(h)(α(h)δ(h))-1 0 при h → 0.
Замечание 3. Рассмотрим систему
x(t) + Ax(t) = Bf(t) + v(t),
где v(·) ∈ L2(T ; H) - фиксированная функция. В этом случае уравнение модели имеет вид
{
uh(t)
при п.в. t ∈ [0, δ(h)),
wh(t) =
-Awh(t) + Buh(t) + v(t)
при п.в. t ∈ [δ(h), ϑ],
а управление uh(·) находится по формуле
{
0
при τ ∈ [0, δ), i = 0,
uh(t) = Uh(τihi-1hihi-1hi) =
f(i-1)0(τ) при τ ∈ [τii+1), i = 1,m - 1,
где пара функций {f(i-1)0(·), y(i-1)0(·)} является решением задачи оптимального программного
управления
ÿ(τ) + Ay(τ) = Bf(τ) + v(τ), τ ∈ [τi-1, τi], y(τi-1) = ψhi-1,
y(τi-1) = ξhi-1
c квадратичным критерием качества
I(f(·), y(·); δ, α, ξhi , ψhi) = δ|y(τi; τi-1, ψhi-1, ξhi-1, f(·)) - ψhi|2V +
δ
+ δ| y(τi;τi-1hi-1hi-1,f(·)) - ξhi |2H + α
|f(τ)|2U dτ.
0
2. Скорость сходимости алгоритма. Установим оценку скорости сходимости алгоритма.
В дальнейшем нам понадобится
Лемма [13]. Пусть заданы две функции: t → a(t) ∈ L2(T ; W) и t → b(t) ∈ W, t ∈ T,
причём b(·) является функцией с ограниченной вариацией. Если верны неравенства
∫
t
a(τ)
ε,
|b(t)|W d, t ∈ T,
W
t0
то справедлива оценка
ϑ
〈a(t), b(t)W ε(varT b(t) + d).
t0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1535
Здесь W - банахово пространство с нормой |·|W , символ varT b(t) означает полную вариацию
функции b(t) на промежутке T, а символ 〈 · , · 〉W - двойственность между W и W.
Теорема 3. Пусть выполнены условия теоремы 2, U = V, B = I (тождественные
оператор) и функция t → u(t) ∈ V является функцией с ограниченной вариацией. Тогда
справедлива следующая оценка скорости сходимости алгоритма:
|u(t) - uh(t + δ)|2H dt c{χ1/4(h, δ, α) +-1}.
(48)
0
Доказательство. Учитывая линейность и непрерывность оператора A : V → V, заклю-
чаем, что при всех t ∈ [0, ϑ - δ] имеет место оценка
 ∫
t
t
J (u(τ) - uh(τ + δ))
= sup
{x(τ) - wh(τ + δ) - A(x(τ) - wh(τ + δ))}dτ,v
V
|v|V1
0
0
t
|x(t) - wh(t + δ)|V + |x(0) - wh(δ)|V + |A|L(V ;V)
|x(τ) - wh(τ + δ)|V dτ,
(49)
0
где | · |V - норма в пространстве V, символ J означает оператор канонического вложения
пространства V в пространство V. В свою очередь, в силу теоремы [1, с. 93] при t ∈ [τi, τi+1]
верны неравенства
| x(t) - x(τi)|V c1(t - τi)1/2,
wh(t) -w˙h(τi)|V c2(t - τi)1/2.
(50)
Поэтому из (10) в силу (50) вытекает оценка
)1/2
| x(t) - wh(t + δ)|2V dt
c3χ1/2(h,δ,α).
0
Учитывая (2) и (3), заключаем, что при t ∈ [τi-1, τi], i = 1, m - 1, справедливо соотношение
| x(t) - wh(t + δ)|2H + c|x(t) - wh(t + δ)|2V | x(0) -w˙h(δ)|2H +
t
+ |A|L(V ;V)|x(0) - wh(δ)|2V +
| x(τ) -
wh(τ + δ)|V|{|u(τ)|V + |uh(τ + δ)|V }dτ
0
(∫t
)1/2{(∫τi
)1/2
)1/2}
c4h2 +
| x(τ) - wh(τ + δ)|2V
|u(τ)|2V
+
|uh(τ)|2V
(51)
0
0
0
В силу (11) при выполнении условий теоремы 2 имеем
(∫ϑ
)1/2
(∫ϑ
)1/2
|u(τ)|2V
+
|uh(τ)|2V
c5(1 + h1/2α-1/2) c6.
(52)
0
0
С учётом (52) и (10) из соотношения (51) имеем
| x(t) -
wh(t + δ)|2H + |x(t) - wh(t + δ)|2V c7χ1/2(h,δ,α).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1536
МАКСИМОВ
Таким образом,
t
(
t
)1/2
|x(τ) - wh(τ + δ)|V
ϑ1/2
|x(τ) - wh(τ + δ)|2V
c8χ1/4(h,δ,α).
(53)
0
0
Далее, объединив (49) и (53), заключаем, что справедливо неравенство
 ∫
t
J (u(τ) - uh(τ + δ))
c9χ1/4(h,δ,α).
(54)
V
0
Воспользовавшись неравенством (11), получим
|u(τ) - uh(τ + δ)|2H 2|u(·)|2L
-2
(u(τ), uh(τ + δ)) + C∗∗-1 =
2
(T ;H)
0
0
ϑ-δ
=2
〈J(u(τ) - uh(τ + δ)), u(τ)〉 dτ + C∗∗-1.
(55)
0
В силу леммы 1 из (55) и (54) следует неравенство (48). Теорема доказана.
Работа выполнена при финансовой поддержке Министерства науки и высшего образования
Российской Федерации в рамках реализации программы Уральского математического центра
по соглашению № 075-02-20022-874.
СПИСОК ЛИТЕРАТУРЫ
1. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации. М.,
1999.
2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.
3. Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамической системе // Изв.
АН СССР. Техн. кибернетика. 1983. № 2. С. 51-60.
4. Maksimov V.I. Dynamical Inverse Problems of Distributed Systems. Utrecht, 2002.
5. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Динамические обратные задачи для параболи-
ческих систем // Дифференц. уравнения. 2000. Т. 36. № 5. С. 579-597.
6. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Метод экстремального сдвига Н.Н. Красовского
и задачи граничного управления // Автоматика и телемеханика. 2009. Т. 4. № 5. С. 18-30.
7. Maksimov V.I. Some dynamical inverse problems for hyperbolic systems // Control and Cybern. 1996.
V. 25. P. 465-481.
8. Maksimov V., Pandolfi L. The problem of dynamical reconstruction of Dirichlet boundary control in
semilinear hyperbolic equations // J. of Inverse and Ill-Posed Probl. 2000. V. 8. № 4. P. 399-418.
9. Максимов В.И. О динамическом восстановлении правой части гиперболического уравнения
// Журн. вычислит. математики и мат. физики. 2015. Т. 55. № 6. С. 1008-1019.
10. Максимов В.И. Об одном алгоритме динамического восстановления правой части уравнения с рас-
пределёнными параметрами второго порядка // Журн. вычислит. математики и мат. физики. 2017.
Т. 57. № 8. С. 13-27.
11. Лионс Ж.Л. Оптимальное управление системами, описываемыми уравнениями с частными произ-
водными. М., 1972.
12. Максимов В.И. Об отслеживании траектории динамической системы // Прикл. математика и ме-
ханика. 2011. Т. 75. № 6. С. 951-960.
13. Васильева Е.В., Максимов В.И. О динамической реконструкции неограниченных управлений в
параболическом уравнении // Дифференц. уравнения. 2003. Т. 39. № 1. С. 23-29.
Институт математики и механики
Поступила в редакцию 06.04.2022 г.
имени Н.Н. Красовского УрО РАН,
После доработки 06.04.2022 г.
г. Екатеринбург
Принята к публикации 15.08.2022 г.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022