ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2022, том 58, № 11, с. 1525-1536
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977+519.633.9
ОБ ОДНОЙ МОДИФИКАЦИИ
МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
ДЛЯ ЛИНЕЙНЫХ ГИПЕРБОЛИЧЕСКИХ УРАВНЕНИЙ
© 2022 г. В. И. Максимов
Рассматривается задача восстановления распределённых входных воздействий (возмуще-
ний) в линейных гиперболических уравнениях. Предлагается алгоритм решения этой зада-
чи. В случае, когда входное воздействие - функция с ограниченной вариацией, устанавли-
вается оценка сверху скорости сходимости. Алгоритм, основанный на соединении методов
оптимального программного и позиционного управлений, позволяет осуществить процесс
восстановления на основе неточных измерений решений уравнений в дискретные моменты
времени.
DOI: 10.31857/S0374064122110085, EDN: MBCWVN
Введение. Пусть V и H - действительные гильбертовы пространства. Пространство V
вложено в пространство H, плотно и непрерывно: V ⊂ H = H∗ ⊂ V∗. Символы |·|V , |·|V ∗ и
|·|H означают соответственно нормы в V, V ∗ и H, а символы (·,·) и 〈·,·〉 - соответственно
скалярное произведение в H и двойственность между V и V∗.
Рассматривается гиперболическое уравнение
x(t) + Ax(t) = Bu(t), t ∈ T = [t0, ϑ],
(1)
с начальными условиями
x(t0) = x0,
x(t0) = x1.
Здесь ϑ ∈ (t0, +∞), A : V → V∗ - линейный, непрерывный и симметричный оператор, удо-
влетворяющий (для некоторого c > 0) условию коэрцитивности
〈Ay, y〉 ≥ c|y|2V для любого y ∈ V,
(2)
U - гильбертово пространство с нормой | · |U (пространство возмущений), производная
x(·)
понимается в смысле пространства распределений [1, с. 95], B - линейный непрерывный опе-
ратор, действующий из пространства U в пространство H (B ∈ L(U; H)).
Следуя [1, с. 91], функцию x(·) ∈ C(T ; V ) такую, что
x(·) ∈ W (T ; V ) = {z(·) ∈ C(T ; H) :
Ż(·) ∈ L2(T ; V∗)} и выполняется соотношение
〈x(t),v〉 + 〈Ax(t),v〉 = (Bu(t),v) для любой v ∈ V при п.в. t ∈ T,
будем называть решением (слабым) уравнения (1) и обозначать
x(·) = x(· ; t0, x0, x1, u(·)).
В дальнейшем полагаем, что вложение пространства V в пространство H компактно. Кроме
того, x0 ∈ V, x1 ∈ H. Тогда (см. [1, с. 93]) при любой функции u(·) ∈ L2(T ; U) уравнение (1)
имеет единственное решение (слабое).
Исследуемая в настоящей работе задача формулируется следующим образом. Имеется
уравнение (1) с некоторым входным воздействием (возмущением) u = u∗(·). Заранее как это
воздействие, так и отвечающее ему решение x(·) = x(· ; t0, x0, x1, u∗(·)) уравнения не заданы.
В дискретные, достаточно частые, моменты времени
τi ∈ Δ = {τi}mi=0 (τ0 = t0, τm = ϑ, τi+1 = τi + δ)
1525
1526
МАКСИМОВ
измеряются (с ошибкой) величины x(τi) и
x(τi). Результаты измерений - элементы ψhi ∈ V
и ξhi ∈ H - удовлетворяют неравенствам
|ψhi - x(τi)|V ≤ h,
|ξhi - x(τi)|H ≤ h, i = 0, m - 1.
(3)
Здесь число h ∈ (0, 1) характеризует “ошибку” вычислений { x(τi), x(τi)}. Задача заключается
в том, чтобы построить алгоритм приближённого восстановления неизвестного возмущения,
порождающего решение x(·) уравнения (1).
Заметим, что одно и то же решение уравнения (1) может порождаться не единственным
возмущением. Пусть символ U(x(·)) означает множество всех возмущений, совместимых с
выходом x(t), t ∈ T, т.е.
U (x(·)) = {u(·) ∈ L2(T ; U) : (Bu(t), z) = 〈x(t) + Ax(t), z〉 при п.в. t ∈ T и всех z ∈ V }.
Как нетрудно видеть, множество U(x(·)) выпукло и замкнуто в пространстве L2(T ; U). По-
этому оно содержит единственный элемент минимальной L2(T ; U)-нормы - u∗(·). Следуя
принятому в теории некорректных задач подходу, будем восстанавливать u∗(·).
Первый из алгоритмов динамической регуляризации, основанный на известном в теории
гарантированного управления принципе экстремального сдвига [2, с. 57-59], был предложен
в статье [3]. Впоследствии данный алгоритм был распространен на дифференциальные урав-
нения с распределёнными параметрами (см. [1, с. 44-51; 4, с. 10-29; 5; 6]). Здесь упомянуты
лишь монографии и обзорные статьи, в которых можно найти дополнительные ссылки. Среди
более поздних работ, в которых рассматривались гиперболические уравнения, отметим, на-
пример, [7-10]. В соответствии с описанным в этих работах методом задача восстановления
неизвестного возмущения по результатам измерения заменяется некоторой другой задачей, а
именно, задачей позиционного управления вспомогательной системой (уравнением) M, назы-
ваемой моделью. При этом управление в модели определялось путём локальной регуляриза-
ции по методам сглаживающего функционала или невязки, известного в теории позиционных
дифференциальных игр, экстремального сдвига. В настоящей работе будет предложен ал-
горитм решения рассматриваемой задачи, который можно трактовать как метод локальной
регуляризации экстремального сдвига путём решения вспомогательной задачи оптимального
программного управления с квадратичным критерием качества.
1. Алгоритм решения. Опишем алгоритм решения рассматриваемой задачи. Пусть име-
, τh,i+1 = τh,i+δ(h), i = 0,mh - 1, τh,0 = t0, τh,mh =
ется семейство разбиений Δh = {τh,i}
=0
= ϑ, h ∈ (0,1), отрезка T, а также функция α = α(h) : (0,1) → (0,1). Всюду ниже для
упрощения полагаем t0 = 0, h, δ(h) ∈ (0, 1).
До начала работы алгоритма фиксируются погрешность h, разбиение Δh = {τi}mi=0 (τi =
= τh,i, m = mh) отрезка T с шагом δ = δ(h) и число α = α(h). Работа алгоритма разбивается
на m - 1 однотипных шагов. На i-м шаге (i = 1, m - 1) алгоритма, осуществляемом на
промежутке времени [τi, τi+1], выполняются следующие операции. Сначала решается задача
оптимального программного управления уравнением
ÿ(τ) + Ay(τ) = Bf(τ), τ ∈ [0, δ], y(0) = ψhi-1,
y(0) = ξhi-1
(4)
c квадратичным критерием качества
∫δ
I(f(·), y(·); δ, α, ξhi , ψhi) = δ| y(δ) - ξhi|2H + δ|y(δ) - ψhi|2V + α
|f(τ)|2U dτ.
(5)
0
Здесь y(·) = y(· ; 0, ψhi-1, ξhi-1, f(·)) - решение уравнения (4). Решением задачи (4), (5) является
пара {f(i-1)opt(·), y(i-1)opt(·)}, где y(i-1)opt = y(· ; 0, ψhi-1, ξhi-1f(i-1)opt(·)), такая, что
I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi) =
= min{I(f(·),y(·);δ,α,ξhi ,ψhi ) : f(·) ∈ L2([0,δ];U), y(·) = y(·;0,ψhi-1,ξhi-1,f(·))}.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1527
После этого вычисляется функция
uh(t) = vhi(t - τh,i), t ∈ [τi,τi+1),
(6)
где
{
0
при τ ∈ [0, δ), i = 0,
vhi(τ) = Uh(τi,ψhi-1,ψhi,ξhi-1,ξhi) =
(7)
f(i-1)opt(τ) при τ ∈ [0,δ), i = 1,m - 1.
Работа алгоритма заканчивается в момент ϑ.
Замечание 1. Решение задачи оптимального программного управления с квадратичным
критерием качества приведено, например, в монографии [11, гл. 4, §§ 2, 3].
Справедлива
Теорема 1. Пусть δ(h) → 0, α(h) → 0, hδ-2(h) → 0, α(h)δ-5/2(h) → 0 при h → 0.
Тогда имеет место сходимость
uh(·) → u∗(·) в L2(T;U) при h → 0.
(8)
Таким образом, для реализации описанного выше алгоритма модель не требуется, однако
она необходима для обоснования его сходимости (см. доказательство теоремы 1, в котором
используются оценки из теоремы 2).
Прежде чем перейти к доказательству теоремы 1 приведём вспомогательные построения.
Следуя работам [1, с. 15; 7-10], введём вспомогательную управляемую систему (модель), опи-
сываемую уравнением
{
uh(t)
при п.в. t ∈ [0, δ(h)),
wh(t) =
(9)
-Awh(t) + Buh(t)
при п.в. t ∈ [δ(h), ϑ].
Начальное состояние модели определяют условия wh(0) = ψh0,
wh(0) = ξh0. Управление мо-
делью осуществляется синхронно с процессом восстановления. На промежутке [τi, τi+1], τi =
= τh,i, на вход модели (9) подается управление uh(·) вида (6). После этого формируется
решение wh(t) = wh(t; τi, wh(τi),w˙h(τi), uh(·)), t ∈ [τi, τi+1], уравнения (9), т.е. осуществляется
корректировка памяти.
Имеет место следующая
Теорема 2. Справедливы неравенства
εh,δ = max{| x(τi) -w˙h(τi+1)|2H + c|x(τi) - wh(τi+1)|2V : i ∈ [0 : mh - 1]} ≤ C∗χ(h,α,δ),
(10)
|uh(·)|L
(11)
2(T ) ≤|u∗(·)|L2(T )+C∗∗h1/2α-1/2.
Здесь χ(h, α, δ) = hδ-2 + αδ-5/2 + h1/2δ-1 + δ1/2, C∗ и C∗∗ - некоторые постоянные, не
зависящие от h, α, δ, символ | · |L2(T ) означает норму в пространстве L2(T ; U).
Доказательство. Введём обозначение
z(t) = y(i-1)opt(t - τi-1) при t ∈ δi = [τi-1, τi).
Тогда функция z(·) на отрезке [τi-1, τi] является решением уравнения
z(t) + Az(t) = Buh(t)
(12)
с начальными условиями
z(τi-1) = ψhi-1,
Ż(τi-1) = ξhi-1
и управлением
uh(t) = f(i-1)opt(t - τi-1) при п.в. t ∈ [τi-1,τi).
(13)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1528
МАКСИМОВ
Таким образом, из (9), (7), (6), (12) и (13) следует соотношение
μhδ(t) + Aμhδ(t) = 0 при п.в. t ∈ [τi-1,τi] и всех i = 1,m - 1,
(14)
где μhδ(t) = z(t)-wh(t+δ). Умножив правую и левую части равенства (14) на μhδ(t) (скалярно
в H) и проинтегрировав полученное выражение, будем иметь
| μhδ(t)|2H + 〈Aμhδ(t),μhδ(t)〉 = |ξhi-1 -w˙h(τi)|2H + 〈Aμhδ(τi-1),μhδ(τi-1)〉, t ∈ [τi-1,τi].
(15)
В свою очередь, учитывая правило определение функции z(·), а также условие (2), из (15)
получаем
|y(i-1)opt(δ) - wh(τi+1)|2H + ei = |ξhi-1 -w˙h(τi)|2H + νi,
(16)
где
ei = 〈A(y(i-1)opt(δ) - wh(τi+1)),y(i-1)opt(δ) - wh(τi+1)〉 ≥ 0, i = 1,m - 1,
νi = 〈A(ψhi-1 - wh(τi)),ψhi-1 - wh(τi)〉 ≥ 0, ν1 = 0.
Рассмотрим задачу оптимального управления уравнением (4) с начальными условиями
y(0) = x(τi-1),
y(0) = x(τi-1)
и критерием качества I(f(·), y(·); δ, α,x˙(τi), x(τi)) вида (5). Обозначим оптимальное управле-
ние в этой задаче символом fδi-1(·), а оптимальную траекторию через
yδi-1(·) = y(·;0,x(τi-1), x(τi-1),fδi-1(·)).
Легко видеть, что верно неравенство
I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi) = δ| y(δ; 0, ψhi-1, ξhi-1, f(i-1)opt(·)) - ξhi|2H +
∫δ
+ δ|y(δ;0,ψhi-1,ξhi-1,f(i-1)opt(·)) - ψhi |2V + α
|f(i-1)opt(τ)|2U dτ ≤
0
∫δ
≤ δ| y(δ;0,ψhi-1,ξhi-1,fδi-1(·))-ξhi |2H +δ|y(δ;0,ψhi-1,ξhi-1,fδi-1(·))-ψhi |2V +α
|fδi-1(τ)|2U dτ.
(17)
0
Заметим, что вложение пространства V в пространство H непрерывно, т.е. существует число
C1 > 0 такое, что для любых x ∈ V : |x|H ≤ C1|x|V . Поэтому, учитывая линейность оператора
A, а также (2), (3), нетрудно показать, что верно неравенство
| yδi-1(δ) - y(δ;0,ψhi-1,ξhi-1,fδi-1(·))|H + |yδi-1(δ) - y(δ;0,ψhi-1,ξhi-1,fδi-1(·))|V ≤ C2h.
В таком случае из (17) и (3) следует, что
I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi) ≤ δ{| yδi-1(δ) - x(τi)|H + C3h}2 +
∫δ
+ δ{|yδi-1(δ) - x(τi)|V + C4h}2 + α
|fδi-1(τ)|2U dτ.
(18)
0
Далее имеем
∫δ
α
|f(i-1)opt(τ)|2U dτ ≤ I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi, ψhi).
(19)
0
Кроме того, как нетрудно видеть,
sup{| x(t)|H + |x(t)|V } ≤ C5.
(20)
t∈T
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1529
Действительно, умножив правую и левую части уравнения (1) на x(t), будем иметь
0.5d| x(t)|2H /dt + 〈Ax(t), x(t)〉 ≤ |Bu(t)|H | x(t)|H .
После интегрирования получим
t
∫ϑ
∫
| x(t)|2H +〈Ax(t),x(t)〉 ≤ | x(0)|2H +〈Ax(0),x(0)〉+
|Bu(t)|2H dt+
| x(t)|2H dt для любого t ∈ T.
0
0
Отсюда, учитывая (2), включение u(·) ∈ L2(T ; U) и лемму Гронуолла, получаем неравен-
ство (20). Пусть y(·) - решение уравнения
r(t) + Ar(t) = 0, t ∈ [0, δ],
(21)
с начальными условиями r(0) = x(τi-1),
r(0) = x(τi-1). Умножив (скалярно) правую и левую
части (21) на r(·) и проинтегрировав, будем иметь
|r(t)|2H + 〈Ar(t),r(t)〉 = |r(0)|2H + 〈Ar(0),r(0)〉.
Отсюда, воспользовавшись (2), получим
|r(δ)|2H + c|r(δ)|2V ≤ |x(τi-1)|2H + |A|L(V ;V∗)|x(τi-1)|2V .
Здесь |A|L(V;V ∗) - норма линейного непрерывного оператора A : V → V∗. Таким образом,
ввиду последнего неравенства, а также (20),
sup
{| y(δ; 0, x(τi-1), x(τi-1), u0(·))|H , |y(δ; 0, x(τi-1), x(τi-1), u0(·))|V } ≤ C6,
(22)
i∈[1:mh]
где C6 не зависит от h,
u0(t) = 0 при п.в. t ∈ [0,δ].
Далее, имеем
I(fδi-1(·), yδi-1(·); δ, α,x˙(τi), x(τi)) ≤ I(u0(·), y(· ; 0, x(τi-1), x(τi-1), u0(·)); δ, α,x˙(τi), x(τi)) =
= δ| y(δ;0,x(τi-1), x(τi-1),u0(·)) - x(τi)|2H + δ|y(δ;0,x(τi-1), x(τi-1),u0(·)) - x(τi)|2V .
Отсюда и из (20) и (22) следует существование числа C7 ∈ (0, +∞) такого, что
sup{| y(δ;0,x(τi-1), x(τi-1),fδi-1(·))|H,
|y(δ; 0, x(τi-1), x(τi-1), fδi-1(·))|V : δ ∈ (0,1), i = 1,m} ≤ C7.
(23)
Поэтому, используя (20) и (23), выводим оценку
{| yδi-1(δ) - x(τi)|H + C3h}2 + {|yδi-1(δ) - x(τi-1)|V + C4h}2 ≤
≤ | yδi-1(δ) - x(τi)|2H + |yδi-1(δ) - x(τi-1)|2V + C8h.
(24)
Таким образом, в силу (6), (7), (18), (19) и (24) получаем
∫
∫
δ
α
|uh(τ)|2U dτ = α
|f(i-1)opt(τ)|2U dτ ≤
(25)
τi
0
∫δ
≤ δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V + C8δh + α
|fδi-1(τ)|2U dτ.
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1530
МАКСИМОВ
Учитывая правило определения управления fδi-1(·), устанавливаем неравенство
∫δ
δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V + α
|fδi-1(τ)|2U dτ ≤
0
∫τi
≤α
|u∗(τ)|2U dτ = I(u∗(·), y(·); δ, α,x˙(τi), x(τi)),
(26)
τi-1
где y(·) = y(· ; τi-1, x(τi-1), x(τi-1), u∗(·)). Воспользовавшись этим неравенством, а также (25),
получаем
τi
∫
∫
α
|uh(τ)|2U dτ ≤ α
|u∗(τ)|2U dτ + C8δh,
(27)
τi
τi-1
откуда следует неравенство (11). Осталось проверить неравенство (10). Оценим изменение
величины ε(τi) = | x(τi) - w˙h(τi + δ)|2H + c|x(τi) - wh(τi + δ)|2V при изменении i = 0, m - 1 и
t ∈ [τi,τi+1) (τi = τh,i, m = mh). Из (18) и (24) вытекает оценка
I(u(i-1)opt(·), y(i-1)opt(·); δ, α, ξhi , ψhi) ≤ δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V +
∫δ
+α
|fδi-1(τ)|2U dτ + C8δh.
(28)
0
В свою очередь, из (28) и (26) следует неравенство
δ| y(i-1)opt(δ) - ξhi|2H + δ|y(i-1)opt(δ) - ψhi|2V ≤
τi
∫δ
∫
≤ δ| yδi-1(δ) - x(τi)|2H + δ|yδi-1(δ) - x(τi)|2V + α
|fδi-1(τ)|2U dτ + C8δh ≤ C8δh + α
|u∗(τ)|2U dτ.
0
τi-1
Таким образом,
τi
∫
| y(i-1)opt(δ) - ξhi |2H + |y(i-1)opt(δ) - ψhi |2V ≤ C8h + αδ-1
|u∗(τ)|2U dτ.
(29)
τi-1
Умножим обе части уравнения (9) на
wh(t). После интегрирования полученного равенства
в силу (2) будем иметь
∫t
wh(t)|2H + c|wh(t)|2V ≤
|Buh(τ)|H |wh(τ)|H dτ + |w˙h(0)|2H .
0
Отсюда в силу неравенства Гронуолла находим
sup{|w˙h(t)|H + |wh(t)|V } ≤ C9, h ∈ (0,1).
(30)
t∈T
Из (16) и (30) также следует (δ = δ(h), m = mh), что
sup
|y(i-1)opt(δ)|V ≤ C10, h ∈ (0,1).
(31)
i=1,m-1
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1531
Далее, учитывая (29)-(31), выводим оценку
νi+1 = 〈A(y(i-1)opt(δ) - wh(τi+1)),ψhi - wh(τi+1)〉 + 〈A(ψhi - y(i-1)opt(δ)),ψhi - wh(τi+1)〉 ≤
≤ 〈A(y(i-1)opt(δ) - wh(τi+1)), ψhi - wh(τi+1)〉 + C11φi ≤ ei + C12φi,
(32)
где
(
∫τi
)1/2
φi
= h + αδ-1
|u∗(τ)|2U dτ
τi-1
Воспользовавшись (16), (29), (32), получаем (i = 1, m - 1) неравенства
|ξhi -
wh(τi+1)|2H + νi+1 ≤ (| y(i-1)opt(δ) -w˙h(τi+1)|H + | y(i-1)opt(δ) - ξhi|H)2 + ei + C12φi ≤
≤ (1 + C13δ){|ξhi-1 - wh(τi)|2H + νi} + (1 + δ-1)| y(i-1)opt(δ) - ξhi |2H + C12φi ≤
(
∫
τi
)
≤ (1 + C12δ){|ξhi-1 - w˙h(τi)|2H + νi} + (1 + δ-1) C8h + αδ-1
|u∗(τ)|2U dτ
+C12φi,
τi-1
откуда в силу леммы из работы [12] следует оценка
{
|ξhi - wh(τi+1)|2H + c|ψhi - wh(τi+)|2V ≤
|ξh0 - w˙h(τ1)|2H + ν1 +
(
∫
τi
)
∑ }
+ (1 + δ-1) C13hδ-1 + αδ-1
|u∗(τ)|2
dτ
+C14
φj exp{C12τi}.
(33)
U
j=1
0
Заметим, что ν1 = 0 и
τi
∫
φi ≤ h1/2 + αδ-3/2 + δ1/2
|u∗(τ)|2U dτ,
τi-1
поэтому
{
∫
τi
}
∑
φj ≤ C14
h1/2δ-1 + αδ-5/2 + δ1/2
|u∗(τ)|2U dτ
(34)
j=1
0
Из неравенств (33) и (34) получаем оценку
ε(τi) ≤ (h + |ξhi - w˙h(τi+1)|H )2 + c(h + |ψhi - wh(τi+1)|V )2 ≤ C15χ(h, α, δ).
Теорема доказана.
Доказательство теоремы 1. Покажем, что для произвольной последовательности hj →
→ 0+ при j → ∞ и любого семейства {Δhj} = {τhj,i}
=0
разбиений промежутка T имеет
место сходимость
uhj (·) → u∗(·) в L2(T;U) при j → ∞.
Здесь и ниже управления uhj (·) определены по правилу (6), (7), в которых h = hj . Предпо-
лагая противное, заключаем, что найдётся подпоследовательность последовательности uhj (·)
(обозначим её для упрощения тем же символом uhj (·)) такая, что
uhj (·) → f0(·) слабо в L2(T;U) при j → ∞,
(35)
f0(·) = u∗(·).
(36)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1532
МАКСИМОВ
Введём оператор C : L2(T ; U) → L2(T ; V∗) по формуле
Cf(·) = x(·;0,x0,x1,f(·)),
где x(·) - решение уравнения (1). В силу неравенства (1.7) из работы [1], а также непре-
рывности вложения пространства H в пространство V∗, оператор C является линейным и
непрерывным. Тогда, учитывая (35), имеем
〈 x(·;uhj (·)),φ〉∗ = 〈Cuhj (·),φ〉∗ = 〈uhj (·),C∗φ〉U при j → ∞,
〈f0(·), C∗φ〉U = 〈Cf0(·), φ〉∗ = 〈 x(· ; f0(·)), φ〉∗ при всех φ ∈ L2(T ; V ).
Здесь 〈 · , · 〉∗ означает двойственность между пространствами L2(T ; V ) и L2(T ; V∗), 〈·,·〉U -
скалярное произведение в пространстве U, x(· ; f0(·)) = x(· ; 0, x0, x1, f0(·)), а
x(· ; uhj (·)) -
производную решения x(· ; 0, x0, x1, uhj (·)) уравнения (1). Таким образом,
x(· ; uhj (·)) → x(· ; f0(·)) слабо в L2(T ; V∗).
(37)
Заметим, что whj (t - δ(hj )) = x(t; uhj(·)) при t ∈ [δ(hj ), ϑ]. Поэтому справедливо равенство
ϑ
∫
〈 x(t;uhj (·)) - x(t;f0(·)),φ(t)〉dt = Ih
+ Jhj для любой φ ∈ L2(T;V ∗),
(38)
j
0
где
∫
Ihj =
〈 x(t;uhj (·)) - x(t;f0(·)),φ(t)〉dt,
0
∫ϑ
Jhj =
〈 whj(t - δ(hj)) - x(t;f0(·)),φ(t)〉dt.
δ(hj )
В силу неравенства (11) аналогично оценке (20) устанавливается равномерная ограничен-
ность в метрике пространства C(T ; H) множества { x(· ; uhj (·))}∞j=1. Вследствие этого,
Ihj → 0
при j → ∞.
(39)
Учитывая (37)-(39), непрерывность в среднем функции x(· ; f0(·)), а также ограниченность в
C(T ; H) множества {w˙hj (·)}∞j=1 (см. (30)), получаем
∫
Jhj =
〈 whj(t) - x(t + δ(hj);f0(·)),φ(t)〉dt → 0 при j → ∞ для любой φ(·) ∈ L2(T;V ).
0
Значит,
whj (·) → x(·;f0(·)) слабо в L2(T;V∗) при j → ∞.
(40)
В силу теоремы 1 (см. (10)) получаем
max
whj (t) - x(t)|V ∗ → 0 при j → ∞,
(41)
t∈T
где x(·) = x(· ; 0, x0, x1, u∗(·)), т.е.
whj (·) → x(·) в C(T;V∗) при j → ∞.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1533
Из (40) и (41) следует равенство
x(t; 0, x0, x1, f0(·)) = x(t; 0, x0, x1, u∗(·)) при всех t ∈ T,
значит f0(·) ∈ U(x(·)) и, следовательно,
|f0(·)|L2 ≥ |u∗(·)|L2 .
(42)
Символ | · |L2 означает норму в пространстве L2(T ; U). Кроме того, в силу известных свойств
слабого предела из сходимости (35) вытекает, что
lim
|uhj (·)|L2 ≥ |f0(·)|L2 .
(43)
j→∞
Ввиду (11) справедливо неравенство
|uhj (·)|2L
≤ |u∗(·)|2L
+ C∗∗h1/2jα1/2(hj),
2
2
откуда следует, что
lim
|uhj (·)|L2 ≤ |u∗(·)|L2 ,
(44)
j→∞
т.е. (см. (42)-(44))
lim
|uhj (·)|L2 ≤ |u∗(·)|L2 ≤ |f0(·)|L2 ≤ lim
|uhj (·)|L2 .
(45)
j→∞
j→∞
Так как множество U(x(·)) содержит единственный элемент минимальной L2-нормы (а имен-
но u∗(·)), то из (45) получаем равенство
f0(·) = u∗(·).
(46)
Воспользовавшись (35), (46), заключаем, что
uhj (·) → u∗(·) слабо в L2 при j → ∞.
(47)
Сходимость (47) противоречит (35) и (36). Теорема доказана.
Замечание 2. Пусть управления f(i-1)opt(·) находятся приближённо, т.е. вместо них вычис-
ляются управления f(i-1)opt(·) ∈ L2([0, δ]; U) такие, что
|f(i-1)opt(·) - f(i-1)opt(·)|L
2([0,δ];U) ≤γ(h).
Тогда естественно полагать (см. (7))
{
0
при τ ∈ [0, δ], i = 0,
Uh(τi,ψhi-1,ψhi,ξhi-1,ξhi) =
f(i-1)opt(τ) при τ ∈ [0,δ], i = 1,m - 1.
В этом случае справедливы неравенства
|f(i-1)opt(·)|2L
≤ (γ(h) + |f(i-1)opt(·)|L
(·)|2L
,
2(δ;U)
2(δ;U))2 ≤(1+α-1)γ(h)2 +(1+α)|
opt
2(δ;U)
поэтому
∫
∫
δ
∫
δ
α
|uh(τ)|2U dτ = α
|f(i-1)opt(τ)|2U dτ ≤ α(1 + α)
|f(i-1)opt(τ)|2U dτ + αγ2(h)(1 + α-1).
τi
0
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1534
МАКСИМОВ
Значит (см. (13), (27)),
τi
∫
∫
α
|uh(τ)|2U dτ ≤ α(1 + α)
|u∗(τ)|2U dτ + C8δh + αγ2(h)(1 + α-1)
τi
τi-1
и, следовательно, вместо (11) выполняется неравенство
|uh(·)|L
2(T ) ≤(1+α)|u∗(·)|L2(T )+C∗∗(h1/2α-1/2 +γ2(h)δ-1)(1+α-1).
В свою очередь, нетрудно показать, что вместо неравенства (10) будет выполняться нера-
венство
ε(t) ≤ C∗{χ(h, δ, α) + γ2(h)δ-1α-1} при t ∈ [0, ϑ - δ].
В таком случае имеет место сходимость (8), если выполнены условия теоремы 3, а также
следующее условие: γ2(h)(α(h)δ(h))-1 → 0 при h → 0.
Замечание 3. Рассмотрим систему
x(t) + Ax(t) = Bf(t) + v(t),
где v(·) ∈ L2(T ; H) - фиксированная функция. В этом случае уравнение модели имеет вид
{
uh(t)
при п.в. t ∈ [0, δ(h)),
wh(t) =
-Awh(t) + Buh(t) + v(t)
при п.в. t ∈ [δ(h), ϑ],
а управление uh(·) находится по формуле
{
0
при τ ∈ [0, δ), i = 0,
uh(t) = Uh(τi,ψhi-1,ψhi,ξhi-1,ξhi) =
f(i-1)0(τ) при τ ∈ [τi,τi+1), i = 1,m - 1,
где пара функций {f(i-1)0(·), y(i-1)0(·)} является решением задачи оптимального программного
управления
ÿ(τ) + Ay(τ) = Bf(τ) + v(τ), τ ∈ [τi-1, τi], y(τi-1) = ψhi-1,
y(τi-1) = ξhi-1
c квадратичным критерием качества
I(f(·), y(·); δ, α, ξhi , ψhi) = δ|y(τi; τi-1, ψhi-1, ξhi-1, f(·)) - ψhi|2V +
∫δ
+ δ| y(τi;τi-1.ψhi-1,ξhi-1,f(·)) - ξhi |2H + α
|f(τ)|2U dτ.
0
2. Скорость сходимости алгоритма. Установим оценку скорости сходимости алгоритма.
В дальнейшем нам понадобится
Лемма [13]. Пусть заданы две функции: t → a(t) ∈ L2(T ; W∗) и t → b(t) ∈ W, t ∈ T,
причём b(·) является функцией с ограниченной вариацией. Если верны неравенства
∫
t
a(τ) dτ
≤ ε,
|b(t)|W ≤ d, t ∈ T,
W∗
t0
то справедлива оценка
ϑ
∫
〈a(t), b(t)〉W dτ ≤ ε(varT b(t) + d).
t0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1535
Здесь W - банахово пространство с нормой |·|W , символ varT b(t) означает полную вариацию
функции b(t) на промежутке T, а символ 〈 · , · 〉W - двойственность между W∗ и W.
Теорема 3. Пусть выполнены условия теоремы 2, U = V, B = I (тождественные
оператор) и функция t → u∗(t) ∈ V является функцией с ограниченной вариацией. Тогда
справедлива следующая оценка скорости сходимости алгоритма:
∫
|u∗(t) - uh(t + δ)|2H dt ≤ c{χ1/4(h, δ, α) + hα-1}.
(48)
0
Доказательство. Учитывая линейность и непрерывность оператора A : V → V∗, заклю-
чаем, что при всех t ∈ [0, ϑ - δ] имеет место оценка
∫
t
∫
t
J (u∗(τ) - uh(τ + δ)) dτ
= sup
{x(τ) - wh(τ + δ) - A(x(τ) - wh(τ + δ))}dτ,v
≤
V∗
|v|V ≤1
0
0
∫
t
≤ |x(t) - wh(t + δ)|V ∗ + |x(0) - wh(δ)|V ∗ + |A|L(V ;V ∗)
|x(τ) - wh(τ + δ)|V dτ,
(49)
0
где | · |V ∗ - норма в пространстве V∗, символ J означает оператор канонического вложения
пространства V в пространство V∗. В свою очередь, в силу теоремы [1, с. 93] при t ∈ [τi, τi+1]
верны неравенства
| x(t) - x(τi)|V ∗ ≤ c1(t - τi)1/2,
wh(t) -w˙h(τi)|V ∗ ≤ c2(t - τi)1/2.
(50)
Поэтому из (10) в силу (50) вытекает оценка
∫
)1/2
| x(t) - wh(t + δ)|2V ∗ dt
≤ c3χ1/2(h,δ,α).
0
Учитывая (2) и (3), заключаем, что при t ∈ [τi-1, τi], i = 1, m - 1, справедливо соотношение
| x(t) - wh(t + δ)|2H + c|x(t) - wh(t + δ)|2V ≤ | x(0) -w˙h(δ)|2H +
∫t
+ |A|L(V ;V ∗)|x(0) - wh(δ)|2V +
| x(τ) -
wh(τ + δ)|V ∗|{|u∗(τ)|V + |uh(τ + δ)|V }dτ ≤
0
(∫t
)1/2{(∫τi
)1/2
∫
)1/2}
≤c4h2 +
| x(τ) - wh(τ + δ)|2V ∗ dτ
|u∗(τ)|2V dτ
+
|uh(τ)|2V dτ
(51)
0
0
0
В силу (11) при выполнении условий теоремы 2 имеем
(∫ϑ
)1/2
(∫ϑ
)1/2
|u∗(τ)|2V dτ
+
|uh(τ)|2V dτ
≤ c5(1 + h1/2α-1/2) ≤ c6.
(52)
0
0
С учётом (52) и (10) из соотношения (51) имеем
| x(t) -
wh(t + δ)|2H + |x(t) - wh(t + δ)|2V ≤ c7χ1/2(h,δ,α).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022
1536
МАКСИМОВ
Таким образом,
∫
t
(
∫
t
)1/2
|x(τ) - wh(τ + δ)|V
dτ ≤ ϑ1/2
|x(τ) - wh(τ + δ)|2V dτ
≤ c8χ1/4(h,δ,α).
(53)
0
0
Далее, объединив (49) и (53), заключаем, что справедливо неравенство
∫
t
J (u∗(τ) - uh(τ + δ)) dτ
≤ c9χ1/4(h,δ,α).
(54)
V
∗
0
Воспользовавшись неравенством (11), получим
∫
∫
|u∗(τ) - uh(τ + δ)|2H dτ ≤ 2|u∗(·)|2L
-2
(u∗(τ), uh(τ + δ)) dτ + C∗∗hα-1 =
2
(T ;H)
0
0
ϑ-δ
=2
〈J(u∗(τ) - uh(τ + δ)), u∗(τ)〉 dτ + C∗∗hα-1.
(55)
0
В силу леммы 1 из (55) и (54) следует неравенство (48). Теорема доказана.
Работа выполнена при финансовой поддержке Министерства науки и высшего образования
Российской Федерации в рамках реализации программы Уральского математического центра
по соглашению № 075-02-20022-874.
СПИСОК ЛИТЕРАТУРЫ
1. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации. М.,
1999.
2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.
3. Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамической системе // Изв.
АН СССР. Техн. кибернетика. 1983. № 2. С. 51-60.
4. Maksimov V.I. Dynamical Inverse Problems of Distributed Systems. Utrecht, 2002.
5. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Динамические обратные задачи для параболи-
ческих систем // Дифференц. уравнения. 2000. Т. 36. № 5. С. 579-597.
6. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Метод экстремального сдвига Н.Н. Красовского
и задачи граничного управления // Автоматика и телемеханика. 2009. Т. 4. № 5. С. 18-30.
7. Maksimov V.I. Some dynamical inverse problems for hyperbolic systems // Control and Cybern. 1996.
V. 25. P. 465-481.
8. Maksimov V., Pandolfi L. The problem of dynamical reconstruction of Dirichlet boundary control in
semilinear hyperbolic equations // J. of Inverse and Ill-Posed Probl. 2000. V. 8. № 4. P. 399-418.
9. Максимов В.И. О динамическом восстановлении правой части гиперболического уравнения
// Журн. вычислит. математики и мат. физики. 2015. Т. 55. № 6. С. 1008-1019.
10. Максимов В.И. Об одном алгоритме динамического восстановления правой части уравнения с рас-
пределёнными параметрами второго порядка // Журн. вычислит. математики и мат. физики. 2017.
Т. 57. № 8. С. 13-27.
11. Лионс Ж.Л. Оптимальное управление системами, описываемыми уравнениями с частными произ-
водными. М., 1972.
12. Максимов В.И. Об отслеживании траектории динамической системы // Прикл. математика и ме-
ханика. 2011. Т. 75. № 6. С. 951-960.
13. Васильева Е.В., Максимов В.И. О динамической реконструкции неограниченных управлений в
параболическом уравнении // Дифференц. уравнения. 2003. Т. 39. № 1. С. 23-29.
Институт математики и механики
Поступила в редакцию 06.04.2022 г.
имени Н.Н. Красовского УрО РАН,
После доработки 06.04.2022 г.
г. Екатеринбург
Принята к публикации 15.08.2022 г.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№ 11
2022