ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2022, том 58, № 11, с. 1525-1536

ТЕОРИЯ УПРАВЛЕНИЯ

УДК 517.977+519.633.9

ОБ ОДНОЙ МОДИФИКАЦИИ

МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ

ДЛЯ ЛИНЕЙНЫХ ГИПЕРБОЛИЧЕСКИХ УРАВНЕНИЙ

Рассматривается задача восстановления распределённых входных воздействий (возмуще-

ний) в линейных гиперболических уравнениях. Предлагается алгоритм решения этой зада-

чи. В случае, когда входное воздействие - функция с ограниченной вариацией, устанавли-

вается оценка сверху скорости сходимости. Алгоритм, основанный на соединении методов

оптимального программного и позиционного управлений, позволяет осуществить процесс

восстановления на основе неточных измерений решений уравнений в дискретные моменты

времени.

DOI: 10.31857/S0374064122110085, EDN: MBCWVN

Введение. Пусть V и H - действительные гильбертовы пространства. Пространство V

вложено в пространство H, плотно и непрерывно: V ⊂ H = H^∗ ⊂ V^∗. Символы |·|_V , |·|_V ∗ и

|·|_H означают соответственно нормы в V, V ^∗ и H, а символы (·,·) и 〈·,·〉 - соответственно

скалярное произведение в H и двойственность между V и V^∗.

Рассматривается гиперболическое уравнение

x(t) + Ax(t) = Bu(t), t ∈ T = [t₀, ϑ],

(1)

с начальными условиями

x(t₀) = x₀,

x(t₀) = x₁.

Здесь ϑ ∈ (t₀, +∞), A : V → V^∗ - линейный, непрерывный и симметричный оператор, удо-

влетворяющий (для некоторого c > 0) условию коэрцитивности

〈Ay, y〉 ≥ c|y|2V для любого y ∈ V,

(2)

U - гильбертово пространство с нормой | · |_U (пространство возмущений), производная

x(·)

понимается в смысле пространства распределений [1, с. 95], B - линейный непрерывный опе-

ратор, действующий из пространства U в пространство H (B ∈ L(U; H)).

Следуя [1, с. 91], функцию x(·) ∈ C(T ; V ) такую, что

x(·) ∈ W (T ; V ) = {z(·) ∈ C(T ; H) :

Ż(·) ∈ L₂(T ; V^∗)} и выполняется соотношение

〈x(t),v〉 + 〈Ax(t),v〉 = (Bu(t),v) для любой v ∈ V при п.в. t ∈ T,

будем называть решением (слабым) уравнения (1) и обозначать

x(·) = x(· ; t₀, x₀, x₁, u(·)).

В дальнейшем полагаем, что вложение пространства V в пространство H компактно. Кроме

того, x₀ ∈ V, x₁ ∈ H. Тогда (см. [1, с. 93]) при любой функции u(·) ∈ L₂(T ; U) уравнение (1)

имеет единственное решение (слабое).

Исследуемая в настоящей работе задача формулируется следующим образом. Имеется

уравнение (1) с некоторым входным воздействием (возмущением) u = u_∗(·). Заранее как это

воздействие, так и отвечающее ему решение x(·) = x(· ; t₀, x₀, x₁, u_∗(·)) уравнения не заданы.

В дискретные, достаточно частые, моменты времени

τ_i ∈ Δ = {τ_i}mi=0 (τ₀ = t₀, τ_m = ϑ, τi+1 = τ_i + δ)

1525

1526

МАКСИМОВ

измеряются (с ошибкой) величины x(τ_i) и

x(τ_i). Результаты измерений - элементы ψ^hi ∈ V

и ξ^hi ∈ H - удовлетворяют неравенствам

|ψ^hi - x(τ_i)|_V ≤ h,

|ξ^hi - x(τ_i)|_H ≤ h, i = 0, m - 1.

(3)

Здесь число h ∈ (0, 1) характеризует “ошибку” вычислений { x(τ_i), x(τ_i)}. Задача заключается

в том, чтобы построить алгоритм приближённого восстановления неизвестного возмущения,

порождающего решение x(·) уравнения (1).

Заметим, что одно и то же решение уравнения (1) может порождаться не единственным

возмущением. Пусть символ U(x(·)) означает множество всех возмущений, совместимых с

выходом x(t), t ∈ T, т.е.

U (x(·)) = {u(·) ∈ L₂(T ; U) : (Bu(t), z) = 〈x(t) + Ax(t), z〉 при п.в. t ∈ T и всех z ∈ V }.

Как нетрудно видеть, множество U(x(·)) выпукло и замкнуто в пространстве L₂(T ; U). По-

этому оно содержит единственный элемент минимальной L₂(T ; U)-нормы - u^∗(·). Следуя

принятому в теории некорректных задач подходу, будем восстанавливать u^∗(·).

Первый из алгоритмов динамической регуляризации, основанный на известном в теории

гарантированного управления принципе экстремального сдвига [2, с. 57-59], был предложен

в статье [3]. Впоследствии данный алгоритм был распространен на дифференциальные урав-

нения с распределёнными параметрами (см. [1, с. 44-51; 4, с. 10-29; 5; 6]). Здесь упомянуты

лишь монографии и обзорные статьи, в которых можно найти дополнительные ссылки. Среди

более поздних работ, в которых рассматривались гиперболические уравнения, отметим, на-

пример, [7-10]. В соответствии с описанным в этих работах методом задача восстановления

неизвестного возмущения по результатам измерения заменяется некоторой другой задачей, а

именно, задачей позиционного управления вспомогательной системой (уравнением) M, назы-

ваемой моделью. При этом управление в модели определялось путём локальной регуляриза-

ции по методам сглаживающего функционала или невязки, известного в теории позиционных

дифференциальных игр, экстремального сдвига. В настоящей работе будет предложен ал-

горитм решения рассматриваемой задачи, который можно трактовать как метод локальной

регуляризации экстремального сдвига путём решения вспомогательной задачи оптимального

программного управления с квадратичным критерием качества.

1. Алгоритм решения. Опишем алгоритм решения рассматриваемой задачи. Пусть име-

, τh,i+1 = τ_h,i+δ(h), i = 0,m_h - 1, τh,0 = t₀, τh,mh =

ется семейство разбиений Δ_h = {τ_h,i}

= ϑ, h ∈ (0,1), отрезка T, а также функция α = α(h) : (0,1) → (0,1). Всюду ниже для

упрощения полагаем t₀ = 0, h, δ(h) ∈ (0, 1).

До начала работы алгоритма фиксируются погрешность h, разбиение Δ_h = {τ_i}mi=0 (τ_i =

= τ_h,i, m = m_h) отрезка T с шагом δ = δ(h) и число α = α(h). Работа алгоритма разбивается

на m - 1 однотипных шагов. На i-м шаге (i = 1, m - 1) алгоритма, осуществляемом на

промежутке времени [τ_i, τi+1], выполняются следующие операции. Сначала решается задача

оптимального программного управления уравнением

ÿ(τ) + Ay(τ) = Bf(τ), τ ∈ [0, δ], y(0) = ψhi-1,

y(0) = ξhi-1

(4)

c квадратичным критерием качества

∫δ

I(f(·), y(·); δ, α, ξ^hi , ψ^hi) = δ| y(δ) - ξ^hi|2H + δ|y(δ) - ψ^hi|2V + α

|f(τ)|2U dτ.

(5)

Здесь y(·) = y(· ; 0, ψhi-1, ξhi-1, f(·)) - решение уравнения (4). Решением задачи (4), (5) является

пара {f(i-1)opt(·), y(i-1)opt(·)}, где y(i-1)opt = y(· ; 0, ψhi-1, ξhi-1f(i-1)opt(·)), такая, что

I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξ^hi, ψ^hi) =

= min{I(f(·),y(·);δ,α,ξhi ,ψhi ) : f(·) ∈ L₂([0,δ];U), y(·) = y(·;0,ψhi-1,ξhi-1,f(·))}.

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ

1527

После этого вычисляется функция

u^h(t) = v^hi(t - τ_h,i), t ∈ [τ_i,τi+1),

(6)

где

{

при τ ∈ [0, δ), i = 0,

v^hi(τ) = U_h(τ_i,ψhi-1,ψ^hi,ξhi-1,ξ^hi) =

(7)

f(i-1)opt(τ) при τ ∈ [0,δ), i = 1,m - 1.

Работа алгоритма заканчивается в момент ϑ.

Замечание 1. Решение задачи оптимального программного управления с квадратичным

критерием качества приведено, например, в монографии [11, гл. 4, §§ 2, 3].

Справедлива

Теорема 1. Пусть δ(h) → 0, α(h) → 0, hδ-2(h) → 0, α(h)δ-5/2(h) → 0 при h → 0.

Тогда имеет место сходимость

u^h(·) → u^∗(·) в L₂(T;U) при h → 0.

(8)

Таким образом, для реализации описанного выше алгоритма модель не требуется, однако

она необходима для обоснования его сходимости (см. доказательство теоремы 1, в котором

используются оценки из теоремы 2).

Прежде чем перейти к доказательству теоремы 1 приведём вспомогательные построения.

Следуя работам [1, с. 15; 7-10], введём вспомогательную управляемую систему (модель), опи-

сываемую уравнением

{

u^h(t)

при п.в. t ∈ [0, δ(h)),

w^h(t) =

(9)

-Aw^h(t) + Bu^h(t)

при п.в. t ∈ [δ(h), ϑ].

Начальное состояние модели определяют условия w^h(0) = ψh0,

w^h(0) = ξh0. Управление мо-

делью осуществляется синхронно с процессом восстановления. На промежутке [τ_i, τi+1], τ_i =

= τ_h,i, на вход модели (9) подается управление u^h(·) вида (6). После этого формируется

решение w^h(t) = w^h(t; τ_i, w^h(τ_i),w˙^h(τ_i), u^h(·)), t ∈ [τ_i, τi+1], уравнения (9), т.е. осуществляется

корректировка памяти.

Имеет место следующая

Теорема 2. Справедливы неравенства

ε_h,δ = max{| x(τ_i) -w˙^h(τi+1)|2H + c|x(τ_i) - w^h(τi+1)|2V : i ∈ [0 : m_h - 1]} ≤ C_∗χ(h,α,δ),

(10)

|u^h(·)|_L

(11)

2(T ) ≤|u∗(·)|L2(T )+C∗∗h1/2α-1/2.

Здесь χ(h, α, δ) = hδ-2 + αδ-5/2 + h1/2δ-1 + δ1/2, C_∗ и C_∗∗ - некоторые постоянные, не

зависящие от h, α, δ, символ | · |L2(T ) означает норму в пространстве L2(T ; U).

Доказательство. Введём обозначение

z(t) = y(i-1)opt(t - τi-1) при t ∈ δ_i = [τi-1, τ_i).

Тогда функция z(·) на отрезке [τi-1, τ_i] является решением уравнения

z(t) + Az(t) = Bu^h(t)

(12)

с начальными условиями

z(τi-1) = ψhi-1,

Ż(τi-1) = ξhi-1

и управлением

u^h(t) = f(i-1)opt(t - τi-1) при п.в. t ∈ [τi-1,τ_i).

(13)

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

1528

МАКСИМОВ

Таким образом, из (9), (7), (6), (12) и (13) следует соотношение

μ^hδ(t) + Aμ^hδ(t) = 0 при п.в. t ∈ [τi-1,τ_i] и всех i = 1,m - 1,

(14)

где μ^hδ(t) = z(t)-w^h(t+δ). Умножив правую и левую части равенства (14) на μ^hδ(t) (скалярно

в H) и проинтегрировав полученное выражение, будем иметь

| μ^hδ(t)|2H + 〈Aμ^hδ(t),μ^hδ(t)〉 = |ξhi-1 -w˙^h(τ_i)|2H + 〈Aμ^hδ(τi-1),μ^hδ(τi-1)〉, t ∈ [τi-1,τ_i].

(15)

В свою очередь, учитывая правило определение функции z(·), а также условие (2), из (15)

получаем

|y(i-1)opt(δ) - wh(τi+1)|2H + ei = |ξhi-1 -w˙h(τi)|2H + νi,

(16)

где

e_i = 〈A(y(i-1)opt(δ) - w^h(τi+1)),y(i-1)opt(δ) - w^h(τi+1)〉 ≥ 0, i = 1,m - 1,

ν_i = 〈A(ψhi-1 - w^h(τ_i)),ψhi-1 - w^h(τ_i)〉 ≥ 0, ν₁ = 0.

Рассмотрим задачу оптимального управления уравнением (4) с начальными условиями

y(0) = x(τi-1),

y(0) = x(τi-1)

и критерием качества I(f(·), y(·); δ, α,x˙(τ_i), x(τ_i)) вида (5). Обозначим оптимальное управле-

ние в этой задаче символом fδi-1(·), а оптимальную траекторию через

yδi-1(·) = y(·;0,x(τi-1), x(τi-1),fδi-1(·)).

Легко видеть, что верно неравенство

I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξ^hi, ψ^hi) = δ| y(δ; 0, ψhi-1, ξhi-1, f(i-1)opt(·)) - ξ^hi|2H +

∫δ

+ δ|y(δ;0,ψhi-1,ξhi-1,f(i-1)opt(·)) - ψhi |2V + α

|f(i-1)opt(τ)|2U dτ ≤

∫δ

≤ δ| y(δ;0,ψhi-1,ξhi-1,fδi-1(·))-ξhi |2H +δ|y(δ;0,ψhi-1,ξhi-1,fδi-1(·))-ψhi |2V +α

|fδi-1(τ)|2U dτ.

(17)

Заметим, что вложение пространства V в пространство H непрерывно, т.е. существует число

C₁ > 0 такое, что для любых x ∈ V : |x|_H ≤ C₁|x|_V . Поэтому, учитывая линейность оператора

A, а также (2), (3), нетрудно показать, что верно неравенство

| yδi-1(δ) - y(δ;0,ψhi-1,ξhi-1,fδi-1(·))|_H + |yδi-1(δ) - y(δ;0,ψhi-1,ξhi-1,fδi-1(·))|V ≤ C2h.

В таком случае из (17) и (3) следует, что

I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξ^hi, ψ^hi) ≤ δ{| yδi-1(δ) - x(τ_i)|_H + C₃h}² +

∫δ

+ δ{|yδi-1(δ) - x(τ_i)|_V + C₄h}² + α

|fδi-1(τ)|2U dτ.

(18)

Далее имеем

∫δ

|f(i-1)opt(τ)|2U dτ ≤ I(f(i-1)opt(·), y(i-1)opt(·); δ, α, ξ^hi, ψ^hi).

(19)

Кроме того, как нетрудно видеть,

sup{| x(t)|_H + |x(t)|_V } ≤ C₅.

(20)

t∈T

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ

1529

Действительно, умножив правую и левую части уравнения (1) на x(t), будем иметь

0.5d| x(t)|2H /dt + 〈Ax(t), x(t)〉 ≤ |Bu(t)|_H | x(t)|_H .

После интегрирования получим

∫ϑ

∫

| x(t)|2H +〈Ax(t),x(t)〉 ≤ | x(0)|2H +〈Ax(0),x(0)〉+

|Bu(t)|2H dt+

| x(t)|2H dt для любого t ∈ T.

Отсюда, учитывая (2), включение u(·) ∈ L₂(T ; U) и лемму Гронуолла, получаем неравен-

ство (20). Пусть y(·) - решение уравнения

r(t) + Ar(t) = 0, t ∈ [0, δ],

(21)

с начальными условиями r(0) = x(τi-1),

r(0) = x(τi-1). Умножив (скалярно) правую и левую

части (21) на r(·) и проинтегрировав, будем иметь

|r(t)|2H + 〈Ar(t),r(t)〉 = |r(0)|2H + 〈Ar(0),r(0)〉.

Отсюда, воспользовавшись (2), получим

|r(δ)|2H + c|r(δ)|2V ≤ |x(τi-1)|2H + |A|L(V ;V∗)|x(τi-1)|2V .

Здесь |A|L(V;V ∗₎ - норма линейного непрерывного оператора A : V → V∗. Таким образом,

ввиду последнего неравенства, а также (20),

sup

{| y(δ; 0, x(τi-1), x(τi-1), u₀(·))|_H , |y(δ; 0, x(τi-1), x(τi-1), u₀(·))|_V } ≤ C₆,

(22)

i∈[1:m_h]

где C₆ не зависит от h,

u₀(t) = 0 при п.в. t ∈ [0,δ].

Далее, имеем

I(fδi-1(·), yδi-1(·); δ, α,x˙(τ_i), x(τ_i)) ≤ I(u₀(·), y(· ; 0, x(τi-1), x(τi-1), u₀(·)); δ, α,x˙(τ_i), x(τ_i)) =

= δ| y(δ;0,x(τi-1), x(τi-1),u₀(·)) - x(τ_i)|2H + δ|y(δ;0,x(τi-1), x(τi-1),u₀(·)) - x(τ_i)|2V .

Отсюда и из (20) и (22) следует существование числа C₇ ∈ (0, +∞) такого, что

sup{| y(δ;0,x(τi-1), x(τi-1),fδi-1(·))|_H,

|y(δ; 0, x(τi-1), x(τi-1), fδi-1(·))|V : δ ∈ (0,1), i = 1,m} ≤ C7.

(23)

Поэтому, используя (20) и (23), выводим оценку

{| yδi-1(δ) - x(τ_i)|_H + C₃h}² + {|yδi-1(δ) - x(τi-1)|_V + C₄h}² ≤

≤ | yδi-1(δ) - x(τ_i)|2H + |yδi-1(δ) - x(τi-1)|2V + C₈h.

(24)

Таким образом, в силу (6), (7), (18), (19) и (24) получаем

∫

|u^h(τ)|2U dτ = α

|f(i-1)opt(τ)|2U dτ ≤

(25)

τ_i

∫δ

≤ δ| yδi-1(δ) - x(τ_i)|2H + δ|yδi-1(δ) - x(τ_i)|2V + C₈δh + α

|fδi-1(τ)|2U dτ.

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

1530

МАКСИМОВ

Учитывая правило определения управления fδi-1(·), устанавливаем неравенство

∫δ

δ| yδi-1(δ) - x(τ_i)|2H + δ|yδi-1(δ) - x(τ_i)|2V + α

|fδi-1(τ)|2U dτ ≤

∫τi

≤α

|u^∗(τ)|2U dτ = I(u^∗(·), y(·); δ, α,x˙(τ_i), x(τ_i)),

(26)

τi-1

где y(·) = y(· ; τi-1, x(τi-1), x(τi-1), u^∗(·)). Воспользовавшись этим неравенством, а также (25),

получаем

τ_i

∫

|u^h(τ)|2U dτ ≤ α

|u^∗(τ)|2U dτ + C₈δh,

(27)

τ_i

τi-1

откуда следует неравенство (11). Осталось проверить неравенство (10). Оценим изменение

величины ε(τ_i) = | x(τ_i) - w˙^h(τ_i + δ)|2H + c|x(τ_i) - w^h(τ_i + δ)|2V при изменении i = 0, m - 1 и

t ∈ [τ_i,τi+1) (τ_i = τ_h,i, m = m_h). Из (18) и (24) вытекает оценка

I(u(i-1)opt(·), y(i-1)opt(·); δ, α, ξ^hi , ψ^hi) ≤ δ| yδi-1(δ) - x(τ_i)|2H + δ|yδi-1(δ) - x(τ_i)|2V +

∫δ

+α

|fδi-1(τ)|2U dτ + C₈δh.

(28)

В свою очередь, из (28) и (26) следует неравенство

δ| y(i-1)opt(δ) - ξ^hi|2H + δ|y(i-1)opt(δ) - ψ^hi|2V ≤

τ_i

∫δ

∫

≤ δ| yδi-1(δ) - x(τ_i)|2H + δ|yδi-1(δ) - x(τ_i)|2V + α

|fδi-1(τ)|2U dτ + C₈δh ≤ C₈δh + α

|u^∗(τ)|2U dτ.

τi-1

Таким образом,

τ_i

∫

| y(i-1)opt(δ) - ξhi |2H + |y(i-1)opt(δ) - ψhi |2V ≤ C₈h + αδ-1

|u^∗(τ)|2U dτ.

(29)

τi-1

Умножим обе части уравнения (9) на

w^h(t). После интегрирования полученного равенства

в силу (2) будем иметь

∫t

w^h(t)|2H + c|w^h(t)|2V ≤

|Bu^h(τ)|_H |w^h(τ)|_H dτ + |w˙^h(0)|2H .

Отсюда в силу неравенства Гронуолла находим

sup{|w˙^h(t)|_H + |w^h(t)|_V } ≤ C₉, h ∈ (0,1).

(30)

t∈T

Из (16) и (30) также следует (δ = δ(h), m = m_h), что

sup

|y(i-1)opt(δ)|V ≤ C10, h ∈ (0,1).

(31)

i=1,m-1

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ

1531

Далее, учитывая (29)-(31), выводим оценку

νi+1 = 〈A(y(i-1)opt(δ) - w^h(τi+1)),ψ^hi - w^h(τi+1)〉 + 〈A(ψ^hi - y(i-1)opt(δ)),ψ^hi - w^h(τi+1)〉 ≤

≤ 〈A(y(i-1)opt(δ) - w^h(τi+1)), ψ^hi - w^h(τi+1)〉 + C₁₁φ_i ≤ e_i + C₁₂φ_i,

(32)

где

(

∫τi

)1/2

φ_i

= h + αδ-1

|u^∗(τ)|2U dτ

τi-1

Воспользовавшись (16), (29), (32), получаем (i = 1, m - 1) неравенства

|ξ^hi -

≤ (1 + C₁₃δ){|ξhi-1 - w^h(τ_i)|2H + ν_i} + (1 + δ-1)| y(i-1)opt(δ) - ξhi |2H + C₁₂φ_i ≤

(

∫

τ_i

)

≤ (1 + C₁₂δ){|ξhi-1 - w˙^h(τ_i)|2H + ν_i} + (1 + δ-1) C₈h + αδ-1

|u^∗(τ)|2U dτ

+C₁₂φ_i,

τi-1

откуда в силу леммы из работы [12] следует оценка

{

|ξ^hi - wh(τi+1)|2H + c|ψhi - wh(τi+)|2V ≤

|ξh0 - w˙^h(τ₁)|2H + ν₁ +

(

∫

τ_i

)

∑ }

+ (1 + δ-1) C₁₃hδ-1 + αδ-1

|u^∗(τ)|²

dτ

+C₁₄

φ_j exp{C₁₂τ_i}.

(33)

j=1

Заметим, что ν₁ = 0 и

τ_i

∫

φ_i ≤ h1/2 + αδ-3/2 + δ1/2

|u^∗(τ)|2U dτ,

τi-1

поэтому

{

∫

τ_i

}

∑

φ_j ≤ C₁₄

h1/2δ-1 + αδ-5/2 + δ1/2

|u^∗(τ)|2U dτ

(34)

j=1

Из неравенств (33) и (34) получаем оценку

ε(τ_i) ≤ (h + |ξ^hi - w˙^h(τi+1)|_H )² + c(h + |ψ^hi - w^h(τi+1)|_V )² ≤ C₁₅χ(h, α, δ).

Теорема доказана.

Доказательство теоремы 1. Покажем, что для произвольной последовательности h_j →

→ 0+ при j → ∞ и любого семейства {Δhj} = {τhj,i}

разбиений промежутка T имеет

место сходимость

uhj (·) → u^∗(·) в L₂(T;U) при j → ∞.

Здесь и ниже управления uhj (·) определены по правилу (6), (7), в которых h = h_j . Предпо-

лагая противное, заключаем, что найдётся подпоследовательность последовательности uhj (·)

(обозначим её для упрощения тем же символом uhj (·)) такая, что

uhj (·) → f₀(·) слабо в L₂(T;U) при j → ∞,

(35)

f₀(·) = u^∗(·).

(36)

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

1532

МАКСИМОВ

Введём оператор C : L₂(T ; U) → L₂(T ; V^∗) по формуле

Cf(·) = x(·;0,x₀,x₁,f(·)),

где x(·) - решение уравнения (1). В силу неравенства (1.7) из работы [1], а также непре-

рывности вложения пространства H в пространство V^∗, оператор C является линейным и

непрерывным. Тогда, учитывая (35), имеем

〈 x(·;uhj (·)),φ〉^∗ = 〈Cuhj (·),φ〉^∗ = 〈uhj (·),C^∗φ〉_U при j → ∞,

〈f₀(·), C^∗φ〉_U = 〈Cf₀(·), φ〉^∗ = 〈 x(· ; f₀(·)), φ〉^∗ при всех φ ∈ L₂(T ; V ).

Здесь 〈 · , · 〉^∗ означает двойственность между пространствами L₂(T ; V ) и L₂(T ; V^∗), 〈·,·〉U -

скалярное произведение в пространстве U, x(· ; f₀(·)) = x(· ; 0, x₀, x₁, f₀(·)), а

x(· ; uhj (·)) -

производную решения x(· ; 0, x₀, x₁, uhj (·)) уравнения (1). Таким образом,

x(· ; uhj (·)) → x(· ; f₀(·)) слабо в L₂(T ; V^∗).

(37)

Заметим, что whj (t - δ(h_j )) = x(t; u^hj(·)) при t ∈ [δ(h_j ), ϑ]. Поэтому справедливо равенство

∫

〈 x(t;uhj (·)) - x(t;f₀(·)),φ(t)〉dt = I_h

+ Jhj для любой φ ∈ L₂(T;V ^∗),

(38)

где

∫

Ihj =

〈 x(t;uhj (·)) - x(t;f₀(·)),φ(t)〉dt,

∫ϑ

Jhj =

〈 whj(t - δ(h_j)) - x(t;f₀(·)),φ(t)〉dt.

δ(h_j )

В силу неравенства (11) аналогично оценке (20) устанавливается равномерная ограничен-

ность в метрике пространства C(T ; H) множества { x(· ; uhj (·))}∞j=1. Вследствие этого,

Ihj → 0

при j → ∞.

(39)

Учитывая (37)-(39), непрерывность в среднем функции x(· ; f0(·)), а также ограниченность в

C(T ; H) множества {w˙hj (·)}∞j=1 (см. (30)), получаем

∫

Jhj =

〈 whj(t) - x(t + δ(h_j);f₀(·)),φ(t)〉dt → 0 при j → ∞ для любой φ(·) ∈ L₂(T;V ).

Значит,

whj (·) → x(·;f₀(·)) слабо в L₂(T;V^∗) при j → ∞.

(40)

В силу теоремы 1 (см. (10)) получаем

max

whj (t) - x(t)|_V ∗ → 0 при j → ∞,

(41)

t∈T

где x(·) = x(· ; 0, x0, x1, u∗(·)), т.е.

whj (·) → x(·) в C(T;V^∗) при j → ∞.

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ

1533

Из (40) и (41) следует равенство

x(t; 0, x₀, x₁, f₀(·)) = x(t; 0, x₀, x₁, u^∗(·)) при всех t ∈ T,

значит f₀(·) ∈ U(x(·)) и, следовательно,

|f₀(·)|L2 ≥ |u^∗(·)|L2 .

(42)

Символ | · |L2 означает норму в пространстве L₂(T ; U). Кроме того, в силу известных свойств

слабого предела из сходимости (35) вытекает, что

lim

|uhj (·)|L2 ≥ |f₀(·)|L2 .

(43)

j→∞

Ввиду (11) справедливо неравенство

|uhj (·)|2L

≤ |u^∗(·)|2L

+ C_∗∗h1/2jα1/2(h_j),

откуда следует, что

lim

|uhj (·)|L2 ≤ |u^∗(·)|L2 ,

(44)

j→∞

т.е. (см. (42)-(44))

lim

|uhj (·)|L2 ≤ |u^∗(·)|L2 ≤ |f₀(·)|L2 ≤ lim

|uhj (·)|L2 .

(45)

j→∞

Так как множество U(x(·)) содержит единственный элемент минимальной L₂-нормы (а имен-

но u^∗(·)), то из (45) получаем равенство

f₀(·) = u^∗(·).

(46)

Воспользовавшись (35), (46), заключаем, что

uhj (·) → u^∗(·) слабо в L₂ при j → ∞.

(47)

Сходимость (47) противоречит (35) и (36). Теорема доказана.

Замечание 2. Пусть управления f(i-1)opt(·) находятся приближённо, т.е. вместо них вычис-

ляются управления f(i-1)opt(·) ∈ L₂([0, δ]; U) такие, что

|f(i-1)opt(·) - f(i-1)opt(·)|_L

2([0,δ];U) ≤γ(h).

Тогда естественно полагать (см. (7))

{

при τ ∈ [0, δ], i = 0,

U_h(τ_i,ψhi-1,ψ^hi,ξhi-1,ξ^hi) =

f(i-1)opt(τ) при τ ∈ [0,δ], i = 1,m - 1.

В этом случае справедливы неравенства

|f(i-1)opt(·)|2L

≤ (γ(h) + |f(i-1)opt(·)|_L

(·)|2L

2(δ;U)

2(δ;U))² ≤(1+α-1)γ(h)2 +(1+α)|

opt

2(δ;U)

поэтому

∫

|u^h(τ)|2U dτ = α

|f(i-1)opt(τ)|2U dτ ≤ α(1 + α)

|f(i-1)opt(τ)|2U dτ + αγ²(h)(1 + α-1).

τ_i

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

1534

МАКСИМОВ

Значит (см. (13), (27)),

τ_i

∫

|u^h(τ)|2U dτ ≤ α(1 + α)

|u_∗(τ)|2U dτ + C₈δh + αγ²(h)(1 + α-1)

τ_i

τi-1

и, следовательно, вместо (11) выполняется неравенство

|u^h(·)|_L

2(T ) ≤(1+α)|u∗(·)|L2(T )+C∗∗(h1/2α-1/2 +γ2(h)δ-1)(1+α-1)^.

В свою очередь, нетрудно показать, что вместо неравенства (10) будет выполняться нера-

венство

ε(t) ≤ C_∗{χ(h, δ, α) + γ²(h)δ-1α-1} при t ∈ [0, ϑ - δ].

В таком случае имеет место сходимость (8), если выполнены условия теоремы 3, а также

следующее условие: γ²(h)(α(h)δ(h))-1 → 0 при h → 0.

Замечание 3. Рассмотрим систему

x(t) + Ax(t) = Bf(t) + v(t),

где v(·) ∈ L₂(T ; H) - фиксированная функция. В этом случае уравнение модели имеет вид

{

u^h(t)

при п.в. t ∈ [0, δ(h)),

w^h(t) =

-Aw^h(t) + Bu^h(t) + v(t)

при п.в. t ∈ [δ(h), ϑ],

а управление u^h(·) находится по формуле

{

при τ ∈ [0, δ), i = 0,

u^h(t) = U_h(τ_i,ψhi-1,ψ^hi,ξhi-1,ξ^hi) =

f(i-1)0(τ) при τ ∈ [τ_i,τi+1), i = 1,m - 1,

где пара функций {f(i-1)0(·), y(i-1)0(·)} является решением задачи оптимального программного

управления

ÿ(τ) + Ay(τ) = Bf(τ) + v(τ), τ ∈ [τi-1, τ_i], y(τi-1) = ψhi-1,

y(τi-1) = ξhi-1

c квадратичным критерием качества

I(f(·), y(·); δ, α, ξ^hi , ψ^hi) = δ|y(τ_i; τi-1, ψhi-1, ξhi-1, f(·)) - ψ^hi|2V +

∫δ

+ δ| y(τ_i;τi-1.ψhi-1,ξhi-1,f(·)) - ξhi |2H + α

|f(τ)|2U dτ.

2. Скорость сходимости алгоритма. Установим оценку скорости сходимости алгоритма.

В дальнейшем нам понадобится

Лемма [13]. Пусть заданы две функции: t → a(t) ∈ L₂(T ; W^∗) и t → b(t) ∈ W, t ∈ T,

причём b(·) является функцией с ограниченной вариацией. Если верны неравенства

∫



a(τ) dτ

≤ ε,

|b(t)|_W ≤ d, t ∈ T,



W^∗

t₀

то справедлива оценка

∫

〈a(t), b(t)〉_W dτ ≤ ε(var_T b(t) + d).

t₀

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ

1535

Здесь W - банахово пространство с нормой |·|_W , символ var_T b(t) означает полную вариацию

функции b(t) на промежутке T, а символ 〈 · , · 〉_W - двойственность между W^∗ и W.

Теорема 3. Пусть выполнены условия теоремы 2, U = V, B = I (тождественные

оператор) и функция t → u^∗(t) ∈ V является функцией с ограниченной вариацией. Тогда

справедлива следующая оценка скорости сходимости алгоритма:

∫

|u^∗(t) - u^h(t + δ)|2H dt ≤ c{χ1/4(h, δ, α) + hα-1}.

(48)

Доказательство. Учитывая линейность и непрерывность оператора A : V → V^∗, заклю-

чаем, что при всех t ∈ [0, ϑ - δ] имеет место оценка

 ∫



∫



J (u^∗(τ) - u^h(τ + δ)) dτ

= sup

{x(τ) - w^h(τ + δ) - A(x(τ) - w^h(τ + δ))}dτ,v

≤



V∗

|v|_V ≤1

∫

≤ |x(t) - w^h(t + δ)|_V ∗ + |x(0) - w^h(δ)|_V ∗ + |A|L(V ;V ∗₎

|x(τ) - w^h(τ + δ)|_V dτ,

(49)

где | · |_V ∗ - норма в пространстве V^∗, символ J означает оператор канонического вложения

пространства V в пространство V^∗. В свою очередь, в силу теоремы [1, с. 93] при t ∈ [τ_i, τi+1]

верны неравенства

| x(t) - x(τ_i)|_V ∗ ≤ c₁(t - τ_i)1/2,

w^h(t) -w˙^h(τ_i)|_V ∗ ≤ c₂(t - τ_i)1/2.

(50)

Поэтому из (10) в силу (50) вытекает оценка

∫

)1/2

| x(t) - wh(t + δ)|2V ∗ dt

≤ c₃χ1/2(h,δ,α).

Учитывая (2) и (3), заключаем, что при t ∈ [τi-1, τ_i], i = 1, m - 1, справедливо соотношение

| x(t) - wh(t + δ)|2H + c|x(t) - wh(t + δ)|2V ≤ | x(0) -w˙h(δ)|2H +

∫t

+ |A|L(V ;V ∗₎|x(0) - w^h(δ)|2V +

| x(τ) -

w^h(τ + δ)|_V ∗|{|u^∗(τ)|_V + |u^h(τ + δ)|_V }dτ ≤

(∫t

)1/2{(∫τi

)1/2

∫

)1/2}

≤c₄h² +

| x(τ) - wh(τ + δ)|2V ∗ dτ

|u^∗(τ)|2V dτ

|u^h(τ)|2V dτ

(51)

В силу (11) при выполнении условий теоремы 2 имеем

(∫ϑ

)1/2

(∫ϑ

)1/2

|u^∗(τ)|2V dτ

|u^h(τ)|2V dτ

≤ c₅(1 + h1/2α-1/2) ≤ c₆.

(52)

С учётом (52) и (10) из соотношения (51) имеем

| x(t) -

w^h(t + δ)|2H + |x(t) - w^h(t + δ)|2V ≤ c₇χ1/2(h,δ,α).

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022

1536

МАКСИМОВ

Таким образом,

∫

(

∫

)1/2

|x(τ) - w^h(τ + δ)|_V

dτ ≤ ϑ1/2

|x(τ) - w^h(τ + δ)|2V dτ

≤ c₈χ1/4(h,δ,α).

(53)

Далее, объединив (49) и (53), заключаем, что справедливо неравенство

 ∫



J (u^∗(τ) - u^h(τ + δ)) dτ

≤ c₉χ1/4(h,δ,α).

(54)



∗

Воспользовавшись неравенством (11), получим

∫

|u^∗(τ) - u^h(τ + δ)|2H dτ ≤ 2|u^∗(·)|2L

-2

(u^∗(τ), u^h(τ + δ)) dτ + C_∗∗hα-1 =

(T ;H)

ϑ-δ

〈J(u^∗(τ) - u^h(τ + δ)), u^∗(τ)〉 dτ + C_∗∗hα-1.

(55)

В силу леммы 1 из (55) и (54) следует неравенство (48). Теорема доказана.

Работа выполнена при финансовой поддержке Министерства науки и высшего образования

Российской Федерации в рамках реализации программы Уральского математического центра

по соглашению № 075-02-20022-874.

СПИСОК ЛИТЕРАТУРЫ

1. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации. М.,

1999.

2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.

3. Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамической системе // Изв.

АН СССР. Техн. кибернетика. 1983. № 2. С. 51-60.

4. Maksimov V.I. Dynamical Inverse Problems of Distributed Systems. Utrecht, 2002.

5. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Динамические обратные задачи для параболи-

ческих систем // Дифференц. уравнения. 2000. Т. 36. № 5. С. 579-597.

6. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Метод экстремального сдвига Н.Н. Красовского

и задачи граничного управления // Автоматика и телемеханика. 2009. Т. 4. № 5. С. 18-30.

7. Maksimov V.I. Some dynamical inverse problems for hyperbolic systems // Control and Cybern. 1996.

V. 25. P. 465-481.

8. Maksimov V., Pandolfi L. The problem of dynamical reconstruction of Dirichlet boundary control in

semilinear hyperbolic equations // J. of Inverse and Ill-Posed Probl. 2000. V. 8. № 4. P. 399-418.

9. Максимов В.И. О динамическом восстановлении правой части гиперболического уравнения

// Журн. вычислит. математики и мат. физики. 2015. Т. 55. № 6. С. 1008-1019.

10. Максимов В.И. Об одном алгоритме динамического восстановления правой части уравнения с рас-

пределёнными параметрами второго порядка // Журн. вычислит. математики и мат. физики. 2017.

Т. 57. № 8. С. 13-27.

11. Лионс Ж.Л. Оптимальное управление системами, описываемыми уравнениями с частными произ-

водными. М., 1972.

12. Максимов В.И. Об отслеживании траектории динамической системы // Прикл. математика и ме-

ханика. 2011. Т. 75. № 6. С. 951-960.

13. Васильева Е.В., Максимов В.И. О динамической реконструкции неограниченных управлений в

параболическом уравнении // Дифференц. уравнения. 2003. Т. 39. № 1. С. 23-29.

Институт математики и механики

Поступила в редакцию 06.04.2022 г.

имени Н.Н. Красовского УрО РАН,

После доработки 06.04.2022 г.

г. Екатеринбург

Принята к публикации 15.08.2022 г.

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58

№ 11

2022