ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2021, том 57, № 8, с.1146-1150
КРАТКИЕ СООБЩЕНИЯ
УДК 517.977.58
ОБ ОДНОЙ МОДИФИКАЦИИ
МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
© 2021 г. В. И. Максимов
Приводится регуляризирующий алгоритм решения задачи динамического восстановления
неизвестного входа, действующего на нелинейное векторное дифференциальное уравнение.
Алгоритм устойчив к информационным помехам и погрешностям вычислений.
DOI: 10.31857/S037406412108015X
1. Введение. Постановка задачи. Рассматривается задача динамического восстановле-
ния неизвестных входных воздействий (управлений). Предполагается, что система описывает-
ся нелинейным векторным дифференциальным уравнением
x(t) = f(t, x(t), u(t)), t ∈ T = [t0, ϑ], x(t0) = x0,
(1)
где x(t) Rn - фазовый вектор системы, u(t) ∈ P ⊂ Rm - управление, P - компакт, f : T ×
× Rn × P → Rn - векторная функция, непрерывная по t, u и липшицева по x. Эволюция
фазового состояния x(t), t ∈ T, определяется некоторым входом u(·). Этот вход, а также
траектория x(·) системы неизвестны. В дискретные, достаточно частые моменты времени
τi ∈ T, τi < τi+1, измеряются с некоторой ошибкой координаты вектора x(τi). Требуется
восстановить управление u(·), порождающее решение x(·). Так как точное восстановление
управления u(·) невозможно, то необходимо построить алгоритм приближённого вычисле-
ния некоторого приближения к u(·). Это приближение должно быть тем лучше, чем меньше
величина погрешности измерения x(τi) и чем гуще сеткаi}, взятая на промежутке T.
Обсуждаемая задача относится к классу обратных задач динамики управляемых систем.
Один из подходов к решению подобного типа задач развит в работах [1-5]. Здесь мы указываем
только монографии и обзорные статьи. В соответствии с этим подходом задача динамического
восстановления заменяется задачей позиционного управления некоторой специальным обра-
зом подобранной системы, называемой моделью. При этом приближение неизвестного входа
строится с помощью модели. В настоящей работе предложен отличный от известных алгоритм
решения задачи восстановления, основанный на тех же идеях, что и алгоритмы из указанных
выше работ.
2. Алгоритм решения. Рассмотрим разбиение отрезка T на mh - 1 полуинтервалов
δh,i = [τh,ih,i+1) узлами τh,i = t0 +h, 0 i mh, с шагом δh = (ϑ-t0)/mh. Через ξhi обо-
значим результаты измерений состояний x(τi), т.е. векторы, удовлетворяющие неравенствам
|x(τi) - ξhi| h, τi = τh,i, i ∈ [0 : mh - 1],
(2)
где h ∈ (0, 1) - величина погрешности измерения фазового состояния системы (1), а | · | -
евклидова норма в Rn.
В соответствии с подходом [1-5], прежде чем приступить к описанию алгоритма реше-
ния задачи, мы должны указать вспомогательную систему (модель). В данной статье модель
описывается уравнением вида
wh(t) = vh(t), t ∈ T, wh(t0) = ξh0.
(3)
Её решение - абсолютно непрерывная функция wh(·) = wh(· ; t0, wh(t0), vh(·)).
1146
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1147
Заметим, что модель является простейщей дифференциальной системой, в то время как
реальная система нелинейна по фазовым переменным. Обозначим
P (·) = {u(·) ∈ L2(T ; Rn) : u(t) ∈ P при п.в. t ∈ T }.
Пусть sel U(x(·)) - совокупность всех управлений u(·) из P (·), порождающих x(·), т.е.
sel U(x(·)) = {u(·) ∈ P (·) : x(t) = f(t, x(t), u(t)) при п.в. t ∈ T };
в дальнейшем через dist (u(·), sel U(x(·))) обозначаем расстояние между управлением u(·) и
непустым множеством sel U(x(·)) в метрике пространства L2(T ; Rn).
Через v[a,b](·) будем обозначать сужение функции v(t) на отрезок [a, b]. Введём два управ-
ления uh(·) и vh(·). При этом второе управление (управление в модели (3)) будет носить
вспомогательный характер. Оно необходимо для вычисления uh(·). Пусть функции vh[τii+1](·)
и u[τii+1](·) вычисляются в моменты τi = τh,i по правилу
vh(t) = 0, uh(t) = 0 при t ∈ δ0 = [t01),
vh(t) = vhi = vh(τihi-1hi,wh(τi)), uh(t) = uhi = uh(τihi,vhi)
при t ∈ δi = [τi, τi+1), i ∈ [1 : m - 1], m = mh,
где
{
0,
если ρhi 0 или hi| ε,
vhi =
(4)
−ρhi(ahi)-2πi
в противном случае,
uhi = arg min{|f(τihi,v) - vhi| : v ∈ P},
ρhi = -(πhihi), πhi = wh(τi) - ξhi-1, χhi = ξhi - ξhi-1, ahi =hi1/2,
здесь через ( · , · ) обозначено скалярное произведение в Rn.
В дальнейшем нам понадобится следующее
Утверждение [6, с. 69]. Если семейство управлений ũh(·) ∈ P (·) таково, что
ϑ
|f(t, x(t), ũh(t)) - x(t)|2dt → 0 при h → 0,
t0
то имеет место сходимость
dist (ũh(·), sel U(x(·))) 0 при h → 0.
Теорема. Пусть при некотором ε ∈ (0, 1) и всех h ∈ (0, 1) выполняется неравенство
h1δ-1(h) c0 (c0 = const (0,+)). Тогда
dist (uh(·), sel U(x(·))) 0 при h → 0.
Доказательство. Оценим изменение величины εi+1 = |ri+1|2, ri+1 = wh(τi+1) - x(τi),
i ∈ [0 : m - 1]. Имеем неравенство
εi+1 εi + J1,i + J2,i,
(5)
где
( τi
)
τi
2
J1,i = 2
ri,
μ1(τ;vh, x)
,
J2,i =
μ1(τ;vh, x)
,
μ1(τ;vh, x) = vh(τ + δ) - x(τ).
τi-1
τi-1
10 ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1148
МАКСИМОВ
Ввиду (2) верно неравенство
τi
h
-
x(τ)
2h,
(6)
χ
i
≤
τi-1
воспользовавшись которым получим
( τi
)
ρhi - πhi,
x(τ)
+ 2h|πhi |.
τi-1
Отсюда следует, что
ρhi ahi| x(·)|L
(7)
2(δi-1;Rn) +2h|πi|.
Далее, в силу неравенств (6) верна оценка
J1,i J1,i + βh,i.
(8)
Здесь
τi
βh,i = 2h
1(τ; vh, x)| dτ,
τi-1
( τi
)
( τi
)
J1,i = 2
πhi,
μ1(τ;vh, x)
2ρhi + 4h|πhi | + 2 πhi ,
vh(τ + δ)
τi-1
τi-1
Заметим, что при выполнении условия
ρhi > 0
(9)
управление vh(τ), τ ∈ [τi, τi+1), вида (4) обеспечивает выполнение неравенства
τi
ρhi +
(πhi, vh(τ + δ)) 0.
(10)
τi-1
В таком случае при условии (9) из определения (4) и оценки (7) вытекает неравенство
)1/2
|vh(·)|L
(ρhihi|(ahi)-2)2 dt
=
2(δi;Rn)
τi
= ρhi /ahi | x(·)|L
(11)
2(δi-1;Rn) +2h|πi|-1δ-1/2i|=|x(·)|L2(δi-1;Rn)+2-1/2.
Очевидно, неравенства (10) и (11) верны и при ρhi 0.
Рассмотрим величину βh,i. Имеем
βh,i 4h2 + δ{| x(·)|2L
+ |vh(·)|2L
}.
(12)
2(δi-1;Rn)
2(δi;Rn)
Ввиду (11) справедливо неравенство
|vh(·)|2L
2| x(·)|2L
+ 8h2δ-1,
(13)
2(δi;Rn)
2(δi-1;Rn)
учитывая которое в неравенстве (12), получаем
βh,i 4h2 + 3δ| x(·)|2L
+ 8h2δ-1 12h2δ-1 + 3δ| x(·)|2L
(14)
2(δi-1;Rn)
2(δi-1;Rn)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ОБ ОДНОЙ МОДИФИКАЦИИ МЕТОДА ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
1149
Кроме того, в силу (13) имеет место оценка
J2,i 2δ{| x(·)|2L
+ |vh(·)|L
(15)
2(δi-1;Rn)
2(δi;Rn)}4δ|x(·)|L2(δi-1;Rn)+16h2.
Воспользовавшись неравенством (10), устанавливаем оценку
J1,i 4h(h + ε1/2i) 4h2 + 2h + 2i 6h + 2i.
(16)
Объединив (14) и (15), получим
βh,i + J2,i 9δ| x(·)|2L
+ 28h2δ-1.
(17)
2(δi-1;Rn)
Из неравенства (5) вследствие оценок (8), (16) и (17) выводим неравенство
εi+1 (1 + 2h)εi + 9δ| x(·)|2L
+ 6h + 28h2δ-1, i ∈ [0 : m - 1],
2(δi-1;Rn)
учитывая которое, аналогично [7, с. 59-61] устанавливаем, что
εi+1 (|wh(t0 + δ) - x(t0)|2 + 6-1 + 28h2δ-2 + 9δ| x(·)|2L
)×
2(T ;Rn)
× exp{(1 + 2-1)(τi+1 - t0)}, i ∈ [0 : m - 1].
(18)
Далее, при всех t ∈ δi выполняется соотношение
t
2
|wh(t) - x(t)|2 =wh(τi+1) -
vh(s + δ)ds - x(τi) -
x(s)ds
εi+1 +ei.
(19)
t
τi
Здесь
ei = 2|wh(τi+1) - x(τi)|
{| x(τ)| + |vh(τ + δ)|} dτ + 2δ{| x(·)|2L
+ |vh(·)|2L
}
2(δi;Rn)
2(δi+1;Rn)
τi
εi+1 + 4δ{|x(·)|2L
+ |vh(·)|2L
}.
2(δi;Rn)
2(δi+1:Rn)
В таком случае, воспользовавшись неравенством (11), несложно показать, что ei εi+1 + c1δ.
Отсюда и из (18), (19) вытекает оценка
|x(t) - wh(t)|2 c2(-1(1 +-1) + δ), t ∈ T.
(20)
Здесь и ниже cj , j = 1, 2, . . . , - положительные постоянные.
Далее, в силу (11), каково бы ни было λ ∈ (0, +), верно неравенство
|vh(·)|2L
(| x(·)|2L
+ 2-1/2)2 (1 + λ)| x(·)|2L
+ 4h2(λδ)-1.
2(δi+1;Rn)
2(δi;Rn)
2(δi;Rn)
Следовательно,
|vh(·)|2L
(1 + λ)| x(·)|2L
+ 4(ϑ - t0)λ-1(-1)2.
(21)
2(T ;Rn)
2(T ;Rn)
Если λ = hε, h1δ-1(h) c0 при h ∈ (0, 1), то (ϑ - t0)λ-1(-1)2 c2hε и из (21) следует
неравенство
|vh(·)|2L
(1 + hε)| x(·)|2L
+c4hε.
(22)
2(T ;Rn)
2(T ;Rn)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
10
1150
МАКСИМОВ
Воспользовавшись неравенствами (20) и (22), стандартным образом (см., например, [3, с. 24-
26]) устанавливаем сходимость
vh(·) x(·) в L2(T;Rn) при h → 0.
(23)
Через X(·) обозначим пучок решений системы (1), т.е.
X(·) = {x(·) : x(t) = f(t, x(t), u(t)) при п.в. t ∈ T, u(·) ∈ P (·), x(t0) = x0}.
Пусть K = sup{|x| : x ∈ X(t), t ∈ T }, Q = {x ∈ Rn : |x| K + 1}. Нетрудно видеть, что
при п.в. t ∈ T и всех x(·) ∈ X(·) справедливо неравенство | x(t)| c5. Поэтому при п.в. t ∈ δi
и всех i ∈ [0 : m - 1], u ∈ P имеет место оценка
||f(t, x(t), u) - x(t)| - |f(τi, ξhi, u) - vhi|| ω(δ) + L(hi - x(t)| + | x(t) - vhi|)
c6(ω(δ) + h + δ + | x(t) - vh(t)|).
(24)
Здесь ω(δ) = sup{|f(t1, x, u) - f(t2, x, u)| : t1, t2 ∈ T,
|t1 - t2| δ, x ∈ Q, u ∈ P }. Пусть
u(·) sel U(x(·)), L - постоянная Липшица функции x → f(t, ·, u). Положив в (24) u = uh(t),
устанавливаем справедливую при п.в. t ∈ δi и всех i ∈ [0 : m - 1] оценку
|f(t, x(t), uh(t)) - x(t)| |f(τi, ξhi, uh(t)) - vhi| + c6(ω(δ) + h + δ + | x(t) - vhi|).
Отсюда, учитывая правило определения uhi (см. (4)), получаем
|f(t, x(t), uh(t)) - x(t)| |f(τi, ξhi, u(t)) - vhi| + c6(ω(δ) + h + δ + | x(t) - vhi|).
(25)
Пусть в (24) u = u(t), тогда, воспользовавшись равенством
|f(t, x(t), u(t)) - x(t)| = 0 (при п.в. t ∈ T ),
из (24) выводим справедливую при п.в. t ∈ δi оценку
|f(τi, ξhi, u(t)) - vhi| c6(ω(δ) + h + δ + | x(t) - vhi|).
(26)
Учитывая неравенства (25), (26), получаем, что при п.в. t ∈ T верна оценка
|f(t, x(t), uh(t)) - x(t)| 2c6(ω(δ) + h + δ + | x(t) - vh(t)|).
(27)
Справедливость теоремы следует из утверждения, сходимости (23) и неравенства (27). Тео-
рема доказана.
СПИСОК ЛИТЕРАТУРЫ
1. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации. М.,
1999.
2. Osipov Yu.S., Kryazhimskii A.V. Inverse Problems for Ordinary Differential Equations: Dynamical
Solutions. London, 1995.
3. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Методы динамического восстановления входов
управляемых систем. Екатеринбург, 2011.
4. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Некоторые алгоритмы динамического восстанов-
ления входов // Тр. Ин-та математики и механики УрО РАН. 2011. Т. 17. № 1. С. 129-161.
5. Осипов Ю.С., Кряжимский А.В., Максимов И.И. Обратные задачи динамики для параболических
систем // Дифференц. уравнения. 2000. Т. 36. № 5. С. 579-597.
6. Кряжимский А.В. О непрерывности лебеговских множеств в задаче оптимального управления
// Задачи оптимизации и устойчивости в управляемых системах. Свердловск, 1990. С. 54-73.
7. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.
Институт математики и механики
Поступила в редакцию 07.11.2020 г.
им. Н.Н. Красовского УрО РАН,
После доработки 09.03.2021 г.
г. Екатеринбург
Принята к публикации 08.06.2021 г.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021