ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2021, том 57, № 4, с.552-571
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
СИСТЕМОЙ С РАЗРЫВНОЙ ПРАВОЙ ЧАСТЬЮ
© 2021 г. Ю. С. Осипов, В. И. Максимов
На конечном промежутке времени рассматривается управляемая система, описываемая
векторным дифференциальным уравнением с правой частью, изменяющей структуру в
некоторые моменты времени, расстояние между которыми не может быть меньше некото-
рой заданной величины. Между двумя соседними моментами изменения структуры правая
часть является функцией, липшицевой по фазовым переменным, непрерывной по време-
ни и линейной по управлению и возмущению, которые принимают значения в некоторых
выпуклых замкнутых множествах. Предполагается, что в моменты изменения структуры
решение системы может испытывать скачок на некоторый вектор, относительно которого
известно лишь его направление. На промежутке функционирования системы задана равно-
мерная сетка, в узлах которой измеряются (с ошибкой) значения фазового вектора. Реша-
ется задача построения такого алгоритма формирования управления этой системой, кото-
рый обеспечивает перевод в конечный момент времени траектории системы в минимально
возможную окрестность целевого множества. Указывается основанный на конструкциях
теории позиционного управления алгоритм решения, устойчивый к информационным по-
мехам и погрешностям вычислений.
DOI: 10.31857/S0374064121040099
1. Введение. Постановка задачи. Рассматривается задача управления системой диф-
ференциальных уравнений
x(t) = f(t, x(t), x(t), u(t), v(t), V (t)), t ∈ T = [0, ϑ],
(1)
с начальным состоянием
x(0) = x0,
x(0) = y0.
(2)
Здесь ϑ = const (0, +), x ∈ Rn, u ∈ Rq - управление, v(t) Rp и V (t) N - воз-
мущения, N - множество натуральных чисел. Пользуясь терминологией теории позиционных
дифференциальных игр [1], будем говорить, что формированием управления u(·) распоряжа-
ется первый игрок. В свою очередь возмущения v(·) и V (·) формирует второй игрок. Функция
V (t) кусочно-постоянная и имеет вид
V (t) = k при t ∈ [a∗k, a∗k+1), k ∈ [0 : r], a∗k < a∗k+1, a0 = 0, a∗r+1 = ϑ,
где число r ∈ N и моменты времени a∗k находятся в распоряжении второго игрока. Правая
часть системы (1) имеет следующую структуру:
f (t, x, y, u, v, k) = fk(t, x, u, u, v), k ∈ [0 : r].
Таким образом,
f (t, x, y, u, v, V (t)) = fk(t, x, y, u, v) при t ∈ [a∗k, a∗k+1), k ∈ [0 : r].
Систему (1) будем записывать также в виде
x(t) = y(t),
y(t) = f(t, x(t), y(t), u(t), v(t), V (t)).
(3)
Начальное состояние последней:
x(0) = x0, y(0) = y0.
(4)
552
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
553
Суть рассматриваемой задачи такова. Полагаем, что u(t) ∈ P (t) Rq, v(t) ∈ Q(t) Rp,
где P (t) и Q(t) являются выпуклыми ограниченными замкнутыми множествами - “ресурса-
ми” первого и второго игроков соответственно. На промежутке T выбрана равномерная сетка
Δ = i}mi=0, τ0 = 0, τi+1 = τi +δ, τm = ϑ. В узлах сетки τi измеряется (с ошибкой) фазовое
состояние системы (1), (2) (системы (3), (4)), т.е. находятся векторы ψhi и ξhi такие, что
hi - x(τi)|n h,
hi - x(τi)|n h.
(5)
Здесь и ниже h ∈ (0, 1) - величина информационной погрешности, через |x|n обозначается
евклидова норма вектора x. Кроме того, в моменты a∗k, k ∈ [1 : r], происходит изменение
структуры системы (происходит переключение), также меняются и множества P и Q: P (t) =
= Pk, Q(t) = Qk при t ∈ [a∗k,a∗k+1). Считаем, что функции fk, а также множества Pk и Qk
известны первому игроку, в то время как моменты переключения a∗k ему неизвестны. Выбором
этих моментов (т.е. управлением V (t)) распоряжается второй игрок. Будем также считать, что
в моменты a∗k, k ∈ [1 : r], происходят “скачки” фазовых состояний. Именно, если в момент a∗k
должно реализоваться состояние {x(a∗k), y(a∗k-)}, где x(a∗k) = lim
x(t), y(a∗k-) = lim y(t),
t→a∗k-
t→a∗k-
то полагаем
x(a∗k) = x(a∗k+), y(a∗k) = y(a∗k+) = y(a∗k-) + b∗kek,
где векторы ek Rn, |ek|n = 1, и величины b∗k R выбирает второй игрок. При этом считаем
структуру “скачка” частично известной первому игроку. Именно, ему известны векторы ek,
но не известны величины b∗k. В дальнейшем будем называть моменты a∗k моментами скачка.
Функции fk будем предполагать липшицевыми по x, y и непрерывными по t, u, v.
Обсуждаемая в настоящей работе задача, стоящая перед первым игроком, состоит в по-
строении управления u(t) = u(τi, ξhi, ψhi), t ∈ [τi, τi+1), обеспечивающего перевод фазовой
траектории системы (1), (2) на замкнутое множество M ⊂ R2n (в момент ϑ) или “минималь-
но допустимую” его окрестность. Смысл последнего термина будет пояснён ниже.
В случае, когда структура системы неизменна (f = f0 при всех t ∈ T, “скачки” отсут-
ствуют), обсуждаемая задача может быть решена в рамках предложенного в монографии [1]
подхода. Согласно этому подходу необходимо поступить следующим образом. В начальный
момент времени, зная начальное состояние, можно определить наименьшую окрестность (ε-
окрестность, т.е. Mε) целевого множества, в которую первый игрок гарантированно может
перевести фазовый вектор системы в момент ϑ. (Говоря о той или иной окрестности множества
M, мы в дальнейшем понимаем замкнутую окрестность.) Затем можно построить некоторое
семейство u-стабильных множеств Wε(t), t ∈ T, обрывающееся в момент ϑ на множестве
Mε (Wε(ϑ) ⊂ Mε) и такое, что начальное состояние системы находится во множестве Wε(0).
В качестве таких множеств можно взять максимально широкое семейство множеств (семей-
ство множеств позиционного поглощения) или более узкое семейство, например, стабильные
дорожки. После этого организуется процедура позиционного управления заданной системой,
обеспечивающая отслеживание фазовой траекторией этой системы фазовой траектории так
называемого поводыря, который движется по выбранному семейству u-стабильных множеств.
Стратегия (правило выбора) управления, обеспечивающая указанное выше свойство слеже-
ния, называется экстремальной стратегией. Если {x0, y0} ∈ W (0), то, как установлено в [1,
§ 57], экстремальная стратегия решает задачу гарантированного наведения на множество M
в момент ϑ при любой допустимой реализации управления второго игрока.
Будем говорить, что стратегия формирования управления обеспечивает решение задачи
наведения в “минимально допустимую” окрестность множества M, если она определяется
следующим образом. (В дальнейшем такую стратегию назовём стратегией гарантированного
наведения - СГН.) В начальный момент строится семейство u-стабильных множеств W0(t),
t ∈ T, обеспечивающих решение задачи гарантированного наведения системы (3) с правой
частью f = f0 из начального состояния {x0, y0} в наименьшую окрестность множества M.
После этого в качестве СГН на полуинтервале [0, a1) выбираем стратегию экстремального
прицеливания на множества W0(t). В момент a1 в результате применения этой стратегии
и действия некоторого допустимого управления v(·) второго игрока реализуется состояние
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
554
ОСИПОВ, МАКСИМОВ
{x(a1), y(a1-)}. Вследствие скачка и изменения структуры системы, начиная с момента a1
(вплоть до момента a2), система (3) описывает соотношениями
x(t) = y(t),
y(t) = f1(t, x(t), y(t), u(t), v(t))
(6)
с начальным состоянием
x(a1), y(a1) = y(a1+) = y(a1-) + b1e1.
(7)
Для системы (6) с начальным в момент t = a1 состоянием (7) строится система u-стабильных
множеств W1(t), t ∈ [a1, ϑ], обеспечивающих решение задачи гарантированного наведения
в наименьшую окрестность множества M в момент ϑ. В качестве СГН на полуинтервале
[a1, a2) берём стратегию экстремального прицеливания на множества W1(t). Аналогичным
образом СГН определяется на полуинтервалах [a∗k, a∗k+1), k ∈ [2 : r]. Пусть СГН опреде-
лена на полуинтервале [0, a∗k). В момент t = a∗k в результате применения этой стратегии
и действия некоторого допустимого управления v(·) второго игрока реализуется состояние
{x(a∗k), y(a∗k-)}. Вследствие изменения структуры системы и скачка, начиная с момента a∗k
(вплоть до момента a∗k+1), система (3) описывается соотношениями
x(t) = y(t),
y(t) = fk(t, x(t), y(t), u(t), v(t))
(8)
с начальным состоянием
x(a∗k), y(a∗k) = y(a∗k+) = y(a∗k-) + b∗kek.
(9)
Для системы (8) с начальным в момент t = a∗k состоянием (9) строится система u-стабильных
множеств Wk(t), t ∈ [a∗k, ϑ], обеспечивающих решение задачи гарантированного наведения из
состояния {x(a∗k), y(a∗k)} в наименьшую окрестность множества M. В качестве СГН на полу-
интервале [a∗k, a∗k+1) выбираем стратегию экстремального прицеливания на множество Wk(t).
Мы ввели понятие СГН в предположении, что моменты скачков a∗k первому игроку из-
вестны и что ему известны также состояния {x(a∗k), y(a∗k)}. В действительности же это не так.
Именно, как моменты a∗k, так и состояния {x(a∗k), y(a∗k)} вида (9) первому игроку неизвестны
и подлежат определению. Предположим, что при построении СГН вместо моментов скачков
a∗k, а также состояний {x(a∗k),y(a∗k)} берутся их приближённые значения, которые определя-
ются с помощью некоторого алгоритма. Для их вычисления требуется определённое время.
Поэтому при построении СГН вместо неизвестных моментов a∗k скачка естественно использо-
вать другие моменты, немного превосходящие a∗k. Подобная модификация СГН приводит нас
к новой стратегии выбора управления первым игроком, которую мы назовём ε-стратегией
гарантированного наведения (ε-СГН). Цель настоящей работы состоит в построении ε-СГН.
Заметим, что основы теории гарантированного управления в формализации, восходящей
к работам Н.Н. Красовского, заложены в работах [1-7]. Однако в этих работах обсуждались
задачи гарантированного управления для систем с фиксированной правой частью (заданной
структурой). Кроме того, рассматривался случай измерения всех фазовых координат. Случай
измерения части координат исследовался в работах [8-11]. В данной работе изучается задача
наведения для систем с переменной структурой при наличии скачков фазовых состояний.
Заметим, что такого типа скачки появляются, например, в задачах с импульсным управлением.
В настоящей работе для упрощения мы ограничимся случаем линейных по управлениям
функций fk, т.е. положим
fk = f1k(t,x, x) + Bku - Ckv,
где Bk и Ck - постоянные матрицы соответствующих размеров, а в качестве стабильных
множеств возьмём стабильные дорожки. При этом естественно в качестве стратегии экстре-
мального прицеливания выбрать стратегию прицеливания на соответствующие дорожки.
Замечание 1. Если в качестве стабильных множеств берутся максимальные стабильные
мосты, т.е. множества позиционного поглощения, то в качестве стратегии экстремального при-
целивания удобно выбирать стратегию прицеливания на поводыря, движущегося по соответ-
ствующему мосту.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
555
Системы с разрывной правой частью являются частным случаем гибридных систем. К по-
следним относятся системы с переменной структурой [12], а также импульсные системы [13, 14].
Теория управления гибридными системами получила в последние годы бурное развитие [15-
18]. Важным подклассом гибридных систем являются переключаемые системы [19, 20]. К по-
следним можно отнести и системы, рассматриваемые в настоящей работе.
В дальнейшем предполагаем выполненными следующие два условия.
Условие 1. Существуют выпуклые и замкнутые множества Ek Rn, k ∈ [0 : r], такие,
что BkPk = CkQk + Ek.
Здесь BkPk = {Bku : u ∈ Pk}, CkQk = {Ckv : v ∈ Qk}, CkQk + Ek = {u1 + u2 : u1
∈ CkQk,u2 ∈ Ek}.
Условие 2. Заданы числа b > 0, d0 > 0 и d > 0 такие, что
b b∗k при всех k ∈ [1 : r],
d0 a∗k+1 - a∗k при всех k ∈ [1 : r - 1], a1 > d, a∗r < ϑ.
2. Вспомогательные результаты. Рассмотрим задачу построения алгоритма нахожде-
ния точек, а также величин разрывов производной n-мерной функции x(·), заданной с ошиб-
кой. Суть задачи состоит в следующем. Имеется некоторая n-мерная функция x(·), заданная
на конечном промежутке времени T = [0, ϑ]. Промежуток T разбит на конечное число полу-
интервалов
[τi, τi+1), i ∈ [0 : m - 1], τi+1 = τi + δ, τ0 = 0, τm = ϑ.
В моменты времени τi Δ =i}mi=0 измеряются (приближённо) значения x(τi) функции
x(·), т.е. находятся векторы Ξhi Rn со свойствами
|x(τi) - Ξhi|n h.
(10)
Сама функция x(·) неизвестна. Необходимо указать динамический алгоритм вычисления то-
чек, а также величин разрывов производной функции
x(·) на основе неточного измерения
величины x(τi). Такой алгоритм характеризуется двумя свойствами:
а) вычисление точек разрывов (а также соответствующих величин разрывов) производ-
ной функции x(·), меньших текущего значения t, производится по результатам измерения
состояния x(τ) в моменты τ, предшествующие t;
б) только после вычисления точек и величин разрывов функции
x(·) на промежутке 0
τt возможно использование новой информации для их вычислений в следующие моменты
времени (при τ > t).
Для решений указанной задачи воспользуемся методом позиционного управления с моде-
лью, развитым в работах [1-4, 6-12]. В соответствии с этим методом рассматриваемая задача
заменяется другой задачей, а именно, задачей управления по принципу обратной связи неко-
торой системой. Эту систему в дальнейшем называем моделью.
Рассмотрим случай, когда x(·) - кусочно-непрерывная функция. Именно, пусть {ak}rk=1 -
точки (неизвестные) разрывов функции
x(·), упорядоченные по возрастанию, т.е. ak+1 > ak.
Для определённости считаем, что в этих точках функция x(·) непрерывна справа:
x(ak) = x(ak+) = lim
x(t).
t→ak
t>ak
Через bk обозначим (неизвестные) величины разрывов, т.е.
bk = | x(ak+) - x(ak-)|n,
x(ak-) = lim
x(t).
t→ak
t<ak
Пусть заданы три числа b > 0, d0 > 0 и d > 0 и известно, что
b bk при всех k ∈ [1 : r],
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
556
ОСИПОВ, МАКСИМОВ
d0 ak+1 - ak при всех k ∈ [1 : r - 1], a1 > d0 ar < ϑ,
| x(t)|n d при п.в. t ∈ T.
(Значение r может быть неизвестно.) Предположим также, что функция
x(·) непрерывно-
дифференцируема всюду, за исключением точек {ak}rk=1, причём известно число F > 0 та-
кое, что
|x(t)|n F
во всех точках дифференцируемости функции x(·).
Фиксируем семейство разбиений отрезка T :
,
τh,0 = 0, τh,m3
= ϑ, τh,i+1 = τh,i + δ(h),
Δh =h,i}
=0
h
где δ(h) = ϑm-3h, mh N.
Зафиксируем некоторую функцию α = α(h) : (0, 1) (0, 1). Введём управляемую систе-
му (модель), описываемую векторным дифференциальным уравнением (w ∈ Rn, uh Rn)
следующего вида:
w(t) = uh(t)
(11)
(система M) с управлением uh(t). Пусть
1
uh(t) = -
[wh(τi) - Ξhi] при t ∈ δi [τi, τi+1), τi = τh,i, i ∈ [0 : m3h - 1],
(12)
α
где α = α(h). В уравнении (11) управление uh(t) зададим согласно (12). Таким образом,
управление uh(·) в системе (11) будет находиться по принципу обратной связи
uh(t) = uh(τi;wh(τi),Ξhi), t ∈ δi.
В этом случае система (11) примет вид
1
wh(t) = -
[wh(τi) - Ξhi] при п.в. t ∈ δi, i ∈ [0 : m3h - 1].
(13)
α
Её начальное состояние
wh(0) = Ξh0.
Введём обозначение
μ(t) = max
|wh(τ) - x(τ)|n.
(14)
0τt
Через Ξ(x(·), h) обозначим множество допустимых результатов измерений, т.е. множество всех
кусочно-постоянных функций Ξh(·) : T → Rn следующей структуры:
Ξh(t) = Ξhi при t ∈ [τii+1), τi = τh,i, i ∈ [0 : m3h - 1],
удовлетворяющих неравенствам (10).
Введём
Условие 3. Имеют место соотношения
h + δ(h)
δ(h) 0, α(h) 0,
0
при h → 0.
α(h)
Учитывая это условие, можно утверждать, что найдётся h (0, 1), для которого при
любом h ∈ (0, h) справедливы включения
α(h) (0, 1), δ(h) (0, 1), h/α(h) (0, 1), δ(h)(h) (0, 1/2).
(15)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
557
Лемма 1. Пусть ˙x(·) ∈ L(T ; Rn),
|x(t)|n d при п.в. t ∈ T, μ(a) q для некото-
рого a ∈ T и выполнено условие 3. Тогда при всех h ∈ (0,h), Ξh(·) Ξ(x(·),h), τi+1 > a
справедливы неравенства
μ(t) 2q + (2 + 3d)(α + δ), t ∈ [a, ϑ],
(16)
)1/2
wh(s)|2n ds
2(4 + 4.5d)δ1/2 + 2
2δ1/2α-1q,
(17)
τi
где
τi = τi, если τi a, и
τi = a, если τi < a.
Доказательство. Воспользовавшись равенством (13), заключаем, что справедливы соот-
ношения
d
1
[wh(t) - x(t)] = -
[wh(τi) - Ξhi] - x(t) =
dt
α
1
=-
[wh(t) - x(t)] + Ψ(1)h(t) при п.в. t ∈ δi = [τi, τi+1), i ∈ [0 : m3h - 1],
(18)
α
где
Ψ(1)h(t) = Ψh(t) +1[wh(t) - wh(τi)],
α
1
Ψh(t) = -
[x(t) - Ξhi] - x(t) при п.в. t ∈ δi.
α
В силу включений (15) верны неравенства-1 1 и δα-1 1/2 при h ∈ (0, h). В таком
случае семейство функций Ψh(·) (равномерно по всем h ∈ (0, h)) ограничено:
1
|Ψh(t)|n
(h + |x(t) - x(τi)|n) + | x(t)|n
α
h
1
+
| x(τ)|n + | x(t)|n 1 + 1,5d при п.в. t ∈ δi.
(19)
α
α
τi
Из представления (18) следует равенство
t
wh(t) - x(t) = wh(a) - x(a) + e-(t-s)Ψ(1)h(s)ds, t ∈ [a,ϑ].
(20)
a
Далее, верны оценки (см. (13), (14))
1
1
1
wh(s)|n ds
wh(τi) - Ξhi]
s
d
α
α
α[
n
τi
τi
δ
(μ(τi) + h), μ(τi) μ(τi+1), i ∈ [0 : m3h - 1].
(21)
α2
Заметим, что имеет место неравенство
|Ψ(1)h(t)|n |Ψh(t)|n +1
wh(s)|n ds при t ∈ δi.
(22)
α
τi
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
558
ОСИПОВ, МАКСИМОВ
Учитывая соотношения (20)-(22), получаем
(
)∫ t
t
δ
δh
μ(t) q +
μ(τi) +
e-(t-s) ds + e-(t-s)|Ψh(s)|n ds,
(23)
α2
α2
a
a
t ∈ [τii+1], τi+1 > a.
Нетрудно видеть, что верно неравенство
t
e-(t-s) ds α(1 - e-(t-a)) α.
(24)
a
Воспользовавшись неравенствами (19) и (24), будем иметь
t
(∫t
)
e-(t-s)|Ψh(s)|n ds (1 + 1.5d)
e-(t-s) ds
αK1,
(25)
a
a
где K1 = 1+1, 5d. В свою очередь, из (23) и (25), считая в (23) t = τi и учитывая неравенство
(24), а также неравенство μ(τ) μ(τi) при τ ∈ [0, τi], выводим оценку
(
)
(
)
δ
δh
δh
1-
μ(τi) q +
+ αK1 q + K1 α +
,
α
α
α
из которой в силу неравенств 1 - δ/α 1/2 и-1(h) 1 (см. (15)) следует, что
(
)
δh
μ(τi) 2q + 2K1 α +
2q + 2K1(α + δ).
(26)
α
Далее, имеем
μ(τi) μ(τi).
(27)
Учитывая (23) и (25), получаем
δh
δ
μ(t) q +
+
μ(τi) + αK1.
α
α
Значит, вследствие (26) и (24) справедливо неравенство
δh
δ
δ
μ(t) q +
+2
q+2
K1(α + δ) + αK1,
α
α
α
из которого вытекает неравенство (16).
Проверим справедливость неравенства (17). Имеем
1
|uh(t)|n
|wh(τi) - Ξhi|n при п.в. t ∈ δi.
α
Поэтому, учитывая (15), (26), (27), получаем
(
)
1
h
q
δ
q
|uh(t)|n
(μ(τi) + h)
+2
+ 2K1
1+
2
+ (4 + 4.5d) при п.в. t ∈ δi.
(28)
α
α
α
α
α
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
559
Из (28) выводим неравенство
q2
wh(s)|2nds
wh(s)|2n ds =
|vh(s)|2n ds 8
δ + 2(4 + 4.5d)2δ,
α2
τi
τi
τi
из которого следует неравенство (17). Лемма доказана.
Символом W1,∞([a, b]; Rn) обозначим пространство дифференцируемых n-мерных функ-
ций, производные которых являются элементами пространства L([a, b]; Rn).
Лемма 2. Пусть выполнены условия леммы 1. Если
x(·) ∈ W1,∞([a,ϑ];Rn), a ∈ [0),
то при t ∈ [a,ϑ] имеет место следующее неравенство:
)
(h
δ
α
δq
|uh(t) - x(t)|n Ψ
,
, α,
,
α
α
t-a
α2
α
d + c1α(h) + c2(h + δ(h))α-1(h) + c3δ(h)-2(h),
t-a
где c1 = F,
c2 = 2
2(4 + 4.5d) + 2 max{1, d},
c3 = 4
2, vrai max |x(t)|n F,
| x(t)|n d при
t∈[a,ϑ]
п.в. t ∈ [a,ϑ].
Доказательство. Учитывая представление (20), приходим к равенству
t
d
α-1[wh(t) - x(t)] - α-1[wh(a) - x(a)] =
(ϱα(t - s))Ψ(1)h(s) ds =
ds
a
t
t
d
d
=-
(ϱα(t - s)) x(s) ds +
(ϱα(t - s))γ(j)δ(s) ds, t ∈ [a, ϑ],
(29)
ds
ds
a
j=1 a
где
ϱα(t) = exp(-1t), γ(1)δ(s) = α-1[wh(s) - wh(τi)],
γ(2)δ(s) =-1[x(s) - Ξhi] при п.в. s ∈ [τii+1].
В силу леммы 1 (см. (17)) верны соотношения
s
)1/2
δ1/2
(1)δ(s)|n1
wh(s)|n ds
wh(s)|2n ds
α
α
τi
τi
}
1/2
{
δ
δ1/2
δ
δ
2(4 + 4.5d)δ1/2 + 2
2
q
=
2(4 + 4.5d)
+2
2
q, s ∈ [τii+1].
(30)
α
α
α
α2
Воспользовавшись условием (10), а также неравенством | x(t)|n d, будем иметь
(2)δ(s)|n c0(δ + h)α-1, s ∈ [a, ϑ],
(31)
где c0 = max{1, d}. В таком случае из (30) и (31), учитывая неравенство (24), выводим оценку
t
 ∑
d
δ
ϱα(t - s)γ(j)δ(s)ds
ϱ(h, α, δ) + 2
2
q,
(32)
ds
α2
n
j=1 a
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
560
ОСИПОВ, МАКСИМОВ
где ϱ(h, α, δ) = c1(δ + h)/α, c1 =
2(4 + 4.5d) + c0. Интегрируя по частям первое слагаемое в
правой части равенства (29), получаем
t
(
)
t
d
-
ϱα(t - s)
x(s) ds = ϱα(t - a) x(a) - x(t) + ϱα(t - s)x(s) ds, t ∈ [a, ϑ].
(33)
ds
a
a
В свою очередь с учётом соотношений (32), (33) из равенства (29) следует, что
1
1
δ
[wh(t) - x(t)] +
[wh(a) - x(a)] - x(t)
2
2
q+
-
α
α
α2
n
t
+ ϱ(h, α, δ) +α(t - a) x(a)|n + e-(t-s)|x(s)|n ds.
(34)
a
Поскольку имеют место неравенства
α
α(t - a) x(a)|n = e-(t-a)| x(a)|n
| x(a)|n, t ∈ [a,ϑ],
t-a
t
e-(t-s)|x(s)|n ds αF,
(35)
a
то из них и неравенства (34) вытекает, что
1
1
δ
α
[wh(t) - x(t)] +
[wh(a) - x(a)] - x(t)
2
2
q + ϱ(h,α,δ) + αF +
| x(a)|n.
-
α
α
α2
t-a
n
Кроме того, в силу (10), (30) имеем при t ∈ [τi, τi+1] оценку
{∫t
t
}
1
-1{[wh(t) - x(t)] - [wh(τi) - Ξhi]}|n
wh(s)|n ds + h +
| x(s)|n ds
α
τi
τi
)
(
q
(h +)α-1 + δα-1
2(4 + 4.5d) + 2
2
(36)
α
Ввиду ограниченности второй производной x(·)
(|x(t)|n F при п.в. t ∈ [a, ϑ]) из (34)-(36)
вытекает (при t ∈ δi) неравенство
1
1
δ
wh(τi) - Ξhi] +
[wh(a) - x(a)] - x(t)
4
2
q+
α[
α
α2
n
h
δ
α
+
+ ϱ(h, δ, α) + (d +
2(4 + 4.5d))
++
| x(a)|n,
α
α
t-a
из которого и следует справедливость леммы. Лемма доказана.
Введём функции α = α(h), γ = γ(h) и N = N(h) следующим образом:
ϑ
d0
γ(h)
α(h) = δ2/3(h), γ(h) = δ(h)m2h =
<
,
N (h) =
=m2h.
mh
2
δ(h)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
561
Здесь δ(h) - шаг разбиения Δh, т.е δ(h) = ϑm-3h, mh = [(ϑ/h)1/3], через [a] обозначает-
ся целая часть числа a. Заметим, что при таком выборе величин α, δ и γ выполняются
соотношенния
1/3
h
δ(h)
ϑ2/3α(h)
ϑ
h δ(h),
=
=
0
при h → 0.
(37)
α(h)
α(h)
γ(h)
mh
Пусть δ(1 + N) < ϑ - ar,
)
)
(h
δ
α
δh
(h
δ
α
δ(2h + (2 + 3d)(α + δ))
χ1(α,δ,h) = F(δ + γ) + Ψ
,
, α,
,
,
, α,
,
,
α
α
d0
α2
α
α
γ
α2
)
(h
δ
3α
δ(2h + (2 + 3d)(α + δ))
χ(α, δ, h) = F (δ + γ) + Ψ
,
, α,
,
+
α
α
d0
α2
)
(h
δ
α
δ(4h + (6 + 9d)(α + δ))
,
, α,
,
(38)
α
α
γ
α2
В силу соотношений (37) можно указать число h1 (0, h) такое, что при всех h ∈ (0, h)
верны неравенства
δ(h) = ϑm-3h d0/4, χ1(α(h), δ(h), h) b/2, χ(α(h), δ(h), h) b/2.
(39)
Число h определено выше. (Мы считаем выполненным условие 3.)
Опишем алгоритм решения рассматриваемой в настоящем пункте задачи. В качестве мо-
дели рассмотрим систему вида (11) с начальным состоянием wh(0) = Ξh0. Управление uh(·) в
модели будем вычислять по правилу (12). До начала работы алгоритма фиксируем величину
h ∈ (0,h1) и разбиение Δh с диаметром δ = δ(h) = ϑm-3h. Сначала определим полуинтервал,
на котором находится первая точка разрыва. Для этого в каждый момент τi d0 вычисляем
величину
νi = |uh(τi-N-1) - uh(τi)|n.
Лемма 3. Пусть при некотором i ∈ [1 : m3h - 1] таком, что τi > d0, первый раз выпол-
няется неравенство
νi > b/2,
(40)
т.е. при всех j i - 1, d0 τj справедливы неравенства νj b/2. Тогда первая точка
разрыва a1 находится на полуинтервале γi = (τi-N-1, τi-N ]. Причём величина разрыва b1
такова, что
|b1 - νi| χ1(α, δ, h).
(41)
Пусть вычислены k
(1 k) полуинтервалов, которым принадлежат первые k точек
разрыва, т.е. aj (τij -1, τij ], j ∈ [1 : k], τij +1 < τij+1-1. Последнее неравенство следует из
оценки δ(h) d0/4. В каждый момент τi τik + d0 вычисляем величину νi.
Лемма 4. Пусть при некотором i таком, что τi > τik + d0, первый раз выполняет-
ся неравенство (40), т.е. при всех j i - 1, τik-1 + d0 τj имеют место неравенства
νj b/2. Тогда (k + 1)-я точка разрыва функции x(·) лежит на полуинтервале γi. Причём
для величины bk+1 разрыва справедливо неравенство
|bk+1 - νi| χ(α, δ, h).
Если известно число (r) точек разрыва, то после вычисления величины ar, т.е. нахож-
дения полуинтервала γi такого, что ar ∈ γi, работа алгоритма заканчивается. Если число
r неизвестно, то работа алгоритма осуществляется до момента ϑ. При этом в силу условия
δ(1 + N) < ϑ - ar последняя точка разрыва (ar) будет определена.
9
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
562
ОСИПОВ, МАКСИМОВ
Доказательство леммы 3. Пусть τi1 = τi1(h) Δh, a1 (τi1-1i1].Наотрезке[0i1-1]
функция x(·) непрерывна. Значит
x(·) ∈ W1,∞([0, τi1-1]; Rn)). Поэтому в силу леммы 2 верно
неравенство
)
(h
δ
α
δh
|uh(τi1-1) - x(τi1-1)|n Ψ
,
, α,
,
(42)
α
α
d0
α2
Кроме того, учитывая, что |x(t)|n F при п.в. t ∈ T, имеем
| x(a1-) - x(τi1-1)|n F(a1 - τi1-1) и
|x(a1+) - x(τi1 )|n F(τi1 - a1).
(43)
В свою очередь из неравенств (43) следует, что
|| x(τi1 ) - x(τi1-1)|n - b1| F δ,
(44)
где b1 = |x(a1+) - x(a1-)|n. Воспользовавшись леммой 1, а также неравенством |x(0) -
- wh(0)|n h, устанавливаем оценку
μ(τi1 ) 2h + (2 + 3d)(α + δ).
(45)
Так как γ = m2hδ 0.5d0, то x(·) ∈ W1,∞([τi1 , τi1+N ]; Rn). Поэтому в силу леммы 2, учитывая
оценку (45), имеем неравенство
)
(h
δ
α
δ(2h + (2 + 3d)(α + δ))
|uh(τi1+N ) - x(τi1+N )|n Ψ
,
, α,
,
(46)
α
α
γ
α2
Кроме того, в силу равенства N(h)δ(h) = γ(h) справедлива оценка
| x(τi1+N) - x(τi1 )|n Fγ,
(47)
при выводе которой мы воспользовались непрерывностью функции x(·) на отрезке [τi1 , τi1+N ],
вытекающей из неравенства 2γ d0. Из (46), (47) выводим неравенство
)
(h
δ
α
δ(2h + (2 + 3d)(α + δ))
|uh(τi1+N ) - x(τi1 )|n F γ + Ψ
,
, α,
,
(48)
α
α
γ
α2
В свою очередь из неравенств (42) и (44) следует, что
)
(h
δ
α
δh
||uh(τi1-1) - x(τi1 )|n - b1| F δ + Ψ
,
, α,
,
(49)
α
α
d0
α2
Объединяя неравенства (48) и (49), получаем ||uh(τi1+N ) - uh(τi1-1)|n - b1| χ1(α, δ, h).
Таким образом, считая i = i1 + N, будем иметь |b1 - |uh(τi) - uh(τi-N-1)|n| χ1(α, δ, h), т.е.
0.5b b1 - χ1(α, δ, h) νi b1 + χ1(α, δ, h). Неравенство (41) установлено.
Заметим, что если бы функция x(·) была непрерывной на полуинтервале (τi1-1, τi1 ], то в
силу (42), (46), (47) и непрерывности справа функции x(·) в точках разрыва выполнялось бы
следующее неравенство:
νi1+N ≡ |uh(τi1+N) - uh(τi1-1)|n |uh(τi1+N) - x(τi1+N)|n +
+ |x(τi1+N) - x(τi1)|n + |x(τi-1) - x(τi)|n + |uh(τi1-1) - x(τi1-1)|nχ1(α,δ,h) 0.5b,
(50)
так как τi1+N - τi1-1 = γ + δ < d0.
Неравенства (50) будут также справедливы, если мы заменим i1 + N на любое значение
i ∈ [i1 : i1 + N - 1], где i1 = [d0(h)] +1. Значит, при всех таких i имеют место неравенства
νi 0.5b. Лемма 3 доказана.
Доказательство леммы 4 проводится по схеме доказательства леммы 3.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
563
Пусть вычислены k полуинтервалов, которым принадлежат первые k точек разрыва, т.е.
aj (τij-1ij ], j ∈ [1 : k], τij+1 < τij+1. Тогда ak+1 (τik+1-1ik+1]. На отрезке [τik+1ik+1-1]
функция
x(·) непрерывна. Кроме того, τik+1-1 - τik+1 0.5d0, поскольку 2δ(h) 0.5d0 и
ak+1 - ak d0.
Поэтому в силу лемм 1 и 2 верно неравенство
)
(h
δ
3α
δ(2h + (2 + 3d)(α + δ))
|uh(τi
,
, α,
,
,
(51)
k+1-1)-x(τik+1-1)|nΨ
α
α
d0
α2
так как τik+1-1 > ak + d0/3, а на отрезке [ak, ak - δ] функция x(·) непрерывна. Кроме того,
верны неравенства
|x(ak+1-) - x(τik+1-1)|n F(ak+1 - τik+1-1) и
|x(ak+1+) - x(τik+1)|n F(τik+1 - ak+1),
учитывая которые, получаем
|| x(τik+1 ) - x(τik+1-1)|n - bk+1| F δ,
(52)
где bk+1 = | x(ak+1+) - x(ak+1-)|n.
Заметим, что (см. лемму 1) μ(τik ) 2h + (2 + 3d)(α + δ). Поэтому
μ(τik+1 ) 2μ(τik ) + (2 + 3d)(α + δ) 4h + (6 + 9d)(α + δ).
(53)
В силу леммы 2 (считаем a = τik+1, q = 4h + (6 + 9d)(α + δ)) и неравенства (53) имеем
)
(h
δ
α
δ(4h + (6 + 9d)(α + δ))
|uh(τi
,
, α,
,
(54)
k+1+N)-x(τik+1+N)|nΨ
α
α
γ
α2
Кроме того, справедлива оценка
| x(τik+1+N) - x(τik+1 )|n Fγ,
(55)
так как τik+1+N < ak+2. Из (54), (55) выводим неравенство
)
(h
δ
α
δ(4h + (6 + 9d)(α + δ))
|uh(τi
,
, α,
,
(56)
k+1+N)-x(τik+1)|n
α
α
γ
α2
В свою очередь из (51), (52) следует, что
)
(h
δ
α
δ(2h + (2 + 3d)(α + δ))
||uh(τi
,
, α,
,
(57)
k+1-1)-x(τik+1)|n-bk+1|
α
α
d0
α2
Объединив неравенства (56), (57), получаем
||uh(τi
k+1+N)-uh(τik+1-1)|n - bk+1| χ(α,δ,h).
Таким образом, считая i = ik+1 + N, будем иметь
|bk+1 - |uh(τi) - uh(τi-N-1)|n| χ(α, δ, h),
т.е.
0.5b bk+1 - χ(α, δ, h) νi bk+1 + χ(α, δ, h).
Заметим, что если бы функция x(·) была непрерывной на полуинтервале (τik+1-1, τik ], то
в силу (51), (54), (55) выполнялось бы неравенство
νik+1+N ≡ |uh(τik+1+N) - uh(τik+1-1)|n |uh(τik+1+N ) - x(τik+1+N)|n + | x(τik+1+N ) - x(τik+1)|n +
+ |x(τik+1) - x(τik+1-1)|n + |uh(τik+1-1) - x(τik+1-1)|nχ(α,δ,h) 0.5b.
(58)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
9
564
ОСИПОВ, МАКСИМОВ
Неравенства (58) будут также справедливы, если мы заменим ik+1 + N на любое значение
i ∈ [i∗k : ik+1 + N - 1], где i∗k = ik + [d0(h)]. Следовательно, при всех таких i будут верны
неравенства νi 0.5b. Лемма 4 доказана.
3. Алгоритм решения. Пусть при всех возможных действиях первого и второго игроков
система (1), (2) остаётся в области
|f(t, x, y, u, v, V )|n F,
|y|n d.
(59)
Перейдём к описанию алгоритма решения рассматриваемой задачи. Фиксируем семейство
разбиений отрезка T :
,
τh,0 = 0, τh,m3
= ϑ, τh,i+1 = τh,i + δ(h),
Δh =h,i}
=0
h
где δ(h) = ϑm-3h, mh N, mh = [(ϑ/h)1/3] (величина h ∈ (0, 1) определена в неравен-
ствах (5)), а также функции χ1(α, δ, h), χ(α, δ, h) (см. определения (38), в которых вместо d0
следует взять d0) и
)
(h
δ
Ψ
,
, α, e(1), e(2)
≡ e(1)d + c1α(h) + c2(h + δ(h))α-1(h) + c3e(2).
α
α
Здесь c1 = F,
c2 = 2
2(4 + 4.5d) + 2 max{1, d},
c3 = 4
2.
Введём функции α = α(h), γ = γ(h) и N = N(h) следующим образом:
ϑ
d0
γ(h)
α(h) = δ2/3(h), γ(h) = δ(h)m2h =
,
N (h) =
=m2h.
mh
2
δ(h)
Рассмотрим систему
wh(t) = vh(t), t ∈ T (wh,vh Rn),
(60)
с начальным состоянием wh(0) = ξh0.
Фиксируем величину погрешности измерения h ∈ (0, h1). Здесь h1 (0, h) таково, что
при h ∈ (0, h1) имеют место неравенства δ(h) d0/4, а также неравенства (39). Вместе с
отрезка T. Рассмотрим систему
величиной h мы фиксируем разбиение Δh =i,h}
=0
x(t) = y(t),
y(t) = f0(t, x(t), y(t)) + ũ(t), t ∈ T,
(61)
с начальным состоянием
x(0) = ξh0, y(0) = ψh0
(62)
и управлением ũ(·) ∈ {u(·) ∈ L2(T;Rn) : u(t) ∈ E0 при п.в. t ∈ T}. Решаем задачу оптималь-
ного программного управления, состоящую в переводе фазовой траектории системы (61), (62)
в момент ϑ в минимальную окрестность множества M. Пусть u0(·) - оптимальное управле-
ние, решающее эту задачу, Mε0 - соответствующая замкнутая ε0-окрестность множества M.
В частности, если разрешима задача о переводе траектории в момент ϑ на множество M, то
полагаем ε0 = 0. В качестве семейства стабильных множеств W0(t), t ∈ T, берём решение
системы (61), (62) при
ũ(t) = u0(t), t ∈ T. Обозначим его {x0(t), y0(t)}. Таким образом,
W0(t) = {x0(t),y0(t)}. На полуинтервале δ0 = [01) на систему (1) подаём постоянное уп-
равление
u(t) = u0,
где u0 - произвольный элемент множества P0. Под действием этого управления и неизвестно-
го возмущения v(t) ∈ Q0, t ∈ δ0, (V (t) = 0) реализуется траектория {xp(t), yp(t)}, t ∈ [0, τ1],
системы (1). На промежутках δi = [τi, τi+1), i > 0, поступаем следующим образом. В моменты
t = τi зададим векторы ui и vhi согласно правилам
(ψhi - y0(τi), B0ui) = min{(ψhi - y0(τi), B0u) : u ∈ P0},
hi - yp(τi)|n h,
(63)
vhi =-1[wh(τi) - ξhi],
hi - xp(τi)|n h.
(64)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
565
После этого в (1) и (60) полагаем
u(t) = ui, vh(t) = vhi, t ∈ [τi, τi+1).
(65)
Затем вычисляем траектории {xp(·), yp(·)} (системы (1), (2)) и wh(·) (системы (61), (62)) на
промежутке [τi, τi+1]. Теперь определим полуинтервал, на котором находится первая точка
разрыва. Для этого в каждый момент τi d0 вычисляем величину νi = |vh(τi-N-1)-vh(τi)|n.
Пусть при некотором i ∈ [1 : m3h - 1] таком, что τi > d0, первый раз выполняется неравенство
νi > b/2,
(66)
т.е. при всех j i - 1, d0 τj имеют место неравенства
νj
b/2. Обозначим момент,
соответствующий этому i символом τi1+N . Тогда первая точка скачка a1 находится на по-
луинтервале (τi1-1, τi1 ]. Причём величина разрыва b1 такова, что
|b1 - νi1+N | χ1(α, δ, h).
Теперь определим полуинтервал, на котором находится вторая точка скачка. В момент
τi1+N рассмотрим систему
x(t) = y(t),
y(t) = f1k(t, x(t), y(t)) + ũ(t), t ∈ [τi1+N , ϑ],
(67)
с начальным состоянием
x(τi1+N ) = x0(τi1-1), y(τi1+N +) = y0(τi1-1) + νi1+N e1
(68)
и управлением ũ(·) ∈ {u(·) ∈ L2(T;Rn) : u(t) ∈ E1 при п.в. t ∈ [τi1+N]}. Решаем задачу оп-
тимального управления, состоящую в переводе фазовой траектории системы (67) с начальным
состоянием (68) в момент ϑ в минимальную окрестность множества M. Пусть u1(·) - опти-
мальное управление, решающее эту задачу, Mε1 - соответствующая замкнутая ε1-окрестность
множества M. В частности, если разрешима задача о переводе траектории на множество M,
то полагаем ε1 = 0. В качестве семейства стабильных множеств W1(t), t ∈ [τi1+N , ϑ], берём
решение системы (67) при ũ(t) = u1(t), t ∈ T. Обозначим его, как и выше, через {x0(t), y0(t)}.
Таким образом, W1(t) = {x0(t), y0(t)}. На промежутках δi = [τi, τi+1), i i1 + N, поступаем
следующим образом. В моменты t = τi зададим векторы ui и vhi согласно формулам (63),
(64), в которых B0 и P0 заменены на B1 и P1 соответственно. Затем управления u(t) в
системе (1) и vh(t) в системе (60) задаём по формуле (65). После формирования указанных
выше управлений вычисляем траектории {xp(·), yp(·)} (системы (1)) и wh(·) (системы (60))
на промежутке [τi, τi+1]. Пусть при некотором i ∈ [i1 +N +1 : m3h -1] первый раз выполняется
неравенство (66), т.е. при всех j i - 1, τi1-1 + d0 τj имеют место неравенства νj b/2.
Обозначим момент, соответствующий этому i, символом τi2+N . Тогда вторая точка скачка a2
лежит на полуинтервале (τi2-1, τi2 ]. Причём величина b2 разрыва удовлетворяет неравенству
|b2 - νi2+N | χ(α, δ, h).
Аналогичные действия осуществляются и при t ∈ [τik+N , ϑ]. Именно, в момент τik+N ,
k 2, рассматривается система
x(t) = y(t),
y(t) = f1k(t, x(t), y(t)) + ũ(t), t ∈ [τik+N , ϑ],
(69)
с начальным состоянием
x(τik +N ) = x0(τik-1), y(τik+N +) = y0(τik-1) + νik+N ek
(70)
и управлением
ũ(·) ∈ {u(·) ∈ L2(T ; Rn) : u(t) ∈ Ek при п.в. t ∈ [τik+N , ϑ]}. Решаем задачу
оптимального управления, состоящую в переводе фазовой траектории системы (69) с началь-
ным состоянием (70) в момент ϑ в минимальную окрестность множества M. Пусть uk(·) -
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
566
ОСИПОВ, МАКСИМОВ
оптимальное управление, решающее эту задачу, Mεk - соответствующая замкнутая εk -окрест-
ность множества M. В частности, если разрешима задача о переводе траектории в момент
ϑ на множество M, то полагаем εk = 0. В качестве семейства стабильных множеств Wk(t),
t ∈ [τik+N], берём решение системы (69) при ũ(t) = uk(t), t ∈ [τik+N , ϑ]. Обозначаем его
через {x0(t), y0(t)}. Таким образом, Wk(t) = {x0(t), y0(t)}. На промежутках δi = [τi, τi+1),
i ik + N, поступаем следующим образом. В моменты t = τi зададим векторы ui и vhi
согласно формулам (63), (64), в которых B0 и P0 заменены на Bk и Pk соответственно.
Управления u(t) в системе (1) и vh(t) в системе (60) задаём по формуле (64). После фор-
мирования указанных выше управлений вычисляем траектории {xp(·), yp(·)} (системы (1)) и
wh(·) (системы (60)) на промежутке [τii+1].
Пусть при некотором i ∈ [ik + N + 1 : m3h - 1] первый раз выполняется неравенство (66),
т.е. при всех j i - 1, τik-1 + d0 τj имеют место неравенства
νj
b/2. Обозначим
момент, соответствующий этому i, через τik+1+N . Тогда k + 1-я точка скачка ak+1 лежит на
полуинтервале (τik+1-1, τik+1 ]. Причём величина bk+1 разрыва такова, что
|b∗k+1 - νi
k+1+N |χ(α,δ,h).
Итак, в ходе работы алгоритма устанавливается, что a∗k (τik -1, τik ], k ∈ [1 : r].
Таким образом, ε-СГН определяется как стратегия экстремального прицеливания (см.
(63)) на стабильную дорожку следующего вида:
W0(t), t ∈ [0i1+N),
W (t) =
Wk(t), t ∈ [τik+Nik+1+N), k ∈ [1 : r - 1],
Wr(t), t ∈ [τir+N].
Этот факт следует из приведённой ниже теоремы.
r
δ(k)
[0, τ1), ρ(h) = ϑ(m-1h + m-3h). Заметим, что
Пусть δ(k) = [τik-1, τik+N ), Δ(r) =
k=1
τik+N - τik-1 = ρ(h). Поэтому мера Лебега множества Δ(r) равна(h) + δ(h).
Теорема. Для любого γ > 0 можно указать такие числа h (0, 1) и δ (0, 1), что
при всех h ∈ (0,h), δ ∈ (0) справедливо неравенство
ε(ϑ) γ,
где ε(t) = |xp(t) - x0(t)|2n + |yp(t) - y0(t)|2n.
Доказательство теоремы следует из приведённой ниже леммы 9.
Пусть Lk - постоянная Липшица функции fk, L = max Lk, а ωk(δ), k ∈ [0 : r], -
k∈[0:r]
модуль непрерывности функции t → fk(t, x, y, u, v) в той области, в которой остаются решения
системы (1), а также стабильная дорожка W (t), t ∈ T. Обозначим также
ω(δ) = max ωk(δ).
k∈[0:r]
Заметим, что все точки скачка сосредоточены во множестве Δ(r).
Лемма 5. Пусть δi
Δ(r) = . Тогда справедливо неравенство
ε(τi+1) ε(τi) + C1δε(τi) + C2δ2 + 4ω2(δ)δ + 2C0hδ,
где C0 = sup{|Bku(1)+Cku(2)+u(3)|n : u(1) ∈ Pk, u(2) ∈ Qk, u(3) ∈ Ek, k ∈ [0 : r]}, C1 = 4(1+L),
C2 = 4L2(F + d)2 + 5F2 + 4d2.
Доказательство. Согласно условию леммы на отрезке [τi, τi+1] нет точек скачка. Пусть
a∗k < τi, τi+1 < a∗k+1.
Тогда траектория {xp(·), yp(·)} на отрезке [τi, τi+1] является решением системы
x(t) = y(t),
y(t) = f1k(t, x(t), y(t)) + Bkui - Ckv(t),
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
567
а траектория {x0(·), y0(·)} - решением системы
x(t) = y(t),
y(t) = f1k(t, x(t), y(t)) + uk(t),
где uk(·) - соответствующее оптимальное управление, uk(t) ∈ Ek при п.в. t ∈ [τi, τi+1]. В та-
ком случае имеем оценку
ε(τi+1) ε(τi) + I1i + I2i + 4(d2 + F2)δ2,
(71)
где
(
)
(
)
I1i = 2
xp(τi) - x0(τi),
{yp(s) - y0(s)} ds
,
I2i = 2
yp(τi) - y0(τi),
qi(s)ds
,
τi
τi
qi(s) = f(s,xp(s),yp(s),ui,v(s)) - f(s,x0(s),y0(s),uk(s)),
f(s,xp(s),yp(s),ui,v(s)) = f1k(s,xp(s),yp(s)) + Bkui - Ckv(s),
f(s,x0(s),y)(s),uk(s)) = f1k(s,x0(s),y0(s)) + uk(s).
Нетрудно видеть, что справедливо неравенство
(∫s
)
{yp(s) - y0(s)} ds
=
{yp(τi) - y0(τi) +
{yp(τ) - y0(τ)}dτ ds
n
n
τi
τi
τi
δ|yp(τi) - y0(τi)|n + 22,
воспользовавшись которым, получаем
I1i 2δ|xp(τi) - x0(τi)|n|yp(τi) - y0(τi)|n + 22|xp(τi) - x0(τi)|n 2δε(τi) + F2δ3.
(72)
Далее, в силу липшицевости функций f1k по x, y и непрерывности по t, имеем при s ∈ δi =
= [τi, τi+1) неравенство
|qi(s)|n |f(τi, xp(τi), yp(τi), ui, v(s)) - f(τi, x0(τi), y0(τi), uk(s))|n + I3i(s) + 2ω(δ).
(73)
Здесь I3i(s) = L{|xp(s) - xp(τi)|n + |yp(s) - yp(τi)|n + |x0(s) - x0(τi)|n + |y0(s) - y0(τi)|n}
2(f + d). Из (73), снова воспользовавшись липшицевостью функций f1k, выводим нера-
венство (s ∈ δi)
|qi(s)|n |f(τi, x0(τi), y0(τi), ui, v(s)) - f(τi, x0(τi), y0(τi), uk(s))|n + q1i + 2ω(δ) + 2(F + d),
где q1i = L{|xp(τi) - x0(τi)|n + |yp(τi) - y0(τi)|n}. Очевидно, что q1i1/2(τi). Поэтому
I2i I4i + I5i, где
I4i = 2δ|yp(τi) - y0(τi)|n{Lε1/2(τi) + 2ω(δ) + 2(F + d)},
(
)
I5i = 2
yp(τi) - y0(τi),
{f(τi, x0(τi), y0(τi), ui, v(s)) - f(τi, x0(τi), y0(τi), uk(s))} ds
τi
Нетрудно видеть, что
(
)
I5i = 2
yp(τi) - y0(τi),
{Bkui - Ckv(s) - uk(s)} ds
τi
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
568
ОСИПОВ, МАКСИМОВ
Следовательно,
(
)
I5i 2
ψhi - y0(τi),
{Bkui - Ckv(s) - uk(s)} ds
+ 2hδC0.
τi
Здесь ψhi Rn,
hi - yp(τi)|n h. В таком случае, учитывая условие 1, а также правило
выбора векторов ui (см. (63), при этом в (63) B0 и P0 заменены на Bk и Pk соответственно)
заключаем, что справедлива оценка I5i 2hδC0. Значит,
I2i I4i + I5i 2(1 + L)δε(τi) + 4ω2(δ)δ + 4L2(F + d)2δ2 + 2hδC0.
Отсюда в силу (71) и (72) следует утверждение леммы. Лемма доказана.
Пусть τi(k) = maxi : τi < ak+1}.
Лемма 6. При всех k ∈ [0 : r - 1] справедливы неравенства
ε(a∗k+1-) νk+1 = [ε(τi
k+N+)+(ak+1 - ak)(C2δ + 2hC0 + 4ω2(δ))]exp C1(ak+1 - ak),
где ε(a∗k+1-) = lim ε(t).
t→a∗k+1-
Доказательство. В силу леммы из работы [12] и леммы 5 настоящей работы при τi
[τik+N , ak+1] имеют место оценки
ε(τi) [ε(τik +N +) + (τi - τik+N )(C2δ + 2hC0 + 4ω2(δ))] exp C1(τi - τik+N ).
(74)
Поэтому
ε(τi(k) ) Ψk = [ε(τik +N +) + (τi(k) - τik )(C2δ + 2hC0 + 4ω2(δ))] exp C1(τi(k) - τik ).
Обозначим Δk = a∗k+1i(k) . Аналогично лемме 5, учитывая последнее неравенство, получаем
ε(a∗k+1-) (1 + C1Δk)ε(τi(k) ) + ρk (1 + C1Δkk + ρk,
(75)
где
ρk = C2Δk + 4ω2kk + 2hC0Δk. Нетрудно видеть, что справедливы неравенства
(1 + C1Δkk [ε(τik +N +) + (τi(k) - τik+N )(C2δ + 2hC0 + 4ω2(δ))] exp C1(ak+1 - ak),
(76)
(77)
ρk (ak+1 - τi(k) )(C2δ + 2hC0 + 4ω2(δ)) exp C1(ak+1 - ak).
Утверждение леммы следует из неравенств (75)-(77) и неравенства a∗k < τik+N . Лемма дока-
зана.
Введём обозначение ρ1(h) = ρ(h) + ϑm-3h.
Лемма 7. Справедливы неравенства
ε(τi1+N +) = |y0(τi1+N +) - yp(τi1+N +)|n + |x0(τi1+N ) - xp(τi1+N )|n 4ε(a1-) + φ1(h, δ),
(78)
ε(τik+N +) = |y0(τik+N +) - yp(τik+N +)|n + |x0(τik +N ) - xp(τik+N )|n
4ε(a∗k-) + φ(h, δ) при k ∈ [2 : r],
(79)
где φ1(h, δ) = 4(χ1 + F ρ1(h))2 + 8d2ρ2(h), φ(h, δ) = 4(χ + F ρ1(h))2 + 8d2ρ2(h).
Доказательство. Проверим неравенство (78). По определению
ε(a∗k-) = |y0(a∗k-) - yp(a∗k-)|2n + |x0(a∗k) - xp(a∗k)|2n.
В момент τi1+N устанавливаем, что a1 (τi1-1, τi1+N ] и
|b1 - νi1+N | χ1 = χ1(α, δ, h).
(80)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
569
Полагаем (см. (68))
y0(τi1+N+) = y0(τi1-1) + νi1+Ne1.
(81)
По постановке задачи имеет место равенство
yp(a1+) = yp(a1-) + b1e1.
(82)
Нетрудно видеть, что справедливо неравенство
|y0(a1-) - yp(a1-)|n ε1/2(a1-).
(83)
При t ∈ (a1, τi1+N ] скачков нет. Кроме того, |Fk|n F, k ∈ [0 : r]. В таком случае
|yp(τi1+N ) - yp(a1+)|n F ρ(h).
(84)
Так как a1 (τi1-1, τi1 ], τi1 - τi1-1 = δ(h) = ϑmh3, |Fk|n F, то верна оценка
|y0(τi1-1) - y0(a1-)|n F δ = F ϑmh3.
(85)
Поэтому вследствие соотношений (80)-(85) справедлива цепочка неравенств
|y0(τi1+N +) - yp(τi1+N +)|n = |y0(τi1-1) + νi1+N e1 - yp(τi1+N )|n =
= |y0(τi1-1) + νi1+N e1 - yp(τi1+N ) + yp(a1+) - yp(a1+)|n
|y0(τi1-1) + νi1+N e1 - yp(a1+)|n + |yp(a1+) - yp(τi1+N )|n
|y0(τi1-1) - yp(a1-)|n + χ1 + F ρ(h)
|y0(τi1-1) - y0(a1-)|n + |y0(a1-) - yp(a1-)|n + χ1 + F ρ(h)
|y0(a1-) - yp(a1-)|n + χ1 + F ρ1(h) ε1/2(a1-) + χ1(α, δ, h) + F ρ1(h).
(86)
Так как a1 (τi1-1, τi1 ], Nδ = ϑmh1, функция xp(·) непрерывна на T, а функция x0(·) - на
[a1, τi1+N ], то справедливы неравенства
|x0(τi1+N ) - x0(a1)|n d(τi1+N - a1)(h) и
|xp(τi1+N ) - xp(a1)|n(h).
Следовательно,
|xp(τi1+N ) - x0(τi1+N )|n |x0(a1) - xp(a1)|n + 2(h) ε1/2(a1-) + 2(h).
(87)
Из (86), (87) вытекает неравенство (78).
Неравенство (79) устанавливается аналогично. Лемма доказана.
Пусть
Ψ0(h,δ) = (1 + 4δ2)(h + 2)2 + h2 + 4(h + 2),
Ψ1(h,δ) = [Ψ0(h,δ) + a1(C2δ + 2hC0 + 4ω2(δ))]exp C1a1.
Лемма 8. При k ∈ [1 : r - 1] справедливы неравенства
ε(a∗k+1-) Ψk+1(h, δ) = [4Ψk(h, δ) + φ(h, δ) + ϑ(C2δ + 2hC0 + 4ω2(δ))] exp C1ϑ,
где φ(h, δ) = φ1(h, δ), если k = 1, и φ(h, δ) = φ(h, δ), если k ∈ [2 : r - 1].
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
570
ОСИПОВ, МАКСИМОВ
Доказательство. В силу лемм 6 и 7 имеет место оценка
ε(a∗k+1-) [4ε(a∗k-) + φ(h, δ) + (a∗k+1 - a∗k)(C2δ + 2hC0 + 4ω2(δ))] exp C1ϑ.
В таком случае
ε(a∗k+1-) [4ε(a∗k-) + φ(h, δ) + ϑ(C2δ + 2hC0 + 4ω2(δ))] exp C1ϑ.
(88)
Аналогично лемме 6 устанавливается неравенство
ε(a1-) [ε(τ1) + a1(C2δ + 2hC0 + 4ω2(δ))] exp C1a1 Ψ1(h, δ).
(89)
Заметим, что в силу (5), (62) и (59) справедливы неравенства
|yp(τ1) - y0(τ1)|n h + 2F δ,
|xp(τ1) - x0(τ1)|n h + 2δ(h + 2F δ).
Поэтому
ε(τ1) (h + 2F δ)2 + [h + 2δ(h + 2F δ)]2 Ψ0(h, δ).
Из (88), (89) и последнего неравенства следует утверждение леммы. Лемма доказана.
Лемма 9. Для любого γ0 > 0 можно указать такие h (0, 1) и δ (0, 1), что при
всех δ δ, h h, τi Δ(r) верны неравенства
ε(τi) Ψr(h, δ) γ0.
Доказательство. Функции Ψk(h, δ) обладают следующим свойством:
Ψk(h,δ) < Ψk+1(h,δ) при k ∈ [0 : r - 1].
По всякому γ0 > 0 можно указать такие δ = δ(γ0) > 0 и h = h(γ0) > 0, что при всех
h ∈ (0,h), δ ∈ (0) справедливо неравенство Ψr(h,δ) γ0. Поэтому при δ ∈ (0), h ∈
(0, h) верны неравенства ε(a∗k-) γ0 при всех k ∈ [1 : r]. Как отмечено выше, справедливо
неравенство (74). Из этого неравенства и леммы 7 при τi [τik+N , ak+1] получаем
ε(τi) [4ε(a∗k-) + φ(h, δ) + (τi - τi
k+N)(C2δ+2hC0+4ω2(δ))]exp C1(τi - τik+N)
[4ε(a∗k-) + φ(h, δ) + ϑ(C2δ + 2hC0 + 4ω2(δ))] exp C1ϑ.
Отсюда, учитывая лемму 8, выводим оценку ε(τi) Ψk+1(h, δ) γ0. Лемма доказана.
Замечание 2. В силу леммы 9 и неравенства ϑ-a∗r > ρ(h) при δ δ, h h справедливо
неравенство ε(ϑ) γ0. Отсюда следует утверждение теоремы.
Замечание 3. Пусть в начальный момент построено семейство u-стабильных множеств
позиционного поглощения, обеспечивающих решение задачи гарантированного наведения сис-
темы (3) с правой частью f = f0 из начального состояния {x0, y0} в наименьшую окрестность
множества M. Пусть это будет ε-окрестность. Обозначим построенное семейство через
W ε(t),
t ∈ T. Анализ описанного выше алгоритма позволяет сделать вывод, что, если в момент скач-
ков a∗k выполняются включения
{xp(a∗k), yp(a∗k+)} ∈Wε(a∗k), k ∈ [1 : r],
то СГН обеспечивает перевод фазовой траектории системы (3) в сколь угодно малую окрест-
ность множества Mε при достаточно малых h и δ.
СПИСОК ЛИТЕРАТУРЫ
1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.
2. Красовский Н.Н. Управление динамической системой. М., 1985.
3. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М., 1981.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ УПРАВЛЕНИЯ
571
4.
Избранные труды Осипова Ю.С. М., 2009.
5. Григоренко Н.Л. Математические методы управления несколькими динамическими процессами. М.,
1990.
6. Ушаков В.Н. К построению стабильных мостов в дифференциальной игре сближения-уклонения
// Изв. АН СССР. Техн. кибернетика. 1980. № 4. С. 29-36.
7. Кряжимский А.В. К теории позиционных дифференциальных игр сближения-уклонения // Докл.
АН СССР. 1978. Т. 239. № 4. С. 123-128.
8. Osipov Yu.S., Kryazhimskii A.V. Inverse Problems for Ordinary Differential Equations: Dynamical
Solutions. Basel, 1995.
9. Осипов Ю.С. Пакеты программ: подход к решению задач позиционного управления с неполной
информацией // Успехи мат. наук. 2006. Т. 61. № 4. C. 25-76.
10. Кряжимский А.В., Максимов В.И. О сочетании процессов реконструкции и гарантированного
управления // Автоматика и телемеханика. 2013. № 8. С. 26-34.
11. Максимов В.И. Дифференциальная игра наведения при неполной информации о фазовых коорди-
натах и неизвестном начальном состоянии // Дифференц. уравнения. 2015. Т. 51. № 11. C. 1676-1685.
12. Емельянов С.В. Системы автоматического управления с переменной структурой. М., 1967.
13. Завалищин С.Е., Сесекин А.Н. Импульсные процессы: модели и приложения. М., 1991.
14. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями.
М., 2004.
15. Семеров В.В., Репин В.М., Журина Н.Э. Алгоритмизация процессов управления летательными
аппаратами в классе логико-динамических систем. М., 1987.
16. Бортаковский А.С. Оптимизация переключающихся систем. М., 2016.
17. Engell S., Frehse G., Schnieder E. Modeling, Analysis and Design of Hybrid System. Berlin; Heidelberg,
2002.
18. Savkin A.V., Evans R.J. Hybrid Dynamical Systems: Controller and Sensor Switching Problems. Boston,
2002.
19. Васильев С.Н., Маликов А.И. О некоторых результатах по устойчивости переключаемых и гибрид-
ных систем // Актуальные проблемы механики сплошной среды. К 20-летию ИММ КазНЦ РАН.
Казань, 2011. С. 23-81.
20. Axelsson H., Boccadoro V., Egerstedt M., Valigi P.,Wardi Y. Optimal mode-switching for hybrid systems
with varying initial states // J. of Nonlin. Anal.: Hybrid Systems and Appl. 2008. V. 2. № 3. P. 765-772.
21. Максимов В.И. Об отслеживании траектории динамической системы // Прикл. математика и ме-
ханика. 2011. Т. 75. № 6. С. 951-960.
Московский государственный университет
Поступила в редакцию 22.01.2021 г.
им. М.В. Ломоносова,
После доработки 22.01.2021 г.
Математический институт
Принята к публикации 02.03.2021 г.
им. В.А Стеклова РАН, г. Москва,
Институт математики и механики
им. Н.Н. Красовского УрО РАН, г. Екатеринбург
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№4
2021