ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2021, том 57, № 8, с.1116-1141
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977.8
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА
СБЛИЖЕНИЯ-УКЛОНЕНИЯ: АЛЬТЕРНАТИВНАЯ
РАЗРЕШИМОСТЬ И ПОСТРОЕНИЕ РЕЛАКСАЦИЙ
© 2021 г. А. Г. Ченцов
Исследуется нелинейная дифференциальная игра (ДИ) сближения-уклонения. Для неё
Н.Н. Красовским и А.И. Субботиным установлена фундаментальная теорема об альтерна-
тиве. Параметрами игры являются целевое множество (ЦМ) и множество, определяющее
фазовые ограничения (ФО); в указанной теореме оба эти множества предполагались за-
мкнутыми в пространстве позиций. В настоящем исследовании замкнутости множества,
формирующего ФО, не предполагается, а постулируется только замкнутость всех его сече-
ний, отвечающих фиксации моментов времени; ЦМ предполагается замкнутым. При этих
условиях устанавливается вариант утверждения об альтернативной разрешимости и кон-
струируются релаксации исходной ДИ, определяемые ослаблением условий окончания иг-
ры сближения. Данное построение использует известный метод программных итераций
(МПИ), реализуемый на пространстве множеств, точками которых являются позиции иг-
ры. В результате формируется специальная последовательность функций, поточечно схо-
дящаяся к некоторой предельной функции позиции. Значения последней имеют смысл
наименьшего размера окрестностей множеств-параметров, при котором игрок, заинтере-
сованный в сближении с ЦМ, гарантированно решает свою задачу при ослабленных от-
меченным выше способом условиях; при этом, однако, допускается та или иная степень
приоритетности в части вопросов сближения с ЦМ и соблюдения ФО. Для построения
упомянутой предельной функции предлагается также “прямая” итерационная процедура
МПИ в функциональном пространстве, причём искомая предельная функция оказывается
неподвижной точкой оператора, порождающего данную процедуру. Кроме того, показано,
что каждое значение этой функции является ценой некоторой ДИ со специальным функ-
ционалом качества.
DOI: 10.31857/S0374064121080136
Введение. Теорема Красовского-Субботина об альтернативе (см. [1, 2]) является ключе-
вым положением современной теории дифференциальных игр (ДИ); с использованием данной
теоремы установлено [2] существование седловой точки для типичных функционалов каче-
ства, важных для теории и приложений. В самой этой теореме рассматривается вариант ДИ,
для которой функционал качества отсутствует; предполагаются заданными замкнутые целе-
вое множество (ЦМ) и множество, определяющее фазовые ограничения (ФО). Игрок I заин-
тересован в приведении траектории на ЦМ при соблюдении ФО; цель игрока II (уклониста)
противоположна. Из теоремы об альтернативе следует, что множество, формирующее ФО,
допускает разбиение в сумму множеств (успешной) разрешимости игроков. При этом игроки
могут использовать позиционные стратегии соответствующего типа, определяемого условиями
информационной согласованности [2] (используются процедуры управления по принципу об-
ратной связи); возможно (см. [3]) использование квазистратегий (неупреждающих стратегий).
Таким образом, множество разрешимости игрока I определяет конкретный вариант позицион-
ной стратегии (стратегия экстремального сдвига Н.Н. Красовского), гарантирующей наведение
на ЦМ при соблюдении ФО. В связи с процедурой, устойчивой к помехам в канале наблюде-
ния, отметим схему управления с поводырем (моделью) Н.Н. Красовского и А.И. Субботина
(см. [2]).
Исследованиям различных вопросов, связанных с теорией ДИ, посвящено очень много пуб-
ликаций. Напомним прежде всего монографию [4], где приведено большое число практических
задач, формализуемых в виде ДИ, и указаны некоторые методы их исследования. Имеются
монографии [2, 5-11], в которых изложены основные положения теории и указаны возмож-
ные приложения. В связи с задачами теории ДИ отметим особо основополагающие работы
1116
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1117
Л.С. Понтрягина и его учеников [12-15] и исследования Б.Н. Пшеничного [16-18]. В работах
А.И. Субботина [10, 11, 19, 20] и его учеников создано новое направление, связанное с изуче-
нием обобщённых решений уравнения Гамильтона-Якоби. Эти исследования позволили уста-
новить целый ряд важных свойств функции цены ДИ. Отметим принципиальный результат
А.В. Кряжимского [21], в котором утверждение об альтернативе в ДИ сближения-уклонения
распространено на случай управляемых систем, не удовлетворяющих условию Липшица по
фазовой переменной.
Одним из методов исследования ДИ является метод программных итераций (МПИ) - см.
[22-27]. Обзор ранних исследований по МПИ содержится в [10, гл. IV, V]. Конструкции на
основе МПИ используются и в настоящей работе (см. также [26, 27]; в частности, см. [27,
раздел 6]). Схема применения МПИ здесь подобна в значительной степени работам [28-31],
развитием которых является настоящее исследование, имеющее следующие основные этапы.
1) Обоснование положения об альтернативной разрешимости ДИ сближения-уклонения
при ослаблении требований к множеству, определяющему ФО в задаче игрока I.
2) Построение функции позиции, значения которой определяют аналог наименьшего раз-
мера окрестностей ЦМ и множества, формирующего ФО, для которого игрок I ещё в состоянии
гарантировать успех в задаче сближения при ослабленных должным образом условиях окон-
чания игры.
3) Построение нового варианта МПИ, реализующего функцию позиции из этапа 2) в виде
предела последовательности итераций в функциональном пространстве.
4) Доказательство свойства неподвижной точки для функции из этапов 2), 3), а также
свойства её экстремальности в порядковом смысле.
5) Обоснование положения о том, что упомянутая выше функция позиции есть функция
цены некоторой ДИ на минимакс-максимин в несимметричных классах стратегий (квазистра-
тегии игрока I и стратегии с управляемыми моментами коррекции игрока II).
Целый ряд положений настоящей работы допускает естественные аналогии с [28-31], но
имеются и существенные различия. В части, касающейся применения МПИ, отметим следую-
щее. Конструкции на основе МПИ здесь являются средствами теоретического исследования и
не претендуют на роль инструмента решения конкретных задач теории ДИ.
1. Общие сведения. Используется стандартная теоретико-множественная символика; -
пустое множество,
= - равенство по определению. Семейством называем множество, все
элементы которого - множества. Принимаем аксиому выбора. Двум произвольным объектам
x и y ставим в соответствие их неупорядоченную пару {x;y} [32, c. 60]. Если h - объект, то
= {h; h} есть синглетон, содержащий h. Следуя [32, c. 67], полагаем для любых объектов
= {{a}; {a; b}}, получая упорядоченную пару (УП) с первым элементом a и
вторым элементом b. Для всякой УП h через pr1(h) и pr2(h) обозначаем первый и второй
элементы h соответственно, т.е. h = (pr1(h), pr2(h)).
Если H - множество, то через P(H) обозначаем семейство всех подмножеств (п/м) мно-
= P(H) \ {} - семейство всех непустых п/м множества H. Множеству
= {M \ M: M ∈
∈ M} ∈ P(P(M)), двойственное к M. Обычным образом определяем след семейства: если
= {A
B: A ∈ A} ∈ P(P(B)). Для произвольных
множеств A и B через BA обозначаем [32, c. 77] множество всех отображений из A в B.
= {g(x): x ∈ C} - образ множества
C при действии g, а (g | C) ∈ BC - сужение отображения g на множество C, определяемое
= g(y) для любого y ∈ C.
=
= {0}
⊔ N. Если m ∈
= {k ∈ N0 : m k}. Полагаем, что элементы
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
8
1118
ЧЕНЦОВ
множества N не являются множествами. С учётом этого для всяких множества H и числа k ∈
N для обозначения множества всех отображений из 1,k в H (т.е. множества всех кортежей
в H “длины” k) вместо H1,k используем более традиционное обозначение Hk; в качестве
H может использоваться семейство. В дальнейшем часто используется запись отображений в
индексной форме (семейство с индексом; см. [33, c. 11]); в частности, это относится к кортежам.
Согласно введённому обозначению HN - множество всех последовательностей в H; если H -
семейство, (Hi)i∈N ∈ HN и H - множество, то
⇐⇒ ((H = Hi) & (Hk+1 ⊂ Hk
∀k ∈ N)).
(1)
i∈N
= (R+)S всех неотри-
цательных вещественнозначных (в/з) функций на S; в качестве S может использоваться
семейство. В последнем случае элементы R+[S] - суть функции множеств.
Измеримость, меры. Произвольному множеству E ставим в соответствие семейство
(σ-alg)[E] всех σ-алгебр п/м множества E; если E ∈ (σ-alg)[E], то пара (E, E) - стандартное
измеримое пространство (ИП), множества из E называются измеримыми. Если E ∈ P(P(E))
(т.е. E - семейство п/м множества E), то через σ0E (E) (σ-alg)[E] обозначаем σ-алгебру на
E, порождённую семейством E. Типичный вариант соответствует случаю, когда E - тополо-
гия на E; тогда σ0E (E) есть σ-алгебра борелевских п/м множества E. Для множеств X и
Y ∈ P(X), семейств X ∈ P(P(X)) и X|Y ∈ P(P(Y )) всегда σ0Y (X|Y ) = σ0X(X)|Y ;
(Y ∈ σ0X (X )) ⇐⇒ (σ0Y (X |Y ) = {Σ ∈ σ0X (X ) : Σ ⊂ Y }).
(2)
Если (E, E) - стандартное ИП, то через (σ-add)+[E] обозначаем множество всех в/з неот-
рицательных счётно-аддитивных (с.-а.) мер на E, в частности, (σ-add)+[E] ⊂ R+[E]. При
E = σ0E(τ), где τ - топология на E, меры из (σ-add)+[E] называют борелевскими; в слу-
чае метризуемости топологического пространства (E, τ) все такие меры регулярны (см. [34,
гл. 1]). Данный случай достаточен для последующих построений.
2. Игра сближения-уклонения (содержательное обсуждение). Рассматриваем Rn,
где n ∈ N, в качестве фазового пространства системы
x = f(t,x,u,v), u ∈ P, v ∈ Q,
(3)
= [t0, ϑ0]
при t0 R и ϑ0 ]t0, ∞[ (итак, ϑ0 R и t0 < ϑ0). В (3) P и Q - непустые компакты в Rp
и Rq соответственно, где p ∈ N и q ∈ N,
f :T ×Rn ×P ×Q→Rn
(4)
– непрерывная (по совокупности переменных) функция. Предполагается, что в системе (3)
u ∈ P и v ∈ Q - управления игроков I и II соответственно. Для упрощения полагаем сейчас,
что при t ∈ T игроки I и II могут формировать кусочно-постоянные, непрерывные справа
на [t, ϑ0) и непрерывные слева в точке ϑ0 функции на [t, ϑ0] со значениями в компактах P
и Q соответственно; через Ut и Vt обозначим множества всех таких управлений на [t,ϑ0]
игроков I и II соответственно. Будем предполагать сейчас, что при (t, x) ∈ T × Rn, u(·)
∈ Ut и v(·) ∈ Vt реализуется единственная обычная траектория x(·,t,x,u(·),v(·)) систе-
мы (3), (4); x( · , t, x, u(·), v(·)) ∈ Cn([t, ϑ0]), где (здесь и ниже) Cn([t, ϑ0]) - множество всех
непрерывных отображений из [t, ϑ0] в Rn, Cn([t, ϑ0]) (Rn)[t,ϑ0]. Управления u(·) ∈ Ut и
v(·) ∈ Vt, где t ∈ T, являются программными. Будем предполагать, что они формируются
некоторыми (допустимыми) способами; поэтому каждой позиции (t, x) ∈ T × Rn ставятся
в соответствие непустые множества U〈t, x и V〈t, x возможных способов формирования
реализаций u(·) ∈ Ut и v(·) ∈ Vt соответственно; выбором U U〈t, x распоряжается иг-
рок I, а выбором V V〈t, x - игрок II. Каждому такому способу U ставится в соответствие
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1119
непустой пучок XI (t, x, U) траекторий, возможных при использовании U и стартующих из
позиции (t, x); предполагается, что эти траектории представляют собой равномерные пре-
делы обычных траекторий. Аналогично способу V ставится в соответствие непустой пучок
XII(t,x,V) траекторий, стартующих из позиции (t,x) и являющихся равномерными пре-
делами обычных траекторий.
Пусть M ∈ P(T × Rn) и N ∈ P(T × Rn); M есть ЦМ игрока I, а N формирует его ФО
в виде системы своих сечений. Возникают следующие две (M, N)-задачи.
I(M, N). Найти множество всех (t, x) ∈ N, для которых U U〈t,x
∀x(·)
XI(t,x,U) ∃ϑ ∈ [t0]:
((ϑ, x(ϑ)) ∈ M) & ((t, x(t)) ∈ N
∀t ∈ [t[).
(5)
II(M,N). Найти множество всех (t,x) ∈ N, для которых V V〈t,x
∀x(·)
XII(t,x,V) ∀ϑ ∈ [t0]:
((ϑ, x(ϑ)) ∈ M) (∃t ∈ [t, ϑ[: (t, x(t)) ∈ N).
(6)
Ситуацию (5) рассматриваем как (M, N)-сближение, а ситуацию (6) - как (M, N)-укло-
нение. Если множества, определяющие решение задач I(M,N), II(M,N), образуют раз-
биение N, будем говорить, что имеет место (M, N)-альтернатива. В [1, 2] (M, N)-задачи
рассматривались в случае, когда U〈t, x〉 и V〈t, x〉 определялись как не зависящие от (t, x)
множества позиционных стратегий, а пучки траекторий конструировались в классе равно-
мерных пределов реализуемых пошаговых движений; важную роль играли при этом условия
информационной согласованности (см. [2, гл. XI]).
Подчеркнём, что в рассматриваемой постановке имеется существенная особенность в срав-
нении с [1, 2]. Так, обращаясь к задаче I(M, N), отметим, что в момент сближения с ЦМ до-
пускается нарушение ФО, т.е. (по сути) потеря дальнейшей работоспособности объекта управ-
ления, при фактическом осуществлении сближения, что может иметь место в некоторых тех-
нических системах “одноразового действия” (цель достигнута, а остальное несущественно).
Данное соглашение важно для последующих построений. Если же (как и в [1, 2]) множество,
определяющее ФО, замкнуто в обычном смысле, то, как легко видеть, наведение на ЦМ в смыс-
ле задачи I(M, N) будет осуществляться (для позиций из N) так же, как и в [1, 2], включая
соблюдение ФО в момент реального осуществления упомянутого наведения. Итак, отмеченная
особенность связана с более общим допущением в отношении множества N, определяющего
ФО задачи.
В [3] элементы множеств U〈t, x〉 и V〈t, x〉 отождествлялись с многозначными квазистра-
тегиями; сами эти множества зависели только от t. Представляет интерес вопрос о зави-
симости решений задач I(M, N), II(M, N) от множеств M и N. В частности, в услови-
ях (M, N)-альтернативы для позиции, не принадлежащей множеству разрешимости задачи
(M, N)-сближения, интересен вопрос о наименьшем значении ε, ε > 0, при котором эта по-
зиция содержится в множестве, являющемся решением задачи I(Mε, Nχε), где Mb и Nb -
b-окрестности множеств M и N при b > 0, а χ, χ > 0, - некоторый коэффициент приори-
тетности в смысле вопросов, связанных с достижением ЦМ и соблюдением ФО.
3. Обобщённые управления. Ниже используются управления-меры, называемые также
обобщёнными управлениями (ОУ). Напомним, что T = [t00], где t0 R, ϑ0 R и t0 < ϑ0.
= [t, ϑ0] × Q
= [t, ϑ0] × P × Q, оснащаемые σ-алгебрами борелевских множеств:
Tt (σ-alg)[[t,ϑ0]], Kt (σ-alg)[Yt], Dt (σ-alg)[Zt], Ct (σ-alg)[Ωt].
Итак, ([t, ϑ0], Tt), (Yt, Kt), (Zt, Dt),t, Ct) - стандартные ИП. Среди борелевских множеств
выделяем цилиндры: при t ∈ T и I ∈ Tt имеем I × P ∈ Kt, I × Q ∈ Dt и I × P × Q ∈ Ct.
Кроме того, имеем [35, c. 17] Ωt = ([t, ϑ0] × P ) × Q = Yt × Q, а потому S × Q ∈ Ct при S ∈
= {(ξ, u, v) Ωt : (ξ, v) ∈ D} ∈ Ct.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1120
ЧЕНЦОВ
В связи с указанными свойствами цилиндров см. [34, добавление II; 36]. Отметим очевидные
следствия эквивалентности (2): при t1 ∈ T и t2 [t1, ϑ0] выполняются включения
= Ct1|[t1,t2[×P×Q = {C ∈ Ct1 : C ⊂ [t1,t2[×P × Q} ∈ (σ-alg)[[t1,t2[×P × Q],
= Dt1|[t1,t2[×Q = {D ∈ Dt1 : D ⊂ [t1,t2[×Q} ∈ (σ-alg)[[t1,t2[×Q].
Если t ∈ T, то через λt обозначаем след меры Лебега на Tt (см. [37, c. 155]);
= {η ∈ (σ-add)+[Ct] : η(I × P × Q) = λt(I) ∀I ∈ Tt},
= {μ ∈ (σ-add)+[Kt] : μ(I × P ) = λt(I) ∀I ∈ Tt},
= {ν ∈ (σ-add)+[Dt] : ν(I × Q) = λt(I) ∀I ∈ Tt}.
Заметим, что (см. [10, гл. IV, § 2]) Ut × Vt допускает погружение в Ht, а Ut и Vt допускают
аналогичные погружения в Rt и Et соответственно. Элементы Ht - “совокупные” (программ-
ные) ОУ, а элементы Rt и Et - ОУ игроков I и II соответственно. Полагаем, что
= {η ∈ Ht : η(K × Q) = μ(K) ∀K ∈ Kt}
∀μ ∈ Rt,
= {η ∈ Ht : η(D×P ) = ν(D) ∀D ∈ Dt}
∀ν ∈ Et.
(7)
В определении (7) введены специальные множества ОУ, отвечающие содержательно ситуации,
когда при реализации УП (u(·), v(·)) ∈ Ut × Vt одно из программных управлений u(·), v(·)
фиксировано, а другое может быть произвольным. Через B обозначаем σ-алгебру борелев-
ских п/м множества Q; при K ∈ Kt и B ∈ B имеем K × B ∈ Ct (см. [34, добавление II]).
Если v ∈ Q, то для меры Дирака, сосредоточенной в точке v, через δv обозначаем след на
σ-алгебре B; если t ∈ T и μ ∈ Rt, то μ
v ∈ πt(μ) определяем условиями
(μ
= μ(K)δv(B)
∀K ∈ Kt
∀B ∈ B;
данная мера отвечает совместному действию на систему (3), (4) ОУ μ и константы v; см.
построения в [38, 39].
Через Ct), C(Yt) и C(Zt) обозначаем множества всех непрерывных в/з функций на
компактах Ωt, Yt и Zt соответственно. Определяя на этих множествах линейные операции
поточечно и вводя норму равномерной сходимости, получаем сепарабельные банаховы прост-
ранства; топологически сопряжённые к ним обозначим Ct), C(Yt) и C(Zt) (простран-
ства линейных ограниченных функционалов на Ct), C(Yt) и C(Zt) соответственно). Осна-
щаем Ct), C(Yt) и C(Zt) *-слабыми топологиями. С учётом теоремы Рисса [37, гл. IV]
Ht, Rt и Et отождествляются со *-слабо компактными п/м в Ct), C(Yt) и C(Zt) соот-
ветственно (являются сильно ограниченными и *-слабо замкнутыми), а потому эти три мно-
жества сами могут рассматриваться как *-слабые метризуемые компакты (используем свой-
ство сепарабельности предсопряжённых пространств; см. [37, гл. V]). При этом замкнутость
и компактность отождествимы с секвенциальной замкнутостью и секвенциальной компактно-
стью соответственно (см. [40, § 2.7]). Итак, все нужные в дальнейшем топологические свойства
представимы в терминах *-слабой сходимости последовательностей, обозначаемой через ⇀ .
В частности, при t ∈ T получаем, что
= {F ∈ P(Ht) :(ηj )j∈N FN ∀η ∈ Ht
((ηj )j∈N ⇀ η) (η ∈ F)}
– семейство всех *-слабо замкнутых п/м множества Ht. Отметим также (см. [36]), что имеют
место включения
(πt(μ) F∗t
∀μ ∈ Rt) & (Πt(ν) F∗t
∀ν ∈ Et).
(8)
Из сильной ограниченности Ht и включений (8) вытекает (секвенциальная) *-слабая ком-
пактность множеств (7); см. [36, c. 16].
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1121
4. Стратегии игроков. В качестве стратегий игрока I используем многозначные квази-
стратегии [3], а в качестве стратегий игрока II - стратегии-тройки [38, 39]. Рассмотрим сначала
определения, относящиеся к квазистратегиям, фиксируя t ∈ T до тех пор, пока не будет ого-
ворено противное. Тогда (см. [27, разд. 10])
= {α ∈
Pt (ν)) : ∀ν1 ∈ Et∀ν2 ∈ Et
∀θ ∈ [t0]
ν∈Et∗
((ν1|Dθt
) = (ν2|Dθt
))
({(η|Cθt
) : η ∈ α(ν1)} = {(η|Cθt
) : η ∈ α(ν2)})}
(9)
– множество всех квазистратегий игрока I на [t, ϑ0]. Среди всевозможных квазистратегий
выделяем (см. [27]) квазипрограммы
{
}
AΠt
= α
At :
α(ν) F
;
(10)
t
ν∈Et∗
= (Πt (ν))ν∈Et∗
AΠt. Поэтому множества (9) и (10) непу-
стые. Заметим, что использование в (9) и (10) многозначных отображений связано с конструк-
циями на основе МПИ: именно в классе таких отображений удаётся (см. [27, предложение 10.3])
конструктивно определить квазипрограмму, гарантирующую решение задачи игрока I.
Рассмотрим один специальный вариант стратегий игрока II. Полагая
= P(Q)Rn,
получаем непустое множество всех многозначных позиционных стратегий, подобных в идейном
отношении используемым в [1, 2]. При t ∈ T обозначим [38, 39]
= {g ∈ P([t, ϑ0])Cn([t,ϑ0]) : ∀g1 ∈ Cn([t, ϑ0]) ∀g2 ∈ Cn([t,ϑ0]) ∀θ ∈ [t,ϑ0]
((g1|[t, θ]) = (g2|[t, θ])) (g(g1)
[t, θ] = g(g2) [t, θ])};
= G(t)Rn (множество всех отображений из Rn в G(t)). Наконец, при
θ ∈ T полагая
=
G0(t),
t∈[θ,ϑ0]
получаем (непустое) множество стратегий коррекции на промежутке [θ, ϑ0]. Если (st)t∈[θ,ϑ0]
G∗θ, τ ∈ [θ,ϑ0] и x ∈ Rn, то отображение Cn([τ,ϑ0]) → P([τ,ϑ0]), действующее по прави-
лу h → sτ (x)(h), представляет собой неупреждающее правило выбора моментов коррекции
управления, формируемого позиционной стратегией. При t ∈ T назовём стратегией-тройкой
на отрезке [t, ϑ0] всякий триплет (V, β, m) Vpos×G∗t ×N (число m определяет ограничение
на возможное число переключений формируемого управления из Vt ).
5. Обобщённые траектории и пучки движений. Следуя идейно работе [21], введём
условия на систему. Полагаем, что при (t, x) ∈ T × Rn и η ∈ Ht интегральная воронка
= {x(·) ∈ Cn([t, ϑ0]) : x(θ) = x +
f (t, x(t), u, v)η(d(t, u, v))
∀θ ∈ [t0]}
[t[×P ×Q
одноэлементна: Φ(t, x, η) =( · , t, x, η)}, где
ϕ( · , t, x, η) = (ϕ(t, t, x, η))t∈[t0] ∈ Cn([t, ϑ0])
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1122
ЧЕНЦОВ
– траектория (скользящий режим), порождённая ОУ η из позиции (t, x). В дальнейшем
= {x ∈ Rn : ∥x∥ c} при c ∈ R+. Как и в [20],
предполагаем, что
∀a ∈ R+
∃b ∈ R+ : ϕ(τ,t,x,η) Bn(b)
∀t ∈ T
∀x ∈ Bn(a)
∀η ∈ Ht
∀τ ∈ [t,ϑ0].
(11)
Условие (11) - это условие равномерной ограниченности обобщённых траекторий. При t ∈ T
отображение
Rn × Ht → Cn([t,ϑ0]), (x,η) → ϕ(·,t,x,η),
(12)
непрерывно; при этом Ht оснащается относительной *-слабой топологией, Rn - топологи-
ей покоординатной сходимости, а Cn([t, ϑ0]) - топологией равномерной сходимости (см. [27,
c. 309]). При (t, x) ∈ T × Rn и ν ∈ Et полагаем, что
=( · , t, x, η) : η ∈ Πt (ν)},
(13)
получая непустой компакт в пространстве Cn([t, ϑ0]) с топологией равномерной сходимости
(учитываем включения (8), непрерывность отображения (12) и *-слабую компактность Ht ).
Если (t, x) ∈ T × Rn и α
At , то
{
}
= ϕ( · , t, x, η) : η ∈
α(ν)
∈ P(Cn([t0]))
(14)
ν∈Et∗
- пучок траекторий, порождённых квазистратегией α из позиции (t, x). Если же α
AΠt,
то множество (14) - компакт в Cn([t, ϑ0]).
Следуя [38, 39], при (t, x) ∈ T × Rn, V ∈ Vpos, β ∈ G∗t и m ∈ N вводим пучок
X[t; x; V ; β; m] ∈ P(Cn([t, ϑ0])) траекторий, порождённых стратегией-тройкой (V, β, m) из
позиции (t, x); см. [38, разд. 7; 39, формулы (7.4)-(7.8)]. Введём, наконец, при (t, x) ∈ T ×
× Rn и v ∈ Q непустой компакт
=( · , t, x, μ
v) : μ ∈ Rt} ∈ P(Cn([t0])).
(15)
В связи с определением (15) отметим свойство [38, формула (7.7)]: при (t, x) ∈ T × Rn,
V ∈ Vpos и β ∈ G∗t справедливо равенство
X[t; x; V ; β; 1] =
Xπ(t,x,v).
(16)
v∈V (t,x)
6. Множества в пространстве позиций. Пространство позиций отождествляем с T ×
× Rn; на T × Rn задаём метрику ρ ∈ R+[(T × Rn) × (T × Rn)] правилом
= sup({|t1 - t2|;∥x1 - x2∥})
для всех (t1, x1) ∈ T × Rn и (t2, x2) ∈ T × Rn (итак, ρ((t1, x1), (t2, x2)) - наибольшее из рассто-
яний |t1 - t2| и ∥x1 - x2). Метрическая топология t на T × Rn, порождённая метрикой ρ, -
= CRn[t], получая
семейство всех замкнутых в традиционном смысле п/м в T × Rn; тогда
= F \ {}
(17)
– семейство всех непустых замкнутых п/м в T ×Rn. Чтобы ввести другое оснащение на T ×Rn,
= P(T) (дискретная топология на T) и τ(n)R - топология на Rn, порождён-
ная нормой ∥ · ∥ (итак, τ(n)R - топология покоординатной сходимости в Rn). Через τ τ(n)R
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1123
обозначаем метризуемую топологию на T ×Rn, соответствующую стандартному произведению
= CRn[τ
τ(n)R] и
= F \ {}
(18)
(семейство всех непустых замкнутых в (T × Rn, τ
τ(n)R) п/м T × Rn). Если E ∈ P(T × Rn)
= {x ∈ Rn : (t, x) ∈ E} ∈ P(Rn) - t-сечение множества E. Полагая, что
= CRn[τ(n)R], получаем по двойственности, что (см. [27, разд. 5])
F = {F ∈ P(T × Rn) : F〈t〉 ∈ F ∀t ∈ T}.
(19)
Из определений легко следуют (см., в частности, (17), (18)) вложения F ⊂ F и F F.
7. Метод программных итераций. 1. Приведём краткую сводку положений, относя-
щихся к вариантам МПИ, реализуемым на пространстве п/м множества T × Rn. С учётом
(13) и [27, формула (5.5)] при M ∈ P(T × Rn) определим оператор A[M], действующий в
P(T × Rn), следующим образом:
= {(t, x) ∈ S : ∀ν ∈ Et
x(·) ∈ XΠ(t, x, ν) ∃ϑ ∈ [t,ϑ0] : ((ϑ,x(ϑ)) ∈ M) &
& ((τ, x(τ)) ∈ S
∀τ ∈ [t,ϑ[)}
∀S ∈ P(T × Rn).
(20)
В общем случае для множеств M ∈ P(T × Rn) и N ∈ P(T × Rn) определена [27, разд. 6]
последовательность (Wk(M, N))k∈N0 ∈ P(T × Rn)N0 по рекуррентному правилу
= N) & (Wk+1(M,N) = A[M](Wk(M,N))
∀k ∈ N0),
(21)
а также предельное множество
= Wk(M,N).
(22)
k∈N0
Будем использовать определения (21), (22) при различных множествах M и N. Из (20) и
(21) следует (см. [27, формула (6.3)]), что
∀M1 ∈ P(T × Rn)
∀N1 ∈ P(T × Rn)
∀M2 ∈ P(T × Rn)
∀N2 ∈ P(T × Rn)
((M1 ⊂ M2) & (N1 ⊂ N2)) ((Wk(M1, N1) ⊂ Wk(M2, N2)
∀k ∈ N0) &
& (W (M1, N1) ⊂ W (M2, N2))).
(23)
Если же M ∈ F и N ∈ F, то [27, разд. 6] имеем включения
(Ws(M, N) F
∀s ∈ N0) & (W(M,N) = A[M](W(M,N)) F).
(24)
Для дальнейшего важны аналоги секвенциальной непрерывности: если (Mi)i∈N ∈ FN,
(Ni)i∈N FN, M ∈ P(T × Rn), N ∈ P(T × Rn) и при этом (Mi)i∈N ↓ M и (Ni)i∈N ↓ N,
то M ∈ F, N ∈ F и, самое главное,
((Wk(Mi, Ni))i∈N ↓ Wk(M, N)
∀k ∈ N0) & ((W(Mi,Ni))i∈N ↓ W(M,N)).
(25)
Свойство (25) существенно для дальнейшего. Если N ∈ P(T × Rn), то t|N - топология на
N, индуцированная из (T × Rn,t), а F|N - семейство всех п/м множества N, замкнутых
в топологическом пространстве (N, t|N ). Тогда (см. [27, разд. 7]) при M ∈ F и N ∈ F
справедливы включения
(Wk(M, N) ∈ F|N
∀k ∈ N0) & (W(M,N) ∈ F|N ).
(26)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1124
ЧЕНЦОВ
В (24) и (26) сформулированы важные топологические свойства. Из включений (26) следует,
что если M ∈ F и N ∈ F, то
(Wk(M, N) ∈ F
∀k ∈ N0) & (W(M,N) ∈ F).
Рассмотрим итерационную процедуру [36, § 11], определяя при M ∈ P(T × Rn) оператор
стабильности A[M], действующий в P(T × Rn), по правилу: если S ∈ P(T × Rn), то
= {(t, x) ∈ S : ∀v ∈ Q ∃x(·) ∈ Xπ(t, x, v) ∃ϑ ∈ [t,ϑ0] :
((ϑ, x(ϑ)) ∈ M) & ((ξ, x(ξ)) ∈ S
∀ξ ∈ [t,ϑ[)}.
(27)
С помощью оператора (27) определяем новую итерационную процедуру: если M ∈ P(T × Rn)
и N ∈ P(T ×Rn), то [38, разд. 5] последовательность (Wk(M,N))k∈N0 ∈ P(T ×Rn)N0 зададим
рекуррентно следующим образом:
= N) & (Wk+1(M,N) = A[M](Wk(M,N))
∀k ∈ N0);
(28)
кроме того, положим
= Wk(M,N).
(29)
k∈N0
Свойства процедуры (28), (29) во многом аналогичны свойствам (21), (22). Напомним их пре-
дельно кратко (подробнее см. в [38, 39]). Если M ∈ F и N ∈ F, то
(Wk(M, N) F
∀k ∈ N0) & (W(M,N) = A[M](W(M,N)) F).
Отметим аналог свойства (26): при M ∈ F и N ∈ F справедливы включения
(Wk(M, N) ∈ F|N
∀k ∈ N0) & (W(M,N) ∈ F|N ).
Заметим, наконец, что (см. [36, c. 61, 62]) при M ∈ F и N ∈ F выполняется равенство
W (M, N) = W(M, N)
(30)
(для несколько менее общего случая аналог соотношения (30) отмечен в [10, гл. V, форму-
ла (4.3)]).
8. Вопросы альтернативной разрешимости. Рассматривается некоторый аналог тео-
ремы Красовского-Субботина об альтернативе, относящийся к случаю, когда множество, опре-
деляющее ФО, не является замкнутым в топологии t. Ключевую роль в этих построениях
играет МПИ. Всюду в дальнейшем считаем, что
M∈F и NF;
(31)
M есть ЦМ игрока I, а множество N формирует его ФО. С парой множеств (31) связываем
две последовательности
(Wk(M, N))k∈N0 FN0 и (Wk(M, N))k∈N0 FN0 ,
(32)
а также общее (см. (30)) предельное множество
W (M, N) = Wk(M, N) = Wk(M, N) = W(M, N).
(33)
k∈N0
k∈N0
Согласно (31) и [27, теорема 10.1] имеем цепочку равенств
W (M, N) = {(t, x) N : ∃α
At
x(·) X[t; x; α] ∃ϑ ∈ [t,ϑ0] :
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1125
((ϑ, x(ϑ)) M) & ((ξ, x(ξ)) N
∀ξ ∈ [t,ϑ[)} = {(t,x) N :
∃α
AΠt x(·) X[t; x; α] ∃ϑ ∈ [t,ϑ0] : ((ϑ,x(ϑ)) M) & ((ξ,x(ξ)) N ∀ξ ∈ [t,ϑ[)}.
(34)
Итак, множество (33) является решением задачи I(M, N) и в классе квазистратегий, и в
классе квазипрограмм; при (t, x) ∈ W (M, N) квазипрограмма, гарантирующая (M, N)-
сближение, определена в [27, формула (10.23), предложение 10.3, следствие 10.2]. С другой
стороны (см. [38, 39]), в силу (33) имеем
N \ W(M,N) = {(t,x) N : ∃V ∈ Vpos ∃β ∈ G∗t ∃m ∈ Nx(·) X[t;x;V ;β;m] ∀ϑ ∈ [t,ϑ0]
((ϑ, x(ϑ)) M) (∃ξ ∈ [t, ϑ[: (ξ, x(ξ)) N)}.
(35)
Свойство (35) следует из [38, теорема 9.2] с учётом равенств (33). Из (34) и (35) вытекает
следующая
Теорема 8.1. Если (t, x) N, то справедливо одно и только одно из следующих двух
утверждений:
1) ∃α
At
∀x(·) X[t;x;α]
∃ϑ ∈ [t0]:
((ϑ, x(ϑ)) M) & ((t, x(t)) N
∀t ∈ [t[);
2) ∃(V, β, m) Vpos×G∗t ×N ∀x(·) X[t; x; V ; β; m] ∀ϑ ∈ [t0] ((ϑ, x(ϑ)) M) (∃t ∈
[t, ϑ[: (t, x(t)) N).
Согласно [38, следствие 9.1] при (t, x) N \ W (M, N) осуществимо гарантированное
решение задачи игрока II с некоторым “запасом” (осуществимо уклонение по отношению к
некоторым окрестностям множеств M и N); сама структура разрешающей стратегии-тройки
в значительной степени пояснена в [38, разд. 8].
9. Окрестности множеств и релаксация задачи сближения. Начинаем рассмотрение
вопросов, связанных с ослаблением условий окончания игры сближения. Полагаем в дальней-
шем, наряду с (31), что
N〈t〉 = для всех t ∈ T.
(36)
= inf(((t, x), (τ, y)) : (τ, y) M}). Соответственно
= (ρ(z; M))z∈T×Rn ∈ R+[T × Rn] представляет собой расстояние до множе-
ства M. При ε ∈ R+ получаем, что
= {(t, x) ∈ T × Rn : ρ((t, x); M) ε} = ρ(· ; M)-1([0, ε]) ∈ F;
(37)
M = S0(M,0) ⊂ S0(M) (см. (31)). При ε > 0 множество (37) является замкнутой ε-
окрестностью множества M. При S ∈ P(Rn) и x ∈ Rn верно также
(∥ · ∥-inf)[x; S]
=
= inf{∥x - s∥ : s ∈ S} ∈ R+. Если H ∈ P
(Rn), то (∥ · ∥-inf)[· ; H] ∈ R+[Rn] определяет
функцию Rn R+ по правилу x → (∥ · ∥-inf)[x; H]. В силу (36) для всех t ∈ T имеем
N〈t〉 ∈ P(Rn). Если H ∈ P(Rn) и ε ∈ R+, то
= {x ∈ Rn : (∥ · ∥-inf)[x; H] ε} = (∥ · ∥-inf)[· ; H]-1([0, ε]) F,
(38)
= F \ {}. При ε ∈ R+ получаем, что
= {(t, x) ∈ T × Rn : x ∈ B0n(N〈t〉, ε)} ∈ P(T × Rn),
(39)
N S(N). Отметим очевидное
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1126
ЧЕНЦОВ
Предложение 9.1. Справедливо равенство S(N, 0) = N.
Отметим также легко проверяемое свойство S(N, ε)〈t〉 = B0n(N〈t〉, ε) для любого ε ∈ R+
и всех t ∈ T. C учётом этого и (19) получаем, что
S(N, ε) F для любого ε ∈ R+.
(40)
Предложение 9.2. Если (εi)i∈N (R+)N, ε ∈ R+ и при этом (εi)i∈N → ε и εk+1 εk
для всех k ∈ N, то (S0(M, εi))i∈N ↓ S0(M, ε) и (S(N, εi))i∈N S(N, ε).
Доказательство следует из определений.
Введём в рассмотрение и зафиксируем параметр κ ∈ R+, κ = 0, в качестве специального
коэффициента приоритетности: будем рассматривать в качестве возможных замены
M → S0(M), N S(N,κε),
(41)
где ε ∈ R+. В связи с (41) отметим несложно проверяемое равенство
T ×Rn =
W (S0(M, ε), S(N, κε))
(42)
ε∈R+
(для доказательства (42) используется тот очевидный факт, что M
N ⊂ W(M,N) для
любых M, N ∈ P(T × Rn)). Из (22) и (42) вытекает следующее свойство:
T ×Rn =
Wk(S0(M),S(N,κε))
∀k ∈ N0.
(43)
ε∈R+
В силу равенств (42) и (43) заключаем, что справедливо утверждение: если (t, x) ∈ T × Rn, то
= {ε ∈ R+ : (t, x) ∈ Wk(S0(M, ε), S(N, κε))} ∈ P(R+)
∀k ∈ N0) &
= {ε ∈ R+ : (t, x) ∈ W (S0(M, ε), S(N, κε))} ∈ P(R+)).
(44)
С учётом включений (44) при (t,x) ∈ T × Rn получаем, что
= inf(Σ(k)0(t, x|κ)) R+
= inf(Σ0(t, x|κ)) R+).
(45)
Вследствие определений (20), (21) имеем: Wk+1(M, N) ⊂ Wk(M, N) при M ∈ P(T × Rn),
N ∈ P(T × Rn) и k ∈ N0. Поэтому если (t,x) ∈ T × Rn и k ∈ N0, то
Σ(k+1)0(t,x|κ) Σ(k)0(t,x|κ).
(46)
Тогда из (45) и (46) вытекает следующее свойство:
ε(k)0(t,x|κ) ε(k+1)0(t,x|κ)
∀k ∈ N0
(t, x) ∈ T × Rn.
(47)
Стандартным образом, используя (45), получаем, что
= (ε(k)0(z|κ))z∈T×Rn ∈ R+[T × Rn]
∀k ∈ N0) &
= (ε0(z|κ))z∈T×Rn ∈ R+[T × Rn]).
(48)
= обозначаем поточечный порядок на R+[T × Rn], т.е.
⇐⇒ (g1(t, x) g2(t, x)
(t, x) ∈ T × Rn)
(49)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1127
для g1, g2 ∈ R+[T × Rn]. Из (47)-(49) следует очевидное свойство
= ε(k+1)0(·|κ)
∀k ∈ N0.
(50)
Предложение 9.3. Если (t, x) ∈ T × Rn, то справедливо равенство
Σ0(t,x) =
Σ(k)0(t,x).
k∈N0
Доказательство вытекает из определения (22).
Из предложения 9.3 несложно следует (см. (45), (49)) неравенство
= ε0(·|κ)
∀k ∈ N0.
(51)
Предложение 9.4. Если (t, x) ∈ T × Rn, то
(ε(k)0(t, x) Σ(k)0(t, x)
∀k ∈ N0) & (ε0(t,x) Σ0(t,x)).
Доказательство. Ограничимся проверкой первого включения (проверка второго анало-
= ε(s)0(t,x). С учётом включений (45) выберем по-
следовательность (aj)j∈N Σ(s)0(t, x)N, для которой (aj )j∈N → ε и ak+1 ak для всех
k ∈ N. В силу предложения 9.2, а также сходимости (25) получаем, что
(Ws(S0(M, aj ), S(N, κaj )))j∈N ↓ Ws(S0(M, ε), S(N, κε)),
(52)
причём (t, x) ∈ Ws(S0(M, ak), S(N, κak)) при k ∈ N. Вследствие (1) и (52) заключаем, что
(t, x) ∈ Ws(S0(M, ε), S(N, κε)). Осталось учесть включение (44). Предложение доказано.
Следствие 9.1. При (t, x) ∈ T × Rn элемент ε0(t, x) является наименьшим во
множестве Σ0(t,x), и, кроме того, ε(k)0(t,x) - наименьший элемент множества
Σ(k)0(t,x) при k ∈ N0.
С учётом неравенства (51) имеем при (t,x) ∈ T × Rn включение
(k)0(t, x) : k ∈ N0} ∈ P([0, ε0(t, x)]).
Предложение 9.5. Если (t, x) ∈ T × Rn, то справедливо равенство
ε0(t,x) = sup ε(k)0(t,x).
k∈N0
Доказательство подобно обоснованию аналогичного утверждения в [29-31] (отметим
только использование свойства (23)).
Следствие 9.2. Функция ε0(·|κ) представляет собой точную верхнюю грань множества
=).
Доказательство очевидно.
=) таково, что
последовательность (ε(k)0(·|κ))k∈N0 и функция ε0(·|κ) связаны свойством точной верхней гра-
ни. Ещё одно очевидное следствие состоит в том, что при (t, x) ∈ T × Rn (см. (47)) имеют
место соотношения
((ε(k)0(t, x))k∈N → ε0(t, x)) & (ε(s)0(t, x) ε(s+1)0(t, x)
∀s ∈ N).
(53)
В силу (53) функция ε0(·|κ) является поточечным пределом последовательности (ε(k)0(·|κ))k∈N.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1128
ЧЕНЦОВ
10. Основная последовательность в пространстве функций. Функции ε(k)0(·|κ), k ∈
N0, и ε0(·|κ) определены в терминах итерационных процедур (21), (22). Мы укажем далее
“прямую” итерационную процедуру, позволяющую строить упомянутую последовательность
и определять её предел в терминах преобразований в R+[T × Rn]. Однако предварительно
следует установить целый ряд свойств данных функций, привлекая лишь первоначальное (см.
(44), (45)) их определение.
Предложение 10.1. Если (t, x) ∈ T ×Rn и k ∈ N0, то Σ(k)0(t, x) = [ε(k)0(t, x), ∞[.
Доказательство легко следует из определений с учётом свойства (23) (см. также [30,
предложение 7]).
Аналогичным образом устанавливается
Предложение 10.2. Если (t, x) ∈ T × Rn, то Σ0(t, x) = [ε0(t, x), ∞[.
Предложение 10.3. Если b ∈ R+, то
(ε(k)0(·|κ)-1([0, b]) = Wk(S0(M, b), S(N, κb))
∀k ∈ N0) &
& (ε0(·|κ)-1([0, b]) = W (S0(M, b), S(N, κb))).
Доказательство следует из предложений 10.1, 10.2 c учётом включений (44).
Предложение 10.4. Если b ∈ R+, то
(ε(k)0(·|κ)-1([0, b]) ∈ F|S(N,κb)
∀k ∈ N0) & (ε0(·|κ)-1([0,b]) ∈ F|S(N,κb)).
Доказательство получается комбинацией включений (26) и предложения 10.3.
Из (24), (37) и предложения 10.3 вытекает, что при b ∈ R+ справедливы включения
(ε(k)0(·|κ)-1([0, b]) F
∀k ∈ N0) & (ε0(·|κ)-1([0,b]) F).
(54)
Введём в рассмотрение следующее множество неотрицательных полунепрерывных снизу
функций на топологическом пространстве (T × Rn, τ
τ(n)R):
= {g ∈ R+[T × Rn] : g-1([0, b]) F ∀b ∈ R+}.
(55)
Из (54) и (55) вытекает важное свойство полунепрерывности снизу
(ε(k)0(·|κ) M
∀k ∈ N0) & (ε0(·|κ) M);
(56)
предложение 10.4 дополняет утверждение (56). Напомним, что ρ(· ; M) - непрерывная в/з
функция; в частности, ρ(· ; M) M. Введём в рассмотрение функцию
= (κ-1(∥ · ∥-inf)[x; N〈t〉])(t,x)∈T×Rn ∈ R+[T × Rn].
(57)
Предложение 10.5. Если b ∈ R+, то (ζκ)-1([0, b]) = S(N, κb).
Доказательство следует из определений.
Из включения (40) и предложения 10.5 вытекает, что (ζκ)-1([0, b]) F для всех b ∈ R+.
Отметим, что функция
= (sup(((t, x); M); ζκ(t, x)}))(t,x)∈T×Rn ∈ R+[T × Rn]
(58)
=) неупорядоченной пары(·;M);ζκ}.
Нетрудно видеть (см. (55)), что ψκ M.
Предложение 10.6. Справедливо равенство ε(0)0(·|κ) = ζκ.
Доказательство. В силу определения (21), включений (44) и предложения 10.1 имеем
Σ(0)0(t,x|κ) = {ε ∈ R+ : (t,x) S(N,κε)} = [ε(0)0(t,x|κ),∞[
(t, x) ∈ T × Rn.
(59)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1129
= ε(0)0(t,x); εR+. В силу (59) (t,x) S(N,κε), а тогда,
согласно (39), (∥·∥-inf)[x; N〈t] κε. В силу (57) верно неравенство ζκ(t, x) ε. С другой
= (∥·∥-inf)[x; N〈t] R+ имеем (см. (38), (39)) включение (t, x) S(N, δ).
Вследствие (59) получаем
δ
Σ(0)0(t,x).
(60)
κ
Из соотношений (59) и (60) вытекает неравенство ε δ = ζκ(t, x). В итоге ε=
= ζκ(t,x). Так как выбор позиции (t,x) был произвольным, требуемое равенство уста-
новлено.
=ψκ.
= ρ((t, x); M); тогда
= (∥ · ∥-inf)[x; N〈t] = κζκ(t, x).
С учётом включения (39) получаем
(t, x) ∈ S0(M, b)
⋂S(N,c),
(61)
= sup({a;b}) R+. Тогда a = ζκ(t,x), S0(M,b) ⊂ S0(M,d),
c = κa κd и S(N,c) S(N,κd). Вследствие (61) имеем (t,x) ∈ S0(M,d)
⋂S(N,κd),
а потому (см. (44)) d Σ0(t, x) и, согласно (45), ε0(t, x) d = ψκ(t, x). Так как
выбор позиции (t, x) был произвольным, предложение доказано.
=ψκ.
Доказательство получается комбинацией неравенства (51) и предложения 10.7.
Пусть
Mψ
= ψκ}.
(62)
Из включений (56), предложения 10.7 и следствия 10.1 вытекает, что
(ε(k)0(·|κ) Mψ
∀k ∈ N0) & (ε0(·|κ) Mψ).
(63)
Здесь же отметим, что
= ε(k)0(·|κ)
= ε0(·|κ))
(64)
в силу неравенств (50), (51) и предложения 10.6.
11. Вспомогательные функционалы качества. Введём в рассмотрение некоторые спе-
циальные функционалы, для которых позднее будет установлено совпадение значений мини-
макса в классе квазистратегий с соответствующими значениями функции ε0(·|κ). Всюду в
дальнейшем предполагается выполненным следующее
Условие (квазиограниченность N). Для некоторого c R+ имеет место соотношение
Bn(c)
N〈t〉 = для всех t ∈ T.
(65)
Число c со свойством (65) зафиксируем и будем использовать в последующих построениях.
При t ∈ T и x(·) ∈ Cn([t, ϑ0]) функция [t, ϑ0] R+, t → ∥x(t)∥, непрерывна и достигает
максимума; при этом
(∥ · ∥-inf)[x(τ); N〈τ〉] c + max
∥x(t)
∀τ ∈ [t0].
t∈[t0]
В силу непрерывности функции ρ(· ; M) при t ∈ T и x(·) ∈ Cn([t, ϑ0]) имеем непрерывность
функции [t, ϑ0] R+, t → ρ((t, x(t)); M); если при этом τ ∈ [t, ϑ0], то
ζκ(τ,x(τ)) κ-1( max ∥x(t) + c).
(66)
t∈[t0]
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1130
ЧЕНЦОВ
Пусть при t ∈ T отображение It ∈ P([t, ϑ0])[t,ϑ0] таково, что
= [t, ϑ[
∀ϑ ∈ ]t,ϑ0]).
(67)
В силу (66), (67) имеем при t ∈ T, x(·) ∈ Cn([t, ϑ0]) и ϑ ∈ [t, ϑ0], что
ζκ(τ,x(τ)) κ-1( max
∥x(t) + c)
∀τ ∈ It (ϑ);
(68)
t∈[t0]
с учётом оценки (68) получаем следующее (конечное) значение:
= sup(((ϑ,x(ϑ));M); sup ζκ(t,x(t))}) R+.
(69)
t∈It∗ (ϑ)
Из определений вытекает очевидное свойство
ωκ(t,x(·),t) = ψκ(t,x(t))
∀t ∈ T
∀x(·) ∈ Cn([t0]).
(70)
При t ∈ T функционал γ(κ)t
∈ R+[Cn([t0])] определяем условием
γ(κ)t
= inf ωκ(t, x(·), ϑ)
∀x(·) ∈ Cn([t0]).
(71)
ϑ∈[t0]
При t ∈ T через ∥ · ∥(C)t обозначаем норму равномерной сходимости на Cn([t, ϑ0]). Тогда при
t ∈ T имеем легко проверяемое свойство:
∀ε ∈ ]0,∞[
∃δ ∈ ]0,∞[
∀x1(·) ∈ Cn([t0])
∀x2(·) ∈ Cn([t0])
(∥x1(·) - x2(·)(C)t
< δ) (κ(t,x1(·)) - ωκ(t,x2(·))| < ε
∀ϑ ∈ [t0]).
(72)
Предложение 11.1. Если t ∈ T, то функционал γ(κ)t
на пространстве Cn([t0]) с
топологией равномерной сходимости непрерывен.
Доказательство получается комбинацией определения (71) и свойства (72).
Замечание. Несложно видеть, что на самом деле при t ∈ T функционал γ(κ) равномерноt
непрерывен на (Cn([t, ϑ0]), ∥ · ∥(C)), что непосредственно следует из (72). Здесь же отметим,t
что, как нетрудно проверить, имеет место следующее представление для множества нулей
этого функционала:
(γ(κ)t)-1({0}) = {x(·) ∈ Cn([t0]) : ∃ϑ ∈ [t0] : ((ϑ,x(ϑ)) M) & ((t,x(t)) N ∀t ∈ It (ϑ))}.
12. Минимакс в классе квазистратегий. В данном пункте при фиксированной на-
чальной позиции исследуется задача на минимакс функционала (71) в классе квазистратегий.
В связи с этим полагаем
= {η ∈ Ht : ∃ϑ ∈ [t, ϑ0] : ((ϑ, ϕ(ϑ, t, x, η)) ∈ M) &
& ((ξ, ϕ(ξ, t, x, η)) ∈ N
∀ξ ∈ [t,ϑ[)}
∀M ∈ F
∀N ∈ F
(t, x) ∈ N.
(73)
Тогда (см. [27, теорема 10.1]) при M ∈ F и N ∈ F получаем цепочку равенств
{
}
W (M, N) = (t, x) ∈ N : ∃α
At :
α(ν) ⊂ SM,N (t, x)
=
ν∈Et
{
}
= (t, x) ∈ N : ∃α
AΠt :
α(ν) ⊂ SM,N (t, x)
(74)
ν∈Et
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1131
Фиксируем до конца пункта позицию (t, x) ∈ T × Rn. Следуя идейно [27, формула (10.22)],
полагаем
π(W)t
= {η ∈ Πt (ν) : ∃ϑ ∈ [t, ϑ0] : ((ϑ, ϕ(ϑ, t, x, η)) ∈ M) &
,x
& ((ξ, ϕ(ξ, t, x, η)) ∈ W (M, N)
∀ξ ∈ [t[)}
∀M ∈ F
∀N ∈ F
∀ν ∈ Et .
Согласно утверждению (44), предложению 9.4 и [27, предложение 10.3] получаем, что
=π(W)t
〈·|S0(M, ε0(t, x)), S(N, κε0(t, x))
AΠt
(75)
,x
Из включений (14) и (75) вытекает, что определено значение
max
γ(κ)t(x(·)) R+.
x(·)X[t;x;aκW)(t,x)]
Предложение 12.1. Справедливо неравенство
max
γ(κ)t(x(·)) ε0(t, x).
x(·)X[t;x;aκW)(t,x)]
Доказательство легко следует из [27, следствие 10.2], (69) и (71).
Заметим, что в силу непрерывности отображения (12) и предложения 11.1 функционал
Ht R+, действующий по правилу η → γ(κ)t(ϕ( · , , t, x, η)), также непрерывен и, в силу
*-слабой компактности множества Ht , ограничен. Поэтому (см. (14)) при α
At ограничен
функционал X[t; x; α] R+, x(·) → γ(κ)(x(·)), и определено (конечное) значениеt
sup
γ(κ)t(x(·)) R+.
(76)
x(·)X[t;x;α]
Если α
AΠt, то в (76) sup можно заменить на max. С учётом этого получаем, поскольку
AΠt
=, что
= inf
sup
γ(κ)t(x(·)) R+) &
α∈At∗ x(·)X[t;x;α]
= inf
max
γ(κ)t(x(·)) R+).
(77)
α∈AΠt
x(·)X[t;x;α]
Отметим очевидные следствия (см. (75), (77), предложение 12.1)
vκ(t,x) v(Π)κ(t,x)
max
γ(κ)t(x(·)) ε0(t, x).
(78)
x(·)X[t;x;aκW)(t,x)]
Предложение 12.2. Если b ∈ [0, ε0(t, x)[ и α
At , то
∃x(·) X[t;x;α] : b γ(κ)(x(·)).t
Доказательство легко следует из (44) и (74) (см. (69), (71), (78)).
Из предложения 12.2 вытекает, что при b ∈ [0, ε0(t, x)[ имеют место неравенства
b vκ(t,x) v(Π)κ(t,x)
max
γ(κ)t(x(·)) ε0(t, x).
(79)
x(·)X[t;x;aκW)(t,x)]
Теорема 12.1. Справедлива цепочка равенств
vκ(t,x) = v(Π)κ(t,x) =
max
γ(κ)t(x(·)) = ε0(t, x).
x(·)X[t;x;aκW)(t,x)]
Доказательство вытекает из неравенств (79).
9
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1132
ЧЕНЦОВ
Согласно теореме 12.1 aκW)(t, x) представляют собой минимаксную квазипрограмму.
В частности, aκW)(t, x)
At (см. (75)) и при этом
sup
γ(κ)(x(·)) =
max
γ(κ)t(x(·)) = ε0(t, x) = vκ(t, x).
(80)
t
x(·)X[t;x;aκW)(t,x)]
x(·)X[t;x;aκW)(t,x)]
Получаем (см. (77)) следующее очевидное теперь равенство:
vκ(t,x) = min
sup
γ(κ)(x(·)).t
α∈At∗ x(·)X[t;x;α]
13. Программный оператор на пространстве функций. Рассмотрим вариант МПИ,
аналогичный [26] и реализуемый в функциональном пространстве. Наша ближайшая цель
состоит в представлении преобразования ε(k)0(·|κ) → ε(k+1)0(·|κ) в терминах действия данного
оператора. Сначала рассмотрим, однако, некоторые вспомогательные построения, подобные
[28-31]. В силу предположения (11) при t ∈ T и x(·) ∈ Cn([t, ϑ0]) функция [t, ϑ0] R+,
ξ → ψκ(ξ,x(ξ)), ограничена (см. также условие в п. 11) и определено (конечное) значение
sup ψκ(ξ,x(ξ)) R+;
(81)
ξ∈[t,ϑ0]
если, кроме того, g ∈ Mψ, то в силу (62) при τ ∈ [t, ϑ0] значения g(τ, x(τ)) не превосходят
величины (81). Поэтому при g ∈ Mψ, t ∈ T, x(·) ∈ Cn([t, ϑ0]) и ϑ ∈ [t, ϑ0] определено
значение
sup({ sup g(τ,x(τ));ρ((ϑ,x(ϑ));M)}) R+.
(82)
τ ∈It(ϑ)
С учётом этого при g ∈ Mψ и t ∈ T определим функционал H[g;t] ∈ R+[Cn([t,ϑ0]) × [t,ϑ0]]
правилом: каждой УП (x(·), ϑ) ∈ Cn([t, ϑ0])× [t, ϑ0] поставим в соответствие значение (82), т.е.
(x(·), ϑ) H[g; t](x(·), ϑ); данное значение также не превосходит величины (81).
Предложение 13.1. Если g ∈ Mψ, t ∈ T и ϑ ∈ [t, ϑ0], то для каждого b ∈ R+
множества Лебега H[g;t](·,ϑ)-1([0,b]) функционала
= (H[g; t](x(·), ϑ))x(·)∈Cn ([t0]) ∈ R+[Cn([t0])]
замкнуты в топологии равномерной сходимости пространства Cn([t, ϑ0]).
Доказательство подобно в идейном отношении обоснованию предложения 13 работы [30]
и поэтому для уменьшения объёма статьи опущено.
Если g ∈ Mψ, t ∈ T, x Rn и ν ∈ Et , то (см. (13))
= (H[g; t]|XΠ(t, x, ν) × [t, ϑ0]) = (sup({ sup g(τ, x(τ));
τ ∈It∗ (ϑ)
(83)
ρ((ϑ, x(ϑ)); M)}))(x(·))∈XΠ (t,x)×[t0]∈R+[XΠ(t,x)×[t0]];
если θ ∈ [t, ϑ0], то для функционала (83) определено его сечение
= (h[g; t; x; ν](x(·), θ))x(·)∈XΠ (t,x) ∈ R+[XΠ(t,x)],
для которого h[g; t; x; ν]( · , θ)-1([0, b]) = XΠ(t,x)
H[g; t]( · , θ)-1([0, b]) при b ∈ R+.
С учётом предложения 13.1 получаем, что при g ∈ Mψ, t ∈ T, x Rn, ν ∈ Et , θ ∈
[t, ϑ0] и b ∈ R+ множество h[g; t; x; ν]( · , θ)-1([0, b]) замкнуто в (относительной) тополо-
гии равномерной сходимости на XΠ(t, x, ν), а следовательно, и компактно в этой топологии
(учитываем компактность множества (13)); очевидно, что данное множество компактно и в
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1133
пространстве Cn([t, ϑ0]) с топологией равномерной сходимости. С учётом этого свойства и
предложения 13.1 несложно (подобно [28-31]) устанавливается
Предложение 13.2. Если g ∈ Mψ, t ∈ T, x Rn, ν ∈ Et и ϑ ∈ [t, ϑ0], то суще-
ствует x(·) ∈ XΠ(t,x) такой, что
h[g; t; x; ν](x(·), ϑ) =
inf
h[g; t; x; ν](x(·), ϑ).
x(·)∈XΠ(t,x)
В силу предложения 13.2 определено значение
min
h[g; t; x; ν](x(·), ϑ) R+,
x(·)∈XΠ(t,x)
где g, t, x, ν и ϑ удовлетворяют условиям этого предложения. В качестве следствия
имеем включения
inf
min
h[g; t; x; ν](x(·), ϑ) R+
∀g ∈ Mψ
∀t ∈ T
∀x Rn
∀ν ∈ Et .
(84)
ϑ∈[t0]
x(·)∈XΠ(t,x)
Вместе с тем, как легко видеть, при g ∈ Mψ, t ∈ T, x Rn, ν ∈ Et , x(·) ∈ XΠ(t, x, ν)
и ϑ ∈ [t0] справедливо неравенство
h[g; t; x; ν](x(·), ϑ) sup ψκ(t, x(t)).
(85)
t∈[t0]
C учётом (85) при t ∈ T и x Rn получаем, что
∃b ∈ R+ : h[g;t;x;ν](x(·)) b
∀g ∈ Mψ
∀ν ∈ Et
∀x(·) ∈ XΠ(t,x)
∀ϑ ∈ [t0].
С учётом этого (см. (84), (85)) при g ∈ Mψ и (t,x) ∈ T ×Rn определено (конечное) значение
sup
inf
min
h[g; t; x; ν](x(·), ϑ) R+.
ϑ∈[t0]
x(·)∈XΠ(t,x)
ν∈Et∗
Используя последнее свойство, задаём оператор Γ : Mψ → R+[T × Rn] посредством следую-
щего правила: при g ∈ Mψ функция Γ(g) ∈ R+[T × Rn] такова, что
= sup
inf
min h[g; t; x; ν](x(·), ϑ)
(t, x) ∈ T × Rn.
(86)
ν∈Et
ϑ∈[t,ϑ0]
x(·)∈XΠ(t,x,ν)
Итак, определён оператор Γ ∈ R+[T × Rn]Mψ . С учётом включений (63) имеем
(Γ(ε(k)0(·|κ)) ∈ R+[T × Rn]
∀k ∈ N0) & (Γ(ε0(·|κ)) ∈ R+[T × Rn]).
14. Метод программных итераций. 2. Покажем, что последовательность (ε(k)0(·|κ))k∈N0
может быть реализована при помощи итерационной процедуры с использованием оператора
Γ. Сначала отметим два достаточно простых вспомогательных утверждения.
= Γ(g).
Предложение 14.2. Оператор Γ обладает свойством изотонности: если g1 Mψ, g2
= Γ(g2).
Доказательства обоих положений аналогичны [28-31] (см., в частности, [29, предложе-
ния 15, 16]).
Теорема 14.1. Если k ∈ N0, то справедливо равенство ε(k+1)0(·|κ) = Γ(ε(k)0(·|κ)).
Доказательство. Фиксируем k ∈ N0, получая функции ε(k)0(·|κ) Mψ, ε(k+1)0(·|κ) Mψ
и значение Γ(ε(k)0(·|κ)) ∈ R+[T × Rn]. Пусть (t, x) ∈ T × Rn; тогда
= Γ(ε(k)0(·|κ))(t,x) R+).
(87)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
9
1134
ЧЕНЦОВ
В силу предложения 9.4 и включений (87) получаем, что a Σ(k+1)0(t, x), и поэтому
(см. (44))
(t, x) ∈ Wk+1(S0(M, a), S(N, κa)).
(88)
Тогда, в частности (см. (21), (88)), реализуется включение
(t, x) ∈ Wk(S0(M, a), S(N, κa)).
(89)
Согласно (21) и (89) имеем (t, x) S(N, κa). В силу предложения 10.5 ζκ(t, x) a. Из
(21) и (88) вытекает, что (t, x) A[S0(M, a)](Wk(S0(M, a), S(N, κa))). Поэтому (см. (20))
∀ν ∈ Et
∃x(·) ∈ XΠ(t,x)
∃ϑ ∈ [t0] : ((ϑ,x(ϑ)) ∈ S0(M,a))
&((τ, x(τ)) ∈ Wk(S0(M, a), S(N, κa))
∀τ ∈ [t[).
(90)
Фиксируем ν ∈ Et и подбираем (см. (90)) x(·) ∈ XΠ(t, x, ν) и
ϑ ∈ [t0] так, что
(
ϑ, x
ϑ)) ∈ S0(M, a)) & ((τ, x(τ)) ∈ Wk(S0(M, a), S(N, κa))
∀τ ∈ [t
ϑ[).
(91)
Вследствие включений (37), (91) и предложения 10.3 верно неравенство
(ε(k)0(τ, x(τ)) a
∀τ ∈ [t
ϑ[) & (ρ(
ϑ, x
ϑ)); M) a).
(92)
При этом в силу (67) имеем импликацию
ϑ = t) (ε(k)0(τ, x(τ)) = ε(k)0(t,x)
∀τ ∈ It
ϑ)).
В итоге
ϑ = t) ( sup ε(k)0(τ, x(τ)) = ε(k)0(t,x)).
(93)
τ ∈It∗
ϑ)
В силу включений (44), (45) и (89) выполняется неравенство ε(k)0(t, x) a. Поэтому из
(83), (92) и (93) вытекает импликация
ϑ=t) (h[ε(k)0(·|κ);t;x;ν](x(·)
ϑ) a).
(94)
Пусть теперь
ϑ∈]t0]. С учётом (67) It
ϑ) = [t
ϑ[, и согласно (92) имеем следующие
неравенства: sup ε(k)0(τ, x(τ))
a и ρ(
ϑ, x
ϑ)); M) a. Используя (83), получаем
τ ∈It∗
ϑ)
импликацию
ϑ ∈ ]t0])
(h[ε(k)0(·|κ); t; x; ν](x(·)
ϑ) a).
(95)
Из (94) и (95) следует, что h[ε(k)0(·|κ); t; x; ν](x(·)
ϑ) a во всех возможных случаях. Таким
образом, справедливо неравенство
inf
min
h[ε(k)0(·|κ); t; x; ν](x(·), ϑ) a.
ϑ∈[t0]
x(·)∈XΠ(t,x)
Так как выбор меры ν был произвольным, установлено, что (см. (86), (87))
b = Γ(ε(k)0(·|κ))(t,x) a.
(96)
<
k)
В силу предложения 14.1 верно неравенство ε(k)0(·|κ)
= Γ(ε(
(·|κ)), а поэтому b
0
[ε(k)0(t, x), ∞[. Согласно утверждению (44) и предложению 10.1 имеем
(t, x) ∈ Wk(S0(M, b), S(N, κb)).
(97)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1135
Далее, из (86) и (87) следует, что
inf
min
h[ε(k)0(·|κ); t; x; ν](x(·), ϑ) b
∀ν ∈ Et.
(98)
ϑ∈[t0]
x(·)∈XΠ(t,x)
Выберем произвольно b ]b, ∞[, т.е. b R+ и b < b. Пусть ν ∈ Et . Тогда в силу
(98) для некоторых ϑ [t, ϑ0] и x(·) ∈ XΠ(t, x, ν) справедливо неравенство
h[ε(k)0(·|κ); t; x; ν](x(·), ϑ) < b,
из которого вытекает следующее свойство:
(ρ((ϑ, x(ϑ)); M) < b) & (ε(k)0(τ, x(τ)) < b
∀τ ∈ It (ϑ)).
(99)
С учётом (23) в силу выбора числа b имеем
Wk(S0(M,b),S(N,κb)) ⊂ Wk(S0(M,b),S(N,κb)),
а тогда (см. (97))
(t, x) ∈ Wk(S0(M, b), S(N, κb)).
(100)
Рассмотрим отдельно случаи ϑ = t и ϑ ]t, ϑ0].
1) Пусть ϑ = t. Тогда [t, ϑ[ = и, очевидно, (t, x(t)) ∈ Wk(S0(M, b), S(N, κb)) для
любого t ∈ [t, ϑ[. С учётом неравенств (99) получаем импликацию
(ϑ = t) (((ϑ, x(ϑ)) ∈ S0(M, b)) &
& ((t, x(t)) ∈ Wk(S0(M, b), S(N, κb))
∀t ∈ [t[)).
(101)
2) Пусть ϑ ]t, ϑ0]. Тогда It (ϑ) = [t, ϑ[. Поэтому в силу (44), (99) и предложения 10.1
(t, x(t)) ∈ Wk(S0(M, b), S(N, κb)) для любого t ∈ [t, ϑ[. С учётом неравенств (99) получаем
импликацию
(ϑ ]t, ϑ0]) (((ϑ, x(ϑ)) ∈ S0(M, b)) &
& ((t, x(t)) ∈ Wk(S0(M, b), S(N, κb))
∀t ∈ [t[)).
(102)
Вследствие импликаций (101) и (102) и произвольного выбора числа ϑ заключаем, что ∀ν ∈
∈Et
∃x(·) ∈ XΠ(t,x) ∃ϑ ∈ [t0]:
((ϑ, x(ϑ)) ∈ S0(M, b)) & ((t, x(t)) ∈ Wk(S0(M, b), S(N, κb))
∀t ∈ [t[).
Из (20) и (100) вытекает, что (t, x) A[S0(M, b)](Wk(S0(M, b), S(N, κb))). C учётом
определения (21) имеем (t, x) ∈ Wk+1(S0(M, b), S(N, κb)) и в силу (44) b Σ(k+1)0(t, x).
Так как число b выбиралось произвольно, установлено, что ]b, ∞[ Σ(k+1)0(t, x). С учё-
том включений (45) получаем неравенство a b. В итоге a = b (см. (96)). Так как выбор
позиции (t, x) был произвольным, получили (см. (87)) требуемое утверждение. Теорема до-
казана.
Итак, последовательность (ε(k)0(·|κ))k∈N0 реализуется в виде итерационной процедуры
(ε(0)0(·|κ) = ζκ) & (ε(k+1)0(·|κ) = Γ(ε(k)0(·|κ))
∀k ∈ N0).
(103)
Можно рассматривать процедуру (103) как новую реализацию МПИ; в связи с этим отметим
[26, 31].
15. Свойство неподвижной точки. Вследствие соотношений (53) и (103) возникает
вопрос об описании предельной функции ε0(·|κ) в терминах оператора Γ. Ответ доставляет
Теорема 15.1. Функция ε0(·|κ) является неподвижной точкой оператора Γ, т.е. спра-
ведливо равенство ε0(·|κ) = Γ(ε0(·|κ)).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1136
ЧЕНЦОВ
Доказательство. Выбирая произвольно позицию (t, x) ∈ T × Rn, получаем, что
= Γ(ε0(·|κ))(t,x) R+).
(104)
В силу предложения 14.1 a b.
Докажем справедливость обратного неравенства. При этом a Σ0(t, x) согласно пред-
ложению 9.4, а тогда
(t, x) ∈ W (S0(M, a), S(N, κa)).
(105)
Из (24) и (105) следует включение (t, x) A[S0(M, a)](W (S0(M, a), S(N, κa))), а поэтому
∀ν ∈ Et
∃x(·) ∈ XΠ(t,x) ∃ϑ ∈ [t0]:
((ϑ, x(ϑ)) ∈ S0(M, a)) & ((t, x(t)) ∈ W (S0(M, a), S(N, κa))
∀t ∈ [t[).
(106)
C учётом включений (44), (45) получаем, что ∀ν ∈ Et
∃x(·) ∈ XΠ(t,x) ∃ϑ ∈ [t0]:
(ρ((ϑ, x(ϑ)); M) a) & (ε0(t, x(t)) a
∀t ∈ [t[).
(107)
Пусть ν ∈ Et . В силу неравенств (107) для некоторых
x(·) ∈ XΠ(t, x, ν) и
ϑ ∈ [t0]
имеем
(ρ(
ϑ, x
ϑ)); M) a) & (ε0(t, x(t)) a
∀t ∈ [t
ϑ[).
(108)
Случа
ϑ=t
ϑ ∈ ]t0] рассмотрим отдельно.
а) Пуст
ϑ=t. Тогда(см.(67)) It
ϑ) = {t} и ε0(t,x(t)) = ε0(t,x) = a для любого
t∈It
ϑ); см. (104). С учётом (83) и (108) получаем импликацию
ϑ=t) (h[ε0(·|κ);t;x;ν](x(·)
ϑ) a).
(109)
б) Пусть
ϑ ∈ ]t0]. Тогда It
ϑ) = [t
ϑ[. Поэтому из неравенств (108) следует, что
ρ(
ϑ, x
ϑ)); M) a и ε0(t, x(t)) a для любого t ∈ It
ϑ), а тогда в силу представления
(83) получаем импликацию
ϑ ∈ ]t0])
(h[ε0(·|κ); t; x; ν](x(·)
ϑ) a).
(110)
Из импликаций (109) и (110) вытекает, что неравенство h[ε0(·|κ); t; x; ν](x(·)
ϑ) a спра-
ведливо во всех возможных случаях. В качестве следствия (см. (84)) получаем
inf
min
h[ε0(·|κ); t; x; ν](x(·), ϑ) a.
ϑ∈[t0]
x(·)∈XΠ(t,x)
Так как выбор меры ν был произвольным, заключаем, что b = Γ(ε0(·|κ))(t, x) a. В
итоге a = b, откуда (см. (104)) вытекает требуемое равенство функций (выбор позиции
(t, x) был произвольным). Теорема доказана.
M(Γ)
Обозначим
= g)}.
ψ
<
Теорема 15.2. Функция ε0(·|κ) является
=-наименьшим элементом во множестве
M(Γ)
, т.е.
ψ
M(Γ)
(ε0(·|κ)
=g
∀g ∈M(Γ)ψ).
ψ
Доказательство подобно обоснованию аналогичного положения в [28-31] (см., в частно-
сти, [29, теорема 3]).
= ψκ; см.
(64) и предложение 10.7. Поэтому при (t, x) ∈ T × Rn имеем (см. (58)) импликацию
(ρ((t, x); M) ζκ(t, x)) (ε0(t, x) = ζκ(t, x)).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1137
16. Свойство функции цены. Дополним теорему 12.1, а именно: покажем, что при
(t, x) ∈ T × Rn значение ε0(t, x|κ) представляет собой цену ДИ с функционалом качества γ(κ)t
(см. (71)).
Для этого сначала рассмотрим связь функции ε0(·|κ) с функцией максимина в классе
стратегий-троек игрока II. Учитываем при этом (см. (31)), что при ε ∈ R+ имеют место
включения
(S0(M, ε) ∈ F) & (S(N, κε) F).
(111)
Напомним построения пп. 4 и 5 в части стратегий-троек и порождаемых ими движений
(подробнее см. в [38, 39]). Упомянутые движения [38, разд. 7] порождаются ОУ. Однако са-
ми стратегии-тройки игрока II формируют управления из множеств Vt, t ∈ T (реализации
управления игрока I допускаются в [38, 39] обобщёнными). Итак, при (t, x) ∈ T × Rn и
(V, β, m) Vpos × G∗t × N имеем непустой пучок X[t; x; V ; β; m] траекторий, стартующих из
позиций (t, x) и порождаемых совместным воздействием ОУ игрока I и обычных управлений
из Vt . Последние формируются пошагово посредством позиционой стратегии V, включае-
мой в моменты, вырабатываемые c помощью β в количестве, не превосходящем m; см. [38,
разд. 7].
Согласно [38, теорема 9.2] с учётом включений (111) получаем при ε ∈ R+ и k ∈ N
равенство
S(N, κε) \ Wk(S0(M, ε), S(N, κε)) = {(t, x) S(N, κε) : ∃V ∈ Vpos ∃β ∈ Gt ∃l ∈ 1,k
x(·) X[t; x; V ; β; l] ∀ϑ ∈ [t,ϑ0] ((ϑ, x(ϑ)) ∈ S0(M, ε))
(∃ξ ∈ [t, ϑ[: (ξ, x(ξ)) S(N, κε))}.
(112)
Напомним свойство, отмеченное в [38, следствие 9.1] и касающееся совпадения множеств
успешной разрешимости задач “обычного” и строгого уклонения (уклонения “с запасом”). В си-
лу (29) и (30) при ε ∈ R+ имеет место равенство
S(N, κε) \ W (S0(M, ε), S(N, κε)) = (S(N, κε) \ Wk(S0(M, ε), S(N, κε))).
(113)
k∈N
Из равенств (112), (113), в частности, следует, что справедлива импликация
∀ε ∈ R+
(t, x) S(N, κε) \ W (S0(M, ε), S(N, κε))
∃V ∈ Vpos
∃β ∈ G∗t
∃k ∈ N
x(·) X[t; x; V ; β; k]
∀ϑ ∈ [t,ϑ0]
((ϑ, x(ϑ)) ∈ S0(M, ε)) (∃ξ ∈ [t, ϑ[: (ξ, x(ξ)) S(N, κε)).
(114)
Отметим, что при (t, x) ∈ T × Rn, V ∈ Vpos, β ∈ G∗t и k ∈ N определено (конечное)
значение
inf
γ(κ)t(x(·)) R+.
x(·)X[t;x;V ;β;k]
Предложение 16.1. Если ε ∈ R+, (t, x) ∈ T × Rn, V ∈ Vpos, β ∈ G∗t , k ∈ N, x(·)
X[t; x; V ; β; k] и ϑ ∈ [t, ϑ0] таковы, что
((ϑ, x(ϑ)) ∈ S0(M, ε)) (∃t ∈ It(ϑ) : (t, x(t)) S(N, κε)),
то ε < ωκ(t,x(·)).
Доказательство следует непосредственно из определений.
Следствие 16.1. Если ε ∈ R+, (t, x) ∈ T × Rn, V ∈ Vpos, β ∈ G∗t , k ∈ N и x(·)
X[t; x; V ; β; k] таковы, что
∀ϑ ∈ [t0]
((ϑ, x(ϑ)) ∈ S0(M, ε)) (∃t ∈ It(ϑ) : (t, x(t)) S(N, κε)),
то выполняется неравенство γ(κ)(x(·)) ε.t
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1138
ЧЕНЦОВ
Доказательство очевидно (см. (71) и предложение 16.1).
Предложение 16.2. Если (t, x) ∈ T ×Rn и ε [0, ε0(t, x)[, то ∃V ∈ Vpos ∃β ∈ G∗t
∃k ∈ N:
ε
inf
γ(κ)(x(·)).t
x(·)X[t;x;V ;β;k]
Доказательство. Пусть (t, x) ∈ T × Rn и ε [0, ε0(t, x)[. Тогда ε R+ и ε <
< ε0(t,x). В силу (44) и (45) имеем (t,x) ∈ W(S0(M),S(N,κε)). Поэтому
((t, x) S(N, κε)) ((t, x) S(N, κε) \ W (S0(M, ε), S(N, κε))).
(115)
Рассмотрение первого (в (115)) случая опустим в силу его очевидности (см. (15), (16));
итогом его является импликация
((t, x) S(N, κε))
(∃V ∈ Vpos
∃β ∈ G∗t
∃k ∈ N : ε
inf
γ(κ)(x(·))).
(116)
t
x(·)X[t;x;V ;β;k]
Рассмотрим второй случай. Пусть (t, x) S(N, κε) \ W (S0(M, ε), S(N, κε)). Тогда в
силу (114) для некоторых V Vpos, β G∗t и r ∈ N имеет место импликация ∀x(·)
X[t; x; V ; β; r] ∀ϑ ∈ [t0]
((ϑ, x(ϑ)) ∈ S0(M, ε)) (∃t ∈ [t, ϑ[: (t, x(t)) S(N, κε)).
(117)
Пусть y(·) X[t; x; V; β; r]. Тогда y(·) ∈ Cn([t, ϑ0]), y(t) = x и, согласно (117), верна
импликация ∀ϑ ∈ [t, ϑ0]
((ϑ, y(ϑ)) ∈ S0(M, ε)) (∃t ∈ [t, ϑ[: (t, y(t)) S(N, κε)).
(118)
Выберем произвольно ϑ [t, ϑ0] и рассмотрим отдельно случаи ϑ = t и ϑ ]t, ϑ0].
1) Пусть ϑ= t. Тогда согласно (70) ωκ(t,y(·)) = ψκ(t,x). В силу того, что
[t, t[ = [t, ϑ[ = согласно (118) имеем (ϑ, y(ϑ)) ∈ S0(M, ε), т.е. (t, x) ∈ S0(M, ε).
Поэтому согласно включению (37) ε < ρ((t, x); M) ψκ(t, x) (см. (58)). В итоге ε <
< ωκ(t,y(·)). Таким образом, установлено, что если ϑ = t, то ε < ωκ(t,y(·)).
2) Пусть ϑ ]t, ϑ0]. Тогда (см. (67)) It (ϑ) = [t, ϑ[. Из импликации (118) следует, что
((ϑ, y(ϑ)) ∈ S0(M, ε)) (∃t ∈ It(ϑ) : (t, y(t)) S(N, κε)).
(119)
Напомним, что (t, x) ∈ T ×Rn, ε R+, V Vpos, β G∗t , r ∈ N, y(·)X[t; x; V; β; r]
и ϑ[t0]. В силу предложения 16.1 и импликации (119) неравенство ε < ωκ(t,y(·))
справедливо и в случае 2). Получили, что если ϑ ]t, ϑ0], то ε < ωκ(t, y(·), ϑ).
Так как выбор числа ϑ был произвольным, получаем, что ε < ωκ(t, y(·), ϑ) для всех
ϑ ∈ [t0]. Отсюда с учётом определения (71) вытекает неравенство εγ(κ)(y(·)). Так какt
и выбор функции y(·) был произвольным, установлено, что ε γ(κ)(x(·)) для всех x(·)t
X [t; x; V ; β; r]. Поэтому
ε
inf
γ(κ)(x(·)).t
x(·)X[t;x;V;β;r]
Итак, доказана следующая импликация:
((t, x) S(N, κε) \ W (S0(M, ε), S(N, κε)))
(∃V ∈ Vpos
∃β ∈ Gt
∃k ∈ N : ε
inf
γ(κ)(x(·))).
(120)
t
x(·)X[t;x;V ;β;k]
Из (116) и (120) вытекает требуемое утверждение. Предложение доказано.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1139
Предложение 16.3. Если (t, x) ∈ T × Rn, V ∈ Vpos, β ∈ G∗t и k ∈ N, то
∃x(·) X[t;x;V ;β;k] : γ(κ)t(x(·)) ε0(t, x).
= ε0(t,x).
В силу предложения 9.4 (t, x) ∈ W (S0(M, ε), S(N, κε)). Из (29) и (30) следует включение
(t, x) ∈ Wk(S0(M, ε), S(N, κε)).
(121)
Тогда (см. [38, предложение 7.5]) для некоторых y(·) X[t; x; V ; β; k] и
ϑ ∈ [t0] имеем
(
ϑ,y
ϑ)) ∈ S0(M, ε)) & ((t, y(t)) S(N, κε)
∀t ∈ [t
ϑ[).
(122)
При этом y(t) = x (см. п. 3, а также [38, 39]). Рассмотрим отдельно случаи
ϑ = t и
ϑ ∈ ]t0].
а) Пусть
ϑ=t. Тогда
ϑ,y
ϑ)) = (t, x) и, согласно (67), It
ϑ) = {t}. Из включения
(121) следует, что (t, x) S(N, κε). Согласно предложению 10.5 (t, y(t)) (ζκ)-1([0, ε]),
т.е. ζκ(t, y(t)) ε. Итак, ζκ(t, y(t)) ε для всех t ∈ It
ϑ). Отсюда с учётом включений
(122) получаем, что
(ζκ(t, y(t)) ε
∀t ∈ It
ϑ)) & (ρ
ϑ,y
ϑ); M) ε).
(123)
Вследствие (69) и (123) в случае а) верно неравенство ωκ(t, y(·)
ϑ) ε. Таким образом,
ϑ=t) (ωκ(t,y(·)
ϑ) ε).
(124)
б) Пусть
ϑ∈]t0]. Тогда (см. (67)) It
ϑ) = [t
ϑ[ и в силу включений (122) получаем
(ρ(
ϑ,y
ϑ)); M) ε) & ((t, y(t)) S(N, κε)
∀t ∈ It
ϑ)).
(125)
Из (125) и предложения 10.5 вытекает, в частности, что (t, y(t)) (ζκ)-1([0, ε]) для всех t ∈
It
ϑ). Получили (см. (125)) свойство (123). В силу (69) неравенство ωκ(t, y(·)
ϑ) ε верно
и в случае б). Следовательно, если
ϑ∈]t0], то ωκ(t,y(·)
ϑ) ε. Поэтому с учётом (124)
получаем, что ωκ(t, y(·)
ϑ) ε во всех возможных случаях. Тогда γ(κ)t(y(·)) ε в силу
(71). Учитывая выбор y(·), приходим к требуемому свойству. Предложение доказано.
Из предложения 16.3 вытекает следующее свойство: если (t, x) ∈ T × Rn, то определено
(конечное) значение
sup
inf
γ(κ)t(x(·)) [0, ε0(t, x)].
(V,β,k)Vpos×Gt∗ ×N
x(·)X[t;x;V ;β;k]
С учётом предложения 16.2 заключаем, что справедлива
Теорема 16.1. Если (t, x) ∈ T × Rn, то
ε0(t,x) =
sup
inf
γ(κ)(x(·)).t
(V,β,k)Vpos×Gt∗ ×N
x(·)X[t;x;V ;β;k]
Из равенств (80) и теорем 12.1, 16.1 вытекает
Теорема 16.2. Если (t, x) ∈ T × Rn, то ε0(t, x) есть цена игры на минимакс-
максимин γ(κ), при этомt
ε0(t,x) = min
sup
γ(κ)(x(·)) = mint
max
γ(κ)(x(·)) =t
α∈At∗ x(·)X[t;x;α]
α∈AΠt
x(·)X[t;x;α]
=
sup
inf
γ(κ)(x(·)).t
(V,β,k)Vpos×Gt∗ ×N
x(·)X[t;x;V ;β;k]
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
1140
ЧЕНЦОВ
СПИСОК ЛИТЕРАТУРЫ
1. Красовский Н.Н., Субботин А.И. Альтернатива для игровой задачи сближения // Прикл. матема-
тика и механика. 1970. Т. 34. № 6. C. 1005-1022.
2. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.
3. Ченцов А.Г. Об альтернативе в классе квазистратегий для дифференциальной игры сближения-
уклонения // Дифференц. уравнения. 1980. Т. 16. № 10. C. 1801-1808.
4. Айзекс Р. Дифференциальные игры. М., 1967.
5. Красовский Н.Н. Игровые задачи о встрече движений. М., 1970.
6. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного ре-
зультата. М., 1985.
7. Krasovskii A.N. Control under Lack of Information. Berlin etc., 1995.
8. Лукоянов Н.Ю. Функциональные уравнения Гамильтона-Якоби и задачи управления с наследствен-
ной информацией. Екатеринбург, 2011.
9. Чикрий А.А. Конфликтно управляемые процессы. Киев, 1992.
10. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М., 1977.
11. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М., 1991.
12. Понтрягин Л.С. К теории дифференциальных игр // Успехи мат. наук. 1996. Т. 21. № 4. C. 219-274.
13. Понтрягин Л.С. О линейных дифференциальных играх. I // Докл. АН СССР. 1967. Т. 174. № 6.
C. 1278-1280.
14. Понтрягин Л.С. О линейных дифференциальных играх. II // Докл. АН СССР. 1967. Т. 175. № 4.
C. 764-766.
15. Мищенко Е.Ф. Задачи преследования и уклонения от встречи в теории дифференциальных игр
// Изв. АН СССР. Техническая кибернетика. 1971. № 5. C. 3-9.
16. Пшеничный Б.Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т. 184. № 2. C. 185-
187.
17. Пшеничный Б.Н. О линейных дифференциальных играх // Кибернетика. 1968. № 1. C. 65-78.
18. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. Киев, 1992.
19. Subbotin A.I. Generalized Solutions of First-Order PDEs. The Dynamical Optimization Perspective.
Boston; Basel; Berlin, 1995.
20. Субботин А.И. Об одном свойстве субдифференциала // Мат. сб. 1991. Т. 182. № 9. C. 1315-1330.
21. Кряжимский А.В. К теории позиционных дифференциальных игр сближения-уклонения // Докл.
АН СССР. 1978. T. 239. № 4. C. 779-782.
22. Ченцов А.Г. О структуре одной игровой задачи сближения // Докл. АН СССР. 1975. Т. 224. № 6.
С. 1272-1275.
23. Ченцов А.Г. К игровой задаче наведения // Докл. АН СССР. 1976. Т. 226. № 1. С. 73-76.
24. Чистяков С.В. К решению игровых задач преследования // Прикл. математика и механика. 1977.
Т. 41. № 5. С. 825-832.
25. Ухоботов В.И. Построение стабильного моста для одного класса линейных игр // Прикл. матема-
тика и механика. 1977. Т. 41. № 2. С. 358-364.
26. Ченцов А.Г. Об игровой задаче сближения к заданному моменту времени // Изв. АН СССР. Сер.
матем. 1978. Т. 42. № 2. C. 455-467.
27. Ченцов А.Г. Метод программных итераций в игровой задаче наведения // Тр. ИММ УрО РАН.
2016. Т. 22. № 2. C. 304-321.
28. Ченцов А.Г., Хачай Д.М. Релаксация дифференциальной игры сближения-уклонения и методы
итераций // Тр. ИММ УрО РАН. 2018. Т. 18. № 4. C. 246-269.
29. Chentsov A.G., Khachay D.M. Program iterations method and relaxation of a pursuit-evasion differential
game / Advanced Control Techniques in Complex Engineering Systems: Theory and Applications. 2019.
V. 203. P. 129-161.
30. Ченцов А.Г., Хачай Д.М. Оператор программного поглощения и релаксация дифференциальной
игры сближения-уклонения // Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки. 2020. Т. 30.
№ 1. C. 64-91.
31. Ченцов А.Г. Релаксации игровой задачи сближения, связанные с альтернативой в дифференци-
альной игре сближения-уклонения // Вестн. российск. ун-тов. Математика. 2020. Т. 25. № 130.
C.196-244.
32. Куратовский К., Мостовский А. Теория множеств. М., 1970.
33. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.,
1977.
34. Биллингсли П. Сходимость вероятностных мер. М., 1977.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СБЛИЖЕНИЯ-УКЛОНЕНИЯ
1141
35. Дьедонне Ж. Основы современного анализа. М., 1964.
36. Ченцов A.Г. Метод программных итераций для дифференциальной игры сближения-уклонения.
Деп. в ВИНИТИ. № 1933-79 / Уральский политехн. ин-т им. С.М. Кирова. Свердловск, 1979.
37. Данфорд Н., Шварц Дж.Т. Линейные операторы. Общая теория. М., 1962.
38. Ченцов А.Г. Итерации стабильности и задача уклонения с ограничением на число переключений
// Тр. ИММ УрО РАН. 2017. Т. 23. № 2. C. 285-302.
39. Ченцов А.Г. Итерации стабильности и задача уклонения с ограничением на число переключений
формируемого управления // Изв. Ин-та математики и информатики Удмуртск. гос. ун-та. 2017.
Т. 49. C. 17-54.
40. Chentsov A.G., Morina S.I. Extensions and Relaxations. Dordrecht; Boston; London, 2002.
Институт математики и механики
Поступила в редакцию 28.09.2020 г.
им. Н.Н. Красовского УрО РАН, г. Екатеринбург,
После доработки 28.04.2021 г.
Уральский федеральный университет
Принята к публикации 08.06.2021 г.
им. Первого Президента России Б.Н. Ельцина,
г. Екатеринбург
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№8
2021