Доклады Российской академии наук. Математика, информатика, процессы управления, 2020, T. 495, № 1, стр. 107-111
ЗАДАЧА УКЛОНЕНИЯ ТРАЕКТОРИЙ ОТ РАЗРЕЖЕННОГО ТЕРМИНАЛЬНОГО МНОЖЕСТВА
1 Алмалыкский филиал
Национального исследовательского технологического университета “МИСиС”
Алмалык, Узбекистан
* E-mail: yugailp@mail.ru
Поступила в редакцию 20.10.2020
После доработки 20.10.2020
Принята к публикации 23.10.2020
Аннотация
Для нелинейных конфликтно управляемых процессов рассматривается задача уклонения (убегания) в постановке Л.С. Понтрягина и Е.Ф. Мищенко. Терминальное множество имеет дискретную структуру. В отличие от известных работ, оно состоит из счетного множества точек, расстояния между которыми не ограничены снизу некоторой положительной константой. Получены новые достаточные условия и метод уклонения, позволяющие решить ряд задач уклонения траекторий колебательных систем, в том числе задачу о раскачке обобщенного математического маятника.
A. Пусть конфликтно управляемый процесс (дифференциальная игра) описывается векторным дифференциальным уравнением
где $z \in {{R}^{n}}$, $u \in P \subset {{R}^{p}}$, $v \in Q \subset {{R}^{q}}$, P и Q – непустые компактные множества, содержащие начала ${{0}_{p}}\, \in \,{{R}^{p}}$ и ${{0}_{q}}\, \in \,{{R}^{q}}$ соответственно, функция $f(z,u,{v})$ непрерывна по совокупности переменных на множестве $X = {{R}^{n}} \times P \times Q$ и удовлетворяет при всех $(z,u,{v}) \in X$ неравенству где $C \geqslant 0$ – постоянная. Терминальное множество является дискретным и имеет вид(2)
$M\, = \,\bigcup\limits_{i = 1}^{ + \infty } {{\text{\{ }}{{m}_{i}}{\text{\} }}} ,\quad {{m}_{i}}\, \ne \,{{m}_{j}},\quad {\text{для}}\quad i \ne j,\quad {{m}_{i}}\, \in \,{{R}^{n}}.$Параметры u и ${v}$ в (1) выбираются противоборствующими сторонами (игроками) в виде измеримых функций $u = u(t) \in P$, ${v} = {v}(t) \in Q$, $t \geqslant 0$. Игрок, выбирающий ${v} = {v}(t) \in Q$ (уклоняющийся или убегающий игрок), ставит своей задачей при любом допустимом поведении $u(t) \in P$ уклонить соответствующую траекторию z(t) уравнения (1), начинающуюся из любой точки ${{z}_{0}} \in {{R}^{n}}{\backslash }M({{z}_{0}} = z(0))$ от M при всех $t \geqslant 0$. Такую задачу называют глобальной задачей уклонения (убегания), впервые она была сформулирована в [1]. Предполагается, что в каждый момент времени $t \geqslant 0$ уклоняющийся игрок, формируя значение управления ${v}(t) \in Q$, может использовать значения $u(s) \in P$ и $z(s)$ при $s \leqslant t$.
Б. Обозначим: $B({{0}_{n}},r)$ – замкнутый шар радиуса $r \geqslant 0$ c центром в начале ${{0}_{n}} \in {{R}^{n}}$, $n \in N$ = 1, 2, 3, ..., $S = \partial (B({{0}_{n}},1))$ – граница $B({{0}_{n}},1)$ (единичная сфера), ${\text{co\{ }}A{\text{\} }}$ – выпуклая оболочка множества A, 〈 , 〉 – знак скалярного произведения, ${\text{In}}{{{\text{t}}}_{{{{R}^{n}}}}}A$ – внутренность множества A относительно ${{R}^{n}}$, ${{\left| a \right|}^{2}} = \left\langle {a,a} \right\rangle $, $a \in {{R}^{n}}$.
Лемма 1. Пусть в задаче уклонения (1) с терминальным множеством (2) ${{z}_{0}} \in {{R}^{n}}{\backslash }M$, ${{m}_{i}} \in M$, и z(t) – некоторое допустимое решение (1) с начальным условием $z(0) = {{z}_{0}}$. Тогда:
1) z(t) будет определенным и неограниченно продолжаемым при $t \geqslant 0$;
2) для всех $t \in [0,\;1]$ выполняется неравенство
3) z(t) будет единственным на отрезке $I = [0,1]$, и не будет покидать при всех $t \in I$ шар $B({{0}_{n}},\rho (1))$, где $\rho (t) = 2\left( {1 + \left| {{{z}_{0}} - {{m}_{i}}} \right| + \left| {{{m}_{i}}} \right|} \right){{e}^{{Ct}}}$.
Пусть для ${{m}_{j}} \in M$, $j\, \in \,N$:
$g({{m}_{j}},u,{v})$ = $f({{m}_{j}},u,{v})$ – $f({{m}_{j}},{{0}_{p}},{{0}_{q}})$,
Определение 1. Множество векторов ${\text{\{ }}{{\psi }_{j}} \in {{R}^{n}}$, j = 1, 2, ..., n + 1} назовем набором Каратеодори (или K-набором), если эти векторы аффинно независимые и их некоторая выпуклая комбинация равна 0n. Множество всех K-наборов, составленных из векторов ${{A}_{{li}}}$, обозначим через ${{K}_{{li}}}$, $l = 1,\;2$.
Определение 2. Пусть
Лемма 2. Если ${{0}_{n}} \in {\text{co}}{{A}_{{li}}}$, $i \in N$, то ${{K}_{{li}}} \ne \not {0}$ и ${{N}_{{li}}} > 0$.
В. Сформулируем предположения и теорему о локальном уклонении.
Предположение 1. Для любого компактного множества K ⊂ X существует константа $L = L(K) > 0$, такая, что для всех $({{z}_{1}},u,{v}) \in K$ и $({{z}_{2}},u,{v}) \in K$ выполняется неравенство
Предположение 2 (о разреженности M). Существует число r0 > 0, такое, что для каждого $r \geqslant {{r}_{0}}$ множество $M \cap B({{0}_{n}},r) \ne \not {0}$ не пустое и состоит из конечного числа точек.
Предположение 3. $n = {\text{dim}}{{R}^{n}} \geqslant 2$, ${{0}_{n}} \in {{A}_{1}} \cup {{A}_{2}}$, где
Теорема 1 (о локальном уклонении). Пусть в задаче уклонения (1) с разреженным терминальным множеством (2) выполняются предположения 1–3, mi ∈ M – фиксированная точка. Тогда существуют константы ${{r}_{i}}$, δi, εi, θi, σi и допустимое управление ${{{v}}_{c}}(t) \in Q$, такие, что для любой начальной позиции ${{z}_{0}} \notin M$ с условием $\left| {{{z}_{0}} - {{m}_{i}}} \right| \leqslant {{\delta }_{i}}$ траектория z(t) уравнения (1), $z(0) = {{z}_{0}}$, соответствующая некоторому допустимому управлению $u(t) \in P$ и управлению ${{{v}}_{c}}(t) \in Q$, при всех $t \in [0;{{\theta }_{i}}]$ удовлетворяет неравенствам:
1) $z(t) \in B({{0}_{n}},{{r}_{i}})$;
2) $\tfrac{{{{\varepsilon }_{i}}}}{2} \geqslant \left| {z(t) - {{m}_{i}}} \right| \geqslant \tfrac{1}{3}{{N}_{{2i}}}t > 0$;
3) $\left| {z({{\theta }_{i}}) - {{m}_{i}}} \right| > {{\sigma }_{i}}$,
которые, в совокупности, обеспечивают локальное уклонение траектории z(t) от терминального множества M на отрезке $[0;{{\theta }_{i}}]$.
Основу доказательства теоремы 1 составляет алгоритм построения управления ${{{v}}_{c}}(t) \in Q$, обеспечивающего локальное уклонение траектории z(t) от точки mi ∈ M и от всего M. Ключевую роль здесь играет выполнение условий предположения 3, которые характеризуют преимущество (по ресурсам и информации) уклоняющегося игрока над преследователем. Управление локального уклонения ${{{v}}_{c}}(t)$ строится следующим образом:
(3)
${{{v}}_{c}}(t) = \left\{ \begin{gathered} {{{v}}_{1}}(t) \in Q,\quad {\text{если}}\quad {{0}_{n}} \in {{A}_{1}}, \hfill \\ {{{v}}_{2}}(t) \in Q,\quad {\text{если}}\quad {{0}_{n}} \in {{A}_{2}}, \hfill \\ \end{gathered} \right.$(4)
$\langle \psi _{{ik}}^{1},{{z}_{0}} - {{m}_{i}} + tf({{m}_{i}},{{0}_{p}},{{0}_{q}})\rangle \geqslant 0.$Далее, для $\psi _{{ik}}^{1} = \psi _{{ik}}^{1}({{z}_{0}},{{m}_{i}})$ (см. (4)) рассматривается уравнение относительно неизвестного ${v} \in Q$:
(5)
$\begin{gathered} \mathop {max}\limits_{v \in Q} \mathop {min}\limits_{u \in P} \left\langle {\psi _{{ik}}^{1},g({{m}_{i}},u,{v})} \right\rangle = \\ = \;\mathop {{\text{min}}}\limits_{u \in P} \left\langle {\psi _{{ik}}^{1},g({{m}_{i}},u,{v})} \right\rangle , \\ \end{gathered} $(6)
$\mathop {max}\limits_{v \in Q} \mathop {min}\limits_{u \in P} \left\langle {\psi _{{ik}}^{1},g({{m}_{i}},u,v)} \right\rangle \geqslant \frac{2}{3}{{N}_{{1i}}} > 0.$Неравенства (4) и (6) являются основой получения при всех $t \in (0,{{\theta }_{i}}]$ следующей оценки:
(7)
$\left| {z(t) - {{m}_{i}}} \right| \geqslant \left\langle {\psi _{{ik}}^{1},z(t) - {{m}_{i}}} \right\rangle \geqslant \frac{1}{3}{{N}_{{1i}}}t > 0,$Пусть теперь ${{0}_{n}} \in {{A}_{2}}$, тогда ${{K}_{{2i}}} \ne \not {0}$ и ${{N}_{{2i}}} > 0$, в этом случае говорят, что уклоняющийся игрок имеет минимаксное преимущество. Рассуждая аналогично, приходим к существованию K-набора $K_{i}^{2} = \{ \psi _{{ij}}^{2},j = 1,2, \ldots ,n + 1\} $ ∈ K2i и вектора $\psi _{{ik}}^{2} \in K_{i}^{2}$, таких, что выполняются неравенства, аналогичные (4) и (6):
(8)
$\left\langle {\psi _{{ik}}^{2},{{z}_{0}} - {{m}_{i}} + tf({{m}_{i}},{{0}_{p}},{{0}_{q}})} \right\rangle \geqslant 0,$(9)
$\mathop {min}\limits_{u \in P} \mathop {max}\limits_{{v} \in Q} \left\langle {\psi _{{ik}}^{2},g({{m}_{i}},u,{v})} \right\rangle \geqslant \frac{2}{3}{{N}_{{1i}}} > 0.$Если преследователь применяет допустимое управление $u(t) \in P$, $t \in [0;{{\theta }_{i}}]$, то из (9) следует неравенство
(10)
$\mathop {{\text{max}}}\limits_{{v} \in Q} \left\langle {\psi _{{ik}}^{2},g({{m}_{i}},u(t),{v})} \right\rangle \geqslant \frac{2}{3}{{N}_{{1i}}} > 0.$Для построения управления уклонения нужно рассмотреть уравнение относительно неизвестного ${v} \in Q$:
(11)
$\mathop {{\text{max}}}\limits_{{v} \in Q} \left\langle {\psi _{{ik}}^{2},g({{m}_{i}},u(t),{v})} \right\rangle = \left\langle {\psi _{{ik}}^{2},g({{m}_{i}},u(t),{v})} \right\rangle .$Для каждого t решений уравнения (11) может быть несколько, и тогда возникает задача выбора допустимой однозначной измеримой ветви ${{{v}}_{2}}(t) = {v}({{z}_{0}}$, mi, u(t)) ∈ Q. Существование и способ построения измеримого управления ${{{v}}_{2}}(t) \in Q$, являющегося решением (11), обеспечивается аналогом известной леммы Филиппова для дифференциальных игр [7]. По этой лемме найдется измеримое управление ${{{v}}_{2}}(t) = {{{v}}_{2}}({{z}_{0}},{{m}_{i}},u(t)) \in Q$, являющееся решением (11), и для которого, очевидно, выполняются неравенства (8) и (10). Если уклоняющийся игрок будет применять построенное управление ${{{v}}_{2}}(t) \in Q$, то доказывается, что можно добиться выполнения неравенств
Ниже управление ${{{v}}_{c}}(t) \in Q$ будем называть специальным управлением уклонения от точки ${{m}_{i}} \in M$ при $t \in [0;{{\theta }_{i}}]$, а процесс и результат применения ${{{v}}_{c}}(t) \in Q$ будем называть маневром обхода точки mi ∈ M.
Теорема 2 (о глобальном уклонении). Пусть в задаче уклонения (1) с разреженным терминальным множеством (2) выполняются предположения 1–3. Тогда из любой начальной позиции ${{z}_{0}} \notin M$ возможно уклонение траектории $z(t)$, $z(0)$ = z0, уравнения (1) от M при всех $t \geqslant 0$.
Опишем кратко процесс уклонения, который происходит индуктивно и организован на основе теоремы 1 (о локальном уклонении) следующим образом. На первом шаге строится шар $B({{0}_{n}},{{r}_{1}})$, для которого эффективно вычисляется ${{r}_{1}} > 0$ (лемма 1), такое, чтобы в шар входили z0 и некоторые точки из M, образующие конечное множество ${{M}_{1}} \subset M$ (предположение 2). Пусть L1 = ${{L}_{1}}({{K}_{1}})$ – константа Липшица для компакта ${{K}_{1}} = B({{0}_{n}},{{r}_{1}})$ × P × Q. Затем из $B({{0}_{n}},{{r}_{1}})$ удаляются все точки M1, лежащие достаточно близко к его границе $\partial (B({{0}_{n}},1))$ вместе со своими окрестностями (радиусы окрестностей вычисляются, и все они меньше единицы). В результате получается компактное множество ${{B}_{1}} \subset B({{0}_{n}},{{r}_{1}})$. Доказывается, что траектория z(t), начинающаяся из любой точки ${{z}_{0}} \notin {{M}_{1}}$ и расположенная внутри B1, либо не попадает на M при всех $t \geqslant 0$ (совершая в B1 конечное или бесконечное число маневров обхода), либо в какой-то конечный момент ${{t}_{1}} > 0$ выходит на границу $S = \partial ({{B}_{1}})$. При этом, до момента выхода на границу убегающий игрок строит свое управление уклонения на основе специальных управлений маневров обхода точек из M1 (теорема 1) либо свободного управления ${v}(t) = {{0}_{q}}$. Момент выхода на границу означает завершение первого цикла и начало второго, на котором последовательно определяются $B({{0}_{n}},{{r}_{2}}),{{K}_{2}} = B({{0}_{n}},{{r}_{2}}) \times P \times Q$, ${{L}_{2}} = {{L}_{2}}({{K}_{2}})$, M2 и строится множество ${{B}_{2}} \subset B({{0}_{n}},{{r}_{2}})$, для которого рассматриваются все возможные ситуации поведения z(t) при $t > {{t}_{1}}$, аналогичные рассмотренным для B1. При этом полагают ${{t}_{1}} = 0$, $z({{t}_{1}})$ = z0, и ${{r}_{2}} > {{r}_{1}} + 2$. Продолжая процесс уклонения траектории от терминального множества, получаем последовательность компактов
лежащих в шарах радиусов ${{r}_{1}} < {{r}_{2}} < \; \ldots \; < {{r}_{k}} < \; \ldots $, где ${{r}_{{k + 1}}} \geqslant {{r}_{k}} + 2$. Очевидно, что ${{r}_{k}} \to \infty $ при $k \to \infty $. Доказывается, что случаи выхода траектории на границу Bk в моменты ${{t}_{k}} > 0$ на каждом k-цикле возможны только при ${{t}_{1}} + {{t}_{2}} + \; \ldots \; + {{t}_{k}} = {{T}_{k}} \to \infty $, так что $z(t)$ не попадает на M при всех $t \geqslant 0$. Поэтому во всех рассмотренных случаях траектория $z(t)$, начинающаяся из точки ${{z}_{0}} \notin M$, не попадет на M при всех $t \geqslant 0$, т.е. из ${{z}_{0}} \notin M$ возможно уклонение траектории от M.Г. Пример (Задача о раскачке обобщенного математического маятника).
Пусть уравнения движения конфликтно управляемой системы имеют вид
(12)
$\begin{gathered} \frac{{d{{z}_{1}}}}{{dt}} = {{z}_{2}}, \\ \frac{{d{{z}_{2}}}}{{dt}} = - asin({{\gamma }_{0}} + {{\gamma }_{1}}z_{1}^{{{{\delta }_{1}}}} + {{\gamma }_{2}}z_{1}^{{{{\delta }_{2}}}}) + u + {v}, \\ \end{gathered} $(13)
$\frac{{d{{z}_{1}}}}{{dt}} = {{z}_{2}},\quad \frac{{d{{z}_{2}}}}{{dt}} = - asin({{z}_{1}} + \mu z_{1}^{2}) + u + {v}.$Терминальное множество M будет состоять из нижних положений равновесия (13), имеющих вид ${{m}_{k}} = (z_{1}^{k};0)$, где $z_{1}^{k}$ – корни уравнения z1 + $\mu z_{1}^{2}$ = = 2πk, $k = 0,1,2$, ... Таким образом, M = {mk = = $(z_{1}^{k};0),k = 0,1,2$, ...}.
Задача раскачки [2] для обобщенного математического маятника (13) заключается в построении уклоняющимся игроком управления, обеспечивающего уклонение траектории (13) от M при всех $t \geqslant 0$. Для решения этой задачи установим выполнимость предположений 1–3 из теоремы 2. Прямые вычисления показывают, что
(14)
$\frac{{{{d}_{2}}}}{{\sqrt k }} \geqslant {\text{|}}z_{1}^{{(k + 1)}} - z_{1}^{k}{\text{|}} \geqslant \frac{{{{d}_{1}}}}{{\sqrt {k + 1} }},\quad k = 0,\;1,\;2,\; \ldots ,$Таким образом, для рассматриваемого примера выполняются все условия предположений 1–3, поэтому по теореме 2 разрешима глобальная задача о раскачке обобщенного математического маятника (13).
Замечание 1. Выбор аргумента синуса в (13) связан с возможными неточностями измерения аргумента, либо с неопределенностью в точном определении его значений [6].
Замечание 2. Для примера (13) не выполняются условия работ [2, 3, 8].
Список литературы
Понтрягин Л.С., Мищенко Е.Ф. Задача убегания одного управляемого объекта от другого // ДАН СССР. 1969. Т. 189. № 4. С. 721–723.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 496 с.
Мищенко Е.Ф., Никольский М.С., Сатимов Н. // Задача уклонения от встречи в дифференциальных играх многих лиц // Тр. Матем. ин-та им. В.А. Стеклова. 1977. Вып. 143. С. 105–128.
Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980. 484 с.
Пилипенко Ю.В., Чикрий А.А. Колебательные конфликтно управляемые процессы // Прикл. матем. и механика. 1993. Т. 57. Вып. 3. С. 3–14.
Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. 392 с.
Мищенко Е.Ф., Сатимов Н.Ю. Задача об уклонении от встречи в дифференциальных играх с нелинейными управлениями // Дифф. уравнения. 1973. Т. 9. № 10. С. 1792–1797.
Югай Л.П. К задаче о раскачке маятника // Матер. 13-й межд. конф. “Устойчивость и колебания нелинейных систем управления” (конференция Пятницкого). Москва, 1–3 июня, 2016. С. 429–432.
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления