Доклады Российской академии наук. Математика, информатика, процессы управления, 2020, T. 494, № 1, стр. 86-92

РЕШЕНИЕ СЕРИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С 2-МЕРНЫМ УПРАВЛЕНИЕМ НА ОСНОВЕ ВЫПУКЛОЙ ТРИГОНОМЕТРИИ

А. А. Ардентов 1*, Л. В. Локуциевский 2**, Ю. Л. Сачков 13***

1 Институт программных систем им. А.К. Айламазяна Российской академии наук
Переславский район, Ярославская область, Веськово, Россия

2 Математический институт им. В.А. Стеклова Российской академии наук
Москва, Россия

3 Научно-технологический университет “Сириус”
Сочи, Россия

* E-mail: aaa@pereslavl.ru
** E-mail: lion.lokut@gmail.com
*** E-mail: yusachkov@gmail.com

Поступила в редакцию 10.06.2020
После доработки 10.06.2020
Принята к публикации 13.07.2020

Полный текст (PDF)

Аннотация

Рассматривается ряд задач оптимального управления с двумерным управлением, принадлежащим произвольному выпуклому компакту $\Omega $. Решение этих задач получено на основе методов выпуклой тригонометрии. Рассмотрены: (1) геодезические в финслеровой задаче на плоскости Лобачевского, (2) левоинвариантные субфинслеровы задачи на всех унимодулярных 3-мерных группах Ли (${\text{SU}}(2)$, ${\text{SL}}(2)$, SE(2), ${\text{SH}}(2)$); (3) задача о качении шара по плоскости с функцией расстояния, заданной множеством Ω; (4) серия “задач о яхтах”, обобщающих задачу Эйлера об эластиках, задачу Маркова–Дубинса, задачу Ридса–Шеппа и новую субриманову задачу на SE(2).

Ключевые слова: субфинслерова геометрия, выпуклая тригонометрия, задача оптимального управления, плоскость Лобачевского, унимодулярные 3-мерные группы Ли, качение шара по плоскости, эластика Эйлера, задачи о яхтах

В работе [1] были введены обобщенные тригонометрические функции, для которых вместо круга используется произвольное компактное выпуклое множество на плоскости, содержащее начало координат внутри. Это обобщение названо выпуклой тригонометрией. В данной работе выпуклая тригонометрия применяется для явного интегрирования ряда нетривиальных задач оптимального управления с двумерным управлением.

1. ФИНСЛЕРОВЫ ГЕОДЕЗИЧЕСКИЕ НА ПЛОСКОСТИ ЛОБАЧЕВСКОГО

Рассмотрим задачу быстродействия на верхней полуплоскости ${{L}^{2}} = \{ (x,y)$, y > 0}:

(1)
$\begin{gathered} T \to inf;\quad \dot {x} = y{{u}_{1}};\quad \dot {y} = y{{u}_{2}}; \\ ({{u}_{1}},{{u}_{2}}) \in \Omega \subset {{\mathbb{R}}^{2}}; \\ \end{gathered} $
где Ω – выпуклое компактное множество на плоскости, $0 \in {\text{int}}\,\Omega $ и заданы произвольные граничные условия на x и y. Решения этой задачи являются финслеровыми геодезическими на L2.

В этом разделе мы получим явные формулы для геодезических на L2 в терминах выпуклой тригонометрии (случай симметричного множества Ω разобран в [2]). Согласно принципу максимума Понтрягина,

$\mathcal{H} = py{{u}_{1}} + qy{{u}_{2}}.$

Обозначим коэффициенты при управлениях через ${{h}_{1}} = py$ и ${{h}_{2}} = qy$, здесь p = const. Тогда, так как

$H = \mathop {max}\limits_{({{u}_{1}},{{u}_{2}}) \in \Omega } \mathcal{H} = {{s}_{\Omega }}({{h}_{1}},{{h}_{2}}) = {\text{const}} > 0,$
то $({{h}_{1}},{{h}_{2}}) \in H\partial \Omega ^\circ $. Делая замену с помощью функций выпуклой тригонометрии (см. [1])
(2)
$\begin{gathered} {{h}_{{\,1}}} = H{\text{co}}{{{\text{s}}}_{{\Omega ^\circ }}}\theta ^\circ ;\quad {{h}_{2}} = H{\text{si}}{{{\text{n}}}_{{\Omega ^\circ }}}\theta ^\circ ;\quad \\ {{u}_{1}} = {\text{co}}{{{\text{s}}}_{\Omega }}\theta ;\quad {{u}_{2}} = {\text{si}}{{{\text{n}}}_{\Omega }}\theta ;\quad {\text{где}}\quad \theta \leftrightarrow \theta ^\circ ; \\ \end{gathered} $
приходим к уравнению натуральной параметризации на геодезических

(3)
$\dot {\theta }^\circ = \frac{{{{h}_{1}}{{{\dot {h}}}_{2}} - {{h}_{2}}{{{\dot {h}}}_{1}}}}{H} = - co{{s}_{{\Omega ^\circ }}}\theta ^\circ .$

Откуда, если $p \ne 0$, получаем x = x0$\tfrac{H}{p}si{{n}_{{\Omega ^\circ }}}\theta ^\circ $ и $y = \tfrac{H}{p}co{{s}_{{\Omega ^\circ }}}\theta ^\circ $, где ${{x}_{0}} = {\text{const}}$. Итак, доказана

Теорема 1. Если $p \ne 0$, то экстремали в задаче (1) получаются поворотом $\Omega ^\circ $ на ${\text{(sgn}}p)90^\circ $, растяжением в $H{\text{/|}}p{\text{|}}$, сдвигом вдоль горизонтальной оси на x0и взятием части границы, лежащей в L2. Натуральная параметризация определяется уравнением (3).

Если p = 0, то управление меняется произвольно в верхнем ребре $\Omega $ (если $q = {\text{const}} > 0$), либов нижнем (если $q = {\text{const}} < 0$).

2. СУБФИНСЛЕРОВЫ ЗАДАЧИ НА 3-МЕРНЫХ ГРУППАХ ЛИ

2.1. Постановка задачи

Пусть G есть 3-мерная унимодулярная группа Ли, и $L = {{T}_{{Id}}}G$ ее алгебра Ли, где Id – единичный элемент группы G. Возможны следующие случаи [3]: $L = {{\mathfrak{h}}_{3}}$ есть алгебра Гейзенберга, $L = \mathfrak{s}{{\mathfrak{u}}_{2}}$ есть алгебра Ли группы унитарных матриц порядка 2, $L = \mathfrak{s}{{\mathfrak{l}}_{2}}$ есть алгебра Ли группы унимодулярных матриц порядка 2, $L = \mathfrak{s}{{\mathfrak{e}}_{2}}$ ($L = \mathfrak{s}{{\mathfrak{h}}_{2}}$) есть алгебра Ли группы евклидовых (соответственно гиперболических) движений 2-мерной плоскости.

Пусть $\Delta \subset L$ есть 2-мерное подпространство, не являющееся подалгеброй Ли, и пусть $U \subset \Delta $ есть выпуклый компакт, такой что $0 \in in{{t}_{\Delta }}U$. Рассматривается следующая левоинвариантная задача оптимального управления:

(4)
$\dot {q} \in qU,\quad q \in G,$
(5)
$q(0) = {{q}_{0}},\quad q(T) = {{q}_{1}},$
(6)
$T \to min.$

В силу левоинвариантности задачи (4)–(6), можно положить ${{q}_{0}} = Id$.

По теореме Аграчева–Барилари [4], существует базис L = $span({{X}_{1}},{{X}_{2}},{{X}_{3}})$, в котором

$\Delta = span({{X}_{1}},{{X}_{2}}),$
(7)
$\begin{gathered} \text{[}{{X}_{1}},{{X}_{2}}] = {{X}_{3}},\quad [{{X}_{3}},{{X}_{1}}] = (\chi + \kappa ){{X}_{2}}, \\ [{{X}_{3}},{{X}_{2}}] = (\chi - \kappa ){{X}_{1}}, \\ \end{gathered} $
$\chi = \kappa = 0\quad {\text{или}}\quad ({{\chi }^{2}} + {{\kappa }^{2}} = 1,\chi \geqslant 0).$

Случай $\chi = \kappa = 0$ соответствует алгебре Гейзенберга $L = {{\mathfrak{h}}_{3}}$ [5, 8]. В случае ${{\chi }^{2}} + {{\kappa }^{2}} = 1$, $\chi \geqslant 0$ таблица умножения в алгебре Ли L сводится заменой переменных к следующей:

(8)
$[{{X}_{1}},{{X}_{2}}] = {{X}_{3}},\quad [{{X}_{3}},{{X}_{1}}] = a{{X}_{2}},\quad [{{X}_{3}},{{X}_{2}}] = b{{X}_{1}},$
(9)
$a,b \in \{ \pm 1,0\} ,\quad a + b \geqslant 0,\quad (a,b) \ne (0,0),$
где $a = sgn(\chi + \kappa )$, $b = sgn(\chi - \kappa )$.

Введем параметризацию U = {u1X1 + u2X2 | u = = $({{u}_{1}},{{u}_{2}}) \in \Omega \} $. Тогда задача (4)–(6) принимает форму

(10)
$\dot {q} = {{u}_{1}}{{X}_{1}}(q) + {{u}_{2}}{{X}_{2}}(q),\quad q\, \in \,G,\quad u = ({{u}_{1}},{{u}_{2}})\, \in \,\Omega ,$
(11)
$q(0) = {{q}_{0}} = Id,\quad q(T) = {{q}_{1}},$
(12)
$T \to min,$
где левоинвариантные поля X1, X2 на группе Ли $G$ удовлетворяют условиям (8), (9).

2.2. Принцип максимума Понтрягина

Оптимальное управление в задаче (10)–(12) существует по теоремам Рашевского–Чжоу и Филиппова [7]. Введем линейные на слоях кокасательного расслоения T*G гамильтонианы hi(λ) = = $\langle \lambda ,{{X}_{i}}(q)\rangle $, $q = \pi (\lambda )$, i = 1, 2, 3, где π: T*G $ \to G$ есть каноническая проекция. Согласно принципу максимума Понтрягина [6, 7], для оптимальных траектории q(t) и управления u(t), $t \in [0,T]$, существует липшицева кривая ${{\lambda }_{t}} \in T_{{q(t)}}^{*}G$, ${{\lambda }_{t}} \ne 0$, $t \in [0,T]$, удовлетворяющая условиям (здесь ${{h}_{i}} = \langle {{\lambda }_{t}},{{X}_{i}}\rangle $):

(13)
${{u}_{1}}{{h}_{1}} + {{u}_{2}}{{h}_{2}} = \mathop {max}\limits_{w \in \Omega } ({{w}_{1}}{{h}_{1}} + {{w}_{2}}{{h}_{2}}) = {{s}_{\Omega }}({{h}_{1}},{{h}_{2}}) = :H,$
(14)
$\begin{gathered} {{{\dot {h}}}_{1}} = - {{u}_{2}}{{h}_{3}}, \\ {{{\dot {h}}}_{2}} = {{u}_{1}}{{h}_{3}}, \\ {{{\dot {h}}}_{3}} = - a{{u}_{1}}{{h}_{2}} - b{{u}_{2}}{{h}_{1}}, \\ \dot {q} = {{u}_{1}}{{X}_{1}} + {{u}_{2}}{{X}_{2}}, \\ \end{gathered} $
$H({{\lambda }_{t}}) \equiv {\text{const}} \geqslant 0.$

Анормальные траектории постоянны.

Рассмотрим нормальный случай H > 0. Вертикальная подсистема гамильтоновой системы (14) с помощью той же замены (2) сводится к системе

(15)
$\begin{gathered} \dot {\theta }^\circ = \frac{{{{h}_{3}}}}{H}, \\ {{{\dot {h}}}_{3}} = - H(a{\text{co}}{{{\text{s}}}_{\Omega }}\theta {\text{si}}{{{\text{n}}}_{{\Omega ^\circ }}}\theta ^\circ + bsi{{n}_{\Omega }}\theta {\text{co}}{{{\text{s}}}_{{\Omega ^\circ }}}\theta ^\circ ). \\ \end{gathered} $

Функция $\mathcal{C} = \tfrac{1}{2}(h_{3}^{2} - bh_{1}^{2} + ah_{2}^{2})$ является функцией Казимира на коалгебре Ли $L{\kern 1pt} *$, поэтому $\mathbb{E} = \frac{\mathcal{C}}{H}$ есть первый интеграл системы (15). Разложим

$\begin{gathered} \mathbb{E} = \tfrac{1}{{2H}}h_{3}^{2} + \mathcal{U}(\theta ^\circ ), \\ \mathcal{U}({{\theta }^{{^{ \circ }}}}) = \tfrac{1}{{2H}}(ah_{2}^{2} - bh_{1}^{2}) = \tfrac{H}{2}(a{\text{sin}}_{{\Omega ^\circ }}^{2}\theta ^\circ - b{\text{cos}}_{{\Omega ^\circ }}^{2}\theta ^\circ ). \\ \end{gathered} $

Система (15) является гамильтоновой системой с гамильтонианом $\mathbb{E}$:

(16)
$\begin{gathered} \dot {\theta }^\circ = \frac{{{{h}_{3}}}}{H},\quad \theta ^\circ \in {\mathbb{R} \mathord{\left/ {\vphantom {\mathbb{R} {(2\mathbb{S}^\circ \mathbb{Z}}}} \right. \kern-0em} {(2\mathbb{S}^\circ \mathbb{Z}}}), \\ {{{\dot {h}}}_{3}} \in - \mathcal{U}{\kern 1pt} '(\theta ^\circ ),\quad {{h}_{3}} \in \mathbb{R}\,, \\ \end{gathered} $
где $\mathbb{S}^\circ $ – площадь Ω°. Для описания свойств регулярности экстремальной введем следующие множества:

${{\mathfrak{S}}_{k}} = \{ ({{h}_{1}},{{h}_{2}}) \in {{\mathbb{R}}^{2}}\,{\text{|}}\,H \notin {{C}^{k}}({{h}_{1}},{{h}_{2}})\} ,\quad k = 1,2.$

Экстремаль ${{\lambda }_{t}}$, $t \in [\alpha ,\beta ]$, α < β, называется: релейной дугой, если $({{h}_{1}},{{h}_{2}})({{\lambda }_{t}}) \notin {{\mathfrak{S}}_{2}}$ для п.в. $t \in (\alpha ,\beta )$; особой дугой, если $({{h}_{1}},{{h}_{2}})({{\lambda }_{t}}) \in {{\mathfrak{S}}_{2}}$ для всех $t \in [\alpha $, β]; смешанной, если она есть конкатенация конечного числа релейных и особых дуг.

2.3. Релейные экстремали

Система (16) имеет неподвижные точки $(\theta ^\circ ,{{h}_{3}})$ = = $(\theta _{*}^{^\circ },0)$, в которых $\mathcal{U}{\kern 1pt} '(\theta _{*}^{{^{ \circ }}}) \ni 0$.

Если $\mathcal{U}(\theta ^\circ )$ имеет локальный минимум в $\theta _{*}^{^\circ }$, убывает на интервале $(\theta _{*}^{{^{ \circ }}} - \varepsilon ,\theta _{*}^{{^{ \circ }}}]$ и возрастает на интервале $[\theta _{*}^{{^{ \circ }}},\theta _{*}^{{^{ \circ }}} + \varepsilon )$, то фазовый портрет системы (16) имеет неподвижную точку $(\theta ^\circ ,{{h}_{3}}) = (\theta _{*}^{{^{ \circ }}},0)$ типа центр.

Если $\mathcal{U}(\theta ^\circ )$ имеет локальный максимум в $\theta _{*}^{{^{ \circ }}}$, возрастает на интервале $(\theta _{*}^{{^{ \circ }}} - \varepsilon ,\theta _{*}^{{^{ \circ }}}]$ и убывает на интервале $[\theta _{*}^{{^{ \circ }}},\theta _{*}^{{^{ \circ }}} + \varepsilon )$, то фазовый портрет системы (16) имеет подвижную точку $({{\theta }^{{^{ \circ }}}},{{h}_{3}}) = (\theta _{*}^{{^{ \circ }}},0)$ типа седло. Сепаратриса, входящая в неподвижную точку $(\theta _{*}^{{^{ \circ }}},0)$ в полосе $\theta ^\circ \in (\theta _{*}^{{^{ \circ }}} - \varepsilon ,\theta _{*}^{{^{ \circ }}})$, попадает в эту точку за время, равное несобственному интегралу

$I = H\int\limits_{\theta _{ * }^{^\circ } - \varepsilon }^{\theta _{ * }^{^\circ }} {\tfrac{{d\theta ^\circ }}{{\sqrt {2(\mathbb{E} - \mathcal{U}(\theta ^\circ ))} }}} $.

Это время конечно или бесконечно в зависимости от того, сходится интеграл $I$ или расходится. Аналогично для сепаратрисы в полосе ${{\theta }^{{^{ \circ }}}} \in (\theta _{*}^{{^{ \circ }}},\theta _{*}^{{^{ \circ }}}$ + ε).

2.4. Особые экстремали

Кривая λt и управление u(t) являются особыми тогда и только тогда, когда $\theta ^\circ \equiv {\text{const}}$, ${{h}_{3}} \equiv 0$,

$a{\text{si}}{{{\text{n}}}_{{\Omega ^\circ }}}\theta ^\circ co{{s}_{\Omega }}\theta + b{\text{co}}{{{\text{s}}}_{{\Omega ^\circ }}}\theta ^\circ {\text{si}}{{{\text{n}}}_{\Omega }}\theta \equiv 0,$
${\text{co}}{{{\text{s}}}_{{\Omega ^\circ }}}\theta ^\circ co{{s}_{\Omega }}\theta + {\text{si}}{{{\text{n}}}_{{\Omega ^\circ }}}\theta ^\circ {\text{si}}{{{\text{n}}}_{\Omega }}\theta \equiv 1,$
$({{h}_{1}}({{\lambda }_{t}}),{{h}_{2}}({{\lambda }_{t}})) \in {{\mathfrak{S}}_{2}}.$

2.5. Смешанные экстремали

Смешанная экстремаль появляется, когда релейная дуга $(\theta ^\circ (t),{{h}_{3}}(t))$ входит за конечное время в точку $(\theta _{*}^{{^{ \circ }}},0)$, соответствующую особой экстремали.

2.6. Частные случаи и примеры

Теорема 2. Если Ω есть выпуклый многоугольник, содержащий начало координат внутри себя, то все экстремали в задаче (10)–(12) релейные, особые или смешанные.

Теорема 3. Если Ω есть строго выпуклый компакт, содержащий начало координат внутри себя и $\partial \Omega ^\circ $ является k-гладкой, $k \geqslant 2$, то все экстремали в задаче (10)–(12) релейные и C k-гладкие.

Пример 1. $\Omega \, = \,\{ {\text{||}}u{\text{|}}{{{\text{|}}}_{\infty }}\, \leqslant \,1\} $ или $\Omega \, = \,\{ {\text{||}}u{\text{|}}{{{\text{|}}}_{1}}\, \leqslant \,1\} $. В этих случаях все экстремальные траектории релейные, особые или смешанные.

Пример 2. $\Omega = \{ {\text{||}}u{\text{|}}{{{\text{|}}}_{p}} \leqslant 1\} $, $1 < p < \infty $.

Теорема 4. Пусть $\Omega = \{ u \in {{\mathbb{R}}^{2}}\,{\text{|}}\,{\text{||}}u{\text{|}}{{{\text{|}}}_{p}} \leqslant 1\} $, $p \in (1$, +∞). Если $1 < p < 2$, то все экстремали в задаче (10)–(12) релейные. Если p > 2, то возникают особые экстремали. Смешанные экстремали существуют тогда и только тогда, когда ($2 < p < \infty $ и a = 1).

3. КАЧЕНИЕ ШАРА ПО ФИНСЛЕРОВОЙ ПЛОСКОСТИ

Рассмотрим следующую задачу быстродействия:

(17)
$\begin{gathered} T \to min;\quad \dot {x} = {{u}_{1}};\quad \dot {y} = {{u}_{2}}; \\ \dot {z} = \frac{1}{2}z({{u}_{2}}{\mathbf{i}} - {{u}_{1}}{\mathbf{j}});\quad u = ({{u}_{1}},{{u}_{2}}) \in \Omega \subset {{\mathbb{R}}^{2}}. \\ \end{gathered} $

Здесь $(x,y) \in {{\mathbb{R}}^{2}}$ – координаты центра шара, $z \in \mathbb{H}$ задает его поворот, Ω – выпуклое компактное множество на плоскости, $0 \in {\text{int}}\Omega $ и заданы произвольные граничные условия. Таким образом, задача (17) есть задача о поиске такого движения шара по плоскости без прокручивания и без проскальзывания, что точка касания (или, равносильно, центр) движется по кривой кратчайшей длины в финслеровой метрике на плоскости ${{\mathbb{R}}^{2}}$, задаваемой множеством Ω.

Обозначим через $(p,q) \in {{\mathbb{R}}^{2}}$ сопряженные переменные к (x, y) и через $r \in \mathbb{H}$ – к z. Скалярное произведение z и r есть $\Re (z\bar {r})$. Согласно принципу максимума Понтрягина

$\begin{gathered} \mathcal{H} = p{{u}_{1}} + q{{u}_{2}} - \frac{1}{2}\Re (z{\mathbf{j}}\bar {r}){{u}_{1}} + \frac{1}{2}\Re (z{\mathbf{i}}\bar {r}){{u}_{2}} = \\ \, = \left( {p - \frac{1}{2}\Re (z{\mathbf{j}}\bar {r})} \right){{u}_{1}} + \left( {q + \frac{1}{2}\Re (z{\mathbf{i}}\bar {r})} \right){{u}_{2}}. \\ \end{gathered} $

Явные формулы для решений могут быть получены в терминах выпуклой тригонометрии. Обозначим через h1 и h2 – коэффициенты при u1 и u2. Очевидно, $\dot {p} = \dot {q} = 0$. Вертикальная подсистема гамильтоновых уравнений для ${{h}_{3}} = - \tfrac{1}{2}\Re (z{\mathbf{k}}\bar {r})$ имеет вид

(18)
$\begin{gathered} {{{\dot {h}}}_{1}} = - {{h}_{3}}{{u}_{2}};\quad {{{\dot {h}}}_{2}} = {{h}_{3}}{{u}_{1}}; \\ {{{\dot {h}}}_{3}} = (q - {{h}_{2}}){{u}_{1}} + ({{h}_{1}} - p){{u}_{2}}. \\ \end{gathered} $

Она замыкается до полной системы уравнений принципом максимума $\mathcal{H} = {{h}_{1}}{{u}_{1}} + {{h}_{2}}{{u}_{2}} \to max$ по $({{u}_{1}},{{u}_{2}}) \in \Omega $.

Сама вертикальная подсистема не зависит от формы множества Ω, но управления, максимизирующие $\mathcal{H}$, зависят принципиально. Тем не менее, как и в предыдущих задачах, при любом множестве Ω решения могут быть найдены с помощью функций выпуклой тригонометрии (см. [1]). Пусть $H = \mathop {max}\limits_{({{u}_{1}},{{u}_{2}}) \in \Omega } \mathcal{H}$. Если H = 0, то $({{u}_{1}},{{u}_{2}})\,{\text{||}}\,(p,q)$, и мы получаем, что анормальные экстремали есть прямые линии. Если H > 0, опять делая замену (2), находим первый интеграл вертикальной подсистемы (18):

(19)
$\begin{gathered} \mathbb{E} = \frac{1}{2}H(\theta {{^\circ }^{2}} + {\text{cos}}_{{\Omega ^\circ }}^{2}\theta ^\circ + {\text{sin}}_{{{{\Omega }^{{^{ \circ }}}}}}^{2}\theta ^\circ ) - \\ \, - p{\text{co}}{{{\text{s}}}_{{\Omega ^\circ }}}\theta ^\circ - q{\text{si}}{{{\text{n}}}_{{\Omega ^\circ }}}\theta ^\circ = \frac{1}{{2H}}h_{3}^{2} + \mathcal{U}(\theta ^\circ ). \\ \end{gathered} $

Система на $(\theta ^\circ ,{{h}_{3}})$ опять является гамильтоновой с гамильтонианом $\mathbb{E}$:

${{\dot {\theta }}^{{^{ \circ }}}} = \frac{{{{h}_{3}}}}{H};\quad {{\dot {h}}_{3}} \in - \mathcal{U}{\kern 1pt} '({{\theta }^{{^{ \circ }}}}).$

Теорема 5. Если Ω – эллипс с центром в начале координат, то вертикальная подсистема (18) для случая H > 0 интегрируется в эллиптических функциях.

Топологическая структура фазового портрета на плоскости $(\theta ^\circ ,\dot {\theta }^\circ )$ зависит от констант p, q и H >  0 и может быть исследована явно, например, для случая многогранника получаем следующую теорему.

Теорема 6. Предположим, что Ω – выпуклый многоугольник. Тогда в задаче (17) есть два типа нормальных экстремалей:

1. Если управление u движется произвольно, не покидая некоторого ребра e в Ω, то соответствующая экстремаль оптимальна. В этом случае точка $\left( {\tfrac{p}{H},\tfrac{q}{H}} \right)$ совпадает с вершиной Ω°, отвечающей ребру e.

2. В противном случае управление u кусочно-постоянно. Множество его значений конечно: управление $u = (co{{s}_{\Omega }}\theta ,si{{n}_{\Omega }}\theta )$ есть либо вершина Ω, либо точка на некотором ребре e из Ω, заданная соотношением $({\text{co}}{{{\text{s}}}_{\Omega }}\hat {\theta },{\text{si}}{{{\text{n}}}_{\Omega }}\hat {\theta })$ || $\left( {{\text{co}}{{{\text{s}}}_{{\Omega ^\circ }}}\theta _{0}^{{^{ \circ }}} - \tfrac{p}{H},{\text{si}}{{{\text{n}}}_{{\Omega ^\circ }}}\theta _{0}^{{^{ \circ }}} - \tfrac{q}{H}} \right)$, где $\theta _{0}^{{^{ \circ }}}$ задает вершину Ω°, отвечающую ребру e. Последний случай разрешен принципом максимума Понтрягина, если и только если $\mathbb{E} = H\mathcal{U}(\theta _{0}^{{^{ \circ }}})$.

4. ЯХТЫ

Рассмотрим следующую управляемую систему:

(20)
$\begin{gathered} \dot {q} = {{u}_{1}}{{X}_{1}} + {{u}_{2}}{{X}_{2}},\quad {{X}_{1}} = (co{{s}_{\Omega }}\theta ,si{{n}_{\Omega }}\theta ,0), \\ {{X}_{2}} = (0,0,1),\quad q = (x,y,\theta ) \in \mathbb{R}_{{x,y}}^{2} \times ({{\mathbb{R}}_{\theta }}{\text{/}}(2\mathbb{S}\mathbb{Z})), \\ \end{gathered} $
где $\mathbb{S}$ – площадь множества Ω, также зафиксируем граничные условия, интегральный функционал качества в обобщенной форме и возможное ограничение на управление

(21)
$\begin{gathered} q(0) = {{q}_{0}},\quad q(T) = {{q}_{1}},\quad J = \int\limits_0^T {f({{u}_{1}},{{u}_{2}})dt} \to min, \\ ({{u}_{1}},{{u}_{2}}) \in U \subset {{\mathbb{R}}^{2}}. \\ \end{gathered} $

Задача (20)–(21) включает в себя обобщения классических задач оптимального управления:

1) задача Эйлера об эластиках [9] при условии $U = {{U}_{E}} = \{ ({{u}_{1}},{{u}_{2}}) \in {{\mathbb{R}}^{2}}\,{\text{|}}\,{{u}_{1}} = 1\} $, $f = {{f}_{E}} = \tfrac{{u_{2}^{2}}}{2}$,

2) задача Маркова–Дубинса [10, 11] с U = UMD = = $\{ ({{u}_{1}},{{u}_{2}}) \in {{\mathbb{R}}^{2}}\,{\text{|}}\,{{u}_{1}} = 1,{\text{|}}{{u}_{2}}{\text{|}} \leqslant 1\} $, f = 1,

3) задача Ридса–Шеппа [12] с U = URS = = $\{ ({{u}_{1}},{{u}_{2}}) \in {{\mathbb{R}}^{2}}\,{\text{|}}\,{\text{|}}{{u}_{1}}{\text{|}} \leqslant 1,{\text{|}}{{u}_{2}}{\text{|}} \leqslant 1\} $, f = 1,

4) субриманова задача на группе движений евклидовой плоскости ${\text{SE}}(2)$ [13] с $U = {{\mathbb{R}}^{2}}$, f = fSR = = $\tfrac{{u_{1}^{2} + u_{2}^{2}}}{2}$ или эквивалентно с U = USR = {(u1, u2) ∈ ∈ ${{\mathbb{R}}^{2}}\,{\text{|}}\,u_{1}^{2} + u_{2}^{2} \leqslant 1\} $, f = 1.

Классические задачи, когда Ω есть круг с центром в начале координат, описывают модели управления машиноподобным роботом, движущимся на горизонтальной плоскости. Обобщения этих моделей при произвольном $\Omega $ можно рассматривать как модели управления яхтой в море. Для моделей 1), 2) с ${{u}_{1}} = 1$ область Ω задает описание вектора скорости в точке (x, y) в виде (cosΩθ, ${\text{si}}{{{\text{n}}}_{\Omega }}\theta )$. Явная форма Ω может быть получена из вида потоков ветра и воды, а решение достаточно описать в виде движения точки по границе множества Ω, параметризованной обобщенным углом θ. Для моделей 3), 4) следует предполагать, что Ω симметрично ($\Omega = - \Omega $), а яхта двигается вперед и назад с одинаковой скоростью. Если $\Omega \ne - \Omega $ в задачах 3), 4), то физическая интерпретация ломается, однако математическая задача следует тому же решению, представленному ниже.

К общей задаче (20)–(21) был применен принцип максимума Понтрягина. Анормальный случай ${{\psi }_{0}} = 0$ и нормальный случай при $\psi _{1}^{2} + \psi _{2}^{2} = 0$ не рассматриваются в данной работе. Далее будем подразумевать $\psi _{1}^{2} + \psi _{2}^{2} = 1$ без потери общности. Тогда функция Гамильтона записывается в следующей форме:

$\mathcal{H} = {{\psi }_{0}}f({{u}_{1}},{{u}_{2}}) + {{u}_{1}}{\text{co}}{{{\text{s}}}_{{\tilde {\Omega }}}}\tilde {\theta } + {{u}_{2}}{{\psi }_{3}},$
где ${{\psi }_{0}},\;{{\psi }_{3}}$ – компоненты вектора сопряженных переменных, $\tilde {\theta }$ есть перепараметризованный угол θ через оставшиеся компоненты ${{\psi }_{1}},\;{{\psi }_{2}}$, а множество $\tilde {\Omega }$ есть повернутое исходное множество Ω на соответствующий вектору $({{\psi }_{1}},{{\psi }_{2}})$ угол. При этом вертикальная подсистема принимает вид

(22)
$\mathop {\dot {\psi }}\nolimits_3 = {{u}_{1}}{\text{si}}{{{\text{n}}}_{{\tilde {\Omega }^\circ }}}\tilde {\theta }^\circ .$

Далее продолжим с каждой спецификацией для U и f согласно пунктам 1)–4).

4.1. Задача Эйлера об эластиках

Из условия максимума имеем ${{u}_{2}} = {{\psi }_{3}}$. Максимизированный гамильтониан $H = \frac{1}{2}{{\dot {\tilde {\theta }}}^{2}} + {\text{co}}{{{\text{s}}}_{{\tilde {\Omega }}}}\tilde {\theta }$ определяет фазовый портрет (22). Так как $\tilde {\Omega }$ компактно, то существуют минимальное и максимальное значения ${\text{co}}{{{\text{s}}}_{{\tilde {\Omega }}}}\tilde {\theta }$, обозначим их через ${{m}_{1}} < 0$ и ${{m}_{2}} > 0$, без ограничения общности полагаем далее ${\text{|}}{{m}_{1}}{\text{|}} \leqslant {{m}_{2}}$. Возможны следующие случаи:

1. $H = {{m}_{1}}$; прямые линии на (x, y), соответствующие устойчивым положениям равновесия.

2. $H \in ({{m}_{1}},{{m}_{2}})$; инфлексионные решения с периодичным $\theta $ и квазипериодичными x, y.

3. $H = {{m}_{2}}$; если ${{u}_{2}} \equiv 0$, то имеем устойчивые и неустойчивые положения равновесия; при ${{\psi }_{3}} \ne 0$ возникают две сепаратрисы, которые могут стремиться к положениям равновесия за конечное или бесконечное время в зависимости от степени гладкости $\tilde {\Omega }$.

4. $H \in ({{m}_{2}}, + \infty )$; неинфлексионные решения с периодичным θ и квазипериодичными x, y.

4.2. Задача Маркова–Дубинса

В этом случае $H = co{{s}_{{\tilde {\Omega }}}}\tilde {\theta }\; + \;{\text{|}}{{\psi }_{3}}{\text{|}}$, ${{u}_{2}} = sgn{{\psi }_{3}}$ при ${{\psi }_{3}} \ne 0$ (${{u}_{2}} \in [ - 1,1]$ при ${{\psi }_{3}} = 0$). Исследование возможных случаев приводит к следующему описанию экстремальных управлений.

Теорема 7. Если Ω строго выпукло, то при любом повернутом $\tilde {\Omega }$ имеем кусочно-постоянное экстремальное управление ${{u}_{2}}$ со значениями $u_{2}^{1},u_{2}^{2}, \ldots ,u_{2}^{n}$ и соответствующими временными интервалами T 1, ${{T}^{2}}$, ..., T n одного из двух типов:

1) $u_{2}^{{2k}} = 0$, $u_{2}^{{2k + 1}} \in \{ - 1,1\} $; $k \in \mathbb{N}$, ${{T}^{{2k}}},k \in \mathbb{N}$ произвольны и ${{T}^{1}} \leqslant 2\mathbb{S}$, ${{T}^{n}} \leqslant 2\mathbb{S}$, ${{T}^{{2k + 1}}} = 2\mathbb{S}$ при $k \ne 0$, $2k + 1 \ne n$.

2) $u_{2}^{{2k}} = \pm 1$, $u_{2}^{{2k + 1}} = \mp 1$, $k \in \mathbb{N}$; T 2 = T 3 = ... = = ${{T}^{{n - 1}}} = \hat {T} \leqslant 2\mathbb{S}$, ${{T}^{1}} \leqslant \hat {T}$, ${{T}^{n}} \leqslant \hat {T}$.

Теорема 8. Если $\Omega $ не строго выпукло, то помимо управления из теоремы 7 также возможно произвольное управление, соответствующее грани и порождающее смешанные траектории.

4.3. Задача Ридса–Шеппа

Условие максимума дает $H = {\text{|co}}{{{\text{s}}}_{{\tilde {\Omega }}}}\tilde {\theta }{\text{|}}\; + \;{\text{|}}{{\psi }_{3}}{\text{|}}$, u1 = = ${\text{sgnco}}{{{\text{s}}}_{{\tilde {\Omega }}}}\tilde {\theta }$, ${{u}_{2}} = sgn{{\psi }_{3}}$, что определяет фазовый портрет системы (22) на цилиндре $(\tilde {\theta },{{\psi }_{3}})$. Возможны следующие случаи:

1. H = 0; прямые линии на (x, y) с условием ${{u}_{1}} = \pm 1$, u2 = 0.

2. $H \in (0,{\text{|}}{{m}_{1}}{\text{|}})$; имеем два семейства, управление $({{u}_{1}},{{u}_{2}})$ для первого семейства переключается по шаблону (1, 1), (–1, 1), (–1, –1), (1, –1) с временными интервалами ${{T}^{ + }},\;{{T}^{ - }},\;{{T}^{ - }},\;{{T}^{ + }}$.

3. $H = {\text{|}}{{m}_{1}}{\text{|}},{{m}_{2}}$; если $\tilde {\Omega }$ имеет слева (при ${{u}_{1}} = - 1$) или справа (при u1 = 1) вертикальную сторону, то управление ${{u}_{2}} \leqslant 1$ произвольно соответствует стороне, а в вершинах стороны возможно переключение на определенное управление ${{u}_{2}} = \pm 1$ с дальнейшим движением угла $\tilde {\theta }$ вдоль границы $\tilde {\Omega }$ и переключением управления согласно формуле u1 = ${\text{sgnco}}{{{\text{s}}}_{{\tilde {\Omega }}}}\tilde {\theta }$ до попадания на ту же сторону при ${\text{|}}{{m}_{1}}{\text{|}} \ne {{m}_{2}}$ (либо на любую из двух при ${\text{|}}{{m}_{1}}{\text{|}} = {{m}_{2}}$).

4. $H \in ({\text{|}}{{m}_{1}}{\text{|}},{{m}_{2}})$, этот случай аналогичен случаю 3. Управление $({{u}_{1}},{{u}_{2}})$ переключается по повторяющемуся шаблону (1, 1), (–1, 1), (1, 1), (1, –1), (–1, –1), (1, –1) с определенными временными интервалами ${{T}_{1}},{{T}_{2}},{{T}_{3}},{{T}_{3}},{{T}_{2}},{{T}_{1}}$.

5. $H \in ({{m}_{2}}, + \infty )$; ${{u}_{2}} \equiv \pm 1$, ${{u}_{1}}$ переключается между 1 и –1 с интервалами ${{T}_{ + }},{{T}_{ - }} = 2\mathbb{S} - {{T}_{ + }}$.

4.4. Субриманова задача на группе ${\text{SE}}(2)$

Из условия максимума имеем ${{u}_{1}} = co{{s}_{{\tilde {\Omega }}}}$, ${{u}_{2}}$ = ψ3 с максимизированным гамильтонианом H = = $\frac{1}{2}({\text{cos}}_{{\tilde {\Omega }}}^{2}\tilde {\theta } + {{\dot {\tilde {\theta }}}^{2}})$, который определяет фазовый портрет системы (22). Возможны случаи:

1. $H \in (0,m_{1}^{2})$; инфлексионные решения с малой амплитудой для углового параметра $\theta $.

2. $H = m_{1}^{2},m_{2}^{2}$; если ${{\psi }_{3}} = 0$, то имеем устойчивые и неустойчивые положения равновесия; когда ${{\psi }_{3}} \ne 0$ возникают две малые сепаратрисы при $H = m_{1}^{2}$ (две большие при $H = m_{2}^{2}$).

3. $H \in (m_{1}^{2},m_{2}^{2})$; инфлексионные решения с большой амплитудой для угла $\tilde {\theta }$.

4. $H \in (m_{2}^{2}, + \infty )$; неинфлексионные траектории.

ЗАКЛЮЧЕНИЕ

В этой работе продемонстрирована эффективность подхода выпуклой тригонометрии к интегрированию ряда нетривиальных задач оптимального управления с двумерным управлением. Мы надеемся, что этот подход окажется плодотворным для многих других задач этого класса.

Список литературы

  1. Локуциевский Л.В. Выпуклая тригонометрия с приложениями к субфинслеровой геометрии // Матем. сб. 2019. Т. 210. № 8. С. 120–148.

  2. Грибанова И. А. Квазигиперболическая плоскость // Сиб. матем. журн. 1999. Т. 40. № 2. С. 288–301.

  3. Jacobson N. Lie Algebras./ Interscience, 1962.

  4. Agrachev A., Barilari D. Sub-Riemanian structures on 3D Lie groups // J. Dynamical and Control Systems. 2012. V. 18. P. 21–44.

  5. Busemann H. The Isoperimetric Problem in the Minkowski Plane // American J. of Mathematics. 1947. V. 69. № 4 (Oct., 1947). P. 863–871.

  6. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф Математическая теория оптимальных процессов. М.: Физматлит, 1961.

  7. Аграчев А.А., Сачков Ю.Л. Геометрическая теория управления. М.: Физматлит, 2005.

  8. Берестовский В. Н. Геодезические неголономных левоинвариантных внутренних метрик на группе Гейзенберга и изопериметриксы плоскости Минковского // Сиб. матем. журн. 1994. Т. 35. № 1. С. 3–11.

  9. Euler L. Methodus inveniendi lineas curvas maximi minimive proprietate gaudentes, sive solutio problematis isoperimitrici latissimo sensu accepti. Lausanne: Bousquet, 1744.

  10. Марков А.А. Несколько примеров решения особого рода задач о наибольших и наименьших величинах. Сообщ. Харьков. матем. общ. Вторая сер. 1889. Т. 1, 2. С. 250–276.

  11. Dubins L.E. On curves of minimal length with a constraint on average curvature, and with prescribed initial and terminal positions and tangents // American J. of Mathematics. 1957. V. 79. № 3. P. 497–516.

  12. Reeds J.A., Shepp L.A. Optimal Paths for a Car That Goes Both Forwards and Backwards // Pacific J. Math. 1990. V. 145. № 2. P. 367–393.

  13. Sachkov Yu.L. Cut locus and optimal synthesis in the sub-Riemannian problem on the group of motions of a plane // ESAIM: Control, Optimisation and Calculus of Variations. 2011. V. 17. № 2. P. 293–321.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления