Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 505, № 1, стр. 86-91

УСЛОВИЯ ЭКСТРЕМУМА ПРИ ОГРАНИЧЕННОМ СКАЛЯРНОМ УПРАВЛЕНИИ ДВУМЯ НЕСИНХРОННЫМИ ОСЦИЛЛЯТОРАМИ В ЗАДАЧЕ БЫСТРОДЕЙСТВИЯ

Л. М. Берлин 1*, член-корреспондент РАН А. А. Галяев 1**

1 Институт проблем управления им. В.А. Трапезникова Российской академии наук
Москва, Россия

* E-mail: berlin.lm@phystech.edu
** E-mail: galaev@ipu.ru

Поступила в редакцию 25.02.2022
После доработки 12.03.2022
Принята к публикации 12.04.2022

Полный текст (PDF)

Аннотация

Рассматривается задача оптимального управления двумя несинхронными осцилляторами при наличии скалярного ограничения на управление по критерию быстродействия в задаче разгона из состояния покоя. Особенность данной задачи заключается в том, что в терминальный момент фазовые координаты второго осциллятора снова становятся равными нулю. Для заданного количества неизвестных моментов переключения, определяющих оптимальное релейное управление, предложены необходимые условия экстремума в виде нелинейных матричных равенств. Исследование необходимых и достаточных условий экстремума позволило в фазовом пространстве первого осциллятора найти аналитический вид кривой, соответствующей классу двух переключений управления, которая также отделяет множества достижимости класса трех переключений управления.

Ключевые слова: оптимальное управление, гармонический осциллятор, принцип максимума Понтрягина, ограниченное скалярное управление

1. ВВЕДЕНИЕ

Задачи с недостатком ресурса управления, когда размерность вектора управления меньше или значительно меньше размерности пространства состояний физической системы, имеют широкое применение на практике. Колебательные системы, такие как электрические контуры, механические системы, квантовые осцилляторы и другие физические системы, управляемые одной внешней силой, являются примерами подобных систем. Математические модели, описывающие динамику различных систем, представляют собой системы несинхронных осцилляторов c ограничением не только на размерность вектора управления, но и на его максимальную амплитуду [1–5]. В результате управления такими системами зачастую необходимо, чтобы одна из подсистем как можно быстрее пришла в требуемое положение, тогда как вторая система должна остаться в состоянии покоя в терминальный момент. Если в каждый осциллятор системы входит отдельное управление, тогда задача оптимального быстродействия может быть решена путем рассмотрения отдельных одиночных осцилляторов, для которых В.Г. Болтянским в [6] был приведен синтез оптимального управления. Впервые подобные задачи оптимального управления системой многих маятников были исследованы академиком РАН Ф.Л. Черноусько в [1], где приведено доказательство существования решения задач об оптимальном по быстродействию гашении колебаний и об оптимальном по быстродействию разгоне системы маятников с различными частотами колебаний, и указано, что данная задача при некотором соотношении частот осцилляторов была исследована С.А. Михайловым. Условия экстремума в классе $2N - 1$ переключений управления, где N – количество осцилляторов, приведены в [5], а синтез асимптотически оптимального управления для системы из произвольного числа линейных осцилляторов при общем ограниченном управлении был представлен в работах [7, 8]. Одним из ключевых вопросов при поиске решения является исследование достижимости и управляемости системы двух несинхронных осцилляторов с ограниченным и скалярным управлением, что может быть показано как на основе геометрической теории управления [9], а именно: теоремы Суссмана-Джарджевича и теоремы Пуанкаре, так и с использованием результата классической теории оптимального управления, теоремы ЛаСалля-Конти [10]. В настоящей работе будут предложены условия экстремума, при помощи которых удается описать множество достижимости первого осциллятора в системе двух несинхронных осцилляторов, а также выделить в нем подмножества, соответствующие различным классам переключений управления.

2. ЗАДАЧА СКАЛЯРНОГО УПРАВЛЕНИЯ ДВУМЯ ОСЦИЛЛЯТОРАМИ

2.1. Уравнения ПМП

Рассматривается следующая задача быстродействия для системы, состоящей из двух несинхронных осцилляторов:

(1)
$\begin{gathered} \left( {\begin{array}{*{20}{c}} {{{{\dot {q}}}_{1}}} \\ {{{{\dot {p}}}_{1}}} \\ {\begin{array}{*{20}{c}} {{{{\dot {q}}}_{2}}} \\ {{{{\dot {p}}}_{2}}} \end{array}} \end{array}} \right) = \left( {\begin{array}{*{20}{c}} {{{p}_{1}}} \\ { - w_{1}^{2}{{q}_{1}}} \\ {\begin{array}{*{20}{c}} {{{p}_{2}}} \\ { - w_{2}^{2}{{q}_{2}}} \end{array}} \end{array}} \right) + u\left( {\begin{array}{*{20}{c}} 0 \\ {\begin{array}{*{20}{c}} 1 \\ 0 \\ 1 \end{array}} \end{array}} \right), \\ x = {{\left( {{{q}_{1}},{{p}_{1}},{{q}_{2}},{{p}_{2}}} \right)}^{T}} \in {{\mathbb{R}}^{4}} = M,\quad u \in \left[ { - \varepsilon ,\varepsilon } \right] = U, \\ \end{gathered} $
(2)
$\begin{gathered} x\left( 0 \right) = {{x}_{0}} = {{\left( {0,0,0,0} \right)}^{T}}, \\ x\left( {{{T}_{0}}} \right) = {{x}_{{{{T}_{0}}}}} = {{(q_{1}^{{{{T}_{0}}}},p_{1}^{{{{T}_{0}}}},0,0)}^{T}}, \\ \end{gathered} $
(3)
${{T}_{0}} = \mathop \smallint \limits_0^{{{T}_{0}}} dt \to {\text{min}}.$

Для исследования задачи (1)–(3) и получения решения применяется принцип максимума Понтрягина (ПМП). Поскольку динамика (1) описывается следующей системой векторных полей

(4)
$\mathcal{F}\left( {x,u} \right) = \left\{ {{{f}_{1}} + u{{f}_{2}}|u \in U} \right\},$
(5)
$\begin{gathered} {{f}_{1}} = {{p}_{1}}\frac{\partial }{{\partial {{q}_{1}}}} + {{p}_{2}}\frac{\partial }{{\partial {{q}_{2}}}} - w_{1}^{2}{{q}_{1}}\frac{\partial }{{\partial {{p}_{1}}}} - w_{2}^{2}{{q}_{2}}\frac{\partial }{{\partial {{p}_{2}}}}, \\ {{f}_{2}} = \frac{\partial }{{\partial {{p}_{1}}}} + \frac{\partial }{{\partial {{p}_{2}}}}, \\ \end{gathered} $
то упростить запись условий принципа максимума можно, введя неканонические координаты, построенные по векторным полям управляемой системы и их коммутаторам. Соответствующие линейные на слоях кокасательного расслоения гамильтонианы имеют вид
(6)
${{h}_{i}}\left( \lambda \right) = \langle \lambda ,{{f}_{i}}\left( x \right)\rangle ,$
где $\lambda $ – элемент кокасательного пространства. Укороченный гамильтониан системы векторных полей (4) записывается в неканонических координатах в следующем виде
(7)
${{h}_{u}}\left( \lambda \right) = \langle \lambda ,{{f}_{1}} + u{{f}_{2}}\rangle = {{h}_{1}} + u{{h}_{2}},$
а условие максимума представляется в виде максимизации (7) по всем допустимым управлениям

(8)
${{h}_{1}} + u{{h}_{2}} \to \mathop {{\text{max}}}\limits_{u \leqslant \left| \varepsilon \right|} .$

Установить соответствие между скобками Пуассона гамильтонианов (6) и скобками Ли соответствующих векторных полей (5) можно при помощи следующей леммы [9]

Лемма 1. Пусть ${{f}_{i}}$, ${{f}_{j}}$ $ \in Vec\left( M \right),$ $i \ne j$. Тогда:

$\left\{ {{{h}_{{{{f}_{i}}}}},{{h}_{{{{f}_{j}}}}}} \right\} = h{{\,}_{{\left[ {{{f}_{i}},{{f}_{j}}} \right]}}}$,

$[{{\vec {h}}_{{{{f}_{i}}}}},{{\vec {h}}_{{{{f}_{j}}}}}] = \vec {h}{{\,}_{{\left[ {{{f}_{i}},{{f}_{j}}} \right]}}}$.

Согласно Лемме 1, можно выписать векторные поля, составляющие алгебру Ли, используя следующие ненулевые скобки Ли:

${{f}_{3}} = \left[ {{{f}_{1}},{{f}_{2}}} \right] = - \frac{\partial }{{\partial {{q}_{1}}}} - \frac{\partial }{{\partial {{q}_{2}}}},$
${{f}_{4}} = \left[ {{{f}_{1}},{{f}_{3}}} \right] = - w_{1}^{2}\frac{\partial }{{\partial {{p}_{1}}}} - w_{2}^{2}\frac{\partial }{{\partial {{p}_{2}}}},$
${{f}_{5}} = \left[ {{{f}_{1}},{{f}_{4}}} \right] = w_{1}^{2}\frac{\partial }{{\partial {{q}_{1}}}} + w_{2}^{2}\frac{\partial }{{\partial {{q}_{2}}}}.$

Скобка Ли $\left[ {{{f}_{1}},{{f}_{5}}} \right]$ в свою очередь является линейной комбинацией векторных полей ${{f}_{2}},{{f}_{4}}$.

$\begin{gathered} \left[ {{{f}_{1}},{{f}_{5}}} \right] = w_{1}^{4}\frac{\partial }{{\partial {{p}_{1}}}} + w_{2}^{4}\frac{\partial }{{\partial {{p}_{2}}}} = \\ = ( - w_{1}^{2}w_{2}^{2}){{f}_{2}} + ( - w_{1}^{2} - w_{2}^{2}){{f}_{4}}. \\ \end{gathered} $

Для системы (4) выполнена теорема Суссмана-Джарджевича о сильной достижимости.

Теорема 1 (Суссман-Джарджевич). Аналитическая система $\dot {x}(t) = f(x(t),u(t))$ обладает свойством сильной достижимости в точке $x$ тогда и только тогда, когда размерность идеала алгебры Ли, порожденной системой, совпадает с размерностью пространства состояний

${\text{dim}}{{\mathcal{L}}_{0}}\left( x \right) = n.$

В силу линейной независимости векторов f2, f3, ${{f}_{4}},{{f}_{5}}$, их линейная оболочка будет являться следующим идеалом алгебры Ли

${{\mathcal{L}}_{0}}\left( x \right) = {\text{span}}\left[ {{{f}_{2}},} \right[{{f}_{1}},{{f}_{2}}\left] , \right[{{f}_{1}},\left[ {{{f}_{1}},{{f}_{2}}} \right]\left] , \right[{{f}_{1}},\left[ {{{f}_{1}},} \right[{{f}_{1}},{{f}_{2}}]]],$
${\text{dim}}{{\mathcal{L}}_{0}}(x) = n$. Поэтому справедлива следующая лемма.

Лемма 2. Система (1) с ограниченным и скалярным управлением является сильно достижимой.

Выполнение рангового условия управляемости Калмана и равенство нулю собственных значений структурной матрицы динамики системы позволяют применить теорему ЛаСалля-Конти [11] для доказательства леммы

Лемма 3. Система (1) с ограниченным и скалярным управлением является глобально управляемой.

Далее, согласно Лемме 1, вычисляются соответствующие скобки Пуассона для системы ПМП:

$\begin{gathered} {{{\dot {h}}}_{1}} = \left\{ {{{h}_{u}},{{h}_{1}}} \right\} = \left\{ {{{h}_{1}} + u{{h}_{2}},{{h}_{1}}} \right\} = \\ = u\left\{ {{{h}_{2}},{{h}_{1}}} \right\} = - u\left\{ {{{h}_{1}},{{h}_{2}}} \right\} = - u{{h}_{3}}, \\ \end{gathered} $
${{\dot {h}}_{2}} = \left\{ {{{h}_{u}},{{h}_{2}}} \right\} = \left\{ {{{h}_{1}} + u{{h}_{2}},{{h}_{2}}} \right\} = \left\{ {{{h}_{1}},{{h}_{2}}} \right\} = {{h}_{3}},$
$\begin{gathered} {{{\dot {h}}}_{3}} = \left\{ {{{h}_{u}},{{h}_{3}}} \right\} = \left\{ {{{h}_{1}} + u{{h}_{2}},{{h}_{3}}} \right\} = \left\{ {{{h}_{1}},{{h}_{3}}} \right\} + u\left\{ {{{h}_{2}},{{h}_{3}}} \right\} = {{h}_{4}}, \\ {\text{т}}.{\text{к}}.\,\,\left[ {{{f}_{2}},{{f}_{3}}} \right] = 0, \\ \end{gathered} $
$\begin{gathered} {{{\dot {h}}}_{4}} = \left\{ {{{h}_{u}},{{h}_{4}}} \right\} = \left\{ {{{h}_{1}} + u{{h}_{2}},{{h}_{4}}} \right\} = \left\{ {{{h}_{1}},{{h}_{4}}} \right\} + u\left\{ {{{h}_{2}},{{h}_{4}}} \right\} = {{h}_{5}}, \\ {\text{т}}.{\text{к}}.\,\,\left[ {{{f}_{2}},{{f}_{4}}} \right] = 0, \\ \end{gathered} $
$\begin{gathered} {{{\dot {h}}}_{5}} = \left\{ {{{h}_{u}},{{h}_{5}}} \right\} = \left\{ {{{h}_{1}} + u{{h}_{2}},{{h}_{5}}} \right\} = \\ = \left\{ {{{h}_{1}},{{h}_{5}}} \right\} + u\left\{ {{{h}_{2}},{{h}_{5}}} \right\} = ( - w_{1}^{2}w_{2}^{2}){{h}_{2}} + ( - w_{1}^{2} - w_{2}^{2}){{h}_{4}}. \\ \end{gathered} $

Объединяя все полученные компоненты, формируется вертикальная система ПМП:

(9)
$\left\{ {\begin{array}{*{20}{l}} {{{{\dot {h}}}_{1}} = - u{{h}_{3}},} \\ {{{{\dot {h}}}_{2}} = {{h}_{3}},} \\ {{{{\dot {h}}}_{3}} = {{h}_{4}},} \\ {{{{\dot {h}}}_{4}} = {{h}_{5}},} \\ {{{{\dot {h}}}_{5}} = ( - w_{1}^{2}w_{2}^{2}){{h}_{2}} + ( - w_{1}^{2} - w_{2}^{2}){{h}_{4}}.} \end{array}} \right.$

2.2. Исследование вертикальной подсистемы

Последние четыре уравнения системы (9) составляют следующую систему линейных однородных дифференциальных уравнений

(10)
$\dot {\vec {h}} = A\vec {h}.$

После замены: $a = - w_{1}^{2}w_{2}^{2},b = - w_{1}^{2} - w_{2}^{2}$, матрица A примет вид

$A = \left( {\begin{array}{*{20}{l}} 0&1&0&0 \\ 0&0&1&0 \\ 0&0&0&1 \\ a&0&b&0 \end{array}} \right).$

Лемма 4. Cистема (10) не имеет первых интегралов в виде линейной комбинации ${{h}_{2}},{{h}_{3}},{{h}_{4}},{{h}_{5}}$, но обладает двумя первыми интегралами в виде квадратичных форм:

(11)
${{V}_{1}} = \frac{a}{2}h_{3}^{2} - \frac{b}{2}h_{4}^{2} + \frac{1}{2}h_{5}^{2} - a{{h}_{4}}{{h}_{2}},$
(12)
${{V}_{2}} = - \frac{a}{2}h_{2}^{2} - \frac{1}{2}h_{4}^{2} - \frac{b}{2}h_{3}^{2} + {{h}_{5}}{{h}_{3}}.$

Следствие 1. Из двух первых интегралов (11), (12) можно составить две неотрицательно определенные квадратичные формы:

(13)
$V_{1}^{ + } = 2{{V}_{1}} + 2w_{1}^{2}{{V}_{2}} = w_{2}^{2}{{(w_{1}^{2}{{h}_{2}} + {{h}_{4}})}^{2}} + {{({{h}_{3}}w_{1}^{2} + {{h}_{5}})}^{2}},$
(14)
$V_{2}^{ + } = 2{{V}_{1}} + 2w_{2}^{2}{{V}_{2}} = w_{1}^{2}{{(w_{2}^{2}{{h}_{2}} + {{h}_{4}})}^{2}} + {{({{h}_{3}}w_{2}^{2} + {{h}_{5}})}^{2}}.$

Для поиска решения системы (10) вычисляются собственные значения матрицы , которые равны

${{\lambda }_{{1,3}}} = \pm {{w}_{1}}i,$
${{\lambda }_{{2,4}}} = \pm {{w}_{2}}i.$

Поэтому решение $\vec {h}$ системы (10) имеет следующий вид

$\begin{gathered} \vec {h} = {{c}_{1}}\left( {\begin{array}{*{20}{l}} {{\text{cos}}\left( {{{w}_{1}}t} \right)} \\ { - {{w}_{1}}{\text{sin}}\left( {{{w}_{1}}t} \right)} \\ { - w_{1}^{2}{\text{cos}}\left( {{{w}_{1}}t} \right)} \\ {w_{1}^{3}{\text{sin}}\left( {{{w}_{1}}t} \right)} \end{array}} \right) + {{c}_{2}}\left( {\begin{array}{*{20}{l}} { - {\text{sin}}\left( {{{w}_{1}}t} \right)} \\ { - {{w}_{1}}{\text{cos}}\left( {{{w}_{1}}t} \right)} \\ {w_{1}^{2}{\text{sin}}\left( {{{w}_{1}}t} \right)} \\ {w_{1}^{3}{\text{cos}}\left( {{{w}_{1}}t} \right)} \end{array}} \right) + \\ + \,{{c}_{3}}\left( {\begin{array}{*{20}{l}} {{\text{cos}}\left( {{{w}_{2}}t} \right)} \\ { - {{w}_{2}}{\text{sin}}\left( {{{w}_{2}}t} \right)} \\ { - w_{2}^{2}{\text{cos}}\left( {{{w}_{2}}t} \right)} \\ {w_{2}^{3}{\text{sin}}\left( {{{w}_{2}}t} \right)} \end{array}} \right) + {{c}_{4}}\left( {\begin{array}{*{20}{l}} { - {\text{sin}}\left( {{{w}_{2}}t} \right)} \\ { - {{w}_{2}}{\text{cos}}\left( {{{w}_{2}}t} \right)} \\ {w_{2}^{2}{\text{sin}}\left( {{{w}_{2}}t} \right)} \\ {w_{2}^{3}{\text{cos}}\left( {{{w}_{2}}t} \right)} \end{array}} \right). \\ \end{gathered} $

Следовательно, согласно (8), вид оптимального управления определяется функцией h2(t), которая называется функцией переключения управления, следующим образом

(15)
$\begin{gathered} u{\text{*}}(t) = \varepsilon {\text{sign(}}{{h}_{2}}(t)) = \varepsilon {\text{sign}}({{C}_{1}}{\text{cos}}({{w}_{1}}t) + {{C}_{2}}{\text{sin}}({{w}_{1}}t) + \\ + \,{{C}_{3}}{\text{cos}}({{w}_{2}}t) + {{C}_{4}}{\text{sin}}({{w}_{2}}t)). \\ \end{gathered} $

Эта функция определяется однозначно и не может быть равна нулю на целом интервале, за исключением изолированных точек, что приводит к отсутствию особых режимов управления.

3. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

Управление u*(t), согласно (15), является релейным. Переключения управления происходят в моменты времени ${{t}_{i}},i = \overline {1,K - 1} $. Пусть ${{\tau }_{n}}$ – длительности n-го интервала постоянства управления, $n = \overline {1,K} $. Тогда u*(t) c $K - 1$ переключением и $K \in \mathbb{N}$ интервалами постоянства управления имеет вид, представленный на рис. 1.

Рис. 1.

Вид оптимального управления u*(t).

Решение системы (1) для двух несинхронных осцилляторов с граничными условиями (2) записывается следующим образом [1, 12]:

(16)
$\left\{ \begin{gathered} {{q}_{1}}\left( {{{T}_{0}}} \right) = \frac{1}{{{{w}_{1}}}}\mathop \smallint \limits_0^{{{T}_{0}}} {\text{sin}}\left( {{{w}_{1}}\left( {{{T}_{0}} - \tau } \right)} \right)u\left( \tau \right)d\tau = q_{1}^{{{{T}_{0}}}}, \hfill \\ {{p}_{1}}\left( {{{T}_{0}}} \right) = \mathop \smallint \limits_0^{{{T}_{0}}} {\text{cos}}\left( {{{w}_{1}}\left( {{{T}_{0}} - \tau } \right)} \right)u\left( \tau \right)d\tau = p_{1}^{{{{T}_{0}}}}, \hfill \\ {{q}_{2}}\left( {{{T}_{0}}} \right) = \frac{1}{{{{w}_{2}}}}\mathop \smallint \limits_0^{{{T}_{0}}} {\text{sin}}\left( {{{w}_{2}}\left( {{{T}_{0}} - \tau } \right)} \right)u\left( \tau \right)d\tau = 0, \hfill \\ {{p}_{2}}\left( {{{T}_{0}}} \right) = \mathop \smallint \limits_0^{{{T}_{0}}} {\text{cos}}\left( {{{w}_{2}}\left( {{{T}_{0}} - \tau } \right)} \right)u\left( \tau \right)d\tau = 0. \hfill \\ \end{gathered} \right.$

Учитывая вид оптимального управления u*(t), можно записать решение системы (16) при различных значениях K. Стоит также отметить, что управление на первом интервале может быть выбрано как $\varepsilon $, так и $ - \varepsilon $, для чего вводится параметр k, равный 0 и 1 соответственно.

(17)
$\left\{ \begin{gathered} 2\mathop \sum \limits_{j = 1}^K {\text{}}{{( - 1)}^{{j + 1}}}{\text{cos}}\left( {{{w}_{1}}\mathop \sum \limits_{i = j}^K {{\tau }_{i}}} \right) - {\text{cos}}\left( {{{w}_{1}}\mathop \sum \limits_{i = 1}^K {{\tau }_{i}}} \right) = \hfill \\ = {{( - 1)}^{{K - 1}}} + {{( - 1)}^{{k + 1}}}\frac{{q_{1}^{{{{T}_{0}}}}w_{1}^{2}}}{\varepsilon }, \hfill \\ 2\mathop \sum \limits_{j = 1}^K {\text{}}{{( - 1)}^{{j + 1}}}{\text{sin}}\left( {{{w}_{1}}\mathop \sum \limits_{i = j}^K {{\tau }_{i}}} \right)\, - \,{\text{sin}}\left( {{{w}_{1}}\mathop \sum \limits_{i = 1}^K {{\tau }_{i}}} \right)\, = \,{{( - 1)}^{k}}\frac{{p_{1}^{{{{T}_{0}}}}{{w}_{1}}}}{\varepsilon }, \hfill \\ 2\mathop \sum \limits_{j = 1}^K {\text{}}{{( - 1)}^{{j + 1}}}{\text{cos}}\left( {{{w}_{2}}\mathop \sum \limits_{i = j}^K {{\tau }_{i}}} \right)\, - \,{\text{cos}}\left( {{{w}_{2}}\mathop \sum \limits_{i = 1}^K {{\tau }_{i}}} \right)\, = \,{{( - 1)}^{{K - 1}}}, \hfill \\ 2\mathop \sum \limits_{j = 1}^K {\text{}}{{( - 1)}^{{j + 1}}}{\text{sin}}\left( {{{w}_{2}}\mathop \sum \limits_{i = j}^K {{\tau }_{i}}} \right) - {\text{sin}}\left( {{{w}_{2}}\mathop \sum \limits_{i = 1}^K {\text{}}{{\tau }_{i}}} \right) = 0. \hfill \\ \end{gathered} \right.$

Функция ${{h}_{2}}\left( t \right)$ равна нулю в моменты времени ${{t}_{i}},i = \overline {1,K - 1} $, когда происходят переключения управления.

(18)
$\begin{gathered} {{h}_{2}}\left( {{{t}_{i}}} \right) = {{C}_{1}}{\text{cos}}\left( {{{w}_{1}}{{t}_{i}}} \right) + {{C}_{2}}{\text{sin}}\left( {{{w}_{1}}{{t}_{i}}} \right) + \\ + \,{{C}_{3}}{\text{cos}}\left( {{{w}_{2}}{{t}_{i}}} \right) + {{C}_{4}}{\text{sin}}\left( {{{w}_{2}}{{t}_{i}}} \right) = 0,\quad i = \overline {1,K - 1} \\ \end{gathered} $.

Уравнение (18) в матричной форме имеет вид

(19)
$\left( {C,{{{{\Omega }}}_{i}}} \right) = 0,{\text{\;\;}}i = \overline {1,K - 1} ,$
где

$C = \left( {\begin{array}{*{20}{l}} {{{C}_{1}},}&{{{C}_{2}},}&{{{C}_{3}},}&{{{C}_{4}}} \end{array}} \right),\quad {{{{\Omega }}}_{i}} = \left( {\begin{array}{*{20}{l}} {{\text{cos}}\left( {{{w}_{1}}{{t}_{i}}} \right)} \\ {{\text{sin}}\left( {{{w}_{1}}{{t}_{i}}} \right)} \\ {{\text{cos}}\left( {{{w}_{2}}{{t}_{i}}} \right)} \\ {{\text{sin}}\left( {{{w}_{2}}{{t}_{i}}} \right)} \end{array}} \right).$

Объединяя все уравнения (19), можно записать следующую систему

(20)
${{\left( {\begin{array}{*{20}{c}} {{\text{cos}}\left( {{{w}_{1}}{{t}_{1}}} \right)}&{{\text{cos}}\left( {{{w}_{1}}{{t}_{2}}} \right)}&{...}&{{\text{cos}}\left( {{{w}_{1}}{{t}_{{K - 2}}}} \right)}&{{\text{cos}}\left( {{{w}_{1}}{{t}_{{K - 1}}}} \right)} \\ {{\text{sin}}\left( {{{w}_{1}}{{t}_{1}}} \right)}&{{\text{sin}}\left( {{{w}_{1}}{{t}_{2}}} \right)}&{...}&{{\text{sin}}\left( {{{w}_{1}}{{t}_{{K - 2}}}} \right)}&{{\text{sin}}\left( {{{w}_{1}}{{t}_{{K - 1}}}} \right)} \\ {{\text{cos}}\left( {{{w}_{2}}{{t}_{1}}} \right)}&{{\text{cos}}\left( {{{w}_{2}}{{t}_{2}}} \right)}&{...}&{{\text{cos}}\left( {{{w}_{2}}{{t}_{{K - 2}}}} \right)}&{{\text{cos}}\left( {{{w}_{2}}{{t}_{{K - 1}}}} \right)} \\ {{\text{sin}}\left( {{{w}_{2}}{{t}_{1}}} \right)}&{{\text{sin}}\left( {{{w}_{2}}{{t}_{2}}} \right)}&{...}&{{\text{sin}}({{w}_{2}}{{t}_{{K - 2}}})}&{{\text{sin}}\left( {{{w}_{2}}{{t}_{{K - 1}}}} \right)} \end{array}} \right)}^{T}}\left( {\begin{array}{*{20}{l}} {{{C}_{1}}} \\ {{{C}_{2}}} \\ {{{C}_{3}}} \\ {{{C}_{4}}} \end{array}} \right) = \vec {0}.$

Поскольку в моменты ${{t}_{i}} = \mathop \sum \limits_{n = 1}^i {\text{}}{{\tau }_{n}}$ выполнено (19), то условие невырожденности вектора C эквивалентно K – 4 равенствам

(21)
$\begin{gathered} {\text{det}}\left( {{{{{\Omega }}}_{i}},{{{{\Omega }}}_{{i + 1}}},{{{{\Omega }}}_{{i + 2}}},{{{{\Omega }}}_{{i + 3}}}} \right) = 0, \\ i = \overline {1,K - 4} . \\ \end{gathered} $

Справедлива следующая теорема

Теорема 2 (Необходимые условия экстремума). Любое решение задачи (1)–(3) в классе релейных управлений (15) удовлетворяет совместной системе (17) и (21).

Замечание 1. В случае, когда управление имеет три переключения, а число интервалов постоянства управления равно четырем, для нахождения интервалов ${{\tau }_{i}}$ достаточно использовать только уравнения системы (17).

Замечание 2. В случае, когда $K - 1 = 4$, получаем следующее условие невырожденности вектора C

(22)
${\text{det}}\left( {\begin{array}{*{20}{l}} {{\text{cos}}\left( {{{w}_{1}}{{t}_{1}}} \right)}&{{\text{cos}}\left( {{{w}_{1}}{{t}_{2}}} \right)}&{{\text{cos}}\left( {{{w}_{1}}{{t}_{3}}} \right)}&{{\text{cos}}\left( {{{w}_{1}}{{t}_{4}}} \right)} \\ {{\text{sin}}\left( {{{w}_{1}}{{t}_{1}}} \right)}&{{\text{sin}}\left( {{{w}_{1}}{{t}_{2}}} \right)}&{{\text{sin}}\left( {{{w}_{1}}{{t}_{3}}} \right)}&{{\text{sin}}\left( {{{w}_{1}}{{t}_{4}}} \right)} \\ {{\text{cos}}\left( {{{w}_{2}}{{t}_{1}}} \right)}&{{\text{cos}}\left( {{{w}_{2}}{{t}_{2}}} \right)}&{{\text{cos}}\left( {{{w}_{2}}{{t}_{3}}} \right)}&{{\text{cos}}\left( {{{w}_{2}}{{t}_{4}}} \right)} \\ {{\text{sin}}\left( {{{w}_{2}}{{t}_{1}}} \right)}&{{\text{sin}}\left( {{{w}_{2}}{{t}_{2}}} \right)}&{{\text{sin}}\left( {{{w}_{2}}{{t}_{3}}} \right)}&{{\text{sin}}\left( {{{w}_{2}}{{t}_{4}}} \right)} \end{array}} \right)\, = \,0.$

Если $K - 1 > 4$, получаем $C_{{K - 1}}^{4}$ условий невырожденности вектора C

(23)
$\begin{gathered} \det \left( {\begin{array}{*{20}{c}} {\cos ({{w}_{1}}{{t}_{{{{m}_{1}}}}})}&{\cos ({{w}_{1}}{{t}_{{{{m}_{2}}}}})}&{\cos ({{w}_{1}}{{t}_{{{{m}_{3}}}}})}&{\cos ({{w}_{1}}{{t}_{{{{m}_{4}}}}})} \\ {\sin ({{w}_{1}}{{t}_{{{{m}_{1}}}}})}&{\sin ({{w}_{1}}{{t}_{{{{m}_{2}}}}})}&{\sin ({{w}_{1}}{{t}_{{{{m}_{3}}}}})}&{\sin ({{w}_{1}}{{t}_{{{{m}_{4}}}}})} \\ {\cos ({{w}_{2}}{{t}_{{{{m}_{1}}}}})}&{\cos ({{w}_{2}}{{t}_{{{{m}_{2}}}}})}&{\cos ({{w}_{2}}{{t}_{{{{m}_{3}}}}})}&{\cos ({{w}_{2}}{{t}_{{{{m}_{4}}}}})} \\ {\sin ({{w}_{2}}{{t}_{{{{m}_{1}}}}})}&{\sin ({{w}_{2}}{{t}_{{{{m}_{2}}}}})}&{\sin ({{w}_{1}}{{t}_{{{{m}_{4}}}}})}&{\sin ({{w}_{2}}{{t}_{{{{m}_{4}}}}})} \end{array}} \right)\, = \,0, \\ {{m}_{1}} \ne {{m}_{2}} \ne {{m}_{3}} \ne {{m}_{4}};\quad {{m}_{1}},{{m}_{2}},{{m}_{3}},{{m}_{4}} = \overline {1,K - 1} , \\ \end{gathered} $
и для нахождения интервалов ${{\tau }_{i}}$ совместно с (17) можно использовать $K - 4$ уравнений из набо- ра (23).

Используя теорему 2, можно вычислить все требуемые моменты переключения ${{t}_{i}},i = \overline {K - 1} $. Полученные значения позволят определить вектор C как вектор ядра соответствующего линейного отображения в (20). Отсюда следует еще одно необходимое условие экстремума, которое формулируется в виде следующей леммы.

Лемма 5. Экстремальное управление u*(t) с вектором C, полученным из (20) для случая K – 1 переключения, содержит ровно K – 1 переключение управления.

Предложение 1 (Достаточные условия оптимальности). Существует единственный (с точностью до множителя) вектор C, определяющий по теореме 1 оптимальное управление u*(t).

4. ФАЗОВАЯ ПЛОСКОСТЬ ПЕРВОГО ОСЦИЛЛЯТОРА

Для иллюстрации полученных теоретических результатов приводится пример, когда управление имеет два, три и четыре переключения для различных конечных состояний первого осциллятора ($q_{1}^{T},p_{1}^{T}$). Выбраны следующие параметры системы:

$\varepsilon = 0.4,\quad {{w}_{1}} = 1,\quad {{w}_{2}} = 1.4.$

В [10] при исследовании зависимости количества классов переключений от значения $\varepsilon $ наблюдалось обнуление интервала ${{\tau }_{3}}$ в классе четырех переключений. Обнуление внутреннего интервала приводит к классу двух переключений, для которого справедлива следующая лемма

Лемма 6. В классе двух переключений для интервалов постоянства управления ${{\tau }_{1}}$, ${{\tau }_{2}}$, ${{\tau }_{3}}$ справедливы функциональные зависимости

$\begin{gathered} {\text{cos}}\left( {{{w}_{2}}{{\tau }_{1}}} \right) = {\text{cos}}\left( {{{w}_{2}}{{\tau }_{3}}} \right), \\ {\text{т}}.{\text{е}}.\,\,\,{{\tau }_{1}} = {{\tau }_{3}} + \frac{{2\pi n}}{{{{w}_{2}}}},\quad n \in \mathbb{Z}, \\ \end{gathered} $
${\text{cos}}\left( {{{w}_{2}}{{\tau }_{2}}} \right) = \frac{{2{\text{co}}{{{\text{s}}}^{2}}\left( {{{w}_{2}}{{\tau }_{1}}} \right) - 4{\text{cos}}\left( {{{w}_{2}}{{\tau }_{1}}} \right) + 3}}{{5 - 4{\text{cos}}\left( {{{w}_{2}}{{\tau }_{1}}} \right)}}.$

Различные классы управления представлены на рис. 2. Голубая и красная области отвечают классу трех переключений с начальным управлением $\varepsilon , - \varepsilon $ соответственно. Класс четырех переключений представлен оранжевой и зеленой областями с управлением на начальном интервале $ - \varepsilon ,\varepsilon $ соответственно. Классы трех переключений управления разделяются между собой параметрическими кривыми, полученными по лемме 5. Обнуление внутреннего интервала управления в классе четырех переключений приводит к кривым (синяя и зеленая), соответствующим классу двух переключений при различных начальных управлениях. Обнуление крайнего интервала управления в классе трех переключений также приводит к классу двух переключений (оранжевая и красная кривые).

Рис. 2.

Точки фазовой плоскости первого осциллятора.

5. ЗАКЛЮЧЕНИЕ

Необходимые условия экстремума задачи оптимального быстродействия в системе, состоящей из двух несинхронных осцилляторов, сформулированные в виде Теоремы 1, позволяют найти моменты переключения в любом классе переключений управления. Сформулирована Лемма 5, связывающая получаемое управление с выбранным классом переключений. Для заданных частот и фиксированного ограничения на управление построено множество достижимости на фазовой плоскости первого осциллятора для классов трех и четырех переключений. Получены аналитические выражения для описания кривой класса двух переключений, которая разделяет области трех переключений с различным управлением на начальном интервале. Предложенный в работе подход может быть распространен на системы, состоящие из произвольного числа осцилляторов, в том числе и с учетом произвольных терминальных условий второго и следующих осцилляторов.

Список литературы

  1. Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980.

  2. Andresen B., Hoffmann K.H., Nulton J., Tsirlin A., Sala-mon P. Optimal control of the parametric oscillator // European Journal of Physics 2011. V. 32. No. 3. P. 827–843.

  3. Hoffmann K.H., Andresen B., Salamon P. Optimal control of a collection of parametric oscillators // Physical Review E 2013. V. 87. Iss. 6:062106.

  4. Andresen B., Salamon P., Hoffmann K.H., Tsirlin A.M. Optimal Processes for Controllable Oscillators // Automation and Remote Control 2018. V. 79. No. 12. P. 3–15.

  5. Галяев А.А. Скалярное управление группой несинхронных осцилляторов // Автоматика и телемеханика 2016. № 9. С. 3–18.

  6. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969.

  7. Федоров А.К., Овсеевич А.И. Асимптотически оптимальное управление в форме синтеза для системы линейных осцилляторов // Доклады Академии наук 2013. Том 452 №. 3. С. 266–270.

  8. Fedorov A.K., Ovseevich A.I. Asymptotic control theory for a system of linear oscillators // Moscow Mathematical Journal 2016. V. 16. Iss. 3. P. 561–598.

  9. Сачков Ю.Л. Введение в геометрическую теорию управления. М.: Ленанд, 2021.

  10. Берлин Л.М., Галяев А.А., Лысенко П.В. Геометрический подход к задаче оптимального скалярного управления двумя несинхронными осцилляторами // Итоги науки и техники. Современная математика и ее приложения. Тематические обзоры, 2022, С. 1–9. (в печати)

  11. La Salle J.P. The Time Optimal Control Problem // Contributions to the Theory of Nonlinear Oscillations (AM-45) 1960. V. 5. P. 1–24.

  12. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. М.: Наука, 2005.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления