Журнал вычислительной математики и математической физики, 2023, T. 63, № 5, стр. 731-738

Синтез оптимальной системы с устойчивыми режимами скольжения

Л. Т. Ащепков 1*

1 ДВФУ
690922 Владивосток, о. Русский, п. Аякс, 10, Россия

* E-mail: ashchepkov@yahoo.com

Поступила в редакцию 09.09.2022
После доработки 09.09.2022
Принята к публикации 15.12.2022

Полный текст (PDF)

Аннотация

Предложен метод синтеза оптимального управления, обеспечивающего существование и устойчивость режимов скольжения системы нелинейных обыкновенных дифференциальных уравнений. В методе используется вспомогательная задача оптимального управления. Решение задачи дает искомое управление в аналитической форме. Установлена устойчивость по Ляпунову тривиального решения замкнутой и доопределенной систем. Показано применение метода к линейным и квазилинейным системам уравнений. Приведен иллюстративный пример. Библ. 11. Фиг. 1.

Ключевые слова: синтез системы, оптимальное управление, достаточные условия оптимальности, скользящий режим, устойчивость.

1. ВВЕДЕНИЕ

Проблема устойчивости систем автоматического регулирования возникла в XVIII веке с развитием промышленной революции и не утратила актуальности в настоящее время. Многочисленные исследования привели к созданию ряда новых научных методов и направлений. Не останавливаясь на них подробно, отметим близкую теме статьи теорию систем с переменной структурой. В ее основе лежит идея использования порождающих устойчивые режимы скольжения разрывных обратных связей (далее – специальных управлений). Историю развития, результаты, методологию и библиографию можно найти в публикациях [13]. Отдавая должное достигнутым в теории успехам, отметим, что вопрос об общем формализованном способе построения специальных управлений остается пока открытым.

В данной статье предложен метод синтеза специального оптимального управления для нелинейной системы определенного типа, использующий аналитическое решение оригинальной вспомогательной задачи оптимального управления. Построенное этим методом управление определено и непрерывно на всем фазовом пространстве системы, за исключением некоторого многообразия. Благодаря этому процедура доопределения системы на многообразии [4] упрощается и позволяет выписать уравнения скольжения в явном виде [1]. Итоговый фазовый портрет синтезированной системы состоит из участков оптимальных траекторий, попавших из начальных точек на подмножество многообразия (область скольжения), и участков траекторий, лежащих в области скольжения и притягивающихся к началу координат. За счет появления в решении задачи режимов скольжения достигается еще и важная в техническом отношении малая чувствительность траекторий синтезированной системы к возмущениям [1].

Приведенные в статье результаты легко обобщаются на случай эллипсоидальной области управления. Вместе с тем их распространение на области управления с негладкими границами, например, многогранники, наталкивается на серьезные технические трудности, связанные с возможным появлением режимов скольжения на пересечениях поверхностей разрыва управления. Заметим также, что вспомогательная задача оптимального управления является обратной по отношению к “единичному” управлению [5], веденному в качестве векторного аналога релейного скалярного управления.

2. ПОСТАНОВКА ЗАДАЧИ

Рассмотрим систему обыкновенных дифференциальных уравнений в координатной форме

${{\dot {x}}_{i}} = {{f}_{i}}({{x}_{1}},...,{{x}_{n}}) + \sum\limits_{k = 1}^m {{{b}_{{ik}}}} ({{x}_{1}},...,{{x}_{n}}){{u}_{k}},\quad i = 1,...,n,$
и векторно-матричном представлении
(1)
$\dot {x} = f(x) + B(x)u,$
где $x,\,\,u$ – векторы фазового состояния и управляющих воздействий с координатами ${{x}_{1}},...,{{x}_{n}}$, ${{u}_{1}},...,{{u}_{m}}$ соответственно и $\dot {x} = {{dx} \mathord{\left/ {\vphantom {{dx} {dt}}} \right. \kern-0em} {dt}}.$ Предположим, что векторная функция $f:{{{\text{R}}}^{n}} \to {{{\text{R}}}^{n}}$ со свойством $f(0) = 0$ и матричная функция $B:{{{\text{R}}}^{n}} \to {{{\text{R}}}^{{n \times m}}}$ ранга $m \leqslant n$ в областях определения гладкие (достаточное число раз дифференцируемые). Кроме того, для заданной гладкой положительно- определенной функции $c(x)$ ($c(x) > 0,\;x \ne 0,\;c(0) = 0)$) существуют гладкая скалярная функция $w(x)$ и положительные постоянные $\alpha ,\beta $, удовлетворяющие условиям
(2)
$\begin{gathered} f(x){\kern 1pt} '{\kern 1pt} {{w}_{x}}(x) + c(x) = 0, \\ c(x) \geqslant \alpha w(x),\quad w(x) \geqslant \beta {{\left\| x \right\|}^{2}},\quad x \in {{{\text{R}}}^{n}}. \\ \end{gathered} $
Здесь $f{\kern 1pt} '{\kern 1pt} {{w}_{x}} = {{f}_{1}}{{w}_{{{{x}_{1}}}}} + ... + {{f}_{n}}{{w}_{{{{x}_{n}}}}}$ – скалярное произведение вектора $f$ на градиент ${{w}_{x}}$ функции $w$, штрих – знак транспонирования и $\left\| x \right\| = {{\left( {x{\kern 1pt} '{\kern 1pt} x} \right)}^{{1{\text{/}}2}}}$ $ - $ евклидова норма вектора x.

В предположениях (2) по второй теореме Ляпунова (см., например, [6, с. 17]) тривиальное решение уравнения $\dot {x} = f(x)$ равномерно асимптотически устойчиво. Непротиворечивость условий (2) в частном случае показана в разд. 5.

Требуется обеспечить устойчивость тривиального решения системы (1) с помощью специальных ограниченных управлений.

3. ВСПОМОГАТЕЛЬНАЯ ЗАДАЧА

В связи со сказанным сформулируем задачу оптимального управления

(3)
$\begin{gathered} J = \int\limits_0^\infty {\left( {c(x(t)) + \left\| {s(x(t))} \right\|} \right)dt \to \min ,} \\ \dot {x} = f(x) + B(x)u,\quad x(0) = {{x}_{0}},\quad x(\infty ) = 0,\quad \left\| u \right\| \leqslant 1,\quad t \geqslant 0, \\ \end{gathered} $
где ${{x}_{0}}$ – произвольный фиксированный вектор, $x(\infty )$ – предел функции $x(t)$ при $t \to \infty $ и
(4)
$s(x) = B(x){\kern 1pt} '{{w}_{x}}(x),\quad x \in {{{\text{R}}}^{n}},$
$ - $ гладкая векторная функция со значениями в ${{{\text{R}}}^{m}}$. Ранг матрицы $({{s}_{x}}{\text{B): }}{{{\text{R}}}^{n}} \to {{{\text{R}}}^{{m \times m}}}$ на множестве R решений уравнения $s(x) = 0$ примем равным m.

Непрерывную кусочно-гладкую траекторию $x(t),\;t \geqslant 0$, и кусочно-непрерывное управление $u(t),\;t \geqslant 0$, назовем процессом, если пара $x(t),\;u(t)$ отвечает условиям (3), за возможным исключением целевого требования, и соответствующее значение функционала J конечно. Вспомогательная задача состоит в нахождении оптимального процесса с наименьшим значением целевого функционала.

Как видно из постановки задачи, близость траекторий $x(t)$ к началу координат и множеству R оценивается суммой неотрицательных несобственных интегралов

$\int\limits_0^\infty {c(x(t))dt} ,\quad \int\limits_0^\infty {\left\| {s(x(t))} \right\|dt} .$
Минимизация функционала J предполагает уменьшение интегралов, т.е. влечет асимптотическое приближение траекторий к началу координат и множеству R (устойчивость) или приближение к началу координат по множеству R (скольжение), что отвечает требуемой цели управления системой (1).

Обсудим корректность постановки задачи (3). Если ${{x}_{0}} = 0$, то решение $x = 0,\;u = 0$ задачи очевидно. Следовательно, множество оптимальных процессов, отвечающих начальным точкам ${{x}_{0}} \in {{{\text{R}}}^{n}}$, не пусто.

Принятые предположения гарантируют также существование и единственность множества R. Действительно, если $m = n$, то R по определению состоит из единственной точки $x = 0.$ При $m < n$ из свойств функций w, s следует ${{w}_{x}}(0) = 0$, $s(0) = 0$. Поскольку ранг матрицы ${{s}_{x}}(0)$ равен m, то без потери общности можно считать последние m столбцов этой матрицы линейно независимыми. Положим $y = ({{x}_{1}},...,{{x}_{{n - m}}}),\;z = ({{x}_{{n - m + 1}}},...,{{x}_{n}})$ и представим уравнение $s(x) = 0$ в виде $s(y,z) = 0.$ По предположению, функция $s(y,z)$ гладкая по совокупности аргументов и при $y = 0,\;z = 0$ удовлетворяет условиям $s(0,0) = 0,$ $\operatorname{rank} {{s}_{z}}(0,0) = m$. Согласно теореме о неявной функции (см., например, [7, с. 299]) последние условия гарантируют существование в некоторой окрестности точки $(0,0)$ единственной гладкой функции $z = {{\varphi }}(y)$ со свойствами $0 = {{\varphi }}(0),\;s(y,{{\varphi }}(y)) = 0$. В силу единственности график функции $z = {{\varphi }}(y)$ и множество R в окрестности точки $(0,0)$ совпадают. Следовательно, при $m < n$ в окрестности начала координат существует единственное множество R, представляющее собой гладкое многообразие.

4. РЕШЕНИЕ ВСПОМОГАТЕЛЬНОЙ ЗАДАЧИ

Решение задачи (3) проведем в четыре этапа.

4.1. Нижняя оценка функционала

Следуя [8], представим целевой функционал на произвольном фиксированном процессе $x(t)$, $u(t)$ в виде

$J = \int\limits_0^\infty {\left( {c(x(t)) + \left\| {s(x(t))} \right\|} \right)dt + } \int\limits_0^\infty {\left. {{{{\left( {w(x(t))} \right)}}^{ \bullet }}dt - w(x(t))} \right|_{{t = 0}}^{{t = \infty }}} .$
Выполняя во втором интеграле дифференцирование по t и учитывая (3), (4), получим
$\begin{gathered} J = w({{x}_{0}}) + \int\limits_0^\infty {\left( {c(x(t)) + \left\| {s(x(t))} \right\|} \right)dt + \int\limits_0^\infty {{{w}_{x}}(x(t)){\kern 1pt} '\left( {f(x(t)) + B(x(t))u(t)} \right)dt} } = \\ \, = w({{x}_{0}}) + \int\limits_0^\infty {\left( {\left\| {s(x(t))} \right\| + s(x(t)){\kern 1pt} '{\kern 1pt} u(t)} \right)dt} . \\ \end{gathered} $
Найдем нижнюю оценку функционала J. Имеем
$J = w({{x}_{0}}) + \int\limits_0^\infty {\left( {\left\| {s(x(t))} \right\| + s(x(t)){\kern 1pt} '{\kern 1pt} u(t)} \right)dt} \geqslant w({{x}_{0}}) + \int\limits_0^\infty {\mathop {\min }\limits_{x \in {{{\text{R}}}^{n}}} \mathop {\min }\limits_{\left\| u \right\| \leqslant 1} \left( {\left\| {s(x)} \right\| + s(x){\kern 1pt} '{\kern 1pt} u} \right)dt.} $
Минимизируемая на шаре $\left\| u \right\| \leqslant 1$ подынтегральная функция в силу неравенства Коши–Буняковского имеет точную нижнюю оценку
$\left\| {s(x)} \right\| + s(x){\kern 1pt} '{\kern 1pt} u \geqslant \left\| {s(x)} \right\| - \left\| {s(x)} \right\|\left\| u \right\| \geqslant 0,$
достижимую на управлении
(5)
$u(x) = - \frac{{s(x)}}{{\left\| {s(x)} \right\|}},\quad s(x) \ne 0.$
В результате нижняя оценка функционала J примет вид

(6)
$J = w({{x}_{0}}) + \int\limits_0^\infty {\left( {\left\| {s(x(t))} \right\| + s(x(t)){\kern 1pt} 'u(t)} \right)dt \geqslant } \;w({{x}_{0}}).$

4.2. Структура многообразия R

Формула (5) задает непрерывное управление $u(x)$ на всем пространстве ${{{\text{R}}}^{n}}$, кроме многообразия R. Следуя [4], доопределим на R уравнения замкнутой системы

(7)
$\dot {x} = f(x) + B(x)u(x).$
Введем обозначения
(8)
$\dot {s}(x,u) = {{s}_{x}}(x)\left( {f(x) + B(x)u} \right)$
для производной функции $s(x)$ в силу системы (1), $U$ – для шара $\left\| u \right\| \leqslant 1$ и $\dot {s}(x,U)$ – для области значений производной $\dot {s}(x,u)$ на шаре U при фиксированном x. Выделим, далее, на R множества S, P, полагая

(9)
$x \in S \Leftrightarrow \left( {0 \in \dot {s}(x,U),\;s(x) = 0} \right),$
(10)
$x \in P \Leftrightarrow \left( {0 \notin \dot {s}(x,U),\;s(x) = 0} \right).$

Согласно (9) включение $x \in S$ равносильно существованию решения $v = v(x)$ уравнения ${{s}_{x}}(x)\left( {f(x) + B(x){v}} \right) = 0$ и выполнению условий ${v}(x) \in U$, $x \in R.$ Учитывая обратимость матрицы ${{s}_{x}}(x)B(x)$, представим эти условия в эквивалентной форме:

(11)
${v}(x) = - {{\left( {{{s}_{x}}(x)B(x)} \right)}^{{ - 1}}}{{s}_{x}}(x)f(x),\quad \left\| {{v}(x)} \right\| \leqslant 1,\quad s(x) = 0.$
На множестве S функция ${v}(x)$ непрерывна и допустима по амплитудному ограничению (3). Рассматривая ${v}(x)$ как продолжение управления $u(x)$ на многообразие R и следуя [4], определим на S замкнутую систему дифференциальных уравнений
(12)
$\dot {x} = f(x) + B(x){v}(x),\quad x \in S.$
Из (8), (11) вытекает тождественное на S равенство $\dot {s}(x,{v}(x)) = 0$, поэтому исходящие из точек множества S траектории системы (12) лежат в S. Множество S будем называть областью скольжения и уравнения (12)уравнениями скольжения.

Установим свойства множества $P$. В произвольной фиксированной точке $\xi \in P$ множество $\dot {s}(\xi ,U) = {{s}_{x}}(\xi )\left( {f(\xi ) + B(\xi )U} \right)$ выпуклое, замкнутое, ограниченное в ${{{\text{R}}}^{m}}$ и по определению (10) не содержит 0. Согласно теореме отделимости (см., например, [9, с. 25]) для множеств $\dot {s}(\xi ,U)$ и 0 найдется такой зависящий от $\xi $ ненулевой вектор $a \in {{{\text{R}}}^{m}}$, что справедливо строгое неравенство $a{\kern 1pt} '{\kern 1pt} \dot {s}(\xi ,U) > a{\kern 1pt} '0 = 0$. В подробной записи в обозначении (8) имеем

(13)
$a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(\xi )\left( {f(\xi ) + B(\xi )u} \right) > 0,\quad u \in U.$
По предположению, строки матрицы ${{s}_{x}}(\xi )$ линейно независимы, поэтому $a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(\xi ) \ne 0$. Обозначим через M поверхность $a{\kern 1pt} '{\kern 1pt} s(x) = 0$. Вектор a в неравенстве (13) определен с точностью до положительного множителя и $a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(x)$ есть градиент функции $a{\kern 1pt} '{\kern 1pt} s(x)$, поэтому без потери общности считаем $a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(\xi )$ нормалью поверхности M в точке $\xi $. В этих терминах неравенство (13) означает положительность проекции любого вектора скорости $\dot {x} = f(\xi ) + B(\xi )u$, $u \in U$, на нормаль $a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(\xi )$. В частности, если траектория $x(t)$ замкнутой системы (7) имеет в момент $t = \tau $ общую с поверхностью M точку $x(\tau ) = \xi $, то проекции односторонних векторов скорости $\dot {x}(\tau \pm 0) = f(x(\tau )) + B(x(\tau ))u(x(\tau \pm 0))$ в точке $x(\tau )$ на нормаль $a{\kern 1pt} '{\kern 1pt} {{s}_{x}}(\xi )$ тоже положительны. Последнее возможно тогда и только тогда, когда траектория $x(t)$ пересекает поверхность M в точке $\xi $ без односторонних касаний. Это значит, что односторонние векторы скорости $\dot {x}(\tau \pm 0)$ не лежат в касательной плоскости к поверхности M в точке $\xi $. Поскольку $P \subset M$ и $\xi $ – произвольная точка Р, то каждая траектория замкнутой системы (7), имеющая с Р общую точку, пересекает P. В связи c этим множество Р будем называть областью прошивания.

Итак, многообразие R состоит из двух взаимно дополняющих областей скольжения S и прошивания $P,$заданных соответственно условиями

(14)
$\begin{gathered} \left\| {{{{\left( {{{s}_{x}}(x)B(x)} \right)}}^{{ - 1}}}{{s}_{x}}(x)f(x)} \right\| \leqslant 1,\quad s(x) = 0; \hfill \\ \left\| {{{{\left( {{{s}_{x}}(x)B(x)} \right)}}^{{ - 1}}}{{s}_{x}}(x)f(x)} \right\| > 1,\quad s(x) = 0. \hfill \\ \end{gathered} $

4.3. Оптимальный процесс

Вернемся к вопросу о точности нижней оценки (6). Обозначим через $x(t)$ определенную на полуоси $t \geqslant 0$ непрерывную траекторию замкнутой системы (7), (12) с начальным условием $x(0) = {{x}_{0}}$. Выделим на полуоси $t \geqslant 0$ множества ${{T}_{1}},\,\,{{T}_{2}},\,\,{{T}_{3}}$, полагая

$t \in {{T}_{1}} \Leftrightarrow x(t) \notin R;\quad t \in {{T}_{2}} \Leftrightarrow x(t) \in S;\quad t \in {{T}_{3}} \Leftrightarrow x(t) \in P.$
Если $t \in {{T}_{1}}$, то с использованием (2), (5) и (7) находим
${{\left( {w(x(t))} \right)}^{ \bullet }} = {{w}_{x}}(x(t)){\kern 1pt} '\left( {f(x(t)) + B(x(t))u(x(t)} \right) = - c(x(t)) - \left\| {s(x(t))} \right\| \leqslant - c(x(t)) \leqslant - \alpha w(x(t)).$
При $t \in {{T}_{2}}$ в силу (2), (4) и (12) так же получим
${{\left( {w(x(t))} \right)}^{ \bullet }} = {{w}_{x}}(x(t)){\kern 1pt} '\left( {f(x(t)) + B(x(t)){v}(x(t)} \right) = - c(x(t)) + s(x(t)){\kern 1pt} {\kern 1pt} '{\kern 1pt} {v}(x(t)) = - c(x(t)) \leqslant - \alpha w(x(t)).$
Следовательно, неравенство
(15)
${{\left( {w(x(\tau ))} \right)}^{ \bullet }} \leqslant - \alpha w(x(\tau )){\text{,}}\quad \tau \geqslant {\text{0,}}$
верно на всей полуоси времени, за возможным исключением моментов $\tau \in {{T}_{3}}$ и момента первого попадания траектории $x(t)$ на S. Интегрируя неравенство (15) по $\tau $ в пределах от нуля до $t \geqslant 0$, приходим к оценке
(16)
$w(x(t)) \leqslant w({{x}_{0}}){{e}^{{ - \alpha t}}},\quad t \geqslant 0.$
Из (16) следует соотношение $x(\infty ) = 0$, значит, пара $x(t),\,\,u(t)$ с управлением
(17)
$u(t) = u(x(t)),\quad t \in {{T}_{1}};\quad u(t) = {v}(x(t)),\quad t \in {{T}_{2}},$
является процессом.

Покажем, что на этом процессе нижняя оценка (6) целевого функционала достигается. Действительно, подынтегральная функция в неравенстве (6) равна нулю, во-первых, в силу определений (17) и (5) управления $u(t)$ при $t \in {{T}_{1}}$ и, во-вторых, в силу равенства $s\left( {x(t)} \right) = 0$ при $t \in {{T}_{2}} \cup {{T}_{3}}$. По построению, множества ${{T}_{1}},\,\,{{T}_{2}},\,\,{{T}_{3}}$ не пересекаются и в объединении составляют всю полуось $t \geqslant 0$, поэтому несобственный интеграл в неравенстве (6) равен нулю. В результате соотношение (6) выполняется как точное равенство и тогда процесс $x(t),\,\,u(t)$ – оптимальный.

4.4. Устойчивость синтезированной системы

Как показано в п. 4.3, каждая определенная при $t \geqslant 0$ оптимальная траектория $x(t)$ замкнутой системы (7), (12), исходящая в момент $t = 0$ из произвольной точки ${{x}_{0}} \in {{{\text{R}}}^{n}}$, удовлетворяет оценке (16). При заданном $\beta > 0$ в силу свойств функции w (неотрицательности на ${{{\text{R}}}^{n}}$, непрерывности и нулевом значении в начале координат) по любому $\varepsilon > 0$ найдется такое $\delta > 0$, что выполняется неравенство $0 \leqslant w({{x}_{0}}) < \beta {{\varepsilon }^{2}},$ если только $\left\| {{{x}_{0}}} \right\| < \delta .$ Тогда с использованием (2) и (16) получим

$\beta {{\left\| {x(t)} \right\|}^{2}} \leqslant w(x(t)) \leqslant w({{x}_{0}}){{e}^{{ - \alpha t}}} < \beta {{\varepsilon }^{2}},\quad t \geqslant 0.$
Отсюда вытекает справедливость неравенства $\left\| {x(t)} \right\| < \varepsilon $ при любых $t \geqslant 0$, $\left\| {{{x}_{0}}} \right\| < \delta $, что равносильно устойчивости по Ляпунову тривиального решения системы (7), (12).

Сформулируем общие выводы.

Теорема. Если условия задачи (3) отвечают принятым в разд. 2, 3 предположениям, то при любом ${{x}_{0}}$ решение задачи существует. Оптимальное управление (5) имеет разрыв на многообразии R, состоящем из областей скольжения S и прошивания P вида (14). Залегающие на S части оптимальных траекторий описываются уравнениями скольжения (12). Управление (11) в области скольжения непрерывное и допустимое по амплитудному ограничению (3). Тривиальное решение замкнутой системы (7), (12) устойчиво по Ляпунову. Минимум целевого функционала равен $w({{x}_{0}})$.

Теорема полностью доказана приведенными выше рассуждениями.

5. ЧАСТНЫЕ СЛУЧАИ ЗАДАЧИ

5.1. Линейные стационарные системы

Рассмотрим задачу (3) с функциями

(18)
$f(x) = Ax,\quad c(x) = x{\kern 1pt} '{\kern 1pt} Cx,\quad w(x) = x{\kern 1pt} 'Wx,\quad x \in {{\operatorname{R} }^{n}},$
в следующих предположениях. Квадратные матрицы A, C, W порядка n постоянные, матрица А устойчивая – действительные части всех ее собственных значений отрицательные, матрица C симметричная и положительно-определенная, матрица W удовлетворяет матричному алгебраическому уравнению Ляпунова
(19)
$A{\kern 1pt} '{\kern 1pt} W + WA + C = 0.$
Согласно [10] уравнение (19) задает симметричную положительно-определенную матрицу $W$ однозначно.

Для функций (18) с указанными матрицами условия (2) выполняются. Действительно, в силу (19) квадратичная форма $w(x)$ обращает уравнение (2) в тождество на всем пространстве ${{R}^{n}}.$ Неравенства (2) верны при $\alpha = \mathop {\min }\limits_{\left\| x \right\| = 1} {{c(x)} \mathord{\left/ {\vphantom {{c(x)} {w(x)}}} \right. \kern-0em} {w(x)}},\;\beta = \mathop {\min }\limits_{\left\| x \right\| = 1} w(x).$

Считая дополнительно матрицу $B(x) = B$ ранга m постоянной, приходим к стационарной задаче оптимального управления

(20)
$\begin{gathered} J = \int\limits_0^\infty {\left( {x(t){\kern 1pt} '{\kern 1pt} Cx(t) + 2\left\| {B{\kern 1pt} '{\kern 1pt} Wx(t))} \right\|} \right)dt \to \min ,} \\ \dot {x} = Ax + Bu,\quad x(0) = {{x}_{0}},\quad x(\infty ) = 0,\quad \left\| u \right\| \leqslant 1,\quad t \geqslant 0, \\ \end{gathered} $
отвечающей всем условиям теоремы из разд. 4. На основании теоремы задача (20) имеет решение при любых ${{x}_{0}}$, оптимальное управление $u(x)$ задано формулой (5) с функцией $s(x) = B{\kern 1pt} '{\kern 1pt} Wx$, управление (11) имеет вид
${v}(x) = - {{\left( {B{\kern 1pt} '{\kern 1pt} WB} \right)}^{{ - 1}}}B{\kern 1pt} '{\kern 1pt} WAx,\quad s(x) = 0,$
тривиальное решение замкнутой системы
$\dot {x} = Ax + Bu(x),\quad s(x) \ne 0;\quad \dot {x} = Ax + B{v}(x),\quad s(x) = 0$
экспоненциально устойчиво, минимум целевого функционала равен $x_{0}^{'}W{{x}_{0}}$.

Приведенные результаты полностью совпадают с выводами [11]. Экспоненциальная устойчивость вытекает из оценки (16) и неравенства $x{\kern 1pt} '{\kern 1pt} Wx \leqslant \mu {{\left\| x \right\|}^{2}}$, где $\mu $ – максимум квадратичной формы $x{\kern 1pt} '{\kern 1pt} Wx$ на сфере $\left\| x \right\| = 1$.

5.2. Квазилинейные системы

Пусть в задаче (20) матрицы $A,\;C,\;W$ по-прежнему отвечают предположениям п. 5.1 и переменная матрица ${{s}_{x}}(x)B(x)$ имеет ранг $m$ на многообразии $s(x) = 0$ при $s(x) = B(x){\kern 1pt} 'Wx$. Тогда утверждения теоремы остаются верными.

Проиллюстрируем сказанное на примере билинейной системы. Положим

$A = \left( {\begin{array}{*{20}{c}} { - 1}&0 \\ 0&{ - 3} \end{array}} \right),\quad B(x) = \left( {\begin{array}{*{20}{c}} {{{x}_{1}}} \\ 1 \end{array}} \right),\quad C = \left( {\begin{array}{*{20}{c}} 2&0 \\ 0&6 \end{array}} \right),\quad W = \left( {\begin{array}{*{20}{c}} 1&0 \\ 0&1 \end{array}} \right).$

В соответствии с выводами теоремы находим оптимальное релейное управление $u({{x}_{1}},{{x}_{2}}) = $ $ = - \operatorname{sign} \left( {x_{1}^{2} + {{x}_{2}}} \right)$, область скольжения $x_{1}^{2} + {{x}_{2}} = 0$ и уравнения скольжения

(21)
$\begin{gathered} {{{\dot {x}}}_{1}} = - {{x}_{1}}\left( {1 - {v}({{x}_{2}})} \right),\quad {{{\dot {x}}}_{2}} = - 2{{x}_{2}}\left( {1 - {v}({{x}_{2}})} \right), \\ {v}({{x}_{2}}) = {{{{x}_{2}}} \mathord{\left/ {\vphantom {{{{x}_{2}}} {(1 - 2{{x}_{2}})}}} \right. \kern-0em} {(1 - 2{{x}_{2}})}},\quad x_{1}^{2} + {{x}_{2}} = 0. \\ \end{gathered} $
Область прошивания отсутствует. Картина расположения оптимальных траекторий показана на фигуре.

Выберем малое $\varepsilon > 0$ и зафиксируем произвольную точку $\xi (\tau ) = \left( {\left| \tau \right|, - {{\tau }^{2}}} \right)$, $\left| \tau \right| > \varepsilon $, области скольжения. Рассмотрим две траектории, исходящие в момент $t = 0$ из точки $\xi (\tau )$: пробную траекторию $y(t) = ({{y}_{1}}(t),{{y}_{2}}(t))$, $t \geqslant 0$, исходной системы уравнений при $u = 0$ и оптимальную траекторию $x(t) = ({{x}_{1}}(t),{{x}_{2}}(t))$, $t \geqslant 0$, описываемую уравнениями скольжения (21).

Фиг. 1.

Фазовый портрет оптимальной синтезированной системы в примере. Движение фазовой точки к началу координат происходит по оси ординат или по параболе в режиме скольжения.

Сравним траектории $x(t),y(t)$ по переходным периодам ${{t}_{1}},\,\,{{t}_{2}}$ $ - $ соответствующим моментам первого попадания на границу квадрата $[ - \varepsilon ,\varepsilon ] \times [ - \varepsilon ,\varepsilon ]$, $\varepsilon < \left| \tau \right|$. Для пробной траектории верны тождества

(22)
${{{{{\dot {y}}}_{1}}(t)} \mathord{\left/ {\vphantom {{{{{\dot {y}}}_{1}}(t)} {{{y}_{1}}(t)}}} \right. \kern-0em} {{{y}_{1}}(t)}} \equiv - 1,\quad {{{{{\dot {y}}}_{2}}(t)} \mathord{\left/ {\vphantom {{{{{\dot {y}}}_{2}}(t)} {{{y}_{2}}(t)}}} \right. \kern-0em} {{{y}_{2}}(t)}} \equiv - 3,\quad t \geqslant 0,$
и уравнения
(23)
$\left| {{{y}_{1}}({{\theta }_{1}})} \right| = \varepsilon ,\quad {{y}_{2}}({{\theta }_{2}}) = - \varepsilon $
имеют единственные положительные корни ${{\theta }_{1}},\;{{\theta }_{2}}$. Проинтегрируем тождества (22) по t на отрезках $[0,{{\theta }_{1}}]$ и $[0,{{\theta }_{2}}]$ соответственно с использованием начальных значений и равенств (23). Получим
${{\theta }_{1}} = \ln \left( {{{\left| \tau \right|} \mathord{\left/ {\vphantom {{\left| \tau \right|} \varepsilon }} \right. \kern-0em} \varepsilon }} \right) > {{\theta }_{2}} = \ln {{\left( {{{{{\tau }^{2}}} \mathord{\left/ {\vphantom {{{{\tau }^{2}}} \varepsilon }} \right. \kern-0em} \varepsilon }} \right)}^{{{1 \mathord{\left/ {\vphantom {1 3}} \right. \kern-0em} 3}}}}.$
Следовательно, ${{t}_{2}} = {{\theta }_{1}} = \ln \left( {{{\left| \tau \right|} \mathord{\left/ {\vphantom {{\left| \tau \right|} \varepsilon }} \right. \kern-0em} \varepsilon }} \right)$. Таким же способом находим переходный период ${{t}_{1}}$ оптимальной траектории

${{t}_{1}} = {{t}_{2}} - \frac{1}{6}ln\frac{{1 + 3{{\tau }^{2}}}}{{1 + 3{{\varepsilon }^{2}}}},\quad \left| \tau \right| > \varepsilon .$

Из полученной формулы вытекает, что для любых $\tau ,\,\,\left| \tau \right| > \varepsilon $, оптимальная траектория имеет меньший переходный период, чем пробная траектория, и разность ${{t}_{2}} - {{t}_{1}}$ неограниченно возрастает с увеличением $\left| \tau \right|$. Кроме того, в силу точной нижней оценки (6) оптимальная траектория оказывается лучше пробной еще и по целевому функционалу.

В общем случае пробная траектория системы (1) (при управлении $u = 0$) оптимальна во вспомогательной задаче (3) в том и только в том случае, если полностью лежит в области скольжения. Этот вывод непосредственно следует из точной нижней оценки (6) целевого функционала.

Список литературы

  1. Уткин В.И. Системы с переменной структурой: состояние, проблемы, перспективы // Автоматика и телемехан. 1983. № 9. С. 5–25. Utkin V. I. Variable structure systems: present and future //Automat. Remote Control. 1983. V. 44. № 9. P. 1105–1120.

  2. Ferrara A., Incremona G.P., Cucuzzella M. Advanced and optimization based sliding mode control. Philadelphia: SIAM, 2019.

  3. Steinberger M., Horn M., Fridman L.M. Variable-structure systems and sliding-mode control. Berlin: Springer, 2020.

  4. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью // Матем. сб. 1960. Т. 51 (93). № 1. С. 99–128.

  5. Уткин В.И., Орлов Ю.В. Системы управления с векторным реле // Автоматика и телемехан. 2019. № 9. С. 143–155. Utkin V.I., Orlov Yu.V. Control systems with vector relays // Automat. Remote Control. 2019. V. 80. № 9. P. 1671–1680.

  6. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высш. шк., 2003.

  7. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1965.

  8. Кротов В.Ф., Букреев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. M.: Машиностр., 1969.

  9. Карманов В.Г. Математическое программирование. М.: Наука, 1986.

  10. Параев Ю.И. Уравнения Ляпунова и Риккати. Томск: Томский ун-т, 1989.

  11. Ащепков Л.Т. Аналитическое конструирование регулятора с амплитудным ограничением // Автоматика и телемехан. 2022. № 7. С. 49–58. Ashchepkov L.T. Analytical synthesis of an amplitude-constrained controller // Automat. Remote Control. 2022. V. 83. № 7. P. 1050–1058.

Дополнительные материалы отсутствуют.