Известия РАН. Теория и системы управления, 2019, № 2, стр. 5-13

ЭФФЕКТ СМЕЩЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В ЗАДАЧАХ СТАБИЛИЗАЦИИ КВАЗИЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ ДИФФУЗИОННОГО ТИПА

А. С. Халина 1*, М. М. Хрусталев 1**

1 ИПУ им. В.А. Трапезникова РАН, МАИ (национальный исследовательский ун-т)
Москва, Россия

* E-mail: an.khalina@gmail.com
** E-mail: mmkhrustalev@mail.ru

Поступила в редакцию 07.11.2017
После доработки 15.11.2018
Принята к публикации 26.11.2018

Полный текст (PDF)

Аннотация

Исследуется эффект смещения линейного оптимального управления в задачах стабилизации стационарных квазилинейных стохастических систем диффузионного типа, функционирующих на неограниченном интервале времени. Показано, что в системах без детерминированного дрейфа, в которых равновесное состояние разомкнутой системы равно нулю, возможно наличие скрытой асимметрии возмущений. Использование смещенного линейного регулятора улучшает качество стабилизации, несмотря на возникновение асимметрии колебаний системы.

Введение. Исследуются квазилинейные управляемые по выходу стохастические системы, функционирующие на неограниченном интервале времени. Коэффициенты диффузии рассматриваемых систем могут зависеть линейно от вектора состояния системы и управления. В литературе такого рода системы также называются линейными с мультипликативными шумами; линейными системами с шумами, зависящими от состояния; билинейными системами. Мы будем придерживаться предложенного Ю.И. Параевым [1] термина – квазилинейная система, который хорошо подчеркивает фактическую нелинейность таких систем.

Задачам оптимального управления квазилинейными стохастическими системами посвящено большое количество публикаций, например, [211]. Однако в этих публикациях в качестве основной постановки задачи рассматривается частный случай – симметричные квазилинейные системы [12].

В работе авторов [12] изложен подход к общей задаче синтеза оптимальной квазилинейной стохастической системы, функционирующей на неограниченном интервале времени, при неполной информации о состоянии.

В настоящей статье приводятся необходимые условия оптимальности управляемых по выходу систем, полученные в [12]. Интересно отметить факт необходимости использования для стабилизации квазилинейной системы в общем случае оптимальной стратегии управления со смещением, которая приводит к асимметрии колебаний относительно стабилизируемого состояния (равного нулю), но значительно уменьшающей среднеквадратичное отклонение от этого состояния. Указанный эффект встречается в линейных стохастических системах при наличии аддитивных неслучайных возмущений (дрейфа), действующих на объект [13]. При отсутствии дрейфа смещение управления отсутствует.

Для рассматриваемого здесь вида стохастических систем, которые по существу являются нелинейными, ситуация с возникновением смещения управления намного интереснее. Даже при отсутствии дрейфа, когда детерминированная система, получающаяся при обнулении случайных возмущений, и стохастическая разомкнутая система (управление равно нулю) имеют равновесное состояние равное нулю, оптимальная стратегия управления может иметь ненулевое смещение. Такое изменение структуры управления вызвано тем, что для квазилинейных систем, в отличие от линейных, обыкновенное дифференциальное уравнение для матрицы ковариаций зависит от математического ожидания состояния. В результате имеются случаи, когда искусственное введение ненулевого математического ожидания (и как следствие смещение управления) существенно уменьшает элементы матрицы ковариаций. Это, несмотря на возникающую асимметрию колебаний относительно нулевого состояния системы, существенно уменьшает среднеквадратичное отклонение от нуля. Математическим признаком такой ситуации является то, что коэффициенты диффузии в уравнениях системы, зависящие от состояния, обращаются в ноль на плоскости, не проходящей через начало координат. Это создает скрытую асимметрию возмущений.

В силу симметрии систем, рассматриваемых в [211], эффект смещения управления отсутствует.

Указанная особенность квазилинейных систем демонстрируется на примере движения специального маятника [14], производится сравнение стратегий различной структуры.

1. Постановка задачи. Рассматривается стохастическая динамическая управляемая по выходу система, описываемая уравнением Ито:

(1.1)
$dx = ({{A}_{{0c}}}x + {{B}_{{0c}}}u + B_{{0c}}^{1})dt + \sum\limits_{k = 1}^{{{n}_{w}}} ({{A}_{{kc}}}x + {{B}_{{kc}}}u + B_{{kc}}^{1})d{{w}_{k}}.$
Здесь $x \in {{R}^{n}}$ – состояние системы; $u \in {{R}^{{{{n}_{u}}}}}$ – вектор управления; $w \in {{R}^{{{{n}_{w}}}}}$ – стандартный винеровский процесс; ${{A}_{{kc}}}$, ${{B}_{{kc}}}$, $B_{{kc}}^{1}$, $k = \overline {0,{{n}_{w}}} $, – постоянные матрицы соответствующих размеров.

Стационарное линейное управление $u$ определяется равенствами

(1.2)
$u = - Ly + \nu ,$
(1.3)
$y = Cx,$
где $y \in {{R}^{{{{n}_{y}}}}}$ – выход системы, постоянная матрица $C$ соответствующих размеров задана, постоянные матрица $L \in {{R}^{{{{n}_{u}}}}} \times {{R}^{{{{n}_{y}}}}}$ и вектор смещения $\nu \in {{R}^{{{{n}_{u}}}}}$ – искомые параметры управления. Функцию вида (1.2) будем называть стратегией управления или регулятором.

Особенностью изучаемых задач является то, что, как и в детерминированной теории А.М. Летова (АКОР), система функционирует на неограниченном интервале времени. Но здесь изучается не летовская бесконечность, которая в практических задачах стабилизации заканчивается за 3–5 или 20 с, а “постлетовская” бесконечность, где классические “первичные” критерии типа времени переходного процесса, перерегулирования и т.д. теряют смысл. Единственным критерием стабилизации является мера отклонения от желаемого состояния системы (в рассматриваемой постановке задачи равного нулю), в качестве которой принят осредненный по времени квадратичный критерий.

Задача состоит в определении коэффициентов $L$, $\nu $ регулятора неполной обратной связи, исходя из условий минимума критерия оптимальности:

(1.4)
$\begin{gathered} J(P{\text{*}}( \cdot ),u) = \frac{1}{2}\mathop {lim}\limits_{T \to + \infty } \frac{1}{T}\int\limits_0^T \int\limits_{{{R}^{n}}} {{f}^{c}}(x,u)P(t,dx)dt, \\ {{f}^{c}}(x,u) = {{x}^{{\text{T}}}}{{Q}_{c}}x + 2{{x}^{{\text{T}}}}{{S}_{c}}u + {{u}^{{\text{T}}}}{{D}_{c}}u, \\ \end{gathered} $
где ${{f}^{c}}(x,u) \geqslant 0$, $P(t, \cdot \,)$ – вероятностная мера, задающая распределение случайного состояния $x$ системы (1.1) в момент времени $t \in [0, + \infty )$; ${{x}^{{\text{T}}}}{{Q}_{c}}x$ – неотрицательная квадратичная форма; ${{Q}_{c}}$ – симметричная постоянная матрица размеров $n \times n$; ${{S}_{c}}$, ${{D}_{c}} > 0$ – постоянные матрицы размеров ${{n}_{u}} \times n$, ${{n}_{u}} \times {{n}_{u}}$ соответственно. Внутренний интеграл в (1.4) представляет собой математическое ожидание “мгновенных потерь”.

Введем следующие обозначения, $k = \overline {0,{{n}_{w}}} $:

${{A}_{k}} = {{A}_{{kc}}} - {{B}_{{kc}}}LC,$
(1.5)
$\;\quad {{B}_{k}} = {{B}_{{kc}}}\nu + B_{{kc}}^{1},$
$Q = {{Q}_{c}} - {{S}_{c}}LC - {{C}^{{\text{T}}}}{{L}^{{\text{T}}}}S_{c}^{{\text{T}}} + {{C}^{{\text{T}}}}{{L}^{{\text{T}}}}{{D}_{c}}LC,$
$S = {{\nu }^{{\text{T}}}}S_{c}^{{\text{T}}} - {{\nu }^{{\text{T}}}}{{D}_{c}}LC,$
$D = {{\nu }^{{\text{T}}}}{{D}_{c}}\nu .$

2. Устойчивость системы и необходимые условия оптимальности. Начальное распределение ${{P}_{0}}(\, \cdot \,) = P(0, \cdot \,)$ состояния ${{x}_{0}} = x(0)$ считается заданным и выбирается из заданного множества ${{\mathcal{P}}_{0}}$ борелевских мер, которые имеют конечные вектор математического ожидания и матрицу ковариаций состояния ${{x}_{0}}$. В [1] показано, что в этом случае текущая мера $P(t, \cdot \,)$ процесса сохраняет указанные свойства и для квазилинейной системы (1.1) с регулятором (1.2), (1.3) имеет место замкнутая система уравнений для математического ожидания $m(t)$ и ковариации $\Gamma {\text{*}}(t)$:

(2.1)
$\dot {m} = {{A}_{0}}m + {{B}_{0}},$
(2.2)
$\Gamma * = {{A}_{0}}\Gamma {\text{*}} + \Gamma {\text{*}}A_{0}^{T} + \sum\limits_{k = 1}^{{{n}_{w}}} {{A}_{k}}\Gamma {\text{*}}A_{k}^{{\text{T}}} + \sum\limits_{k = 1}^{{{n}_{w}}} ({{A}_{k}}m + {{B}_{k}}){{({{A}_{k}}m + {{B}_{k}})}^{{\text{T}}}},$
которые имеют единственные решения при заданных начальных условиях $m(0) = {{m}_{0}}$, $\Gamma {\text{*}}(0) = \Gamma _{0}^{ * }$, где ${{m}_{0}}$, $\Gamma _{0}^{ * }$ – математическое ожидание и матрица ковариации начального состояния ${{x}_{0}} = x(0)$ системы.

Заметим, что уравнение (2.1) является линейным относительно $m(t)$ и не зависит от $\Gamma {\text{*}}(t)$. Оно будет асимптотически устойчивым, если матрица ${{A}_{0}}$ – гурвицева. Если решение $m(t)$ уравнения (2.1) найдено и подставлено в (2.2), то (2.2) также линейно относительно $\Gamma {\text{*}}(t)$ и его устойчивость может быть исследована классическими методами.

Определение 1. Обозначим через ${{U}_{a}}$ совокупность стратегий управления вида (1.2), для которых уравнения (2.1), (2.2) асимптотически устойчивы относительно положения равновесия ${{m}^{\infty }}$, ${{\Gamma }^{\infty }}$, определяемого выражениями

(2.3)
${{A}_{0}}{{m}^{\infty }} + {{B}_{0}} = 0,$
(2.4)
${{A}_{0}}{{\Gamma }^{\infty }} + {{\Gamma }^{\infty }}A_{0}^{T} + \sum\limits_{k = 1}^{{{n}_{w}}} {{A}_{k}}{{\Gamma }^{\infty }}A_{k}^{T} + \sum\limits_{k = 1}^{{{n}_{w}}} ({{A}_{k}}{{m}^{\infty }} + {{B}_{k}}){{({{A}_{k}}{{m}^{\infty }} + {{B}_{k}})}^{{\text{T}}}} = 0.$

Очевидно, что для стратегий вида (1.2) из ${{U}_{a}}$ решения ${{m}^{\infty }}$ и ${{\Gamma }^{\infty }}$ уравнений (2.3), (2.4) существуют и система (1.1) устойчива в среднеквадратичном.

Конкретизируем для рассматриваемой задачи утверждения из работы [12], приняв во внимание следующее замечание.

Замечание 1. В [12] в теоремах 3, 4 (уравнения (3.2)(3.5), (5.8), (5.12)) и их доказательствах под ${{\Gamma }^{\infty }}$ следует понимать матрицу вторых начальных моментов $\Gamma _{{(2)}}^{\infty }$, которая удовлетворяет известному уравнению

(2.5)
$\Gamma _{{(2)}}^{\infty } = {{\Gamma }^{\infty }} + {{m}^{\infty }}{{m}^{{{{\infty }^{{\text{T}}}}}}},$
где $\Gamma _{{(2)}}^{\infty }$ – матрица вторых начальных моментов, ${{\Gamma }^{\infty }}$ – матрица ковариации, удовлетворяющая выражению (2.4). А также в замечании 3 публикации [12, с. 75] вместо “матрица $L$” следует написать “матрица $C$”.

Для рассматриваемой здесь задачи теорему 2 из [12] сформулируем следующим образом.

Теорема 1. Если стратегия управления (1.2) принадлежит множеству ${{U}_{a}}$, то критерий (1.4) для всех начальных распределений ${{P}_{0}}( \cdot )$ принимает одно и то же значение, которое может быть вычислено по формуле

(2.6)
$J = B_{0}^{{\text{T}}}\xi + \frac{1}{2}\sum\limits_{k = 1}^{{{n}_{w}}} B_{k}^{{\text{T}}}M{{B}_{k}} + \frac{1}{2}D,$
где симметрическая неотрицательная матрица $M$ и вектор $\xi $ находятся из уравнений
(2.7)
$A_{0}^{{\text{T}}}M + M{{A}_{0}} + \sum\limits_{k = 1}^{{{n}_{w}}} A_{k}^{{\text{T}}}M{{A}_{k}} + Q = 0,$
(2.8)
${{\xi }^{{\text{T}}}}{{A}_{0}} + \sum\limits_{k = 1}^{{{n}_{w}}} B_{k}^{{\text{T}}}M{{A}_{k}} + B_{0}^{{\text{T}}}M + S = 0,$
которые имеют решения.

Для управляемой по выходу системы (1.1)–(1.3) оптимизируемыми параметрами являются элементы матрицы $L$ и вектора $\nu $. Для нее справедливы утверждения из [12], которые приведем в виде теоремы, скорректированной с учетом замечания 1 и дающей необходимые условия оптимальности регулятора вида (1.2), (1.3).

Теорема 2. Если стратегия управления $u = - \bar {L}y + \bar {\nu } \in {{U}_{a}}$ является оптимальной, то выполнены следующие условия:

(2.9)
$C[\Gamma _{{(2)}}^{\infty }{{\Pi }_{1}} + {{m}^{\infty }}{{\Pi }_{2}}] = 0,$
(2.10)
${{m}^{{\infty {\text{T}}}}}{{\Pi }_{1}} + {{\Pi }_{2}} = 0,$
где предельные математическое ожидание ${{m}^{\infty }}$ и матрица вторых моментов $\Gamma _{{(2)}}^{\infty }$ определяются равенствами: (2.3)–(2.5),
${{\Pi }_{1}} = - M{{B}_{{0c}}} - \sum\limits_{k = 1}^{{{n}_{w}}} A_{{kc}}^{{\text{T}}}M{{B}_{{kc}}} - {{S}_{c}} + {{C}^{{\text{T}}}}{{\bar {L}}^{{\text{T}}}}\left( {\sum\limits_{k = 1}^{{{n}_{w}}} B_{{kc}}^{{\text{T}}}M{{B}_{{kc}}} + {{D}_{c}}} \right),$
${{\Pi }_{2}} = - {{\xi }^{{\text{T}}}}{{B}_{{0c}}} - \sum\limits_{k = 1}^{{{n}_{w}}} B_{{kc}}^{{1{\text{T}}}}M{{B}_{{kc}}} - {{\bar {\nu }}^{{\text{T}}}}\left( {\sum\limits_{k = 1}^{{{n}_{w}}} B_{{kc}}^{{\text{T}}}M{{B}_{{kc}}} + {{D}_{c}}} \right),$
матрица $M$ и вектор $\xi $ находятся из уравнений (2.7), (2.8), а оптимальное значение критерия вычисляется по формуле (2.6) при $L = \bar {L}$, $\nu = \bar {\nu }$.

Если подставить (2.5) в (2.9) и учесть равенство (2.10), то необходимое условие (2.9) упрощается и приобретает вид

(2.11)
$C{{\Gamma }^{\infty }}{{\Pi }_{1}} = 0.$

Интересно отметить, что уравнения (2.10), (2.11) разрешимы относительно коэффициентов регулятора $\bar {L}$ и $\bar {\nu }$, если матрица ковариации невырожденная (${\text{|}}{{\Gamma }^{\infty }}{\text{|}} \ne 0$) и матрица $C$ имеет полный ранг ${{n}_{y}}$.

Замечание 2. Из результатов работы [12] следует, что в случае оптимизации регулятора вида $u = - Ly$, ($\nu = 0$) необходимым условием оптимальности является равенство (2.11). Для оптимальности регулятора $u = \nu $, ($L = 0$) необходимо выполнение равенства (2.10).

3. Эффект смещения оптимального управления. Будем предполагать, что детерминированный дрейф в системе отсутствует:

(3.1)
$B_{{0c}}^{1} = 0$
и проведем следующее исследование.

Положим смещение управления $\nu = 0$. Тогда из (2.3), (3.1) с учетом обозначений (1.5) следует, что не только детерминированная система ($dw(t) \equiv 0$), но и стохастическая система, замкнутая стратегией $u = - Ly$ из ${{U}_{a}}$, будет иметь равновесное состояние $x(t) \equiv 0$. В этой ситуации найдем оптимальное значение $L$ (с точностью до необходимых условий) и затем посмотрим, можно ли за счет смещения $\nu \ne 0$ улучшить значение критерия (1.4).

Введем обозначение

(3.2)
${{B}_{\nu }} = - B_{{0c}}^{{\text{T}}}A_{0}^{{ - {\text{T}}}}\sum\limits_{k = 1}^{{{n}_{w}}} A_{k}^{{\text{T}}}MB_{{kc}}^{1} + \sum\limits_{k = 1}^{{{n}_{w}}} B_{{kc}}^{{\text{T}}}MB_{{kc}}^{1}.$

Теорема 3. Пусть выполнено условие (3.1), найден регулятор $\bar {u} = - \bar {L}y \in {{U}_{a}}$, удовлетворяющий необходимому условию (2.11), и из уравнения (2.7) найдена соответствующая матрица $M$. Если ${{B}_{\nu }} \ne 0$, то этот регулятор можно улучшить за счет смещения $\nu $ (и найти его). Если ${{B}_{\nu }} = 0$, то найденный регулятор удовлетворяет общим необходимым условиям (2.10), (2.11).

Доказательство теоремы 3. По теореме 1 значение критерия (1.4) для любой стратегии $u = - Ly + \nu \in {{U}_{a}}$ подсчитывается по формуле (2.6). Фиксируем $L = \bar {L}$, а величину $\nu $ будем считать произвольной, т.е. рассматривать стратегию

(3.3)
$u* = - \bar {L}y + \nu ,$
где $\bar {L}$ удовлетворяет необходимому условию (2.11) и $\bar {u} = - \bar {L}y \in {{U}_{a}}$.

Обратив внимание на уравнения (2.1), (2.2) и равенства (1.5), нетрудно видеть, что добавление смещения $\nu $ не выводит стратегию (3.3) из множества ${{U}_{a}}$.

Очень важен еще один факт: уравнение (2.7) для матрицы $M$ не содержит смещения $\nu $ и поэтому матрица $M$ однозначно определяется значением матрицы $L = \bar {L}$. Учитывая сделанные замечания, сформируем зависимость значения $J{\text{*}}(\nu )$ критерия (1.4) от смещения $\nu $ для стратегии (3.3). Выразим из равенства (2.8) вектор $\xi $. В результате получим равенство

(3.4)
$\xi = - {{Q}_{\xi }}\nu - A_{0}^{{ - {\text{T}}}}\sum\limits_{k = 1}^{{{n}_{w}}} A_{k}^{{\text{T}}}MB_{{kc}}^{1},$
где
${{Q}_{\xi }} = A_{0}^{{ - {\text{T}}}}\left( {\sum\limits_{k = 1}^{{{n}_{w}}} A_{k}^{{\text{T}}}M{{B}_{{kc}}} + M{{B}_{{0c}}} + {{S}_{c}} - {{C}^{{\text{T}}}}{{{\bar {L}}}^{{\text{T}}}}{{D}_{c}}} \right),$
а матрицы ${{A}_{k}}$, $k = \overline {0,{{n}_{w}}} $, вычисляются при $L = \bar {L}$. Заметим, что правая часть равенства (3.4) линейна по $\nu $.

Подставляя (3.4) в (2.6) и учитывая условие (3.1), получим равенство

(3.5)
$J{\text{*}}(\nu ) = \frac{1}{2}{{\nu }^{{\text{T}}}}{{A}_{\nu }}\nu + {{\nu }^{{\text{T}}}}{{B}_{\nu }} + {{C}_{\nu }},$
где ${{B}_{\nu }}$ определяется равенством (3.2),
${{A}_{\nu }} = - B_{{0c}}^{{\text{T}}}{{Q}_{\xi }} - Q_{\xi }^{{\text{T}}}{{B}_{{0c}}} + \sum\limits_{k = 1}^{{{n}_{w}}} B_{{kc}}^{{\text{T}}}M{{B}_{{kc}}} + {{D}_{c}},$
${{C}_{\nu }} = \frac{1}{2}\sum\limits_{k = 1}^{{{n}_{w}}} B_{{kc}}^{{1{\text{T}}}}MB_{{kc}}^{1},$
а матрицы ${{A}_{k}}$, как и в (3.4), подсчитываются при $L = \bar {L}$.

Нетрудно видеть, что зависимость $J{\text{*}}(\nu )$ в (3.5) представляет собой линейно-квадратичную функцию по $\nu $. При этом симметричная матрица ${{A}_{\nu }}$ неотрицательна, что следует из неотрицательности критерия (1.4). Совершенно очевидно, что в случае, когда ${{B}_{\nu }} \ne 0$, существует значение $\nu = \bar {\nu }$, такое, что

$J{\text{*}}(\bar {\nu }) < J{\text{*}}(0) = {{C}_{\nu }},$
что и утверждается в теореме.

Если же ${{B}_{\nu }} = 0$, то при любых $\nu $

$J{\text{*}}(\bar {\nu }) \geqslant J{\text{*}}(0) = {{C}_{\nu }}$
и регулятор $u = - Ly + \nu $, где $L = \bar {L}$, $\nu = 0$, удовлетворяет необходимым условиям (2.10), (2.11), в чем можно убедиться непосредственной проверкой.

Если матрица ${{A}_{\nu }}$ не вырождена, то наилучшее смещение $\nu = \nu {\text{*}}$ в регуляторе (3.3) имеет вид

$\nu * = - A_{\nu }^{{ - 1}}{{B}_{\nu }}.$

Однако следует заметить, что стратегия $u = - \bar {L}y + \nu {\text{*}}$ может не удовлетворять общим необходимым условиям (2.10), (2.11).

В случае вырожденной матрицы ${{A}_{\nu }}$ неединственное значение наилучшего смещения $\nu = \nu {\text{*}}$ является решением уравнения

${{A}_{\nu }}\nu {\text{*}} + {{B}_{\nu }} = 0.$

4. Симметричные системы. Ранее в [12] был исследован частный случай системы (1.1), обладающий свойством симметрии.

Определение 2. Будем говорить, что система (1.1) обладает свойством симметрии, если при замене переменных $x$, $u$ на $( - x)$, $( - u)$ соответственно получается система, совпадающая с исходной (1.1).

В [12] был дан следующий критерий симметрии системы.

Критерий симметрии. Для того, чтобы система (1.1) обладала свойством симметрии, необходимо и достаточно выполнение условий:

1) $B_{{oc}}^{1} = 0$;

2) для каждого $k = \overline {1,{{n}_{w}}} $ выполнено хотя бы одно из условий: $B_{{kc}}^{1} = 0$ $(k \in {{K}_{a}})$ или ${{A}_{{kc}}} = 0$, ${{B}_{{kc}}} = 0$ $(k \in {{K}_{b}})$.

В справедливости критерия нетрудно убедиться непосредственной проверкой, если учесть, что стандартный винеровский процесс не изменяется при замене его знака на противоположный.

Система (1.1), обладающая свойством симметрии, принимает вид

(4.1)
$dx = ({{A}_{{0c}}}x + {{B}_{{0c}}}u)dt + \sum\limits_{k \in {{K}_{a}}} ({{A}_{{kc}}}x + {{B}_{{kc}}}u)d{{w}_{k}} + \sum\limits_{k \in {{K}_{b}}} B_{{kc}}^{1}d{{w}_{k}}.$

Нетрудно проверить, что для систем, управляемых по выходу и обладающих свойством симметрии ${{B}_{\nu }} = 0$, и, следовательно, оптимальное смещение всегда можно взять равным нулю.

В случае вырожденной матрицы ${{A}_{\nu }}$ оптимальная стратегия может содержать и не нулевое смещение, однако в этом случае значение критерия оптимальности совпадает со значением критерия на стратегии с той же матрицей $L$ и $\nu = 0$ [12].

5. Пример. Рассмотрим движение маятника, состоящего из жесткого стержня и жестко закрепленной на нем пластинки, представленного на рис. 1. Маятник отклоняется на угол $\alpha $ под действием горизонтального потока воздуха случайной мощности и воздействия управления. Наблюдатель видит ребро пластинки, которая закреплена под углом $\beta $, что создает различное аэродинамическое сопротивление при различных положениях маятника.

Рис. 1.

Схема маятника

Движение маятника описывается системой уравнений

$d\alpha = \omega dt,\quad d\omega = ( - 0.5\alpha - 0.5\omega + u)dt + (0.6\alpha + 1)dw,$
где ${{(\alpha ,\omega )}^{{\text{T}}}}$ – состояние системы, $\omega $ – угловая скорость отклонения маятника, $u$ – управление, $w$ – стандартный винеровский процесс.

Коэффициент диффузии зависит от компонент вектора состояния (а в общем случае – от вектора состояния и управления) и обнуляется на прямой $0.6\alpha + 1 = 0$, не проходящей через начало координат.

Пусть измеряется только угловая скорость отклонения маятника $\omega $. Тогда стратегию управления будем искать в виде $u = - L\omega + \nu $, где $L$, $\nu = $const, $\nu $ – смещение управления.

Минимизируемый критерий задается равенством

$J = \frac{1}{2}\mathop {lim}\limits_{T \to + \infty } \frac{1}{T}\int\limits_0^T \int\limits_{{{R}^{2}}} ({{\alpha }^{2}} + {{u}^{2}})P(t,dx)dt.$

В таблице представлены оптимальное значение критерия ${{J}_{{{\text{min}}}}}$, матрицы математического ожидания ${{m}^{\infty }}$ и вторых моментов $\Gamma _{{(2)}}^{\infty }$, оптимальные значения параметров управления $L$, $\nu $ в зависимости от структуры управления. Как видно, оптимальная стратегия управления со смещением $u = - L\omega + \nu $ приводит к асимметрии колебаний относительно стабилизируемого состояния (${{m}^{\infty }} \ne 0$), но значительно уменьшает среднеквадратичное отклонение от этого состояния, что сказывается на величине критерия.

Таблица.

Результаты вычислений

Структура $u$ $L$, $\nu $ ${{J}_{{{\text{min}}}}}$ ${{m}^{\infty }}$, $\Gamma _{{(2)}}^{\infty }$
$u = 0$ $L = 0$ 3.57 ${{m}^{\infty }} = \left( {\begin{array}{*{20}{c}} 0 \\ 0 \end{array}} \right)$,
$\nu = 0$ $\Gamma _{{(2)}}^{\infty } = \left( {\begin{array}{*{20}{c}} {7.14}&0 \\ 0&{3.57} \end{array}} \right)$
$u = \nu $ $L = 0$ 1.17 ${{m}^{\infty }} = \left( {\begin{array}{*{20}{c}} { - 1.12} \\ 0 \end{array}} \right)$,
$\nu = - 0.56$ $\Gamma _{{(2)}}^{\infty } = \left( {\begin{array}{*{20}{c}} {2.02}&0 \\ 0&{0.38} \end{array}} \right)$
$u = - L\omega $ $L = 1.28$ 0.64 ${{m}^{\infty }} = \left( {\begin{array}{*{20}{c}} 0 \\ 0 \end{array}} \right)$,
$\nu = 0$ $\Gamma _{{(2)}}^{\infty } = \left( {\begin{array}{*{20}{c}} {0.70}&0 \\ 0&{0.35} \end{array}} \right)$
$u = - L\omega + \nu $ $L = 1.28$, 0.47 ${{m}^{\infty }} = \left( {\begin{array}{*{20}{c}} { - 0.45} \\ 0 \end{array}} \right)$,
$\nu = - 0.22$ $\Gamma _{{(2)}}^{\infty } = \left( {\begin{array}{*{20}{c}} {0.58}&0 \\ 0&{0.19} \end{array}} \right)$

На рис. 2 представлен один из вариантов реализации зависимости от времени угла отклонения $\alpha $ маятника при различных структурах оптимального управления.

Рис. 2.

Реализация угла отклонения $\alpha $, град: 1$u = 0$; 2$u = \nu $; 3$u = - L\omega $; 4$u = - L\omega + \nu $

Анализ  приведенных выше условий оптимальности показывает, что при использовании в приведенном примере полной информации о состоянии оптимальный регулятор $u = - {{L}_{\alpha }}\alpha - {{L}_{\omega }}\omega + \nu $ также будет иметь смещение $\nu \ne 0$.

Заключение. Установлен следующий факт: смещение $\nu $ линейного закона управления (1.2), несмотря на асимметрию колебаний относительно стабилизируемого состояния (равного нулю), может значительно уменьшить значение критерия. Сформулирована и доказана теорема улучшаемости регулятора за счет смещения управления. Показано, что для систем, обладающих свойством симметрии, смещение всегда можно положить равным нулю. На примере движения специального маятника проведено сравнение стратегий управления различной структуры, продемонстрирован эффект асимметрии колебаний относительно нулевого состояния системы, являющийся следствием асимметрии возмущений.

Список литературы

  1. Параев Ю.И. Введение в статистическую динамику процессов управления и фильтрации. М.: Сов. радио, 1976. 156 с.

  2. Красовский Н.Н., Лидский Э.А. Аналитическое конструирование регуляторов в системах со случайными свойствами. I. Постановка задачи, метод решения // АиТ. 1961. Т. 22. Вып. 9. С. 1145–1150.

  3. Красовский Н.Н., Лидский Э.А. Аналитическое конструирование регуляторов в системах со случайными свойствами. II. Уравнения для оптимального управления. Приближеный метод решения // АиТ. 1961. Т. 22. Вып. 10. С. 1273–1278.

  4. Красовский Н.Н., Лидский Э.А. Аналитическое конструирование регуляторов в системах со случайными свойствами. III. Оптимальное регулирование в линейных системах. Минимум среднеквадратичной ошибки // АиТ. 1961. Т. 22. Вып. 11. С. 1425–1431.

  5. Haussmann U.G. Optimal Stationary Control with State and Control Dependent Noise // SIAM J. Control. 1971. V. 9. № 2. P. 184–198.

  6. Вонэм В.М. Стохастические дифференциальные уравнения в теории управления // Математика. 1973. Т. 17. № 4. С. 129–167.

  7. Вонэм В.М. Стохастические дифференциальные уравнения в теории управления // Математика. 1973. Т. 17. № 5. С. 82–114.

  8. Малышев В.В., Пакшин П.В. Прикладная теория стохастической устойчивости и оптимального стационарного управления (обзор). I // Изв. АН СССР. Техн. кибернетика. 1990. № 1. С. 42–66.

  9. Малышев В.В., Пакшин П.В. Прикладная теория стохастической устойчивости и оптимального стационарного управления (обзор). II // Изв. АН СССР. Техн. кибернетика. 1990. № 2. С. 97–120.

  10. Мильштейн Г.Н. Линейные оптимальные регуляторы заданной структуры в системах с неполной информацией // АиТ. 1976. Вып. 8. С. 48–53.

  11. Bernstein D.S. Robust Static and Dynamic Output-Feedback Stabilization: Deterministic and Stochastic Perspectives // IEEE Transactions on Automatic Control. 1987. V. AC-32. № 12. P. 1076–1084.

  12. Халина А.С., Хрусталев М.М. Оптимизация облика и стабилизация управляемых квазилинейных стохастических систем, функционирующих на неограниченном интервале времени // Изв. РАН. ТиСУ. 2017. № 1. С. 65–88.

  13. Малышев В.В., Старков А.В., Федоров А.В. Синтез оптимального управления при решении задачи удержания космического аппарата в орбитальной группировке // Автоматика и ракетостроение. 2012. № 4 (69). С. 150–158.

  14. Хрусталев М.М., Халина А.С. Аффинные стабилизирующие стратегии в квазилинейных стохастических системах диффузионного типа // Тр. XI Междунар. Четаевской конф. “Аналитическая механика, устойчивость и управление”. Т. 4. Казань: КНИТУ-КАИ, 2017. С. 227–235.

Дополнительные материалы отсутствуют.