Известия РАН. Теория и системы управления, 2023, № 2, стр. 60-72

ОБ УСТОЙЧИВОМ РЕШЕНИИ ЗАДАЧИ КОМПЕНСАЦИИ НЕГЛАДКИХ АДДИТИВНЫХ ВОЗМУЩЕНИЙ С ПОМОЩЬЮ ЗАКОНОВ ОБРАТНОЙ СВЯЗИ

В. И. Максимов *

Институт математики и механики УрО РАН
Екатеринбург, Россия

* E-mail: maksimov@imm.uran.ru

Поступила в редакцию 14.09.2022
После доработки 24.11.2022
Принята к публикации 05.12.2022

Полный текст (PDF)

Аннотация

Обсуждается задача управления по принципу обратной связи нелинейной по фазовым переменным системой обыкновенных дифференциальных уравнений, подверженной влиянию неизвестного негладкого возмущения. Суть задачи состоит в построении закона формирования управляющего воздействия, гарантирующего компенсацию негладкого возмущения, а именно гарантирующего отслеживание фазовой траекторией (а также скоростью ее изменения) заданной системы, предписанной фазовой траектории (а также скорости ее изменения) при любой допустимой реализации возмущения. Рассмотрены два случая. В первом случае допустимые возмущения стеснены мгновенными ограничениями, а во втором допустимым возмущением может быть всякая функция, являющаяся элементом пространства измеримых по Лебегу функций, суммируемых с квадратом евклидовой нормы. Задача решается в условиях неточного измерения в дискретные моменты времени фазовых состояний обеих систем. При наличии мгновенных ограничений на возмущения задача решается также и при измерении части фазовых состояний. Сконструированы устойчивые к информационным помехам и погрешностям вычислений алгоритмы решения указанной задачи, ориентированные на компьютерную реализацию. Приводятся оценки скорости сходимости алгоритмов.

0. Введение. Рассматривается система обыкновенных дифференциальных уравнений

(0.1)
$\dot {x}(t) = f(t,x(t)) + u(t) - v(t),\quad t \in T = [0,\vartheta ]$
с начальным условием

(0.2)
$x(0) = {{x}_{0}}.$

Здесь $0 < \vartheta < + \infty $, $x \in {{\mathbb{R}}^{N}}$ – фазовый вектор системы, $u \in {{\mathbb{R}}^{N}}$ – управление, $v \in {{\mathbb{R}}^{N}}$ – возмущение, $f(t,y)$ – некоторая функция. В дальнейшем решение системы (0.1) с начальным условием (0.2) обозначается символом $x( \cdot ;0,{{x}_{0}},u( \cdot ),v( \cdot ))$. Следуя теории гарантированного управления, восходящей к работам Н.Н. Красовского и его школы, возмущение в системе (0.1) записываем со знаком минус.

Предполагается, что на систему (0.1) оказывают воздействие неизвестное возмущение $v( \cdot ) \in V( \cdot )$, а также подлежащее формированию управление u(·). Здесь V(·) означает множество допустимых возмущений. В работе рассмотрим два случая. В первом случае положим, что множество допустимых возмущений стеснено мгновенными ограничениями, т.е. V(·) = = $\{ v( \cdot ) \in {{L}_{2}}(T;{{\mathbb{R}}^{N}}):v(t) \in P\;{\text{при}}\;{\text{п}}{\text{.в}}{\text{.}}\;t \in T\} $, где $P \subset {{\mathbb{R}}^{N}}$ – известный априори выпуклый компакт, а во втором случае такие ограничения отсутствуют, при этом $V( \cdot ) = {{L}_{2}}(T;{{\mathbb{R}}^{N}})$. Здесь и ниже “п.в.” означает “почти всех”. В моменты времени ${{\tau }_{i}} \in \Delta = \{ {{\tau }_{i}}\} _{{i = 0}}^{m}$ (${{\tau }_{0}} = 0,$ ${{\tau }_{m}} = \vartheta ,$ ${{\tau }_{{i + 1}}} = {{\tau }_{i}} + \delta $) измеряются фазовые состояния системы $x({{\tau }_{i}}) = x({{\tau }_{i}};0,{{x}_{0}},u( \cdot ),v( \cdot ))$. Эти состояния измеряются с ошибкой. В результате дискретных измерений траектории системы (0.1) находятся векторы $\xi _{i}^{h} \in {{\mathbb{R}}^{N}}$, такие, что

(0.3)
${\text{|}}x({{\tau }_{i}}) - \xi _{i}^{h}{{{\text{|}}}_{N}} \leqslant h.$

Здесь $h \in (0,1)$ – величина погрешности измерения, ${\text{|}}\, \cdot \,{{{\text{|}}}_{N}}$ – евклидова норма в пространстве ${{\mathbb{R}}^{N}}$. Функция f предполагается неизвестной. Известно лишь, что она липшицева по совокупности переменных с постоянной Липшица L.

Обсуждаемая в работе задача состоит в компенсации возмущения. Иными словами, задача заключается в построении алгоритма формирования такого управления u(·) по принципу обратной связи (со значениями в V(·)) , что фазовая траектория системы (0.1) $x( \cdot ;0,{{x}_{0}},u( \cdot ),v( \cdot ))$ отслеживает фазовую траекторию системы того же вида, но с нулевыми управлением и возмущением, в метрике пространства $W(T;{{\mathbb{R}}^{N}}) = \{ p( \cdot ) \in C(T;{{\mathbb{R}}^{N}}):\dot {p}( \cdot ) \in {{L}_{2}}(T;{{\mathbb{R}}^{N}})\} $. Последняя задается следующим образом:

${\text{|}}p( \cdot ){{{\text{|}}}_{{W(T;{{\mathbb{R}}^{N}})}}} = (\mathop {\max }\limits_{t \in T} {\text{|}}p(t){\text{|}}_{N}^{2}\; + \;{\text{|}}\dot {p}( \cdot ){\text{|}}_{{{{L}_{2}}(T;{{\mathbb{R}}^{N}})}}^{2}{{)}^{{1/2}}}.$

Следовательно, управление $u( \cdot )$ должно быть сконструировано так, чтобы расстояние от фазовой траектории системы (0.1) до фазовой траектории системы

(0.4)
$\dot {y}(t) = f(t,y(t)),\quad t \in T,$
с начальным состоянием $y(0) = {{y}_{0}}$, ${\text{|}}{{y}_{0}} - {{x}_{0}}{{{\text{|}}}_{N}} \leqslant h$, в метрике пространства $W(T;{{\mathbb{R}}^{N}})$ было мало при малых δ и h, какова бы ни была реализация возмущения $v( \cdot ) \in V( \cdot )$. Так как функция f неизвестна, то решение системы (0.4) также неизвестно. Будем предполагать, что в моменты ${{\tau }_{i}}$, $i \in \overline {0,m - 1} ,$ становятся известны (приближенно) состояния $y({{\tau }_{i}})$. Именно в результате дискретных измерений траектории системы (0.4) становятся известными векторы $\psi _{i}^{h} \in {{\mathbb{R}}^{N}}$, такие, что

(0.5)
${\text{|}}y({{\tau }_{i}}) - \psi _{i}^{h}{{{\text{|}}}_{N}} \leqslant h.$

Управление u(·) в системе (0.1) будем строить в форме обратной связи:

$u(t) = {{u}^{h}}({{\tau }_{i}},\xi _{i}^{h},\psi _{i}^{h})\quad {\text{при}}\quad t \in [{{\tau }_{i}},{{\tau }_{{i + 1}}}),\quad i \in \overline {0,m - 1} .$

При наличии мгновенных ограничений на возмущения также рассмотрим случай измерения части координат фазового вектора. При этом будем предполагать, что приведенная система имеет вид

(0.6)
$\begin{gathered} {{{\dot {x}}}_{1}}(t) = {{f}_{1}}(t,x(t)), \\ {{{\dot {x}}}_{2}}(t) = {{f}_{2}}(t,x(t)) + u(t) - v(t),\quad t \in T. \\ \end{gathered} $

Здесь ${{x}_{1}}$ – вектор размерности ${{n}_{1}}$, ${{x}_{2}},u$ и $v$ – вектора размерности ${{n}_{2}}$, ${{n}_{1}} + {{n}_{2}} = N$, $x = \{ {{x}_{1}},{{x}_{2}}\} $. Множество ограничений на возмущения (и управления) $V( \cdot )\, = \,\{ v( \cdot )\, \in \,{{L}_{2}}(T;{{\mathbb{R}}^{{{{n}_{2}}}}})\,:\,v(t)\, \in \,P\;{\text{при}}\;{\text{п}}{\text{.в}}{\text{.}}\;t\, \in \,T\} ,$ где $P \subset {{\mathbb{R}}^{{{{n}_{2}}}}}$ – выпуклый компакт. В этом случае будем считать, что в моменты ${{\tau }_{i}}$ измеряются координаты ${{x}_{1}}({{\tau }_{i}})$, а также координаты ${{y}_{1}}({{\tau }_{i}})$ системы

${{\dot {y}}_{1}}(t) = {{f}_{1}}(t,y(t)),$
${{\dot {y}}_{2}}(t) = {{f}_{2}}(t,y(t)),$
где $y = \{ {{y}_{1}},{{y}_{2}}\} .$ В результате измерений находятся векторы $\xi _{i}^{h} \in {{\mathbb{R}}^{{{{n}_{1}}}}}$ и $\psi _{i}^{h} \in {{\mathbb{R}}^{{{{n}_{1}}}}}$, такие, что

(0.7)
${\text{|}}{{x}_{1}}({{\tau }_{i}}) - \xi _{i}^{h}{{{\text{|}}}_{{{{n}_{1}}}}} \leqslant h,\quad {\text{|}}{{y}_{1}}({{\tau }_{i}}) - \psi _{i}^{h}{{{\text{|}}}_{{{{n}_{1}}}}} \leqslant h.$

Управляемые системы довольно часто подвержены влиянию неизвестных неконтролируемых возмущений. Одним из важных разделов математической теории управления является теория управления по принципу обратной связи, которая ориентирована на создание алгоритмов формирования управляющих элементов в условиях внешних воздействий. Классическая задача этой теории – задача слежения [16]. При решении этой задачи, как правило, управляемой динамической системе необходимо обеспечить заданное качество процесса, в частности отслеживание предписанной или, как иногда говорят, эталонной траектории. Решение подобной задачи усложняется, когда параметры системы известны неточно или она подвержена воздействию неизвестных возмущений. В последние годы возникло значительное число подходов, ориентированных на исследование подобных систем. В случае, когда неизвестные воздействия трактуются как воздействия, формируемые противоборствующей стороной, задачи управления исследуются в рамках теории дифференциальных игр. Среди других подходов, позволяющих конструировать системы управления, которые компенсируют внешние ограниченные возмущения, можно отметить теорию робастного управления [7], метод матричных неравенств [8], метод гарантированного управления [9], метод управления, основанный на наблюдении за возмущением (disturbance-obserever-based control – DOBC-метод) [10], метод активного подавления возмущений (active disturbance rejection control – ADRC-метод) [11] и т.д.

В работе для решения задачи компенсации (подавления) возмущений будем применять подход, основанный на конструкциях теории управления по принципу обратной связи, которые используют элементы локальной регуляризации при формировании компенсирующих управляющих воздействий (см., например, работы [1215], в которых локальная регуляризация привлекалась для решения задач восстановления входных воздействий). Впервые применение этой теории для решения исследуемой нами задачи в случае, когда система описывается линейными обыкновенными дифференциальными уравнениями и измеряются в дискретные моменты времени все ее фазовые координаты, было приведено в работе [16]. При этом существенную роль играло представление решения в форме Коши. В настоящей статье, продолжающей исследование [16], рассматривается нелинейная по фазовым переменным система. Кроме того, наряду с измерением всех фазовых координат, также приведем случай измерения части координат.

Для каждого $h \in (0,1)$ фиксируем семейство ${{\Delta }_{h}}$ разбиений отрезка T контрольными моментами времени ${{\tau }_{{h,i}}}$:

(0.8)
${{\Delta }_{h}} = \{ {{\tau }_{{h,i}}}\} _{{i = 0}}^{{{{m}_{h}}}},\quad {{\tau }_{{h,0}}} = 0,\quad {{\tau }_{{h,{{m}_{h}}}}} = \vartheta ,\quad {{\tau }_{{h,i + 1}}} = {{\tau }_{{h,i}}} + \delta (h),\quad \delta (h) \in (0,1).$

В дальнейшем символы ${{c}^{{(0)}}},{{c}^{{(1)}}}, \ldots ,{{c}_{0}},{{c}_{1}}, \ldots ,{{k}^{{(1)}}},{{k}^{{(2)}}}, \ldots ,{{k}_{1}},{{k}_{2}}, \ldots $ означают положительные постоянные, которые могут быть выписаны в явном виде.

1. Алгоритмы решения. Случай мгновенных ограничений на возмущения. Сначала укажем алгоритм решения рассматриваемой задачи для системы (0.1) в случае, когда измеряются все фазовые координаты. Зафиксируем некоторое семейство ${{\Delta }_{h}}$ (0.8) разбиений отрезка T, а также функцию $\alpha (h):(0,1) \to (0,1)$.

До начала работы алгоритма фиксируются величины $h \in (0,1)$, $\alpha = \alpha (h)$ и разбиение Δh = = $\{ {{\tau }_{{h,i}}}\} _{{i = 0}}^{{{{m}_{h}}}}$ вида (0.8). Работа алгоритма (nри фиксированном h) разбивается на ${{m}_{h}} - 1$ однотипных шагов. В течение i-го шага, осуществляемого на промежутке времени ${{\delta }_{i}} = [{{\tau }_{i}},{{\tau }_{{i + 1}}})$, ${{\tau }_{i}} = {{\tau }_{{h,i}}}$, выполняются следующие операции. Сначала, в момент ${{\tau }_{i}}$, вычисляются вектора $u_{i}^{h}$ и $\tilde {u}_{i}^{h}$ по формулам

(1.1)
$u_{i}^{h} = \arg \min \{ 2(\xi _{i}^{h} - \psi _{i}^{h},u{{)}_{N}} + \alpha {\text{|}}u{\text{|}}_{N}^{2}:u \in P\} ,\quad \tilde {u}_{i}^{h} = 2L(\psi _{i}^{h} - \xi _{i}^{h}).$

Здесь символ ${{( \cdot , \cdot )}_{N}}$ означает скалярное произведение в пространстве ${{\mathbb{R}}^{N}}$. Затем на вход системы (0.1) подается управление ${{u}_{h}}(t)$ следующего вида:

(1.2)
${{u}_{h}}(t) = {{u}^{h}}(t) + {{\tilde {u}}^{h}}(t),\quad t \in {{\delta }_{i}},$
где

(1.3)
${{u}^{h}}(t) = u_{i}^{h},\quad {{\tilde {u}}^{h}}(t) = \tilde {u}_{i}^{h}\quad {\text{при}}\;{\text{п}}{\text{.в}}{\text{.}}\quad t \in {{\delta }_{i}}.$

Под действием этого управления, а также реализации неизвестного возмущения $v(t),t \in {{\delta }_{i}}$ система (0.1) переходит из состояния ${{x}^{h}}({{\tau }_{i}})$ в состояние ${{x}^{h}}({{\tau }_{{i + 1}}}) = x({{\tau }_{{i + 1}}};{{\tau }_{i}},{{x}^{h}}({{\tau }_{i}}),{{u}_{h}}( \cdot ),v( \cdot ))$. Работа алгоритма заканчивается в момент $\vartheta $.

Оказывается, что при определенном согласовании величин h, $\delta (h)$ и $\alpha (h)$ управление ${{u}_{h}}( \cdot )$ решает рассматриваемую задачу.

Лемма 1. Можно указать такое ${{h}_{1}} \in (0,1)$, что при всех $h \in (0,{{h}_{1}})$, $t \in T$, справедливы неравенства

(1.4)
$\mathop {\max }\limits_{i \in \overline {0,{{m}_{h}}} } \varepsilon ({{\tau }_{i}}) \leqslant {{d}_{1}}\{ \alpha + \delta + h\} ,$
(1.5)
$\int\limits_0^\vartheta {\text{|}}{{u}^{h}}(\tau ){\text{|}}_{N}^{2}{\kern 1pt} d\tau \leqslant \int\limits_0^\vartheta {\text{|}}{v}(\tau ){\text{|}}_{N}^{2}{\kern 1pt} d\tau + {{d}_{2}}(h + \delta ){{\alpha }^{{ - 1}}},$
где $\varepsilon (t) = {\text{|}}{{x}^{h}}(t) - y(t){\text{|}}_{N}^{2}$, $\alpha = \alpha (h),$ $\delta = \delta (h)$, ${{d}_{1}}$ и ${{d}_{2}}$ – положительные постоянные.

Доказательство леммы 1 приведено в Приложении.

С помощью леммы 1 аналогично теореме 2 из работы [16] доказывается следующая теорема.

Теорема 1. Пусть $\alpha (h) \to 0,$ $(h + \delta (h)){{\alpha }^{{ - 1}}}(h) \to 0$ при $h \to 0$. Тогда имеет место сходимость ${{x}^{h}}( \cdot ) \to y( \cdot )$ в $W(T;{{\mathbb{R}}^{N}})$ при $h \to 0$.

При некоторых дополнительных условиях может быть выписана оценка скорости сходимости алгоритма. Для ее обоснования нам потребуется следующая лемма.

Лемма 2 [5, с. 29]. Пусть ${{x}_{1}}( \cdot ) \in {{L}_{\infty }}(T_{*}^{{}};{{\mathbb{R}}^{n}})$, ${{y}_{1}}( \cdot ) \in AC(T_{*}^{{}};{{\mathbb{R}}^{n}})$, $T_{*}^{{}} = [a,b]$, $ - \infty < a < b < + \infty $,

${{\left| {\int\limits_a^t {{x}_{1}}(\tau ){\kern 1pt} d\tau } \right|}_{n}} \leqslant \varepsilon ,\quad {\text{|}}{{y}_{1}}(t){{{\text{|}}}_{n}} \leqslant K\quad \forall \;t \in T_{*}^{{}}.$

Тогда при всех $t \in T_{*}^{{}}$ верно неравенство

$\left| {\int\limits_a^t {{{({{x}_{1}}(\tau ),{{y}_{1}}(\tau ))}}_{n}}{\kern 1pt} d\tau } \right| \leqslant \varepsilon (K + {\text{var}}(T_{*}^{{}};{{y}_{1}}( \cdot ))).$

Здесь символ ${\text{var}}(T_{*}^{{}};{{y}_{1}}( \cdot ))$ означает вариацию функции ${{y}_{1}}( \cdot )$ на отрезке ${{T}_{*}}$, а символ $AC(T_{*}^{{}};{{\mathbb{R}}^{n}})$ – множество функций $y( \cdot ):T_{*}^{{}} \to {{\mathbb{R}}^{n}}$ с ограниченной вариацией.

Лемма 3. Пусть $v( \cdot ) \in AC(T;{{\mathbb{R}}^{N}})$. Пусть также выполнены условия теоремы 1. Тогда при $h \in (0,{{h}_{1}})$ имеет место следующая оценка скорости сходимости алгоритма:

(1.6)
${\text{|}}{{x}^{h}}( \cdot ) - y( \cdot ){\text{|}}_{{W(T;{{\mathbb{R}}^{N}})}}^{2} \leqslant {{d}_{3}}\{ {{\alpha }^{{1/2}}} + {{\delta }^{{1/2}}} + {{h}^{{1/2}}} + (h + \delta ){{\alpha }^{{ - 1}}}\} ,$
где ${{d}_{3}}$ – положительная постоянная.

Доказательство леммы 3 приведено в Приложении.

Обратимся к измерению части фазовых координат. В этом случае для решения задачи нам потребуется ввести в контур управления системой (0.6) вспомогательный блок, цель которого восстанавливать по ходу развития процесса управления неизмеряемые координаты ${{x}_{2}}(t)$ и ${{y}_{2}}(t)$. Этот блок содержит две вспомогательные управляемые системы и законы V и $\tilde {V}$ формирования управлений ${{v}^{h}}( \cdot )$ и ${{{\tilde {v}}}^{h}}( \cdot )$ этими системами. Динамика систем описывается векторными дифференциальными уравнениями

(1.7)
$\dot {w}_{1}^{h}(t) = {{v}^{h}}(t)\quad {\text{при}}\quad t \in T\quad (w_{1}^{h},{{v}^{h}} \in {{\mathbb{R}}^{{{{n}_{1}}}}})$
и
(1.8)
$\dot {w}_{2}^{h}(t) = {{{\tilde {v}}}^{h}}(t)\quad {\text{при}}\quad t \in T\quad {\kern 1pt} (w_{2}^{h},{{{\tilde {v}}}^{h}} \in {{\mathbb{R}}^{{{{n}_{1}}}}})$
с начальными условиями $w_{1}^{h}({{t}_{0}}) = \xi _{0}^{h},w_{2}^{h}({{t}_{0}}) = \psi _{0}^{h}$ и управлениями ${{v}^{h}}( \cdot )$ и ${{{\tilde {v}}}^{h}}( \cdot )$, которые находятся по принципу обратной связи:

(1.9)
$\begin{gathered} {{v}^{h}}(t) = v_{i}^{h} = V({{\tau }_{i}},\xi _{i}^{h},w_{1}^{h}({{\tau }_{i}})), \\ {{{{\tilde {v}}}}^{h}}(t) = {\tilde {v}}_{i}^{h} = \tilde {V}({{\tau }_{i}},\psi _{i}^{h},w_{2}^{h}({{\tau }_{i}}))\quad {\text{при}}\;{\text{п}}{\text{.в}}{\text{.}}{\kern 1pt} \quad t \in [{{\tau }_{i}},{{\tau }_{{i + 1}}})\quad (i \in \overline {0,{{m}_{h}} - 1} ). \\ \end{gathered} $

Здесь $\xi _{i}^{h}$ – результат измерения координаты ${{x}_{1}}({{\tau }_{i}})$, $\psi _{i}^{h}$ – результат измерения координаты ${{y}_{1}}({{\tau }_{i}})$ (см. (0.7)). Законы $V( \cdot , \cdot , \cdot ):T \times {{\mathbb{R}}^{{{{n}_{1}}}}} \times {{\mathbb{R}}^{{{{n}_{1}}}}} \mapsto {{\mathbb{R}}^{{{{n}_{1}}}}}$ и $\tilde {V}( \cdot , \cdot , \cdot ):T \times {{\mathbb{R}}^{{{{n}_{1}}}}} \times {{\mathbb{R}}^{{{{n}_{1}}}}} \mapsto {{\mathbb{R}}^{{{{n}_{1}}}}}$ конструируются таким образом, что при соответствующем согласовании параметров $h$ и $\delta (h)$ управления ${{v}^{h}}( \cdot )$ и ${{{\tilde {v}}}^{h}}( \cdot )$, стоящие в правых частях систем (1.7) и (1.8) соответственно, позволяют с помощью некоторых отображений ${{U}_{1}}:T \times {{\mathbb{R}}^{{{{n}_{1}}}}} \times {{\mathbb{R}}^{{{{n}_{1}}}}} \to {{\mathbb{R}}^{{{{n}_{2}}}}}$ и ${{U}_{2}}:T \times {{\mathbb{R}}^{{{{n}_{1}}}}} \times {{\mathbb{R}}^{{{{n}_{1}}}}} \to {{\mathbb{R}}^{{{{n}_{2}}}}}$ сконструировать функции $q_{1}^{h}( \cdot )$ и $q_{2}^{h}( \cdot )$:

(1.10)
$\begin{gathered} q_{1}^{h}(t) = q_{{1i}}^{h} = {{U}_{1}}({{\tau }_{i}},\xi _{i}^{h},v_{i}^{h}), \\ q_{2}^{h}(t) = q_{{2i}}^{h} = {{U}_{2}}({{\tau }_{i}},\psi _{i}^{h},{\tilde {v}}_{i}^{h})\quad {\text{при}}\;{\text{п}}{\text{.в}}{\text{.}}\quad t \in [{{\tau }_{i}},{{\tau }_{{i + 1}}})\quad (i \in \overline {0,{{m}_{h}} - 1} ), \\ \end{gathered} $
являющиеся приближениями (в метрике пространства непрерывных функций) неизмеряемых частей фазовых траекторий $x( \cdot )$ и $y( \cdot )$, а именно ${{x}_{2}}( \cdot )$ и ${{y}_{2}}( \cdot )$. Управление $u = {{u}^{h}}( \cdot )$ в системе (0.6) находится по тому же правилу, что и в случае измерения всех фазовых координат. При этом $\xi _{i}^{h}$ и $\psi _{i}^{h}$ заменяются на $q_{{1i}}^{h}$ и $q_{{2i}}^{h}$ (см. (1.2), (1.3)).

Итак, перейдем к описанию алгоритма решения. Возьмем некоторые семейство ${{\Delta }_{h}}$ (0.8), а также две функции $\alpha (h):(0,1) \to (0,1)$ и ${{\alpha }_{1}}(h):(0,1) \to (0.1)$.

Пусть $M \subset {{\mathbb{R}}^{{{{n}_{1}}}}}$ – область, в которой остаются первые n1 фазовых координат решений системы (0.1), порожденных всевозможными $u( \cdot ) \in V( \cdot )$ и $v( \cdot ) \in V( \cdot )$, т.е.

${{x}_{1}}(t) = {{x}_{1}}(t;0,{{x}_{0}},u( \cdot ),{v}( \cdot )) \in M\quad {\kern 1pt} {\text{при}}\;{\text{всех}}{\kern 1pt} \quad {\kern 1pt} {\kern 1pt} t \in T.$

Пусть также ${{y}_{1}}(t) \in M$ при всех $t \in T$.

В дальнейшем полагаем, что выполнено следующее условие.

Условие. В области T × M функция ${{x}_{2}} \to F = {{f}_{1}}(t,{{x}_{1}},{{x}_{2}})$ имеет обратную ${{x}_{2}} = f_{{1{{x}_{2}}}}^{{ - 1}}(t,{{x}_{1}},F)$, которая является липшицевой функцией по совокупности переменных с постоянной Липшица L. Кроме того, функция f1 имеет производные по каждому аргументу, и справедливо включение ${{\ddot {x}}_{1}}( \cdot ) \in {{L}_{2}}(T;{{\mathbb{R}}^{{{{n}_{1}}}}})$.

До начала работы алгоритма фиксируем величину $h \in (0,1)$, числа ${{\alpha }_{1}} = {{\alpha }_{1}}(h),$ $\alpha = \alpha (h)$ и разбиение ${{\Delta }_{h}} = \{ {{\tau }_{{h,i}}}\} _{{i = 0}}^{{{{m}_{h}}}}$ вида (0.8). Работу алгоритма разобьем на однотипные шаги. В течение i-го шага, осуществляемого на промежутке времени ${{\delta }_{i}} = [{{\tau }_{i}},{{\tau }_{{i + 1}}})$, ${{\tau }_{i}} = {{\tau }_{{h,i}}}$, выполняются следующие операции. Сначала, в момент τi, вычисляются векторы $v_{i}^{h},\;q_{{1i}}^{h},\;{\tilde {v}}_{i}^{h},\;q_{{2i}}^{h}$ по формулам (1.9), (1.10), в которых

(1.11)
$V({{\tau }_{i}},\xi _{i}^{h},w_{1}^{h}({{\tau }_{i}})) = - {{\alpha }^{{ - 1}}}(h)[w_{1}^{h}({{\tau }_{i}}) - \xi _{i}^{h} + {{\tau }_{i}}{{f}_{1}}(0,{{x}_{0}})],$
$\begin{gathered} \tilde {V}({{\tau }_{i}},\psi _{i}^{h},w_{2}^{h}({{\tau }_{i}})) = - {{\alpha }^{{ - 1}}}(h)[w_{2}^{h}({{\tau }_{i}}) - \psi _{i}^{h} + {{\tau }_{i}}{{f}_{1}}(0,{{y}_{0}})], \\ {{U}_{1}}({{\tau }_{i}},\xi _{i}^{h},v_{i}^{h}) = f_{{1{{x}_{2}}}}^{{ - 1}}({{\tau }_{i}},\xi _{i}^{h},v_{i}^{h} + {{f}_{1}}(0,{{x}_{0}})), \\ \end{gathered} $
${{U}_{2}}({{\tau }_{i}},\psi _{i}^{h},{\tilde {v}}_{i}^{h}) = f_{{1{{x}_{2}}}}^{{ - 1}}({{\tau }_{i}},\psi _{i}^{h},{\tilde {v}}_{i}^{h} + {{f}_{1}}(0,{{y}_{0}})).$

В свою очередь векторы $u_{i}^{h}$ и $\tilde {u}_{i}^{h}$ находятся по формулам

(1.12)
$u_{i}^{h} = \arg \min \{ 2(q_{{1i}}^{h} - q_{{2i}}^{h},u{{)}_{{{{n}_{2}}}}} + {{\alpha }_{1}}(h){\text{|}}u{\text{|}}_{{{{n}_{2}}}}^{2}:u \in P\} ,\quad \tilde {u}_{i}^{h} = 2L(q_{{2i}}^{h} - q_{{1i}}^{h}).$

Затем на вход системы (1.7) при всех $t \in {{\delta }_{i}}$ подается управление ${{v}^{h}}(t)$ вида (1.9), (1.11), на вход системы (1.8) – управление ${{{\tilde {v}}}^{h}}(t)$ вида (1.9), (1.11), а на вход системы (0.6) – управление ${{u}_{h}}(t)$ вида (1.2), (1.3), (1.12). Под действием этих управлений решение системы (1.7) переходит из состояния $w_{1}^{h}({{\tau }_{i}})$ в состояние $w_{1}^{h}({{\tau }_{{i + 1}}})$, решение системы (1.8) – из состояния $w_{2}^{h}({{\tau }_{i}})$ в состояние $w_{2}^{h}({{\tau }_{{i + 1}}})$, а решение системы (0.6) – из состояния ${{x}^{h}}({{\tau }_{i}})$ в состояние ${{x}^{h}}({{\tau }_{{i + 1}}}) = x({{\tau }_{{i + 1}}};{{\tau }_{i}},{{x}^{h}}({{\tau }_{i}}),{{u}_{h}}( \cdot ),v( \cdot ))$. Работа алгоритма заканчивается в момент $\vartheta $.

Символом ${{x}^{h}}( \cdot ) = x( \cdot ;0,{{x}_{0}},{{u}_{h}}( \cdot ),v( \cdot ))$ обозначим решение системы (0.6), порожденное неизвестным возмущением ${v}( \cdot )$ и управлением ${{u}_{h}}( \cdot )$.

Справедливо следующее утверждение.

Теорема 2. Пусть $\alpha (h) \to 0,$ ${{\alpha }_{1}}(h) \to 0,$ $\delta (h) \to 0,$ $(h + \delta (h)){{\alpha }^{{ - 1}}}(h) \to 0,$ $(h + \delta (h))\alpha {{(h)}^{{ - 1}}}\alpha _{1}^{{ - 1}}(h) \to 0,$ $\alpha (h)\alpha _{1}^{{ - 1}}(h) \to 0$ при $h \to 0$. Тогда имеет место сходимость

(1.13)
${{x}^{h}}( \cdot ) = x( \cdot ;0,{{x}_{0}},{{u}_{h}}( \cdot ),v( \cdot )) \to y( \cdot )\quad {\text{в}}\quad W(T;{{\mathbb{R}}^{N}})\quad {\kern 1pt} {\text{при}}\quad h \to 0.$

Если $v( \cdot ) \in AC(T;{{\mathbb{R}}^{{{{n}_{2}}}}})$, то верна оценка скорости сходимости алгоритма

(1.14)
${\text{|}}{{x}^{h}}( \cdot ) - y( \cdot ){\text{|}}_{{W(T;{{\mathbb{R}}^{N}})}}^{2} \leqslant {{d}_{4}}\{ \alpha _{1}^{{1/2}} + {{\delta }^{{1/2}}} + {{(\alpha + (h + \delta ){{\alpha }^{{ - 1}}})}^{{1/2}}} + [\alpha + (h + \delta ){{\alpha }^{{ - 1}}} + \delta ]\alpha _{1}^{{ - 1}}\} ,$
где d4 – положительная постоянная, $\alpha = \alpha (h)$, ${{\alpha }_{1}} = {{\alpha }_{1}}(h)$.

Доказательство теоремы 2 приведено в Приложении.

Замечание. Как видно из формулы (1.1) (см. также формулу (1.12) в случае измерения части фазовых координат), разрешающее управление ${{u}_{h}}( \cdot )$ состоит из двух слагаемых ${{u}^{h}}( \cdot )$ и ${{\tilde {u}}^{h}}( \cdot )$. При этом первое слагаемое при всех $t \in T$ принимает значения из множества мгновенных ограничений P. В свою очередь второе слагаемое в силу неравенства (1.4) (см. также неравенство (П.16) в случае измерения части координат) обладает следующим свойством:

$\mathop {\sup }\limits_{t \in T} {\text{|}}{{\tilde {u}}^{h}}(t){{{\text{|}}}_{N}} \to 0\quad {\text{при}}\quad h \to 0.$

Таким образом, каково бы ни было малое число $\nu > 0$, можно указать (в явном виде) такое число ${{h}_{\nu }} \in (0,1)$, что при всех $h \in (0,{{h}_{\nu }})$ и всех $t \in T$ управление ${{u}_{h}}(t)$ будет оставаться в $\nu $-окрестности множества P.

2. Алгоритм решения. Случай отсутствия ограничений на возмущения. Укажем алгоритм решения рассматриваемой задачи при отсутствии ограничений на возмущения, т.е. при $u( \cdot )\, \in \,V( \cdot )\, = \,{{L}_{2}}(T;{{\mathbb{R}}^{r}})$. Как и в случае наличия мгновенных ограничений на возмущения выберем некоторое семейство ${{\Delta }_{h}}$ (0.8) разбиений отрезка T, а также функцию $\alpha (h):(0,1) \to (0,1)$.

До начала работы алгоритма фиксируются величины $h \in (0,1)$, $\alpha = \alpha (h)$ и разбиение ${{\Delta }_{h}} = \{ {{\tau }_{{h,i}}}\} _{{i = 0}}^{{{{m}_{h}}}}$ вида (0.8). Работа алгоритма разбивается $m - 1,$ $m = {{m}_{h}}$, однотипных шагов. В течение i-го шага, осуществляемого на промежутке времени ${{\delta }_{i}} = [{{\tau }_{i}},{{\tau }_{{i + 1}}})$, ${{\tau }_{i}} = {{\tau }_{{h,i}}}$, выполняются следующие операции. Сначала, в момент τi, вычисляются вектора $u_{i}^{h}$ и $\tilde {u}_{i}^{h}$ по формулам

(2.1)
$u_{i}^{h} = {{\alpha }^{{ - 1}}}(\psi _{i}^{h} - \xi _{i}^{h}),\quad \tilde {u}_{i}^{h} = 2L(\psi _{i}^{h} - \xi _{i}^{h}).$

Затем на вход системы (0.1) при всех $t \in {{\delta }_{i}}$ подается управление ${{u}_{h}}(t)$ вида (1.2), (1.3). Под действием этого управления и реализующегося неизвестного возмущения $v(t),$ $t \in {{\delta }_{i}}$ система (0.1) переходит из состояния ${{x}^{h}}({{\tau }_{i}}) = x({{\tau }_{i}};0,{{x}_{0}},{{u}_{h}}( \cdot ),v( \cdot ))$ в состояние ${{x}^{h}}({{\tau }_{{i + 1}}}) = {{x}^{h}}({{\tau }_{{i + 1}}};{{\tau }_{i}},{{x}^{h}}({{\tau }_{i}}),{{u}_{h}}( \cdot ),v( \cdot ))$. Работа алгоритма заканчивается в момент $\vartheta $.

Имеют место следующие утверждения.

Лемма 4. Можно указать такое число ${{d}_{0}} > 0$, что равномерно по всем $t \in T,$ ${{x}_{0}} \in {{\mathbb{R}}^{N}},$ $u( \cdot ) \in {{L}_{2}}(T;{{\mathbb{R}}^{N}})$ выполняется неравенство

$\int\limits_0^t {\text{|}}\dot {x}(s;{{x}_{0}},u( \cdot )){\text{|}}_{N}^{2}ds \leqslant {{d}_{0}}\left( {{\text{|}}{{x}_{0}}{\text{|}}_{N}^{2} + \int\limits_0^t {\text{|}}u(s){\text{|}}_{N}^{2}ds} \right).$

Здесь $x( \cdot ;{{x}_{0}},u( \cdot ))$ – решение системы (0.1) с начальным состоянием (0.2), порожденное $u( \cdot ) \in {{L}_{2}}(T;{{\mathbb{R}}^{N}})$ при нулевом возмущении $v( \cdot )$.

Лемма 5. Пусть $\alpha (h) \to 0$, $\delta (h){{\alpha }^{{ - 2}}}(h) \to 0$ при $h \to 0$. Тогда можно указать такое ${{h}_{2}} \in (0,1)$, что при всех $h \in (0,{{h}_{2}})$, $t \in T$, справедливы неравенства

(2.2)
$\mathop {\max }\limits_{i \in \overline {0,{{m}_{h}}} } \varepsilon ({{\tau }_{i}}) \leqslant {{d}_{5}}\{ \alpha + \delta + {{h}^{2}}{{\delta }^{{ - 1}}}\} ,$
(2.3)
$\int\limits_0^\vartheta {\text{|}}{{u}^{h}}(\tau ){\text{|}}_{N}^{2}{\kern 1pt} d\tau \leqslant \{ 1 + {{d}_{6}}\delta {{\alpha }^{{ - 2}}}\} \int\limits_0^\vartheta {\text{|}}v(\tau ){\text{|}}_{N}^{2}{\kern 1pt} d\tau + {{d}_{7}}\{ {{h}^{2}}{{(\alpha \delta )}^{{ - 1}}} + \delta {{\alpha }^{{ - 1}}}\} ,$
где $\varepsilon (t) = {\text{|}}{{x}^{h}}(t) - y(t){\text{|}}_{N}^{2}$, $\alpha = \alpha (h)$, $\delta = \delta (h)$, ${{d}_{5}},\;{{d}_{6}},\;{{d}_{7}}$ – положительные постоянные.

Доказательство леммы 5 приведено в Приложении.

С помощью леммы 5 может быть доказана следующая теорема.

Теорема 3. Пусть выполнены условия леммы 5. Пусть также ${{h}^{2}}{{(\alpha (h)\delta (h))}^{{ - 1}}} \to 0$ при $h \to 0$. Тогда имеет место сходимость ${{x}^{h}}( \cdot ) \to y( \cdot )$ в $W(T;{{\mathbb{R}}^{N}})$ при $h \to 0.$

Укажем оценку скорости сходимости алгоритма.

Лемма 6. Пусть $v( \cdot ) \in AC(T;{{\mathbb{R}}^{N}})$. Пусть также выполнены условия теоремы 2. Тогда при $h \in (0,{{h}_{2}})$ имеет место следующая оценка скорости сходимости алгоритма:

(2.4)
${\text{|}}{{x}^{h}}( \cdot ) - y( \cdot ){\text{|}}_{{W(T;{{\mathbb{R}}^{N}})}}^{2} \leqslant {{d}_{8}}\{ {{\alpha }^{{1/2}}} + {{\delta }^{{1/2}}}{{\alpha }^{{ - 1}}} + h{{\delta }^{{ - 1/2}}} + {{h}^{2}}{{(\alpha \delta )}^{{ - 1}}}\} ,$
где d8 – положительная постоянная.

Доказательство леммы 6 приведено в Приложении.

Заключение. Предложены алгоритмы устойчивого к информационным помехам и погрешностям вычислений решения задачи компенсации негладких возмущений, действующих на управляемую систему дифференциальных уравнений нелинейных по фазовой переменной. Алгоритмы позволяют строить разрешающие управления путем подходящей локальной регуляризации метода экстремального сдвига. При этом управляющие воздействия формируются по принципу обратной связи по результатам дискретных измерений (с ошибкой) фазовых состояний системы. Рассмотрены случаи как наличия мгновенных ограничений на возмущения, так и отсутствия таковых. Установлены оценки скорости сходимости алгоритмов.

Список литературы

  1. Егоров А.И. Основы теории управления. М.: Физматлит, 2004.

  2. Черноусько Ф.Л., Ананьевский И.М., Решмин С.А. Методы управления нелинейными механическими системами. М.: Физматлит, 2006.

  3. Ананьевский И.М., Решмин С.А. Метод декомпозиции в задаче об отслеживании траекторий механических систем // Изв. РАН. ТиСУ. 2002. № 5. С. 25–32.

  4. Уткин В.А., Уткин А.В. Задача слежения в линейных системах с параметрическими неопределенностями при неустойчивой нулевой динамике // АиТ. 2014. № 9. С. 45–64.

  5. Ананьевский И.М. Управляемое перемещение платформы, несущей упругое звено с неизвестным фазовым состоянием // Изв. РАН. ТиСУ. 2019. № 6. С. 18–25.

  6. Кряжимский А.В., Максимов В.И. Задача ресурсосберегающего слежения на бесконечном промежутке времени // Дифференц. уравнения. 2011. Т. 47. № 7. С. 993–1002.

  7. Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. М.: Наука, 2002.

  8. Баландин Д.В., Коган М.М. Синтез законов управления на основе матричных неравенств. М.: Наука, 2007.

  9. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

  10. Chen W.H., Yang J., Guo L., Li H. Disturbance-observer-based-control and Related Methods: an Overview // IEEE Trans. Ind. Electron. 2015. V. 63. № 2. P. 1083–1095.

  11. Zhao Z., Guo B. A Nonlinear Extended State Observer Based on Fractional Power Functions // Automatica. 2017. V. 81. № 2. P. 286–296.

  12. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации. М.: Изд. МГУ, 1999.

  13. Osipov Yu.S., Kryazhimskii A.V. Inverse Problems for Ordinary Differential Equations: Dynamical Solutions. London: Gordon and Breach, 1995.

  14. Осипов Ю.С., Кряжимский А.В., Максимов В.И. Методы динамического восстановления входов управляемых систем. Екатеринбург: УрО РАН, 2011.

  15. Maksimov V.I. The Methods of Dynamical Reconstruction of an Input in a System of Ordinary Differential Equations // J. Inverse Ill-Posed Probl. 2021. V. 29. № 1. P. 125–156.

  16. Maksimov V.I. On the Stable Solution of a Problem of Disturbance Reduction // Int. J. Appl. Math. Comput. Sci. 2021. V. 31. № 2. P. 187–194.

  17. Максимов В.И. Обратная связь в задаче слежения при измерении в дискретные моменты времени части координат фазового вектора // Изв. РАН. ТиСУ. 2021. № 4. С. 44–53.

  18. Самарский А.А. Введение в теорию разностных схем. М.: Наука, 1971.

Дополнительные материалы отсутствуют.