Известия РАН. Теория и системы управления, 2021, № 4, стр. 46-56
ОБРАТНАЯ СВЯЗЬ В ЗАДАЧЕ СЛЕЖЕНИЯ ПРИ ИЗМЕРЕНИИ В ДИСКРЕТНЫЕ МОМЕНТЫ ВРЕМЕНИ ЧАСТИ КООРДИНАТ ФАЗОВОГО ВЕКТОРА
В. И. Максимов *
Институт математики и механики УрО РАН
Екатеринбург, Москва
* E-mail: maksimov@imm.uran.ru
Поступила в редакцию 30.03.2019
После доработки 23.03.2021
Принята к публикации 31.05.2021
Аннотация
Рассматривается задача отслеживания траектории нелинейной управляемой системы дифференциальных уравнений в условиях неточного измерения в дискретные моменты времени части фазовых координат. Указывается устойчивый к помехам алгоритм ее решения, который основан на конструкциях теорий управления с обратной связью. Алгоритм состоит из двух блоков: блока динамического восстановления неизмеряемых координат и блока управления.
Введение. В статье описывается задача управления системой нелинейных обыкновенных дифференциальных уравнений. Суть задачи состоит в построении алгоритма формирования управления по принципу обратной связи, который гарантировал бы отслеживание траекторией заданной системы траектории другой системы, подверженной влиянию неизвестного возмущения. В работе исследуем задачу, в которой предполагается, что измеряются (с ошибкой) в дискретные моменты времени не все, а часть фазовых координат заданной управляемой системы. Кроме того, полагаем, что неизвестное возмущение является элементом пространства функций, суммируемых с квадратом евклидовой нормы, т.е. может быть неограниченным. Учитывая данную особенность задачи, конструируем устойчивый к информационным помехам и погрешностям вычислений алгоритм решения, который основан на сочетании элементов теории некорректных задач с известным в теории позиционных дифференциальных игр методом экстремального сдвига. Предлагаемый алгоритм содержит два блока: блок реконструкции в темпе “реального времени” ненаблюдаемых координат, а также блок управления, использующий результаты работы блока реконструкции в качестве входа.
1. Постановка задачи. Рассматривается нелинейная система дифференциальных уравнений
(1.1)
$\begin{gathered} {{{\dot {x}}}_{1}}(t) = {{f}_{1}}(t,{{x}_{1}}(t),{{y}_{1}}(t)),\quad t \in T, \\ \mathop {\dot {y}}\nolimits_1 (t) = {{f}_{{21}}}(t,{{x}_{1}}(t),{{y}_{1}}(t)) + C{v}(t) \\ \end{gathered} $Здесь $0 < \vartheta < + \infty $ – конечный момент времени, $x \in {{R}^{n}}$ – измеряемая часть полного фазового вектора системы, $y \in {{R}^{N}}$ – неизмеряемая часть, ${v} \in {{R}^{r}}$ – возмущение, f1 и f21 – липшицевые функции с константой Липшица L, C – стационарная матрица соответствующей размерности. Назовем систему (1.1) возмущенной. Система (1.1) подвержена воздействию некоторого возмущения ${v}( \cdot ) \in {{L}_{2}}(T;{{R}^{r}})$. Как это возмущение ${v}( \cdot )$, так и отвечающее ему решение системы (1.1) ${{z}_{1}}( \cdot ;{{z}_{{10}}},{v}( \cdot )) = \left\{ {{{x}_{1}}( \cdot ;{{z}_{{10}}},{v}( \cdot )),{{y}_{1}}( \cdot ;{{z}_{{10}}},{v}( \cdot ))} \right\}$, где ${{z}_{1}} = \left\{ {{{x}_{1}},{{y}_{1}}} \right\}$, ${{z}_{{10}}} = \left\{ {{{x}_{{10}}},{{y}_{{10}}}} \right\}$, неизвестны.
Наряду с системой (1.1) имеется еще одна система того же вида
(1.2)
$\begin{gathered} \dot {x}(t) = {{f}_{1}}(t,x(t),y(t)),\quad t \in T = [0,\vartheta ], \\ \dot {y}(t) = {{f}_{{21}}}(t,x(t),y(t)) + Cu(t) \\ \end{gathered} $В дискретные, достаточно частые, моменты времени
Здесь $h \in (0,1)$ – уровень погрешности измерения, символ $| \cdot {{|}_{n}}$ означает евклидову норму в пространстве Rn. Для простоты ограничимся случаем, когда состояния $x({{\tau }_{i}})$ и $y({{\tau }_{i}})$ системы (1.2) измеряются точно. Будем предполагать
(1.4)
${\text{|}}{{x}_{0}} - {{x}_{{10}}}{{{\text{|}}}_{n}} \leqslant h,\quad {\text{|}}{{y}_{0}} - {{y}_{{10}}}{{{\text{|}}}_{N}} \leqslant h.$Неравенства (1.3) означают, что состояния ${{x}_{1}}({{\tau }_{i}})$ измеряются с ошибкой. В свою очередь неравенства (1.4) говорят о том, что начальные состояния следящей и возмущенной систем близки.
Обсуждаемая в работе задача состоит в построении алгоритма формирования управления $u = {{u}^{h}}( \cdot )$ системой (1.2), позволяющего осуществлять отслеживание решением $z( \cdot ) = \left\{ {x( \cdot ),y( \cdot )} \right\}$ этой системы решение ${{z}_{1}}( \cdot ) = \left\{ {{{x}_{1}}( \cdot ),{{y}_{1}}( \cdot )} \right\}$ системы (1.1), т.е. обеспечить малость величины ${{\sup }_{{t \in T}}}{{\left| {z(t) - {{z}_{1}}(t)} \right|}_{{n + N}}}$. Таким образом, рассматривается задача, состоящая в построении алгоритма, который по текущим измерениям величин ${{x}_{1}}({{\tau }_{i}})$ и $z({{\tau }_{i}})$ в “реальном времени” формирует (по принципу обратной связи) управление $u = {{u}^{h}}( \cdot )$ в правой части системы (1.2), такое, что отклонение решения системы (1.2) $z( \cdot ) = z( \cdot ;{{z}_{0}},{{u}^{h}}( \cdot )) = \left\{ {x({{\tau }_{i}};{{z}_{0}},u( \cdot )),y({{\tau }_{i}};{{z}_{0}},u( \cdot ))} \right\}$ $({{z}_{0}} = \left\{ {{{x}_{0}},{{y}_{0}}} \right\})$ от решения системы (1.1) ${{z}_{1}}( \cdot ) = {{z}_{1}}( \cdot ;{{z}_{{10}}},{v}( \cdot ))$ в метрике пространства $C(T;{{R}^{{n + N}}})$ мало при достаточной малости измерительной погрешности h и периода дискретизации δ.
Задача слежения – одна из классических задач теории управления. Она исследовалась многими авторами (см., например, [1–5]). В данной работе мы рассмотрим случай измерения части координат. При этом укажем алгоритм решения, который основан на методе динамического обращения, развитом в [6, 7], а также известном в теории позиционного управления методе экстремального сдвига [8]. В связи с неполнотой информации (а именно с возможностью измерения в моменты ${{\tau }_{i}}$ не всего фазового состояния системы (1.1) – $\{ {{x}_{1}}({{\tau }_{i}}),{{y}_{1}}({{\tau }_{i}})\} $, а лишь его части – ${{x}_{1}}({{\tau }_{i}})$), наряду с блоком управления, нами будет использоваться дополнительный блок – блок динамического восстановления неизмеряемых координат. Последний будет играть роль поставщика недостающей информации о текущем фазовом состоянии системы (1.1). Эта информация оперативно передается на блок управления, формирующий $u$ по принципу обратной связи. Среди последних работ, где сначала оценивается часть координат, а затем все координаты подаются на вход контура управления, следует отметить [9].
Другие задачи отслеживания решений дифференциальных уравнений, основанные на методе экстремального сдвига, обсуждались, например, в [10–15]. При этом в работах [10–12] рассматривался случай измерения “всех” координат. Случай измерения части фазовых координат обсуждался в публикациях [13] (линейная система обыкновенных дифференциальных уравнений), [14] (система с последействием), [15] (система с распределенными параметрами).
2. Метод решения. Перейдем к описанию метода решения рассматриваемой задачи. Пусть для каждого $h \in (0,1)$ фиксировано семейство ${{\Delta }_{h}}$ разбиений отрезка $T$ контрольными моментами времени ${{\tau }_{{h,i}}}$:
(2.1)
${{\Delta }_{h}} = \left\{ {{{\tau }_{{h,i}}}} \right\}_{{i = 0}}^{{{{m}_{h}}}},\quad {{\tau }_{{h,0}}} = 0,\quad {{\tau }_{{h,{{m}_{h}}}}} = \vartheta ,\quad {{\tau }_{{h,i + 1}}} = {{\tau }_{{h,i}}} + \delta (h),\quad \delta (h) \in (0,1).$Как было отмечено выше, при решении задачи слежения будут использоваться два блока.
Первый (вспомогательный) блок – блок реконструкции, содержит управляемую систему и закон формирования управления $u_{0}^{h}( \cdot )$ этой системой по принципу обратной связи ${{U}_{0}}$. Динамика системы описывается векторным дифференциальным уравнением
(2.2)
$\mathop {\dot {w}}\nolimits_1^h (t) = u_{0}^{h}(t)\quad {\text{при}}\quad t \in T\quad (w_{1}^{h}{\text{,}}{\kern 1pt} {\kern 1pt} {\kern 1pt} u_{0}^{h} \in {{R}^{n}})$(2.3)
$u_{0}^{h}(t) = u_{{0i}}^{h} = {{U}_{0}}({{\tau }_{i}},\xi _{i}^{h},w_{1}^{h}({{\tau }_{i}}))\quad {\text{при}}\;{\text{п}}.{\text{в}}.\quad t \in [{{\tau }_{i}},{{\tau }_{{i + 1}}})\quad (i \in \overline {0,{{m}_{h}} - 1} ),$(2.4)
$u_{1}^{h}(t) = u_{{1i}}^{h} = {{U}_{1}}({{\tau }_{i}},\xi _{i}^{h},u_{{0i}}^{h})\quad {\text{при}}\;{\text{п}}.{\text{в}}.\quad t \in [{{\tau }_{i}},{{\tau }_{{i + 1}}})\quad (i \in \overline {0,{{m}_{h}} - 1} ),$Второй (основной) блок – блок управления системой (1.2), содержит закон U(·, ·, ·) : $T \times {{R}^{N}} \times {{R}^{N}} \mapsto {{R}^{r}}$ формирования управления $u = {{u}^{h}}( \cdot )$. Закон U конструируется таким образом, что при соответствующем согласовании ряда параметров управление $u = {{u}^{h}}( \cdot )$ вида
(2.5)
${{u}^{h}}(t) = u_{i}^{h} = U({{\tau }_{i}},u_{{1i}}^{h},y({{\tau }_{i}}))\quad {\text{при}}\;{\text{п}}.{\text{в}}.\quad t \in [{{\tau }_{i}},{{\tau }_{{i + 1}}})\quad (i \in \overline {0,{{m}_{h}} - 1} )$На рис. 1 изображена блок-схема алгоритма решения задачи.
3. Алгоритм решения. Укажем алгоритм решения рассматриваемой задачи. Фиксируем некоторoе семейство ${{\Delta }_{h}}$ (2.1), а также две функции $\alpha (h):(0,1) \to (0,1)$ и ${{\alpha }_{1}}(h):(0,1) \to (0,1)$.
Пусть $M \subset {{R}^{n}}$ – область, в которой остаются первые $n$ фазовых координат решения системы (1.1), порожденного неизвестным возмущением ${v}( \cdot )$, т.е.
Условие. В области $T \times M$ функция $y \to F = {{f}_{1}}(t,x,y)$ имеет обратную функцию $y = f_{{1y}}^{{ - 1}}(t,x$, F), которая является липшицевой функцией по совокупности переменных с постоянной Липшица Ly.
Кроме того, полагаем, что функция f1 – дифференцируема, а компонента $x( \cdot )$ решения системы (1.2) обладает следующим свойством: $\ddot {x}( \cdot ) \in {{L}_{2}}(T;{{R}^{n}})$.
До начала работы алгоритма фиксируем величину $h \in (0,1)$, числа ${{\alpha }_{1}} = {{\alpha }_{1}}(h),$ $\alpha = \alpha (h)$ и разбиение ${{\Delta }_{h}} = \left\{ {{{\tau }_{{h,i}}}} \right\}_{{i = 0}}^{{{{m}_{h}}}}$ вида (2.1). Работу алгоритма разобьем на однотипные шаги. В течение i-го шага, осуществляемого на промежутке времени ${{\delta }_{i}} = [{{\tau }_{i}},{{\tau }_{{i + 1}}})$, ${{\tau }_{i}} = {{\tau }_{{h,i}}}$, выполняются следующие операции. Сначала, в момент ${{\tau }_{i}}$, вычисляются векторы $u_{{0i}}^{h},$ $u_{{1i}}^{h}$ и $u_{i}^{h}$ по формулам (2.3)–(2.5), в которых
(3.1)
$\begin{gathered} {{U}_{0}}({{\tau }_{i}},\xi _{i}^{h},w_{1}^{h}({{\tau }_{i}})) = - {{\alpha }^{{ - 1}}}[w_{1}^{h}({{\tau }_{i}}) - \xi _{i}^{h} + {{\tau }_{i}}{{f}_{1}}(0,{{x}_{{10}}},{{y}_{{10}}})]{\kern 1pt} {\kern 1pt} , \\ {{U}_{1}}({{\tau }_{i}},\xi _{i}^{h},u_{{0i}}^{h}) = f_{{1y}}^{{ - 1}}({{\tau }_{i}},\xi _{i}^{h},u_{{0i}}^{h} + {{f}_{1}}(0,{{x}_{{10}}},{{y}_{{10}}})), \\ U({{\tau }_{i}},u_{{1i}}^{h},y({{\tau }_{i}})) = - \alpha _{1}^{{ - 1}}{{C}^{{\text{T}}}}(y({{\tau }_{i}}) - u_{{1i}}^{h}). \\ \end{gathered} $Здесь символ “T” означает транспонирование. Затем на вход системы (2.2) при всех $t \in {{\delta }_{i}}$ подается управление $u_{0}^{h}(t)$ вида (2.3), (3.1), а на вход системы (1.2) – управление $u = {{u}^{h}}(t)$ вида (2.5), (3.1). Под действием этих управлений решение системы (1.2) переходит из состояния $z({{\tau }_{i}})$ в состояние $z({{\tau }_{{i + 1}}})$, а решение системы (2.2) – из состояния $w_{1}^{h}({{\tau }_{i}})$ в состояние $w_{1}^{h}({{\tau }_{{i + 1}}})$. Работа алгоритма заканчивается в момент $\vartheta $.
Оказывается, что при определенном согласовании величин $h,\,\,\delta (h),\,\;\alpha (h)$ и ${{\alpha }_{1}}(h)$ построенное таким образом управление $u = {{u}^{h}}( \cdot )$ решает обсуждаемую задачу слежения.
Прежде чем перейти к доказательству этого факта, приведем два вспомогательных утверждения. Заметим, что встречающиеся далее постоянные ${{c}_{j}},\;{{C}_{j}}$ зависят от структуры системы (1.2) и не зависят от $h,\;\alpha ,\;{{\alpha }_{1}},\;\delta $.
Лемма 1 [10]. Пусть неотрицательная функция $\varphi ( \cdot )$ при всех $i \in \overline {0,{{m}_{h}} - 1} $ удовлетворяет неравенствам
Символ $| \cdot |$ здесь означает модуль числа.
Лемма 2. Пусть $\alpha (h) \to 0,$ $\delta (h) \to 0,$ $(h + \delta (h)){{\alpha }^{{ - 1}}}(h) \to 0$ при $h \to 0$, причем $\delta ({{h}_{1}}) \leqslant \delta ({{h}_{2}})$, если ${{h}_{1}} \leqslant {{h}_{2}}$. Тогда можно указать такое число ${{h}_{0}} \in (0,1)$, что при всех $h \in (0,{{h}_{0}})$ верно неравенство
Доказательство леммы 2 приведено в Приложении.
Теорема. Пусть выполнены условия леммы 2. Пусть также ${{\alpha }_{1}}(h) \to 0$ при $h \to 0$ и ${{\delta }^{\gamma }}(h) \leqslant {{C}_{1}}\alpha _{1}^{2}(h)$ при некотором $\gamma \in (0,1)$. Тогда можно указать ${{h}_{1}} \in (0,{{h}_{0}})$, такое, что при всех $h \in (0,{{h}_{1}})$ верно неравенство
Доказательство теоремы приведено в Приложении.
Следствие. Если $\gamma = 1{\text{/}}2,$ δ = h, $\alpha = {{h}^{{1/2}}},$ ${{\alpha }_{1}} = {{h}^{{1/2}}}$, то справедливо неравенство
Замечание. Пусть неточно измеряются состояния $x({{\tau }_{i}})$ системы (1.2), т.е. в моменты ${{\tau }_{i}}$ находятся величины $\psi _{i}^{h} \in {{R}^{n}}$, такие, что
В этом случае блок реконструкции следует дополнить системой
В свою очередь управление ${{u}^{h}}(t)$ вычисляется по формуле (2.5), в которой вместо вектора $y({{\tau }_{i}})$ стоит вектор
При этом теорема и следствие будут справедливыми.
4. Примеры. Пример 1. Рассматриваются две материальные точки единичной массы, которые двигаются по прямой под действием внешних сил. Силы гравитации, а также сопротивления среды отсутствуют. Поэтому уравнения движения точек, согласно второму закону Ньютона, имеют вид
иЗдесь $x(t)\;({{x}_{1}}(t))$ – путь, пройденный к моменту t первой (второй) точкой, $\dot {x}(t)({{\dot {x}}_{1}}(t))$ – скорость первой (второй) точки, $u( \cdot )({v}( \cdot ))$ – сила воздействия на первую (вторую) точку. В начальный момент времени ($t = 0)$ состояния точек и их скоростей изменения близки:
Сила ${v}( \cdot )$, действующая на вторую точку, неизвестна. Известно лишь, что она удовлетворяет условию ${v}( \cdot ) \in {{L}_{2}}(T;R)$. В дискретные моменты времени ${{\tau }_{i}},{{\tau }_{i}} = {{\tau }_{{i - 1}}} + \delta ,$ ${{\tau }_{0}} = 0$, измеряются пути, пройденные каждой из точек, т.е. определяются числа $\xi _{i}^{h}$ и $\psi _{i}^{h}$, такие, что
Необходимо указать алгоритм формирования управления $u( \cdot )$ по принципу обратной связи
Для решения сформулированной задачи был использован описанный выше алгоритм. Уравнение (4.1) сводилось к виду (1.2) заменой переменных $y(t) = \dot {x}(t)$, а уравнение (4.2) – к виду (1.1) заменой ${{y}_{1}}(t) = {{\dot {x}}_{1}}(t)$. Полученные системы решались методом Эйлера с шагом $\delta $.
В моменты ${{\tau }_{i}} = i\delta $ числа ${v}_{i}^{h}$, $u_{{1i}}^{h}$ и $u_{i}^{h}$ вычислялись по формулам (2.3)–(2.5) и (3.1). В ходе эксперимента полагалось ${v}(t) = 1 + \sin (2t),$ $\vartheta = 2$, ${{x}_{0}} = {{x}_{{10}}} = 2$, ${{y}_{0}} = {{y}_{{10}}} = 2$, $\alpha = {{\alpha }_{1}} = 0.002$, $\xi _{i}^{h} = {{x}_{1}}({{\tau }_{i}})$ + + hcos(10t), $\psi _{i}^{h} = x({{\tau }_{i}}) + h$. Результаты вычислительного эксперимента показаны на рис. 2, 3. Рисунок 2 отвечает случаю $h = 0.01$, $\delta = 0.002$, в то время как рисунок 3 – случаю $h = 0.001$, $\delta = 0.002$. На рисунках сплошная линия изображает $\dot {x}( \cdot )$, пунктирная линия – ${{\dot {x}}_{1}}( \cdot )$. Как показал эксперимент, графики кривых $x( \cdot )$ и ${{x}_{1}}( \cdot )$ во втором случае практически совпадают.
Пример 2. Аналогичная задача решалась для систем вида
(4.3)
$\begin{gathered} \dot {x}(t) = 2x(t) + 3y(t),\quad x(0) = {{x}_{0}}, \\ \dot {y}(t) = - x(t) + y(t) + u(t),\quad y(0) = {{y}_{0}}, \\ \end{gathered} $(4.4)
$\begin{gathered} \mathop {\dot {x}}\nolimits_1 (t) = 2{{x}_{1}}(t) + 3{{y}_{1}}(t),\quad {{x}_{1}}(0) = {{x}_{{10}}}, \\ \mathop {\dot {y}}\nolimits_1 (t) = - {{x}_{1}}(t) + {{y}_{1}}(t) + {v}(t),\quad {{y}_{1}}(0) = {{y}_{{10}}}. \\ \end{gathered} $Системы (4.3)–(4.4) решались методом Эйлера с шагом δ. В ходе эксперимента полагалось $v(t) = {{t}^{2}},$ ϑ = 2, ${{x}_{0}} = 2$, ${{y}_{0}} = 2$, $\alpha = {{\alpha }_{1}} = 0.002$, $\xi _{i}^{h} = {{x}_{1}}({{\tau }_{i}}) + hcos(10t)$, $x_{{10}}^{{}} = {{x}_{0}}$, $y_{{10}}^{{}} = {{y}_{0}} + h$. Результаты эксперимента приведены на рис. 4, 5. Рисунок 4 отвечает случаю $h = 0.5$, $\delta = 0.002$, а рисунок 5 – случаю h = 0.1, $\delta = 0.002$. На указанных рисунках сплошная линия изображает $y( \cdot )$, пунктирная линия –${{y}_{1}}( \cdot )$.
Список литературы
Айзерман М.А. Лекции по теории автоматического регулирования. М.: Физматгиз, 1958.
Егоров А.И. Основы теории управления. М.: Физматлит, 2004.
Черноусько Ф.Л., Ананьевский И.М., Решмин С.А. Методы управления нелинейными механическими системами. М.: Физматлит, 2006.
Ананьевский И.М., Решмин С.А. Метод декомпозиции в задаче об отслеживании траекторий механических систем // Изв. РАН. ТиСУ. 2002. № 5. С. 25–32.
Уткин В.А., Уткин А.В. Задача слежения в линейных системах с параметрическими неопределенностями при неустойчивой нулевой динамике // АиТ. 2014. № 9. С. 45–64.
Osipov Yu.S., Kryazhimskii A.V. Inverse problems for Ordinary Differential Equations: Dynamical Solutions. London: Gordon and Breach, 1995.
Осипов Ю.С., Кряжимский А.В., Максимов В.И. Методы динамического восстановления входов управляемых систем. Екатеринбург: УрО РАН, 2011.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
Ананьевский И.М. Управляемое перемещение платформы, несущей упругое звено с неизвестным фазовым состоянием // Изв. РАН. ТиСУ. 2019. № 6. С. 18–25.
Максимов В.И. Об отслеживании траектории динамической системы // ПММ. 2011. Т. 75. № 6. С. 951–960.
Кряжимский А.В., Максимов В.И. Задача ресурсосберегающего слежения на бесконечном промежутке времени // Дифференц. уравнения. 2011. Т. 47. № 7. С. 993–1002.
Максимов В.И., Осипов Ю.C. О граничном управлении распределенной системой на бесконечном промежутке времени // ЖВМиМФ. 2016. Т. 56. № 1. С. 14–26.
Максимов В.И. Об одном алгоритме управления линейной системой при измерении части координат фазового вектора // Тр. Ин-та математики и механики УрО РАН. 2014. Т. 20. № 4. С. 218–230.
Близорукова М.С., Максимов В.И. Об одном алгоритме отслеживания движения эталонной системы с последействием при измерении части координат // Дифференц. уравнения. 2011. Т. 47. № 3. С. 415–426.
Maksimov V.I. Game Control Problem for a Phase Field Equation // JOTA. 2016. V. 170. № 1. P. 294–307.
Максимов В.И. О вычислении производной функции, заданной неточно, с помощью законов обратной связи // Тр. МИРАН им. В.А. Стеклова. 2015. Т. 291. С. 559–586.
Дополнительные материалы отсутствуют.
Инструменты
Известия РАН. Теория и системы управления