Прикладная математика и механика, 2021, T. 85, № 6, стр. 683-698

Cтабилизация двойного перевернутого маятника, установленного на качелях SEESAW

А. М. Формальский 1*, П. А. Кручинин 1**, К. Л. Войцицкая 1

1 Московский государственный университет им. М.В. Ломоносова
Москва, Россия

* E-mail: formal@imec.msu.ru
** E-mail: pkruch@mech.math.msu.su

Поступила в редакцию 07.04.2021
После доработки 24.08.2021
Принята к публикации 10.09.2021

Полный текст (PDF)

Аннотация

Рассматривается задача о синтезе закона управления, стабилизирующего двойной перевернутый маятник, установленный на качелях seesaw. Движение такого маятника рассматривается в вертикальной плоскости. Качели seesaw представляют собой сегмент цилиндра, ось которого горизонтальна. Этот цилиндрический сегмент может совершать колебания, перекатываясь по горизонтальной опорной поверхности без проскальзывания. Нижнее (первое) звено маятника крепится к качелям seesaw при помощи цилиндрического шарнира. Ось этого шарнира параллельна оси цилиндра и оси межзвенного шарнира. Ограниченный по абсолютной величине управляющий момент приложен в межзвенном шарнире. Описываемая система имеет три степени свободы и единственное управляющее воздействие. В отсутствие управления, система имеет неустойчивое положение равновесия, в котором оба звена маятника направлены вертикально вверх, а качели не наклонены. Управление, стабилизирующее желаемое неустойчивое положение равновесия, строится в виде обратной связи по двум “неустойчивым” жордановым переменным разомкнутой линеаризованной системы так, чтобы область притяжения системы была, по возможности, максимальной. Рассмотрены некоторые свойства области управляемости и области притяжения в этой системе. Приводятся результаты численных исследований.

Ключевые слова: двойной перевернутый маятник, качели seesaw, область управляемости, область притяжения, стабилизация

Изучаемая в настоящей статье задача стабилизации двухзвенного перевернутого маятника, установленного на качелях seesaw, представляет интерес, прежде всего, с точки зрения теории управления неустойчивыми механическими системами в условиях дефицита количества управляющих воздействий и при наложенных на них ограничениях [1, 2]. В подобных задачах одной из целей может быть синтез управления, при котором реализуется максимально возможная область притяжения неустойчивого (в отсутствие управления) состояния равновесия. В этих условиях представляется перспективным подход, который предполагает использование всех ресурсов управления для подавления неустойчивых мод. Результаты решения рассматриваемой здесь задачи могут представить интерес также при изучении процессов поддержания вертикальной позы человека. Одним из движений, требующих подобного анализа, является удержание человеком равновесия на подвижной опоре в виде пресс-папье. Такую опору называют также качелями seesaw. Соответствующий тест в настоящее время приобрел популярность и используется в биомеханических исследованиях и в спортивной медицине [37]. В работах [8, 9] рассматривается так называемая “голеностопная стратегия”, когда поддержание вертикальной позы человека осуществляется за счет моментов, приложенных в голеностопных суставах. В настоящей статье исследуется задача стабилизации установленного на seesaw двухзвенного маятника с управляющим моментом, приложенным в межзвенном шарнире. Если считать, что межзвенный шарнир двухзвенника моделирует два тазобедренных сустава, то подобная система касается так называемой “тазобедренной стратегии” [1012].

1. Математическая модель двухзвенного маятника, закрепленного шарнирно на качелях seesaw. Обозначим через $m$ массу сегмента цилиндра (качелей seesaw). Сегмент имеет плоскость симметрии, которая содержит ось цилиндра, обозначенную буквой $O$ (см. рис. 1). Будем считать, что масса сегмента распределена по нему равномерно, при этом его центр масс $G$ располагается в плоскости симметрии, как показано на рис. 1. Цилиндрическая поверхность сегмента касается плоской горизонтальной опорной поверхности вдоль прямой линии, обозначенной буквой $K$. В плоскости симметрии цилиндрического сегмента, на его верхней поверхности при помощи цилиндрического шарнира ${{S}_{1}}$ закреплен двойной перевернутый маятник с массами звеньев ${{m}_{1}}$ и ${{m}_{2}}$. Оси обоих шарниров параллельны оси цилиндра $O$. Центры масс ${{C}_{1}}$ и ${{C}_{2}}$ звеньев удалены от шарниров ${{S}_{1}}$ и ${{S}_{2}}$ на расстояния ${{r}_{1}}$ и ${{r}_{2}}$ соответственно.

Рис. 1.

Модель двойного маятника на seesaw.

Рассмотрим движение системы в плоскости, перпендикулярной оси цилиндра и содержащей маятник. В этой плоскости контур пресс-папье имеет форму сегмента круга, как показано на рис. 1. Точки $G$ и ${{S}_{1}}$ лежат на одном радиусе цилиндра (см. рис. 1), расположенном в плоскости симметрии сегмента. Расстояние $OK$ равно радиусу $R$ цилиндра. Примем следующие обозначения для величин, показанных на рис. 1: $O{{S}_{1}} = h$, $OG = r$, ${{S}_{1}}{{S}_{2}} = l$. Будем считать сегмент цилиндра таким, что центр $O$ лежит вне его. Через $\rho $ обозначим радиус инерции качелей seesaw относительно оси, параллельной оси $O$ и проходящей через центр масс $G$ качелей. Соответствующие радиусы инерции звеньев относительно их центров масс обозначим через ${{{{\rho }}}_{1}}$ и ${{{{\rho }}}_{2}}$.

Будем полагать, что качели перекатываются по горизонтальной поверхности без проскальзывания и отрыва. В этом случае система имеет три степени свободы. Для ее описания введем обобщенные координаты: ${{\alpha }_{1}}$ и ${{\alpha }_{2}}$ – углы отклонения звеньев маятника от вертикали и $\varphi $ – угол наклона платформы качелей (см. рис. 1).

Кинетическую энергию $T$ системы запишем в следующем виде:

$\begin{gathered} T = \frac{1}{2}\left\{ {m\left[ {V(r,\varphi ) + {{\rho }^{2}}} \right]{{{\dot {\varphi }}}^{2}} + {{m}_{1}}\rho _{1}^{2}\dot {\alpha }_{1}^{2} + {{m}_{2}}\rho _{2}^{2}\dot {\alpha }_{2}^{2} + } \right. \\ + \;{{m}_{1}}\left[ {V(h,\varphi ){{{\dot {\varphi }}}^{2}} + r_{1}^{2}\dot {\alpha }_{1}^{2} + 2{{r}_{1}}\dot {\varphi }{{{\dot {\alpha }}}_{1}}U(\varphi ,{{\alpha }_{1}})} \right] + \\ + \;{{m}_{2}}\left[ {V(h,\varphi ){{{\dot {\varphi }}}^{2}} + {{l}^{2}}\dot {\alpha }_{1}^{2} + 2l\dot {\varphi }{{{\dot {\alpha }}}_{1}}U(\varphi ,{{\alpha }_{1}}) + } \right. \\ \left. {\left. { + \;r_{2}^{2}\dot {\alpha }_{2}^{2} + 2l{{r}_{2}}{{{\dot {\alpha }}}_{1}}{{{\dot {\alpha }}}_{2}}\cos ({{\alpha }_{1}} - {{\alpha }_{2}}) + 2{{r}_{2}}\dot {\varphi }{{{\dot {\alpha }}}_{2}}U(\varphi ,{{\alpha }_{2}})} \right]} \right\} \\ \end{gathered} $

Здесь приняты обозначения

$V(z,\varphi ) = {{R}^{2}} + {{z}^{2}} - 2Rz\cos \varphi $
$U(\varphi ,{{\alpha }_{i}}) = R\cos {{\alpha }_{i}} - h\cos \left( {\varphi - {{\alpha }_{i}}} \right),\quad i = 1,\;2$

Потенциальную энергию $\Pi $ сил тяжести и виртуальную работу $\delta W$ управляющего момента $M$ в шарнире ${{S}_{2}}$ запишем в виде

$\begin{gathered} \Pi = mg{\text{(}}R - r\cos \varphi {\text{)}} + {{m}_{1}}g{\text{(}}R - h\cos \varphi + {{r}_{1}}\cos {{\alpha }_{1}}{\text{)}} + \\ + \;{{m}_{2}}g{\text{(}}R - h\cos \varphi + l\cos {{\alpha }_{1}} + {{r}_{2}}\cos {{\alpha }_{2}}{\text{)}} \\ \end{gathered} $
$\delta W = Q(\delta {{\alpha }_{2}} - \delta {{\alpha }_{1}})$

Уравнения Лагранжа 2-го рода для рассматриваемой системы можно записать в удобной матричной форме по аналогии с уравнениями в [1, 2, 8, 13]

(1.1)
${\mathbf{A}}{\text{(}}\psi {\text{)}}\ddot {\psi } + {\mathbf{F}}{\text{(}}\psi {\text{)}}{{\dot {\psi }}^{{\mathbf{2}}}} + {\mathbf{Csin}}\psi = {\mathbf{D}}Q$

Здесь приняты следующие обозначения:

${\mathbf{\psi }} = \left\| {\begin{array}{*{20}{c}} \varphi \\ {{{\alpha }_{1}}} \\ {{{\alpha }_{2}}} \end{array}} \right\|,\quad {{{\mathbf{\dot {\psi }}}}^{{\mathbf{2}}}} = \left\| {\begin{array}{*{20}{c}} {{{{\dot {\varphi }}}^{2}}} \\ {\dot {\alpha }_{1}^{2}} \\ {\dot {\alpha }_{2}^{2}} \end{array}} \right\|,\quad {\mathbf{sin\psi }} = \left\| {\begin{array}{*{20}{c}} {\sin \varphi } \\ {\sin {{\alpha }_{1}}} \\ {\sin {{\alpha }_{2}}} \end{array}} \right\|,\quad {\mathbf{D}} = \left\| {\begin{array}{*{20}{c}} 0 \\ 1 \\ { - 1} \end{array}} \right\|$
(1.2)
$\begin{gathered} A(\psi ) = \left\| {\begin{array}{*{20}{c}} {{{A}_{{11}}}(\varphi )}&{wU(\varphi ,{{\alpha }_{1}})}&{{{m}_{2}}{{r}_{2}}U(\varphi ,{{\alpha }_{2}})} \\ {wU(\varphi ,{{\alpha }_{1}})}&{{{m}_{1}}\left( {r_{1}^{2} + \rho _{1}^{2}} \right) + {{M}_{2}}{{l}^{2}}}&{{{m}_{2}}l{{r}_{2}}\cos ({{\alpha }_{1}} - {{\alpha }_{2}})} \\ {{{m}_{2}}{{r}_{2}}U(\varphi ,{{\alpha }_{2}})}&{{{m}_{2}}l{{r}_{2}}\cos ({{\alpha }_{1}} - {{\alpha }_{2}})}&{{{m}_{2}}\left( {r_{2}^{2} + \rho _{2}^{2}} \right)} \end{array}} \right\| \\ C = \left\| {\begin{array}{*{20}{c}} {({{m}_{1}} + {{m}_{2}})h + mr}&0&0 \\ 0&{ - {{m}_{1}}{{r}_{1}} - {{m}_{2}}l}&0 \\ 0&0&{ - {{m}_{2}}{{r}_{2}}} \end{array}} \right\|g \\ \end{gathered} $
$F(\psi ) = \left\| {\begin{array}{*{20}{c}} {\left( {{{m}_{1}} + {{m}_{2}}} \right)Rh\sin \varphi }&{ - w{{U}_{1}}(\varphi ,{{\alpha }_{1}})}&{{{m}_{2}}{{r}_{2}}{{U}_{1}}(\varphi ,{{\alpha }_{2}})} \\ { - \left( {{{m}_{1}} + {{m}_{2}}} \right){{r}_{1}}h\sin ({{\alpha }_{1}} - \varphi )}&0&{{{m}_{2}}l{{r}_{2}}\sin ({{\alpha }_{1}} - {{\alpha }_{2}})} \\ {{{m}_{2}}h{{r}_{2}}\sin ({{\alpha }_{2}} - \varphi )}&{ - {{m}_{2}}l{{r}_{2}}\sin ({{\alpha }_{1}} - {{\alpha }_{2}})}&0 \end{array}} \right\|,$
где

${{A}_{{11}}}\left( {{\varphi }} \right) = \left( {{{m}_{1}} + {{m}_{2}}} \right)V(h,{{\varphi }}) + m\left[ {V(r,{{\varphi }}) + {{{{\rho }}}^{2}}} \right]$
${{U}_{1}}(\varphi ,{{\alpha }_{i}}) = R\sin {{\alpha }_{i}} - h\sin \left( {\varphi - {{\alpha }_{i}}} \right),\quad i = 1,2$
$w = {{m}_{1}}{{r}_{1}} + {{m}_{2}}l$

Представим момент $Q$, действующий в шарнире ${{S}_{2}}$, в виде суммы управляющего момента $M$, развиваемого приводом, и момента сил вязкого трения с коэффициентом $k$:

$Q = M + k{\text{(}}{{{{\dot {\alpha }}}}_{2}} - {{{{\dot {\alpha }}}}_{1}}{\text{)}}$

Тогда уравнение (1.1) примет вид:

(1.3)
$A(\psi )\ddot {\psi } + B\dot {\psi } + F(\psi ){{\dot {\psi }}^{{\mathbf{2}}}} + Csin\psi = DM,$
где

(1.4)
${\mathbf{B}} = \left\| {\begin{array}{*{20}{c}} 0&0&0 \\ 0&k&{ - k} \\ 0&{ - k}&k \end{array}} \right\|$

В дальнейшем будем рассматривать систему с управляющим моментом $M$, ограниченным по абсолютной величине:

(1.5)
$\left| M \right| \leqslant {{M}_{0}},\quad {{M}_{0}} = \operatorname{const} $

2. Линеаризованные уравнения движения. При $M = 0$ система (1.3) имеет тривиальное решение

(2.1)
$\varphi \equiv {{\alpha }_{1}} \equiv {{\alpha }_{2}} \equiv 0,$
которое описывает неустойчивое положение равновесия, когда платформа качелей горизонтальна, а оба звена перевернутого двухзвенника вертикальны. Предполагая, что углы ${{\varphi }}$, ${{{{\alpha }}}_{1}}$, ${{{{\alpha }}}_{2}}$ и скорости ${{\dot {\varphi }}}$, ${{{{\dot {\alpha }}}}_{1}}$, ${{{{\dot {\alpha }}}}_{2}}$ малы, линеаризуем уравнение (1.3) в окрестности состояния равновесия (2.1). Линеаризованные уравнения движения запишем в матричном виде следующим образом:

(2.2)
${\mathbf{A\ddot {\psi }}} + {\mathbf{B\dot {\psi }}} + {\mathbf{C\psi }} = {\mathbf{D}}M$

Здесь матрицы B, C и D сохраняют вид (1.2) и (1.4), а матрица инерции $A\left( \psi \right)$ принимает вид

${\mathbf{A}} = \left\| {\begin{array}{*{20}{c}} {{{A}_{{11}}}(0)}&{\left( {{{m}_{1}}{{r}_{1}} + {{m}_{2}}l} \right)(R - h)}&{{{m}_{2}}{{r}_{2}}(R - h)} \\ {\left( {{{m}_{1}}{{r}_{1}} + {{m}_{2}}l} \right)(R - h)}&{{{m}_{1}}\left( {r_{1}^{2} + \rho _{1}^{2}} \right) + {{m}_{2}}{{l}^{2}}}&{{{m}_{2}}l{{r}_{2}}} \\ {{{m}_{2}}{{r}_{2}}(R - h)}&{{{m}_{2}}l{{r}_{2}}}&{{{m}_{2}}\left( {r_{2}^{2} + \rho _{2}^{2}} \right)} \end{array}} \right\|$

Величина ${{A}_{{11}}}(0)$ имеет вид

${{A}_{{11}}}(0) = \left( {{{m}_{1}} + {{m}_{2}}} \right){{\left( {R - h} \right)}^{2}} + m\left[ {{{{\left( {R - r} \right)}}^{2}} + {{\rho }^{2}}} \right]$

3. Структура спектра разомкнутой системы. Рассмотрим линеаризованную систему (2.2) в отсутствие трения и управления, т.е. при $k = 0$ и $M = 0$. Характеристическое уравнение системы (2.2) можно записать, пользуясь соотношением

(3.1)
$\det \left( {{\mathbf{A}}{{{{\lambda }}}^{2}} + {\mathbf{C}}} \right) = 0$

Его левая часть представляет собой бикубический полином, т.е. уравнение (3.1) имеет вид

(3.2)
${{a}_{0}}{{\lambda }^{6}} + {{a}_{1}}{{\lambda }^{4}} + {{a}_{2}}{{\lambda }^{2}} + {{a}_{3}} = 0$

Определим расположение трех корней кубического уравнения

(3.3)
${{a}_{0}}{{{{\mu }}}^{3}} + {{a}_{1}}{{{{\mu }}}^{2}} + {{a}_{2}}{{\mu }} + {{a}_{3}} = 0$
полученного из (3.2) при замене переменных: ${{\mu }} = {{{{\lambda }}}^{2}}$. Так как (3.3) – характеристическое уравнение консервативной механической системы, то все его корни действительны [14]. Матрица $A$ кинетической энергии является положительно определенной, определитель матрицы $C$ положителен, следовательно,

(3.4)
${{a}_{0}} = \det {\mathbf{A}} > 0,\quad {{a}_{3}} = \det C > 0$

Из неравенства ${{a}_{3}} \ne 0$ (см. (3.4)) следует, что уравнение (3.3) (а значит и уравнение (3.2)) не имеет нулевых корней. При этом, как следует из неравенств (3.4), уравнение (3.3) имеет либо один, либо три отрицательных корня. Покажем, что трех отрицательных корней уравнение (3.3) иметь не может. Действительно, наложим на систему (1.1) связь $\varphi = 0$, тогда механическая система превратится в двухзвенный перевернутый маятник с неподвижной точкой подвеса. Линеаризованная модель такого маятника имеет два положительных собственных значения. Но собственные значения системы, стесненной новой связью, перемежаются с собственными значениями системы в отсутствие этой связи [14]. Поэтому если бы уравнение (3.3) имело три отрицательных корня, то после наложения связи $\varphi = 0$, система имела бы два отрицательных собственных значения, чего не может быть. Следовательно, уравнение (3.3) имеет один отрицательный и два положительных корня. А значит уравнение (3.2) имеет пару чисто мнимых корней, два отрицательных и два положительных.

Если коэффициент вязкого трения $k \ne 0$, но достаточно мал, то характеристическое уравнение линейной системы (2.2) имеет, как и при $k = 0$, два отрицательных и два положительных корня. Силы вязкого трения, приложенные в шарнире ${{S}_{2}}$, являются диссипативными. Однако при этих силах имеет место лишь частичная диссипация и степень неустойчивости при $k \ne 0$ такая же, как и при $k = 0$ [15], т.е. равна двум. В этом случае чисто мнимые при $k = 0$ корни могут либо остаться таковыми при добавлении вязкого трения, либо стать комплексно-сопряженными с отрицательной действительной частью. Ниже будет численно показано, что с добавлением вязкого трения при рассматриваемых значениях параметров системы чисто мнимые корни “превращаются” в комплексно-сопряженные с отрицательной действительной частью.

4. Управляемость системы. Для анализа управляемости системы (2.2) в отсутствие трения (при $k = 0$) воспользуемся критерием управляемости Хаутуса для систем второго порядка [16]. В соответствии с этим критерием для управляемости системы необходимо и достаточно, чтобы для всех комплексных значений ${{\lambda }}$ выполнялось условие

(4.1)
$\operatorname{rank} \left( {\begin{array}{*{20}{c}} {{\mathbf{A}}{{{{\lambda }}}^{2}} + {\mathbf{C}}}&{\mathbf{D}} \end{array}} \right) = 3$

Так как собственные числа системы удовлетворяют характеристическому уравнению (3.1), то для управляемости необходимо и достаточно, чтобы при каждом из собственных чисел системы был полным ранг хотя бы одной из трех матриц, образованных двумя столбцами матрицы ${\mathbf{A}}{{{{\lambda }}}^{2}} + {\mathbf{C}}$ и столбцом D. Тогда достаточное условие управляемости заключается в неравенстве нулю определителя матрицы, составленной из трех последних столбцов матрицы, фигурирующей в соотношении (4.1). Для выписанных выше матриц $A$, $C$ и $D$ этот определитель имеет вид

${{{{\lambda }}}^{4}}\left[ {{{m}_{1}}l{{r}_{1}}{{r}_{2}} + {{m}_{2}}l{{\rho }}_{2}^{2} + {{m}_{1}}({{r}_{1}}{{\rho }}_{2}^{2} - {{r}_{2}}{{\rho }}_{1}^{2} + {{r}_{1}}r_{2}^{2} - {{r}_{2}}r_{1}^{2})} \right]$

Характеристическое уравнение (3.2) не имеет нулевых корней. В этом случае система (2.2) будет управляемой при условии

(4.2)
${{m}_{1}}l{{r}_{1}}{{r}_{2}} + {{m}_{2}}l{{\rho }}_{2}^{2} + {{m}_{1}}\left( {{{r}_{1}}{{\rho }}_{2}^{2} - {{r}_{2}}{{\rho }}_{1}^{2} + {{r}_{1}}r_{2}^{2} - {{r}_{2}}r_{1}^{2}} \right) \ne 0$

Это условие выполняется, в частности, для антропоморфных значений параметров системы, заданных в соответствии с работой [17], и при ограничениях на соотношения размеров seesaw, заданных выше. При этом система (2.2) в отсутствие трения управляема. Поскольку трение и управление входят в уравнения движения в виде суммы, наличие трения не влияет на управляемость системы.

5. Область управляемости системы в жордановых переменных. Запишем линейную систему (2.2) шестого порядка в форме Коши:

(5.1)
$\dot {y} = Fy + LM$

Здесь приняты следующие обозначения:

$y = \left( {\begin{array}{*{20}{c}} {\mathbf{\psi }} \\ {{\mathbf{\dot {\psi }}}} \end{array}} \right),\quad {\text{ }}{\mathbf{F}} = \left( {\begin{array}{*{20}{c}} {\mathbf{0}}&{\mathbf{I}} \\ { - {{{\mathbf{A}}}^{{ - 1}}}{\mathbf{C}}}&{ - {{{\mathbf{A}}}^{{ - 1}}}{\mathbf{B}}} \end{array}} \right),\quad {\mathbf{L}} = \left( {\begin{array}{*{20}{c}} {\mathbf{0}} \\ {{{{\mathbf{A}}}^{{ - 1}}}{\mathbf{D}}} \end{array}} \right)$

Трехмерный столбец $\psi $ выписан через угловые переменные системы в (1.2), ${\mathbf{I}}$ – единичная матрица третьего порядка. Равенство

$y = 0$
описывает в новых переменных равновесное положение (2.1) исходной системы при $M = 0$.

С помощью невырожденного преобразования

(5.2)
$y = Hz$
система (5.1) может быть приведена к жордановым переменным. В этих переменных она будет иметь вид
(5.3)
$\dot {z} = \Lambda z + KM,$
где $\Lambda = {{H}^{{ - 1}}}FH$ – жорданова матрица, а $K = {{H}^{{ - 1}}}L$ – столбец коэффициентов при управляющем моменте $M$. Будем считать, что первые две переменные ${{z}_{1}}$ и ${{z}_{2}}$ в столбце $z$ отвечают двум действительным положительным собственным значениям ${{{{\lambda }}}_{1}}$ и ${{{{\lambda }}}_{2}}$, т.е. они удовлетворяют двум первым скалярным уравнениям системы (5.3), которые имеют вид

(5.4)
${{\dot {z}}_{1}} = {{{{\lambda }}}_{1}}{{z}_{1}} + {{K}_{1}}M,\quad {{\dot {z}}_{2}} = {{{{\lambda }}}_{2}}{{z}_{2}} + {{K}_{2}}M$

В дальнейшем для определенности будем считать, что

(5.5)
${{{{\lambda }}}_{1}} > {{{{\lambda }}}_{2}} > 0$

Обозначим пространство двух переменных ${{z}_{1}}$, ${{z}_{2}}$ через ${{z}_{u}}$. Пространство остальных четырех жордановых переменных ${{z}_{3}}$, ${{z}_{4}}$, ${{z}_{5}}$, ${{z}_{6}}$ обозначим через ${{{\mathbf{z}}}_{s}}$. Собственные значения, отвечающие этим четырем жордановым переменным, расположены в левой полуплоскости комплексной плоскости.

Построим область управляемости подсистемы (5.4) при ограничении (1.5), наложенном на управляющий момент $M$.

При управлении $M \equiv - {{M}_{0}}$ подсистема (5.4) имеет неустойчивую стационарную точку ${{D}_{1}}$, координаты которой

(5.6)
${{z}_{{11}}} = \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{M}_{0}},\quad {{z}_{{21}}} = \frac{{{{K}_{2}}}}{{{{{{\lambda }}}_{2}}}}{{M}_{0}}$

При управлении $M \equiv {{M}_{0}}$ подсистема (5.4) имеет неустойчивую стационарную точку ${{D}_{2}}$ c координатами

(5.7)
${{z}_{{12}}} = - \frac{{{{K}_{1}}}}{{{{{{\lambda }}}_{1}}}}{{M}_{0}},\quad {{z}_{{22}}} = - \frac{{{{K}_{2}}}}{{{{{{\lambda }}}_{2}}}}{{M}_{0}}$

Точки (5.6) и (5.7) симметричны относительно начала координат.

Обозначим через U область управляемости подсистемы (5.4), т.е. множество начальных состояний ${{z}_{1}}(0)$, ${{z}_{2}}(0)$, из которых она может быть приведена в начало координат ${{z}_{1}} = 0,$ ${{z}_{2}} = 0$ при помощи ограниченного условием (1.5) управляющего воздействия $M{\text{(}}t{\text{)}}$. Граница ∂U этого множества состоит из двух проходящих через точки (5.6) и (5.7) интегральных траекторий системы (5.4), полученных при $M = \pm {{M}_{0}}$ [1, 2, 18]. Уравнения одной из этих траекторий, полученные при $M \equiv - {{M}_{0}}$, имеют вид

(5.8)
${{z}_{1}}(t) = - \frac{{{{K}_{1}}}}{{{{{{\lambda }}}_{1}}}}{{M}_{0}}\left( {2{{e}^{{{{{{\lambda }}}_{1}}t}}} - 1} \right),\quad {{z}_{2}}(t) = - \frac{{{{K}_{2}}}}{{{{{{\lambda }}}_{2}}}}{{M}_{0}}\left( {2{{e}^{{{{{{\lambda }}}_{{\text{2}}}}t}}} - 1} \right),\quad \left( { - \infty < t \leqslant 0} \right)$

Эти уравнения записаны в параметрическом виде – параметр t изменяется в пределах: $ - \infty < t \leqslant 0$. Траектория (5.8) начинается при $t = - \infty $ в точке ${{D}_{1}}$ и заканчивается при $t = 0$ в точке ${{D}_{2}}$.

Исключив из системы (5.8) время t, получим уравнение, связывающее переменные ${{z}_{1}}$ и ${{z}_{2}}$ “напрямую”

(5.9)
${{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{1}}}}{{{{K}_{1}}{{M}_{0}}}}{{z}_{1}}} \right)} \right]}^{{{{\lambda }_{2}}}}} = {{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{2}}}}{{{{K}_{2}}{{M}_{0}}}}{{z}_{2}}} \right)} \right]}^{{{{\lambda }_{1}}}}}$

Уравнения другой траектории, полученные при $M \equiv {{M}_{0}}$, имеют вид

(5.10)
${{z}_{1}}(t) = \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{M}_{0}}\left( {2{{e}^{{{{\lambda }_{1}}t}}} - 1} \right),\quad {{z}_{2}}(t) = \frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{M}_{0}}\left( {2{{e}^{{{{\lambda }_{2}}t}}} - 1} \right)\quad \left( { - \infty < t \leqslant 0} \right)$

Траектория (5.10) начинается при $t = - \infty $ в точке ${{D}_{2}}$ и заканчивается при $t = 0$ в точке ${{D}_{1}}$.

Исключив из системы (5.10) время t, получим уравнение, связывающее “напрямую” переменные ${{z}_{1}}$ и ${{z}_{2}}$ на второй половине границы $\partial U$

(5.11)
${{\left[ {\frac{1}{2}\left( {1 + \frac{{{{\lambda }_{1}}}}{{{{K}_{1}}{{M}_{0}}}}{{z}_{1}}} \right)} \right]}^{{{{\lambda }_{2}}}}} = {{\left[ {\frac{1}{2}\left( {1 + \frac{{{{\lambda }_{2}}}}{{{{K}_{2}}{{M}_{0}}}}{{z}_{2}}} \right)} \right]}^{{{{\lambda }_{1}}}}}$

Область управляемости U – симметричное относительно начала координат, открытое множество с двумя угловыми точками на границе. Уравнения (5.8), (5.10) и эквивалентные им уравнения (5.9), (5.11) описывают границу области управляемости не только в двумерном пространстве переменных ${{z}_{u}}$, но и в шестимерном пространстве переменных $z$ системы (5.3), поскольку четырем компонентам вектора ${{z}_{s}}$ отвечают собственные значения с отрицательными действительными частями [18].

Граница ∂U области управляемости U построена на плоскости двух переменных ${{z}_{1}}$, ${{z}_{2}}$ при некоторых численных значениях параметров системы в разделе 8, посвященном численным исследованиям.

Разрешим уравнение (5.2) относительно шестимерного вектора $z$

(5.12)
$z = Gy,\quad G = {{H}^{{ - 1}}}$

Первые два скалярных уравнения системы (5.12), отвечающие переменным ${{z}_{1}}$ и ${{z}_{2}}$, имеют вид

(5.13)
$\begin{gathered} {{z}_{1}} = \sum\limits_{j = 1}^6 {{{g}_{{1j}}}{{y}_{j}}} = {{g}_{{11}}}\varphi + {{g}_{{12}}}{{\alpha }_{1}} + {{g}_{{13}}}{{\alpha }_{2}} + {{g}_{{14}}}\dot {\varphi } + {{g}_{{15}}}{{{\dot {\alpha }}}_{1}} + {{g}_{{16}}}{{{\dot {\alpha }}}_{2}} \\ {{z}_{2}} = \sum\limits_{j = 1}^6 {{{g}_{{2j}}}{{y}_{j}}} = {{g}_{{21}}}\varphi + {{g}_{{22}}}{{\alpha }_{1}} + {{g}_{{23}}}{{\alpha }_{2}} + {{g}_{{24}}}\dot {\varphi } + {{g}_{{25}}}{{{\dot {\alpha }}}_{1}} + {{g}_{{26}}}{{{\dot {\alpha }}}_{2}} \\ \end{gathered} $

Здесь через ${{g}_{{ij}}}$ ($i = 1,\;2$; ${\text{ }}j = 1,\; \ldots {\text{,}}\;{\text{6}}$) обозначены компоненты первых двух строк матрицы $G$.

Рассмотрим трехмерное подпространство переменных $\varphi $, ${{\alpha }_{1}}$, ${{\alpha }_{2}}$, положив скорости $\dot {\varphi },{\text{ }}{{\dot {\alpha }}_{1}},{\text{ }}{{\dot {\alpha }}_{2}}$ равными нулю

$\dot {\varphi } = 0,\quad {{\dot {\alpha }}_{1}} = 0,\quad {{\dot {\alpha }}_{2}} = 0$

Тогда соотношения (5.13) принимают вид

(5.14)
${{z}_{1}} = {{g}_{{11}}}\varphi + {{g}_{{12}}}{{\alpha }_{1}} + {{g}_{{13}}}{{\alpha }_{2}},\quad {{z}_{2}} = {{g}_{{21}}}\varphi + {{g}_{{22}}}{{\alpha }_{1}} + {{g}_{{23}}}{{\alpha }_{2}}$

Подставив координаты ${{z}_{1}}$ и ${{z}_{2}}$ какой-то точки $\left( {{{z}_{1}},{{z}_{2}}} \right) \in \partial U$ в левые части уравнений (5.14), получим уравнения двух плоскостей, расположенных в трехмерном пространстве переменных – углов $\varphi $, ${{\alpha }_{1}}$, ${{\alpha }_{2}}$. Пересечение этих двух плоскостей представляет собой прямую линию. Следовательно, каждой точке $\left( {{{z}_{1}},{{z}_{2}}} \right) \in \partial U$, отвечает в пространстве трех переменных $\varphi $, ${{\alpha }_{1}}$, ${{\alpha }_{2}}$ прямая линия. Все эти прямые, параллельные одна другой, образуют цилиндрическую поверхность, направляющая которой представляет собой “образ” границы $\partial U$. Нетрудно выписать уравнения, которым удовлетворяют точки ($\varphi $, ${{\alpha }_{1}}$, ${{\alpha }_{2}}$) этой направляющей.

6. Синтез управления, стабилизирующего неустойчивое положение равновесия. При $M \equiv 0$ система уравнений (5.4) имеет решение

(6.1)
${{z}_{1}} \equiv 0,\quad {{z}_{2}} \equiv 0$

Это тривиальное решение при $M \equiv 0$ неустойчиво, поскольку собственные значения ${{{{\lambda }}}_{1}}$ и ${{{{\lambda }}}_{2}}$ системы (5.4) положительны (см. неравенства (5.5)).

С целью стабилизации решения (6.1) системы (5.4) при учете ограничения (1.5) на управляющий момент M построим линейную обратную связь по неустойчивым переменным ${{z}_{1}}$ и ${{z}_{2}}$:

(6.2)
$M = \left\{ {\begin{array}{*{20}{l}} { - {{M}_{0}}\quad {\text{при}}\quad {{{{\gamma }}}_{1}}{{z}_{1}} + {{{{\gamma }}}_{2}}{{z}_{2}} < - {{M}_{0}}} \\ {{{{{\gamma }}}_{1}}{{z}_{1}} + {{{{\gamma }}}_{2}}{{z}_{2}}\quad {\text{при}}\quad \left| {{{{{\gamma }}}_{1}}{{z}_{1}} + {{{{\gamma }}}_{2}}{{z}_{2}}} \right| \leqslant {{M}_{0}}} \\ {{{M}_{0}}\quad {\text{при}}\quad {{{{\gamma }}}_{1}}{{z}_{1}} + {{{{\gamma }}}_{2}}{{z}_{2}} > {{M}_{0}}} \end{array}} \right.$

Постоянные коэффициенты ${{\gamma }_{1}}$ и ${{\gamma }_{2}}$ в выражении (6.2) выберем так, чтобы обеспечить асимптотическую устойчивость решения (6.1).

Запишем уравнение прямой, проходящей через угловые точки ${{D}_{1}}$ и ${{D}_{2}}$ границы $\partial U$ области управляемости U:

$\frac{{{{K}_{2}}}}{{{{{{\lambda }}}_{2}}}}{{z}_{1}} - \frac{{{{K}_{1}}}}{{{{{{\lambda }}}_{1}}}}{{z}_{2}} = 0$

В законе управления (6.2) выберем коэффициенты обратной связи ${{{{\gamma }}}_{1}}$ и ${{{{\gamma }}}_{2}}$ следующим образом:

(6.3)
${{{{\gamma }}}_{1}} = {{\gamma }}\frac{{{{K}_{2}}}}{{{{{{\lambda }}}_{2}}}},\quad {{{{\gamma }}}_{2}} = - {{\gamma }}\frac{{{{K}_{1}}}}{{{{{{\lambda }}}_{1}}}}$
где ${{\gamma }}$ – подлежащая определению величина, которую в дальнейшем будем называть “общий коэффициент обратной связи”. Выражение (6.2) для управления M при обозначениях (6.3) можно записать следующим образом:
(6.4)
$M = \left\{ \begin{gathered} - {{M}_{0}}\quad {\text{при}}\quad {{M}_{*}} < - {{M}_{0}} \hfill \\ {{M}_{*}}\quad {\text{при}}\quad \left| {{{M}_{*}}} \right| \leqslant {{M}_{0}} \hfill \\ {{M}_{0}}\quad {\text{при}}\quad {{M}_{*}} > {{M}_{0}} \hfill \\ \end{gathered} \right.,$
где

(6.5)
${{M}_{*}} = {{\gamma }}\left( {\frac{{{{K}_{2}}}}{{{{{{\lambda }}}_{2}}}}{{z}_{1}} - \frac{{{{K}_{1}}}}{{{{{{\lambda }}}_{1}}}}{{z}_{2}}} \right)$

Система уравнений (5.4) при подстановке в нее выражения для линейной обратной связи $M = {{M}_{*}}$ (см. формулу (6.5)) принимает вид:

(6.6)
$\begin{gathered} {{{\dot {z}}}_{{\text{1}}}} = \left( {{{{{\lambda }}}_{{\text{1}}}} + \frac{{\gamma {{K}_{1}}{{K}_{2}}}}{{{{\lambda }_{2}}}}} \right){{z}_{{\text{1}}}} - \frac{{\gamma K_{1}^{2}}}{{{{\lambda }_{1}}}}{{z}_{2}} \hfill \\ {{{\dot {z}}}_{{\text{2}}}} = \frac{{\gamma K_{2}^{2}}}{{{{\lambda }_{2}}}}{{z}_{1}} + \left( {{{{{\lambda }}}_{2}} - \frac{{\gamma {{K}_{1}}{{K}_{2}}}}{{{{\lambda }_{1}}}}} \right){{z}_{2}} \hfill \\ \end{gathered} $

Характеристическое уравнение системы (6.6) записывается следующим образом:

(6.7)
${{{{\lambda }}}^{2}} + {{\lambda }}\left[ {{{\gamma }}{{K}_{1}}{{K}_{2}}\left( {\frac{1}{{{{{{\lambda }}}_{1}}}} - \frac{1}{{{{{{\lambda }}}_{2}}}}} \right) - {{{{\lambda }}}_{1}} - {{{{\lambda }}}_{2}}} \right] + {{{{\lambda }}}_{1}}{{{{\lambda }}}_{2}} = 0$

Нулевое решение (6.1) системы (6.6) асимптотически устойчиво при условии, что корни характеристического уравнения (6.7) располагаются в левой полуплоскости комплексной плоскости. Для этого необходимо и достаточно, чтобы коэффициент при первой степени величины $\lambda $ в уравнении (6.7) был положительным. Учитывая неравенства (5.5), заключаем, что коэффициент обратной связи $\gamma $ должен удовлетворять условию

(6.8)
$\left| {{\gamma }} \right| > {{{{\gamma }}}_{*}},\quad \operatorname{sign} {{\gamma }} = - \operatorname{sign} \left( {{{K}_{1}}{{K}_{2}}} \right)$
где

${{\gamma }_{*}} = \frac{{{{\lambda }_{{\text{1}}}}{{\lambda }_{{\text{2}}}}\left( {{{\lambda }_{{\text{1}}}} + {{\lambda }_{{\text{2}}}}} \right)}}{{\left| {{{K}_{1}}{{K}_{2}}} \right|\left( {{{\lambda }_{1}} - {{\lambda }_{2}}} \right)}}$

Выражение (6.5) для момента ${{M}_{*}}$ можно переписать в исходных переменных следующим образом:

$\begin{gathered} {{M}_{*}} = \gamma \left[ {\left( {\frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{g}_{{11}}} - \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{g}_{{21}}}} \right)\varphi + \left( {\frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{g}_{{12}}} - \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{g}_{{22}}}} \right){{\alpha }_{1}} + \left( {\frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{g}_{{13}}} - \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{g}_{{23}}}} \right){{\alpha }_{2}} + } \right. \\ \left. { + \;\left( {\frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{g}_{{14}}} - \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{g}_{{24}}}} \right)\dot {\varphi } + \left( {\frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{g}_{{15}}} - \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{g}_{{25}}}} \right){{{\dot {\alpha }}}_{1}} + \left( {\frac{{{{K}_{2}}}}{{{{\lambda }_{2}}}}{{g}_{{16}}} - \frac{{{{K}_{1}}}}{{{{\lambda }_{1}}}}{{g}_{{26}}}} \right){{{\dot {\alpha }}}_{2}}} \right] \\ \end{gathered} $

7. Область притяжения системы. Система второго порядка (5.4) не может быть приведена в состояние равновесия (6.1) при помощи ограниченного условием (1.5) управления, если ее начальное состояние расположено вне построенной выше области управляемости $U$. Поэтому область притяжения P состояния равновесия (6.1) системы (5.4) при ограниченном управлении (6.4), (6.5) принадлежит ограниченной на плоскости ${{z}_{1}}{{z}_{2}}$ области управляемости U: $P \subset U$.

Покажем, что границей области притяжения P является предельный цикл – периодическая траектория системы (5.4), (6.4), (6.5). Нетрудно убедиться в том, что в области $U$ начало координат (6.1) является единственным на плоскости переменных ${{z}_{1}}{{z}_{2}}$ состоянием равновесия системы (5.4) с управлением (6.4), (6.5). При значениях коэффициента обратной связи $\gamma $, удовлетворяющих условию (6.8), начало координат (6.1) является притягивающей точкой, т.е. асимптотически устойчивым состоянием равновесия системы (5.4), (6.4), (6.5). Поэтому существует такая окрестность ${{Q}_{{{{z}_{1}}{{z}_{2}}}}}$ точки (6.1), что все решения системы (5.4), (6.4), (6.5), начинающиеся из точек этой окрестности ${{Q}_{{{{z}_{1}}{{z}_{2}}}}}$, стремятся при $t \to \infty $ в начало координат (6.1). Выберем какую-то точку из окрестности ${{Q}_{{{{z}_{1}}{{z}_{2}}}}}$ и при условии (6.8) построим в обратном времени решение системы (5.4), (6.4), (6.5), начинающееся из этой точки. Траектория, отвечающая этому решению, остается все время в ограниченной области управляемости $U$. При этом она не стремится к какому-нибудь состоянию равновесия, а значит [19] при $t \to - \infty $ она стремится к предельному циклу, наматываясь на него изнутри. Этот предельный цикл охватывает единственную особую точку системы – начало координат [19, 20]. Построенный цикл и представляет собой границу области притяжения P. Этот цикл является неустойчивым в прямом времени.

Проанализируем теперь поведение четырех переменных вектора ${{{\mathbf{z}}}_{s}}$, которые соответствуют собственным значениям, расположенным в левой полуплоскости комплексной плоскости. Выберем любое конечное значение ${{\gamma }}$, удовлетворяющее условию (6.8). Ему отвечает управление вида (6.4), (6.5) и некоторая расположенная на плоскости переменных ${{z}_{1}}$, ${{z}_{2}}$ область притяжения P. Возьмем произвольное начальное состояние

(7.1)
${{z}_{1}}\left( 0 \right),{{z}_{2}}(0) \in P$

Управление (6.4), (6.5), построенное при выбранном значении ${{\gamma }}$, обеспечивает стремление к нулю при $t \to \infty $ решения системы (5.4) с начальными условиями (7.1). Но если ${{z}_{1}}\left( t \right) \to {\text{0}}$, ${{z}_{2}}\left( t \right) \to 0$, то стремится к нулю и управляющий сигнал ${{M}_{*}}$, поскольку он представляет собой линейную комбинацию переменных ${{z}_{1}}$, ${{z}_{2}}$ (см. выражение (6.5)). Вектор переменных ${{z}_{s}}$, как и все шесть жордановых переменных, описываются неоднородными линейными дифференциальными уравнениями с постоянными коэффициентами. Неоднородные члены в этих уравнениях пропорциональны управляющему моменту $M$ и при $t \to \infty $ стремятся к нулю вместе с сигналом ${{M}_{*}}$. Отсюда вытекает [21], что ${{{\mathbf{z}}}_{s}}{\text{(}}t{\text{)}} \to 0$ при $t \to \infty $, какими бы ни были начальные условия ${{z}_{s}}{\text{(0)}}$.

Таким образом, ограниченное по абсолютной величине управление (6.4), (6.5) обеспечивает асимптотическую устойчивость тривиального решения $z = 0$ системы (5.3), а значит и решения (2.1) исходной линеаризованной системы (2.2). При построенном управлении асимптотически устойчивым будет и равновесное положение (2.1) исходной нелинейной системы (1.3).

8. Численные исследования. Численные исследования проводились при следующих значениях параметров системы

(8.1)
$\begin{gathered} {{m}_{1}} = 40\;{\text{кг,}}\quad {{m}_{2}} = 60\;{\text{кг,}}\quad l = 0.4\;{\text{м,}}\quad {{r}_{1}} = 0.2\;{\text{м,}}\quad {{r}_{2}} = 0.25\;{\text{м,}} \\ {{{{\rho }}}_{1}} = 0.16\;{\text{м}},\quad {{{{\rho }}}_{2}} = 0.2\;{\text{м}},\quad m = 2.2\;{\text{кг}},\quad R = 0.45\;{\text{м}}, \\ h = 0.38\;{\text{м,}}\quad r = 0.41\;{\text{м}},\quad {{\rho }} = 0.12\;{\text{м}},\quad k = 5\;{\text{Нмс}}. \\ \end{gathered} $

При расчетах рассмотрено такое же ограничение на величину момента, как и в статье [8] – ${{M}_{0}} = 31$ Нм. При значениях (8.1) параметров системы комплексные собственные значения имеют отрицательные действительные части, а положительные собственные числа оказываются следующими:

${{\lambda }_{1}} = {\text{0}}{\text{.69}}\;{{с}^{{ - 1}}},\quad {{\lambda }_{2}} = {\text{0}}{\text{.24}}\;{{с}^{{ - 1}}}$

При численных значениях (8.1) параметров с помощью соотношений (5.8), (5.10) построена граница $\partial U$ области управляемости $U$. Эта граница вместе с угловыми точками ${{D}_{1}}$ и ${{D}_{2}}$, найденными по формулам (5.6), (5.7), показана на рис. 2.

Рис. 2.

Граница $\partial U$ области управляемости $U$ системы (5.4) (сплошная линия) и граница области притяжения $P$ этой системы с управлением (6.4), (6.5) при ${{\gamma }} = 2{{{{\gamma }}}_{*}}$ (штрихпунктирная линия). Пунктирная кривая – проекция одной из траекторий системы на плоскость ${{z}_{1}}{{z}_{2}}$ при начальных условиях, близких к границе области $P$.

Граница области притяжения $P$ представляет собой двояко-устойчивый в обратном времени периодический цикл. Она построена на рис. 2 путем решения в обратном времени дифференциальных уравнений (5.4) с управлением (6.4), (6.5) при значении ${{\gamma }} = 2{{\gamma }_{*}}$ (${{{{\gamma }}}_{*}} = 47$), удовлетворяющем условию (6.8).

Как и следовало ожидать [1, 2], численные исследования, проведенные при значениях (8.1) параметров системы, показывают, что область притяжения $P$ охватывает тем бóльшую часть области управляемости $U$, чем больше по модулю значение общего коэффициента обратной связи ${{\gamma }}$. При этом $P \to U$, если $\left| {{\gamma }} \right| \to \infty $. Если, например, ${{\gamma }} = - 20{{{{\gamma }}}_{*}}$, то границы области управляемости и области притяжения неразличимы на глаз. Таким образом, при “больших” значениях коэффициента $\gamma $ граница области притяжения $P$ “близка” к границе $\partial U$ области управляемости $U$. Тем самым, при “больших” значениях коэффициента $\gamma $ область управляемости $U$ может служить “хорошей” оценкой области притяжения $P$.

Итак, путем приведения линеаризованной системы к жордановым переменным можно построить ограниченное управление, обеспечивающее для линеаризованной системы область притяжения, близкую к максимально возможной. Можно надеяться, что такой прием позволяет и для нелинейной системы реализовать “большую” область притяжения.

Для оценки размеров области управляемости в пространстве исходных переменных – углов $\varphi $, ${{\alpha }_{1}}$, ${{\alpha }_{2}}$ используем формулы (5.9), (5.11), а также соотношения (5.14). Найдем интервалы допустимых, с точки зрения устойчивости, значений углов $\varphi \left( 0 \right)$, ${{\alpha }_{1}}\left( 0 \right)$, ${{\alpha }_{2}}\left( 0 \right)$. При отыскании интервала для каждого угла будем полагать равными нулю два других угла, а также все угловые скорости. Концы искомых интервалов обозначим через $ \pm {{\varphi }_{{\sup }}}$, $ \pm {{\alpha }_{1}}_{{\sup }}$, $ \pm {{\alpha }_{2}}_{{\sup }}$.

Для отыскания величин ${{\varphi }_{{\sup }}}$, ${{\alpha }_{{1\sup }}}$, ${{\alpha }_{{2\sup }}}$ используем уравнения:

${{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{1}}{{g}_{{{\text{11}}}}}}}{{{{K}_{1}}{{M}_{0}}}}{{\varphi }_{{\sup }}}} \right)} \right]}^{{{{\lambda }_{2}}}}} = {{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{2}}{{{\text{g}}}_{{{\text{21}}}}}}}{{{{K}_{2}}{{M}_{0}}}}{{\varphi }_{{\sup }}}} \right)} \right]}^{{{{\lambda }_{1}}}}}$
${{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{1}}{{g}_{{{\text{12}}}}}}}{{{{K}_{1}}{{M}_{0}}}}{{\alpha }_{{1\sup }}}} \right)} \right]}^{{{{\lambda }_{2}}}}} = {{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{2}}{{{\text{g}}}_{{{\text{22}}}}}}}{{{{K}_{2}}{{M}_{0}}}}{{\alpha }_{{1\sup }}}} \right)} \right]}^{{{{\lambda }_{1}}}}}$
${{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{1}}{{{\text{g}}}_{{{\text{13}}}}}}}{{{{K}_{1}}{{M}_{0}}}}{{\alpha }_{{2\sup }}}} \right)} \right]}^{{{{\lambda }_{2}}}}} = {{\left[ {\frac{1}{2}\left( {1 - \frac{{{{\lambda }_{2}}{{{\text{g}}}_{{{\text{23}}}}}}}{{{{K}_{2}}{{M}_{0}}}}{{\alpha }_{{2\sup }}}} \right)} \right]}^{{{{\lambda }_{1}}}}},$
полученные из равенства (5.9) с использованием соотношений (5.14). Решая каждое из этих трех уравнений при численных значениях (8.1) параметров, получаем ${{\varphi }_{{\sup }}} = 5.5^\circ $, ${{\alpha }_{{1\sup }}} = 0.46^\circ $, ${{\alpha }_{{2\sup }}} = 1.1^\circ $.

На рис. 3 с использованием численных значений (8.1) параметров системы построена в пространстве переменных $\varphi $, ${{\alpha }_{1}}$, ${{\alpha }_{2}}$ цилиндрическая поверхность, ограничивающая множество начальных положений $\varphi \left( 0 \right)$, ${{\alpha }_{1}}\left( 0 \right)$, ${{\alpha }_{2}}\left( 0 \right)$ линеаризованной системы, из которых она может быть приведена в положение равновесия при нулевых начальных скоростях.

Рис. 3.

Граница области начальных положений линеаризованной системы, из которых она может быть приведена в равновесие при нулевых начальных скоростях.

Отметим, что при φ(0) = 0 и нулевых начальных угловых скоростях, начальные значения углов ${{\alpha }_{1}}$ и ${{\alpha }_{2}}$, принадлежащих области управляемости, могут достигать значений порядка $ \pm 1^\circ $ и $ \mp 3^\circ $ соответственно. Однако такие допустимые отклонения углов ${{\alpha }_{1}}$ и ${{\alpha }_{2}}$ не являются независимыми, а, как следует из соотношений (5.14) и из рассмотрения рис. 3, при этих углах одновременно имеют место разнонаправленные отклонения звеньев маятника от вертикали.

Численное интегрирование нелинейной системы (1.3) с управлением (6.4), (6.5) в “окрестности” границы области притяжения затруднено из-за неустойчивости решения. Тем не менее, такое численное интегрирование позволяет оценить положение границы области притяжения. Полученная оценка показывает, что граница этой области для нелинейной системы (1.3) несколько ближе к началу координат, чем подобная граница для линеаризованной системы (2.2) с тем же управлением. Но различие в координатах точек, лежащих на этих границах, для значений (8.1) параметров системы составляет всего 2–4%, что объясняется малостью значений, которые принимают в области притяжения угловые переменные.

Заключение. В статье рассматривается задача стабилизации вертикального положения опрокинутого двухзвенного маятника, закрепленного шарнирно на качелях seesaw. Желаемое положение равновесия системы неустойчиво, его степень неустойчивости равна двум. Задача стабилизации равновесного состояния осложняется еще и тем, что число степеней свободы системы равно трем, а управляющее воздействие в ней только одно – момент сил, приложенных в межзвенном шарнире маятника. Таким образом, в системе имеет место дефицит числа управляющих воздействий. Помимо этого, управляющий момент ограничен по абсолютной величине. При ограниченных таким образом ресурсах управления неустойчивую систему можно вывести на желаемый режим работы не из всех начальных состояний.

Прежде всего, в статье для системы, линеаризованной около неустойчивого состояния равновесия, построена на плоскости двух неустойчивых жордановых переменных область управляемости, занимающая ограниченную часть этой плоскости. Получены формулы, позволяющие при заданных значениях параметров системы вычислить значения каждого из углов или каждой из угловых скоростей в отдельности, или некоторых их сочетаний, при которых система находится на границе области управляемости. Построена линейная с насыщением обратная связь по двум неустойчивым переменным, стабилизирующая желаемое состояние равновесия. При этой обратной связи все ресурсы управления используются для подавления неустойчивых мод движения. Область притяжения равновесного состояния системы ограничена неустойчивым предельным циклом и целиком принадлежит области управляемости. С ростом общего коэффициента обратной связи область притяжения расширяется, и ее граница приближается к границе области управляемости. В статье рассматривается пример с заданными численно значениями параметров. В этом примере для линеаризованной системы с “большим” коэффициентом обратной связи получены оценки диапазона значений каждого из трех углов, при которых замкнутая система стремится к положению равновесия. Численное интегрирование исходной системы нелинейных уравнений с учетом такой же обратной связи показывает, что допустимые, с точки зрения устойчивости, значения тех же углов “мало” отличаются от полученных для линеаризованной системы. В рассматриваемом примере область притяжения в исходной нелинейной системе “близка” к области притяжения в линеаризованной системе.

Таким образом, представляется целесообразным при рассмотрении задачи синтеза управления неустойчивой системой построить, используя, например, описанный здесь способ, управление, которое обеспечивает желаемую область притяжения для линеаризованной системы. Если при этом окажется, что область притяжения в исходной нелинейной системе при построенном управлении близка к области притяжения в линеаризованной системе, то построенное управление может быть использовано в исходной нелинейной системе.

Публикация частично подготовлена в рамках реализации Программы создания и развития научного центра мирового уровня “Сверхзвук” на 2020–2025 годы при финансовой поддержке Минобрнауки России (Распоряжение правительства РФ от 24 октября 2020 № 2744-p).

Список литературы

  1. Формальский А.М. Управление движением неустойчивых объектов. М.: Физматлит, 2012. 232 с.

  2. Formalskii A.M. Stabilization and Motion Control of Unstable Objects. Berlin/Boston: Walter de Gruyter, 2015. 240 p.

  3. Ivanenko Y.P., Levik Y.S., Talis V.L., Gurfinkel V.S. Human equilibrium on unstable support: the importance of feet-support interaction // Neurosci. Lett. 1997. V. 235. P. 109–112.

  4. Guillou E., Dupui P., Golomer E. Dynamic balance sensory motor control and symmetrical or asymmetrical equilibrium training // Clinical Neurophys. 2007. V. 118. P. 317–324.

  5. Carvalho R.L., Almeidai G.L. Assessment of postural adjustments in persons with intellectual disability during balance on the seesaw // J. Intell. Disabil. Res. 2009. V. 53. Pt. 4. P. 389–395.

  6. Rougier P., Mathias M., Tanzi A. Short-term effects on postural control can be evidenced using a seesaw // Neurosci. Lett. 2011. V. 488. P. 133–137.

  7. Николаев Р.Ю., Мельников А.А., Викулов А.Д. Особенности поддержания устойчивости вертикальной позы на фоне утомления мышц верхних и нижних конечностей у борцов // Изв. ЮФУ. Технич. науки. 2012. № 9. С. 251–256.

  8. Гугаев К.В., Кручинин П.А., Формальский А.М. Модель удержания человеком равновесия на подвижной опоре в виде пресс-папье // ПММ. 2016. V. 80. № 4. С. 450–460.

  9. Кручинин П.А., Сакаев Р.М. Об учете расположения голеностопного сустава в модели удержания человеком равновесия на подвижной опоре в виде пресс-папье // ХII Всеросс. съезд по фундам. проблемам теоретич. и прикл. мех. Аннотации докладов. РИЦ БашГУ Уфа, 2019. С. 316.

  10. Nashner L.M., McCollum G. The organization of human postural movements: A formal basis and experimental synthesis // Behav.&Brain Sci. 1985. V. 8. № 1. P. 135–150.

  11. Suissa D., Gunther M., Shapiro A. at al. On laterally perturbed human stance: experiment, model, and control // Hindawi Appl. Bionics&Biomech. 2018. Article ID 4767624. 20 p.

  12. Han K.S., Shin S.H., Yu Ch.H., Kwon T.K. Postural responses during the various frequencies of anteroposterior perturbation // Bio-Medical Mater.&Engng. 2014. V. 24. P. 2537–2545.

  13. Формальский А.М. Перемещение антропоморфных механизмов. М.: Наука, 1984. 368 с.

  14. Четаев Н.Г. Устойчивость движения. М.: Наука, 1965. 176 с.

  15. Козлов В.В. Замечания о степени неустойчивости // ПММ. 2010. Т. 74. № 1. С. 18–21.

  16. Каленова В.И., Морозов В.М. Линейные нестационарные системы и их приложения к задачам механики. М.: Физматлит, 2010. 208 с.

  17. Зациорский В.М., Аруин А.С., Селуянов В.Н. Биомеханика двигательного аппарата человека. М.: Физкультура и спорт, 1981. 143 с.

  18. Формальский А.М. Управляемость и устойчивость систем с ограниченными ресурсами. М.: Наука, 1974. 368 с.

  19. Немыцкий В.В., Степанов В.В. Качественная теория дифференциальных уравнений. М.: Едиториал УРСС, 2004. 552 с.

  20. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. М.: Физматгиз, 1959. 916 с.

  21. Демидович Б.П. Лекции по математической теории устойчивости. М.: Наука, 1967. 472 с.

Дополнительные материалы отсутствуют.