Известия РАН. Теория и системы управления, 2022, № 4, стр. 22-30
УПРАВЛЕНИЕ АМПЛИТУДОЙ КОЛЕБАНИЙ МЕХАНИЧЕСКИХ СИСТЕМ
Ю. Ф. Голубев *
Институт прикладной математики им. М.В. Келдыша РАН
Москва, Россия
* E-mail: golubev@keldysh.ru
Поступила в редакцию 26.01.2022
После доработки 31.01.2022
Принята к публикации 28.03.2022
- EDN: KSPRLT
- DOI: 10.31857/S0002338822040084
Аннотация
Предложен оригинальный метод поиска оптимального управления амплитудой колебаний в окрестности положения равновесия склерономной многомерной механической системы. Одна степень свободы системы не поддается непосредственному управлению. На ее движение влияют другие, непосредственно управляемые степени свободы. В число непосредственно управляемых могут входить как позиционные, так и циклические координаты. Метод не содержит сопряженных переменных в смысле принципа максимума Л.С. Понтрягина и не увеличивает размерность анализируемой исходной системы дифференциальных уравнений. На примере конкретной маятниковой системы продемонстрирована эффективность применения предложенного метода.
Введение. Задачи управления амплитудой нелинейных колебаний представляют издавна значительный интерес для исследований как с теоретической, так и с практической точек зрения. К настоящему времени существует развитая теория резонансного возбуждения колебаний, которая широко используется в практических приложениях [1, 2]. Проблема построения оптимального управления как для линейных, так и для нелинейных колебательных систем имеет существенные отличия от резонансных постановок. Она часто ставится и исследуется в рамках принципа максимума Л.С. Понтрягина [3, 4]. Среди колебательных систем особый интерес вызывают колебательные системы с дефицитом управления, когда система содержит степени свободы, для которых невозможно непосредственное управление, а их требуемое изменение достигается опосредованно за счет подходящего управления по другим степеням свободы [5, 6]. Примеры решения некоторых задач с дефицитом управления системами, находящимися в окрестности положения равновесия и содержащими одну неуправляемую степень свободы, можно найти в [7–10]. Как следует из указанных работ, системы могут быть весьма непростыми. На первоначальном этапе исследования таких систем представляется разумным выбрать координаты управляемых степеней свободы в качестве функций управления, считая, что возможна их идеальная реализация. Основная трудность применения принципа максимума Понтрягина в таком случае состоит в том, что координаты управляемых степеней свободы, как правило, входят в уравнения движения вместе со своими производными. Из-за этого размерность фазового пространства может быть уменьшена лишь на число управляемых координат системы, что может быть недостаточно для эффективного решения задачи по методу Понтрягина.
В предлагаемой статье для решения задач оптимального управления колебаниями позиционных систем с дефицитом управления по одной степени свободы развивается оригинальный метод оптимизации, формализм которого основан на подходе Д.Е. Охоцимского, Т.М. Энеева [11] к решению проблем оптимального управления. Метод позволяет получить решение в виде синтеза управления колебаниями в классе кусочно-непрерывных управляющих координат в зависимости от неуправляемой координаты. Управление колебаниями понимается в смысле увеличения или уменьшения амплитуды колебаний, которая служит критерием оптимальности.
1. Постановка проблемы. Рассмотрим склерономную голономную механическую систему с кинетической энергией
(1.1)
$\frac{d}{{dt}}\left( {\frac{{\partial T}}{{\partial {{{\dot {q}}}_{i}}}}} \right) - \frac{{\partial T}}{{\partial {{q}_{i}}}} = {{Q}_{i}},\quad i = \overline {1,n} ,$Обобщенную силу ${{Q}_{1}}$ будем считать позиционной в том смысле, что она может зависеть только от x и других обобщенных координат, а от обобщенных скоростей не зависит. Пусть первыми в наборе $({{q}_{2}},...,{{q}_{n}})$ идут $s - 1$ координат, от которых обобщенная сила ${{Q}_{1}}$ зависит явно. Остальные $(n - s)$ координат не входят явно в выражение для ${{Q}_{1}}$. Все координаты переобозначим: ${{u}_{j}} = {{q}_{{j + 1}}}$, $j = \overline {1,s - 1} $ и ${{w}_{k}} = {{q}_{{s + k}}}$, $k = \overline {1,n - s} $, причем ${\mathbf{u}} = ({{u}_{1}},...,{{u}_{{s - 1}}}) \in {{R}^{{s - 1}}}$ – вектор координат, непосредственно влияющих на значение ${{Q}_{1}}$, ${\mathbf{w}} = ({{w}_{1}},...,{{w}_{{n - s}}}) \in {{R}^{{n - s}}}$ – вектор координат, от которых ${{Q}_{1}}$ явно не зависит, так что $\partial {{Q}_{1}}{\text{/}}\partial {{w}_{k}} = 0,$ $k = \overline {1,n - s} $. В число w-координат могут входить, например, циклические координаты. Кинетическая энергия примет вид
В системе (1.1) выделим уравнение для координаты x:
(1.2)
$\frac{d}{{dt}}\left( {{{a}_{{11}}}\dot {x} + \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}} + \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}} } \right) - \frac{{\partial T}}{{\partial x}} = F(x,{\mathbf{u}}),$(1.3)
$\dot {x}\frac{d}{{dx}}\left[ {f(x,{\mathbf{y}})\dot {x}} \right] - p(x,{\mathbf{y}}){{\dot {x}}^{2}} = F(x,{\mathbf{u}}),$Будем считать, что векторы ${\mathbf{u}} = {\mathbf{u}}(x)$, ${\mathbf{w}} = {\mathbf{w}}(x)$ каким-либо образом назначены и ограничены:
(1.4)
$\begin{array}{*{20}{c}} {\left| {u_{j}^{m} \leqslant {{u}_{j}}(x) \leqslant u_{j}^{M}} \right|,} \\ {\left| {\dot {u}_{j}^{m} \leqslant {{{\dot {u}}}_{j}}(x) \leqslant \dot {u}_{j}^{M}} \right|,} \end{array},\quad \begin{array}{*{20}{c}} {\left| {w_{k}^{m} \leqslant {{w}_{k}}(x) \leqslant w_{k}^{M}} \right|,} \\ {\left| {\dot {w}_{k}^{m} \leqslant {{{\dot {w}}}_{k}}(x) \leqslant \dot {w}_{k}^{M}} \right|,} \end{array}\quad j = \overline {1,s - 1} ,\quad k = \overline {1,n - s} .$Эти вектор-функции будем рассматривать как функции управления системой. Тогда обобщенные силы ${{Q}_{2}},...,{{Q}_{n}}$ вычисляются в соответствии с уравнениями (1.1) таким образом, чтобы указанные вектор-функции ${\mathbf{u}}(x)$, ${\mathbf{w}}(x)$ реализовались. Предположим, что это сделано, так что ограничения (1.4) удовлетворяются, и можно написать уравнение
(1.5)
$\int\limits_{{{x}_{0}}}^x {\lambda \left\{ {F(x,{\mathbf{u}}) + p(x,{\mathbf{y}}){{{\dot {x}}}^{2}} - \dot {x}\frac{d}{{dx}}\left[ {f(x,{\mathbf{y}})\dot {x}} \right]} \right\}} dx = 0,$(1.6)
$\lambda = f(x,{\mathbf{y}})\exp \left( { - \int\limits_{{{x}_{0}}}^x {\frac{{2p(x,{\mathbf{y}})}}{{f(x,{\mathbf{y}})}}dx} } \right),\quad f(x,{\mathbf{y}}) \ne 0.$Тогда равенство (1.5) можно преобразовать к виду
(1.7)
$\int\limits_{{{x}_{0}}}^x {\lambda F(x,{\mathbf{u}})dx} = \frac{1}{2}\left. {\left[ {f{\kern 1pt} *(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})\lambda {\kern 1pt} *(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})} \right]} \right|_{{{{x}_{0}}}}^{x},$(1.8)
$\begin{array}{*{20}{c}} {f{\kern 1pt} *(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{\dot {w}}}) = {{a}_{{11}}}\dot {x} + \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}} + \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}} ,} \\ {\lambda {\kern 1pt} *(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}}) = f{\kern 1pt} *(x,\dot {x},{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})\exp \left( { - \int\limits_{{{x}_{0}}}^x {\frac{{2p(x,{\mathbf{y}})}}{{f(x,{\mathbf{y}})}}dx} } \right).} \end{array}$В том случае, когда $\dot {x} = \dot {x}(x)$ обращается в нуль, интеграл в левой части равенства (1.7) становится несобственным из-за того, что при $\dot {x} = 0$ значения ${\mathbf{u}}{\kern 1pt} ' = {\mathbf{\dot {u}}}{\text{/}}\dot {x}$ и ${\mathbf{w}}{\kern 1pt} ' = {\mathbf{\dot {w}}}{\text{/}}\dot {x}$ могут стать бесконечно большими. Однако та же формула (1.7) показывает, что этот интеграл существует и принимает конечное значение. Заметим, что переменные $f{\kern 1pt} *$ и $\lambda {\kern 1pt} *$ не содержат отмеченной особенности.
Предположим, что силовая функция
имеет изолированный максимум по координате $x$ при ${\mathbf{u}}(\tau ) \equiv 0$ и этот максимум остается изолированным, когда ${\mathbf{u}}(\tau )$ меняется. Будем рассматривать движение в окрестности этого максимума. Пусть начальные условия выбраны так, что равенство ${{\dot {x}}_{0}} = \dot {x}({{x}_{0}}) = 0$ выполнено, когда $x = {{x}_{0}}$. Назовем амплитудой колебаний величину $J = {{x}_{1}} - {{x}_{0}}$, где ${{x}_{1}} > {{x}_{0}}$ – следующее значение координаты x, когда ${{\dot {x}}_{1}} = \dot {x}({{x}_{1}})$ обращается в ноль. В этом случае аргумент изолированного максимума силовой функции $U(x,{\mathbf{u}}( \cdot ))$ будет принадлежать отрезку $[{{x}_{0}},{{x}_{1}}]$. В общем случае этот аргумент может меняться в зависимости от выбранных вектор-функций ${\mathbf{u}}(x)$, ${\mathbf{w}}(x)$. На концах отрезка должно быть выполнено а также(1.11)
$\begin{array}{*{20}{c}} {f{\kern 1pt} *({{x}_{0}},{{{\dot {x}}}_{0}},{\mathbf{u}}({{x}_{0}}),{\mathbf{\dot {u}}}({{x}_{0}}),{\mathbf{w}}({{x}_{0}}),{\mathbf{\dot {w}}}({{x}_{0}})) = \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}({{x}_{0}})} + \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}({{x}_{0}}),} } \\ {f{\kern 1pt} *({{x}_{1}},{{{\dot {x}}}_{1}},{\mathbf{u}}({{x}_{1}}),{\mathbf{\dot {u}}}({{x}_{1}}),{\mathbf{w}}({{x}_{1}}),{\mathbf{\dot {w}}}({{x}_{1}})) = \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}} ({{x}_{1}}) + \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}({{x}_{1}}).} } \end{array}$Требуется найти кусочно-непрерывные управления ${\mathbf{u}}(x)$, ${\mathbf{w}}(x)$, при которых достигается максимум (минимум) функционала J.
Теперь рассмотрим обратное движение маятника. Для того, чтобы сохранить смысл введенного функционала, обозначим $\xi = - x$. Пусть ${{{\mathbf{y}}}_{\xi }} = ({\mathbf{u}},{\mathbf{u}}_{\xi }^{'},{\mathbf{w}},{\mathbf{w}}_{\xi }^{'})$, где ${\mathbf{u}}_{\xi }^{'} = d{\mathbf{u}}{\text{/}}d\xi $, ${\mathbf{w}}_{\xi }^{'} = d{\mathbf{w}}{\text{/}}d\xi $, вектор управляющих координат и их производных по координате $\xi $ в этом случае. Уравнение (1.2) принимает вид
(1.12)
$\frac{d}{{dt}}\left( {{{a}_{{11}}}\dot {\xi } - \sum\limits_{j = 1}^{s - 1} {{{a}_{{1,j + 1}}}{{{\dot {u}}}_{j}}} - \sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}{{{\dot {w}}}_{k}}} } \right) - \frac{{\partial T}}{{\partial \xi }} = - F( - \xi ,{\mathbf{u}}).$Уравнение (1.3) можно представить как
(1.13)
$\dot {\xi }\frac{d}{{d\xi }}\left[ {{{f}_{\xi }}( - \xi ,{{{\mathbf{y}}}_{\xi }})\dot {\xi }} \right] - {{p}_{\xi }}( - \xi ,{{{\mathbf{y}}}_{\xi }}){{\dot {\xi }}^{2}} = - F( - \xi ,{\mathbf{u}}),$Следовательно, получаем
(1.14)
${{\lambda }_{\xi }} = {{f}_{\xi }}( - \xi ,{{{\mathbf{y}}}_{\xi }})\exp \left( { - \int\limits_{{{\xi }_{0}}}^\xi {\frac{{2{{p}_{\xi }}( - \xi ,{{{\mathbf{y}}}_{\xi }})}}{{{{f}_{\xi }}( - \xi ,{{{\mathbf{y}}}_{\xi }})}}d\xi } } \right),$(1.15)
$\int\limits_{{{\xi }_{0}}}^\xi {{{\lambda }_{\xi }}F( - \xi ,{\mathbf{u}})d\xi } = - \frac{1}{2}\left. {[f_{\xi }^{*}( - \xi ,\dot {\xi },{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})\lambda _{\xi }^{*}( - \xi ,\dot {\xi },{\mathbf{u}},{\mathbf{\dot {u}}},{\mathbf{w}},{\mathbf{\dot {w}}})]{\kern 1pt} {\kern 1pt} } \right|_{{{{\xi }_{0}}}}^{\xi },$Амплитуда колебаний имеет вид $J = {{\xi }_{1}} - {{\xi }_{0}}$, где ${{\xi }_{1}} > {{\xi }_{0}}$, ${{\dot {\xi }}_{0}} = \dot {\xi }({{\xi }_{0}}) = 0$, ${{\dot {\xi }}_{1}} = \dot {\xi }({{\xi }_{1}}) = 0$ и $\dot {\xi }(\xi ) \ne 0$, если $\xi \in ({{\xi }_{0}},{{\xi }_{1}})$. Требуется найти кусочно-непрерывные управления ${\mathbf{u}}(\xi )$, ${\mathbf{w}}(\xi )$, при которых значение функционала J максимально (минимально).
2. Оптимальное раскачивание (успокоение) колебаний. Пусть λ определенa формулой (1.6). Тогда справедливы следующие теоремы.
Теорема 1 (принцип наилучшего раскачивания). Предположим, что движение системы описывается уравнением (1.2) и существуют две точки ${{x}_{0}}$ и ${{x}_{1}}$, причем ${{x}_{0}} < {{x}_{1}}$ и ${{\dot {x}}_{0}} = {{\dot {x}}_{1}} = 0$. Тогда справедливы следующие утверждения.
I. Необходимыми условиями оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{M}}(x)$, ${{{\mathbf{w}}}_{M}}({{x}_{1}})$, которые, будучи стесненными ограничениями (1.4), при фиксированном значении ${{x}_{0}}$ обеспечивают максимум величины ${{x}_{1}}$, служат уравнения
(2.1)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{M}}(x) = \arg \mathop {\max }\limits_{\mathbf{u}} \text{[}\chi (x,{{{\mathbf{u}}}_{М}},{\mathbf{u}}_{М}^{'},{{{\mathbf{w}}}_{M}},{\mathbf{w}}_{М}^{'})F(x,{\mathbf{u}})],} \\ {{{{{\mathbf{\dot {w}}}}}_{M}}({{x}_{1}}) = \arg \mathop {\min }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{1}},{{{\mathbf{u}}}_{M}},{{{\mathbf{w}}}_{M}}){{{\dot {w}}}_{k}}} } \right],} \end{array}$II. Необходимыми условиями оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{m}}(x)$, ${{{\mathbf{\dot {w}}}}_{m}}({{x}_{0}})$, которые, будучи стесненными ограничениями (1.4), при фиксированном значении x1 обеспечивают минимум величины x0, служат уравнения
(2.2)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{m}}(x) = \arg \mathop {\min }\limits_{\mathbf{u}} \text{[}\chi (x,{{{\mathbf{u}}}_{m}},{\mathbf{u}}_{m}^{'},{{{\mathbf{w}}}_{m}},{\mathbf{w}}_{m}^{'})F(x,{\mathbf{u}})],} \\ {{{{{\mathbf{\dot {w}}}}}_{m}}({{x}_{0}}) = \arg \mathop {\max }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{0}},{{{\mathbf{u}}}_{m}},{{{\mathbf{w}}}_{m}}){{{\dot {w}}}_{k}}} } \right],} \end{array}$Теорема 2 (принцип оптимального успокоения колебаний). Предположим, что движение системы описывается уравнениями (1.2) и имеются две точки x0 и x1, такие, что ${{x}_{0}} < {{x}_{1}}$ ${{\dot {x}}_{0}} = {{\dot {x}}_{1}} = 0$. Тогда справедливы следующие утверждения.
I. Необходимые условия оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{m}}(\tau )$, ${{{\mathbf{\dot {w}}}}_{m}}({{x}_{1}})$, которые, будучи стесненными ограничениями (1.4), при фиксированном значении x0 обеспечивают минимум величины x1, выражаются равенствами
(2.3)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{m}}(x) = \arg \mathop {\min }\limits_{\mathbf{u}} \text{[}\chi (x,{{{\mathbf{u}}}_{m}},{\mathbf{u}}_{m}^{'},{{{\mathbf{w}}}_{m}},{\mathbf{w}}_{m}^{'})F(x,{\mathbf{u}})],} \\ {{{{{\mathbf{\dot {w}}}}}_{m}}({{x}_{1}}) = \arg \mathop {\max }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{1}},{{{\mathbf{u}}}_{m}},{{{\mathbf{w}}}_{m}}){{{\dot {w}}}_{k}}} } \right],} \end{array}$II. Необходимые условия оптимальности управлений ${\mathbf{u}} = {{{\mathbf{u}}}_{M}}(x)$, ${{{\mathbf{\dot {w}}}}_{M}}({{x}_{0}})$, которые, будучи стесненными ограничениями (1.4), при фиксированном значении x1 обеспечивают максимум величины x0, выражаются уравнениями
(2.4)
$\begin{array}{*{20}{c}} {{{{\mathbf{u}}}_{M}}(x) = \arg \mathop {\max }\limits_{\mathbf{u}} \text{[}\chi (x,{{{\mathbf{u}}}_{M}},{\mathbf{u}}_{М}^{'},{{{\mathbf{w}}}_{M}},{\mathbf{w}}_{М}^{'})F(x,{\mathbf{u}})],} \\ {{{{{\mathbf{\dot {w}}}}}_{M}}({{x}_{0}}) = \arg \mathop {\min }\limits_{{\mathbf{\dot {w}}}} \left[ {\sum\limits_{k = 1}^{n - s} {{{a}_{{1,s + k}}}({{x}_{0}},{{{\mathbf{u}}}_{M}},{{{\mathbf{w}}}_{M}}){{{\dot {w}}}_{k}}} } \right]{\text{,}}} \end{array}$Доказательство приведенных теорем достигается применением формул (1.7) и (1.15), а также с учетом того, что в уравнении (1.2) коэффициент ${{a}_{{11}}} > 0$. Обозначим
При варьировании управляющих функций будем считать тождественно выполненным уравнение движения: $\Upsilon \equiv 0$. Интегрирующий множитель будет меняться вместе с изменением управления. Вместе с тем вариация тождества (1.5) примет вид
Поэтому при анализе влияния управления в формулах (1.7) и (1.15) множители λ и ${{\lambda }_{\xi }}$ играют вспомогательную роль и не участвуют в процессе оптимизации. Они служат лишь для тождественного преобразования уравнения движения. Заметим также, что из формул (1.6) и (1.14) следует, что знаки множителей λ и ${{\lambda }_{\xi }}$ совпадают со знаками функций $f(x,{\mathbf{y}})$ и $f( - \xi ,{{{\mathbf{y}}}_{\xi }})$ соответственно.
Рассмотрим сначала утверждение I теоремы 1. Пусть значение координаты $x = {{x}_{1}}$ соответствует максимально достижимому отклонению системы от положения равновесия, но первое равенство формулы (2.1) в какой-нибудь внутренней точке отрезка [${{x}_{0}}$, ${{x}_{1}}$] нарушено. Тогда, как следует из формулы (1.7), в этой точке можно за счет управления ${\mathbf{u}}$, оставив значения других управлений неизменными, увеличить подынтегральную функцию в (1.7), а за счет этого увеличить значение скорости ${{\dot {x}}_{1}} > 0$. Тогда вырастет и новое значение координаты $x = {{x}_{1}}$, при котором скорость $\dot {x}$ сделается равной нулю. Полученное противоречие доказывает необходимость выполнения первого соотношения равенства (2.1). Второе соотношение равенства (2.1) аналогичным образом следует из того, что функции f* в (1.8), (1.11) линейно зависят от скоростей системы.
Для доказательства утверждения II теоремы 1 следует воспользоваться формулой (1.15) с последующей интерпретацией полученного результата в терминах независимой переменной $x$. Действительно, тогда должно быть
Теорема 2 является взаимной по отношению к теореме 1, и поэтому доказательство теоремы 2 вполне аналогично доказательству теоремы 1.
Подробное доказательство приведенных выше теорем с помощью метода первой вариации читатель может найти в [12].
3. Пример. Маятник с точкой подвеса на перевернутой циклоиде. Материальная точка массы m движется без трения в вертикальной плоскости по перевернутой циклоиде (брахистохроне). К этой точке подвешен стержень, имеющий массу M и центральный момент инерции I. Стержень способен совершать колебания в той же плоскости. Требуется, управляя движением стержня, заставить точку m двигаться по циклоиде с возрастающей амплитудой колебаний около ее нижней точки. Обозначим буквой l расстояние от центра масс $С$ стержня до точки подвеса. Пусть ${\mathbf{\nu }}$ − внешняя нормаль к циклоиде в точке подвеса стержня, а $\psi $ − угол между стержнем и вектором ${\mathbf{\nu }}$. Угол $\psi $ примем в качестве управления с целью раскачивания системы, ограничив его допустимые значения: ${{\psi }_{m}} \leqslant \psi \leqslant {{\psi }_{M}}$ (рисунок).
Для описания движения введем абсолютную правоориентированную декартову систему координат $O\xi \eta \zeta $. Ось $O\eta $ направим вертикально вверх. Ось $O\xi $ расположим в плоскости движения. Тогда ось $O\zeta $ будет перпендикулярна указанной плоскости. Уравнение перевернутой циклоиды представим в виде
где $a > 0$ − постоянная, а $\varphi $ − обобщенная координата, задающая положение точки m на циклоиде. Циклоида выпукла вниз. Ее внешняя нормаль ${\mathbf{\nu }} = ({{\nu }_{\xi }},{{\nu }_{\eta }},0)$ имеет координатыТаким образом, вектор ${\mathbf{\nu }}$ образует с отрицательным направлением оси $O\eta $ угол $\varphi {\text{/}}2$.
Центр масс стержня имеет координаты
Далее
Кинетическая энергия системы принимает вид
Найдем силовую функцию:
Система уравнений Лагранжа записывается следующим образом:
(3.1)
$\begin{array}{*{20}{c}} {\frac{d}{{dt}}({{A}_{\psi }}\dot {\varphi } + {{B}_{\psi }}\dot {\psi }) + {{C}_{\psi }} = - Mlg\sin \left( {\frac{\varphi }{2} + \psi } \right) + {{Q}_{\psi }},} \\ {\frac{d}{{dt}}({{A}_{\varphi }}\dot {\varphi } + {{B}_{\varphi }}\dot {\psi }) + {{C}_{\varphi }} = - (m + M)ga\sin \varphi - \frac{{Mgl}}{2}\sin \left( {\frac{\varphi }{2} + \psi } \right),} \end{array}$(3.2)
$\left\{ {\begin{array}{*{20}{c}} {{{A}_{\varphi }} = 4(m + M){{a}^{2}}{{{\cos }}^{2}}\left( {\frac{\varphi }{2}} \right) + 2Mla{{{\cos }}^{2}}\left( {\frac{\varphi }{2}} \right)\cos \psi + \frac{{M{{l}^{2}} + I}}{4},{\text{ }}} \\ {{{B}_{\varphi }} = 2Mla{{{\cos }}^{2}}\left( {\frac{\varphi }{2}} \right)\cos \psi + \frac{{M{{l}^{2}} + I}}{2},{\text{ }}} \\ {{{C}_{\varphi }} = \left[ {2(m + M){{a}^{2}}{{{\dot {\varphi }}}^{2}} + 2Mla\dot {\varphi }\left( {\frac{{\dot {\varphi }}}{2} + \dot {\psi }} \right)\cos \psi } \right]\sin \varphi ,{\text{ }}} \end{array}} \right.$В уравнениях (3.1) в качестве управляющей координаты выбирается угол $\psi $. В соответствии с уравнением (1.3) получим
(3.3)
$f = {{A}_{\varphi }} + {{B}_{\varphi }}\psi {\kern 1pt} ',\quad p = - \left[ {2(m + M){{a}^{2}} + 2Mla\left( {\frac{1}{2} + \psi {\kern 1pt} '} \right)\cos \psi } \right]\sin \varphi ,$(3.4)
$\Phi = \chi (x,{{{\mathbf{u}}}_{m}},{\mathbf{u}}_{m}^{'},{\mathbf{w}}_{m}^{'})F(x,{\mathbf{u}}) = - \chi \left[ {(m + M)ga\sin \varphi + \frac{{Mgl}}{2}\sin \left( {\frac{\varphi }{2} + \psi } \right)} \right].$Естественно принять ${\text{|}}\psi {\text{|}} \leqslant \pi {\text{/}}2$, так как при превышении этих пределов конструкция системы может быть нарушена. Экстремальные значения функции $\Phi $ достигаются при
Следовательно, для указанных экстремалей будем иметь
Поэтому коэффициент $\chi > 0$. Сузим допустимые границы изменения угла $\psi $:
Тогда оптимальными могут быть также режимы постоянства функции $\psi (\varphi )$, для которых $\psi {\kern 1pt} ' = 0$, и будет выполнено
Следовательно, и в этом случае оказывается $\chi > 0$.
Применим утверждение I теоремы 1. Пусть ${{\varphi }_{0}} < 0$ есть левая граница отклонения по углу $\varphi $, а ${{\varphi }_{1}} > 0$ − соответственно правая граница, и в начальный момент $\varphi = {{\varphi }_{0}}$. Из формулы (2.1) видим, что наилучший способ достичь максимума положительного полуколебания состоит в применении правила
(3.5)
$\psi = \left\{ {\begin{array}{*{20}{l}} {{{\psi }_{M}},\quad {\text{если}}\quad \frac{\varphi }{2} + {{\psi }_{M}} < - \frac{\pi }{2},} \\ { - \frac{\pi }{2} - \frac{\varphi }{2},\quad {\text{если}}\quad \frac{\varphi }{2} + {{\psi }_{m}} \leqslant - \frac{\pi }{2} \leqslant \frac{\varphi }{2} + {{\psi }_{M}},} \\ {{{\psi }_{m}},\quad {\text{если}}\quad \frac{\varphi }{2} + {{\psi }_{m}} > - \frac{\pi }{2}.} \end{array}} \right.$Применим утверждение II теоремы 1. Пусть теперь в начальный момент $\varphi = {{\varphi }_{1}} > 0$. Тогда, напротив, требуется минимизировать значение ${{\varphi }_{0}}$ отрицательного полуразмаха. Из (2.2) заключаем, что наилучший режим для достижения минимума отклонения отрицательного полуразмаха состоит в применении формулы
(3.6)
$\psi = \left\{ {\begin{array}{*{20}{l}} {{{\psi }_{m}},\quad {\text{если}}\quad \frac{\varphi }{2} + {{\psi }_{m}} > \frac{\pi }{2},} \\ {\frac{\pi }{2} - \frac{\varphi }{2},\quad {\text{если}}\quad \frac{\varphi }{2} + {{\psi }_{m}} \leqslant \frac{\pi }{2} \leqslant \frac{\varphi }{2} + {{\psi }_{M}},} \\ {{{\psi }_{M}},\quad {\text{если}}\quad \frac{\varphi }{2} + {{\psi }_{M}} < \frac{\pi }{2}.} \end{array}} \right.$В итоге получается синтез управления для оптимального раскачивания маятника: после достижения максимального положительного отклонения маятника следует применять формулы (3.3); после достижения минимального отрицательного отклонения − формулы (3.2) и т.д.
Из теоремы 2 выводится синтез управления для оптимального успокоения колебаний маятника: после достижения максимального положительного отклонения маятника следует применять формулы (3.2), после достижения минимального отрицательного отклонения − формулы (3.3) и т.д.
Когда зависимость $\psi (\varphi )$ установлена, второе уравнение системы (3.1) становится замкнутым и его можно решать различными известными методами [2]. В частности, для решения можно применить формулу (1.7). После определения функции $\varphi (t)$ становится возможным из первого уравнения (3.1) найти обобщенную силу ${{Q}_{\psi }}$, обеспечивающую требуемое изменение угла $\psi $.
Из системы уравнений (3.1) видим, что при l = 0 угол $\psi $ становится циклической координатой. Тогда, чтобы обеспечить раскачивание, достаточно воспользоваться правилами разд. 2 для управления скоростями в конце полуразмаха.
Заключение. Применение предложенных алгоритмов управления, получаемых из необходимых условий оптимальности (2.1)–(2.4), предполагает учет информации о моментах времени достижения экстремальных значений оптимизируемой координаты и информации о направлении соответствующего полуколебания. Условия оптимальности (2.1)–(2.4) не содержат сопряженных переменных в смысле принципа максимума Л.С. Понтрягина [4]. Это облегчает применение указанных условий для рассмотренного класса задач. Дополнительным преимуществом предложенного метода служит то, что закон оптимального управления получается непосредственно в виде зависимости от оптимизируемой координаты. Используя предложенные условия оптимальности, можно получить аналитические решения для некоторых новых нетривиальных модельных задач. Эти условия упрощают решение соответствующих задач в многомерном пространстве управляющих функций по сравнению с известными методами. Они эффективны как для задач раскачивания, так и для задач успокоения колебаний.
Список литературы
Магнус К. Колебания: Введение в исследование колебательных систем. М.: Мир, 1982. 304 с.
Арнольд В.И. Обыкновенные дифференциальные уравнения. Изд. 2, испр. М.: МЦНМО, 2018. 344 с. ISBN 978-5-94057-907-6.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976. 393 с.
Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980. 384 с.
Фантони И., Лозано Р. Нелинейное управление механическими системами с дефицитом управляющих воздействий / Пер. с франц. Ижевск: К-Динамика, 2012. 312 с. ISBN 978-5-906268-01-3.
Формальский А.М. Управление движением неустойчивых объектов. М.: Физматлит, 2012. 232 с. ISBN 978-5-9221-1460-8.
Голубев Ю.Ф., Хайруллин Р.З. К построению оптимальных режимов раскачивания двузвенного физического маятника // ПММ. 2000. Т. 64. Вып. 2. С. 217–226. ISSN 0032-8235.
Голубев Ю.Ф., Корянов В.В., Мелкумова Е.В. Приведение инсектоморфного робота в рабочее состояние из аварийного положения “вверх ногами” // Изв. РАН. ТиСУ. 2019. № 6. С. 163–176. ISSN: 0002-3388.https://doi.org/10.1134/S0002338819060052
Мартыненко Ю.Г., Формальский А.М. Управление продольным движением одноколесного аппарата по неровной поверхности // Изв. РАН. ТиСУ. 2005. № 4. С. 165–173.
Лавровский Э.К., Формальский А.М. О качении колеса посредством управления его дисбалансом // ПММ. Т. 70. Вып. 3. 2006. С. 371–383.
Охоцимский Д.Е., Энеев Т.М. Некоторые вариационные задачи, связанные с запуском искусственного спутника Земли // УФН. 1957. Т. 63. Вып. 1а. С. 5–32.
Golubev Yu.F. Optimal Control for Nonlinear Oscillations of Natural Mechanical Systems // Lobachevskii J. Math. 2021. V. 42. № 11. P. 2596–2607. ISSN: 1995-0802. https://doi.org/10.1134/S199508022111010X
Дополнительные материалы отсутствуют.
Инструменты
Известия РАН. Теория и системы управления