Известия РАН. Теория и системы управления, 2023, № 6, стр. 81-92
О ПРЕДОТВРАЩЕНИИ ВИБРАЦИЙ В ЗАДАЧЕ ОПТИМАЛЬНОГО ПО ВРЕМЕНИ УПРАВЛЕНИЯ СИСТЕМОЙ С ДВУМЯ СТЕПЕНЯМИ СВОБОДЫ
Ю. Д. Селюцкий a, *, А. М. Формальский a, **
a НИИ механики МГУ
Москва, Россия
* E-mail: seliutski@imec.msu.ru
** E-mail: formal@imec.msu.ru
Поступила в редакцию 21.06.2023
После доработки 24.06.2023
Принята к публикации 31.07.2023
- EDN: HIHGMD
- DOI: 10.31857/S0002338823060094
Аннотация
Изучается механическая система с двумя степенями свободы, состоящая из двух абсолютно твердых тел (материальных точек), соединенных между собой невесомым прямолинейным вязкоупругим стержнем, который может растягиваться или сжиматься. Тела могут двигаться поступательно вдоль неподвижной прямой. К одному из них прикладывается ограниченная по абсолютной величине управляющая сила, вектор которой направлен вдоль стержня. Построено непрерывное кусочно-линейное по времени управление, которое переводит систему из одного положения равновесия в другое за время, “близкое” к минимально возможному. В отсутствие вязкости при построенном квазиоптимальном по быстродействию управлении нежелательные вибрации тел не возбуждаются ни в переходном процессе, ни по его окончании. В отличие от оптимального по времени релейного управления, построенное непрерывное управление является также и робастным по отношению к неопределенности конструктивных параметров.
Введение. Исследуемая в работе система содержит два абсолютно твердых тела, соединенных прямолинейным невесомым вязкоупругим стержнем, который может сжиматься или растягиваться. Эта система моделирует симметричное относительно оси твердое тело, вытянутое вдоль этой оси и обладающее податливостью вдоль нее. К одному из абсолютно твердых тел, расположенных на концах этого осесимметричного тела, прикладывается единственная внешняя управляющая сила, ограниченная по абсолютной величине. Вектор этой силы направлен вдоль стержня, соединяющего между собой оба тела. Эта сила должна переместить приведенную выше систему из ее начального равновесного состояния в другое состояние – также равновесное. Управление строится в виде непрерывной функции времени.
Математическая модель изучаемой системы с двумя степенями свободы состоит из линейных дифференциальных уравнений с постоянными коэффициентами. В спектре системы есть двукратное нулевое собственное значение. Если в стержне учитывается вязкость, то в спектре системы есть также два действительных собственных значения или пара комплексно-сопряженных. В отсутствие вязкости система имеет только пару нулевых и пару чисто мнимых собственных значений.
Оптимальное по быстродействию ограниченное управление линейной стационарной системой представляет собой разрывную функцию времени [1–3] (bang-bang control). Система, содержащая две материальные точки, наделенные массами, исследуется в ряде публикаций (см., например, [4–11]). Среди них есть работы, в которых строится оптимальное по времени управление [4, 7, 8], оптимальное с точки зрения расхода топлива [8], а также управление, при котором в системе не возбуждаются нежелательные колебания или минимизируется их амплитуда [5, 9]. В [10, 11] построено ограниченное управление системой с двукратным нулевым собственным значением и парой чисто мнимых.
Изучаемая задача представляет интерес с точки зрения проблем управления космическими аппаратами, роботами-манипуляторами, конструкция которых обладает податливостью и которые должны маневрировать как можно быстрее и без значительных структурных вибраций во время маневров и/или после них [5]. В [12] построено управление перемещением упругого манипулятора, которое также позволяет избежать возбуждения нежелательных вибраций при его работе.
В монографии [13] рассматриваются общие проблемы управления колебательными процессами, разработаны методы синтеза оптимального управления ими, в том числе приближенные. Заметим, что в статье [14] предлагается классификация управляемых систем с двумя степенями свободы.
Хорошо известно [6, 7], что разрывное управление, например оптимальное по быстродействию, не является робастным, поскольку при неточном знании параметров системы его использование может привести к неприемлемо большим отклонениям движения системы от желаемого. В настоящей статье построено в виде непрерывной функции времени управление, “близкое” к оптимальному по быстродействию. Это управление переводит систему из заданного положения равновесия в другое положение равновесия – желаемое. При неточном знании параметров системы использование непрерывного управления приводит к меньшим отклонениям движения системы от желаемого, нежели в случае применения разрывного управления. При построенном здесь непрерывном управлении не возникают, в частности, нежелательные колебания одного тела относительно другого ни в переходном процессе, ни после его окончания. Авторам настоящей статьи представляется, что развитый здесь метод построения непрерывного во времени квазиоптимального по быстродействию управления, при котором удается реализовать движение системы, близкое к желаемому, может быть использован и в других задачах.
1. Механическая система и ее математическая модель. На рис. 1 показана схема механической системы с двумя степенями свободы, управление которой изучается в настоящей работе. Вдоль оси координат $Ox$ могут перемещаться два абсолютно твердых тела массы ${{m}_{1}}$ и ${{m}_{2}}$, соединенные вязкоупругим невесомым стержнем (упругий стержень на рис. 1 изображен в виде пружины). Расстояния этих тел от начала координат O обозначены через ${{x}_{1}}$ и ${{x}_{2}}$, коэффициент жесткости стержня – через k, а коэффициент вязкости – через d. Длина стержня в нейтральном состоянии равна l. К первому телу массы ${{m}_{1}}$ приложена управляющая сила $F{\text{.}}$
Уравнения движения показанной на рис. 1 системы имеют вид:
(1.1)
$\left\{ \begin{gathered} {{m}_{1}}{{{\ddot {x}}}_{1}} + d\left( {{{{\dot {x}}}_{1}} - {{{\dot {x}}}_{2}}} \right) + k\left( {{{x}_{1}} - {{x}_{2}} + l} \right) = F\left( t \right), \hfill \\ {{m}_{2}}{{{\ddot {x}}}_{2}} + d\left( {{{{\dot {x}}}_{2}} - {{{\dot {x}}}_{1}}} \right) + k\left( {{{x}_{2}} - {{x}_{1}} - l} \right) = 0. \hfill \\ \end{gathered} \right.$Управляющую силу F(t) будем считать допустимой, если она описывается кусочно-непрерывной функцией времени t, ограниченной по абсолютной величине:
(1.2)
$\left| {F\left( t \right)} \right| \leqslant {{F}_{0}}{\text{ }}\left( {{{F}_{0}} = {\text{const}}} \right).$Множество допустимых управляющих воздействий обозначим через $\Omega $.
Пусть при $t \leqslant 0$ имеет место тождество
и система находится в равновесии, так что(1.4)
${{x}_{1}}\left( 0 \right) = 0,\quad {{x}_{2}}\left( 0 \right) = l,\quad {{\dot {x}}_{1}}\left( 0 \right) = 0,\quad {{\dot {x}}_{2}}\left( 0 \right) = 0.$В состоянии (1.4) длина стержня равна l и он находится в нейтральном положении. При условиях (1.4) система остается в равновесии до тех пор, пока имеет место тождество (1.3). Будем считать, что цель управления $F\left( t \right) \in \Omega $ состоит в том, чтобы к некоторому моменту времени T перевести систему (1.1) из равновесия (1.4) в другое положение равновесия:
(1.5)
${{x}_{1}}\left( T \right) = {{x}_{{1T}}},\quad {{x}_{2}}\left( T \right) = {{x}_{{1T}}} + l,\quad {{\dot {x}}_{1}}\left( T \right) = 0,\quad {{\dot {x}}_{2}}\left( T \right) = 0,$Чтобы упростить параметрический анализ, приведем систему к безразмерному виду.
2. Уравнения движения в безразмерных переменных. Уравнения (1.1), прежде всего, перепишем в виде
(2.1)
$\left\{ \begin{gathered} {{m}_{1}}{{{{{\ddot {\xi }}}}}_{1}} + d\left( {{{{{{\dot {\xi }}}}}_{1}} - {{{{{\dot {\xi }}}}}_{2}}} \right) + k\left( {{{{{\xi }}}_{1}} - {{{{\xi }}}_{2}} + 1} \right) = \Phi \left( t \right), \hfill \\ {{m}_{2}}{{{{{\ddot {\xi }}}}}_{2}} + d\left( {{{{{{\dot {\xi }}}}}_{2}} - {{{{{\dot {\xi }}}}}_{1}}} \right) + k\left( {{{{{\xi }}}_{2}} - {{{{\xi }}}_{1}} - 1} \right) = 0, \hfill \\ \end{gathered} \right.$(2.2)
${{{{\xi }}}_{1}} = {{{{x}_{1}}} \mathord{\left/ {\vphantom {{{{x}_{1}}} l}} \right. \kern-0em} l},\quad {{{{\xi }}}_{2}} = {{{{x}_{2}}} \mathord{\left/ {\vphantom {{{{x}_{2}}} l}} \right. \kern-0em} l},\quad \Phi \left( t \right) = {{F\left( t \right)} \mathord{\left/ {\vphantom {{F\left( t \right)} l}} \right. \kern-0em} l},\quad \left( {\left| {\Phi \left( t \right)} \right| \leqslant {{\Phi }_{0}},{\text{ }}{{\Phi }_{0}} = {{{{F}_{0}}} \mathord{\left/ {\vphantom {{{{F}_{0}}} l}} \right. \kern-0em} l}} \right).$Теперь введем в рассмотрение безразмерное время ${{\tau }}$ и безразмерную управляющую силу u(τ):
(2.3)
${{\tau }} = t\sqrt {\frac{{{{\Phi }_{0}}}}{{{{m}_{1}}}}} \quad \left( {t = {{\tau }}\sqrt {\frac{{{{m}_{1}}}}{{{{\Phi }_{0}}}}} } \right),\quad u\left( {{\tau }} \right) = \frac{{F\left( {{\tau }} \right)}}{{{{F}_{0}}}} = \frac{{\Phi \left( {{\tau }} \right)}}{{{{\Phi }_{0}}}}\quad \left( {\left| {u\left( {{\tau }} \right)} \right| \leqslant {{u}_{0}},{\text{ где }}{{u}_{0}} = 1} \right).$Опустив громоздкие промежуточные выкладки, получим вместо (2.1) уравнения движения, описанные в безразмерных переменных (2.2) и (2.3):
(2.4)
$\left\{ \begin{gathered} {{\xi }}_{1}^{{''}} + {{b}_{2}}({{\xi }}_{1}^{'} - {{\xi }}_{2}^{'}) + {{b}_{3}}\left( {{{{{\xi }}}_{1}} - {{{{\xi }}}_{2}} + 1} \right) = u\left( {{\tau }} \right), \hfill \\ {{b}_{1}}{{\xi }}_{2}^{{''}} + {{b}_{2}}({{\xi }}_{2}^{'} - {{\xi }}{\kern 1pt} ') + {{b}_{3}}\left( {{{{{\xi }}}_{2}} - {{{{\xi }}}_{1}} - 1} \right) = 0. \hfill \\ \end{gathered} \right.$Безразмерные параметры b1, b2 и b3 в уравнениях (2.4) выражаются через исходные размерные следующим образом:
(2.5)
${{b}_{1}} = \frac{{{{m}_{2}}}}{{{{m}_{1}}}},\quad {{b}_{2}} = \sqrt {\frac{l}{{{{F}_{0}}{{m}_{1}}}}} d = \sqrt {\frac{1}{{{{\Phi }_{0}}{{m}_{1}}}}} d,\quad {{b}_{3}} = \frac{{kl}}{{{{F}_{0}}}} = \frac{k}{{{{\Phi }_{0}}}}.$Штрих в уравнениях (2.4) означает однократное дифференцирование по безразмерному времени ${{\tau }}$, а два штриха – двукратное. Вместо размерного конечного момента времени $T$ будем использовать безразмерный момент времени
(2.6)
${{\theta }} = T\sqrt {{{{{F}_{0}}} \mathord{\left/ {\vphantom {{{{F}_{0}}} {{{m}_{1}}l}}} \right. \kern-0em} {{{m}_{1}}l}}} = T\sqrt {{{{{\Phi }_{0}}} \mathord{\left/ {\vphantom {{{{\Phi }_{0}}} {{{m}_{1}}}}} \right. \kern-0em} {{{m}_{1}}}}} .$Если коэффициент вязкости $d = 0$, то и ${{b}_{2}} = 0$ (см. выражения (2.5)).
3. Уравнения движения в нормальных координатах. Запишем теперь уравнения движения (2.4) в так называемых “нормальных” [15] координатах. Для этого введем переменные ${{\eta }_{1}}$ и ${{\eta }_{2}}$ следующим образом:
(3.1)
${{{{\eta }}}_{1}} = \frac{1}{l}\left( {{{x}_{1}} + \frac{{{{m}_{2}}}}{{{{m}_{1}}}}{{x}_{2}}} \right) = {{{{\xi }}}_{1}} + {{b}_{1}}{{{{\xi }}}_{2}},\quad {{{{\eta }}}_{2}} = \frac{1}{l}\left( {{{x}_{1}} - {{x}_{2}} + l} \right) = {{{{\xi }}}_{1}} - {{{{\xi }}}_{2}} + 1.$Дифференцируя соотношения (3.1) по безразмерному времени $\tau $ дважды, получим выражения
(3.2)
${{\eta }}_{1}^{{''}} = {{\xi }}_{1}^{{''}} + {{b}_{1}}{{\xi }}_{2}^{{''}},\quad {{\eta }}_{2}^{{''}} = {{\xi }}_{1}^{{''}} - {{\xi }}_{2}^{{''}}.$Подставив в каждое из выражений (3.2) производные ${{\xi }}_{1}^{{''}}$ и ${{\xi }}_{2}^{{''}}$ из уравнений (2.4), выпишем два искомых уравнения в нормальных координатах ${{\eta }_{1}}$ и ${{\eta }_{2}}$ (промежуточные выкладки здесь опущены):
(3.3)
${{\eta }}_{1}^{{''}} = u,\quad {{\eta }}_{2}^{{''}} + {{b}_{2}}\left( {1 + \frac{1}{{{{b}_{1}}}}} \right){{\eta }}_{2}^{'} + {{b}_{3}}\left( {1 + \frac{1}{{{{b}_{1}}}}} \right){{{{\eta }}}_{2}} = u.$Во втором из уравнений (3.3) содержатся, по существу, только два безразмерных параметра, которые обозначим через ${{c}_{1}}$ и ${{c}_{2}}$:
(3.4)
${{c}_{1}} = {{b}_{2}}\left( {1 + \frac{1}{{{{b}_{1}}}}} \right),\quad {{c}_{2}} = {{b}_{3}}\left( {1 + \frac{1}{{{{b}_{1}}}}} \right).$Поэтому уравнения (3.3) можно записать более компактно:
(3.5)
${{\eta }}_{1}^{{''}} = u,\quad {{\eta }}_{2}^{{''}} + {{c}_{1}}{{\eta }}_{2}^{'} + {{c}_{2}}{{{{\eta }}}_{2}} = u.$Замечание. Система (1.1) может быть записана в “нормальных” координатах, несмотря на то, что, наряду с консервативной силой, к ней приложена и диссипативная. Заметим, что в работе [16] получены необходимые и достаточные условия приводимости одновременно трех матриц к диагональному виду, при этом рассматриваются также и системы с диссипацией.
Если коэффициент вязкости в стержне $d = 0,$ то ${{b}_{2}} = 0,$ а значит, и ${{c}_{1}} = 0.$
Уравнения (3.5) связаны одно с другим только управлением u(τ). В отсутствие управления, т.е. при $u\left( \tau \right) \equiv 0,$ уравнения (3.3) становятся однородными и “распадаются” на независимые:
(3.6)
${{\eta }}_{1}^{{''}} = 0,\quad {{\eta }}_{2}^{{''}} + {{c}_{1}}{{\eta }}_{2}^{'} + {{c}_{2}}{{{{\eta }}}_{2}} = 0.$Собственные значения системы (3.6) с двумя степенями свободы удовлетворяют уравнениям:
Уравнения (3.7) имеют четыре корня:
(3.8)
${{\lambda }_{{1,2}}} = 0,\quad {{\lambda }_{{3,4}}} = - \frac{{{{c}_{1}}}}{2} \pm \sqrt {\frac{{c_{1}^{2}}}{4} - {{c}_{2}}} .$Таким образом, среди четырех собственных значений (3.8) всегда есть пара нулевых. Если подкоренное выражение во втором из соотношений (3.8) положительно, то существуют также два действительных отрицательных собственных значения. Если же это подкоренное выражение отрицательно, то существует пара комплексно-сопряженных собственных значений c отрицательной действительной частью:
(3.9)
${{{{\lambda }}}_{{3,4}}} = - {{\varepsilon }} \pm i{{\omega ,}}\quad {\text{где}}\quad {{\varepsilon }} > {\text{0}}{\text{.}}$Величины ${{\varepsilon }}$ и ${{\omega }}$ очевидным образом выражаются через исходные параметры при помощи формул (3.4), (3.8). Величина ${{\omega }}$ представляет собой частоту собственных колебаний системы в безразмерном времени ${{\tau }}$, величина $\vartheta = {{2{{\pi }}} \mathord{\left/ {\vphantom {{2{{\pi }}} {{\omega }}}} \right. \kern-0em} {{\omega }}}$ – период этих собственных колебаний, а величина ${{\varepsilon }}$ характеризует скорость их затухания. Если коэффициент диссипации $d = 0,$ то ${{c}_{1}} = 0$ и ${{\varepsilon }} = {\text{0,}}$ а выражение для частоты $\omega $ (безразмерной) принимает вид
(3.10)
$\omega = \sqrt {{{c}_{2}}} = \sqrt {{{b}_{3}}\left( {1 + \frac{1}{{{{b}_{1}}}}} \right)} = \sqrt {\frac{{kl}}{{{{F}_{0}}}}\left( {1 + \frac{{{{m}_{1}}}}{{{{m}_{2}}}}} \right)} .$Заметим, что частоту ${{\omega }}$ собственных колебаний можно находить не только чисто теоретически, но и экспериментально – при наличии соответствующей установки. Определение частоты экспериментальным путем иногда оказывается более удобным и надежным.
Рассматривая первое из соотношений (3.1), легко убедиться в том, что координата ${{{{\eta }}}_{1}}$ с точностью до постоянного множителя ${{{{m}_{1}}l} \mathord{\left/ {\vphantom {{{{m}_{1}}l} {\left( {{{m}_{1}} + {{m}_{2}}} \right)}}} \right. \kern-0em} {\left( {{{m}_{1}} + {{m}_{2}}} \right)}}$ описывает положение центра масс изучаемой двухмассовой системы. Что касается координаты ${{{{\eta }}}_{2}}$, то она с точностью до постоянного слагаемого l и множителя 1/l определяет расстояние между двумя телами (материальными точками) с массами ${{m}_{1}}$ и ${{m}_{2}}$.
Из начальных (при $t = 0$) условий (1.4), записанных в переменных ${{x}_{1}}$, ${{x}_{2}}$ и их производных, c помощью соотношений (3.1) находим начальные (при ${{\tau }} = {\text{0}}$) условия для переменных ${{{{\eta }}}_{1}},{{{{\eta }}}_{2}}$ и их производных ${{\eta }}_{1}^{'}$, ${{\eta }}_{2}^{'}$
(3.11)
${{{{\eta }}}_{1}}\left( 0 \right) = \frac{{{{m}_{2}}}}{{{{m}_{1}}}},\quad {{{{\eta }}}_{2}}\left( 0 \right) = 0,\quad {{\eta }}_{1}^{'}\left( 0 \right) = 0,\quad {{\eta }}_{2}^{'}\left( 0 \right) = 0.$Из конечных (при $t = T$) условий (1.5), записанных в переменных ${{x}_{1}}$, ${{x}_{2}},$ с помощью соотношений (3.1) получаются следующие конечные (при ${{\tau }} = {{\theta }}$) условия для переменных ${{{{\eta }}}_{1}}$, ${{{{\eta }}}_{2}}$ и производных: ${{\eta }}_{1}^{'}$, ${{\eta }}_{2}^{'}$
(3.12)
${{{{\eta }}}_{1}}\left( {{\theta }} \right) = \frac{1}{l}\left[ {{{x}_{{1T}}} + \frac{{{{m}_{2}}}}{{{{m}_{1}}}}\left( {{{x}_{{1T}}} + l} \right)} \right],\quad {{{{\eta }}}_{2}}\left( {{\theta }} \right) = 0,\quad {{\eta }}_{1}^{'}\left( {{\theta }} \right) = 0,\quad {{\eta }}_{2}^{'}\left( {{\theta }} \right) = 0.$Разрешив уравнения (3.1) относительно переменных ${{x}_{1}}$ и ${{x}_{2}}$, можно найти выражения декартовых координат через нормальные ${{{{\eta }}}_{1}}$ и ${{{{\eta }}}_{2}}$.
4. Синтез непрерывного квазиоптимального по времени управления, не возбуждающего в системе вибраций. При синтезе закона управления механическими системами часто приходится учитывать ограниченность ресурсов управления. При этом могут предъявляться определенные требования к качеству управляемых процессов. Например, требование, чтобы цель управления была достигнута, по возможности, быстро, требование избежать в управляемой системе возникновения нежелательных вибраций, требование робастности управления, т.е. требование, чтобы управление обеспечивало удовлетворительное качество функционирования системы, несмотря на ограниченность ресурсов управления и на то, что его параметры зачастую отличаются от используемых при расчетах.
Рассматриваемая в настоящем разделе задача состоит в построении ограниченного условием (2.3) $\left( {\left| {u\left( {{\tau }} \right)} \right| \leqslant {{u}_{0}}} \right)$ непрерывного управления $u\left( {{\tau }} \right),$ которое переводит систему (3.3) с двумя степенями свободы из заданного начального равновесного положения в заданное конечное равновесное положение за время ${{\theta }}$, “близкое” к минимально возможному ${{{{\theta }}}_{{\min }}}$. При оптимальном по быстродействию управлении системой (3.3), которое является разрывным, в переходном процессе возникают нежелательные колебания по переменной ${{{{\eta }}}_{2}}$. Эти колебания затухают лишь к концу переходного процесса. Для того, чтобы подобные вибрации не возникали, длительность переходного процесса можно “несколько” увеличить путем замены участков, на которых управление претерпевает разрывы, на участки непрерывного управления, длительность каждого из которых равна периоду собственных колебаний. При этом, как показано далее, заданное конечное равновесное состояние достигается медленнее, но “ненамного”. Забегая вперед, заметим, что время достижения конечного состояния превышает минимально возможное менее чем на один период $\vartheta $ собственных колебаний системы. Искомое квазиоптимальное по быстродействию управление $u\left( {{\tau }} \right)$ построим аналитически.
Допустим вначале, что податливость в системе отсутствует, т.е. стержень, соединяющий два тела, не деформируется. Тогда расстояние между телами в процессе перемещения системы остается постоянным, иначе говоря, имеет место тождество
(4.1)
${{{{\eta }}}_{2}}\left( {{\tau }} \right) \equiv 0,\quad {\text{т}}{\text{.е}}.\quad {{x}_{2}}\left( {{\tau }} \right) - {{x}_{1}}\left( {{\tau }} \right) \equiv l.$В этом случае речь идет об управлении движением системы с одной степенью свободы, математическая модель (3.3) которой становится максимально простой – в ней остается только одно дифференциальное уравнение второго порядка с двойным нулевым собственным значением
(4.2)
${{\eta }}_{1}^{{''}}\left( {{\tau }} \right) = u\left( {{\tau }} \right),\quad \left| {u\left( {{\tau }} \right)} \right| \leqslant {{u}_{0}}\;\left( {{{u}_{0}} = 1} \right).$В выражениях (4.2) указано ограничение на управление $u\left( {{\tau }} \right),$ приведенное в соотношениях (2.3).
Пусть начальное (при $\tau = 0$) состояние системы (4.2) ${{\eta }_{1}}\left( 0 \right) = \eta _{1}^{'}\left( 0 \right) = 0$, а желаемое конечное (при $\tau = \theta $) состояние ${{\eta }_{1}}\left( \theta \right) = {{\eta }_{{1g}}} = {\text{const}} > 0$, $\eta _{1}^{'}\left( \theta \right) = 0$, где ${{\eta }_{{1g}}}$ – заданная величина. Хорошо известно [1–3], что система (4.2) приводится из начального в конечное состояние за минимально возможное время ${{\theta }_{{\min }}}$ при помощи релейного управления с тремя переключениями, одно из которых происходит в начале процесса управления, другое – в его середине и третье – в конце:
(4.3)
$u\left( \tau \right) = \left\{ \begin{gathered} 0\quad при\quad \tau < 0, \hfill \\ {{u}_{0}}\quad при\quad 0 \leqslant \tau \leqslant {\theta \mathord{\left/ {\vphantom {\theta {2,}}} \right. \kern-0em} {2,}} \hfill \\ - {{u}_{0}}\quad при\quad {\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} < \tau \leqslant \theta , \hfill \\ 0\quad при\quad \tau > \theta {\text{ }}{\text{.}} \hfill \\ \end{gathered} \right.$При этом минимально возможное время приведения равно [1–3]
(4.4)
${{\theta }_{{\min }}} = 2\sqrt {{{{{\eta }_{{1g}}}} \mathord{\left/ {\vphantom {{{{\eta }_{{1g}}}} {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}} .$При ${{u}_{0}} = 1$ (см. формулы (2.3)) выражение (4.4) упрощается:
Оптимальное по быстродействию релейное управление вида (4.3) показано на рис. 2. При управлении (4.3) функции η1(τ) и $\eta _{1}^{'}(\tau )$ с течением времени изменяются непрерывно, производная $\eta _{1}^{'}(\tau )$ совершает одно колебание. Покажем, что переменная η2(τ) при управлении (4.3) также колеблется.
Оценим влияние разрывов в управлении (4.3) на поведение функции η2(τ) при $\tau \geqslant 0$. Для этого рассмотрим управление с разрывом в одной единственной точке τ = 0:
(4.6)
$u\left( {{\tau }} \right) = \left\{ \begin{gathered} 0\quad {\text{при}}\quad {{\tau }} < 0, \hfill \\ {{u}_{0}}\quad {\text{при}}\quad {{\tau }} \geqslant 0. \hfill \\ \end{gathered} \right.$График “мгновенно” изменяющейся (в момент времени τ = 0) функции (4.6) показан на рис. 3.
В соответствии с условиями (3.11) начальные (при τ = 0) значения нормальной координаты ${{{{\eta }}}_{2}}$ и ее производной ${{\eta }}_{2}^{'}$ равны нулю:
Второе из уравнений (3.3) при d = 0 (в отсутствие вязкости) принимает вид
Частота ${{\omega }}$ свободных колебаний системы (4.8) описывается равенствами (3.10). При управлении (4.6) и начальных условиях (4.7) решение неоднородного уравнения (4.8), как нетрудно показать, имеет следующий вид:
Из рассмотрения соотношений (4.9) вытекает, что при управлении (4.6) функция ${{{{\eta }}}_{2}}{\text{(}}\tau {\text{)}}$ и соответственно ее производная ${{\eta }}_{2}^{'}{\text{(}}\tau {\text{)}}$ при ${{\tau }} > 0$ совершают колебания с частотой ${{\omega }}$ свободных колебаний.
Конструкции многих механических систем обладают податливостью. При функционировании подобных систем в них часто возникают нежелательные колебания. Для борьбы с подобными вибрациями используются различные способы. Большинство из этих способов связано с гашением уже возникших вибраций. В то же время в работах [17–20] предлагаются способы управления механическими системами, при использовании которых удается предотвращать нежелательные вибрации как в переходном процессе, так и после его окончания. В указанных публикациях построены законы управления, предотвращающие колебания в некоторых конкретных системах.
Для того, чтобы избежать колебаний величин ${{{{\eta }}}_{2}}{\text{(}}\tau {\text{)}},$ ${{\eta }}_{2}^{'}{\text{(}}\tau {\text{)}},$ вместо управляющей функции (4.6), возрастающей при ${{\tau }} = 0$ “скачкообразно” от значения $u = 0$ до значения $u = {{u}_{0}}$, рассмотрим непрерывную функцию $u{\text{(}}\tau {\text{)}}$. Пусть эта функция $u{\text{(}}\tau {\text{)}}$ на интервале $0 \leqslant \tau \leqslant \vartheta $, длина которого равна периоду $\vartheta = {{2\pi } \mathord{\left/ {\vphantom {{2\pi } \omega }} \right. \kern-0em} \omega }$ собственных колебаний, возрастает от значения $u = 0$ до значения $u = {{u}_{0}}$, изменяясь линейно во времени, а затем при ${{\tau }} \geqslant \vartheta $ остается постоянной:
(4.10)
$u\left( {{\tau }} \right) = \left\{ \begin{gathered} {\text{ }}0\quad {\text{при}}\quad {{\tau }} \leqslant 0, \hfill \\ \frac{{{{u}_{0}}}}{\vartheta }{{\tau }}\quad {\text{при}}\quad {\text{0}} \leqslant {{\tau }} \leqslant \vartheta , \hfill \\ {\text{ }}{{u}_{0}}\quad {\text{при}}\quad {{\tau }} \geqslant \vartheta . \hfill \\ \end{gathered} \right.$График изменения функции (4.10) показан на рис. 4.
При управлении (4.10) уравнение (4.8) как легко убедиться, имеет следующее решение:
(4.11)
$\begin{gathered} {{\eta }_{2}}\left( \tau \right) = \left\{ \begin{gathered} 0\quad при\quad \tau \leqslant 0, \hfill \\ \frac{{{{u}_{0}}}}{{{{\omega }^{2}}\vartheta }}\left( {\tau - \frac{{\sin \omega \tau }}{\omega }} \right)\quad при{\text{ }}0 \leqslant \tau \leqslant \vartheta , \hfill \\ \frac{{{{u}_{0}}}}{{{{\omega }^{2}}}}\quad при\quad \tau \geqslant \vartheta . \hfill \\ \end{gathered} \right. \\ \eta _{2}^{'}\left( \tau \right) = \left\{ \begin{gathered} 0\quad при\quad \tau \leqslant 0, \hfill \\ \frac{{{{u}_{0}}}}{{{{\omega }^{2}}\vartheta }}\left( {1 - \cos \omega \tau } \right)\quad при\quad 0 \leqslant \tau \leqslant \vartheta , \hfill \\ 0\quad при\quad \tau \geqslant \vartheta . \hfill \\ \end{gathered} \right. \\ \end{gathered} $Решение ${{\eta }_{2}}\left( \tau \right)$ (см. формулы (4.11)) на интервале (0, ϑ) монотонно возрастает, поскольку внутри этого интервала производная $\eta _{2}^{'}\left( \tau \right)$ положительна. При $\tau \geqslant \vartheta $ управляющий сигнал $u\left( {{\tau }} \right)$ становится постоянным – $u\left( {{\tau }} \right) = {{u}_{0}}$ (см. выражение (4.10)). При этом и решение ${{\eta }_{2}}\left( \tau \right)$ будет постоянным – ${{\eta }_{2}}\left( \tau \right) = {{{{u}_{0}}} \mathord{\left/ {\vphantom {{{{u}_{0}}} {{{\omega }^{2}}}}} \right. \kern-0em} {{{\omega }^{2}}}}$ (в отличие от случая, когда управление $u\left( {{\tau }} \right)$ претерпевает разрывы). Из выражений (4.11) и сказанного выше следует, что при показанном на рис. 4 управлении (4.10) какие-либо колебания по переменной ${{\eta }_{2}}\left( \tau \right)$ не возникают.
На рис. 5 приведен график непрерывного во времени управляющего сигнала $u\left( \tau \right)$. Этот график получен из изображенного на рис. 2 путем замены участков с разрывами управления на участки непрерывного и (одновременно) линейного во времени изменения управления. Длительность каждого из этих трех участков выбираем равной периоду $\vartheta $ собственных колебаний. Длительность участков постоянства управления $u\left( \tau \right)$ при этом надо уменьшить так, чтобы конечное положение центра масс системы не изменилось.
Аналитическое описание трапециевидного управления $u\left( \tau \right)$ (см. рис. 5) выглядит следующим образом:
(4.12)
$u\left( \tau \right) = \left\{ \begin{gathered} 0\quad {\text{при}}\quad \tau \leqslant 0, \hfill \\ \frac{{{{u}_{0}}}}{\vartheta }\tau \quad {\text{при}}\quad 0 \leqslant \tau \leqslant \vartheta {\text{,}} \hfill \\ {{u}_{0}}\quad {\text{при}}\quad \vartheta \leqslant \tau \leqslant {\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} - {\vartheta \mathord{\left/ {\vphantom {\vartheta 2}} \right. \kern-0em} 2}{\text{,}} \hfill \\ \frac{{2{{u}_{0}}}}{\vartheta }\left( {{\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} - \tau } \right)\quad {\text{при}}\quad {\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} - {\vartheta \mathord{\left/ {\vphantom {\vartheta 2}} \right. \kern-0em} 2} \leqslant \tau \leqslant {\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} + {\vartheta \mathord{\left/ {\vphantom {\vartheta 2}} \right. \kern-0em} 2}, \hfill \\ - {{u}_{0}}\quad {\text{при}}\quad {\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} + {\vartheta \mathord{\left/ {\vphantom {\vartheta 2}} \right. \kern-0em} 2} \leqslant \tau \leqslant \theta - \vartheta , \hfill \\ - \frac{{{{u}_{0}}}}{\vartheta }\left( {\theta - \tau } \right)\quad {\text{при}}\quad \theta - \vartheta \leqslant \tau \leqslant \theta , \hfill \\ 0\quad {\text{при}}\quad \tau \geqslant \theta . \hfill \\ \end{gathered} \right.$Нетрудно убедиться в том, что при управлении (4.12) колебания переменной ${{\eta }_{2}}$ не возбуждаются не только в интервале $0 \leqslant \tau \leqslant {\theta \mathord{\left/ {\vphantom {\theta 2}} \right. \kern-0em} 2} - {\vartheta \mathord{\left/ {\vphantom {\vartheta 2}} \right. \kern-0em} 2},$ но и на всем промежутке $0 \leqslant \tau \leqslant \theta $.
Оценивая время $\theta $ приведения системы в конечное положение с помощью трапециевидного управления (4.12), можно показать, что имеет место следующее соотношение:
(4.13)
$\theta = 2\sqrt {\frac{{{{\eta }_{{1g}}}}}{{{{u}_{0}}}}} + \vartheta = {{\theta }_{{\min }}} + \vartheta .$Напомним, что в формуле (4.13) ${{\theta }_{{\min }}} = \sqrt {{{{{\eta }_{{1g}}}} \mathord{\left/ {\vphantom {{{{\eta }_{{1g}}}} {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}} $ – минимальное время приведения только центра масс системы в конечное положение ${{\eta }_{{1g}}}$ с помощью релейного управления (4.3), а $\vartheta $ – период собственных колебаний.
Очевидно, что время ${{\theta }_{{{\text{opt}}}}}$ приведения рассматриваемой системы (3.5) с двумя степенями свободы в конечное положение при использовании оптимального управления больше, чем для системы, в которой материальные точки не могут двигаться одна относительно другой. Поэтому имеют место следующие неравенства:
Из соотношений (4.13) и (4.14) вытекают неравенства:
Неравенства (4.15) означают, что время, затрачиваемое на приведение системы (3.5) в конечное положение с помощью трапециевидного управления, превосходит минимально возможное ${{\theta }_{{{\text{opt}}}}}$, однако менее чем на период собственных колебаний системы.
5. Численные исследования. Для оценки эффективности и робастности предложенного “трапециевидного” управления проведем численное моделирование движения системы. Зафиксируем расстояние ${{\eta }_{{1g}}}$, на которое требуется переместить центр масс системы: ${{\eta }_{{1g}}} = 20$.
Будем сравнивать трапециевидное управление вида (4.12) (см. рис. 5) с оптимальным по быстродействию для данной задачи. Известно [7], что оптимальное управление является релейным и содержит четыре участка, на которых управление принимает максимальное по модулю значение. Отметим, что конечных формул, определяющих моменты переключения, получить не удается. Однако эти моменты несложно найти численно при заданных значениях параметров системы и величины ${{\eta }_{{1g}}}$.
На рис. 6 представлены зависимости от времени оптимального и трапециевидного управления u, координат ${{\eta }_{1}}$ и ${{\eta }_{2}}$, а также скорости $\eta _{2}^{'}$. Расчеты проведены при значении безразмерной частоты собственных колебаний $\omega = 2$. Кривые, полученные при оптимальном управлении, изображены пунктирными линиями, а кривые, найденные при трапециевидном управлении, – сплошными.
Сравнивая траектории при оптимальном управлении и трапециевидном, убеждаемся в том, что времена, затрачиваемые на перемещение центра масс при оптимальном и трапециевидном управлении, близки, хотя, как и следовало ожидать, при трапециевидном управлении это время несколько больше, нежели при оптимальном (рис. 6). Что касается относительных колебаний тел, описываемых переменной ${{\eta }_{2}}$, то при оптимальном управлении их больше, чем при трапециевидном, и они имеют существенно бόльшую амплитуду. Относительные скорости тел при оптимальном управлении также заметно больше. При трапециевидном управлении переменная ${{\eta }_{2}}$ совершает одно “полное” колебание. Другими словами, упругий стержень в процессе перемещения всей системы сначала сжимается, затем растягивается, и в конце возвращается в исходное нейтральное положение, причем без какого-либо перерегулирования. Как при оптимальном, так и при трапециевидном управлении в течение всего переходного процесса имеет место неравенство x1(t) < x2(t). Таким образом, предложенное трапециевидное управление, будучи непрерывным, позволяет предотвратить колебания друг относительно друга двух связанных упругим стержнем тел.
В реальной системе частота собственных колебаний и коэффициент вязкости могут быть известны с некоторой погрешностью. Обсудим влияние таких неточностей в определении параметров системы на характер движения.
5.1. Робастность по отношению к частоте собственных колебаний. Предположим, что фактическое значение частоты собственных колебаний в p раз больше, чем значение, используемое в законе управления. Будем считать, что демпфирование в системе отсутствует. Разница в частотах, очевидно, не скажется на движении центра масс системы. Однако она повлияет на относительное движение точек: и при оптимальном, и при трапециевидном законе управления оно, вообще говоря, не прекратится после того, как управление “отработает”, и возникнут незатухающие колебания.
На рис. 7 представлена амплитуда ${{A}_{{\eta 2}}}$ относительных колебаний точек в зависимости от фактического значения частоты для случая p = 1.1 (т.е. ошибка в определении частоты составляет 10%). Сплошная линия отвечает трапециевидному управлению, а пунктирная – оптимальному.
Расчеты проводились для значений собственной частоты, при которых длина участков постоянного управления больше нуля, т.е. $\theta - 3\vartheta > 0$.
Таким образом, за исключением достаточно узких окрестностей дискретного набора частот амплитуда относительных колебаний при трапециевидном управлении существенно меньше, чем при оптимальном.
5.2. Робастность по отношению к вязкости. Предположим теперь, что коэффициент вязкости для стержня не равен нулю. Пусть в законе управления вязкие свойства стержня не учитываются. Данное обстоятельство, очевидно, не сказывается на движении центра масс. Но в общем случае после завершения процесса управления (т.е. при $\tau > \theta $) тела еще будут двигаться друг относительно друга (при неподвижном центре масс). Обозначим через $\eta _{2}^{{\text{M}}}$ модуль максимального отклонения величины ${{\eta }_{2}}$ от нуля при $\tau \geqslant \theta $.
На рис. 8 приведены зависимости $\eta _{2}^{{\text{M}}}$ от собственной частоты при безразмерном коэффициенте вязкости $\chi = 0.1$. Сплошная линия соответствует трапециевидному управлению, а пунктирная – оптимальному. Расчеты также были проведены только для таких частот, при которых $\theta \geqslant 3\vartheta $.
При трапециевидном управлении значения $\eta _{2}^{{\text{M}}}$ существенно меньше, чем при оптимальном (за исключением окрестностей некоторых частот). Кроме того, как следует из рассмотрения рис. 8, величина $\eta _{2}^{{\text{M}}}$ при трапециевидном управлении весьма быстро убывает с ростом частоты.
Таким образом, трапециевидное управление является более робастным (по отношению к неточному определению собственной частоты и коэффициента вязкого трения для стержня), чем оптимальное управление.
Заключение. Математическая модель рассматриваемой механической системы приведена к двум уравнениям относительно безразмерных переменных ${{\eta }_{1}}$ и ${{\eta }_{2}}$, которые представляют собой нормальные координаты. Величина ${{\eta }_{1}}$ характеризует положение центра масс системы, состоящей из двух тел, а ${{\eta }_{2}}$ – взаимное расположение этих тел. Каждая из указанных двух координат описывается своим уравнением. Эти два уравнения связывает только управление, ограниченное по модулю. При оптимальном по быстродействию управлении этой системой (релейном) в переходном процессе возникают нежелательные колебания координаты ${{\eta }_{2}}$. Построено непрерывное кусочно-линейное (трапециевидное) управление, в котором длительность каждого участка линейности равна периоду собственных колебаний переменной ${{\eta }_{2}}$. Показано, что это управление позволяет предотвратить относительные колебания тел. При этом построенное трапециевидное управление остается близким к оптимальному по быстродействию и является робастным по отношению к неопределенности конструктивных параметров.
Список литературы
Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука, 1966.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976. 392 с.
Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969. 408 с.
Singh G., Kabamba P.T., McClamroch N.H. Planar Time-Optimal Control, Rest-to-Rest Slewing of Flexible Spacecraft // AIAA J. Guidance, Control and Dynamics. 1989. V. 12. № 1. 1989. P. 71–81.
Singer N.C., Seering W.P. Preshaping Command Inputs to Reduce System Vibration // J. Dynamic Systems, Measurement, and Control. 1990. V. 112. P. 76–81.
Singh T., Vadali S.R. Robust Time-Delay Control // J. Dynamic Systems, Measurement, and Control. 1993. V. 115. P. 303–306.
Singh T., Vadali S.R. Robust Time-Optimal Control: Frequency Domain Approach // AIAA J. Guidance, Control and Dynamics. 1994. V. 17. № 2. P. 346–353.
Singh T. Fuel/Time Optimal Control of the Benchmark Two-Mass/Spring System // Proc. of American Control Conf., 1995. P. 3825–3829.
Самсонов В.А. Очерки о механике: некоторые задачи, явления и парадоксы // Ижевск: НИЦ “Регулярная и хаотическая динамика”, 2001. 80 с.
Добрынина И.С., Черноусько Ф.Л. Ограниченное управление линейной системой четвертого порядка // Изв. РАН. ТиСУ. 1994. № 4. С. 108–115.
Chernousko F.L., Dobrynina I.S. Constrained Control in a Mechanical System with Two Degrees of Freedom // IUTAM Symp. On Optimization of Mechanical Systems / Eds D.Bestle, W.Schiehlen. Stuttgart: Kluwer Acad. Publ., 1995. P. 57–64.
Голубев Ю.Ф., Дитковский А.Е. Управление упругим манипулятором с учетом полезной нагрузки и силы тяжести // ПММ. 2004. Т. 68. Вып. 125. С. 807–818.
Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980.
Maalouf D., Moog C.H., Aoustin Y., Li S. Classification of Two-degree-of-freedom Under-actuated Mechanical Systems // IET Control Theory & Applications. 2015. V. 9. № 10. P. 1501–1510.
Четаев Н.Г. Устойчивость движения. М.: Наука, 1965. 176 с.
Новиков М.А. Одновременная диагонализация трех вещественных симметричных матриц // Изв. вузов. Математика. 2014. № 12. С. 70–82.
Formalskii A., Gannel L. Control to Avoid Vibrations in Systems with Compliant Elements // J. Vibration and Control. 2015. V. 21. № 14. P. 2852–2865.
Formalskii A.M. Stabilisation and Motion Control of Unstable Objects. Berlin/Boston: Walter de Gruyter GmbH, 2015. 239 p.
Проурзин В.А. Управление движением упругих объектов без возбуждения собственных колебаний // АиТ. 2017. № 12. С. 54–69.
Буданов В.М., Селюцкий Ю.Д., Формальский А.М. Предотвращение колебаний сферического робота в продольном движении // Изв. РАН. ТиСУ. 2022. № 4. С. 95–108.
Дополнительные материалы отсутствуют.
Инструменты
Известия РАН. Теория и системы управления