Известия РАН. Теория и системы управления, 2021, № 6, стр. 3-12

МЕТОД КВАЗИОПТИМАЛЬНОГО СИНТЕЗА ЗАКОНОВ УПРАВЛЕНИЯ НА ОСНОВЕ РЕДУКЦИИ ЗАДАЧИ ЛАГРАНЖА К ИЗОПЕРИМЕТРИЧЕСКОЙ ЗАДАЧЕ С ИСПОЛЬЗОВАНИЕМ АСИНХРОННОГО ВАРЬИРОВАНИЯ

А. А. Костоглотов a, С. В. Лазаренко b*

a Ростовский государственный ун-т путей сообщения
Ростов-на-Дону, Россия

b Донской государственный технический ун-т
Ростов-на-Дону, Россия

* E-mail: lazarenkosv@icloud.com

Поступила в редакцию 16.10.2020
После доработки 09.06.2021
Принята к публикации 26.07.2021

Полный текст (PDF)

Аннотация

Рассматривается решение задачи структурного синтеза квазиоптимальных законов управления на основе редукции задачи Лагранжа к изопериметрической задаче. Анализ вариации расширенного интеграла действия базируется на исследовании асинхронной (полной) вариации и приводит к краевой задаче, решение которой удовлетворяет условию максимума функции обобщенной мощности и требованию выполнения энергетического баланса на экстремальной траектории. На примере задачи А.Т. Фуллера показано, что множество квазиоптимальных управлений, построенных с использованием разработанного метода, содержит оптимальные решения.

Введение. Практическое использование принципа максимума Л.С. Понтрягина при создании оптимальных систем требует решения двухточечной краевой задачи. В общем случае она аналитически неразрешима, а ее численное решение связано с вычислительными трудностями. С помощью принципа максимума решаются задачи программного управления, а результаты синтеза оптимальных управлений известны лишь для редких случаев [13].

Для снижения сложности задачи синтеза могут быть использованы постулаты, обеспечивающие выделение допустимого класса решений и построения разумного приближения при поиске оптимального [2]. Совокупность конструктивных результатов получена на основе квазиоптимального синтеза, например, решения оптимизационной задачи с применением функционала обобщенной работы, что связано с введением дополнительного ограничения и рассмотрением соответствующей изопериметрической задачи. Это позволяет свести поиск решения оптимизационной задачи к необходимости анализа линейного уравнения Ляпунова, что является одной из причин интереса к методам квазиоптимального синтеза [2, 4, 5].

Изучение свойств объекта по результатам анализа приращения функционала [6] “позволяет составить определенное представление о характерных особенностях оптимальных условий” [7]. При этом, как правило, вследствие упрощающих допущений реализация подобных процедур возможна не единственным способом, что порождает множество решений. В отдельных случаях удается установить их связь с известными результатами теории оптимального управления и аналитической механики [8]. Так, например, в [9] рассматривается “теория оптимальных процессов на основе методов аналитической механики”.

В настоящей работе в основу анализа условий оптимальности положен принцип Гамильтона– Остроградского, в соответствии с которым движению динамической системы можно поставить в соответствие интеграл действия [9], имеющий стационарное значение на экстремали. Его использование как ограничения приводит к изопериметрической задаче отыскания условий минимума целевого функционала [10, 11]. На основе редукции исходной оптимизационной задачи Лагранжа к изопериметрической можно получить метод квазиоптимального структурного синтеза с помощью анализа вариации [6, 9, 12] расширенного функционала – свертки критерия качества с действием по Гамильтону [6, 1315].

Анализ варьируемой траектории делает необходимым использование аппарата асинхронного варьирования [8, 9, 12]. Исследование асинхронной (полной) вариации расширенного целевого функционала позволяет получить краевую задачу, решение которой удовлетворяет требованиям максимума функции обобщенной мощности и энергетического баланса на экстремальной траектории. Это дает возможность предложить структуру множества квазиоптимальных решений, полученных в форме синтеза, для рассмотренного класса задач управления. На примере классической задачи А.Т. Фуллера показано, что данное множество содержит оптимальное решение.

Цель исследования – разработка метода квазиоптимального структурного синтеза законов управления лагранжевой динамической системой и проверка его конструктивности.

Задача исследования – редукция исходной задачи оптимального управления к изопериметрической задаче с ограничением в виде интеграла действия и поиск ее решения на основе анализа асинхронной вариации расширенного целевого функционала.

1. Постановка задачи синтеза управления. Рассматривается совокупность динамических систем, движение которых удовлетворяет уравнению Лагранжа второго рода [9, 12]:

(1.1)
$\frac{d}{{dt}}\left( {\frac{{\partial T}}{{\partial {{{\dot {q}}}_{s}}}}} \right) - \frac{{\partial T}}{{\partial {{q}_{s}}}} = {{u}_{s}}\left( t \right),\quad s = \overline {1,n,} \quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right] \subset R,$
где $Т = T\left( {{\mathbf{q}},{\mathbf{\dot {q}}}} \right)$ − кинетическая энергия; ${\mathbf{q}} = {{\left[ {{{q}_{1}}, \ldots {{q}_{n}}} \right]}^{{\text{T}}}} \in {{R}^{n}}$ − вектор обобщенных координат; ${\mathbf{\dot {q}}} = {{\left[ {{{{\dot {q}}}_{1}}, \ldots {{{\dot {q}}}_{n}}} \right]}^{{\text{T}}}} \in {{R}^{n}}$ − вектор обобщенных скоростей; ${\mathbf{u}}\left( t \right) = {{\left[ {{{u}_{1}}, \ldots ,{{u}_{n}}} \right]}^{{\text{T}}}}$ − вектор управляющих обобщенных сил; $n = \dim {\mathbf{q}}$ − число степеней свободы динамической системы; T − знак транспонирования; точкой обозначена производная по времени. Такой случай “играет центральную роль при рассмотрении систем вида (1.1) и их обобщений” [4]. Кинетическая энергия динамической системы (1.1) является положительно-определенной квадратичной формой обобщенных скоростей ${{\psi }_{0}}(\dot {q}_{1}^{2} + \ldots + \dot {q}_{n}^{2}) \leqslant T \leqslant {{\psi }_{1}}(\dot {q}_{1}^{2} + \ldots + \dot {q}_{n}^{2})$, ${{\psi }_{j}} = {\text{const}}$, ψj > 0, $j = \overline {0,1} $, и коэффициенты матрицы кинетической энергии непрерывно дифференцируемы.

Положим, что управляющие обобщенные силы выбираются из множества суммируемых на любом конечном интервале функций, принимающих значение в ограниченной замкнутой выпуклой области

(1.2)
${\mathbf{u}} \in \bar {G},$
и для любых двух заданных точек расширенного координатного пространства
(1.3)
$\begin{gathered} t = {{t}_{0}},\quad {\mathbf{q}}\left( {{{t}_{0}}} \right) = {{\left[ {{{q}_{{10}}}, \ldots {{q}_{{n0}}}} \right]}^{T}},\quad {\mathbf{\dot {q}}}\left( {{{t}_{0}}} \right) = {{\left[ {{{{\dot {q}}}_{{10}}}, \ldots {{{\dot {q}}}_{{n0}}}} \right]}^{T}}, \\ t = {{t}_{1}},\quad {\mathbf{q}}\left( {{{t}_{1}}} \right) = {{\left[ {{{q}_{{11}}}, \ldots {{q}_{{n1}}}} \right]}^{T}},\quad {\mathbf{\dot {q}}}\left( {{{t}_{1}}} \right) = {{\left[ {{{{\dot {q}}}_{{11}}}, \ldots {{{\dot {q}}}_{{n1}}}} \right]}^{T}} \\ \end{gathered} $
переводят динамическую систему (1.1) из начального состояния $\left( {{\mathbf{q}}\left( {{{t}_{0}}} \right),{\mathbf{\dot {q}}}\left( {{{t}_{0}}} \right)} \right)$ в конечное состояние $\left( {{\mathbf{q}}\left( {{{t}_{1}}} \right),{\mathbf{\dot {q}}}\left( {{{t}_{1}}} \right)} \right)$; $\bar {G}$ − ограниченная замкнутая выпуклая область.

Пусть для определенности

$\bar {G} = \{ {{u}_{s}}\left( t \right):\left| {{{u}_{s}}} \right| \leqslant {{h}_{s}},{{h}_{s}} = {\text{const}},s = \overline {1,n} \} $
и ${{h}_{0}} = \mathop {\min }\limits_{1 \leqslant s \leqslant n} {{h}_{s}} > 0$. Тогда в соответствии с [5] выполняется необходимое и достаточное условие управляемости исследуемого класса лагранжевых динамических систем (1.1). Пусть также задана скалярная непрерывная вместе со своими частными производными определенно-положительная целевая функция F(q). Задача синтеза управления системой (1.1) состоит в поиске управляющих обобщенных сил, доставляющих минимум целевому функционалу:
(1.4)
$I\left[ {\mathbf{q}} \right] = \int\limits_{{{t}_{0}}}^{{{t}_{1}}} {F\left( {\mathbf{q}} \right)dt} \to \mathop {\min }\limits_{{\mathbf{u}} \in \bar {G}} $
при условиях (1.2), (1.3).

2. Редукция задачи Лагранжа к изопериметрической задаче при заданном значении интеграла действия. В соответствии с вариационным способом описания динамики систем и утверждением принципа Гамильтона–Остроградского истиной траектории управляемой лагранжевой динамической системы (1.1), (1.4) поставим в соответствие экстремальное значение интеграла действия $\tilde {r}$ [9, 12]. Рассмотрим вектор обобщенных сил ${\mathbf{Q}}$ и соответствующую ему траекторию $\left( {{\mathbf{q}}\left( t \right),{\mathbf{\dot {q}}}\left( t \right)} \right)$, $t\, \in \,[{{t}_{0}},{{t}_{1}}]$, проходящую через точки расширенного фазового пространства $({\mathbf{q}}({{t}_{0}}),{\mathbf{\dot {q}}}({{t}_{0}}))$ и $({\mathbf{q}}({{t}_{1}}),{\mathbf{\dot {q}}}({{t}_{1}}))$, для которого задано значение интеграла действия [9, 12]:

(2.1)
$S\left[ {{\mathbf{q}},{\mathbf{Q}}} \right] = \int\limits_{{{t}_{0}}}^{{{t}_{1}}} {\left( {Т + А} \right)dt} = r,\quad r = {\text{const}},\quad r > \tilde {r},$
где
$A = \sum\limits_{s = 1}^n {\int\limits_{{{q}_{s}}\left( {{{t}_{0}}} \right)}^{{{q}_{s}}\left( {{{t}_{1}}} \right)} {{{Q}_{s}}d{{q}_{s}}} } $
− работа обобщенных сил.

Рассмотрим изопериметрическую задачу: среди всех соответствующих обобщенным силам Q траекторий, удовлетворяющих условиям (1.3), на которых функционал (2.1) принимает значение r, найти те, которые обеспечивают минимум целевому функционалу (1.4). В соответствии с [10, 15] решение экстремальной задачи (1.4), (2.1) предполагает исследование на экстремум расширенного целевого функционала

(2.2)
${{I}_{1}}\left[ {{\mathbf{q}},{\mathbf{Q}}} \right] = I\left[ {\mathbf{q}} \right] + \lambda S\left[ {{\mathbf{q}},{\mathbf{Q}}} \right],$
где $\lambda $ − множитель Лагранжа.

3. Исследование асинхронной вариации расширенного функционала. Пусть существуют такие множитель Лагранжа $\lambda $, вектор обобщенных сил ${\mathbf{\tilde {Q}}}$ и соответствующий ему вектор обобщенных координат ${\mathbf{\tilde {q}}}$, которые удовлетворяют (2.1) и обеспечивают минимум (1.4). К сравнению привлекается вектор обобщенных сил ${\mathbf{Q}} = {\mathbf{\tilde {Q}}} + \delta {\mathbf{Q}}$, получаемый варьированием по Макшейну [2, 3]:

(3.1)
$\delta {\mathbf{Q}}(t) = \left\{ {\begin{array}{*{20}{c}} {{\mathbf{C}},\quad t \in \left[ {\tau ,\tau + \varepsilon } \right]} \\ {{\mathbf{0}},\quad t\bar { \in }\left[ {\tau ,\tau + \varepsilon } \right]} \end{array}} \right.\begin{array}{*{20}{c}} , \\ , \end{array}$
где C − произвольный вектор постоянных; $\tau \in \left[ {{{t}_{0}},{{t}_{1}}} \right]$ − момент времени, который задает замкнутый интервал времени $\left[ {\tau ,\tau + \varepsilon } \right] \subseteq \left[ {{{t}_{0}},{{t}_{1}}} \right]$; $\varepsilon \geqslant 0$ − малая величина. Вариация (3.1) также называется игольчатой. Обобщенной силе Q соответствует траектория q.

Обусловленная действием варьированной обобщенной силы ${\mathbf{Q}}$ асинхронная вариация траектории с точностью до величин первого порядка малости в общем случае определяется выражением [9, 12]

(3.2)
${\mathbf{\Delta q}}\left( t \right) = \delta {\mathbf{q}}\left( t \right) + {\mathbf{\dot {\tilde {q}}}}\left( t \right)\Delta t\left( t \right),$
где $\delta {\mathbf{q}}\left( t \right) = {\mathbf{q}}\left( t \right) - {\mathbf{\tilde {q}}}\left( t \right)$ − синхронная вариация траектории; $\Delta t\left( t \right)$ − произвольная неотрицательная бесконечно малая функция времени относительно ε; асинхронное варьирование обозначено символом ${\mathbf{\Delta }}$.

На интервале $\left[ {{{t}_{0}},\tau } \right)$ ${\mathbf{\tilde {Q}}} = {\mathbf{Q}}$, поэтому траектории в расширенном конфигурационном пространстве совпадают и (3.2) принимает вид

${\mathbf{\Delta q}}\left( t \right) = 0,\quad \delta {\mathbf{q}}\left( t \right) = 0,\quad t \in \left[ {{{t}_{0}},\tau } \right).$

При $t = \tau $ ${\mathbf{Q}} = {\mathbf{\tilde {Q}}} + {\mathbf{C}}$, траектории ${\mathbf{\tilde {q}}}$, q проходят через одну и ту же точку фазового пространства [9]

(3.3)
${\mathbf{\Delta q}}\left( \tau \right) = 0,\quad \delta {\mathbf{q}}\left( \tau \right) = - {\mathbf{\dot {\tilde {q}}}}\left( \tau \right)\Delta t\left( \tau \right).$

На интервале $\left( {\tau ,\tau + \varepsilon } \right]$ асинхронная вариация траектории определяется выражением (3.2).

На интервале $\left( {\tau + \varepsilon ,{{t}_{1}}} \right]$ ${\mathbf{\tilde {Q}}} = {\mathbf{Q}}$ и приращение обобщенных координат задается решением n дифференциальных уравнений Лагранжа второго рода в вариациях с начальными условиями [6]

${\mathbf{\Delta q}}\left( {\tau + \varepsilon } \right) = \delta {\mathbf{q}}\left( {\tau + \varepsilon } \right).$

Вариация кинетической энергии, элементарное приращение работы и приращение целевой функции могут быть вычислены с точностью до величин первого порядка малости следующим образом:

(3.4)
$\begin{gathered} \delta T = \sum\limits_{s = 1}^n {\left[ {\frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}}\delta {{q}_{s}} + \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{{\dot {q}}}_{s}}} \right]} ,\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right], \\ \delta {\kern 1pt} '{\kern 1pt} \tilde {A} = \sum\limits_{s = 1}^n {{{{\tilde {Q}}}_{s}}\delta {{q}_{s}},} \quad t \notin \left[ {\tau ,\tau + \varepsilon } \right], \\ \delta {\kern 1pt} '{\kern 1pt} A = \sum\limits_{s = 1}^n {{{Q}_{s}}\delta {{q}_{s}}} = \sum\limits_{s = 1}^n {\left( {{{{\tilde {Q}}}_{s}} + \delta {{Q}_{s}}} \right)\delta {{q}_{s}}} = \delta {\kern 1pt} '{\kern 1pt} \tilde {A} + \sum\limits_{s = 1}^n {\delta {{Q}_{s}}\delta {{q}_{s}}} ,\quad t \in \left[ {\tau ,\tau + \varepsilon } \right], \\ {\text{ }}\delta {\kern 1pt} '{\kern 1pt} F = \sum\limits_{s = 1}^n {\frac{{\partial F\left( {{\mathbf{\tilde {q}}}} \right)}}{{\partial {{{\tilde {q}}}_{s}}}}\delta {{q}_{s}}} = \sum\limits_{s = 1}^n {{{{\tilde {V}}}_{s}}\delta {{q}_{s}},} \quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right], \\ \end{gathered} $
где $\delta {\kern 1pt} '{\kern 1pt} $ − знак бесконечно малой величины для обозначения элементарной работы, которая не является вариацией соответствующей функции [12]; ${{\tilde {V}}_{s}}$ − фиктивная обобщенная сила.

В рамках решения поставленной изопериметрической задачи будем искать условия, при которых обусловленное вариацией обобщенной силы и соответствующей ей траектории приращение расширенного целевого функционала удовлетворяет неравенству

${{I}_{1}}\left[ {{\mathbf{q}},{\mathbf{Q}}} \right] - {{I}_{1}}[{\mathbf{\tilde {q}}},{\mathbf{\tilde {Q}}}] \geqslant 0.$

На интервале $t \in \left[ {{{t}_{0}},\tau } \right)$ в силу (3.1) траектория не изменяется и расширенный целевой функционал приращения не получает.

В соответствии с [12] операция асинхронного варьирования позволяет получить асинхронную вариацию расширенного целевого функционала при любых допустимых вариациях обобщенной силы по следующему правилу:

(3.5)
$\begin{gathered} \Delta {{I}_{1}} = \Delta \left( {\int\limits_{{{t}_{0}}}^\tau {\left[ {F + \lambda \left( {Т + А} \right)} \right]dt} + \int\limits_\tau ^{{{t}_{1}}} {\left[ {F + \lambda \left( {Т + А} \right)} \right]dt} } \right) = \delta \int\limits_\tau ^{{{t}_{1}}} {\left[ {F + \lambda \left( {Т + А} \right)} \right]dt} + \\ + \left. {\left[ {F + \lambda \left( {Т + А} \right)} \right]\Delta t{\kern 1pt} '} \right|_{\tau }^{{{{t}_{1}}}}, \\ \end{gathered} $
где
$\delta \int\limits_\tau ^{{{t}_{1}}} {\left[ {F + \lambda \left( {Т + А} \right)} \right]dt} $
− главная линейная часть приращения расширенного функционала; функции времени Δt'(τ), $\Delta t{\kern 1pt} '({{t}_{1}})$ произвольны и независимы.

На интервале $t \in \left[ {\tau ,\tau + \varepsilon } \right]$ главная линейная часть приращения расширенного целевого функционала с учетом (3.4) определяется следующим выражением:

(3.6)
$\begin{gathered} \int\limits_\tau ^{\tau + \varepsilon } {\left[ {\lambda \left( {\delta T + \delta {\kern 1pt} 'A} \right) + \delta {\kern 1pt} 'F} \right]dt = } \int\limits_\tau ^{\tau + \varepsilon } {\left( {\sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}\delta {{q}_{s}}} + \left[ {\lambda \left( {\delta T + \delta {\kern 1pt} '\tilde {A}} \right) + \delta {\kern 1pt} 'F} \right]} \right)dt} = \\ = \int\limits_\tau ^{\tau + \varepsilon } {\sum\limits_{s = 1}^n {\left( {\lambda \delta {{Q}_{s}}\delta {{q}_{s}} + \left[ {\left( {\lambda \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + \lambda {{{\tilde {Q}}}_{s}} + {{{\tilde {V}}}_{s}}} \right)\delta {{q}_{s}} + \lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{{\dot {q}}}_{s}}} \right]} \right)} \,dt} . \\ \end{gathered} $

С учетом выражения (3.6) и аддитивности определенного интеграла слагаемое главной линейной части приращения расширенного целевого функционала на интервале $t \in \left[ {\tau + \varepsilon ,{{t}_{1}}} \right]$ записывается так:

(3.7)
$\int\limits_{\tau + \varepsilon }^{{{t}_{1}}} {[\lambda (\delta T + \delta {\kern 1pt} '\tilde {A}) + \delta {\kern 1pt} 'F]dt} = \int\limits_{\tau + \varepsilon }^{{{t}_{1}}} {\sum\limits_{s = 1}^n {\left[ {\left( {\lambda \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + \lambda {{{\tilde {Q}}}_{s}} + {{{\tilde {V}}}_{s}}} \right)\delta {{q}_{s}} + \lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{{\dot {q}}}_{s}}} \right]} \,dt} .$

Принимая во внимание (3.6) и (3.7), выражение (3.5) представим в следующем виде:

(3.8)
$\begin{gathered} \Delta {{I}_{1}} = \int\limits_\tau ^{\tau + \varepsilon } {\sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}\delta {{q}_{s}}} dt} + \int\limits_\tau ^{{{t}_{1}}} {\sum\limits_{s = 1}^n {\left[ {\left( {\lambda \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + \lambda {{{\tilde {Q}}}_{s}} + {{{\tilde {V}}}_{s}}} \right)\delta {{q}_{s}} + \lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{{\dot {q}}}_{s}}} \right]} dt} + \\ + \left. {\left[ {\lambda \left( {A + T} \right) + F} \right]\Delta t{\kern 1pt} '} \right|_{\tau }^{{{{t}_{1}}}}. \\ \end{gathered} $

Зависящие от обобщенных скоростей слагаемые вариации кинетической энергии из (3.8) интегрируются по частям:

(3.9)
$\int\limits_\tau ^{{{t}_{1}}} {\sum\limits_{s = 1}^n {\lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{{\dot {q}}}_{s}}dt} } = - \int\limits_\tau ^{{{t}_{1}}} {\sum\limits_{s = 1}^n {\left( {\dot {\lambda }\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}} + \lambda \frac{d}{{dt}}\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}} \right)\delta {{q}_{s}}} dt} + \left. {\sum\limits_{s = 1}^n {\lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{q}_{s}}} } \right|_{\tau }^{{{{t}_{1}}}}.$

По теореме Эйлера об однородных функциях с учетом связи синхронной и асинхронной вариаций обобщенных координат имеем

(3.10)
$\left. {\sum\limits_{s = 1}^n {\lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}\delta {{q}_{s}}} } \right|_{\tau }^{{{{t}_{1}}}} = \left. { - \sum\limits_{s = 1}^n {\lambda \frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}}{{{\dot {\tilde {q}}}}_{s}}\Delta t{\kern 1pt} '} } \right|_{\tau }^{{{{t}_{1}}}} = \left. { - 2\lambda T\Delta t{\kern 1pt} '} \right|_{\tau }^{{{{t}_{1}}}}.$

Множитель Лагранжа для изопериметрической задачи [10, 16] $\lambda = {\text{const}}$,$\dot {\lambda } = 0.$

В соответствии с (3.1) получаем

(3.11)
$\int\limits_\tau ^{\tau + \varepsilon } {\sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}\delta {{q}_{s}}} dt} = \sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}\left( \tau \right)\delta {{q}_{s}}\left( \tau \right)\varepsilon } + o\left( \varepsilon \right),$
где o(ε) − бесконечно малая более высокого порядка, чем ε [3]. Поскольку при $t \in \left[ {{{t}_{0}},\tau } \right)$ ΔI1 = 0, множитель Лагранжа – константа, зависящие от обобщенных скоростей слагаемые вариации кинетической энергии приводятся к выражениям (3.9), (3.10), то с учетом (3.3), (3.11) имеем

$\begin{gathered} \Delta {{I}_{1}} = - \sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}{{{\dot {\tilde {q}}}}_{s}}\left( \tau \right)\Delta t\varepsilon } + \int\limits_\tau ^{{{t}_{1}}} {\sum\limits_{s = 1}^n {\left[ {\lambda \left( { - \frac{d}{{dt}}\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}} + \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + {{{\tilde {Q}}}_{s}}} \right) + {{{\tilde {V}}}_{s}}} \right]\delta {{q}_{s}}} dt} + \\ + \left. {\left[ {\lambda \left( {A - T} \right) + F} \right]\Delta t{\kern 1pt} '} \right|_{\tau }^{{{{t}_{1}}}} + o\left( \varepsilon \right). \\ \end{gathered} $

Поскольку $\Delta t{\kern 1pt} '\left( \tau \right),\;\Delta t{\kern 1pt} '\left( {{{t}_{1}}} \right)$ не равны нулю и независимы, то для определения стационарного значения расширенного целевого функционала I1 следует считать равными нулю множители при $\Delta t{\kern 1pt} '\left( \tau \right),\Delta t{\kern 1pt} '\left( {{{t}_{1}}} \right)$, тогда [10, 16]

(3.12)
$\left. {\left[ {\lambda \left( {A - T} \right) + F} \right]} \right|_{\tau }^{{{{t}_{1}}}} = 0$.

По исходному построению обобщенная сила выбрана так [7], что

(3.13)
$\int\limits_\tau ^{{{t}_{1}}} {\sum\limits_{s = 1}^n {\left[ {\left( { - \frac{d}{{dt}}\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}} + \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + {{{\tilde {Q}}}_{s}}} \right) + {{\lambda }^{{ - 1}}}{{{\tilde {V}}}_{s}}} \right]\delta {{q}_{s}}} dt} = 0$,
множитель Лагранжа в соответствии с [11, 16]
(3.14)
$\lambda = \frac{{ - \sum\limits_{s = 1}^n {{{{\tilde {V}}}_{s}}} }}{{\sum\limits_{s = 1}^n {\left( { - \frac{d}{{dt}}\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}} + \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + {{{\tilde {Q}}}_{s}}} \right)} }},\quad t \in \left[ {\tau ,{{t}_{1}}} \right],$
и для достижения минимума расширенного целевого функционала необходимо, чтобы при $\varepsilon \to 0$ выполнялось условие

(3.15)
$ - \sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}{{{\dot {\tilde {q}}}}_{s}}\left( \tau \right)} \geqslant 0.$

Таким образом, при ограничениях (2.1) доставляющие минимум целевому функционалу (1.4) обобщенные силы и соответствующая им траектория при $\varepsilon \to 0$ удовлетворяют (3.12)–(3.14) и условию (3.15). Поскольку по построению траектория является оптимальной, то, принимая во внимание принцип динамического программирования Р. Беллмана в силу произвольности момента времени $\tau $ [2] получим следующую краевую задачу, стесненную условиями:

(3.16)
$\begin{gathered} \frac{d}{{dt}}\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}} - \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} = {{{\tilde {Q}}}_{s}} + {{\lambda }^{{ - 1}}}{{{\tilde {V}}}_{s}},\quad s = \overline {1,n} , \\ {{{\tilde {q}}}_{s}}\left( {{{t}_{0}}} \right) = \tilde {q}_{{s0}}^{{}},\quad {{{\dot {\tilde {q}}}}_{s}}\left( {{{t}_{0}}} \right) = \dot {\tilde {q}}_{{s0}}^{{}},\quad {{{\tilde {q}}}_{s}}\left( {{{t}_{1}}} \right) = \tilde {q}_{{s1}}^{{}},\quad {{{\dot {\tilde {q}}}}_{s}}\left( {{{t}_{1}}} \right) = \dot {\tilde {q}}_{{s1}}^{{}}, \\ \end{gathered} $
(3.17)
$\left. {\left[ {\lambda \left( {A - T} \right) + F} \right]} \right|_{t}^{{{{t}_{1}}}} = 0,\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right],$
(3.18)
$\sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}\left( t \right){{{\dot {\tilde {q}}}}_{s}}\left( t \right)} \leqslant 0,\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right],$
(3.19)
$\lambda = \frac{{ - \sum\limits_{s = 1}^n {{{{\tilde {V}}}_{s}}} }}{{\sum\limits_{s = 1}^n {\left( { - \frac{d}{{dt}}\frac{{\partial T}}{{\partial {{{\dot {\tilde {q}}}}_{s}}}} + \frac{{\partial T}}{{\partial {{{\tilde {q}}}_{s}}}} + {{{\tilde {Q}}}_{s}}} \right)} }} = {\text{const}},\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right]{\text{.}}$

Анализ необходимых условий экстремума (3.16)–(3.19) позволяет сделать выводы, которые могут служить основой процедуры синтеза квазиоптимального управления.

Уравнение (3.16) – уравнение Лагранжа второго рода, полученное варьированием расширенного целевого функционала (2.2), который можно трактовать как расширенный функционал действия. Условие (3.17) – требование выполнения энергетического баланса на экстремальной траектории.

Анализ условия, определяющего вариацию обобщенной силы

$\sum\limits_{s = 1}^n {\lambda \delta {{Q}_{s}}\left( t \right){{{\dot {\tilde {q}}}}_{s}}\left( t \right)} \leqslant 0,\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right],$
приводит к следующим заключениям. Величина
$\delta \Phi = \sum\limits_{s = 1}^n {\delta {{Q}_{s}}\left( t \right){{{\dot {\tilde {q}}}}_{s}}\left( t \right)} $
является вариацией функции обобщенной мощности $\tilde {\Phi } = {{\tilde {Q}}_{1}}\left( t \right){{\dot {\tilde {q}}}_{1}}\left( t \right) + \ldots + {{\tilde {Q}}_{n}}\left( t \right){{\dot {\tilde {q}}}_{n}}\left( t \right)$ в момент t при значении обобщенной скорости, определенной на экстремальной траектории. Требование отрицательности вариации можно трактовать как необходимое условие обеспечения максимума функции обобщенной мощности всюду на экстремальной траектории

(3.20)
$\tilde {\Phi } = \sum\limits_{s = 1}^n {{{{\tilde {Q}}}_{s}}\left( t \right){{{\dot {\tilde {q}}}}_{s}}\left( t \right)} \to \mathop {\max }\limits_{} ,\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right].$

Тогда краевая задача может быть представлена в виде системы уравнений (3.16), (3.17), (3.19), (3.20). Ее разрешение и построение программной экстремальной траектории является достаточно сложной задачей, которая может быть решена различными численными методами – пристрелки, итераций и т.д. с текущим поиском максимума функции обобщенной мощности. Но вместе с этим система (3.16), (3.17), (3.19), (3.20) дает возможность решения задачи квазиоптимального структурного синтеза.

4. Квазиоптимальный структурный синтез управления. C учетом редукции исходной задачи и решения изопериметрической задачи структуру квазиоптимального управления можно определить следующим образом:

${{\tilde {u}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right) = {{\tilde {Q}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right) + {{\lambda }^{{ - 1}}}{{\tilde {V}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right)} \right),\quad s = \overline {1,n} .$

Условие максимума функции обобщенной мощности позволяет утверждать, что в квазиоптимальной системе знак обобщенной силы определяется знаком обобщенной скорости, что позволяет установить следующую связь:

${{\tilde {Q}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right) = {{\lambda }^{{ - 1}}}{{\mu }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right){{\dot {\tilde {q}}}_{s}}\left( t \right),$
где ${{\mu }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right)$ − знакопостоянная синтезирующая функция. Имеем следующую структуру управления:

${{\tilde {u}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right) = {{\lambda }^{{ - 1}}}\left[ {{{\mu }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right){{{\dot {\tilde {q}}}}_{s}}\left( t \right) + {{{\tilde {V}}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right)} \right)} \right],\quad s = \overline {1,n} .$

Знак управления определяется в процессе синтеза на основе требований устойчивости управляемого движения [4]. Использование прикладных способов учета ограничений на класс допустимых управлений позволяет записать [17, 18]

(4.1)
${{\tilde {u}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right) = {{h}_{s}}{\text{sat}}[{{\lambda }^{{ - 1}}}{{\Psi }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right)] = \left\{ {\begin{array}{*{20}{c}} {{{h}_{s}}{\text{, }}{{\lambda }^{{ - 1}}}{{\Psi }_{s}} > {{h}_{s}},} \\ {{{\lambda }^{{ - 1}}}{{\Psi }_{s}},{\text{ |}}{{\lambda }^{{ - 1}}}{{\Psi }_{s}}{\text{|}} \leqslant {{h}_{s}},} \\ { - {{h}_{s}},{\text{ }}{{\lambda }^{{ - 1}}}{{\Psi }_{s}} < - {{h}_{s}},} \end{array}} \right.$
где функция
${{\Psi }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right) = {{\mu }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right){{\dot {\tilde {q}}}_{s}}\left( t \right) + {{\tilde {V}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right)} \right)$
определяет поверхность переключения.

Заметим, что при $\lambda \to 0$ управление (4.1) имеет релейный характер

${{\tilde {u}}_{s}}\left( {{\mathbf{\tilde {q}}}(t),{\mathbf{\dot {\tilde {q}}}}(t)} \right) = {{h}_{s}}{\text{sign}}[{{\mu }_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right),{\mathbf{\dot {\tilde {q}}}}\left( t \right)} \right){{\dot {\tilde {q}}}_{s}}\left( t \right) + {{\tilde {V}}_{s}}\left( {{\mathbf{\tilde {q}}}\left( t \right)} \right)].$

5. Построение линии переключения. В соответствии (4.1) синтезирующая функция задает линию переключения. Рассматривается вариант ее построения.

При стационарных связях закон изменения кинетической энергии имеет вид [12]

$\frac{d}{{dt}}T = \sum\limits_{s = 1}^n {{{{\tilde {Q}}}_{s}}{{{\dot {\tilde {q}}}}_{s}}} .$

Откуда по теореме о среднем [19]

$T\left( t \right) = \int\limits_{{{t}_{0}}}^t {\sum\limits_{s = 1}^n {{{{\tilde {Q}}}_{s}}{{{\dot {\tilde {q}}}}_{s}}} dt} + T\left( {{{t}_{0}}} \right) = \sum\limits_{s = 1}^n {Q_{s}^{'}\int\limits_{{{t}_{0}}}^t {{{{\dot {\tilde {q}}}}_{s}}dt} } + T\left( {{{t}_{0}}} \right) = \sum\limits_{s = 1}^n {(Q_{s}^{'}{{{\tilde {q}}}_{s}}\left( t \right) + {{C}_{s}})} ,\quad t \in \left[ {{{t}_{0}},{{t}_{1}}} \right],$
где $Q_{s}^{'}$ – среднее значение функции ${{\tilde {Q}}_{s}}$ на интервале $\left[ {{{t}_{0}},t} \right]$.

Для голономной лагранжевой динамической системы со стационарными связями T = = $0.5{{\dot {\tilde {q}}}_{1}}{{p}_{1}} + \ldots + 0.5{{\dot {\tilde {q}}}_{n}}{{p}_{n}}$, где ${{p}_{s}} = {{a}_{{s1}}}\left( {{\mathbf{\tilde {q}}}} \right){{\dot {\tilde {q}}}_{1}} + \ldots + {{a}_{{sn}}}\left( {{\mathbf{\tilde {q}}}} \right){{\dot {\tilde {q}}}_{n}}$ – обобщенные импульсы; ${{a}_{{sk}}}\left( {{\mathbf{\tilde {q}}}} \right)$ – коэффициенты, ограниченные при всех обобщенных координатах вместе с частными производными первого порядка [12]. Поэтому имеем следующую систему уравнений для построения синтезирующей функции:

$\left\{ \begin{gathered} 0.5\sum\limits_{s = 1}^n {{{{\dot {\tilde {q}}}}_{s}}{{p}_{s}}} = \sum\limits_{s = 1}^n {{\text{(}}Q_{s}^{'}{{{\tilde {q}}}_{s}} + {{C}_{s}}{\text{)}}} , \hfill \\ {{\mu }_{s}}{{{\dot {\tilde {q}}}}_{s}} + {{{\tilde {V}}}_{s}} = 0. \hfill \\ \end{gathered} \right.$

Откуда приходим к соотношению:

(5.1)
${{\mu }_{s}}\left( {{\kern 1pt} \left[ {\sum\limits_{s = 1}^n {(Q_{s}^{'}{{{\tilde {q}}}_{s}} + {{C}_{s}})} } \right] + 0.5\left[ {{{{\dot {\tilde {q}}}}_{s}}{{p}_{s}} - \sum\limits_{s = 1}^n {{{{\dot {\tilde {q}}}}_{s}}{{p}_{s}}} } \right]} \right) + 0.5{{V}_{s}}{{p}_{s}} = 0.$

Из (5.1) с учетом знакопостоянства синтезирующей функции имеем

(5.2)
${{\mu }_{s}} = \frac{{\left| {{{V}_{s}}{{p}_{s}}} \right|}}{{\left| {{\kern 1pt} \left( {2\left[ {\sum\limits_{s = 1}^n {(Q_{s}^{'}{{{\tilde {q}}}_{s}}\left( t \right) + {{C}_{s}})} } \right] + \left[ {{{{\dot {\tilde {q}}}}_{s}}{{p}_{s}} - \sum\limits_{s = 1}^n {{{{\dot {\tilde {q}}}}_{s}}{{p}_{s}}} } \right]} \right){\kern 1pt} } \right|}}.$

6. Пример. Рассматривается задача А.Т. Фуллера минимизации целевого функционала [15, 20]

$I = \int\limits_0^{{{t}_{1}}} {{{{\left( q \right)}}^{2}}} dt \to \mathop {\min }\limits_{u \in \left[ { - 1,1} \right]} $
на траекториях управляемой динамической системы
$\begin{gathered} \ddot {q} = u, \\ t = {{t}_{0}} = 0,\quad q\left( 0 \right) = 1,\quad \dot {q}\left( 0 \right) = 1, \\ t = {{t}_{1}},\quad q\left( {{{t}_{1}}} \right) = \dot {q}\left( {{{t}_{1}}} \right) = 0, \\ \end{gathered} $
уравнения которой следуют из принципа Гамильтона–Остроградского для $T = 0.5{{\dot {q}}^{2}}_{{}}$. Для такой динамической системы и целевого функционала изопериметрическая задача предполагает исследование на экстремум расширенного целевого функционала
${{I}_{1}} = \int\limits_0^{{{t}_{1}}} {\left[ {{{q}^{2}} + \lambda \left( {\frac{{{{{\dot {q}}}^{2}}}}{2} + \int\limits_{q\left( 0 \right)}^{q\left( t \right)} Q dq} \right)} \right]dt} $,
где Q – обобщенная сила.

Управление в рассматриваемой задаче нужно строить так, чтобы производная кинетической энергии была отрицательно-определенной функцией [4]. Тогда выражение (4.1) позволяет определить структуру квазиоптимального управления с точностью до синтезирующей функции:

$u = - {\text{sat}}[Q + 2{{\lambda }^{{ - 1}}}q] = - {\text{sat}}[{{\lambda }^{{ - 1}}}\left( {\mu \dot {q} + 2q} \right)].$

Поскольку линия переключения проходит через второй и четвертый квадранты [3], то с учетом (5.2) и выражения для кинетической энергии при ${{C}_{1}} = 0$ имеем

$\ddot {q} = - {\text{sat}}\left[ {{{\lambda }^{{ - 1}}}\left( {\frac{{\left| {\dot {q}} \right|\dot {q}}}{{\left| {Q{\kern 1pt} '} \right|}} + 2q} \right)} \right]{\text{ = }} - {\text{sat}}[2{{\lambda }^{{ - 1}}}\left( {{{k}_{1}}\left| {\dot {q}} \right|\dot {q} + q} \right)],$
где $Q{\kern 1pt} '$ – среднее значение Q; ${{k}_{1}} = 1{\text{/}}2\left| {Q{\kern 1pt} '} \right|$.

При $\lambda \to 0$

$u = - {\text{sign}}\left[ {{{k}_{1}}\left| {\dot {q}} \right|\dot {q} + q} \right]$.

Параметр k1 определяется по результатам анализа движения изображающей точки фазовой плоскости. В первом квадранте

(6.1)
$\ddot {q} = - 1$.

Тогда в конце первого интервала управления длительностью ${{\Delta }_{{\text{1}}}}$ при смене знака обобщенная координата q1 и обобщенная скорость ${{\dot {q}}^{1}}$ находятся из (6.1) интегрированием:

$\begin{gathered} {{{\dot {q}}}^{1}} = - {{\Delta }_{{\text{1}}}} + \dot {q}\left( 0 \right),{\text{ }} \\ {{q}^{1}} = - \frac{{\Delta _{1}^{2}}}{2} + \dot {q}\left( 0 \right){{\Delta }_{{\text{1}}}} - {{k}_{1}}\dot {q}_{{}}^{2}\left( 0 \right){\text{.}} \\ \end{gathered} $

Подставляя решения в условие переключения, получим квадратное уравнение. С учетом анализа его решений [21] запишем как

${{\tau }_{1}} = 1 + \sqrt {\frac{{1 - 2{{k}_{1}}}}{{1 + 2{{k}_{1}}}}} {\text{,}}\quad {{\tau }_{{\text{1}}}} = \frac{{{{\Delta }_{{\text{1}}}}}}{{\dot {q}\left( 0 \right)}},$
а фазовые переменные на кривой переключения имеют значения

${{\dot {q}}^{1}} = - \dot {q}\left( 0 \right)\left( {{{\tau }_{1}} - 1} \right),\quad {{q}^{1}} = {{k}_{1}}\dot {q}\left( 0 \right)_{{}}^{2}{{\left( {{{\tau }_{1}} - 1} \right)}^{2}}.$

Аналогично, рассматривая второй участок траектории, который начинается в точке (q11), ${{\dot {q}}^{1}}({{\tau }_{1}}))$, приходит в точку $({{q}^{2}}\left( {{{\tau }_{2}}} \right),{{\dot {q}}^{2}}\left( {{{\tau }_{2}}} \right))$, лежащую в области, где $u = + 1$, сформируем условие переключения в форме

${{\tau }_{2}} = ({{\tau }_{1}} - 1)\left[ {1 + \sqrt {\frac{{1 - 2{{k}_{1}}}}{{1 + 2{{k}_{1}}}}} } \right] = ({{\tau }_{1}} - 1){{\tau }_{1}}$
и значения фазовых переменных

${{\dot {q}}^{2}} = - \dot {q}\left( 0 \right){{\left( {{{\tau }_{1}} - 1} \right)}^{2}}{\text{,}}\quad {{q}^{2}} = {{k}_{1}}\dot {q}\left( 0 \right)_{{}}^{2}{{\left( {{{\tau }_{1}} - 1} \right)}^{4}}.$

Производя подобные преобразования для m переключений, по индукции получим

$\begin{gathered} {{\tau }_{m}} = {{\left( {{{\tau }_{1}} - 1} \right)}^{m}}{{\tau }_{1}}, \\ {\text{ }}{{q}^{m}} = {{( - 1)}^{m}}{{k}_{1}}\dot {q}\left( 0 \right)_{{}}^{2}{{({{\tau }_{1}} - 1)}^{{2m}}}, \\ {{{\dot {q}}}^{m}} = {{( - 1)}^{m}}\dot {q}\left( 0 \right){{({{\tau }_{1}} - 1)}^{m}}{\text{. }} \\ \end{gathered} $

Промежутки времени между соседними переключениями в этой задаче образуют геометрическую прогрессию

${{\tau }_{m}} = {{\tau }_{{m - 1}}}\left( {{{\tau }_{1}} - 1} \right){\text{ }}$
со знаменателем

${{\tau }_{1}} - 1 = \sqrt {\frac{{1 - 2{{k}_{1}}}}{{1 + 2{{k}_{1}}}}} .$

Пусть при $t = {{t}_{1}}$ происходит смена знака управления. Тогда при $u = - 1$ для траектории имеем

$\begin{gathered} \dot {q}\left( {{{t}_{1}}} \right) = - {{\Delta }_{m}} + {{{\dot {q}}}^{m}},{\text{ }} \\ {\text{ }}q\left( {{{t}_{1}}} \right) = - \frac{{\Delta _{m}^{2}}}{2} + {{{\dot {q}}}^{m}}{{\Delta }_{m}} - {{k}_{1}}{{({{{\dot {q}}}^{m}})}^{2}},{\text{ }} \\ {{\Delta }_{m}} = {{t}_{1}} - {{t}_{m}}. \\ \end{gathered} $

Исключая из этих уравнений промежуток времени Δm, запишем уравнения для определения ${{k}_{1}}$:

$\begin{gathered} {{\delta }_{{m,k}}} = - \frac{1}{2}{{[{{\left( {{{\tau }_{1}} - 1} \right)}^{m}} + {{{\dot {\delta }}}_{k}}]}^{2}} + {{\left( {{{\tau }_{1}} - 1} \right)}^{m}}[{{\left( {{{\tau }_{1}} - 1} \right)}^{m}} + {{{\dot {\delta }}}_{k}}] - {{\left( {{{\tau }_{1}} - 1} \right)}^{{2m}}}{{k}_{1}}, \\ {{{\dot {\delta }}}_{k}} = \frac{{\dot {q}\left( {{{t}_{1}}} \right)}}{{\dot {q}\left( 0 \right)}},{\text{ }}{{\delta }_{k}} = \frac{{q\left( {{{t}_{1}}} \right)}}{{\dot {q}{{{\left( 0 \right)}}^{2}}}}, \\ \end{gathered} $
которые после преобразований записываются в форме геометрической прогрессии [19]:

(6.2)
$\begin{gathered} {{b}_{m}} = {{b}_{{m - 1}}}\left( {\frac{{1 - 2{{k}_{1}}}}{{1 + 2{{k}_{1}}}}} \right) = \frac{1}{2}\dot {\delta }_{k}^{2} + {{\delta }_{{m,k}}}, \\ {{b}_{{m - 1}}} = \frac{{1 + 2{{k}_{1}}}}{2}{{\left( {\frac{{1 - 2{{k}_{1}}}}{{1 + 2{{k}_{1}}}}} \right)}^{{m - 1}}}. \\ \end{gathered} $

Оптимальному решению соответствуют кривые в фазовом пространстве, которые при $m \to \infty $ имеют вид закручивающихся к началу координат спиралей [20]. Приближенное значение k1 определяется по первым двум членам геометрической прогрессии (6.2): m = 2. Пусть $\frac{1}{2}\dot {\delta }_{k}^{2} + {{\delta }_{{m,k}}}$ = = 0.05. Тогда ${{k}_{1}} \approx 0.4446$, а знаменатель геометрической прогрессии [20]

$\sqrt {\frac{{1 - 2{{k}_{1}}}}{{1 + 2{{k}_{1}}}}} \approx 0.2421,$
что соответствует известному решению А.Т. Фуллера [20]

$u = - {\text{sign}}\left[ {0.4446\dot {q}\left| {\dot {q}} \right| + q} \right].$

Заключение. Рассмотрена редукция задачи Лагранжа к изопериметрической задаче. На основе анализа асинхронной вариации расширенного функционала получена краевая задача с условием максимума функции обобщенной мощности и требованием выполнения энергетического баланса на экстремальной траектории. Установлена структура управляющей обобщенной силы для лагранжевой динамической системы при стационарных связях с точностью до синтезирующей функции. Предложен метод ее построения. Показано, что на оптимальной траектории синтез управляющей обобщенной силы лагранжевой динамической системы может быть построен на основе условия максимума функции обобщенной мощности.

Получено известное оптимальное решение задачи А.Т. Фуллера об управлении с учащающимися переключениями [15, 20]. Это позволяет утверждать, что множества квазиоптимальных управлений, синтезированные с использованием разработанного метода, содержат оптимальные решения.

Принцип максимума Л.С. Понтрягина имеет потенциал решения широкого круга оптимизационных задач, но при его применении возникают существенные сложности в случае динамических систем с большим числом степеней свободы, особенно нелинейных. По мнению авторов, разработанный метод синтеза квазиоптимальных законов управления дает возможность искать приближенное решение оптимизационной задачи без необходимости решения краевой задачи большой размерности.

Список литературы

  1. Розоноэр Л.И. Принцип максимума Л.С. Понтрягина в теории оптимальных систем. II // АиТ. 1959. Т. 20. № 11. С. 1441–1458.

  2. Красовский А.А. Справочник по теории автоматического управления. М.: Наука, 1987. 712 с.

  3. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1983. 392 с.

  4. Пятницкий Е.С. Синтез иерархических систем управления механическими и электромеханическими системами управления на основе принципа декомпозиции // АиТ. 1989. № 1. С. 87–99.

  5. Пятницкий Е.С. Управляемость классов лагранжевых систем с ограниченными управлениями // АиТ. 1996. № 12. С. 29–37.

  6. Костоглотов А.А. Метод идентификации параметров голономных систем на основе аппарата асинхронного варьирования // Изв. РАН. ТиСУ. 2003. № 2. С. 86–92.

  7. Охоцимский Д.Е., Энеев Т.М. Некоторые вариационные задачи, связанные с запуском искусственного спутника Земли // УФН. 1957. Т. 63. № 1. С. 5–32.

  8. Голубев Ю.Ф. Метод Охоцимского–Понтрягина в теории управления и аналитической механике. Ч. 1. Метод Охоцимского–Понтрягина в теории управления // Вестн. МГУ. Сер. 1. Математика, механика. 2008. № 6. С. 49–55.

  9. Новоселов В.С. Вариационные методы в механике. Л.: Изд-во ЛГУ, 1966. 72 с.

  10. Ахиезер Н.И. Лекции по вариационному исчислению. М.: Гостехиздат, 1955. 248 с.

  11. Трухачев Р.И., Хоменюк В.В. Теория неклассических вариационных задач. Л.: Изд-во ЛГУ, 1970. 168 с.

  12. Лурье А.И. Аналитическая механика. М.: ГИФМЛ, 1961. 824 с.

  13. Костоглотов А.А., Кузнецов А.А., Лазаренко С.В. Синтез модели процесса с нестационарными возмущениями на основе максимума функции обобщенной мощности // Математическое моделирование. 2016. Т. 28. № 12. С. 133–142.

  14. Костоглотов А.А., Лазаренко С.В. Синтез адаптивных систем сопровождения на основе гипотезы о стационарности Гамильтониана гиперповерхности переключения // РЭ. 2017. Т. 62. № 2. С. 121–125.

  15. Kostoglotov A.A. Solution of Fuller’s Problem on the Basis of the Joint Pontryagin–Hamilton–Ostrogradskii Principle // Automatic Control and Computer Sciences. 2007. V. 41. № 4. P. 179–187.

  16. Курант Р., Гильберт Д. Методы математической физики. М.–Л.: Гостехиздат, 1951. Т. 1. 476 с.

  17. Фуртат И.Б. Синтез алгоритма управления объектами с параметрической неопределенностью, возмущениями и насыщением входного сигнала // АиТ. 2017. № 12. С. 100–117.

  18. Ананьевский И.М., Решмин С.А. Непрерывное управление механической системой на основе метода декомпозиции // Изв. РАН. ТиСУ. 2014. № 4. С. 3–17.

  19. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1974. 832 с.

  20. Майкова О.Е. Субоптимальные режимы в задаче Фуллера // Тр. Математического ин-та им. В.А. Стеклова. 2002. Т. 236. С. 226–229.

  21. Алдакимов Ю.В., Меликян А.А., Наумов Г.В. Перестройка режима в однопараметрическом семействе задач оптимального управления // ПММ. 2001. Т. 65. № 3. С. 400–407.

Дополнительные материалы отсутствуют.