Журнал вычислительной математики и математической физики, 2022, T. 62, № 1, стр. 23-35

Асимптотический метод решения сингулярно возмущенной линейно-квадратичной задачи оптимального управления с подвижным правым концом траекторий

А. И. Калинин 1*, Л. И. Лавринович 1**

1 Белорусский гос. ун-т, ФПМИ
220030 Минск, пр-т Независимости, 4, Беларусь

* E-mail: kalininai@bsu.by
** E-mail: lavrinovich@bsu.by

Поступила в редакцию 12.11.2020
После доработки 09.01.2021
Принята к публикации 07.07.2021

Полный текст (PDF)

Аннотация

Рассматривается задача минимизации интегрального квадратичного функционала на траекториях линейной сингулярно возмущенной системы с линейными терминальными ограничениями. Строятся асимптотические приближения в виде программы и обратной связи к оптимальному управлению в этой задаче. Основное достоинство предлагаемых вычислительных процедур состоит в том, что при их реализации происходит декомпозиция исходной задачи на две невозмущенные задачи оптимального управления меньшей размерности. Библ. 18.

Ключевые слова: оптимальное управление, линейная система, квадратичный функционал, сингулярные возмущения, асимптотические приближения, субоптимальный синтез.

ВВЕДЕНИЕ

В рамках математической теории оптимальных процессов задачам оптимизации сингулярно возмущенных систем, содержащих малые параметры при части производных, уделяется значительное внимание (см. обзоры в [1]–[4]). Интерес к таким задачам вызван эффективностью асимптотических методов их решения, при применении которых исходная задача распадается на задачи оптимального управления меньшей размерности. Такая декомпозиция позволяет эффективно решать задачи с большим числом фазовых переменных. Кроме того, при применении асимптотического подхода удается избежать интегрирования сингулярно возмущенных систем, которые являются жесткими (см. [5]).

Цель настоящей статьи – построение асимптотических приближений в виде программы и обратной связи к решению сингулярно возмущенной линейно-квадратичной задачи оптимального управления с линейными терминальными ограничениями на траектории. Суть предлагаемых вычислительных процедур состоит в асимптотическом разложении по целым степеням малого параметра множителей Лагранжа – конечномерных элементов, соответствующих в силу принципа максимума (см. [6]) оптимальному управлению.

Сингулярно возмущенным линейно-квадратичным задачам оптимального управления посвящено значительное число публикаций (см., например, [7]–[11]), в большинстве из которых рассматривались задачи без ограничений на траектории. Настоящая статья обобщает результаты, полученные в [11] для сингулярно возмущенной линейно-квадратичной задачи оптимального с фиксированным правым концом траекторий.

1. ПОСТАНОВКА ЗАДАЧИ

В классе r-мерных управляющих воздействий $u(t)$, $t \in T = [{{t}_{*}},t*]$, с кусочно-непрерывными компонентами рассмотрим следующую задачу оптимального управления:

(1.1)
$\begin{gathered} \dot {y} = {{A}_{1}}(t)y + {{A}_{2}}(t)z + {{B}_{1}}(t)u,\quad y({{t}_{*}}) = {{y}_{*}}, \\ \mu \dot {z} = {{A}_{3}}(t)y + {{A}_{4}}(t)z + {{B}_{2}}(t)u,\quad z({{t}_{*}}) = {{z}_{*}}, \\ \end{gathered} $
(1.2)
${{H}_{1}}y(t*) = {{g}_{1}},\quad {{H}_{2}}z(t*) = {{g}_{2}},$
(1.3)
$J(u) = \frac{1}{2}\int\limits_{{{t}_{*}}}^{t*} {\left( {{{y}^{{\text{т}}}}M(t)y + \mu {{z}^{{\text{т}}}}L(t)z + {{u}^{{\text{т}}}}P(t)u} \right)dt} \to \min ,$
где µ – малый положительный параметр, ${{t}_{*}}$, $t{\kern 1pt} *$ – заданные моменты времени (${{t}_{*}} < t{\text{*}}$), y есть n-вектор медленных переменных, z есть m-вектор быстрых переменных, ${{g}_{1}}$, ${{g}_{2}}$ – векторы размерностей ${{n}_{1}}$, ${{m}_{1}}$ соответственно (${{n}_{1}} \leqslant n$, ${{m}_{1}} \leqslant m$), ${{H}_{1}}$ и ${{H}_{2}}$ – матрицы полного ранга, M(t), L(t) – неотрицательно-определенные симметрические матрицы, а P(t) – положительно-определенная симметрическая матрица для всех $t \in T$.

Предположение 1. Действительные части всех собственных значений матрицы ${{A}_{4}}(t)$, $t \in T$, отрицательны.

Предположение 2. Элементы всех матриц, формирующих задачу, бесконечно дифференцируемы.

Управление с кусочно-непрерывными компонентами принято называть допустимым, если для порожденной им траектории системы (1.1) выполнены терминальные ограничения (1.2). Допустимое управление, на котором критерий качества (1.3) принимает наименьшее значение, называют оптимальным. Наряду с этими общеупотребительными понятиями определим то, что будет пониматься под асимптотическими приближениями к решению рассматриваемой задачи.

Определение 1. Управление ${{u}^{{(N)}}}(t,\mu )$, $t \in T$, с кусочно-непрерывными компонентами назовем (программным) асимптотически субоптимальным управлением $N$-го порядка ($N = 0,\;1,\;2, \ldots $), в задаче (1.1)–(1.3), если оно отклоняется по критерию качества (1.3) от оптимального управления на величину $O({{\mu }^{{N + 1}}})$, а порожденная им траектория $y\left( {t,\mu } \right)$, $z\left( {t,\mu } \right)$, $t \in T$, системы (1.1) удовлетворяет терминальным ограничениям (1.2) с точностью того же порядка малости.

Определение 2. Вектор-функцию ${{u}^{{(N)}}}(y,z,t,{{\mu }})$ назовем асимптотически субоптимальной обратной связью N-го порядка, если для любого начального состояния (${{y}_{*}}$, ${{z}_{*}}$, ${{t}_{*}}$), ${{t}_{*}} < t{\text{*}}$, имеет место

${{u}^{{(N)}}}({{y}_{*}},{{z}_{*}},{{t}_{*}},{{\mu }}) = {{u}^{{(N)}}}({{t}_{*}},{{\mu }}),$
где ${{u}^{{(N)}}}(t,{{\mu }})$, $t \in T$, – асимптотически субоптимальное управление N-го порядка в задаче (1.1)–(1.3).

В настоящей статье предлагается и обосновывается алгоритм, с помощью которого для заданного числа N можно построить асимптотически субоптимальное управление N-го порядка в рассматриваемой задаче. Его суть состоит в асимптотическом разложении по целым степеням малого параметра множителей Лагранжа, которые в силу принципа максимума (см. [6]) соответствуют оптимальному управлению. В работе также показывается, как можно построить асимптотически субоптимальную обратную связь нулевого порядка.

2. ПЕРВАЯ БАЗОВАЯ ЗАДАЧА

Вычисления при построении асимптотически субоптимальных управлений начинаются с решения вырожденной задачи

(2.1)
$\begin{gathered} \dot {y} = {{A}_{0}}(t)y + {{B}_{0}}(t)u,\quad y({{t}_{*}}) = {{y}_{*}},\;{{H}_{1}}y(t*) = {{g}_{1}}, \\ {{J}_{1}}(u) = \frac{1}{2}\int\limits_{{{t}_{*}}}^{t*} {\left( {{{y}^{{\text{т}}}}M(t)y + {{u}^{{\text{т}}}}P(t)u} \right)dt \to \min ,} \\ \end{gathered} $
где
(2.2)
${{A}_{0}}(t) = {{A}_{1}}(t) - {{A}_{2}}(t)A_{4}^{{ - 1}}(t){{A}_{3}}(t),\quad {{B}_{0}}(t) = {{B}_{1}}(t) - {{A}_{2}}(t)A_{4}^{{ - 1}}(t){{B}_{2}}(t),$
которая является предельной для медленной переменной. В дальнейшем эту задачу будем называть первой базовой.

Предположение 3. Динамическая система в задаче (2.1) является управляемой на отрезке $\left[ {\tau ,t{\text{*}}} \right]$ относительно подпространства ${{H}_{1}}y = 0$ при любом $\tau \in \left[ {{{t}_{*}},t{\text{*}}} \right)$ (см. [12]).

Это предположение выполняется тогда и только тогда (см., например, [13]), когда при любом $\tau \in \left[ {{{t}_{*}},t{\text{*}}} \right)$ и любом ненулевом векторе l размерности ${{n}_{1}}$ выполняется соотношение

(2.3)
${{l}^{{\text{т}}}}{{H}_{1}}{{F}_{0}}(t){{B}_{0}}(t) \ne 0,\quad \tau \leqslant t \leqslant t*,$
где ${{F}_{0}}(t)$, $t \in T$, есть $\left( {n \times n} \right)$-матричная функция, являющаяся решением начальной задачи
${{\dot {F}}_{0}} = - {{F}_{0}}{{А}_{0}}(t),\quad {{F}_{0}}(t*) = {{E}_{n}},$
с единичной матрицей ${{E}_{n}}$. Условие (2.3), которое называют неявным критерием управляемости на подпространство, для стационарной динамической системы эквивалентно требованию (см. [13])

${\text{rank}}\left( {{{H}_{1}}{{B}_{0}},{{H}_{1}}{{A}_{0}}{{B}_{0}},\; \ldots ,\;{{H}_{1}}A_{0}^{{n - 1}}{{B}_{0}}} \right) = {{n}_{1}}.$

При таком предположении в первой базовой задаче существуют допустимые управления, а тогда эта задача имеет единственное решение (см. [14]), которое является нормальной экстремалью. Последнее означает, что принцип максимума (см. [6]) в данном случае может быть сформулирован следующим образом: пусть ${{u}^{0}}(t)$, ${{y}^{0}}(t)$, $t \in T$, – оптимальные управление и траектория в задаче (2.1), тогда существует такой вектор множителей Лагранжа ${{\lambda }_{0}}$ размерности ${{n}_{1}}$, что выполняется условие

${{\psi }^{{{{0}^{{\text{т}}}}}}}(t){{B}_{0}}(t){{u}^{0}}(t) - \frac{1}{2}{{u}^{{{{0}^{{\text{т}}}}}}}(t)P(t){{u}^{0}}(t) = \mathop {\max }\limits_{u \in {{R}^{r}}} \left( {{{\psi }^{{{{0}^{{\text{т}}}}}}}(t){{B}_{0}}(t)u - \frac{1}{2}{{u}^{{\text{т}}}}P(t)u} \right),\quad t \in T,$
где ${{\psi }^{0}}(t)$, $t \in T$, – решение сопряженной системы
$\dot {\psi } = - A_{0}^{{\text{т}}}(t)\psi + M(t){{y}^{0}}(t),\quad \psi \left( {t{\text{*}}} \right) = H_{1}^{{\text{т}}}{{\lambda }_{0}}.$
Из этого условия непосредственно следует

(2.4)
${{u}^{0}}(t) = {{P}^{{ - 1}}}(t)B_{0}^{{\text{т}}}(t){{\psi }^{0}}(t),\quad t \in T.$

Пусть ${{\psi }_{*}} = {{\psi }^{0}}({{t}_{*}})$, тогда ${{y}^{0}}(t)$, ${{\psi }^{0}}(t)$, $t \in T$, есть решение следующей начальной задачи:

(2.5)
$\begin{gathered} \dot {y} = {{A}_{0}}(t)y + {{B}_{0}}(t){{P}^{{ - 1}}}(t)B_{0}^{{\text{т}}}(t)\psi ,\quad y({{t}_{*}}) = {{y}_{*}}, \\ \dot {\psi } = M(t)y - A_{0}^{{\text{т}}}(t)\psi ,\;\psi (t{\text{*}}) = {{\psi }_{*}}. \\ \end{gathered} $

Введем в рассмотрение фундаментальную матрицу $F(t,{{t}_{*}})$, $t \in T$, системы (2.5) как решение начальной задачи

(2.6)
$\dot {F} = \bar {A}(t)F,\quad F({{t}_{*}}) = {{E}_{{2n}}},$
в которой
$\bar {A}(t) = \left( {\begin{array}{*{20}{c}} {{{A}_{0}}(t)}&{{{B}_{0}}(t){{P}^{{ - 1}}}(t)B_{0}^{{\text{т}}}(t)} \\ {M(t)}&{ - A_{0}^{{\text{т}}}(t)} \end{array}} \right),$
а ${{E}_{{2n}}}$ – единичная матрица. Разобьем матрицу F на блоки размеров n × n:

$F = \left( {\begin{array}{*{20}{c}} {{{F}_{{11}}}}&{{{F}_{{12}}}} \\ {{{F}_{{21}}}}&{{{F}_{{22}}}} \end{array}} \right).$

Привлекая для записи решения начальной задачи (2.5) в момент времени $t{\text{*}}$ фундаментальную матрицу, получаем

(2.7)
$\begin{gathered} {{H}_{1}}{{F}_{{11}}}\left( {t*,{{t}_{*}}} \right){{y}_{*}} + {{H}_{1}}{{F}_{{12}}}\left( {t*,{{t}_{*}}} \right){{\psi }_{*}} = {{g}_{1}}, \\ {{F}_{{21}}}\left( {t*,{{t}_{*}}} \right){{y}_{*}} + {{F}_{{22}}}\left( {t*,{{t}_{*}}} \right){{\psi }_{*}} = H_{1}^{{\text{т}}}{{\lambda }_{0}}. \\ \end{gathered} $

В [13] показано, что при выполнении предположения 3 матрицы ${{F}_{{22}}}\left( {t*,{{t}_{*}}} \right)$ и ${{H}_{1}}{{С}_{1}}H_{1}^{{\text{т}}}$, где

(2.8)
${{С}_{1}} = {{F}_{{12}}}\left( {t*,{{t}_{*}}} \right)F_{{22}}^{{ - 1}}\left( {t*,{{t}_{*}}} \right),$
будут невырожденными. Тогда из системы (2.7) следует

${{H}_{1}}{{С}_{1}}H_{1}^{{\text{т}}}{{\lambda }_{0}} = {{g}_{1}} - {{H}_{1}}\left( {{{F}_{{11}}}\left( {t*,{{t}_{*}}} \right) - {{C}_{1}}{{F}_{{21}}}\left( {t*,{{t}_{*}}} \right)} \right){{y}_{*}}.$

Отсюда видно, что вектор ${{\lambda }_{0}}$, а следовательно, и решение сопряженной системы определены однозначно.

3. ВТОРАЯ БАЗОВАЯ ЗАДАЧА

На втором этапе алгоритма построения асимптотических субоптимальных управлений решается следующая линейно-квадратичная задача оптимального управления с бесконечной длительностью процесса:

(3.1)
$\begin{gathered} \frac{{dz}}{{ds}} = {{A}_{4}}(t*)z + {{B}_{2}}(t*)u,\quad {{H}_{2}}z(0) = {{H}_{2}}A_{4}^{{ - 1}}(t*)\left( {{{A}_{3}}(t*){{y}^{0}}(t*) + {{B}_{2}}(t*){{u}^{0}}(t*)} \right) + {{g}_{2}}, \\ z( - \infty ) = 0,\quad {{J}_{2}}(u) = \frac{1}{2}\int\limits_{ - \infty }^0 {{{u}^{{\text{т}}}}(s)} P(t*)u(s)ds \to \min , \\ \end{gathered} $
которая является предельной для быстрой переменной. Задачу (3.1) будем называть второй базовой.

Предположение 4. Выполнен критерий управляемости на подпространство

${\text{rank}}\left( {{{H}_{2}}{{B}_{2}}(t*),\;{{H}_{2}}{{A}_{4}}(t*){{B}_{2}}(t*),\; \ldots ,\;{{H}_{2}}A_{4}^{{m - 1}}(t*){{B}_{2}}(t*)} \right) = {{m}_{1}}.$

Это предположение гарантирует существование допустимых управлений во второй базовой задаче, а тогда задача (3.1) имеет единственное решение (см. [14]) и является нормальной. В этом случае принцип максимума (см. [6]) для нее может быть сформулирован следующим образом: пусть $u{\text{*}}(s)$, $z{\text{*}}(s)$, $s \leqslant 0$, – оптимальные управление и траектория в задаче (3.1), тогда существует такой вектор множителей Лагранжа ${{\sigma }_{0}}$ размерности ${{m}_{1}}$, что выполняется условие

${\text{П}}{{\psi }^{{\text{т}}}}(s){{B}_{2}}(t{\text{*}})u{\text{*}}(s) - \frac{1}{2}{{u}^{*}}^{{\text{т}}}(s)P(t{\text{*}})u{\text{*}}(s) = \mathop {\max }\limits_{u \in {{R}^{r}}} \left( {{\text{П}}{{\psi }^{{\text{т}}}}(s){{B}_{2}}(t{\text{*}})u - \frac{1}{2}{{u}^{{\text{т}}}}P(t{\text{*}})u} \right),\quad s \leqslant 0,$
где ${\text{П}}\psi (s)$, $s \leqslant 0$, – решение сопряженной системы
$\frac{d}{{ds}}{\text{П}}\psi = - A_{4}^{{\text{т}}}(t*){\text{П}}\psi ,\quad {\text{П}}\psi (0) = H_{2}^{{\text{т}}}{{\sigma }_{0}}.$
Отсюда непосредственно следует
(3.2)
$u{\text{*}}(s) = {{P}^{{ - 1}}}(t*)B_{2}^{{\text{т}}}(t*){\text{П}}\psi {\text{(}}s{\text{),}}\quad s \leqslant 0.$
Заметим, что
(3.3)
${\text{П}}{{\psi }^{{\text{т}}}}(s) = \sigma _{0}^{{\text{т}}}{{H}_{2}}G(s),\quad {\text{П}}{{\psi }^{{\text{т}}}}(s){{B}_{2}}(t{\text{*}}) = \sigma _{0}^{{\text{т}}}{{H}_{2}}{\text{ПФ}}(s),\quad s \leqslant 0,$
где
(3.4)
${\text{ПФ}}(s) = G(s){{B}_{2}}(t{\text{*}}),\quad s \leqslant 0,$
а $G(s)$, $s \leqslant 0$, есть $\left( {m \times m} \right)$-матричная функция, являющаяся решением начальной задачи

(3.5)
$\frac{{dG}}{{ds}} = - G{{A}_{4}}(t{\text{*}}),\quad G(0) = {{E}_{m}}.$

Замечание 1. Подчеркнем, что единственная информация о решении второй базовой задачи, которая используется в дальнейшем при построении асимптотически субоптимальных управлений, – это значение σ0 вектора множителей Лагранжа. Нет необходимости строить оптимальное управление $u{\text{*}}(s)$, $s \leqslant 0$, что, впрочем, и невозможно, если задача решается численно. Во второй базовой задаче гамильтониан вдоль оптимального управления равен нулю. Воспользовавшись этим свойством при $s = 0$, получаем условиe, которому удовлетворяет вектор σ0:

$\frac{1}{2}\sigma _{0}^{{\text{т}}}{{H}_{2}}{{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})B_{2}^{{\text{т}}}(t{\text{*}})H_{2}^{{\text{т}}}{{\sigma }_{0}} + \sigma _{0}^{{\text{т}}}{{H}_{2}}{{B}_{2}}(t{\text{*}}){{u}^{0}}(t{\text{*}}) = 0.$

После решения базовых задач формируются матрица

(3.6)
${{I}_{0}} = \left( {\begin{array}{*{20}{c}} {{{Н}_{1}}{{C}_{1}}H_{1}^{{\text{т}}}}&{{{0}_{{{{n}_{1}} \times {{m}_{1}}}}}} \\ {{{H}_{2}}{{C}_{2}}H_{1}^{{\text{т}}}}&{{{H}_{2}}{{C}_{3}}H_{2}^{{\text{т}}}} \end{array}} \right)$
размеров $\left( {{{n}_{1}} + {{m}_{1}}} \right) \times \left( {{{n}_{1}} + {{m}_{1}}} \right)$ и вектор
(3.7)
${{\nu }_{0}} = {{\sigma }_{0}} - {{\left( {{{H}_{2}}{{C}_{3}}H_{2}^{{\rm T}}} \right)}^{{ - 1}}}{{H}_{2}}{{C}_{3}}{{\left( {{{A}_{2}}(t{\text{*}})A_{4}^{{ - 1}}(t{\text{*}})} \right)}^{{\text{т}}}}H_{1}^{{\text{т}}}{{\lambda }_{0}}$
размерности ${{m}_{1}}$. Матрица С1 определена ранее формулой (2.8),
(3.8)
${{С}_{2}} = - A_{4}^{{ - 1}}(t*)\left( {{{A}_{3}}(t*){{C}_{1}} + {{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})B_{0}^{{\text{т}}}(t{\text{*}})} \right) + {{C}_{3}}{{{\text{(}}{{A}_{2}}(t*)A_{4}^{{ - 1}}(t*))}^{{\text{т}}}},$
(3.9)
${{С}_{3}} = \int\limits_{ - \infty }^0 {\left( {{\text{ПФ(}}s{\text{)}}{{P}^{{ - 1}}}(t*){\text{П}}{{{\text{Ф}}}^{{\text{т}}}}{\text{(}}s{\text{)}}} \right)} {\kern 1pt} ds.$
Предположения 3, 4 гарантируют соответственно невырожденность матриц ${{Н}_{1}}{{C}_{1}}H_{1}^{{\text{т}}}$, ${{H}_{2}}{{C}_{3}}H_{2}^{{\text{т}}}$, а тогда $\det \;{{I}_{0}} \ne 0$.

Отметим, что

(3.10)
$H_{2}^{{\text{т}}}{{\nu }_{0}} = H_{2}^{{\text{т}}}{{\sigma }_{0}} - {{\left( {{{A}_{2}}(t{\text{*}})A_{4}^{{ - 1}}(t{\text{*}})} \right)}^{{\text{т}}}}H_{1}^{{\text{т}}}{{\lambda }_{0}}.$

4. АСИМПТОТИЧЕСКИЙ АНАЛИЗ РЕШЕНИЯ ИСХОДНОЙ ЗАДАЧИ

Прежде, чем продолжить изложение алгоритма построения асимптотически субоптимальных управлений, сформулируем и докажем теорему, на которую опираются дальнейшие вычисления.

Из результатов, полученных в [15], следует, что в задаче (1.1)–(1.3) при выполнении предположений 1–4 существуют допустимые управления. Тогда эта задача имеет единственное решение (см. [14]), которое является нормальной экстремалью. Пусть ${{u}^{0}}(t,\mu )$, ${{y}^{0}}(t,\mu )$, ${{z}^{0}}(t,\mu )$, $t \in T$, – оптимальные управление и траектория в задаче (1.1)–(1.3). Из принципа максимума (см. [6]) следует, что оптимальное управление представимо в виде

(4.1)
${{u}^{0}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t)\psi _{1}^{0}(t,\mu ) + B_{2}^{{\text{т}}}(t)\psi _{2}^{0}(t,\mu )} \right),\quad t \in T,$
где $\left( {\psi _{1}^{0}(t,\mu ),\psi _{2}^{0}(t,\mu )} \right)$, $t \in T$, – вектор сопряженных переменных, который вместе с оптимальной траекторией является решением краевой задачи
(4.2)
$\begin{gathered} \dot {y} = {{A}_{1}}(t)y + {{A}_{2}}(t)z + {{B}_{1}}(t){{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t){{\psi }_{1}} + B_{2}^{{\text{т}}}(t){{\psi }_{2}}} \right),\quad y({{t}_{*}}) = {{y}_{*}}, \\ \mu \dot {z} = {{A}_{3}}(t)y + {{A}_{4}}(t)z + {{B}_{2}}(t){{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t){{\psi }_{1}} + B_{2}^{{\text{т}}}(t){{\psi }_{2}}} \right),\quad z({{t}_{*}}) = {{z}_{*}}, \\ {{{\dot {\psi }}}_{1}} = - A_{1}^{{\text{т}}}(t){{\psi }_{1}} - A_{3}^{{\text{т}}}(t){{\psi }_{2}} + M(t)y,\quad {{\psi }_{1}}({{t}_{*}}) = H_{1}^{{\text{т}}}\lambda , \\ \mu {{{\dot {\psi }}}_{2}} = - A_{2}^{{\text{т}}}(t){{\psi }_{1}} - A_{4}^{{\text{т}}}(t){{\psi }_{2}} + \mu L(t)z,\quad {{\psi }_{2}}({{t}_{*}}) = H_{2}^{{\text{т}}}\nu . \\ \end{gathered} $
Векторы множителей Лагранжа λ, ν, разумеется, зависят от малого параметра: $\lambda = \lambda (\mu )$, $\nu = \nu (\mu )$. Покажем, что эти вектор-функции определены однозначно и допускают асимптотические разложения по целым степеням малого параметра со старшими коэффициентами ${{\lambda }_{0}}$, ${{\nu }_{0}}$, которые найдены в результате решения базовых задач. Доказательство будет конструктивным и предопределит дальнейшие вычисления при построении асимптотически субоптимальных управлений.

Теорема. При выполнении предположений 1–4 решению задачи (1.1)–(1.3) с достаточно малым µ соответствует в силу принципа максимума единственный вектор множителей Лагранжа $\left( {\lambda (\mu ),\nu (\mu )} \right)$, допускающий асимптотические разложения

(4.3)
$\lambda (\mu )\sim {{\lambda }_{0}} + \sum\limits_{k = 1}^\infty {{{\mu }^{k}}{{\lambda }_{k}}} ,\quad \nu (\mu )\sim {{\nu }_{0}} + \sum\limits_{k = 1}^\infty {{{\mu }^{k}}{{\nu }_{k}}} ,$
в которых ${{\nu }_{0}}$ задается формулой (3.7), а ${{\lambda }_{0}}$, ${{\sigma }_{0}}$векторы множителей Лагранжа в первой и второй базовых задачах.

Доказательство. Для сокращения записи введем в рассмотрение векторы $\eta = (\lambda ,\nu )$, ${{\eta }_{0}} = ({{\lambda }_{0}},{{\nu }_{0}})$.

В силу теоремы, доказанной в [16], при выполнении сделанных предположений существуют такие положительные числа ${{\mu }_{0}}$, ${{\varepsilon }_{0}}$, что краевая задача (4.2) имеет единственное решение $y(t,\eta ,\mu )$, $z(t,\eta ,\mu )$, ${{\psi }_{1}}(t,\eta ,\mu )$, ${{\psi }_{2}}(t,\eta ,\mu )$, $t \in T$, если только $0 < \mu < {{\mu }_{0}}$, $\left\| {\eta - {{\eta }_{0}}} \right\| < {{\varepsilon }_{0}}$. При этом имеют место асимптотические разложения

$y(t,\eta ,\mu )\sim \sum\limits_{k = 0}^\infty {{{\mu }^{k}}\left( {{{y}_{k}}(t,\eta ) + {{{\text{П}}}_{k}}y(s,\eta ) + {{{\text{Q}}}_{k}}y(\tau ,\eta )} \right)} ,$
(4.4)
$\begin{gathered} z(t,\eta ,\mu )\sim \sum\limits_{k = 0}^\infty {{{\mu }^{k}}\left( {{{z}_{k}}(t,\eta ) + {{{\text{П}}}_{k}}z(s,\eta ) + {{{\text{Q}}}_{k}}z(\tau ,\eta )} \right)} , \\ {{\psi }_{i}}(t,\eta ,\mu )\sim \sum\limits_{k = 0}^\infty {{{\mu }^{k}}\left( {{{\psi }_{{ik}}}(t,\eta ) + {{{\text{П}}}_{k}}{{\psi }_{i}}(s,\eta ) + {{{\text{Q}}}_{k}}{{\psi }_{i}}(\tau ,\eta )} \right)} ,\quad i = 1,\;2, \\ \end{gathered} $
$s = (t - t{\text{*}}){\text{/}}\mu ,\quad \tau = (t - {{t}_{*}}){\text{/}}\mu ,$
коэффициенты которых могут быть найдены с помощью метода пограничных функций (см. [16], [17]). Подчеркнем, что это равномерные по $t \in T$ асимптотические разложения, а для пограничных членов справедливы оценки
(4.5)
$\begin{gathered} \left\| {\left( {{{{\text{П}}}_{k}}y(s,\eta ),{{{\text{П}}}_{k}}z(s,\eta ),{{{\text{П}}}_{k}}{{\psi }_{1}}(s,\eta ),{{{\text{П}}}_{k}}{{\psi }_{2}}(s,\eta )} \right)} \right\| \leqslant {{\alpha }_{k}}\exp ({{\beta }_{k}}s),\quad s \leqslant 0, \\ \left\| {{{{\text{Q}}}_{k}}y(\tau ,\eta ),{{{\text{Q}}}_{k}}z(\tau ,\eta ),{{{\text{Q}}}_{k}}{{\psi }_{1}}(\tau ,\eta ),{{{\text{Q}}}_{k}}{{\psi }_{2}}(\tau ,\eta )} \right\| \leqslant {{\gamma }_{k}}\exp ( - {{\delta }_{k}}\tau ),\quad \tau \geqslant 0, \\ \end{gathered} $
где ${{\alpha }_{k}}$, ${{\beta }_{k}}$, ${{\gamma }_{k}}$, ${{\delta }_{k}}$, k = 0, 1, …, – положительные постоянные.

Приведем старшие коэффициенты разложений (4.4), которые понадобятся при доказательстве теоремы. Прежде всего, отметим, что

(4.6)
${{{\text{П}}}_{0}}y(s,\eta ) \equiv 0,\quad {{{\text{П}}}_{0}}{{\psi }_{1}}(s,\eta ) \equiv 0,\quad {{{\text{Q}}}_{0}}y(\tau ,\eta ) \equiv 0,\quad {{{\text{Q}}}_{0}}{{\psi }_{i}}(\tau ,\eta ) \equiv 0,\quad i = 1,\;2.$

Вектор-функции ${{y}_{0}}(t,\eta )$, ${{\psi }_{{10}}}(t,\eta )$, $t \in T$, $\left\| {\eta - {{\eta }_{0}}} \right\| < {{\varepsilon }_{0}}$, есть решение краевой задачи

(4.7)
$\begin{gathered} \dot {y} = {{A}_{0}}(t)y + {{B}_{0}}(t){{P}^{{ - 1}}}(t)B_{0}^{{\text{т}}}(t)\psi ,\quad y({{t}_{*}}) = {{y}_{*}}, \\ \dot {\psi } = M(t)y - A_{0}^{{\text{т}}}(t)\psi ,\quad \psi (t{\text{*}}) = H_{1}^{{\text{т}}}\lambda . \\ \end{gathered} $
Однозначная разрешимость этой задачи при векторах λ, достаточно близких к ${{\lambda }_{0}}$, гарантируется предположением 3.

Коэффициенты ${{z}_{0}}(t,\eta )$, ${{\psi }_{{20}}}(t,\eta )$, $t \in T$, $\left\| {\eta - {{\eta }_{0}}} \right\| < {{\varepsilon }_{0}}$, вычисляются по формулам

(4.8)
$\begin{gathered} {{z}_{0}}(t,\eta ) = - A_{4}^{{ - 1}}(t)\left( {{{A}_{3}}(t){{y}_{0}}(t,\eta ) + {{B}_{2}}(t){{P}^{{ - 1}}}\left( t \right)B_{0}^{{\text{т}}}(t){{\psi }_{{10}}}\left( {t,\eta } \right)} \right), \\ {{\psi }_{{20}}}(t,\eta ) = - {{\left( {{{A}_{2}}(t)A_{4}^{{ - 1}}(t)} \right)}^{{\text{т}}}}{{\psi }_{{10}}}(t,\eta ). \\ \end{gathered} $

Вектор-функции ${{{\text{П}}}_{0}}{{\psi }_{2}}(s,\eta )$, ${{{\text{П}}}_{0}}z(s,\eta )$, $s \leqslant 0$, ${{{\text{Q}}}_{0}}z(\tau ,\eta )$, $\tau \geqslant {\text{0}}$, $\left\| {\eta - {{\eta }_{0}}} \right\| < {{\varepsilon }_{0}}$, суть решения следующих начальных задач:

(4.9)
$d{{{\text{П}}}_{0}}{{\psi }_{2}}{\text{/}}ds = - A_{4}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{0}}{{\psi }_{2}},\quad {{{\text{П}}}_{0}}{{\psi }_{2}}(0) = H_{2}^{{\text{т}}}\nu + {{\left( {{{A}_{2}}(t{\text{*}})A_{4}^{{ - 1}}(t{\text{*}})} \right)}^{{\text{т}}}}H_{1}^{{\text{т}}}\lambda ,$
(4.10)
$\begin{gathered} d{{{\text{П}}}_{0}}z{\text{/}}ds = A_{4}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{0}}z + {{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})B_{2}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{0}}{{\psi }_{2}}(s,\eta ), \\ {{{\text{П}}}_{0}}z(0) = \int\limits_{ - \infty }^0 {G(s){{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})B_{2}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{0}}{{\psi }_{2}}(s,\eta )ds} , \\ d{{{\text{Q}}}_{0}}z{\text{/}}d\tau = A_{4}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{0}}{{z}_{0}},\quad {{{\text{Q}}}_{0}}z(0) = {{z}_{*}} - {{z}_{0}}({{t}_{*}},\eta ), \\ \end{gathered} $
где $G(s)$, $s \leqslant 0$, – решение дифференциального уравнения (3.5).

Заметим, что ${{y}^{0}}(t)$, ${{\psi }^{0}}(t)$, $t \in T$, есть решение краевой задачи (4.7) с $\lambda = {{\lambda }_{0}}$, а в силу (3.10) имеет место ${{{\text{П}}}_{0}}{{\psi }_{2}}(0,{{\eta }_{0}}) = H_{2}^{{\text{т}}}{{\sigma }_{0}}$. Тогда

(4.11)
${{y}_{0}}(t,{{\eta }_{0}}) = {{y}^{0}}(t),\quad {{\psi }_{{10}}}(t,{{\eta }_{0}}) = {{\psi }^{0}}(t),\quad t \in T,\quad {{{\text{П}}}_{0}}{{\psi }_{2}}(s,{{\eta }_{0}}) = {\text{П}}\psi (s),\quad s \leqslant 0.$

Коэффициенты разложений (4.4) с номерами $k \geqslant 1$ находятся из систем линейных дифференциальных уравнений

${{\dot {y}}_{k}} = {{A}_{1}}(t){{y}_{k}} + {{A}_{2}}(t){{z}_{k}} + {{B}_{1}}(t){{P}^{{ - 1}}}(t)B_{1}^{{\text{т}}}(t){{\psi }_{{1k}}} + {{B}_{1}}(t){{P}^{{ - 1}}}(t)B_{2}^{{\text{т}}}(t){{\psi }_{{2k}}},$
${{\dot {z}}_{{k - 1}}} = {{A}_{3}}(t){{y}_{k}} + {{A}_{4}}(t){{z}_{k}} + {{B}_{2}}(t){{P}^{{ - 1}}}(t)B_{1}^{{\text{т}}}(t){{\psi }_{{1k}}} + {{B}_{2}}(t){{P}^{{ - 1}}}(t)B_{2}^{{\text{т}}}(t){{\psi }_{{2k}}},$
${{\dot {\psi }}_{{1k}}} = M(t){{y}_{k}} - A_{1}^{{\text{т}}}(t){{\psi }_{{1k}}} - A_{3}^{{\text{т}}}(t){{\psi }_{{2k}}},\quad {{\dot {\psi }}_{{2,k - 1}}} = L(t){{z}_{{k - 1}}} - A_{2}^{{\text{т}}}(t){{\psi }_{{1k}}} - A_{4}^{{\text{т}}}(t){{\psi }_{{2k}}},$
$\frac{{d{{{\text{П}}}_{k}}y}}{{ds}} = {{A}_{1}}(t{\text{*}}){{{\text{П}}}_{{k - 1}}}y + {{A}_{2}}(t{\text{*}}){{{\text{П}}}_{{k - 1}}}z + {{B}_{1}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})\left( {B_{1}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{{k - 1}}}{{\psi }_{1}} + B_{2}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{{k - 1}}}{{\psi }_{2}}} \right) + {{{\text{П}}}_{{k - 1}}}Y(s),$$\frac{{d{{{\text{П}}}_{k}}z}}{{ds}} = {{A}_{3}}(t{\text{*}}){{{\text{П}}}_{k}}y + {{A}_{4}}(t{\text{*}}){{{\text{П}}}_{k}}z + {{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})\left( {B_{1}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{k}}{{\psi }_{1}} + B_{2}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{k}}{{\psi }_{2}}} \right) + {{{\text{П}}}_{k}}Z(s),$
$\frac{{d{{{\text{П}}}_{k}}{{\psi }_{1}}}}{{ds}} = M(t{\text{*}}){{{\text{П}}}_{{k - 1}}}y - A_{1}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{{k - 1}}}{{\psi }_{1}} - A_{3}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{{k - 1}}}{{\psi }_{2}} + {{{\text{П}}}_{{k - 1}}}{{\Psi }_{1}}(s),$
$\frac{{d{{{\text{П}}}_{k}}{{\psi }_{2}}}}{{ds}} = L(t{\text{*}}){{{\text{П}}}_{{k - 1}}}z - A_{2}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{k}}{{\psi }_{1}} - A_{4}^{{\text{т}}}(t{\text{*}}){{{\text{П}}}_{k}}{{\psi }_{2}} + {{{\text{П}}}_{k}}{{\Psi }_{2}}(s),$
$\frac{{d{{{\text{Q}}}_{k}}y}}{{d\tau }} = {{A}_{1}}({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}y + {{A}_{2}}({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}z + {{B}_{1}}({{t}_{*}}){{P}^{{ - 1}}}({{t}_{*}})\left( {B_{1}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}{{\psi }_{1}} + B_{2}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}{{\psi }_{2}}} \right) + {{{\text{Q}}}_{{k - 1}}}Y(\tau ),$
$\frac{{d{{{\text{Q}}}_{k}}z}}{{d\tau }} = {{A}_{3}}({{t}_{*}}){{{\text{Q}}}_{k}}y + {{A}_{4}}({{t}_{*}}){{{\text{Q}}}_{k}}z + {{B}_{2}}({{t}_{*}}){{P}^{{ - 1}}}({{t}_{*}})\left( {B_{1}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{k}}{{\psi }_{1}} + B_{2}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{k}}{{\psi }_{2}}} \right) + {{{\text{Q}}}_{k}}Z(\tau ),$
$\frac{{d{{{\text{Q}}}_{k}}{{\psi }_{1}}}}{{d\tau }} = M({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}y - A_{1}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}{{\psi }_{1}} - A_{3}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}{{\psi }_{2}} + {{{\text{Q}}}_{{k - 1}}}\Psi {{(\tau )}_{1}},$
$\frac{{d{{{\text{Q}}}_{k}}{{\psi }_{2}}}}{{d\tau }} = L({{t}_{*}}){{{\text{Q}}}_{{k - 1}}}z - A_{2}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{k}}{{\psi }_{1}} - A_{4}^{{\text{т}}}({{t}_{*}}){{{\text{Q}}}_{k}}{{\psi }_{2}} + {{{\text{Q}}}_{k}}{{\Psi }_{2}}(\tau ),$
с учетом дополнительных условий
${{y}_{k}}({{t}_{*}}) + {{{\text{Q}}}_{k}}y(0) = 0,\quad {{z}_{k}}({{t}_{*}}) + {{{\text{Q}}}_{k}}z(0) = 0,\quad {{\psi }_{{1k}}}({{t}_{*}}) + {{{\text{Q}}}_{k}}{{\psi }_{1}}(0) = 0,\quad {{\psi }_{{2k}}}({{t}_{*}}) + {{{\text{Q}}}_{k}}{{\psi }_{2}}(0) = 0,$
${{y}_{k}}(t{\text{*}}) + {{{\text{П}}}_{k}}y(0) = 0,\quad {{z}_{k}}(t{\text{*}}) + {{{\text{П}}}_{k}}z(0) = 0,\quad {{\psi }_{{1k}}}(t{\text{*}}) + {{{\text{П}}}_{k}}{{\psi }_{1}}(0) = 0,\quad {{\psi }_{{2k}}}(t{\text{*}}) + {{{\text{П}}}_{k}}{{\psi }_{2}}(0) = 0,$
${{{\text{Q}}}_{k}}y(\infty ) = 0,\quad {{{\text{Q}}}_{k}}z(\infty ) = 0,\quad {{{\text{Q}}}_{k}}{{\psi }_{1}}(\infty ) = 0,\quad {{{\text{Q}}}_{k}}{{\psi }_{2}}(\infty ) = 0,$
${{{\text{П}}}_{k}}y( - \infty ) = 0,\quad {{{\text{П}}}_{k}}z( - \infty ) = 0,\quad {{{\text{П}}}_{k}}{{\psi }_{1}}( - \infty ) = 0,\quad {{{\text{П}}}_{k}}{{\psi }_{2}}( - \infty ) = 0,$
где функции ${{{\text{П}}}_{k}}Y(s)$, ${{{\text{П}}}_{k}}Z(s)$, ${{{\text{П}}}_{k}}{{\Psi }_{1}}(s)$, ${{{\text{П}}}_{k}}{{\Psi }_{2}}(s)$ рекуррентно выражаются через ${{{\text{П}}}_{i}}y(s)$, ${{{\text{П}}}_{i}}z(s)$, ${{{\text{П}}}_{i}}{{\psi }_{1}}(s)$, ${{{\text{П}}}_{i}}{{\psi }_{2}}(s)$, i < k, а функции ${{{\text{Q}}}_{k}}Y(\tau )$, ${{{\text{Q}}}_{k}}Z(\tau )$, ${{{\text{Q}}}_{k}}{{\Psi }_{1}}(\tau )$, ${{{\text{Q}}}_{k}}{{\Psi }_{2}}(\tau )$ – через ${{{\text{Q}}}_{i}}y(\tau )$, ${{{\text{Q}}}_{i}}z(\tau )$, ${{{\text{Q}}}_{i}}{{\psi }_{1}}(\tau )$, ${{{\text{Q}}}_{i}}{{\psi }_{2}}(\tau )$, i < k.

Заметим, что вектор $\eta (\mu ) = \left( {\lambda (\mu ),\nu (\mu )} \right)$ множителей Лагранжа, соответствующий в силу принципа максимума оптимальному управлению, является решением системы уравнений

(4.12)
${{H}_{1}}y(t*,\eta ,\mu ) = {{g}_{1}},\quad {{H}_{2}}z(t*,\eta ,\mu ) = {{g}_{2}}.$
С помощью теоремы о неявной функции убедимся, что эта система однозначно разрешима относительно η при достаточно малых μ. Запишем ее в виде
(4.13)
$R(\eta ,\mu ) = 0,$
где
$R(\eta ,\mu ) = \left( {\begin{array}{*{20}{c}} {{{H}_{1}}y(t*,\eta ,\mu ) - {{g}_{1}}} \\ {{{H}_{2}}z(t*,\eta ,\mu ) - {{g}_{2}}} \end{array}} \right).$
В силу (4.4) и оценок (4.5) имеет место асимптотическое разложение
(4.14)
$R(\eta ,\mu )\sim \sum\limits_{k = 0}^\infty {{{\mu }^{k}}{{R}_{k}}(\eta )} ,$
в котором

(4.15)
${{R}_{0}}(\eta ) = \left( {\begin{array}{*{20}{c}} {{{H}_{1}}\left( {{{y}_{0}}(t*,\eta ) + {{\Pi }_{0}}y(0,\eta )} \right) - {{g}_{1}}} \\ {{{H}_{2}}\left( {{{z}_{0}}(t*,\eta ) + {{\Pi }_{0}}z(0,\eta )} \right) - {{g}_{2}}} \end{array}} \right),$
(4.16)
${{R}_{k}}(\eta ) = \left( {\begin{array}{*{20}{c}} {{{H}_{1}}\left( {{{y}_{k}}(t*,\eta ) + {{{\text{П}}}_{k}}y(0,\eta )} \right)} \\ {{{H}_{2}}\left( {{{z}_{k}}(t*,\eta ) + {{{\text{П}}}_{k}}z(0,\eta )} \right)} \end{array}} \right),\quad k = 1,\;2, \ldots \;.$

Положим $R(\eta ,0) = {{R}_{0}}(\eta )$, тогда вектор-функция $R(\eta ,\mu )$ будет непрерывной вместе со своими частными производными по компонентам вектора η в области $\left\| {\eta - {{\eta }_{0}}} \right\| < {{\varepsilon }_{0}}$, $0 \leqslant \mu < {{\mu }_{0}}$.

Из формул (4.6), (4.11) непосредственно следует

(4.17)
${{H}_{1}}\left( {{{y}_{0}}(t*,{{\eta }_{0}}) + {{{\text{П}}}_{0}}y(0,{{\eta }_{0}})} \right) = {{H}_{1}}{{y}^{0}}(t{\text{*}}) = {{g}_{1}}.$
Отсюда и из формул (2.4), (4.8), (4.11) получаем
(4.18)
${{z}_{0}}(t*,{{\eta }_{0}}) = - A_{4}^{{ - 1}}(t{\text{*}})\left( {{{A}_{3}}(t{\text{*}}){{y}^{0}}(t{\text{*}}) + {{B}_{2}}(t{\text{*}}){{u}^{0}}(t{\text{*}})} \right).$
В силу (3.2), (3.5), (4.10), (4.11) и формулы Коши имеем
${{{\text{П}}}_{0}}z(0,{{\eta }_{0}}) = \int\limits_{ - \infty }^0 {G(s){{B}_{2}}(t{\text{*}})u{\text{*}}(s)ds} = z{\text{*}}(0).$
Поскольку
(4.19)
${{H}_{2}}z{\text{*}}(0) = {{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{A}_{3}}(t{\text{*}}){{y}^{0}}(t{\text{*}}) + {{B}_{2}}(t{\text{*}}){{u}^{0}}(t{\text{*}})} \right) + {{g}_{2}},$
то из (4.15)–(4.18) следует $R({{\eta }_{0}},0) = {{R}_{0}}({{\eta }_{0}}) = 0.$

Непосредственным дифференцированием, учитывая формулы (4.6)(4.11), получаем, что $\partial {{R}_{0}}{{({{\eta }_{0}},0)} \mathord{\left/ {\vphantom {{({{\eta }_{0}},0)} {\partial \eta }}} \right. \kern-0em} {\partial \eta }} = \partial {{R}_{0}}{{({{\eta }_{0}})} \mathord{\left/ {\vphantom {{({{\eta }_{0}})} {\partial \eta }}} \right. \kern-0em} {\partial \eta }} = {{I}_{0}}$ (см. (3.6)). Как было отмечено, эта матрица Якоби является невырожденной. Тогда для системы (4.13) или, что то же самое, (4.12), выполнены все условия теоремы о неявной функции. Согласно этой теореме, в некоторой правосторонней окрестности нуля $0 \leqslant \mu < {{\mu }_{1}}$ однозначно определена непрерывная вектор-функция $\eta (\mu ) = \left( {\lambda (\mu ),\nu (\mu )} \right)$, удовлетворяющая уравнениям (4.12), и $\eta (0) = {{\eta }_{0}} = ({{\lambda }_{0}},{{\nu }_{0}}).$

Поскольку асимптотические приближения, построенные с помощью метода пограничных функций, носят равномерный относительно начальных данных характер (см. [17]), то разложение (4.14) будет равномерным в области $\left\| {\eta - {{\eta }_{0}}} \right\| < {{\varepsilon }_{0}}$. Вектор-функции ${{R}_{k}}(\eta )$, k = 0, 1, …, бесконечно дифференцируемы, в чем можно убедиться, проанализировав уравнения для коэффициентов разложения по методу пограничных функций. Тогда для решения $\eta (\mu ) = \left( {\lambda (\mu ),\nu (\mu )} \right)$ системы (4.13) будут иметь место асимптотические разложения (4.3). Теорема доказана.

5. ПОСТРОЕНИЕ АСИМПТОТИЧЕСКИ СУБОПТИМАЛЬНЫХ УПРАВЛЕНИЙ

Продолжим изложение алгоритма построения асимптотических приближений к решению исходной задачи, опираясь на утверждения теоремы и формулы, полученные при ее доказательстве. Как видно из доказательства теоремы, оптимальное управление в задаче (1.1)–(1.3) представимо в виде

${{u}^{0}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t){{\psi }_{1}}(t,\eta (\mu ),\mu ) + B_{2}^{{\text{т}}}(t){{\psi }_{2}}(t,\eta (\mu ),\mu )} \right),\quad t \in T.$
Вектор-функция
${{u}^{{\left( 0 \right)}}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t){{\psi }_{1}}(t,{{\eta }_{0}},\mu ) + B_{2}^{{\text{т}}}(t){{\psi }_{2}}(t,{{\eta }_{0}},\mu )} \right),\quad t \in T,$
будет асимптотически субоптимальным управлением нулевого порядка в исходной задаче. Заметим, что ее можно сформировать непосредственно после решения базовых задач. Асимптотически субоптимальное управление N-го порядка $\left( {N \geqslant 1} \right)$ имеет вид
(5.1)
${{u}^{{\left( N \right)}}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t){{\psi }_{1}}\left( {t,{{\eta }^{{\left( N \right)}}}(\mu ),\mu } \right) + B_{2}^{{\text{т}}}(t){{\psi }_{2}}\left( {t,{{\eta }^{{\left( N \right)}}}(\mu ),\mu } \right)} \right),\quad t \in T,$
где
(5.2)
${{\eta }^{{\left( N \right)}}}(\mu ) = \sum\limits_{k = 0}^N {{{\mu }^{k}}{{\eta }_{k}}} ,\quad {{\eta }_{k}} = ({{\lambda }_{k}},{{\nu }_{k}}),\quad k = 1,\;2,\; \ldots ,\;N.$
Для его построения нужно найти коэффициенты ${{\lambda }_{k}}$, ${{\nu }_{k}}$, $k = 1,\;2,\; \ldots ,\;N$, асимптотических рядов (4.3), что можно сделать методом неопределенных коэффициентов, опираясь на разложение (4.14). Конкретнее, разложим с помощью формулы Тейлора вектор-функцию
$\sum\limits_{k = 0}^N {{{\mu }^{k}}{{R}_{k}}({{\eta }^{{\left( N \right)}}}(\mu ))} $
по степеням µ до порядка N включительно и приравняем коэффициенты разложения к нулю (начиная с коэффициента при µ). В результате будем иметь невырожденные системы линейных алгебраических уравнений для последовательного нахождения векторов ${{\eta }_{k}}$, $k = 1,\;2,\; \ldots ,\;N$:
(5.3)
${{I}_{0}}{{\eta }_{1}} = - {{R}_{1}}({{\eta }_{0}}),\quad {{I}_{0}}{{\eta }_{k}} = - {{R}_{k}}({{\eta }_{0}}) - \sum\limits_{i = 1}^{k - 1} {\frac{{\partial {{R}_{i}}}}{{\partial \eta }}({{\eta }_{0}}){{\eta }_{{k - i}}}} ,\quad k \geqslant 2.$
Здесь учтено, что коэффициенты разложения (4.14) есть линейные вектор-функции. Заметим, что в силу структуры (3.6) матрицы Якоби ${{I}_{0}}$ системы (5.3) расщепляются. Последовательно решая эти системы, находим векторы ${{\eta }_{k}}$, $k = 1,\;2,\; \ldots ,\;N$, и составляем полином (5.2). Как было отмечено, вектор-функция (5.1) будет асимптотически субоптимальным управлением N-го порядка в исходной задаче. Чтобы построить это управление, нужно найти решение краевой задачи для прямой и сопряженной систем, которые являются сингулярно возмущенными и, следовательно, жесткими. Интегрирования жестких систем можно избежать, заменив в (5.1) вектор-функции ${{\psi }_{i}}(t,\eta ,\mu )$, $i = 1,\;2$, их асимптотическими приближениями
$\psi _{i}^{{\left( N \right)}}(t,\eta ,\mu ) = \sum\limits_{k = 0}^N {{{\mu }^{k}}\left( {{{\psi }_{{ik}}}(t,\eta ) + {{{\text{П}}}_{k}}{{\psi }_{i}}(s,\eta ) + {{{\text{Q}}}_{k}}{{\psi }_{i}}(\tau ,\eta )} \right)} ,$
$i = 1,\;2,\quad s = (t - t{\text{*}}){\text{/}}\mu ,\quad \tau = (t - {{t}_{*}}){\text{/}}\mu .$
Вектор-функция
${{\bar {u}}^{{\left( N \right)}}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{1}^{{\text{т}}}(t)\psi _{1}^{{\left( N \right)}}\left( {t,{{\eta }^{{\left( N \right)}}}(\mu ),\mu } \right) + B_{2}^{{\text{т}}}(t)\psi _{2}^{{\left( N \right)}}\left( {t,{{\eta }^{{\left( N \right)}}}(\mu ),\mu } \right)} \right),\quad t \in T,$
вместе с (5.1) будет асимптотически субоптимальным управлением N-го порядка в задаче (1.1)–(1.3). В частности, как следует из (2.2), (2.4), (3.2), (4.6), (4.8), (4.11), асимптотически субоптимальное управление нулевого порядка имеет вид
(5.4)
${{\bar {u}}^{{(0)}}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{0}^{{\text{т}}}(t){{\psi }^{0}}(t) + B_{2}^{{\text{т}}}(t){\text{П}}\psi \left( {{{\left( {t - t{\text{*}}} \right)} \mathord{\left/ {\vphantom {{\left( {t - t{\text{*}}} \right)} \mu }} \right. \kern-0em} \mu }} \right)} \right) = {{u}^{0}}(t) + u{\text{*}}\left( {{{(t - t{\text{*}})} \mathord{\left/ {\vphantom {{(t - t{\text{*}})} \mu }} \right. \kern-0em} \mu }} \right),\quad t \in T.$
Заметим, что асимптотическое приближение не зависит от начального состояния ${{z}_{*}}$ вектора быстрых переменных и при малом µ будет существенно отличаться от решения ${{u}^{0}}(t)$, $t \in T$, первой базовой задачи лишь в пограничном слое, т.е. в некоторой левосторонней окрестности точки $t{\text{*}}$.

Замечание 2. Для построения асимптотически субоптимального управления N-го порядка в задаче (1.1)–(1.3) достаточно найти асимптотическое приближение для $R(\eta ,\mu )$ с точностью порядка ${{\mu }^{{N + 1}}}$, а тогда предположение 2 можно ослабить, заменив его следующим требованием (см. [17]): элементы матриц, формирующих задачу, должны иметь непрерывные производные до порядка N + 2 включительно.

Построенные асимптотические приближения корней системы уравнений (4.13) можно использовать для нахождения оптимального управления ${{u}^{0}}(t,\mu )$, $t \in T$, в задаче (1.1)–(1.3) с заданным значением µ. Для этого нужно применить процедуру доводки (см. [18]), т.е. найти методом Ньютона корни системы (4.14), взяв в качестве начального приближения ${{\eta }^{{\left( N \right)}}}(\mu )$. Чтобы избежать интегрирования жестких систем, вместо матрицы $\partial R(\eta ,\mu ){\text{/}}\partial \eta $ можно воспользоваться ее асимптотическим приближением I0.

Замечание 3. При исследовании сингулярно возмущенных линейно-квадратичных задач оптимального управления традиционный подход (см. [1], [3], [4], [7]–[10]) состоит в построении асимптотики оптимальных траекторий. При этом исходная задача распадается на три невозмущенные вариационные задачи меньшей размерности. В настоящей статье строятся асимптотические приближения непосредственно к решению задачи, т.е. к оптимальному управлению. В этом случае происходит декомпозиция исходной задачи на две предельные задачи, соответственно, для медленной и быстрой переменных. Если же рассмотреть оптимальные траектории в этих двух задачах, то в первой базовой задаче (предельной для медленной переменной) в начале процесса возникает пограничный слой, который называют левым при традиционном подходе. Описывается он через решение еще одной вариационной задачи.

6. АСИМПТОТИЧЕСКИ СУБОПТИМАЛЬНЫЙ СИНТЕЗ

Программные асимптотически субоптимальные управления, разумеется, зависят от начального состояния $\left( {{{y}_{*}},{{z}_{*}},{{t}_{*}}} \right)$ динамической системы. Ранее такая зависимость нами не учитывалась, поскольку начальное состояние считалось заданным. В настоящем разделе, который посвящен построению асимптотически субоптимальной обратной связи нулевого порядка, нас будет интересовать именно эта зависимость. Она будет учтена и в обозначениях. В дальнейшем будем считать, что предположение 3 выполняется для всех ${{t}_{*}} < t{\text{*}}$. Момент $t{\kern 1pt} *$ по-прежнему считается заданным.

Введем обозначения, используя блоки фундаментальной матрицы F (см. (2.6))

(6.1)
${{С}_{1}}(t) = {{F}_{{12}}}\left( {t*,t} \right)F_{{22}}^{{ - 1}}\left( {t*,t} \right),\quad K(t) = F_{{22}}^{{ - 1}}\left( {t*,t} \right){{F}_{{21}}}(t*,t),\quad {{M}_{1}}(t) = {{H}_{1}}{{C}_{1}}(t)H_{1}^{{\text{т}}},\quad t \in T.$
Из (2.7) с учетом (6.1) получаем
(6.2)
${{\psi }^{0}}({{t}_{*}}) = F_{{22}}^{{ - 1}}\left( {t*,{{t}_{*}}} \right)H_{1}^{{\rm T}}M_{1}^{{ - 1}}({{t}_{*}})\left( {{{H}_{1}}\left( {{{F}_{{12}}}\left( {t*,{{t}_{*}}} \right)K({{t}_{*}}) - {{F}_{{11}}}\left( {t*,{{t}_{*}}} \right)} \right){{y}_{*}} + {{g}_{1}}} \right) - K({{t}_{*}}){{y}_{*}},$
(6.3)
${{\psi }^{0}}(t{\text{*}}) = H_{1}^{{\text{т}}}M_{1}^{{ - 1}}({{t}_{*}})\left( {{{H}_{1}}\left( {{{F}_{{12}}}\left( {t*,{{t}_{*}}} \right)K({{t}_{*}}) - {{F}_{{11}}}\left( {t*,{{t}_{*}}} \right)} \right){{y}_{*}} + {{g}_{1}}} \right).$
Заметим, что для всех ${{t}_{*}} < t{\text{*}}$ имеет место равенство $F\left( {t*,t} \right) = {\text{Ф}}(t)$, в котором матрица
(6.4)
${\text{Ф}}(t) = \left( {\begin{array}{*{20}{c}} {{{{\text{Ф}}}_{{{\text{11}}}}}(t)}&{{{{\text{Ф}}}_{{{\text{12}}}}}(t)} \\ {{{{\text{Ф}}}_{{{\text{21}}}}}(t)}&{{{{\text{Ф}}}_{{{\text{22}}}}}(t)} \end{array}} \right)$
с блоками размеров $n \times n$ есть решение начальной задачи
(6.5)
${{\dot {Ф}}} = - {\text{Ф}}\bar {A}(t),\quad {\text{Ф(}}t{\text{*)}} = {{E}_{{2n}}}.$
Соответственно с этим равенства (6.2), (6.3) можно записать в виде
(6.6)
${{\psi }^{0}}({{t}_{*}}) = \Phi _{{22}}^{{ - 1}}({{t}_{*}})H_{1}^{{\text{т}}}M_{1}^{{ - 1}}({{t}_{*}})\left( {{{H}_{1}}{{\Phi }_{0}}({{t}_{*}}){{y}_{*}} + {{g}_{1}}} \right) - K({{t}_{*}}){{y}_{*}},$
(6.7)
${{\psi }^{0}}({{t}_{*}}) = H_{1}^{{\text{т}}}M_{1}^{{ - 1}}({{t}_{*}})\left( {{{H}_{1}}{{{\text{Ф}}}_{{\text{0}}}}({{t}_{*}}){{y}_{*}} + {{g}_{1}}} \right),$
где

(6.8)
${{{\text{Ф}}}_{{\text{0}}}}(t) = {{{\text{Ф}}}_{{{\text{12}}}}}(t)K(t) - {{{\text{Ф}}}_{{{\text{11}}}}}(t).$

Согласно формуле Коши,

${\text{z*}}(0) = \int\limits_{ - \infty }^0 {G(s){{B}_{2}}(t{\text{*}})u{\text{*}}(s)ds} ,$
где $G(s)$, $s \leqslant 0$, – решение начальной задачи (3.5). Отсюда и из формул (3.2)–(3.4), (3.9) следует ${\text{z*}}(0) = {{С}_{3}}{\text{П}}\psi (0)$. Вместе с тем имеет место равенство (4.19), поэтому
(6.9)
${\text{П}}\psi (0) = H_{2}^{{\text{т}}}M_{3}^{{ - 1}}\left( {{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{A}_{3}}(t{\text{*}}){{y}^{0}}(t{\text{*}}) + {{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})B_{0}^{{\text{т}}}(t{\text{*}}){{\psi }^{0}}(t{\text{*}})} \right) + {{g}_{2}}} \right),$
где ${{M}_{3}} = {{H}_{2}}{{C}_{3}}H_{2}^{{\text{т}}}$. Для сокращения записи введем обозначение
(6.10)
${{C}_{0}}(t) = \left( {{{A}_{3}}(t{\text{*}}){{C}_{1}}(t) + {{B}_{2}}(t{\text{*}}){{P}^{{ - 1}}}(t{\text{*}})B_{0}^{{\text{т}}}(t{\text{*}})} \right)H_{1}^{{\text{т}}}M_{1}^{{ - 1}}(t),$
что вместе с (6.7) позволяет записать равенство (6.9) в виде
${\text{П}}\psi (0) = H_{2}^{{\text{т}}}M_{3}^{{ - 1}}\left( {{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{C}_{0}}(t{\text{*}})\left( {{{H}_{1}}{{{\text{Ф}}}_{{\text{0}}}}(t{\text{*}}){{y}_{*}} + {{g}_{1}}} \right) - {{A}_{3}}(t{\text{*}}){{{\text{Ф}}}_{{\text{0}}}}(t{\text{*}}){{y}_{*}}} \right) + {{g}_{2}}} \right).$
Тогда в силу (3.3)

(6.11)
${\text{П}}\psi (s) = {{G}^{{\text{т}}}}(s)H_{2}^{{\text{т}}}M_{3}^{{ - 1}}\left( {{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{C}_{0}}({{t}_{*}})\left( {{{H}_{1}}{{{\text{Ф}}}_{{\text{0}}}}({{t}_{*}}){{y}_{*}} + {{g}_{1}}} \right) - {{A}_{3}}(t{\text{*}}){{{\text{Ф}}}_{{\text{0}}}}({{t}_{*}}){{y}_{*}}} \right) + {{g}_{2}}} \right),\quad s \leqslant 0.$

Как видно из (5.3), (6.6), (6.11), асимптотически субоптимальное управление нулевого порядка в начальный момент времени представимо в виде

$\begin{gathered} {{{\bar {u}}}^{{\left( 0 \right)}}}({{t}_{*}},\mu ) = {{P}^{{ - 1}}}({{t}_{*}})\left( {B_{0}^{{\text{т}}}({{t}_{*}})\left( {\Phi _{{22}}^{{ - 1}}({{t}_{*}})H_{1}^{{\text{т}}}M_{1}^{{ - 1}}({{t}_{*}})\left( {{{H}_{1}}{{\Phi }_{0}}({{t}_{*}}){{y}_{*}} + {{g}_{1}}} \right) - K({{t}_{*}}){{y}_{*}}} \right) + } \right. \\ + \;\left. {B_{2}^{{\text{т}}}({{t}_{*}}){{G}^{{\text{т}}}}\left( {{{(t - t{\kern 1pt} *)} \mathord{\left/ {\vphantom {{(t - t{\kern 1pt} *)} \mu }} \right. \kern-0em} \mu }} \right)H_{2}^{{\text{т}}}M_{3}^{{ - 1}}\left( {{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{C}_{0}}({{t}_{*}})\left( {{{H}_{1}}{{{\text{Ф}}}_{{\text{0}}}}({{t}_{*}}){{y}_{*}} + {{g}_{1}}} \right) - {{A}_{3}}(t{\text{*}}){{{\text{Ф}}}_{{\text{0}}}}({{t}_{*}}){{y}_{*}}} \right) + {{g}_{2}}} \right)} \right). \\ \end{gathered} $
Поскольку $\left( {{{y}_{*}},{{z}_{*}},{{t}_{*}}} \right)$ – произвольное начальное состояние динамической системы, то по определению 2 вектор-функция
(6.12)
$\begin{gathered} {{u}^{{\left( 0 \right)}}}(y,z,t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{0}^{{\text{т}}}(t)\left( {\Phi _{{22}}^{{ - 1}}(t)H_{1}^{{\text{т}}}M_{1}^{{ - 1}}(t)\left( {{{H}_{1}}{{\Phi }_{0}}(t)y + {{g}_{1}}} \right) - K(t)y} \right) + } \right. \\ + \;\left. {B_{2}^{{\text{т}}}(t){{G}^{{\text{т}}}}\left( {{{(t - t{\text{*}})} \mathord{\left/ {\vphantom {{(t - t{\text{*}})} \mu }} \right. \kern-0em} \mu }} \right)H_{2}^{{\text{т}}}M_{3}^{{ - 1}}\left( {{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{C}_{0}}(t)\left( {{{H}_{1}}{{{\text{Ф}}}_{{\text{0}}}}(t)y + {{g}_{1}}} \right) - {{A}_{3}}(t{\text{*}}){{{\text{Ф}}}_{{\text{0}}}}(t)y} \right) + {{g}_{2}}} \right)} \right) \\ \end{gathered} $
представляет собой асимптотически субоптимальную обратную связь нулевого порядка в исходной задаче. При ее построении используются формулы (3.9), (6.1), (6.8), (6.10). Матрица $G(s)$, $s \leqslant 0$, является решением начальной задачи (3.5), а ${{{\text{Ф}}}_{{{\text{11}}}}}(t)$, ${{{\text{Ф}}}_{{{\text{12}}}}}(t)$, ${{{\text{Ф}}}_{{{\text{21}}}}}(t)$, ${{{\text{Ф}}}_{{{\text{22}}}}}(t)$ – блоки матрицы (6.4), удовлетворяющей дифференциальному уравнению (6.5).

Введя обозначения

$\begin{gathered} {{D}_{1}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{0}^{{\text{т}}}(t)\left( {\Phi _{{22}}^{{ - 1}}(t)H_{1}^{{\text{т}}}M_{1}^{{ - 1}}(t){{H}_{1}}{{\Phi }_{0}}(t) - K(t)} \right) + } \right. \\ + \left. {\;B_{2}^{{\text{т}}}(t){{G}^{{\text{т}}}}\left( {{{(t - t{\text{*}})} \mathord{\left/ {\vphantom {{(t - t{\text{*}})} \mu }} \right. \kern-0em} \mu }} \right)H_{2}^{{\text{т}}}M_{3}^{{ - 1}}{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}})\left( {{{C}_{0}}(t){{H}_{1}}{{{\text{Ф}}}_{{\text{0}}}}(t) - {{A}_{3}}(t{\text{*}}){{{\text{Ф}}}_{{\text{0}}}}(t)} \right)} \right), \\ \end{gathered} $
$\begin{gathered} {{D}_{2}}(t,\mu ) = {{P}^{{ - 1}}}(t)\left( {B_{0}^{{\text{т}}}(t)\Phi _{{22}}^{{ - 1}}(t)H_{1}^{{\text{т}}}M_{1}^{{ - 1}}(t){{g}_{1}} + } \right. \\ + \;\left. {B_{2}^{{\text{т}}}(t){{G}^{{\text{т}}}}\left( {{{(t - t{\text{*}})} \mathord{\left/ {\vphantom {{(t - t{\text{*}})} \mu }} \right. \kern-0em} \mu }} \right)H_{2}^{{\text{т}}}M_{3}^{{ - 1}}\left( {{{H}_{2}}A_{4}^{{ - 1}}(t{\text{*}}){{C}_{0}}(t){{g}_{1}} + {{g}_{2}}} \right)} \right), \\ \end{gathered} $
асимптотически субоптимальную связь нулевого порядка можно записать в виде
${{u}^{{\left( 0 \right)}}}(y,z,t,\mu ) = {{D}_{1}}(t,\mu )y + {{D}_{2}}(t,\mu ).$
Отметим, что асимптотически субоптимальная обратная связь нулевого порядка не зависит от текущей позиции вектора быстрых переменных z.

7. ПРИМЕР

Рассмотрим задачу, которая моделирует процесс управления движением материальной точки малой массы по горизонтальной плоскости с учетом силы сопротивления среды, которая пропорциональна скорости точки:

${{\dot {y}}_{1}} = {{z}_{1}},\quad {{\dot {y}}_{2}} = {{z}_{2}},\quad \mu {{\dot {z}}_{1}} = - c{{z}_{1}} + b{{u}_{1}},\quad \mu {{\dot {z}}_{2}} = - c{{z}_{2}} + b{{u}_{2}},$
(7.1)
$\begin{gathered} {{y}_{1}}({{t}_{*}}) = {{y}_{{*1}}},\quad {{y}_{2}}({{t}_{*}}) = {{y}_{{*2}}},\quad {{z}_{1}}({{t}_{*}}) = {{z}_{{*1}}},\quad {{z}_{2}}({{t}_{*}}) = {{z}_{{*2}}}, \\ {{y}_{1}}(t{\text{*}}) = 0,\quad {{z}_{1}}(t{\text{*}}) = 0,\quad {{z}_{2}}(t{\text{*}}) = 0, \\ \end{gathered} $
$J(u) = \frac{1}{2}\int\limits_{{{t}_{*}}}^{t*} {(a_{1}^{2}y_{1}^{2} + a_{2}^{2}y_{2}^{2} + u_{1}^{2} + u_{2}^{2})dt \to \min .} $
Все постоянные положительны, при этом $\mu \ll 1$. Построим асимптотически субоптимальные управление и обратную связь нулевого порядка в этой задаче. Предположения 1, 2 в данном случае выполнены.

Динамическая система в первой базовой задаче

${{\dot {y}}_{1}} = {{b{{u}_{1}}} \mathord{\left/ {\vphantom {{b{{u}_{1}}} c}} \right. \kern-0em} c},\quad {{\dot {y}}_{2}} = {{b{{u}_{2}}} \mathord{\left/ {\vphantom {{b{{u}_{2}}} c}} \right. \kern-0em} c},\quad {{y}_{1}}({{t}_{*}}) = {{y}_{{*1}}},\quad {{y}_{2}}({{t}_{*}}) = {{y}_{{*2}}},\quad {{y}_{1}}(t{\text{*}}) = 0,$
${{J}_{1}}(u) = \frac{1}{2}\int\limits_{{{t}_{*}}}^{t*} {(a_{1}^{2}y_{1}^{2} + a_{2}^{2}y_{2}^{2} + u_{1}^{2} + u_{2}^{2})dt \to \min } $
удовлетворяет предположению 3, а оптимальное управление имеет вид

(7.2)
$u_{1}^{0}(t) = - {{a}_{1}}\frac{{{\text{сh}}\left( {\frac{{{{a}_{1}}b}}{c}\left( {t{\text{*}} - t} \right)} \right)}}{{{\text{sh}}\left( {\frac{{{{a}_{1}}b}}{c}\left( {t{\text{*}} - {{t}_{*}}} \right)} \right)}}{{y}_{{*1}}},\quad u_{2}^{0}(t) = - {{a}_{2}}\frac{{{\text{sh}}\left( {\frac{{{{a}_{2}}b}}{c}\left( {t{\text{*}} - t} \right)} \right)}}{{{\text{ch}}\left( {\frac{{{{a}_{2}}b}}{c}\left( {t{\text{*}} - {{t}_{*}}} \right)} \right)}}{{y}_{{*2}}},\quad t \in [{{t}_{*}},t{\kern 1pt} *{\kern 1pt} ].$

Для динамической системы во второй базовой задаче

${{d{{z}_{1}}} \mathord{\left/ {\vphantom {{d{{z}_{1}}} {ds}}} \right. \kern-0em} {ds}} = - c{{z}_{1}} + b{{u}_{1}},\quad {{d{{z}_{2}}} \mathord{\left/ {\vphantom {{d{{z}_{2}}} {ds}}} \right. \kern-0em} {ds}} = - c{{z}_{2}} + b{{u}_{2}},\quad {{z}_{i}}( - \infty ) = 0,\quad i = 1,\;2,$
${{z}_{1}}(0) = \frac{b}{c}\frac{{{{a}_{1}}}}{{{\text{sh}}\left( {\frac{{{{a}_{i}}b}}{c}\left( {t{\text{*}} - {{t}_{*}}} \right)} \right)}}{{y}_{{*1}}},$
${{z}_{2}}(0) = 0,$
${{J}_{2}}(u) = \frac{1}{2}\int\limits_{ - \infty }^0 {(u_{1}^{2} + u_{2}^{2})ds \to \min } $
выполнено предположение 4. Решением этой задачи является управление

(7.3)
$u_{1}^{*}(s) = \frac{{2{{a}_{1}}\exp (cs)}}{{{\text{sh}}\left( {\frac{{{{a}_{1}}b}}{c}\left( {t{\text{*}} - {{t}_{*}}} \right)} \right)}}{{y}_{{*1}}},\quad u_{2}^{*}(s) = 0,\quad s \leqslant 0.$

Согласно (5.3), асимптотически субоптимальное управление нулевого порядка в задаче (7.1) представимо в виде

(7.4)
$\bar {u}_{i}^{{(0)}}(t,\mu ) = u_{i}^{0}(t) + u_{i}^{*}\left( {{{\left( {t - t{\text{*}}} \right)} \mathord{\left/ {\vphantom {{\left( {t - t{\text{*}}} \right)} \mu }} \right. \kern-0em} \mu }} \right),\quad t \in [{{t}_{*}},t{\kern 1pt} *{\kern 1pt} ],\quad i = 1,\;2.$
Слагаемые $u_{i}^{0}(t)$, $u_{i}^{*}\left( {{{\left( {t - t{\text{*}}} \right)} \mathord{\left/ {\vphantom {{\left( {t - t{\text{*}}} \right)} \mu }} \right. \kern-0em} \mu }} \right)$, i = 1, 2, задаются формулами (7.2), (7.3).

Асимптотически субоптимальная обратная связь нулевого порядка, которая строится по формулам (3.5), (3.9), (6.1), (6.8), (6.10), (6.12) имеет вид

(7.5)
$\begin{gathered} u_{1}^{{\left( 0 \right)}}(y,z,t,\mu ) = - {{a}_{1}}\left( {{\text{cth}}\left( {\frac{{{{a}_{1}}b}}{c}\left( {t{\text{*}} - t} \right)} \right) - \frac{{2\exp \left( {c\left( {t - t{\text{*}}} \right){\text{/}}\mu } \right)}}{{{\text{sh}}\left( {\frac{{{{a}_{1}}b}}{c}\left( {t{\text{*}} - t} \right)} \right)}}} \right){{y}_{1}}, \\ u_{2}^{{\left( 0 \right)}}(y,z,t,\mu ) = {{a}_{2}}{\text{th}}\left( {\frac{{{{a}_{2}}b}}{c}\left( {t{\text{*}} - t} \right)} \right){{y}_{2}}. \\ \end{gathered} $

Для оценки качества построенных асимптотических приближений к решению задачи (7.1) были найдены невязки $\left( {{{y}_{1}}(t*,\mu ),{{z}_{1}}(t*,\mu ),{{z}_{2}}(t*,\mu )} \right)$ в терминальных ограничениях при управлении (7.4) для конкретных значений малого параметра в случае, когда ${{a}_{1}} = 1$, ${{a}_{2}} = 2$, $b = 4$, $c = 3$, ${{t}_{*}} = 0$, $t{\kern 1pt} * = 5$, ${{y}_{{*1}}} = 2$, ${{y}_{{*1}}} = 1$, ${{z}_{{*1}}} = 1$, ${{z}_{{*2}}} = 2$. В частности, оказалось, что

${{y}_{1}}(5,\;0.1) = {\text{0}}{\text{.034578,}}\quad {{z}_{1}}(5,\;0.1) = {\text{0}}{\text{.00338,}}\quad {{z}_{2}}(5,\;0.1) = {\text{0,}}$
${{y}_{1}}(5,\;0.01) = {\text{0}}{\text{.003458,}}\quad {{z}_{1}}(5,\;0.01) = {\text{0}}{\text{.000339,}}\quad {{z}_{2}}(5,\;0.01) = 0.$
Результаты вычислений приведены с точностью до 10–6.

ЗАКЛЮЧЕНИЕ

В статье предложены и обоснованы вычислительные процедуры построения асимптотических приближений к решению рассмотренной задачи в виде программы и обратной связи. При применении предлагаемых алгоритмов задача распадается на две невозмущенные задачи оптимального управления меньшей размерности. Такая декомпозиция позволяет эффективно решать задачи оптимизации динамических систем с большим числом фазовых переменных. Кроме того, вычислительные процедуры алгоритмов не содержат интегрирований сингулярно возмущенных систем, которые являются жесткими.

Список литературы

  1. Дмитриев М.Г., Курина Г.А. Сингулярные возмущения в задачах управления // Автоматика и телемехан. 2006. № 1. С. 3–51.

  2. Калинин А.И. Асимптотика решений возмущенных задач оптимального управления // Изв. РАН. Техн. кибернетика. 1994. № 3. С. 104–114.

  3. Zhang Y., Naidu D.S., Cai C., Zou Y. Singular perturbation and time scales in control theories and applications. An overview 2002–2012 // Int. J. Information and Systems Sciences. 2014. V. 9. № 1. P. 1–36.

  4. Kokotovic P.V., Khalil H.K. Singular perturbations in systems and control. New York: IEEE Press, 1986.

  5. Ракитский Ю.В., Устинов С.М., Черноруцкий И.Г. Численные методы решения жестких систем. М.: Наука, 1979.

  6. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1983.

  7. Kokotovic P.V., Jackel R.A. Singular perturbation of linear regulators: basic theorems // IEEE Trans. Automat. Control. 1972. V. 17. № 1. P. 29–37.

  8. Wilde R.R., Kokotovic P.V. Optimal open – and closed loop control of singularly perturbed linear systems // IEEE Trans. Automat. Control. 1973. V. 18. № 6. P. 616–626.

  9. Глизер В.Я., Дмитриев М.Г. Сингулярные возмущения в линейной задаче оптимального управления с квадратичным функционалом // Докл. АН СССР. 1975. Т. 225. № 5. С. 997–1000.

  10. O’Malley R.E., Jr. Singular perturbation and optimal control // Lecture Notes. Math. 1978. V. 680. P. 171–218.

  11. Калинин А.И., Лавринович Л.И. Асимптотика решения сингулярно возмущенной линейно-квадратичной задачи оптимального управления // Ж. вычис. матем. и матем. физ. 2015. Т. 55. № 2. С. 194–206.

  12. Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. М.: Наука, 1971.

  13. Калинин А.И. О проблеме синтеза оптимальных систем управления // Ж. вычисл. матем. и матем. физ. 2018. Т. 58. № 3. С. 397–402.

  14. Мордухович Б.Ш. Существование оптимальных управлений // Соврем. пробл. матем. (Итоги науки и техники) М.: ВИНИТИ, 1976. Т. 6. С. 207–271.

  15. Калинин А.И., Лавринович Л.И. Асимптотика решения сингулярно возмущенной линейно-квадратичной задачи оптимального управления с терминальными ограничениями на траектории // Автоматика и телемехан. 2020. № 6. С. 29–46.

  16. Есипова В.А. Асимптотика решения краевой задачи для сингулярно возмущенных систем обыкновенных дифференциальных уравнений условно устойчивого типа // Дифференц. ур-ния. 1975. Т. 11. № 11. С. 1957–1966.

  17. Васильева А.Б., Бутузов В.Ф. Асимптотические разложения решений сингулярно возмущенных уравнений. М.: Наука, 1973.

  18. Габасов Р., Кириллова Ф.М. Конструктивные методы оптимизации. Ч. 2. Минск: Университетское, 1984.

Дополнительные материалы отсутствуют.