Журнал вычислительной математики и математической физики, 2020, T. 60, № 2, стр. 177-196

Динамика, фазовые ограничения и линейное программирование

А. С. Антипин 1*, Е. В. Хорошилова 2**

1 ВЦ ФИЦ ИУ РАН
119333 Москва, ул. Вавилова, 40, Россия

2 МГУ им. М.В. Ломоносова, ВМК
119991 Москва, Ленинские горы, Россия

* E-mail: asantip@yandex.ru
** E-mail: khorelena@gmail.com

Поступила в редакцию 05.08.2019
После доработки 05.08.2019
Принята к публикации 18.09.2019

Полный текст (PDF)

Аннотация

В работе рассматривается новый подход к решению задач терминального управления с фазовыми ограничениями, основанный на достаточных условиях оптимальности. Основу подхода составляют лагранжев формализм и теория двойственности. Исследуется линейная управляемая динамика при наличии фазовых ограничений. Сечение фазовых ограничений в определенные моменты времени (на дискретной сетке) приводит к появлению новых промежуточных задач оптимального управления без фазовых ограничений. Эти задачи порождают промежуточные решения в промежуточных пространствах. Объединение всех промежуточных задач, в свою очередь, приводит к исходной задаче на всем отрезке времени. В каждом промежуточном пространстве мы имеем многогранное множество, полученное в результате сечения фазовых ограничений. На основе этого множества формируется задача линейного программирования. Таким образом, на каждом маленьком отрезке между двумя точками сечения формируется полноценная промежуточная задача оптимального управления с фиксированным левым концом и подвижным правым концом фазовой траектории. Правый конец порождает множество достижимости и одновременно является решением для промежуточной краевой задачи линейного программирования. Полученное решение, в свою очередь, является начальным условием для следующей промежуточной задачи оптимального управления. Для решения промежуточной задачи оптимального управления предлагается седловой метод экстраградиентного типа. Доказывается сходимость метода к решению по всем переменным задачи оптимального управления. Свойство сходимости гарантирует получение решения задачи с заданной точностью. Библ. 12.

Ключевые слова: оптимальное управление, функция Лагранжа, двойственность, лагранжев формализм, фазовые ограничения, промежуточные задачи, седловые методы, сходимость.

1. ПОСТАНОВКА ЗАДАЧИ

Рассматривается линейная динамическая управляемая система, определенная на заданном отрезке времени $[{{t}_{0}},{{t}_{S}}]$, с фиксированным левым и подвижным правым концом и с фазовыми ограничениями на траекторию. Динамика управляемой фазовой траектории $x(t)$ описывается линейной системой дифференциальных уравнений с неявно заданным условием на правом конце временного отрезка. Терминальное условие определяется как решение задачи линейного программирования, которое заранее неизвестно. При этом правый конец фазовой траектории выбором управления должен попасть в решение краевой задачи. Задача управления динамической системой рассматривается в гильбертовом функциональном пространстве. Формально все сказанное в случае непрерывных фазовых ограничений можно представить в виде задачи

(1)
$\begin{gathered} \frac{d}{{dt}}x(t) = D(t)x(t) + B(t)u(t),\quad x({{t}_{0}}) = {{x}_{0}},\quad x({{t}_{S}}) = x_{S}^{*}, \\ G(t)x(t) \leqslant g(t),\quad {{t}_{0}} \leqslant t \leqslant {{t}_{S}},\quad u(t) \in {\text{U}}, \\ x_{S}^{*} \in {\text{Argmin}}\{ \left\langle {\varphi ,{{x}_{S}}} \right\rangle \,{\text{|}}\,{{G}_{S}}{{x}_{S}} \leqslant {{g}_{S}},\;{{x}_{S}} \in {{\mathbb{R}}^{n}}\} , \\ \end{gathered} $
где $D(t),\;B(t),\;G(t)$ есть непрерывные матрицы размера $n \times n$, $n \times r$, $m \times n$ соответственно; $g(t)$ есть заданный непрерывный вектор-функция; ${{G}_{S}} = G({{t}_{S}})$, ${{g}_{S}} = g({{t}_{S}})$, ${{x}_{S}} = x({{t}_{S}})$ – значения матрицы и векторов на правом конце отрезка; $\varphi $ – заданный вектор (нормаль к линейному целевому функционалу), ${{x}_{0}}$ есть заданный вектор. Управления $u(t)$ при каждом $t \in [{{t}_{0}},{{t}_{S}}]$ принадлежат множеству U – выпуклому компакту из ${{\mathbb{R}}^{r}}$.

Чтобы решить дифференциальную систему в (1), необходимо использовать начальное условие ${{x}_{0}}$ и некоторое управление $u(t) \in {\text{U}}$. Для каждого допустимого $u(t)$ в рамках классических теорем мы получаем единственную фазовую траекторию $x(t)$. Правый конец оптимальной траектории должен совпасть с конечномерным решением краевой задачи, т.е. $x{\text{*}}({{t}_{S}}) = x_{S}^{*}$. (Звездочка означает, что $x_{S}^{*}$ есть решение краевой задачи оптимизации). Управление должно быть выбрано так, чтобы дополнительно выполнялись фазовые ограничения. Эти ограничения в дальнейшем мы будем называть “фазовой трубкой”. При этом левый конец траектории ${{x}_{0}}$ не является объектом оптимизации.

Поставленная задача с фазовыми ограничениями относится к числу трудных задач. Традиционно задачи оптимального управления (без краевой задачи) исследуются в рамках гамильтонова формализма, вершиной которого является принцип максимума. Этот принцип представляет собой необходимое условие оптимальности и является доминирующим инструментом для исследования динамических управляемых задач. Однако задача (1) является выпуклой, и представляется более разумным исследовать ее в рамках лагранжева формализма. Тем более что класс выпуклых задач в оптимальном управлении является достаточно обширным, и почти любую гладкую задачу можно приблизить выпуклой, квадратичной или линейной.

Задача (1) без фазовых ограничений была исследована авторами в работах [1]–[10]. В линейно-выпуклом случае, опираясь на седловые неравенства функции Лагранжа, авторы доказали сходимость экстраградиентных и экстрапроксимальных (т.е. седловых) методов к решению задачи терминального управления по всем компонентам решения: слабую сходимость по управлениям, сильную (по норме пространства) – по фазовым и сопряженным траекториям, а также по терминальным переменным краевой задачи. Это оказалось возможным благодаря тому факту, что седловые неравенства функции Лагранжа в рассматриваемом случае представляют собой достаточные условия оптимальности. Эти условия, в отличие от необходимых условий принципа максимума, позволяют развивать доказательную (без эвристики) теорию методов решения задач оптимального управления, что и было продемонстрировано в [1]–[10].

Наличие непрерывных фазовых ограничений в задаче (1) порождает серьезные проблемы. Они связаны с тем, что в функциональном пространстве не всегда выполняется условие регулярности Слейтера, которое гарантирует существование седловой точки. Выполнение условия Слейтера в функциональных пространствах зависит от топологии пространства [11], [12]. В частности, в гильбертовом пространстве ${\text{L}}_{2}^{n}[{{t}_{0}},{{t}_{S}}]$, в котором мы будем рассматривать нашу задачу, условие Слейтера может не выполняться для фазовых ограничений из (1). Последнее зависит от множества, на котором происходит оптимизация целевой функции. Типичным контрвозражением являются следующие рассуждения.

Предположим существование функции ${{x}^{c}}(t)$, для которой при всех $t \in [{{t}_{0}},{{t}_{S}}]$ выполняется условие Слейтера $G(t){{x}^{c}}(t) < g(t)$. Тогда всегда можно указать другую функцию $x{\text{'}}(t)$, которая совпадает с ${{x}^{c}}(t)$ на всем отрезке $[{{t}_{0}},{{t}_{S}}]$, за исключением небольшого $\varepsilon $-отрезка, на котором функция $x{\text{'}}(t)$ делает длинный узкий выброс своих значений за пределы границ фазовых ограничений. При этом по норме пространства ${\text{L}}_{2}^{n}[{{t}_{0}},{{t}_{S}}]$ функция $x{\text{'}}(t)$ может быть сколь угодно близка к ${{x}^{c}}(t)$. Последнее означает, что все точки $x(t)$ множества $G(t)x(t) \leqslant g(t)$ являются граничными в пространстве ${\text{L}}_{2}^{n}[{{t}_{0}},{{t}_{S}}]$. Здесь не учитывается то обстоятельство, что множество, для которого мы хотим выполнения условия Слейтера, состоит из абсолютно непрерывных функций, порожденных конкретным дифференциальным уравнением.

Независимо от приведенных выше рассуждений, в работе рассматривается подход, основанный на сечениях фазовых ограничений (“трубки”) и соответственно всей задачи в целом в определенные моменты времени. В этом подходе не требуется существование функциональной седловой точки. Если ее нет, то достаточно существования конечномерных седловых точек в промежуточных пространствах, которые порождены сечениями “трубки” в заданные моменты времени отрезка. В этом случае мы можем провести фазовую траекторию через все сечения фазовой “трубки” (фазовых ограничений).

Рассмотрим подход, в котором в заданные моменты времени $t \in [{{t}_{0}},{{t}_{S}}]$ в системе (1) мы можем осуществить сечение задачи, включая и фазовые ограничения. Введем дискретизацию отрезка $[{{t}_{0}},{{t}_{S}}]$:

$\Gamma = \{ {{t}_{0}},{{t}_{1}},...,{{t}_{{s - 1}}},{{t}_{s}},{{t}_{{s + 1}}},...,{{t}_{S}}\} .$
При этом исходная задача разбивается (декомпозируется) на конечное число промежуточных задач терминального управления, каждая из которых сформулирована на своем отрезке разбиения временного промежутка $[{{t}_{{s - 1}}},{{t}_{s}}]$, $s = \overline {1,S} $. Каждой точке разбиения $\Gamma = \{ {{t}_{0}},{{t}_{1}},...,{{t}_{{s - 1}}},{{t}_{s}},{{t}_{{s + 1}}},...,{{t}_{S}}\} $ (включая и концы отрезков) соответствует конечномерное промежуточное пространство ${{\mathbb{R}}^{n}}$. Сечения фазовых ограничений в промежуточные моменты времени ${{t}_{s}}$ порождают в пространствах ${{\mathbb{R}}^{n}}$ выпуклые многогранные множества. На базе этих многогранников формулируются конечномерные задачи линейного (выпуклого) программирования, для которых условие Слейтера уже выполняется. При достаточно плотной дискретизации (в случае малого шага) семейство многогранников-ограничений можно рассматривать как аппроксимацию непрерывной “трубки” фазовых ограничений.

За исключением дискретных фазовых ограничений, в остальном задача (1) остается непрерывной. Объединение траекторий и других компонент задачи по всем отрезкам времени приводит к итоговому решению исходной задачи. Подход, основанный на сечениях, можно трактовать как метод декомпозиции сложной задачи на ряд простых.

Уточним постановку задачи. В каждой точке временного отрезка $[{{t}_{0}},{{t}_{S}}]$, включая точки дискретизации, определена абсолютно непрерывная фазовая траектория $x(t)$, которая является решением системы дифференциальных уравнений из (1) при выбранных $u(t) \in {\text{U}}$ и ${{x}_{0}}$. Каждой точке дискретизации поставлено в соответствие конечномерное промежуточное пространство, размерность которого совпадает с размерностью вектора $x({{t}_{s}}) \in {{\mathbb{R}}^{n}}$. В пространстве сформулирована конечномерная задача линейного (выпуклого) программирования. Искомая траектория на всем отрезке должна проходить через все решения указанных промежуточных задач.

На каждом из отрезков $[{{t}_{{s - 1}}},{{t}_{s}}]$ определен свой участок фазовой траектории, которую мы обозначим как ${{x}_{s}}(t)$. В общей точке отрезков $[{{t}_{{s - 1}}},{{t}_{s}}]$, $[{{t}_{s}},{{t}_{{s + 1}}}]$ значения ${{x}_{s}}({{t}_{s}})$ и ${{x}_{{s + 1}}}({{t}_{s}})$ будут совпадать по построению метода: ${{x}_{s}}({{t}_{s}}) = {{x}_{{s + 1}}}({{t}_{s}})$, т.е. на каждом из отрезков разбиения правый конец траектории совпадает с начальной точкой траектории на следующем отрезке.

Теперь задачу (1) можно представить в форме

(2)
$\begin{gathered} \frac{d}{{dt}}{{x}_{s}}(t) = D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t),\quad t \in [{{t}_{{s - 1}}},{{t}_{s}}],\quad {{x}_{s}}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),\quad {{x}_{s}}({{t}_{s}}) = x_{s}^{*},\quad {{u}_{s}}(t) \in {\text{U}}, \\ x_{1}^{*} \in {\text{Argmin}}\{ \left\langle {\varphi ,{{x}_{1}}} \right\rangle \,{\text{|}}\,{{G}_{1}}{{x}_{1}} \leqslant {{g}_{1}},\;{{x}_{1}} \in {{\mathbb{R}}^{n}}\} ,\quad x_{1}^{*} \in {{X}_{1}}, \\ x_{2}^{*} \in {\text{Argmin}}\{ \left\langle {\varphi ,{{x}_{2}}} \right\rangle \,{\text{|}}\,{{G}_{2}}{{x}_{2}} \leqslant {{g}_{2}},\;{{x}_{2}} \in {{\mathbb{R}}^{n}}\} ,\quad x_{2}^{*} \in {{X}_{2}}, \\ \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\ x_{S}^{*} \in {\text{Argmin}}\{ \left\langle {\varphi ,{{x}_{S}}} \right\rangle \,{\text{|}}\,{{G}_{S}}{{x}_{S}} \leqslant {{g}_{S}},\;{{x}_{S}} \in {{\mathbb{R}}^{n}}\} ,\quad x_{S}^{*} \in {{X}_{S}}. \\ \end{gathered} $
Здесь ${{x}_{s}}({{t}_{s}})$ – значения функций ${{x}_{s}}(t)$ на правом конце отрезка $[{{t}_{{s - 1}}},{{t}_{s}}]$, $x_{s}^{*}$ – решение $s$-й промежуточной задачи линейного программирования; ${{X}_{s}}$ – промежуточные множества достижимости; ${{G}_{s}} = G({{t}_{s}})$, ${{g}_{s}} = g({{t}_{s}})$, $s = \overline {1,S} $.

Под решением управляемой системы (2) будем понимать следующее: требуется на множестве управлений $u(t)$ (состоящих из кусков ${{u}_{s}}(t) \in {\text{U}}$) выбрать такое управление $u{\text{*}}(t) \in {\text{U}}$, что на каждом отрезке $[{{t}_{{s - 1}}},{{t}_{s}}]$ отвечающая этому управлению единственная траектория $x_{s}^{*}(t)$ дифференциальной системы соединяет свое начальное значение $x_{s}^{*}({{t}_{{s - 1}}})$ с терминальным решением задачи $x_{s}^{*}({{t}_{s}})$, пройдя последовательно через все решения $x_{s}^{*}$ промежуточных задач. Таким образом, задача с номером $s$ представляет собой на отрезке $[{{t}_{{s - 1}}},{{t}_{s}}]$ самостоятельную задачу терминального управления с фиксированным левым и подвижным правым концом. Задача линейного программирования на правом конце фазовой траектории неявно определяет терминальное условие задачи. Итоговую фазовую траекторию и управление получаем как объединение всех полученных участков

$x{\text{*}}(t) = \bigcup\limits_{s = 1}^S {x_{s}^{*}(t)} ,\quad u{\text{*}}(t) = \bigcup\limits_{s = 1}^S {u_{s}^{*}(t)} ,$
где $t \in [{{t}_{{s - 1}}},{{t}_{s}}]$, $s = \overline {1,S} $, $t \in [{{t}_{0}},{{t}_{S}}]$.

2. ПРОМЕЖУТОЧНЫЕ ЗАДАЧИ

Для большей наглядности представим систему (2) в развернутой форме. Дискретизация $\Gamma $ порождает временные отрезки $[{{t}_{{s - 1}}},{{t}_{s}}]$, на которых определены функции ${{x}_{s}}(t)$ при всех $s = \overline {1,S} $ (функции проиндексированы по правым концам своих отрезков). Каждая из этих функций является сужением фазовой траектории $x(t)$ на отрезок $[{{t}_{{s - 1}}},{{t}_{s}}]$. В этой модели на каждом $s$-м отрезке времени $[{{t}_{{s - 1}}},{{t}_{s}}]$ определена $s$-я управляемая динамика ${{x}_{s}}(t)$ и $s$-я промежуточная задача:

$\begin{gathered} \frac{d}{{dt}}{{x}_{1}}(t) = D(t){{x}_{1}}(t) + B(t){{u}_{1}}(t),\quad t \in [{{t}_{0}},{{t}_{1}}],\quad {{x}_{1}}({{t}_{0}}) = {{x}_{0}},\quad {{x}_{1}}({{t}_{1}}) = x_{1}^{*},\quad {{u}_{1}}(t) \in {\text{U}}, \\ x_{1}^{ * } \in {\text{Argmin}}\{ \left\langle {\varphi ,{{x}_{1}}} \right\rangle \,{\text{|}}\,{{G}_{1}}{{x}_{1}} \leqslant {{g}_{1}},\;{{x}_{1}} \in {{\mathbb{R}}^{n}}\} ,\quad x_{1}^{*} \in {{X}_{1}}, \\ \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\ \end{gathered} $
(3)
$\begin{gathered} \frac{d}{{dt}}{{x}_{s}}(t) = D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t),\quad t \in [{{t}_{{s - 1}}},{{t}_{s}}],\quad {{x}_{s}}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*},\quad {{x}_{s}}({{t}_{s}}) = x_{s}^{*},\quad {{u}_{s}}(t) \in {\text{U}}, \\ x_{s}^{*} \in {\text{Argmin}}\{ \left\langle {\varphi ,{{x}_{s}}} \right\rangle \,{\text{|}}\,{{G}_{s}}{{x}_{s}} \leqslant {{g}_{s}},\;{{x}_{s}} \in {{\mathbb{R}}^{n}}\} ,\quad x_{s}^{*} \in {{X}_{s}}, \\ \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\ \end{gathered} $
$\begin{gathered} \frac{d}{{dt}}{{x}_{S}}(t) = D(t){{x}_{S}}(t) + B(t){{u}_{S}}(t),\quad t \in [{{t}_{{S - 1}}},{{t}_{S}}],\quad {{x}_{S}}({{t}_{{S - 1}}}) = x_{{S - 1}}^{*},\quad {{x}_{S}}({{t}_{S}}) = x_{S}^{*},\quad {{u}_{S}}(t) \in {\text{U}}, \\ x_{S}^{*} \in Arg\min \{ \left\langle {\varphi ,{{x}_{S}}} \right\rangle \,{\text{|}}\,{{G}_{S}}{{x}_{S}} \leqslant {{g}_{S}},\;{{x}_{S}} \in {{\mathbb{R}}^{n}}\} ,\quad x_{S}^{*} \in {{X}_{S}}. \\ \end{gathered} $

Итак, в рамках предлагаемого подхода исходная задача с фазовыми ограничениями (1) расщепляется на конечную последовательность самостоятельных промежуточных задач терминального управления без фазовых ограничений. Далее предполагается, что каждая промежуточная задача решается независимо друг от друга, начиная с первой. Первая задача имеет для своего дифференциального уравнения начальное условие ${{x}_{1}}({{t}_{0}}) = {{x}_{0}}$ и произвольное первое приближение ${{u}_{1}}(t)$. Этой информации достаточно, чтобы в рамках классического анализа найти решение дифференциального уравнения на первом временном отрезке. В данной работе описывается итеративный метод седлового типа, с помощью которого можно найти оптимальное решение задачи терминального управления с фиксированным левым концом и подвижным правым концом фазовой траектории. Терминальное условие на правом конце траектории задается неявно в виде решения задачи линейного программирования в конечномерном промежуточном пространстве, которое порождено как сечение фазового ограничения. Тогда задача терминального управления сводится к тому, чтобы выбором управления попасть правым концом траектории в решение конечномерной задачи линейного программирования. Решение конечномерной задачи принадлежит пересечению допустимого множества и множества достижимости, которое по определению образуют все правые концы фазовых траекторий, когда управления пробегают все множество управлений.

При использовании данного подхода, на отрезке $[{{t}_{0}},{{t}_{1}}]$ траектория $x_{1}^{*}(t)$ вначале соединяет точку $x_{1}^{*}({{t}_{0}})$, которая предполагается известной как начальное условие, и точку $x_{1}^{*}({{t}_{1}})$, которая является решением первой краевой задачи системы (3) на допустимом множестве. Допустимое множество, которое представляет собой пересечение многогранника $\{ {{x}_{1}}:{{G}_{1}}{{x}_{1}} \leqslant {{g}_{1}},\;{{x}_{1}} \in {{\mathbb{R}}^{n}}\} $ и множества достижимости ${{X}_{1}} \subset {{\mathbb{R}}^{n}}$, предполагается непустым. На следующем отрезке $[{{t}_{1}},{{t}_{2}}]$ траектория $x_{2}^{*}(t)$ соединяет точки $x_{1}^{*}$ и $x_{2}^{*}$, причем точка $x_{2}^{*}$ является решением второй из задач выпуклого программирования в системе (3). Эта точка принадлежит пересечению многогранника $\{ {{x}_{2}}:{{G}_{2}}{{x}_{2}} \leqslant {{g}_{2}},\;{{x}_{2}} \in {{\mathbb{R}}^{n}}\} $ и множества достижимости ${{X}_{2}} \subset {{\mathbb{R}}^{n}}$. Далее, на отрезке $[{{t}_{2}},{{t}_{3}}]$ траектория соединяет точки $x_{2}^{*}$ и $x_{3}^{*}$. При этом первая точка является начальным условием, а вторая принадлежит множеству достижимости ${{X}_{3}} \subset {{\mathbb{R}}^{n}}$ текущей задачи. Если продолжать этот процесс далее, то в конце концов мы попадем в решение $x_{S}^{*}$ терминальной краевой задачи относительно переменной ${{x}_{S}}$ на отрезке $[{{t}_{{S - 1}}},{{t}_{S}}]$ системы (3). Отметим, что хотя начальное условие каждой краевой задачи совпадает с терминальным условием предыдущей задачи, тем не менее эти задачи можно считать независимыми друг от друга, так как переменные ${{x}_{s}}$ и ${{x}_{{s + 1}}}$ в своих пространствах меняются независимо друг от друга.

Последнее означает, что мы можем строить вычислительные процессы, решая последовательно краевые задачи, начиная с $s = 1$ и до $s = S$. Эта процедура напоминает процесс продолжения решения дифференциального уравнения, начиная с $\varepsilon $-интервала, на котором доказано существование решения, вплоть до бесконечности для линейных дифференциальных систем. С другой стороны, этот подход можно рассматривать как альтернативный по отношению к методу динамического программирования Р. Беллмана. Последнее предполагает проведение серьезного сравнительного анализа двух подходов.

3. КЛАССИЧЕСКИЙ ЛАГРАНЖИАН

Задача (3) представляет собой выпуклую задачу оптимального управления. Задача хорошо изучена с точки зрения принципа максимума. Принцип максимума [11], [12] является основным инструментом гамильтонова формализма. Этот принцип оказал колоссальное воздействие на все области математики в целом. Он стал источником новых идей в области развития управляемых динамических систем, породил новые направления в математическом моделировании, вызвал к жизни новые математические модели со сложной структурой, которые представляют собой совокупности разных типов и видов задач математики, начиная с решения нелинейных уравнений и заканчивая задачами вычисления неподвижных точек.

Сложные задачи потребовали разработки сложных методов. Сложные методы потребовали доказательного математического обоснования понятия “решение задачи”. Последние уже не могут опираться на принцип максимума как необходимое условие оптимальности. Для этого требуются методы, основанные на достаточных условиях оптимальности. Именно эти подходы развиваются для решения задач терминального управления в данном контексте. В основе этих подходов лежат теория двойственности, функция Лагранжа, седловые неравенства, взаимно двойственные задачи линейного программирования, которые в совокупности образуют основной инструментарий лагранжева формализма. Седловые неравенства здесь играют ту же роль, что принцип максимума в гамильтоновом формализме. При этом седловые неравенства являются достаточными условиями оптимальности, которые существенно обогащают рабочий инструментарий исследовательского подхода. Именно поэтому здесь можно получать более сильные и более глубокие результаты, чем в гамильтоновом формате. В рамках лагранжева формализма можно вычислять компоненты сложного решения задачи терминального управления с гарантированной точностью. Классическая теория двойственности утверждает, что если выполняется условие регулярности Слейтера, то функция Лагранжа для задачи (3) в конечномерных и функциональных пространствах всегда имеет седловую точку [11], [12].

Выпишем на каждом отрезке разбиения функцию Лагранжа в задаче (3)

(4)
$\begin{gathered} {{\mathcal{L}}_{s}}({{x}_{s}}(t),{{u}_{s}}(t),{{x}_{s}};{{\psi }_{s}}(t),{{p}_{s}}) = \\ = \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t),D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t) - \frac{d}{{dt}}{{x}_{s}}(t)} \right\rangle } {\kern 1pt} dt + \left\langle {{{p}_{s}},{{G}_{s}}{{x}_{s}} - {{g}_{s}}} \right\rangle + \left\langle {\varphi ,{{x}_{s}}} \right\rangle \\ \end{gathered} $
для всех ${{x}_{s}} \in {{\mathbb{R}}^{n}}$, ${{p}_{s}} \in \mathbb{R}_{ + }^{m}$, ${{x}_{s}}(t) \in {\text{AC}}_{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$, ${{u}_{s}}(t) \in {\text{U}}$, ${{\psi }_{s}}(t) \in \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$, где $\Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$ есть линейное многообразие абсолютно непрерывных функций из сопряженного пространства. Седловая точка $(x_{s}^{*}(t),u_{s}^{*}(t),x_{s}^{*};\psi _{s}^{*}(t);p_{s}^{*})$ функции Лагранжа ${{\mathcal{L}}_{s}}({{x}_{s}}(t),{{u}_{s}}(t),{{x}_{s}};{{\psi }_{s}}(t),{{p}_{s}})$ cодержит прямые $(x_{s}^{*}(t),u_{s}^{*}(t),x_{s}^{*})$ и двойственные $(\psi _{s}^{*}(t),p_{s}^{*})$ решения задачи (3). Компоненты $(x_{s}^{*}(t),u_{s}^{*}(t),\psi _{s}^{*}(t))$ этих решений рассматриваются на отрезках $[{{t}_{{s - 1}}},{{t}_{s}}]$, $s = \overline {1,S} $, и удовлетворяют по определению системе неравенств
(5)
$\begin{gathered} \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t),D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t) - \frac{d}{{dt}}x_{s}^{*}(t)} \right\rangle dt} + \left\langle {{{p}_{s}},{{G}_{s}}x_{s}^{*} - {{g}_{s}}} \right\rangle + \left\langle {\varphi ,x_{s}^{*}} \right\rangle \leqslant \\ \leqslant \;\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\psi _{s}^{*}(t),D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t) - \frac{d}{{dt}}x_{s}^{*}(t)} \right\rangle dt} + \left\langle {p_{s}^{*},{{G}_{s}}x_{s}^{*} - {{g}_{s}}} \right\rangle + \left\langle {\varphi ,x_{s}^{*}} \right\rangle \leqslant \\ \leqslant \;\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\psi _{s}^{*}(t),D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t) - \frac{d}{{dt}}{{x}_{s}}(t)} \right\rangle dt} + \left\langle {p_{s}^{*},{{G}_{s}}{{x}_{s}} - {{g}_{s}}} \right\rangle + \left\langle {\varphi ,{{x}_{s}}} \right\rangle \\ \end{gathered} $
для всех ${{p}_{s}} \in \mathbb{R}_{ + }^{m}$, ${{x}_{s}} \in {{\mathbb{R}}^{n}}$, ${{\psi }_{s}}(t) \in \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$, ${{x}_{s}}(t) \in {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}]$, ${{u}_{s}}(t) \in {\text{U}}$, ${{x}_{s}}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}$. Рассеченная функция Лагранжа ${{\mathcal{L}}_{s}}({{x}_{s}}(t),{{u}_{s}}(t),{{x}_{s}};{{\psi }_{s}}(t),{{p}_{s}})$ и ее седловые неравенства определены на каждом из отрезков ${{t}_{{s - 1}}} \leqslant t \leqslant {{t}_{s}}$, $s = \overline {1,S} $. Задачи и соответственно их функция Лагранжа никак не связаны друг с другом, кроме начальных условий. Поэтому эти задачи можно изучать по отдельности, а решения этих задач по начальным и терминальным условиям согласованы по построению. Существование седловых точек в конечномерных пространствах гарантируется выполнением условий Слейтера. Верно и обратное утверждение: седловая точка функции Лагранжа системы (5) образована прямым и двойственным решениями задачи (3).

Левое неравенство системы (5) представляет собой задачу максимизации линейной функции по переменным $({{p}_{s}},{{\psi }_{s}}(t))$ на всем пространстве $\mathbb{R}_{ + }^{m} \times \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$ определения этой функции:

(6)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t) - \psi _{s}^{*}(t),D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t) - \frac{d}{{dt}}x_{s}^{*}(t)} \right\rangle dt} + \left\langle {{{p}_{s}} - p_{s}^{*},{{G}_{s}}x_{s}^{*} - {{g}_{s}}} \right\rangle \leqslant 0,$
где ${{p}_{s}} \in \mathbb{R}_{ + }^{m}$, ${{\psi }_{s}}(t) \in \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$. Из неравенства (6) следует, что
(7)
$\left\langle {{{p}_{s}} - p_{s}^{*},{{G}_{s}}x{\text{*}} - {{g}_{s}}} \right\rangle \leqslant 0\quad \forall {{p}_{s}} \in \mathbb{R}_{ + }^{m},$
(8)
$D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t) - \frac{d}{{dt}}x_{s}^{*}(t) = 0,\quad x_{s}^{*}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}.$
Полагая в (7) сначала ${{p}_{s}} = 0$, а затем ${{p}_{s}} = 2p_{s}^{*}$, получаем

(9)
$\begin{gathered} \left\langle {p_{s}^{*},{{G}_{s}}x_{s}^{*} - {{g}_{s}}} \right\rangle = 0,\quad {{G}_{s}}x_{s}^{*} - {{g}_{s}} \leqslant 0, \\ D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t) - \frac{d}{{dt}}x_{s}^{*}(t) = 0,\quad x_{s}^{*}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}. \\ \end{gathered} $

Правое неравенство системы (5) представляет собой задачу минимизации выпуклой функции Лагранжа по переменным $({{x}_{s}}(t),{{u}_{s}}(t),{{x}_{s}})$ при фиксированных значениях ${{p}_{s}} = p_{s}^{*}$, ${{\psi }_{s}}(t) = \psi _{s}^{*}(t)$. Покажем, что система векторов $(\psi _{s}^{*}(t),p_{s}^{*};x_{s}^{*}(t),u_{s}^{*}(t),x_{s}^{*})$ является решением (3). С учетом (9), из правого неравенства системы (5) имеем

(10)
$\left\langle {\varphi ,x_{s}^{*}} \right\rangle \leqslant \left\langle {\varphi ,{{x}_{s}}} \right\rangle + \left\langle {p_{s}^{*},{{G}_{s}}{{x}_{s}} - {{g}_{s}}} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\psi _{s}^{*}(t),D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t) - \frac{d}{{dt}}{{x}_{s}}(t)} \right\rangle dt} $
для всех ${{x}_{s}} \in {{\mathbb{R}}^{n}}$, ${{x}_{s}}(t) \in {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}]$, ${{u}_{s}}(t) \in {\text{U}}$.

Рассмотрим неравенство (10) при дополнительных скалярных ограничениях

$\left\langle {p_{s}^{*},{{G}_{s}}{{x}_{s}} - {{g}_{s}}} \right\rangle \leqslant 0,\quad \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\psi _{s}^{*}(t),D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t) - \frac{d}{{dt}}{{x}_{s}}(t)} \right\rangle dt} = 0.$
Тогда получим задачу оптимизации
$\left\langle {\varphi ,x_{s}^{*}} \right\rangle \leqslant \left\langle {\varphi ,{{x}_{s}}} \right\rangle $
при ограничениях
(11)
$\left\langle {p_{s}^{*},{{G}_{s}}{{x}_{s}} - {{g}_{s}}} \right\rangle \leqslant 0,\quad \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\psi _{s}^{*}(t),D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t) - \frac{d}{{dt}}{{x}_{s}}(t)} \right\rangle } \,dt = 0$
для всех ${{x}_{s}} \in {{\mathbb{R}}^{n}}$, ${{x}_{s}}(t) \in {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}]$, ${{u}_{s}}(t) \in {\text{U}}$.

Из (9) следует, что решение $(x_{s}^{*}(t),u_{s}^{*}(t);x_{s}^{*})$ принадлежит более узкому множеству, чем (11). Поэтому указанная точка остается минимумом и на подмножестве решений первой системы (9), т.е.

(12)
$\left\langle {\varphi ,x_{s}^{*}} \right\rangle \leqslant \left\langle {\varphi ,{{x}_{s}}} \right\rangle ,\quad {{G}_{s}}{{x}_{s}} \leqslant {{g}_{s}},$
(13)
$\frac{d}{{dt}}{{x}_{s}}(t) = D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t)$
для всех ${{x}_{s}} \in {{\mathbb{R}}^{n}}$, ${{x}_{s}}(t) \in {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}]$, ${{u}_{s}}(t) \in {\text{U}}$. Таким образом, если функция Лагранжа (4) имеет седловую точку, то ее вектор прямых компонент является решением исходной задачи выпуклого программирования в бесконечномерном пространстве.

4. ДВОЙСТВЕННЫЙ ЛАГРАНЖИАН

В предыдущем разделе была введена фукция Лагранжа, которая представляет собой скаляризацию задачи (3) с помощью весовых коэффициентов. Эта функция сконструирована с помощью скалярного произведения и линейных операторов относительно прямых переменных. В силу симметрии операции скалярного произведения, в выражении для функции Лагранжа всегда можно перейти к сопряженным, или двойственным, линейным операторам без изменения значения функции Лагранжа в любых фиксированных точках. При этом получаем сопряженную (двойственную) функцию Лагранжа, которая уже определена в сопряженном пространстве. Таким образом, мы получили две функции Лагранжа, каждая из которых определена в своем пространстве переменных – прямом и сопряженном соответственно. Причем на декартовом произведении этих пространств обе функции (прямая и двойственная) имеют одну и ту же седловую точку. Прямая функция Лагранжа порождает исходную задачу линейного программирования относительно прямых переменных. Двойственная функция, соответственно, порождает двойственную задачу линейного программирования относительно двойственных переменных.

Рассмотрим эту ситуацию более детально. Введем формулы перехода от переменных прямого пространства к переменным двойственного, и рассмотрим технику преобразования геометрических объектов одного пространства в другое. Используя формулы перехода к сопряженным линейным операторам

(14)
$\left\langle {{{\psi }_{s}}(t),D{{x}_{s}}(t)} \right\rangle = \left\langle {{{D}^{{\text{T}}}}{{\psi }_{s}}(t),{{x}_{s}}(t)} \right\rangle ,\quad \left\langle {{{\psi }_{s}}(t),B{{u}_{s}}(t)} \right\rangle = \left\langle {{{B}^{{\text{T}}}}{{\psi }_{s}}(t),{{u}_{s}}(t)} \right\rangle $
и формулу интегрирования по частям на отрезке $[{{t}_{{s - 1}}},{{t}_{s}}]$
(15)
$\left\langle {{{\psi }_{s}}({{t}_{s}}),{{x}_{s}}({{t}_{s}})} \right\rangle - \left\langle {{{\psi }_{s}}({{t}_{{s - 1}}}),{{x}_{s}}({{t}_{{s - 1}}})} \right\rangle = \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\frac{d}{{dt}}{{\psi }_{s}}(t),{{x}_{s}}(t)} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t),\frac{d}{{dt}}{{x}_{s}}(t)} \right\rangle dt} ,$
выпишем функцию Лагранжа, сопряженную по отношению к (4), и седловую систему, сопряженную по отношению к (5):
(16)
$\begin{gathered} \mathcal{L}_{s}^{{\text{T}}}({{x}_{s}}(t),{{u}_{s}}(t),{{x}_{s}}({{t}_{s}});{{\psi }_{s}}(t),{{p}_{s}}) = \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t),{{x}_{s}}(t)} \right\rangle dt} + \\ \, + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t){{\psi }_{s}}(t),{{u}_{s}}(t)} \right\rangle dt} - \left\langle {{{\psi }_{s}}({{t}_{s}}),{{x}_{s}}({{t}_{s}})} \right\rangle + \left\langle {{{\psi }_{s}}({{t}_{{s - 1}}}),{{x}_{s}}({{t}_{{s - 1}}})} \right\rangle + \left\langle {G_{s}^{{\text{T}}}{{p}_{s}} + \varphi ,{{x}_{s}}({{t}_{s}})} \right\rangle - \left\langle {{{p}_{s}},{{g}_{s}}} \right\rangle \\ \end{gathered} $
для всех ${{p}_{s}} \in \mathbb{R}_{ + }^{m}$, ${{x}_{s}}({{t}_{s}}) \in {{\mathbb{R}}^{n}}$, ${{\psi }_{s}}(t) \in \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$, $({{x}_{s}}(t),{{u}_{s}}(t)) \in {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}] \times {\text{U}}$.

Оба лагранжиана (прямой и двойственный) имеют одну и ту же седловую точку ($x_{s}^{*}(t),u_{s}^{*}(t)$, $x_{s}^{*}({{t}_{s}})$; $\psi _{s}^{*}(t),p_{s}^{*}$), которая удовлетворяет седловой сопряженной системе

$\begin{gathered} \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t),x_{s}^{*}(t)} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t){{\psi }_{s}}(t),u_{s}^{*}(t)} \right\rangle dt} - \left\langle {{{\psi }_{s}}({{t}_{s}}),x_{s}^{*}({{t}_{s}})} \right\rangle + \left\langle {{{\psi }_{s}}({{t}_{{s - 1}}}),x_{s}^{*}({{t}_{{s - 1}}})} \right\rangle + \\ \, + \left\langle {G_{s}^{{\text{T}}}{{p}_{s}} + \varphi ,x_{s}^{*}({{t}_{s}})} \right\rangle - \left\langle {{{p}_{s}},{{g}_{s}}} \right\rangle \leqslant \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t),x_{s}^{*}(t)} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t)} \right\rangle dt} - \\ \end{gathered} $
(17)
$ - \;\left\langle {\psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}})} \right\rangle + \left\langle {\psi _{s}^{*}({{t}_{{s - 1}}}),x_{s}^{*}({{t}_{{s - 1}}})} \right\rangle + \left\langle {G_{s}^{{\text{T}}}p_{s}^{*} + \varphi ,x_{s}^{*}({{t}_{s}})} \right\rangle - \left\langle {p_{s}^{*},{{g}_{s}}} \right\rangle \leqslant $
$\begin{gathered} \leqslant \;\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t),{{x}_{s}}(t)} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),{{u}_{s}}(t)} \right\rangle dt} - \left\langle {\psi _{s}^{*}({{t}_{s}}),{{x}_{s}}({{t}_{s}})} \right\rangle + \\ \, + \left\langle {\psi _{s}^{*}({{t}_{{s - 1}}}),{{x}_{s}}({{t}_{{s - 1}}})} \right\rangle + \left\langle {G_{s}^{{\text{T}}}p_{s}^{*} + \varphi ,{{x}_{s}}({{t}_{s}})} \right\rangle - \left\langle {p_{s}^{*},{{g}_{s}}} \right\rangle \\ \end{gathered} $
для всех $({{p}_{s}},{{\psi }_{s}}(t)) \in \mathbb{R}_{ + }^{m} \times \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]$, $({{x}_{s}}({{t}_{s}}),{{x}_{s}}(t),{{u}_{s}}(t)) \in {{\mathbb{R}}^{n}} \times {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}] \times {\text{U}}$.

Выведем двойственную задачу. Из правого неравенства системы (17) имеем

$\begin{gathered} \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t),x_{s}^{*}(t) - {{x}_{s}}(t)} \right\rangle dt} + \left\langle {G_{s}^{{\text{T}}}p_{s}^{*} + \varphi - \psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - {{x}_{s}}({{t}_{s}})} \right\rangle + \\ \, + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t) - {{u}_{s}}(t)} \right\rangle dt \leqslant 0} \\ \end{gathered} $
для всех $({{x}_{s}}({{t}_{s}}),{{x}_{s}}(t),{{u}_{s}}(t)) \in {{\mathbb{R}}^{n}} \times {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}] \times {\text{U}}$. При ${{u}_{s}}(t) = u_{s}^{*}(t)$ из полученного неравенства имеем
(18)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t),x_{s}^{*}(t) - {{x}_{s}}(t)} \right\rangle dt} + \left\langle {G_{s}^{{\text{T}}}p_{s}^{*} + \varphi - \psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - {{x}_{s}}({{t}_{s}})} \right\rangle \leqslant 0$
для всех $({{x}_{s}}({{t}_{s}}),{{x}_{s}}(t)) \in {{\mathbb{R}}^{n}} \times {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}]$. При ${{x}_{s}}(t) = x_{s}^{*}(t)$ и ${{x}_{s}}({{t}_{s}}) = x_{s}^{*}({{t}_{s}})$ из предпоследнего неравенства получим
(19)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t) - {{u}_{s}}(t)} \right\rangle dt \leqslant 0} $
для всех ${{u}_{s}}(t) \in {\text{U}}$. Учитывая, что (18) представляет собой задачу минимизации линейной функции на всем пространстве по переменным ${{x}_{s}}({{t}_{s}}) \in {{\mathbb{R}}^{n}}$ и ${{x}_{s}}(t) \in {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},{{t}_{s}}]$, пару (18), (19) можно переписать в виде

(20)
$\begin{gathered} {{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t) = 0,\quad \varphi + G_{s}^{{\text{T}}}p_{s}^{*} - \psi _{s}^{*}({{t}_{s}}) = 0, \\ \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t) - {{u}_{s}}(t)} \right\rangle dt} \leqslant 0,\quad {{u}_{s}}(t) \in U. \\ \end{gathered} $

Из левого неравенства (17) с учетом уравнений (20) имеем

$\begin{gathered} \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t),x_{s}^{*}(t)} \right\rangle dt} + \left\langle {{{\psi }_{s}}({{t}_{{s - 1}}}),x_{s}^{*}({{t}_{{s - 1}}})} \right\rangle + \left\langle {G_{s}^{{\text{T}}}{{p}_{s}} + \varphi - {{\psi }_{s}}({{t}_{s}}),x_{s}^{*}({{t}_{s}})} \right\rangle - \left\langle {{{g}_{s}},{{p}_{s}}} \right\rangle + \\ \, + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t){{\psi }_{s}}(t),u_{s}^{*}(t)} \right\rangle dt} \leqslant \left\langle { - {{g}_{s}},p_{s}^{*}} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t)} \right\rangle dt} + \left\langle {\psi _{s}^{*}({{t}_{{s - 1}}}),x_{s}^{*}({{t}_{{s - 1}}})} \right\rangle . \\ \end{gathered} $
Здесь $\psi _{s}^{*}({{t}_{{s - 1}}}) = 0$, ${{\psi }_{s}}({{t}_{{s - 1}}}) = 0$, в силу того факта, что начальное условие фиксировано. Используя это, рассмотрим последнее неравенство при условии выполнения пары скалярных ограничений
$\left\langle {G_{s}^{{\text{T}}}{{p}_{s}} + \varphi - {{\psi }_{s}}({{t}_{s}}),x_{s}^{*}({{t}_{s}})} \right\rangle = 0,\quad \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t),x_{s}^{*}(t)} \right\rangle dt} = 0.$
Тогда получим задачу максимизации скалярной функции
$\left\langle { - {{g}_{s}},{{p}_{s}}} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t),B(t)u_{s}^{*}(t)} \right\rangle dt} \leqslant \left\langle { - {{g}_{s}},p_{s}^{*}} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\psi {\text{*}}({{t}_{s}}),B(t)u_{s}^{*}(t)} \right\rangle dt} $
на паре скалярных ограничений
$\left\langle {G_{s}^{{\text{T}}}{{p}_{s}} + \varphi - {{\psi }_{s}}({{t}_{s}}),x_{s}^{*}({{t}_{s}})} \right\rangle = 0,\quad \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t),x_{s}^{*}} \right\rangle dt} = 0,$
откуда приходим к двойственной задаче относительно двойственных переменных при наличии векторных ограничений:
(21)
$\begin{gathered} (p_{s}^{*},\psi _{s}^{*}(t)) \in \\ \in {\text{Argmax}}\left\{ {\left\langle { - {{g}_{s}},{{p}_{s}}} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t),B(t)u_{s}^{*}(t)} \right\rangle dt} \left| {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t) = 0,} \right.\;\varphi + G_{s}^{{\text{T}}}{{p}_{s}} - {{\psi }_{s}}({{t}_{s}}) = 0} \right\}, \\ {{p}_{s}} \in \mathbb{R}_{ + }^{m},\quad {{\psi }_{s}}(t) \in \Psi _{2}^{n}[{{t}_{{s - 1}}},{{t}_{s}}]. \\ \end{gathered} $
Полученная система является двойственной задачей по отношению к (3). Эту задачу можно рассматривать как обобщение двойственной задачи в конечномерном линейном программировании.

5. ВЗАИМНО ДВОЙСТВЕННЫЕ ЗАДАЧИ

Выпишем вместе пару взаимно двойственных задач:

прямая задача

(22)
$\begin{gathered} \frac{d}{{dt}}{{x}_{s}}(t) = D(t){{x}_{s}}(t) + B(t){{u}_{s}}(t),\quad t \in [{{t}_{{s - 1}}},{{t}_{s}}],\quad {{x}_{s}}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),\quad {{u}_{s}}(t) \in {\text{U}}, \\ x_{s}^{*}({{t}_{s}}) \in {\text{Argmin}}\left\{ {\left\langle {\varphi ,{{x}_{s}}({{t}_{s}})} \right\rangle \,{\text{|}}\,{{G}_{s}}{{x}_{s}}({{t}_{s}}) \leqslant {{g}_{s}},{{x}_{s}}({{t}_{s}}) \in {{\mathbb{R}}^{n}}} \right\},\quad x_{s}^{*}({{t}_{s}}) \in {{X}_{s}},\quad s = \overline {1,S} . \\ \end{gathered} $

двойственная задача

(23)
$\begin{gathered} (p_{s}^{*},\psi _{s}^{*}(t)) \in \\ \in \;{\text{Argmax}}\left\{ {\left\langle { - {{g}_{s}},{{p}_{s}}} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{\psi }_{s}}(t),B(t)u_{s}^{*}(t)} \right\rangle dt} \left| {{{D}^{{\text{T}}}}(t){{\psi }_{s}}(t) + \frac{d}{{dt}}{{\psi }_{s}}(t) = 0,} \right.\;G_{s}^{{\text{T}}}{{p}_{s}} + \varphi = {{\psi }_{s}}({{t}_{s}})} \right\}, \\ \end{gathered} $
(24)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t) - {{u}_{s}}(t)} \right\rangle dt \leqslant 0} ,\quad {{u}_{s}}(t) \in {\text{U}}.$
Если в системе (22)–(24) динамика отсутствует, то система принимает форму прямой и двойственной задач линейного программирования, хорошо известной в конечномерной оптимизации:

$\begin{gathered} x{\kern 1pt} * \in {\text{Argmin}}\left\{ {\left\langle {\varphi ,x} \right\rangle \,{\text{|}}\,Gx \leqslant g,\;x \in {{\mathbb{R}}^{n}}} \right\}, \\ p{\kern 1pt} * \in {\text{Argmax}}\left\{ {\left\langle { - p,g} \right\rangle \,{\text{|}}\,{{G}^{{\text{T}}}}p + \varphi = 0,\;p \in \mathbb{R}_{ + }^{m}} \right\}. \\ \end{gathered} $

6. ДОСТАТОЧНЫЕ СЕДЛОВЫЕ УСЛОВИЯ ЭКСТРЕМАЛЬНОСТИ ДЛЯ ИСХОДНОЙ ЗАДАЧИ

Объединяя в единую систему прямую и двойственную задачи (22)–(24), получим седловые достаточные условия экстремальности для исходной задачи (3):

(25)
$\begin{gathered} \frac{d}{{dt}}x_{s}^{*}(t) = D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t),\quad t \in [{{t}_{{s - 1}}},{{t}_{s}}],\quad x_{s}^{*}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),\quad {{u}_{s}}(t) \in {\text{U}}, \\ \left\langle {{{p}_{s}} - p_{s}^{*},{{G}_{s}}x_{s}^{*}({{t}_{s}}) - {{g}_{s}}} \right\rangle \leqslant 0,\quad {{p}_{s}} \in \mathbb{R}_{ + }^{m},\quad {{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t) = 0,\quad G_{s}^{{\text{T}}}p_{s}^{*} + \varphi - \psi _{s}^{*}({{t}_{s}}) = 0, \\ \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),u_{s}^{*}(t) - {{u}_{s}}(t)} \right\rangle dt} \leqslant 0,\quad {{u}_{s}}(t) \in {\text{U}}. \\ \end{gathered} $

Вариационные неравенства системы (25) можно переписать в эквивалентной форме операторных уравнений с операторами проектирования на соответствующие выпуклые замкнутые множества. Тогда получим систему дифференциальных и операторных уравнений вида

(26)
$\frac{d}{{dt}}x_{s}^{*}(t) = D(t)x_{s}^{*}(t) + B(t)u_{s}^{*}(t),\quad t \in [{{t}_{{s - 1}}},{{t}_{s}}],\quad {{x}_{s}}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*},$
(27)
$p_{s}^{*} = {{\pi }_{ + }}(p_{s}^{*} + \alpha ({{G}_{s}}x_{s}^{*} - {{g}_{s}})),$
(28)
${{D}^{{\text{T}}}}(t)\psi _{s}^{*}(t) + \frac{d}{{dt}}\psi _{s}^{*}(t) = 0,\quad G_{s}^{{\text{T}}}p_{s}^{*} + \varphi - \psi _{s}^{*}({{t}_{s}}) = 0,$
(29)
$u_{s}^{*}(t) = {{\pi }_{{\text{U}}}}(u_{s}^{*}(t) - \alpha {{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t)),$
где ${{\pi }_{ + }}( \cdot ),\;{{\pi }_{{\text{U}}}}( \cdot )$ – операторы проектирования на положительный ортант пространства $\mathbb{R}_{ + }^{m}$ и, соответственно, на множество управлений ${\text{U}}$, $\alpha > 0$. Здесь $(p_{s}^{*},\psi _{s}^{*}(t);x_{s}^{*}({{t}_{s}}),x_{s}^{*}(t),u_{s}^{*}(t))$ – совокупность векторов, являющихся решением системы (26)–(29).

7. СЕДЛОВОЙ МЕТОД РЕШЕНИЯ КРАЕВОЙ И ПРОМЕЖУТОЧНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

На основе системы (26)–(29) построим итеративный процесс. Если взять произвольные значения двойственной переменной ${{p}_{s}} = p_{s}^{k} \in \mathbb{R}_{ + }^{m}$ и управления ${{u}_{s}}(t) = u_{s}^{k}(t) \in {\text{U}}$, которые будем трактовать как некоторое приближение, то можем решить дифференциальное уравнение (26) и найти траекторию $x_{s}^{k}(t)$. Затем вычислим терминальное значение $x_{s}^{k}({{t}_{s}})$ траектории в момент времени $t = {{t}_{s}}$. Используя $p_{s}^{k}$ и $x_{s}^{k}({{t}_{s}})$, реализуем итерацию (27). После этого, используя условие трансверсальности, вычислим терминальное условие $\psi _{s}^{k}({{t}_{s}}) = \varphi + G_{s}^{{\text{T}}}p_{s}^{k}$ сопряженной системы (28), решим ее и найдем сопряженную траекторию. Используя последнюю и управление $u_{s}^{k}(t)$, реализуем итерацию по управлению (29) и найдем следующее управление с номером $u_{s}^{{k + 1}}(t) \in {\text{U}}$.

Формально процесс имеет вид

(30)
$\frac{d}{{dt}}x_{s}^{k}(t) = D(t)x_{s}^{k}(t) + B(t)u_{s}^{k}(t),\quad x_{s}^{k}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),$
(31)
$p_{s}^{{k + 1}} = {{\pi }_{ + }}(p_{s}^{k} + \alpha ({{G}_{s}}x_{s}^{k} - {{g}_{s}})),$
(32)
${{D}^{{\text{T}}}}(t)\psi _{s}^{k}(t) + \frac{d}{{dt}}\psi _{s}^{k}(t) = 0,\quad \psi _{s}^{k} = \varphi + G_{s}^{{\text{T}}}p_{s}^{k},$
(33)
$u_{s}^{{k + 1}}(t) = {{\pi }_{{\text{U}}}}(u_{s}^{k}(t) - \alpha {{B}^{{\text{T}}}}(t)\psi _{s}^{k}(t)),\quad k = 0,1,2,...$
Здесь проведение каждой очередной итерации фактически сводится к решению двух систем дифференциальных уравнений (30), (32). Процесс (30)–(33) относится к методам простой итерации и является наиболее простым из известных вычислительных процессов. Однако в нашем случае мы имеем дело с седловой задачей, про которую известно, что методы типа простой итерации не сходятся к седловой точке задачи (сходятся только их аналоги в оптимизации – методы проекции градиента).

Формулы итеративного седлового (экстраградиентного) метода имеют вид

1) прогнозный полушаг

(34)
$\frac{d}{{dt}}x_{s}^{k}(t) = D(t)x_{s}^{k}(t) + B(t)u_{s}^{k}(t),\quad x_{s}^{k}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),$
(35)
$\bar {p}_{s}^{k} = {{\pi }_{ + }}(p_{s}^{k} + \alpha ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})),$
(36)
$\frac{d}{{dt}}\psi _{s}^{k}(t) + {{D}^{{\text{T}}}}(t)\psi _{s}^{k}(t) = 0,\quad \psi _{s}^{k}({{t}_{s}}) = \varphi + G_{s}^{{\text{T}}}p_{s}^{k},$
(37)
$\bar {u}_{s}^{k}(t) = {{\pi }_{{\text{U}}}}(u_{s}^{k}(t) - \alpha {{B}^{{\text{T}}}}(t)\psi _{s}^{k}(t));$

2) основной полушаг

(38)
$\frac{d}{{dt}}\bar {x}_{s}^{k}(t) = D(t)\bar {x}_{s}^{k}(t) + B(t)\bar {u}_{s}^{k}(t),\quad \bar {x}_{s}^{k}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),$
(39)
$p_{s}^{{k + 1}} = {{\pi }_{ + }}(p_{s}^{k} + \alpha ({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}})),$
(40)
$\frac{d}{{dt}}\bar {\psi }_{s}^{k}(t) + {{D}^{{\text{T}}}}(t)\mathop {\bar {\psi }}\nolimits_s^k (t) = 0,\quad \bar {\psi }_{s}^{k}({{t}_{s}}) = \varphi + G_{s}^{{\text{T}}}\bar {p}_{s}^{k},$
(41)
$u_{s}^{{k + 1}}(t) = {{\pi }_{U}}(u_{s}^{k}(t) - \alpha {{B}^{{\text{T}}}}(t)\bar {\psi }_{s}^{k}(t)),\quad k = 0,1,2,...$
Здесь на каждом полушаге решаются два дифференциальных уравнения и осуществляется итеративный шаг по управлениям. Отметим, что в этом процессе итерации по прямым переменным $(x_{s}^{k}(t),\;u_{s}^{k}(t))$ при всех $k$ всегда принадлежат допустимым множествам, т.е. являются решениями дифференциальных уравнений (34), (36) и (38), (40). Этот процесс можно считать внутренним, или допустимым, поскольку каждый член итеративной последовательности всегда принадлежит допустимому множеству.

Из формул этого процесса видно, что дифференциальные уравнения (34), (36) и (38), (40) используются только для вычисления функций $x_{s}^{k}(t)$ и $\bar {x}_{s}^{k}(t)$, $\psi _{s}^{k}(t)$ и $\bar {\psi }_{s}^{k}(t)$, поэтому процесс можно записать в более компактном виде

(42)
$\bar {p}_{s}^{k} = {{\pi }_{ + }}(p_{s}^{k} + \alpha ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})),$
(43)
$\bar {u}_{s}^{k}(t) = {{\pi }_{{\text{U}}}}(u_{s}^{k}(t) - \alpha {{B}^{{\text{T}}}}(t)\psi _{s}^{k}(t)),$
(44)
$p_{s}^{{k + 1}} = {{\pi }_{ + }}(p_{s}^{k} + \alpha ({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}})),$
(45)
$u_{s}^{{k + 1}}(t) = {{\pi }_{{\text{U}}}}(u_{s}^{k}(t) - \alpha {{B}^{{\text{T}}}}(t)\bar {\psi }_{s}^{k}(t)),$
где $t \in [{{t}_{{s - 1}}},{{t}_{s}}]$, $x_{s}^{k}(t)$, $\bar {x}_{s}^{k}(t)$, $\psi _{s}^{k}(t)$ и $\bar {\psi }_{s}^{k}(t)$ вычисляются в (34), (38) и (36), (40).

Далее приведем некоторые оценки, которые нам понадобятся при доказательстве сходимости метода. Отметим, что они аналогичны оценкам в [18]. Для этого операторные уравнения (35), (39) и (37), (41) представим в форме вариационных неравенств

(46)
$\left\langle {\bar {p}_{s}^{k} - p_{s}^{k} - \alpha ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}}),{{p}_{s}} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0,$
(47)
$\left\langle {p_{s}^{{k + 1}} - p_{s}^{k} - \alpha ({{G}_{s}}\mathop {\bar {x}}\nolimits_s^k ({{t}_{s}}) - {{g}_{s}}),{{p}_{s}} - p_{s}^{{k + 1}}} \right\rangle \geqslant 0,$
(48)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {u}_{s}^{k}(t) - u_{s}^{k}(t) + \alpha {{B}^{{\text{T}}}}(t)\psi _{s}^{k}(t),{{u}_{s}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0,$
(49)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {u_{s}^{{k + 1}}(t) - u_{s}^{k}(t) + \alpha {{B}^{{\text{T}}}}(t)\bar {\psi }_{s}^{k}(t),{{u}_{s}}(t) - u_{s}^{{k + 1}}(t)} \right\rangle dt} \geqslant 0$
для всех ${{p}_{s}} \in \mathbb{R}_{ + }^{m}$, ${{u}_{s}}(t) \in {\text{U}}$.

Из операторных уравнений (42), (44) и (43), (45), очевидно, следуют оценки

(50)
$\left| {\bar {p}_{s}^{k} - p_{s}^{{k + 1}}} \right| \leqslant \alpha \left| {{{G}_{s}}(x_{s}^{k}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}}))} \right| \leqslant \alpha \left\| {{{G}_{s}}} \right\|\left| {x_{s}^{k}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right|,$
(51)
$\left\| {\bar {u}_{s}^{k}(t) - u_{s}^{{k + 1}}(t)} \right\| \leqslant \alpha \left\| {{{B}^{{\text{T}}}}(t)(\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t))} \right\| \leqslant \alpha {{B}_{{{\text{max}}}}}\left\| {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right\|,$
где ${{B}_{{{\text{max}}}}} = {\text{max}}\left\| {B(t)} \right\|$ для всех $t \in [{{t}_{{s - 1}}},{{t}_{s}}]$, $\alpha > 0$.

1. При доказательстве теоремы о сходимости метода нам понадобятся еще две оценки, которые имеет смысл привести здесь – это величины отклонений векторов $\left| {x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)} \right|$ и $\left| {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right|$, $t \in [{{t}_{{s - 1}}},{{t}_{s}}]$. В силу линейности уравнений (34) и (38) имеем

$\frac{d}{{dt}}(x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)) = D(t)(x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)) + B(t)(u_{s}^{k}(t) - \bar {u}_{s}^{k}(t)),\quad x_{s}^{k}({{t}_{{s - 1}}}) - \bar {x}_{s}^{k}({{t}_{{s - 1}}}) = 0.$
Проинтегрируем полученное тождество от ${{t}_{{s - 1}}}$ до $t$:
$(x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)) - (x_{s}^{k}({{t}_{{s - 1}}}) - \bar {x}_{s}^{k}({{t}_{{s - 1}}})) = \int\limits_{{{t}_{{s - 1}}}}^t {D(\tau )(x_{s}^{k}(\tau ) - \bar {x}_{s}^{k}(\tau ))d\tau } + \int\limits_{{{t}_{{s - 1}}}}^t {B(\tau )(u_{s}^{k}(\tau ) - \bar {u}_{s}^{k}(\tau ))d\tau } .$
Из последнего равенства получим оценку
(52)
$\left| {x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)} \right| \leqslant {{D}_{{{\text{max}}}}}\int\limits_{{{t}_{{s - 1}}}}^t {\left| {x_{s}^{k}(\tau ) - \bar {x}_{s}^{k}(\tau )} \right|d\tau } + {{B}_{{{\text{max}}}}}\int\limits_{{{t}_{{s - 1}}}}^t {\left| {u_{s}^{k}(\tau ) - \bar {u}_{{}}^{k}(\tau )} \right|d\tau } ,$
где ${{D}_{{{\text{max}}}}} = max\left\| {D(t)} \right\|$, $t \in [{{t}_{{s - 1}}},{{t}_{s}}]$. Применим лемму Гронуолла [12, Кн. 1, с. 472] в виде: из неравенства
$0 \leqslant \varphi (t) \leqslant a\int\limits_{{{t}_{{s - 1}}}}^t {\varphi (\tau )d\tau } + b,$
где ${{t}_{{s - 1}}} \leqslant t \leqslant {{t}_{s}}$, следует неравенство
$\varphi (t) \leqslant b{{e}^{{a({{t}_{s}} - {{t}_{{s - 1}}})}}},\quad {{t}_{{s - 1}}} \leqslant t \leqslant {{t}_{s}},$
где $\varphi (t)$ непрерывна, $a \geqslant 0$, $b \geqslant 0$ – константы. Используя эту лемму, из (52) получаем
$\left| {x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)} \right| \leqslant {{B}_{{{\text{max}}}}}{{e}^{{{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}}\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left| {u_{s}^{k}(t) - \bar {u}_{{}}^{k}(t)} \right|dt} .$
Оценивая интеграл в правой части последнего неравенства с помощью неравенства Коши–Буняковского, имеем
(53)
${{\left| {x_{s}^{k}(t) - \bar {x}_{s}^{k}(t)} \right|}^{2}} \leqslant B_{{{\text{max}}}}^{2}{{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}}({{t}_{s}} - {{t}_{{s - 1}}}){{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}}.$
Отсюда при $t = {{t}_{s}}$ найдем отклонения терминальных значений траекторий

(54)
${{\left| {x_{s}^{k}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right|}^{2}} \leqslant B_{{{\text{max}}}}^{2}{{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}}({{t}_{s}} - {{t}_{{s - 1}}}){{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}}.$

В дальнейшем нам понадобится ограниченность последовательности $\{ x_{s}^{k}(t)\} $. Чтобы доказать это, мы фактически должны повторить вышеприведенные рассуждения. Напомним основные моменты. Выпишем разность двух линейных уравнений (34) и (26):

$\frac{d}{{dt}}(x_{s}^{k}(t) - x_{s}^{*}(t)) = D(t)(x_{s}^{k}(t) - x_{s}^{*}(t)) + B(t)(u_{s}^{k}(t) - u_{s}^{*}(t)),x_{s}^{k}({{t}_{{s - 1}}}) - x_{s}^{*}({{t}_{{s - 1}}}) = 0.$
Переходя от этой разности к аналогу (52), имеем
$\left| {x_{s}^{k}(t) - x_{s}^{*}(t)} \right| \leqslant {{D}_{{{\text{max}}}}}\int\limits_{{{t}_{{s - 1}}}}^t {\left| {x_{s}^{k}(\tau ) - {{x}^{*}}(\tau )} \right|d\tau } + {{B}_{{{\text{max}}}}}\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left| {u_{s}^{k}(\tau ) - u_{s}^{*}(\tau )} \right|d\tau } .$
Завершая эти рассуждения, получим оценку, аналогичную (54):

(55)
${{\left| {x_{s}^{k}(t) - x_{s}^{*}(t)} \right|}^{2}} \leqslant B_{{{\text{max}}}}^{2}{{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}}({{t}_{s}} - {{t}_{{s - 1}}}){{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}}.$

2. Наконец, получим из уравнений (36)$,$ (40) аналогичные оценки для сопряженных траекторий $\left| {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right|$:

(56)
$\frac{d}{{dt}}(\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)) + {{D}^{{\text{T}}}}(t)(\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)) = 0,$
где $\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}}) = G_{s}^{{\text{T}}}(p_{s}^{k} - \bar {p}_{s}^{k})$. Проинтегрируем (56) от $t$ до ${{t}_{s}}$:
$\int\limits_t^{{{t}_{s}}} {\frac{d}{{dt}}\left( {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right)dt} + \int\limits_t^{{{t}_{s}}} {{{D}^{{\text{T}}}}(t)(\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t))dt} = 0,$
откуда

$\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t) = \int\limits_t^{{{t}_{s}}} {{{D}^{{\text{T}}}}(t)(\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t))dt} + \psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}}).$

Следовательно, справедлива оценка

(57)
$\left| {{{\psi }^{k}}(t) - \bar {\psi }_{{}}^{k}(t)} \right| \leqslant \int\limits_t^{{{t}_{s}}} {\left| {{{D}^{{\text{T}}}}(t)({{\psi }^{k}}(t) - \bar {\psi }_{s}^{k}(t))} \right|dt} + \left| {\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}})} \right| \leqslant {{D}_{{{\text{max}}}}}\int\limits_t^{{{t}_{s}}} {\left| {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right|dt} + b,$
где $t \in [{{t}_{{s - 1}}},{{t}_{s}}]$, $b = \left| {\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}})} \right|$. Здесь также воспользуемся леммой Гронуолла [12, Кн. 1, с. 472]: если верно неравенство
$0 \leqslant \varphi (t) \leqslant a\int\limits_t^{{{t}_{s}}} {\varphi (\tau )d(\tau ) + b} ,\quad {{t}_{{s - 1}}} \leqslant t \leqslant {{t}_{s}},$
то верно неравенство $\varphi (t) \leqslant b{{e}^{{a({{t}_{1}} - t)}}}$, где $\varphi (t)$ непрерывна, $a \geqslant 0$, $b \geqslant 0$ – константы. Опираясь на это утверждение, из (57) получаем
(58)
${{\left| {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right|}^{2}} \leqslant {{\left| {\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}})} \right|}^{2}}{{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - t)}}}.$
Для терминальных значений из (36) и (40) имеем
(59)
${{\left| {\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}})} \right|}^{2}} = {{\left| {G_{s}^{{\text{T}}}(p_{s}^{k} - \bar {p}_{s}^{k})} \right|}^{2}} \leqslant {{\left\| {G_{s}^{{\text{T}}}} \right\|}^{2}}{{\left| {p_{s}^{k} - \bar {p}_{s}^{k}} \right|}^{2}}.$
Подставим (59) в (58)$:$
${{\left| {\psi _{s}^{k}(t) - \bar {\psi }_{s}^{k}(t)} \right|}^{2}} \leqslant {{\left\| {G_{s}^{{\text{T}}}} \right\|}^{2}}{{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - t)}}}{{\left| {p_{s}^{k} - \bar {p}_{s}^{k}} \right|}^{2}}.$
Проинтегрируем неравенство от ${{t}_{{s - 1}}}$ до ${{t}_{s}}$:

(60)
${{\left\| {\psi _{s}^{k}( \cdot ) - \bar {\psi }_{s}^{k}( \cdot )} \right\|}^{2}} \leqslant {{\left\| {G_{s}^{{\text{T}}}} \right\|}^{2}}{\text{/}}(2{{D}_{{{\text{max}}}}})({{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}} - 1){{\left| {p_{s}^{k} - \bar {p}_{s}^{k}} \right|}^{2}}.$

Аналогично докажем ограниченность сопряженных траекторий $\left| {\psi _{s}^{k}(t) - \psi _{s}^{*}(t)} \right|$. Из (40) и (28) имеем

$\frac{d}{{dt}}(\psi _{s}^{k}(t) - \psi _{s}^{*}(t)) + {{D}^{{\text{T}}}}(t)(\psi _{s}^{k}(t) - \psi _{s}^{*}(t)) = 0.$
Переходя от этой разности к аналогам оценок (60), получим

(61)
${{\left\| {\psi _{s}^{k}( \cdot ) - \psi _{s}^{*}( \cdot )} \right\|}^{2}} \leqslant {{\left\| {G_{s}^{T}} \right\|}^{2}}{\text{/}}(2{{D}_{{{\text{max}}}}})({{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}} - s){{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}}.$

8. ДОКАЗАТЕЛЬСТВО СХОДИМОСТИ МЕТОДА

Покажем, что процесс (34)–(41) экстраградиентного метода сходится слабо по управлениям и сильно по прямым и двойственным переменным к одному из решений исходной задачи.

Теорема. Если множество решений $(x_{s}^{*}({{t}_{s}}),x_{s}^{*}( \cdot ),u_{s}^{*}( \cdot );p_{s}^{*},\psi _{s}^{*}( \cdot ))$ задачи (26)–(29) не пусто, то последовательность $\{ (x_{s}^{k}({{t}_{s}}),x_{s}^{k}( \cdot ),u_{s}^{k}( \cdot );p_{s}^{k},\psi _{s}^{k}( \cdot ))\} $, порожденная методом (34)–(41) с длиной $\alpha $, выбранной из последующего условия (73), содержит подпоследовательность $\{ (x_{s}^{{{{k}_{i}}}}({{t}_{s}}),x_{s}^{{{{k}_{i}}}}( \cdot ),u_{s}^{{{{k}_{i}}}}( \cdot );p_{s}^{{{{k}_{i}}}},\psi _{s}^{{{{k}_{i}}}}( \cdot ))\} $, которая сходится к решению задачи, в том числе: слабо – по управлениям, сильно – по траекториям, сопряженным траекториям, а также терминальным переменным. В частности, последовательность

$\left\{ {{{{\left| {p_{s}^{k} - p_{s}^{*}} \right|}}^{2}} + {{{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}}^{2}}} \right\}$
монотонно убывает на декартовом произведении $\mathbb{R}_{ + }^{m} \times {\text{L}}_{2}^{r}[{{t}_{{s - 1}}},{{t}_{s}}]$.

Доказательство.

1. Перепишем (40), включая условия трансверсальности, в виде вариационного неравенства

$\left\langle {\varphi + G_{s}^{{\text{T}}}\bar {p}_{s}^{k} - \bar {\psi }_{s}^{k}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t)\bar {\psi }_{s}^{k}(t) + \frac{d}{{dt}}\bar {\psi }_{s}^{k}(t),x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)} \right\rangle dt} \geqslant 0.$
Аналогично поступим с уравнением (28)
$ - \left\langle {\varphi + G_{s}^{{\text{T}}}p_{s}^{*} - \psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right\rangle - \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{D}^{{\text{T}}}}(t)\psi {\text{*}}(t) + \frac{d}{{dt}}\psi {\text{*}}(t),x{\text{*}}(t) - \bar {x}_{s}^{k}(t)} \right\rangle dt} \geqslant 0.$
Сложим полученные неравенства, группируя слагаемые парами
(62)
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{*},{{G}_{s}}(x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}}))} \right\rangle - \left\langle {\bar {\psi }_{s}^{k}({{t}_{s}}) - \psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right\rangle + \\ \, + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t),D(t)(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t))} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\frac{d}{{dt}}(\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t)),x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)} \right\rangle dt} \geqslant 0 \\ \end{gathered} $
и, используя формулу интегрирования по частям на отрезке $[{{t}_{{s - 1}}},{{t}_{s}}]$, преобразуем дифференциальный член в левой части (62)
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{*},{{G}_{s}}(x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}}))} \right\rangle - \left\langle {\bar {\psi }_{s}^{k}({{t}_{s}}) - \psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right\rangle + \\ + \;\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t),D(t)(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t))} \right\rangle dt} - \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\frac{d}{{dt}}(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)),\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t)} \right\rangle dt} + \\ + \;\left\langle {\bar {\psi }_{s}^{k}({{t}_{s}}) - \psi _{s}^{*}({{t}_{s}}),x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right\rangle - \left\langle {\bar {x}_{s}^{k}({{t}_{{s - 1}}}) - \psi _{s}^{*}({{t}_{{s - 1}}}),x_{s}^{*}({{t}_{{s - 1}}}) - \bar {x}_{s}^{k}({{t}_{{s - 1}}})} \right\rangle \geqslant 0. \\ \end{gathered} $
Так как $x_{s}^{*}({{t}_{{s - 1}}}) = \bar {x}_{s}^{k}({{t}_{{s - 1}}})$, то последний член обнуляется. Сокращая одинаковые члены и объединяя интегралы, получаем

(63)
$\left\langle {\bar {p}_{s}^{k} - p_{s}^{*},{{G}_{s}}(x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}}))} \right\rangle + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t),D(t)(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)) - \frac{d}{{dt}}(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t))} \right\rangle dt} \geqslant 0.$

2. Получим оценочные неравенства по отношению к переменной ${{p}_{s}}$. Для этого положим ${{p}_{s}} = p_{s}^{{k + 1}}$ в (46):

$\left\langle {\bar {p}_{s}^{k} - p_{s}^{k} - \alpha ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}}),p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0.$
Добавим и вычтем $\alpha \left\langle {{{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle $:
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \alpha \left\langle {({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}}),p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle - \\ - \;\alpha \left\langle {{{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0. \\ \end{gathered} $
Используя неравенство (50), оценим второе слагаемое
$\left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + {{\alpha }^{2}}\mathop {\left| {({{G}_{s}}\bar {x}_{s}^{k} - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k} - {{g}_{s}})} \right|}\nolimits^2 - \alpha \left\langle {{{G}_{s}}\bar {x}_{s}^{k} - {{g}_{s}},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0.$
Положим ${{p}_{s}} = p_{s}^{*}$ в (47):
$\left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle - \alpha \left\langle {{{G}_{s}}\bar {x}_{s}^{k} - {{g}_{s}},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle \geqslant 0.$
Сложим попарно последние два неравенства:
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + \\ + \;{{\alpha }^{2}}\mathop {\left| {({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})} \right|}\nolimits^2 - \alpha \left\langle {{{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}},p_{s}^{*} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0. \\ \end{gathered} $
Полагая ${{p}_{s}} = \bar {p}_{s}^{k}$ во второе неравенство (25), получаем
$\alpha \left\langle {{{G}_{s}}x_{s}^{*}({{t}_{s}}) - {{g}_{s}},p_{s}^{*} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0.$
Сложим последние два неравенства:
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + \\ + \;{{\alpha }^{2}}\mathop {\left| {({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})} \right|}\nolimits^2 - \alpha \left\langle {{{G}_{s}}(\bar {x}_{s}^{k}({{t}_{s}}) - x_{s}^{*}({{t}_{s}})),p_{s}^{*} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0. \\ \end{gathered} $
Наконец, сложим полученное неравенство с (63), предварительно умножив его на $\alpha $:

$\begin{gathered} \alpha \left\langle {\bar {p}_{s}^{k} - p_{s}^{*},{{G}_{s}}(x_{s}^{*}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}}))} \right\rangle + \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t),D(t)(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)) - \frac{d}{{dt}}(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t))} \right\rangle dt} + \\ \, + \left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + {{\alpha }^{2}}\mathop {\left| {({{G}_{1}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})} \right|}\nolimits^2 - \\ \, - \alpha \left\langle {{{G}_{s}}(\bar {x}_{s}^{k}({{t}_{s}}) - x_{s}^{*}({{t}_{s}})),p_{s}^{*} - \bar {p}_{s}^{k}} \right\rangle \geqslant 0. \\ \end{gathered} $

Сокращая члены с противоположными знаками, получаем

(64)
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + {{\alpha }^{2}}\mathop {\left| {({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{1}})} \right|}\nolimits^2 + \\ \, + \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {\psi }_{s}^{{}}(t) - \psi _{s}^{*}(t),D(t)(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)) - \frac{d}{{dt}}(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t))} \right\rangle dt} \geqslant 0. \\ \end{gathered} $

3. Получим теперь оценки для управлений. Положим $u(t) = {{u}^{{k + 1}}}(t)$ в (48):

$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {u}_{s}^{k}(t) - u_{s}^{k}(t) + \alpha {{B}^{{\text{T}}}}(t)\psi _{s}^{k}(t),\;u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0.$
Добавляя и вычитая $\mathop {\bar {\psi }}\nolimits_s^k (t)$ под знаком скалярного произведения и разбивая на 3 интеграла, получаем
(65)
$\begin{gathered} \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {u}_{s}^{k}(t) - u_{s}^{k}(t),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} - \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)(\bar {\psi }_{s}^{k}(t) - \psi _{s}^{k}(t)),\;u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} + \\ \, + \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {B_{s}^{{\text{T}}}(t)\bar {\psi }_{s}^{k}(t),\;u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0. \\ \end{gathered} $
Положим ${{u}_{s}} = u_{s}^{*}( \cdot )$ в (49)
(66)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {u_{s}^{{k + 1}}(t) - u_{s}^{k}(t) + \alpha {{B}^{T}}(t)\bar {\psi }_{s}^{k}(t),\;u_{s}^{*}(t) - u_{s}^{{k + 1}}(t)} \right\rangle dt} \geqslant 0.$
Подставляя ${{u}_{s}}(t) = \bar {u}_{s}^{k}(t)$ в вариационное неравенство (25), получаем
(67)
$\alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t),\;\bar {u}_{s}^{k}(t) - u_{s}^{*}(t)} \right\rangle dt} \geqslant 0.$
Сложим (64), (65), (66) и (67), одновременно добавляя и вычитая член $\alpha \int_{{{t}_{{s - 1}}}}^{{{t}_{s}}} \,\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t),B(t)(u_{s}^{*}(t) - \bar {u}_{s}^{k}(t))dt$:
$\left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + {{\alpha }^{2}}\mathop {\left| {({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})} \right|}\nolimits^2 + $
(68)
$\begin{gathered} \, + \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {\psi }_{s}^{k}(t) - \psi _{s}^{*}(t),D(t)(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t)) + B(t)(u_{s}^{*}(t) - \bar {u}_{s}^{k}(t)) - \frac{d}{{dt}}(x_{s}^{*}(t) - \bar {x}_{s}^{k}(t))} \right\rangle dt} + \\ \, + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {u}_{s}^{k}(t) - u_{s}^{k}(t),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {u_{s}^{{k + 1}}(t) - u_{s}^{k}(t),u_{s}^{*}(t) - u_{s}^{{k + 1}}(t)} \right\rangle dt} - \\ \end{gathered} $
$\, - \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)(\bar {\psi }_{s}^{k}(t) - \psi _{s}^{k}(t)),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0.$
В силу (26) и (38), первый из интегралов в (68) равен нулю, в результате чего получаем

(69)
$\begin{gathered} \left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + \left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + {{\alpha }^{2}}\mathop {\left| {({{G}_{s}}\bar {x}_{s}^{k}({{t}_{s}}) - {{g}_{s}}) - ({{G}_{s}}x_{s}^{k}({{t}_{s}}) - {{g}_{s}})} \right|}\nolimits^2 + \\ \, + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {u}_{s}^{k}(t) - u_{s}^{k}(t),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} + \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {u_{s}^{{k + 1}}(t) - u_{s}^{k}(t),u_{s}^{*}(t) - u_{s}^{{k + 1}}(t)} \right\rangle dt} - \\ \, - \alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)(\bar {\psi }_{s}^{k}(t) - \psi _{s}^{k}(t)),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0. \\ \end{gathered} $

4. Усилим полученное неравенство и умножим его на 2:

$\begin{gathered} 2\left\langle {\bar {p}_{s}^{k} - p_{s}^{k},p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right\rangle + 2\left\langle {p_{s}^{{k + 1}} - p_{s}^{k},p_{s}^{*} - p_{s}^{{k + 1}}} \right\rangle + 2{{\alpha }^{2}}{{\left\| {{{G}_{s}}} \right\|}^{2}}{{\left| {\bar {x}_{s}^{k}({{t}_{s}}) - x_{s}^{k}({{t}_{s}})} \right|}^{2}} + \\ \, + 2\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {\bar {u}_{s}^{k}(t) - u_{s}^{k}(t),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} + 2\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {u_{s}^{{k + 1}}(t) - u_{s}^{k}(t),u_{s}^{*}(t) - u_{s}^{{k + 1}}(t)} \right\rangle dt} - \\ \, - 2\alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)(\bar {\psi }_{s}^{k}(t) - \psi _{s}^{k}(t)),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0. \\ \end{gathered} $
Используя тождество ${{\left| {{{y}_{1}} - {{y}_{2}}} \right|}^{2}} = {{\left| {{{y}_{1}} - {{y}_{3}}} \right|}^{2}} + $ $2\left\langle {{{y}_{1}} - {{y}_{3}},{{y}_{3}} - {{y}_{2}}} \right\rangle + {{\left| {{{y}_{3}} - {{y}_{2}}} \right|}^{2}}$ , избавимся от скалярных произведений (кроме последнего):
$\begin{gathered} {{\left| {p_{s}^{{k + 1}} - p_{s}^{k}} \right|}^{2}} - {{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} - {{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} + {{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}} - {{\left| {p_{s}^{{k + 1}} - p_{s}^{*}} \right|}^{2}} - {{\left| {p_{s}^{{k + 1}} - p_{s}^{k}} \right|}^{2}} + \\ \, + 2{{\alpha }^{2}}{{\left\| {{{G}_{s}}} \right\|}^{2}}{{\left| {\bar {x}_{s}^{k}({{t}_{s}}) - x_{s}^{k}({{t}_{s}})} \right|}^{2}} + {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{k}( \cdot )} \right\|}^{2}} - {{\left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} - {{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} - \\ \, - {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} - {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{k}( \cdot )} \right\|}^{2}} - 2\alpha \int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)(\bar {\psi }_{s}^{k}(t) - \psi _{s}^{k}(t)),u_{s}^{{k + 1}}(t) - \bar {u}_{s}^{k}(t)} \right\rangle dt} \geqslant 0. \\ \end{gathered} $
Умножая полученное неравенство на $( - 1)$ и используя неравенство Коши-Буняковского, оценим последний оставшийся член в виде скалярного произведения:

(70)
$\begin{gathered} {{\left| {p_{s}^{{k + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} + {{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} + {{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} - 2\alpha {{B}_{{{\text{max}}}}}\left\| {\bar {\psi }_{s}^{k}( \cdot ) - \psi _{s}^{k}( \cdot )} \right\|\left\| {u_{s}^{{k + 1}}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\| + \\ \, + {{\left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} - 2{{\alpha }^{2}}{{\left\| {{{G}_{s}}} \right\|}^{2}}{{\left| {\bar {x}_{s}^{k}({{t}_{s}}) - x_{s}^{k}({{t}_{s}})} \right|}^{2}} \leqslant {{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}}. \\ \end{gathered} $

5. Продолжим оценивать отдельные члены в левой части последнего неравенства.

i) Используя (51) и (58), (60), получаем

$\begin{gathered} 2\alpha {{B}_{{{\text{max}}}}}\left\| {\bar {\psi }_{s}^{k}( \cdot ) - \psi _{s}^{k}( \cdot )} \right\|\left\| {u_{s}^{{k + 1}}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\| \leqslant 2{{(\alpha {{B}_{{{\text{max}}}}})}^{2}}{{\left\| {\bar {\psi }_{s}^{k}( \cdot ) - \psi _{s}^{k}( \cdot )} \right\|}^{2}} \leqslant \\ \, \leqslant 2{{(\alpha {{B}_{{{\text{max}}}}})}^{2}}({{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}} - 1){\text{/}}({{D}_{{{\text{max}}}}}) \times {{\left| {\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}})} \right|}^{2}} \leqslant \\ \leqslant 2{{(\alpha {{B}_{{{\text{max}}\;}}})}^{2}}({{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}} - 1){\text{/}}({{D}_{{{\text{max}}}}}) \cdot 2{{\left\| {G_{s}^{{\text{T}}}} \right\|}^{2}}{{\left| {p_{s}^{k} - \bar {p}_{s}^{k}} \right|}^{2}} = {{\alpha }^{2}}{{d}_{1}}{{\left| {p_{s}^{k} - \bar {p}_{s}^{k}} \right|}^{2}}, \\ \end{gathered} $
где ${{d}_{1}} = 4{{\left\| {G_{s}^{{\text{T}}}} \right\|}^{2}}B_{{{\text{max}}}}^{2}({{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}} - 1){\text{/}}{{D}_{{{\text{max}}}}}$.

Тогда неравенство (70) примет вид

$\begin{gathered} {{\left| {p_{s}^{{k + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} + {{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} + (1 - {{\alpha }^{2}}{{d}_{1}}){{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} + {{\left\| {\mathop {\bar {u}}\nolimits_s^k ( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} + \\ \, + {{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} - 2{{\alpha }^{2}}{{\left\| {{{G}_{s}}} \right\|}^{2}}{{\left| {\bar {x}_{s}^{k}({{t}_{s}}) - x_{s}^{k}({{t}_{s}})} \right|}^{2}} \leqslant {{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}}. \\ \end{gathered} $

ii) Используя оценку (54), получаем

${{\left| {x_{s}^{k}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right|}^{2}} \leqslant 2{{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}}B_{{{\text{max}}}}^{2}({{t}_{s}} - {{t}_{{s - 1}}}){{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} = {{d}_{2}}{{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}},$
где ${{d}_{2}} = 2B_{{{\text{max}}}}^{2}({{t}_{s}} - {{t}_{{s - 1}}}){{e}^{{2{{D}_{{{\text{max}}}}}({{t}_{s}} - {{t}_{{s - 1}}})}}}$. Тогда
$\begin{gathered} {{\left| {p_{s}^{{k + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} + {{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} + (1 - {{\alpha }^{2}}{{d}_{1}}){{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} + \\ \, + {{\left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} + (1 - 2{{\alpha }^{2}}{{d}_{2}}{{\left\| {{{G}_{s}}} \right\|}^{2}})\parallel u_{s}^{k}( \cdot ) - \bar {u}_{s}^{{}} \leqslant {{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}}. \\ \end{gathered} $
Вводя обозначения
(71)
${{\gamma }_{1}} = {{d}_{1}},\quad {{\gamma }_{2}} = 2{{d}_{2}}{{\left\| {{{G}_{s}}} \right\|}^{2}},$
приходим к неравенству
(72)
$\begin{gathered} {{\left| {p_{s}^{{k + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} + {{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} + (1 - {{\alpha }^{2}}{{\gamma }_{1}}){{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} + {{\left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} + \\ \, + (1 - {{\alpha }^{2}}{{\gamma }_{2}}){{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} \leqslant {{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}}. \\ \end{gathered} $
Выбирая $\alpha $ из условия
(73)
$0 < \alpha < min\left( {\sqrt {\frac{1}{{{{\gamma }_{1}}}}} ,\sqrt {\frac{1}{{{{\gamma }_{2}}}}} } \right),$
получаем положительность всех слагаемых в левой части последнего неравенства. Отбрасывание части из них только усиливает это неравенство:
(74)
${{\left| {p_{s}^{{k + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} \leqslant {{\left| {p_{s}^{k} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}},$
т.е. последовательность $\left\{ {{{{\left| {p_{s}^{k} - p_{s}^{*}} \right|}}^{2}} + {{{\left\| {u_{s}^{k}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}}^{2}}} \right\}$ монотонно убывает на декартовом произведении $\mathbb{R}_{ + }^{m} \times \mathbb{L}_{2}^{r}[{{t}_{{s - 1}}},{{t}_{s}}]$.

6. Просуммируем неравенства (72) от $k = 0$ по $k = N$:

(75)
$\begin{gathered} {{\left| {p_{s}^{{N + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{N + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} + \sum\limits_{k = 0}^N \,{{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} + (1 - {{\alpha }^{2}}{{\gamma }_{1}})\sum\limits_{k = 0}^N \,{{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} + \\ + \;\sum\limits_{k = 0}^N \,{{\left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} + (1 - {{\alpha }^{2}}{{\gamma }_{2}})\sum\limits_{k = 0}^N \,{{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} \leqslant {{\left| {p_{s}^{0} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{0}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}}. \\ \end{gathered} $
При условии (73) получаем отсюда ограниченность при любом $N$ последовательности
(76)
${{\left| {p_{s}^{{N + 1}} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{{N + 1}}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}} \leqslant {{\left| {p_{s}^{0} - p_{s}^{*}} \right|}^{2}} + {{\left\| {u_{s}^{0}( \cdot ) - u_{s}^{*}( \cdot )} \right\|}^{2}},$
а также сходимость рядов
$\begin{gathered} \sum\limits_{k = 0}^\infty \,{{\left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right|}^{2}} < \infty ,\quad \sum\limits_{k = 0}^\infty \,{{\left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right|}^{2}} < \infty , \\ \sum\limits_{k = 0}^\infty \,{{\left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\|}^{2}} < \infty ,\quad \sum\limits_{k = 0}^\infty \,{{\left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\|}^{2}} < \infty , \\ \end{gathered} $
и соответственно стремление к нулю величин
(77)
$\begin{gathered} \left| {p_{s}^{{k + 1}} - \bar {p}_{s}^{k}} \right| \to 0,\quad \left| {\bar {p}_{s}^{k} - p_{s}^{k}} \right| \to 0, \\ \left\| {\bar {u}_{s}^{k}( \cdot ) - u_{s}^{{k + 1}}( \cdot )} \right\| \to 0,\quad \left\| {u_{s}^{k}( \cdot ) - \bar {u}_{s}^{k}( \cdot )} \right\| \to 0. \\ \end{gathered} $
Отсюда, используя неравенство треугольника, получаем
(78)
$\left| {p_{s}^{{k + 1}} - p_{s}^{k}} \right| \to 0,\quad \left\| {u_{s}^{{k + 1}}( \cdot ) - u_{s}^{k}( \cdot )} \right\| \to 0.$
Из (53), (54) и (59), (60) следует
(79)
$\begin{gathered} \left\| {x_{s}^{k}( \cdot ) - \bar {x}_{s}^{k}( \cdot )} \right\| \to 0,\quad \left| {x_{s}^{k}({{t}_{s}}) - \bar {x}_{s}^{k}({{t}_{s}})} \right| \to 0, \\ \left\| {\psi _{s}^{k}( \cdot ) - \bar {\psi }_{s}^{k}( \cdot )} \right\| \to 0,\quad \left| {\psi _{s}^{k}({{t}_{s}}) - \bar {\psi }_{s}^{k}({{t}_{s}})} \right| \to 0. \\ \end{gathered} $
Кроме того, из (76) следует ограниченность последовательностей
(80)
$\left| {p_{s}^{k} - p_{s}^{*}} \right| \leqslant {\text{const}},\quad \left\| {u_{s}^{k}(t) - u_{s}^{*}(t)} \right\| \leqslant {\text{const}},$
а из (53), (54) и (61) следует ограниченность последовательностей

(81)
$\begin{gathered} \left| {x_{s}^{k}({{t}_{s}}) - x_{s}^{*}({{t}_{s}})} \right| \leqslant {\text{const}},\quad \left\| {x_{s}^{k}(t) - x_{s}^{*}( \cdot )} \right\| \leqslant {\text{const}}, \\ \left| {\psi _{s}^{k}({{t}_{s}}) - \psi _{s}^{*}({{t}_{s}})} \right| \leqslant {\text{const}},\quad \left\| {\psi _{s}^{k}(t) - \psi _{s}^{*}( \cdot )} \right\| \leqslant {\text{const}}. \\ \end{gathered} $

7. Докажем теперь сходимость метода к решению задачи. Так как последовательность $\{ (x_{s}^{k},x_{s}^{k}(t),u_{s}^{k}(t);p_{s}^{k},\psi _{s}^{k}(t))\} $ ограничена на декартовом произведении ${{\mathbb{R}}^{n}} \times {\text{A}}{{{\text{C}}}^{n}}[{{t}_{{s - 1}}},\;{{t}_{s}}] \times {\text{U}} \times $ $ \times \;\mathbb{R}_{ + }^{m} \times {{\Psi }^{n}}[{{t}_{{s - 1}}},\;{{t}_{s}}]$, то она слабо компактна. Следовательно, существует подпоследовательность $\{ (x_{s}^{{{{k}_{i}}}},x_{s}^{{{{k}_{i}}}}(t),u_{s}^{{{{k}_{i}}}}(t);p_{s}^{{{{k}_{i}}}},\psi _{s}^{{{{k}_{i}}}}(t))\} $ и точка $(x_{s}^{'},x_{s}^{'}(t),u_{s}^{'}(t);p_{s}^{'},\psi _{s}^{'}(t))$, которая является слабым пределом этой подпоследовательности. Покажем, что эта точка совпадает с решением задачи $(x_{s}^{*},x_{s}^{*}(t),u_{s}^{*}(t);p_{s}^{*},\psi _{s}^{*}(t))$.

Заметим, что для переменных ${{p}_{s}},\;{{x}_{s}}$ – в конечномерных пространствах – слабая и сильная (по норме пространства) сходимости совпадают. Далее, в системе (34)–(41) все операторные уравнения, за исключением (37) и (41), являются слабо непрерывными [22 ] . В силу слабой непрерывности операторов и с учетом оценок (77)–(79), в пределе из (34)–(36) (или (38)–(40)), получим

(82)
$\frac{d}{{dt}}x_{s}^{'}(t) = D(t)x_{s}^{'}(t) + B(t)u_{s}^{'}(t),x_{s}^{'}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),\quad {{t}_{{s - 1}}} \leqslant t \leqslant {{t}_{s}},$
(83)
$p_{s}^{'} = {{\pi }_{ + }}(p_{s}^{'} + \alpha ({{G}_{s}}x_{s}^{'} - {{g}_{s}})),$
(84)
$\frac{d}{{dt}}\psi _{s}^{'}(t) + {{D}^{{\text{T}}}}(t)\psi _{s}^{'}(t) = 0,\quad \psi _{s}^{'} = \varphi + G_{s}^{{\text{T}}}p_{s}^{'}.$
Эта система почти полностью совпадает с достаточными условиями оптимальности (26)–(29), за исключением аналога неравенства (29) (предельного случая (33)). На самом деле он представлен, но неявно, поскольку был получен путем предельного перехода в (34)–(36) при ${{k}_{i}} \to + \infty $. Покажем это.

Из логики построения решения следует, что система (82)–(84) включает исходную задачу (2). Эта задача порождает функцию Лагранжа (4), которая имеет седловую точку, определяемую системой (5). Седловая система порождает прямое и двойственное решения. Двойственное решение предполагает существование двойственной задачи. В линейном случае двойственная задача легко выписывается в явном виде. Для этого достаточно перейти в (4) и (5) к сопряжeнным операторам, тогда мы получим двойственный лагранжиан (16) и двойственную седловую систему (17). Двойственный лагранжиан и двойственная седловая система формулируются в двойственном пространстве. Прямой и двойственный лагранжианы имеют одни и те же седловые точки. Это происходит благодаря тому, что значения билинейных функций не меняются при переходе к сопряженным линейным операторам. При этом двойственная задача (21) включает вариационное неравенство относительно оптимального управления на множестве ${\text{U}}$. Оптимальное управление является опорной точкой на множестве ${\text{U}}$ для линейного функционала с нормальным вектором ${{B}^{{\text{T}}}}(t)\psi _{s}^{*}(t)$.

Перейдя выше в (34)–(36) (или (38)–(40)) к слабому пределу по подпоследовательности $\{ (x_{s}^{{{{k}_{i}}}},x_{s}^{{{{k}_{i}}}}(t),u_{s}^{{{{k}_{i}}}}(t);p_{s}^{{{{k}_{i}}}},\psi _{s}^{{{{k}_{i}}}}(t))\} $, мы получили $(x_{s}^{'},x_{s}^{'}(t),u_{s}^{'}(t);p_{s}^{'},\psi _{s}^{'}(t))$. В результате имеем вектор нормали ${{B}^{{\text{T}}}}(t)\psi _{s}^{'}(t)$ и вариационное неравенство

(85)
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{'}(t),u_{s}^{'}(t) - {{u}_{s}}(t)} \right\rangle dt} \leqslant 0,\quad {{u}_{s}}( \cdot ) \in {\text{U}}.$

Объединяя (82)–(84) с (85), получаем полную седловую систему, которая представляет собой достаточное условие оптимальности:

$\frac{d}{{dt}}x_{s}^{'}(t) = D(t)x_{s}^{'}(t) + B(t)u_{s}^{'}(t),\quad x_{s}^{'}({{t}_{{s - 1}}}) = x_{{s - 1}}^{*}({{t}_{{s - 1}}}),\quad {{t}_{{s - 1}}} \leqslant t \leqslant {{t}_{s}},$
$p_{s}^{'} = {{\pi }_{ + }}(p_{s}^{'} + \alpha ({{G}_{s}}x_{s}^{'} - {{g}_{s}})),$
$\frac{d}{{dt}}\psi _{s}^{'}(t) + {{D}^{{\text{T}}}}(t)\psi _{s}^{'}(t) = 0,\quad \psi _{s}^{'} = \varphi + G_{s}^{{\text{T}}}p_{s}^{'},$
$\int\limits_{{{t}_{{s - 1}}}}^{{{t}_{s}}} {\left\langle {{{B}^{{\text{T}}}}(t)\psi _{s}^{'}(t),u_{s}^{'}(t) - {{u}_{s}}(t)} \right\rangle dt} \leqslant 0,\quad {{u}_{s}}( \cdot ) \in {\text{U}}.$
Эта система гарантирует, что найденная точка является решением исходной задачи. Иными словами,
$(x_{s}^{'},x_{s}^{'}(t),u_{s}^{'}(t);p_{s}^{'},\psi _{s}^{'}(t)) = (x_{s}^{*},x_{s}^{*}(t),u_{s}^{*}(t);p_{s}^{*},\psi _{s}^{*}(t)),$
т.е. любая предельная точка процесса (34)–(41) есть решение задачи (26)–(29).

Уточним вид сходимости по фазовым и сопряженным траекториям. В стандартных условиях управляемая динамика (не обязательно линейная) имеет единственное решение для каждого управления. Тогда если последовательность управлений слабо сходится к некоторому управлению, то соответствующая последовательность фазовых траекторий сходится в равномерной норме к решению, которое отвечает слабому пределу последовательности управлений (см. [12]). Применительно к нашему случаю это означает, что последовательности фазовых и сопряженных траекторий метода (34)–(41) сходятся в равномерной норме к решению исходной задачи. Теорема доказана.

9. ЗАКЛЮЧЕНИЕ

В статье исследуется задача терминального управления с конечномерной краевой задачей на правом конце отрезка времени и фазовыми ограничениями, распределенными в конечном заданном числе точек этого отрезка. Задача имеет выпуклую структуру, что делает возможным в рамках теории двойственности, используя седловые свойства лагранжиана, развить теорию седловых методов для решения задач терминального управления. Предложенный подход позволяет охватить сложный случай с наличием промежуточных фазовых ограничений на управляемые фазовые траектории. Доказана сходимость вычислительного процесса по всем компонентам решения. А именно, слабая сходимость по управлениям и сильная сходимость по фазовым и сопряженным траекториям, а также терминальным переменным.

Список литературы

  1. Antipin A.S., Khoroshilova E.V. Optimal control with connected initial and terminal conditions // Proc. Steklov Inst. Math. 2015. V. 289. № 1. Suppl. P. 9–25.

  2. Антипин А.С., Хорошилова Е.В. Линейное программирование и динамика // Тр. Ин-та матем. и мех. УрО РАН. 2015. Т. 19. № 2. С. 7–25.

  3. Antipin A.S., Khoroshilova E.V. Linear Programming and Dynamics // Ural Math. J. 2015. V. 1. № 1. P. 3–19.

  4. Antipin A.S., Khoroshilova E.V. Saddle-point approach to solving problem of optimal control with fixed ends // J. Global Optim. 2016. V. 65. № 1. P. 3–17.

  5. Antipin A.S., Khoroshilova E.V. On methods of terminal control with boundary-value problems: Lagrange approach // In B. Goldengorin (Ed.) Optimization and Applications in Control and Data Sciences. 2016. Springer Optimization and Its Applications 115, Springer, New York. P. 17–49.

  6. Antipin A.S., Khoroshilova E.V. Feedback Synthesis for a Terminal Control Problem // Comput. Math. Math. Phys. 2018. V. 58. № 12. P. 1903–1918.

  7. Antipin A.S., Khoroshilova E.V. Controlled dynamic model with boundary-value problem of minimizing a sensitivity function // Optim. Lett. 2019. V. 13. № 3. P. 451–473.

  8. Antipin A.S., Khoroshilova E.V. Lagrangian as a tool for solving linear optimal control problems with state constraints // Оптимальное управление и дифференциальные игры. Материалы Международной конференции, посвященной 110-летию со дня рождения Льва Семеновича Понтрягина. 2018. С. 23–26.

  9. Antipin A., Jacimovic V., Jacimovic M. Dynamics and Variational Inequalities // Comp. Maths. Math. Phys. 2017. V. 57. № 5. P. 784–801.

  10. Antipin A., Vasilieva O. Dynamic method of Multipliers in terminal control // Comp. Maths. Math. Phys. 2015. V. 55. № 5. P. 766–787.

  11. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление, Москва. Наука. 1979. English transl., North-Holland, Amsterdam.

  12. Vasilyev F.P. Optimization methods // In 2 Books. 2011. Moscow Center for Continuous Mathematical Education.

Дополнительные материалы отсутствуют.