Известия РАН. Теория и системы управления, 2021, № 5, стр. 33-51

ОПТИМИЗАЦИЯ ТРАЕКТОРИЙ ПЕРЕКЛЮЧАЕМЫХ СИСТЕМ

А. С. Бортаковский a*, И. В. Урюпин a

a МАИ (национальный исследовательский ун-т)
Москва, Россия

* E-mail: asbortakov@mail.ru

Поступила в редакцию 09.02.2021
После доработки 09.03.2021
Принята к публикации 31.05.2021

Полный текст (PDF)

Аннотация

Рассматривается задача оптимизации траекторий переключаемой системой, непрерывное движение которой описывается дифференциальными уравнениями, а дискретные изменения состояния (переключения) – рекуррентными включениями. Управление непрерывным движением осуществляется выбором состояния дискретной части системы. Моменты переключений, а также их количество заранее не заданы. Качество траектории характеризуется функционалом, в котором учитываются затраты на каждое переключение. Вместе с задачей оптимизации траекторий движения решается задача нахождения минимального количества переключений, при котором значение функционала качества не превышает заданной величины.

Введение. Переключаемые системы (ПС) служат математическими моделями многорежимных систем автоматического управления технологическими процессами и движущимися объектами [14]. Функционирование таких систем представляется непрерывно-дискретными процессами, которые имеют разнородное описание [46] и относятся к гибридным системам (ГС).

В статье рассматривается модель непрерывно-дискретной системы (НДС), в которой движение непрерывной части описывается дифференциальными уравнениями, а изменение состояния дискретной части (переключения) – рекуррентными включениями. Управление непрерывным движением осуществляется выбором состояния дискретной части, переключения которой в свою очередь зависят от состояния непрерывной части. В отличие от [7] количество переключений и моменты переключений заранее не заданы и подлежат оптимизации. При этом не исключаются многократные переключения в фиксированный момент времени [24]. Аналогичные модели ранее рассматривались в классе логико-динамических систем [8].

Из-за отсутствия управлений, явно входящих в уравнения движения, исследуемые ПС проще общих моделей ГС [918]. Получаемые для них условия оптимальности оказываются конструктивнее, чем в общем случае [11, 17]. Для построения достаточных условий оптимальности применяется разработанный в [3] подход с применением вспомогательных функций цены – так называемых образующих и условных функций цены. Вывод необходимых условий оптимальности вполне традиционный. Он связан с нахождением вариаций функционала, порождаемых вариациями моментов переключений и состояний дискретной части, в отличие от известных условий оптимальности ГС [12, 19, 20], которые доказываются при помощи принципа максимума.

Необходимые и достаточные условия оптимальности ПС доказываются для процессов с мгновенными многократными переключениями. Такие процессы, как правило, исключаются в задачах оптимизации ГС, несмотря на то, что именно они оказываются оптимальными не только в академических примерах, но и в приложениях, например в задачах группового управления.

Вместе с задачей оптимизации траектории ПС рассматривается задача минимизации количества переключений. Эта задача состоит в нахождении наименьшего количества переключений, при котором значение функционала качества не превышает заданного значения. Например, в классической задаче оптимального управления [21] допустимые управления – ограниченные измеримые (в прикладных задачах – кусочно-непрерывные). Можно сузить множество допустимых управлений, например, до кусочно-постоянных управлений с фиксированным числом переключений и искать решение в этом узком классе. Разумеется, при этом будем получать субоптимальное управление, которое, однако, при неограниченном росте количества переключений будет стремиться к оптимальному. Здесь возникает вопрос: при каком количестве переключений субоптимальное управление будет достаточно близким (по функционалу качества) к оптимальному управлению с прикладной точки зрения? Другим очевидным приложением задач минимизации переключений служит классическая задача аппроксимации, в которой требуется определить наименьшее количество частичных отрезков аппроксимации, чтобы погрешность не превышала допустимую. Заметим также, что проблема минимизации количества переключений нередко встречается в прикладных задачах, в которых число переключений, как правило, ограничено. Например, для вывода спутника на геостационарную орбиту используется разгонный блок “Бриз-М” [22], количество включений маршевого двигателя которого ограничено (не более 10 запусков). Это ограничение, разумеется, учитывается при разработке схемы полета. Потребность минимизации количества переключений возникает естественным образом, если затраты на каждое переключение существенные. В этом случае желательно достичь цели управления с наименьшим количеством переключений.

В статье получены достаточные и необходимые условия оптимальности траекторий ПС, а также следствия этих условий для задачи оптимального управления непрерывными системами в классе кусочно-постоянных управлений. Приведен пример минимизации переключений кусочно-постоянного управления, демонстрирующий применение необходимых условий оптимальности.

1. Постановки задач. Пусть на заданном промежутке времени $T = [{{t}_{0}},{{t}_{F}}]$ динамическая система совершает N переключений (скачков) в моменты времени ti, $i = 1,...,N,$ образующие неубывающую конечную последовательность $\mathcal{T} = \{ {{t}_{1}},...,{{t}_{N}}\} $:

(1.1)
${{t}_{0}} \leqslant {{t}_{1}} \leqslant ... \leqslant {{t}_{N}} \leqslant {{t}_{{N + 1}}} \triangleq {{t}_{F}}.$

Движение ПС описывается соотношениями

(1.2)
$\dot {x}(t) = f(t,x(t),{{y}_{i}}),\quad t \in {{T}_{i}},\quad i \in \mathcal{N},$
(1.3)
${{y}_{i}} \in G({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}){{\backslash }}\{ {{y}_{{i - 1}}}\} ,\quad i = 1,...,N,$
где $x(t)$ – состояние непрерывной части системы в момент времени tT, $x(t) \in X \subset {{\mathbb{R}}^{n}}$; ${{y}_{i}}$ – состояние дискретной части системы в момент времени ${{t}_{i}} \in \mathcal{T}$, $y\, \in \,Y\, \subset \,{{\mathbb{R}}^{m}}$; $\mathcal{N} \triangleq \{ i = 0,1,...,N\,{\mathbf{|}}\,{{t}_{i}} < {{t}_{{i + 1}}}\} $ – множество номеров ненулевых (по длине) частичных промежутков ${{T}_{i}} \triangleq [{{t}_{i}},{{t}_{{i + 1}}})$ непрерывного движения системы. При ${{t}_{i}} = {{t}_{{i + 1}}}$ дифференциальное уравнение (1.2) не учитывается ($i \notin \mathcal{N}$). Функция $f:T \times X \times Y \to {{\mathbb{R}}^{n}}$ непрерывна на всей области определения вместе с производной $\partial f{\text{/}}\partial x$; многозначное отображение $(t,x,y) \to G(t,x,y):T \times X \times Y \to {{2}^{Y}}$ замкнуто [23]. При выборе состояния дискретной части, согласно включению (1.3), исключаются так называемые фиктивные переключения, при которых состояние системы не изменяется (${{y}_{i}} = {{y}_{{i - 1}}}$) и фактического переключения нет. Возможное равенство последовательных моментов в (1.1) означает, что система совершает мгновенные многократные переключения [2, 3].

В соотношения (1.2), (1.3) управление не входит явным образом в отличие от НДС [7, 24]. Управление непрерывным движением (1.2) осуществляется выбором состояния дискретной части, а управление переключениями заменяется выбором состояния дискретной части, согласно рекуррентному включению (1.3). При фиксированном количестве переключений управляющих параметров в рассматриваемой модели ПС будет конечное число.

Начальное состояние системы задано условиями

(1.4)
$x({{t}_{0}}) = {{x}_{0}},\quad y({{t}_{0}}) = {{y}_{0}}.$

Условия (1.4) не исключают одного или нескольких переключений в начальный момент времени ${{t}_{0}}$, поскольку первые несколько моментов переключений (1.1) могут совпадать. Конечное состояние определяется первым достижением терминальной поверхности

(1.5)
$({{t}_{F}},x({{t}_{F}}),{{y}_{N}}) \in Г{\text{,}}$
задаваемой системой уравнений $\Gamma ({{t}_{F}},{{x}_{F}}) = 0$, где $\Gamma :[{{t}_{0}}, + \infty ) \times X \to {{\mathbb{R}}^{l}}$ – вектор-функция, непрерывная на всей области определения вместе с частными производными первого порядка. Аналогичные терминальные условия могут быть на левом конце траектории либо связывать оба конца [21, 23, 2527].

Множество допустимых процессов (траекторий) $\mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ образовано парами $d = (x( \cdot ),y( \cdot ))$, включающими траекторию $x( \cdot )$ непрерывной части системы – абсолютно непрерывную функцию $x:T \to X$, и траекторию $y( \cdot )$ дискретной части системы – конечную последовательность $y( \cdot ) \triangleq \{ ({{t}_{i}},{{y}_{i}})\,{\mathbf{|}}\,{{t}_{i}} \in \mathcal{T},\;{{y}_{i}} \in Y,\;i = 1,...,N\} $, которые удовлетворяют уравнению движения (1.2), включению (1.3), начальным условиям (1.4) и терминальному ограничению (1.5). Подчеркнем, что множество моментов переключений $\mathcal{T} = \{ {{t}_{1}},...,{{t}_{N}}\} $ служит областью определения траектории $y( \cdot )$, причем у разных допустимых траекторий количество переключений $N = \left| \mathcal{T} \right|$ и сами моменты переключений могут не совпадать. При этом не исключается случай отсутствия переключений, когда N = 0 и $\mathcal{T} = \emptyset $ – пустое множество по определению. При необходимости функцию $y( \cdot )$ будем доопределять на промежутках между переключениями, полагая $y(t) = {{y}_{i}}$, $t \in ({{t}_{i}},{{t}_{{i + 1}}})$, $i \in \mathcal{N}$.

Допустимый процесс ПС представляет собой совокупность траекторий движения непрерывной и дискретной частей системы, причем траектория $y( \cdot )$ дискретной части системы, согласно уравнению (1.2), служит управлением для непрерывной части. В свою очередь траектория $x( \cdot )$ непрерывной части через включение (1.3) влияет на выбор состояний дискретной части. Отметим, что процесс управления определяется конечным числом параметров: количеством переключений N, моментами переключений ${{t}_{1}},...,{{t}_{N}}$ и состояниями ${{y}_{1}},...,{{y}_{N}}$ и моментом окончания ${{t}_{F}}$.

На множестве допустимых процессов $\mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ задан функционал качества

(1.6)
$I(d) = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\,{{f}^{0}}(t,x(t),{{y}_{i}})\,dt} } + \sum\limits_{i = 1}^N {{{g}^{ + }}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}})} + F({{t}_{F}},x({{t}_{F}}),{{y}_{N}}),$
где функция ${{f}^{0}}:T \times X \times Y \to \mathbb{R}$ – непрерывна почти при всех t и ограничена снизу, функция $F:[{{t}_{0}}, + \infty ) \times X \times Y \to \mathbb{R}$ – ограничена снизу, а функция ${{g}^{ + }}:T \times X$ × $Y \times Y \to {{\mathbb{R}}_{ + }}$ – неотрицательная. Последнее условие позволяет рассматривать каждое слагаемое g+ в (1.6) как затраты (или “штраф”) при переключении ${{y}_{{i - 1}}} \to {{y}_{i}}$. В силу непрерывности функции ${{f}^{0}}(t,x,y)$ по всем аргументам функция ${{f}^{0}}[t] = {{f}^{0}}(t,x(t),y)$ будет измеримой и ограниченной, т.е. суммируемой, для любой допустимой траектории $d = (x( \cdot ),y( \cdot ))$. Поэтому функционал (1.6) определен на $\mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$. Отметим, что количество переключений $N$ и моменты переключений ${{t}_{1}},...,{{t}_{N}}$ в функционале (1.6) не фиксированы и являются ресурсом управления.

1.1. Задача оптимизации. Требуется найти минимальное значение функционала (1.6) и оптимальный процесс $d{\kern 1pt} * = (x{\kern 1pt} *( \cdot ),y{\kern 1pt} *( \cdot )) \in \mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$, на котором это значение достигается:

(1.7)
$I(d{\kern 1pt} *) = \mathop {\min }\limits_{d \in \mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})} I(d).$

Если наименьшее значение (1.7) не существует, то может быть поставлена задача нахождения минимизирующей последовательности допустимых процессов [25]. Количество переключений у процессов минимизирующей последовательности может оставаться конечным или неограниченно возрастать. Бесконечное количество переключений у оптимального процесса становится невозможным, если усилить условие неотрицательности функции g+ в (1.6):

(1.8)
${{g}^{ + }}(t,{{x}_{i}},{{y}_{{i - 1}}},{{y}_{i}}) \geqslant {\text{const}} > 0.$

Применение таких “штрафов” в функционале качества исключает последовательности процессов с неограниченным ростом числа переключений как неминимизирующие.

Отметим, что управляющие параметры в задаче (1.7) образуют “управляющий комплекс”, который включает: количество переключений, моменты переключений и состояния дискретной части системы, а также момент окончания процесса управления. При заданном количестве переключений N имеется $N(q + 1) + 1$ управляющих параметров. Как правило, решение поставленной задачи $I \to \min $ сводится к решению ряда задач ${{I}_{N}} \to \min $ с фиксированным числом переключений N, которое последовательно увеличивается $N = 0,1,...$

1.2. Задачи оптимизации с фиксированным или ограниченным количеством переключений. В прикладных задачах нередко возникают ограничения на количество переключений. Задача минимизации функционала (1.6) на множестве допустимых процессов с заданным числом переключений формулируется следующим образом. Пусть ${{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ – множество допустимых процессов из $\mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ с N-переключениями, быть может фиктивными. Подчеркнем, что количество переключений N у всех процессов из ${{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ одинаковое (равное N), но моменты переключений (1.1) у разных процессов могут не совпадать. Обозначим через ${{I}_{N}}(d)$ функционал (1.6) при фиксированном количестве переключений N. Он определен на подмножестве ${{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ множества $\mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$. Требуется найти минимальное значение функционала (1.6) на множестве ${{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ и процесс ${{d}^{N}} \in {{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$, на котором это значение достигается:

(1.9)
${{I}_{N}}({{d}^{N}}) = \mathop {\min }\limits_{d \in {{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})} {{I}_{N}}(d).$

Такой процесс ${{d}^{N}}$ будем называть условно оптимальным, имея в виду его оптимальность при дополнительном условии – заданном количестве переключений N.

Количество переключений технических устройств, как правило, ограничено. Поэтому актуальной является задача оптимизации ПС при ограниченном числе переключений. В этом случае задачу оптимизации (1.7) нужно решать при дополнительном условии $N \leqslant {{N}_{{\max }}}$, где ${{N}_{{\max }}}$ – максимально допустимое число переключений. Такое ограничение можно учесть в определении множества допустимых процессов либо дополнить задачу (1.9) целочисленной оптимизацией

$I = \mathop {\min }\limits_{0 \leqslant N \leqslant {{N}_{{\max }}}} \,\mathop {\min }\limits_{d \in {{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})} {{I}_{N}}(d).$

1.3. Задачи минимизации количества переключений при ограниченном функционале качества. Для систем, управляемых с переключениями, можно сформулировать задачи оптимизации количества переключений при ограничениях на показатель качества управления. Математическая формулировка такой задачи может быть следующей. Для ПС (1.1)–(1.5) требуется найти наименьшее количество переключений ${{N}^{\varepsilon }}$, при котором наименьшее значение ${{I}_{{{{N}^{\varepsilon }}}}}({{d}^{{{{N}_{\varepsilon }}}}})$ функционала (1.6) не превосходит заданной величины ε:

(1.10)
${{I}_{{{{N}^{\varepsilon }}}}}({{d}^{{{{N}_{\varepsilon }}}}}) = \mathop {\min }\limits_{d \in {{\mathcal{D}}_{{{{N}^{\varepsilon }}}}}({{t}_{0}},{{x}_{0}},{{y}_{0}})} {{I}_{{{{N}^{\varepsilon }}}}}(d) \leqslant \varepsilon .$

Сравнивая поставленные задачи, отмечаем, что в задаче (1.7) нужно найти оптимальное количество переключений, в задаче (1.9) количество переключений $N$ фиксировано, поэтому нужно получить только условный (с N переключениями) оптимальный процесс. В задаче (1.10) нужно искать минимальное количество переключений ${{N}^{\varepsilon }}$, при котором условный (с ${{N}^{\varepsilon }}$ переключениями) оптимальный процесс обеспечивает достижение заданного уровня $\varepsilon $ функционала качества. Заметим, что вопрос минимизации переключений возникает при численном (приближенном) решении разных задач, например при аппроксимации функций. В этом случае величина $\varepsilon > 0$ задает точность приближенного решения.

Важный частный случай задачи (1.10) возникает, когда функционал ${{I}_{N}}(d)$ играет роль характеристической функции множества допустимых процессов. Например, определим функционал качества следующим образом: ${{I}_{N}}(d) = 0$, если множество ${{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ не пусто, и ${{I}_{N}}(d) = + \infty $, если ${{\mathcal{D}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}}) = \emptyset $. В этом случае задача минимизации переключений формулируется так. Найти минимальное количество переключений N0, при котором наименьшее значение ${{I}_{{{{N}^{0}}}}}({{d}^{{{{N}^{0}}}}})$ функционала ${{I}_{N}}(d)$ равно нулю:

(1.11)
${{I}_{{{{N}^{0}}}}}({{d}^{{{{N}^{0}}}}}) = \mathop {\min }\limits_{d \in {{\mathcal{D}}_{{{{N}^{0}}}}}({{t}_{0}},{{x}_{0}},{{y}_{0}})} {{I}_{{{{N}^{0}}}}}(d) = 0.$

Иначе говоря, требуется найти минимальное количество переключений N0, при котором существует допустимый процесс с N0 переключениями.

Такая задача прямо связана с построением множеств достижимости (или разрешимости) для управляемой системы. Пусть, например, конечное состояние системы $x({{t}_{F}}) = {{x}_{F}}$ задано, а задача (1.11) имеет решение N0. Значит, конечное состояние ${{x}_{F}}$ достижимо из начального состояния ${{x}_{0}}$ за ${{N}^{0}}$ переключений, или, что то же самое, начальное состояние ${{x}_{0}}$ принадлежит множеству разрешимости для процессов с N0 переключениями.

2. Достаточные условия оптимальности. Применение метода динамического программирования [28] опирается на понятие функции цены (функции Гамильтона–Якоби–Беллмана), которая определяется минимальным значением функционала оставшихся потерь. Для рассматриваемой ПС применяется метод построения достаточных условий, разработанный для более общей модели гибридных систем [3]. Согласно этому методу, функция цены строится при помощи вспомогательных функций, так называемых образующих функции цены [24]. Определим вспомогательные функции для задачи (1.7).

Обозначим через $\mathcal{D}(t,x,y)$ множество допустимых процессов, удовлетворяющих начальным условиям $x(t) = x$, $y(t) = y$, каждый из которых имеет конечное число переключений на $[t,{{t}_{F}}]$. Оставшиеся переключения происходят в моменты ${{t}_{1}}$, …, ${{t}_{k}}$, образующие неубывающую последовательность на промежутке $[t,{{t}_{F}}]$:

(2.1)
$t \leqslant {{t}_{1}} \leqslant ... \leqslant {{t}_{k}} \leqslant {{t}_{{k + 1}}} \triangleq {{t}_{F}}.$

Заметим, что количество k оставшихся переключений и сами моменты ${{t}_{1}}$, …, ${{t}_{k}}$ переключений не фиксированы и у разных допустимых процессов могут не совпадать. Последовательность (2.1) отличается от (1.1) только стартовым моментом времени.

На множестве $\mathcal{D}(t,x,y)$ допустимых процессов определим функционал оставшихся потерь, аналогичный (1.6):

(2.2)
$I(d) = \sum\limits_{i = 0}^k {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\,{{f}^{0}}(t,x(t),{{y}_{i}})\,dt} } + \sum\limits_{i = 1}^N {{{g}^{ + }}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}})} + F({{t}_{F}},x({{t}_{F}}),{{y}_{N}}).$

Функция цены $\varphi (t,x,y)$ по определению равна значению функционала оставшихся потерь (2.2), вычисленному на оптимальном процессе с начальными условиями $x(t) = x$, $y(t) = y$. Иначе говоря, функция цены равна минимальному значению функционала оставшихся потерь (2.2) на множестве допустимых процессов $\mathcal{D}(t,x,y)$:

(2.3)
$\varphi (t,x,y) = \mathop {\min }\limits_{d \in D(t,x,y)} I(d).$

Для задачи (1.7) определим образующую функции цены, значение ${{\varphi }^{k}}(t,x,y)$ которой равно значению функционала оставшихся потерь (2.2), вычисленному на процессе, который оптимален среди всех допустимых процессов, исходящих из начальной позиции $(t,x,y)$ и имеющих ровно k переключений, быть может, фиктивных. Если обозначить через ${{\mathcal{D}}_{k}}(t,x,y)$ множество допустимых процессов из $\mathcal{D}(t,x,y)$, имеющих ровно k переключений, быть может, фиктивных, а через ${{I}_{k}}(d)$ – функционал (2.2) при фиксированном количестве k оставшихся переключений, то

${{\varphi }^{k}}(t,x,y) = \mathop {\min }\limits_{d \in {{\mathcal{D}}_{k}}(t,x,y)} {{I}_{k}}(d)$.

Если для позиции $(t,x,y)$ нет допустимых процессов с k переключениями, т.е. множество ${{\mathcal{D}}_{k}}(t,x,y)$ пусто, то полагаем ${{\varphi }^{k}}(t,x,y) = + \infty $. Функция цены находится по своим образующим

(2.4)
$\varphi (t,x,y) = \mathop {\min }\limits_{k \in {{\mathbb{Z}}_{ + }}} {{\varphi }^{k}}(t,x,y).$

Здесь и далее ${{\mathbb{Z}}_{ + }}$ – множество целых неотрицательных чисел.

Вывод уравнений, которым удовлетворяют образующие функции цены, опирается на принцип оптимальности Беллмана, модифицированный для задач с переключениями. Согласно этому принципу, оптимальный процесс с k оставшимися переключениями, после первого переключения, является оптимальным процессом с k – 1 оставшимися переключениями.

Нулевую образующую ${{\varphi }^{0}}(t,x,y)$ находим как значение функционала (2.2) на оптимальном процессе $(x( \cdot ),y( \cdot ))$ без переключений, т.е. при постоянном состоянии $y(t) = y$ дискретной части. Эта функция удовлетворяет уравнению

$\varphi _{t}^{0}(t,x,y) + \varphi _{x}^{0}(t,x,y)f(t,x,y) + {{f}^{0}}(t,x,y) = 0$
с терминальным условием на поверхности (1.5):

${{\varphi }^{0}}({{t}_{F}},x,y) = F({{t}_{F}},x,y),$$\Gamma ({{t}_{F}},x) = 0.$

Решение этой задачи можно представить в виде

(2.5)
${{\varphi }^{0}}(t,x,y) = F({{t}_{F}},x({{t}_{F}}),y) + \int\limits_t^{{{t}_{F}}} {{{f}^{0}}(\theta ,x(\theta ),y)\,d\theta } ,\quad \Gamma ({{t}_{F}},x({{t}_{F}})) = 0,$
где $x(\theta ) = {\mathbf{x}}(\theta {\mathbf{|}}t,x,y)$, $t \leqslant \theta \leqslant {{t}_{F}}$, – решение задачи Коши
(2.6)
$\dot {x}(\theta ) = f(\theta ,x(\theta ),y),\quad x(t) = x,$
при постоянном значении y. Нулевая образующая ${{\varphi }^{0}}(t,x,y)$ находится по формуле (2.5) только для допустимых конечных позиций $({{t}_{F}},x({{t}_{F}})) \in Г$. Если ограничение $\Gamma ({{t}_{F}},x({{t}_{F}})) = 0$ в (2.5) не выполняется, то полагаем ${{\varphi }^{0}}(t,x,y) = + \infty $.

Выведем уравнение для остальных образующих. Пусть известна образующая ${{\varphi }^{{k - 1}}}$, $k \in \mathbb{N}$. Получим следующую образующую ${{\varphi }^{k}}$. Траекторию, исходящую из позиции $(t,x,y)$, разбиваем на две части – до первого переключения в момент времени τ и после него. Значение ${{\varphi }^{k}}(t,x,y)$ складывается из “расходов” на непрерывное движение до переключения, затрат на переключение и оставшихся потерь после переключения. Минимальное значение оставшихся потерь, согласно принципу оптимальности, вычисляется по образующей ${{\varphi }^{{k - 1}}}$. Затраты на непрерывное движение и скачок зависят от момента переключения $\tau \geqslant t$ и состояния $z$ системы после переключения $y \to z$. Минимизируя по этим параметрам, получаем значение образующей

(2.7)
${{\varphi }^{k}}(t,x,y) = \mathop {\min }\limits_{t \leqslant \tau \leqslant {{t}_{F}}} \left\{ {\int\limits_t^\tau {{{f}^{0}}(\theta ,x(\theta ),y)\,d\theta } + \mathop {\min }\limits_{z \in G(\tau ,x(\tau ),y)} [{{\varphi }^{{k - 1}}}(\tau ,x(\tau ),z) + {{g}^{ + }}(\tau ,x(\tau ),y,z)]} \right\}.$

Здесь $x(\theta ) = {\mathbf{x}}(\theta {\mathbf{|}}t,x,y)$, $t \leqslant \theta \leqslant \tau $, – решение задачи Коши (2.6) при постоянном значении $y$. Уравнение (2.7) позволяет найти образующие ${{\varphi }^{k}}(t,x,y)$, $k \in \mathbb{N}$.

Минимальное значение функционала (2.2) находится по функции цены (2.3), согласно равенству (2.4):

(2.8)
$\mathop {\min }\limits_{d \in \mathcal{D}(t,x,y)} I(d) = \varphi {\kern 1pt} {\kern 1pt} (t,x,y) = \mathop {\min }\limits_{k \in {{\mathbb{Z}}_{ + }}} {{\varphi }_{k}}(t,x,y).$

При решении уравнений (2.7) выполняются две операции минимизации. В результате минимизации правой части (2.7) определяем оптимальную позиционную конструкцию дискретной части системы

(2.9)
${{y}_{k}}(\tau ,x,y) = \mathop {\arg \min }\limits_{z \in G(\tau ,x,y)} [{{\varphi }^{{k - 1}}}(\tau ,x,z) + {{g}^{ + }}(\tau ,x,y,z)]$
и оптимальный момент первого из оставшихся $k$ переключений

(2.10)
${{\tau }_{k}}(t,x,y) = \mathop {\arg \min }\limits_{t \leqslant \tau \leqslant {{t}_{F}}} \left\{ {\,\int\limits_t^\tau {{{f}^{0}}(\theta ,x(\theta ),y)\,d\theta } + \mathop {\min }\limits_{z \in G(\tau ,x(\tau ),y)} [{{\varphi }^{{k - 1}}}(\tau ,x(\tau ),z) + {{g}^{ + }}(\tau ,x(\tau ),y,z)]} \right\}.$

Точки минимума (2.9), (2.10) находятся при дополнительном условии – заданном количестве k оставшихся переключений. Оптимальное количество переключений определяется в результате минимизации (2.4):

(2.11)
${\mathbf{k}}(t,x,y) = \mathop {\arg \min }\limits_{k \in {{\mathbb{Z}}_{ + }}} {{\varphi }^{k}}(t,x,y).$

Позиционные конструкции (2.9)–(2.11) позволяют найти оптимальный процесс. Действительно, пусть система находится в позиции $({{t}_{0}},{{x}_{0}},{{y}_{0}})$, т.е. удовлетворяет начальным условиям (1.4). Тогда для этой позиции определяем оптимальное количество переключений $N\, = \,{\mathbf{k}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$, а также момент первого переключения ${{t}_{1}} = {{{\mathbf{\tau }}}_{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$. Если ${{t}_{1}} > {{t}_{0}}$, то на промежутке $[{{t}_{0}},{{t}_{1}})$ траектория x(t) непрерывной части удовлетворяет уравнению (1.2) с параметром ${{y}_{0}}$. В конце промежутка $t = {{t}_{1}}$ происходит переключение ${{y}_{0}} \to {{y}_{1}} = {{{\mathbf{y}}}_{N}}({{t}_{1}},x({{t}_{1}}),{{y}_{0}})$. Если ${{t}_{1}} = {{t}_{0}}$, то дискретная часть изменяет состояние сразу, согласно (2.9): ${{y}_{0}} \to {{y}_{1}} = {{{\mathbf{y}}}_{N}}({{t}_{1}},{{x}_{0}},{{y}_{0}})$. Состояние непрерывной части системы при этом сохраняется. Таким образом, в любом случае система приходит в позицию $({{t}_{1}},{{x}_{1}},{{y}_{1}})$, в которой выполняются те же действия, за исключением поиска оптимального количества переключений, так как оно равно N – 1. Если в начальной позиции $({{t}_{0}},{{x}_{0}},{{y}_{0}})$ оптимальное количество переключений равно нулю: ${\mathbf{k}}({{t}_{0}},{{x}_{0}},{{y}_{0}}) = 0$, то переключений дискретной части нет, а движение непрерывной части происходит, согласно уравнению (1.2), с параметром ${{y}_{0}}$.

Теорема 1. Если для задачи (1.1)–(1.7) существует последовательность функций φk : T $ \times \,X \times \,Y \to {{\mathbb{R}}^{n}}$, $k \in {{\mathbb{Z}}_{ + }}$, удовлетворяющих на области определения уравнениям (2.5), (2.7), то для оптимальности допустимого процесса d = $(x( \cdot ),y( \cdot )) \in \mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ с моментами переключений ${{t}_{1}}$, …, ${{t}_{N}}$, образующими неубывающую последовательность (1.1), достаточно, чтобы выполнялись условия

(2.12)
$N = {\mathbf{k}}({{t}_{0}},{{x}_{0}},{{y}_{0}}),$
(2.13)
${{y}_{i}} = {{{\mathbf{y}}}_{{N - i + 1}}}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}),$
(2.14)
${{t}_{i}} = {{{\mathbf{\tau }}}_{{N - i + 1}}}({{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}}),$
где ${{t}_{{i - 1}}} \leqslant t < {{t}_{i}}$, $i = 1,...,N$. При N = 0 формулы (2.13), (2.14) не используются.

Доказательство. Уравнение (2.7), учитывая позиционные конструкции (2.9), (2.10), можно представить в виде

(2.15)
${{\varphi }^{k}}(t,x,y) = \int\limits_t^{{{\tau }_{k}}} {{{f}^{0}}(\theta ,x(\theta ),y)\,d\theta } + {{\varphi }^{{k - 1}}}({{\tau }_{k}},x({{\tau }_{k}}),{{y}_{k}}) + {{g}^{ + }}({{\tau }_{k}},x({{\tau }_{k}}),y,{{y}_{k}}),$
где ${{y}_{k}} = {{y}_{k}}({{{\mathbf{\tau }}}_{k}},x({{{\mathbf{\tau }}}_{k}}),y)$, ${{{\mathbf{\tau }}}_{k}} = {{{\mathbf{\tau }}}_{k}}(t,x,y)$, а $x({{{\mathbf{\tau }}}_{k}}) = {\mathbf{x}}({{{\mathbf{\tau }}}_{k}}{\mathbf{|}}t,x,y)$ – решение задачи Коши (2.6). Заменим в (2.15) $t = {{t}_{{i - 1}}}$, $x = x({{t}_{{i - 1}}})$, $y = {{y}_{{i - 1}}}$:

(2.16)
${{\varphi }^{k}}({{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}}) = \int\limits_{{{t}_{{i - 1}}}}^{{{\tau }_{k}}} {{{f}^{0}}(\theta ,x(\theta ),y)\,d\theta } + {{\varphi }^{{k - 1}}}({{\tau }_{k}},x({{\tau }_{k}}),{{y}_{k}}) + {{g}^{ + }}({{\tau }_{k}},x({{\tau }_{k}}),{{y}_{{i - 1}}},{{y}_{k}}).$

Здесь ${{y}_{k}} = {{y}_{k}}({{{\mathbf{\tau }}}_{k}},x({{{\mathbf{\tau }}}_{k}}),{{y}_{{i - 1}}})$, ${{{\mathbf{\tau }}}_{k}} = {{{\mathbf{\tau }}}_{k}}({{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}})$, а $x({{{\mathbf{\tau }}}_{k}}) = {\mathbf{x}}({{{\mathbf{\tau }}}_{k}}{\mathbf{|}}{{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}})$ – решение задачи Коши (2.6). Для $k = N - i + 1$, согласно (2.14), (2.13), имеем

${{{\mathbf{\tau }}}_{k}} = {{{\mathbf{\tau }}}_{k}}({{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}}) = {{t}_{i}},\quad x({{{\mathbf{\tau }}}_{k}}) = {\mathbf{x}}({{t}_{i}}{\mathbf{|}}{{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}}) = x({{t}_{i}}),\quad {{y}_{k}} = {{y}_{k}}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}) = {{y}_{i}}.$

Подставляя эти выражения в (2.16), запишем разность образующих

(2.17)
${{\varphi }^{k}}({{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}}) - {{\varphi }^{{k - 1}}}({{t}_{i}},x({{t}_{i}}),{{y}_{i}}) = \int\limits_{{{t}_{{i - 1}}}}^{{{t}_{i}}} {{{f}^{0}}(\theta ,x(\theta ),{{y}_{{i - 1}}})\,d\theta } + {{g}^{ + }}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}}).$

Суммируя равенства (2.17) при $i = 1,...,N$ (соответственно при $k = N,...,1$), находим

(2.18)
${{\varphi }^{N}}({{t}_{0}},x({{t}_{0}}),{{y}_{0}}) - {{\varphi }^{0}}({{t}_{N}},x({{t}_{N}}),{{y}_{N}}) = \sum\limits_{i = 1}^N {\int\limits_{{{t}_{{i - 1}}}}^{{{t}_{i}}} {{{f}^{0}}(\theta ,x(\theta ),{{y}_{{i - 1}}})\,d\theta } } + \sum\limits_{i = 1}^N {{{g}^{ + }}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}})} .$

Учитывая в (2.18) значение нулевой образующей из (2.5), приходим к соотношению

${{\varphi }^{N}}({{t}_{0}},x({{t}_{0}}),{{y}_{0}}) = \sum\limits_{i = 1}^{N + 1} {\int\limits_{{{t}_{{i - 1}}}}^{{{t}_{i}}} {{{f}^{0}}(\theta ,x(\theta ),{{y}_{{i - 1}}})\,d\theta } } + \sum\limits_{i = 1}^N {{{g}^{ + }}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}})} .$

Значит, для допустимого процесса $d = (x( \cdot ),y( \cdot ))$ выполняется равенство ${{\varphi }^{N}}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ = I(d). Учитывая условие (2.12), заключаем, что $\varphi ({{t}_{0}},{{x}_{0}},{{y}_{0}}) = I(d)$, т.е. этот процесс d оптимальный, так как значение функционала равно значению функции цены, согласно (2.8). Доказательство теоремы при отсутствии переключений (т.е. при N = 0) сводится к получению равенства ${{\varphi }^{0}}({{t}_{0}},{{x}_{0}},{{y}_{0}}) = I(d)$ из (2.5) и условия (2.12).

3. Необходимые условия оптимальности. Вывод условий оптимальности по методике [26] состоит в следующем: используя вариации управления, составляем уравнение для вариации траектории; выражаем вариацию функционала через вариации управления и траектории, исключаем из полученного выражения вариацию траектории, вводя вспомогательные переменные, удовлетворяющие сопряженной системе и условиям трансверсальности (в форме А.М. Летова [29]). Будем сравнивать значения функционала (1.6) на опорном (невозмущенном) допустимом процессе $d = (x( \cdot ),y( \cdot ))$ и возмущенном допустимом процессе $\tilde {d} = (\tilde {x}( \cdot ),\,\tilde {y}( \cdot ))$. Возмущенный процесс получается в результате вариации $\delta y( \cdot )$ опорной траектории $y( \cdot )$ дискретной части системы, что приводит к малым вариациям $\delta x( \cdot )$ опорной траектории $x( \cdot )$ непрерывной части системы, а также малым вариациям $\delta I$ функционала. Перечисленные требования ограничивают применяемые вариации $\delta y( \cdot )$. Действительно, количество переключений $\tilde {N}$ у возмущенного процесса должно совпадать с числом переключений N невозмущенного. В противном случае, из-за условия (1.8), приращение функционала $\Delta I = I(\tilde {d}) - I(d)$ будет конечным. Поэтому используем два типа вариаций управляющих параметров: либо малые изменения $\delta {{y}_{i}}$ управления ${{y}_{i}}$ и малую вариацию $\delta {{t}_{F}}$ момента окончания, либо малые вариации $\delta {{t}_{i}}$ моментов переключений ${{t}_{i}}$, $i = 1,...,N$.

Первый случай. Малые вариации $\delta {{y}_{i}}$, $i = 1,...,N$, траектории $y( \cdot )$ и момента окончания $\delta {{t}_{F}}$, при фиксированных моментах переключений. Вариация $\delta x( \cdot )$ траектории динамической части удовлетворяет уравнению [26]

(3.1)
$\delta \dot {x}(t) = {{f}_{x}}[t]\delta x(t) + {{f}_{y}}[t]\delta {{y}_{i}},\quad t \in {{T}_{i}},\quad i \in \mathcal{N}.$

Здесь и далее принято, что аргумент t, заключенный в квадратные скобки, означает, что функция вычислена на опорном режиме в указанный момент времени [26], например ${{f}_{x}}[t] = {{f}_{x}}(t,x(t),y(t))$. Вариация $\delta x( \cdot )$ имеет такой же порядок малости, что и $\delta y( \cdot )$. Уравнение в вариациях (3.1) выполняются с точностью $o(\left\| {\delta y( \cdot )} \right\|)$, где $\left\| {\delta y( \cdot )} \right\| = \max \{ \left| {\delta {{y}_{1}}} \right|,...,\left| {\delta {{y}_{N}}} \right|\} $ считается величиной первого порядка малости. В начальный момент времени вариация нулевая: $\delta x({{t}_{0}}) = 0$, а в конечный – удовлетворяет условию

(3.2)
$\delta \Gamma [{{t}_{F}}] = 0 \Leftrightarrow {{\Gamma }_{t}}[{{t}_{F}}]\delta {{t}_{F}} + {{\Gamma }_{x}}[{{t}_{F}}]\delta {{x}_{F}} = 0.$

Запишем вариацию функционала (1.6):

(3.3)
$\begin{gathered} \delta I = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\{ f_{x}^{0}[t]\delta x(t) + f_{y}^{0}[t]\delta {{y}_{i}}\} dt} } + \sum\limits_{i = 1}^N {\{ g_{x}^{ + }[{{t}_{i}}]\delta x({{t}_{i}}) + g_{y}^{ + }[{{t}_{i}}]\delta {{y}_{{i - 1}}} + g_{z}^{ + }[{{t}_{i}}]\delta {{y}_{i}}\} } + \\ \, + \{ {{F}_{t}}[{{t}_{F}}] + {{f}^{0}}[{{t}_{F}}]\} \delta {{t}_{F}} + {{F}_{x}}[{{t}_{F}}]\delta {{x}_{F}} + {{F}_{y}}[{{t}_{F}}]\delta {{y}_{N}}, \\ \end{gathered} $
где $\delta {{x}_{F}} = \delta x({{t}_{F}}) + f[{{t}_{F}}]\delta {{t}_{F}}$. Значения всех производных в (3.3) вычисляются на невозмущенном процессе, причем частные производные функции ${{g}^{ + }}(t,x,{{y}_{{i - 1}}},{{y}_{i}})$ по ${{y}_{{i - 1}}}$ и yi обозначаются соответственно через $g_{y}^{ + }$ и $g_{z}^{ + }$, как у функции ${{g}^{ + }}(t,x,y,z)$.

Теперь следует исключить в (3.3) вариации δx при помощи вспомогательных функций. Для этого будем использовать тождество

(3.4)
${{\varphi }_{N}}({{t}_{F}}) - {{\varphi }_{0}}({{t}_{0}}) = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{{\dot {\varphi }}}_{i}}(t)dt} + \sum\limits_{i = 1}^N {[{{\varphi }_{i}}({{t}_{i}}) - {{\varphi }_{{i - 1}}}({{t}_{{i - }}})]} } \,,$
справедливое для скалярных функций ${{\varphi }_{i}}(t)$, $i = 0,1,...,N$, определенных соответственно в точках ${{t}_{i}}$, $i = 1,...,N$, и абсолютно непрерывных на ${{T}_{i}}$, $i \in \mathcal{N}$. В тождестве (3.4) через ${{t}_{{i - }}}$ обозначен момент времени непосредственно перед i-м скачком, т.е. ${{t}_{{i - }}} = {{t}_{i}} - 0$ при ${{t}_{{i - 1}}} < {{t}_{i}}$ и ${{t}_{{i - }}} = {{t}_{{i - 1}}}$ при ${{t}_{{i - 1}}} = {{t}_{i}}$. Функция ${{\varphi }_{N}}$ определена на промежутке ${{T}_{N}} = [{{t}_{N}},\;{{t}_{F}}]$, в частности, в точке ${{T}_{N}} = \{ {{t}_{N}}\} $, если ${{t}_{F}} = {{t}_{N}}$. Тождествo доказывается по формуле Ньютона–Лейбница.

Введем функцию Гамильтона–Понтрягина (ГП)

(3.5)
$H(\psi ,t,x,y) = \psi f(t,x,y) - {{f}^{0}}(t,x,y),$
где $\psi = ({{\psi }^{1}},...,{{\psi }^{n}})$ – вспомогательные переменные. Для промежутка T с разбиением (1.1) рассмотрим вспомогательные функции ${{\psi }_{i}}:{{T}_{i}} \to {{\mathbb{R}}^{n}}$, $i = 0,1,...,N$, определенные на ${{T}_{i}}$, $i = 0,1,...,N$, и абсолютно непрерывные на ненулевых (по длине) промежутках ${{T}_{i}}$, $i \in \mathcal{N}$. Напомним, что ${{T}_{i}} = \{ {{t}_{i}}\} $ при ${{t}_{i}} = {{t}_{{i + 1}}}$, $i \notin \mathcal{N}$. Предполагаем, что вспомогательные функции удовлетворяют:

1) сопряженному уравнению

(3.6)
${{\dot {\psi }}_{i}}(t) = - {{H}_{x}}({{\psi }_{i}}(t),t,x(t),{{y}_{i}}),\quad t \in {{T}_{i}},\quad i \in \mathcal{N};$

2) промежуточным условиям

(3.7)
${{\psi }_{i}}({{t}_{i}}) - {{\psi }_{{i - 1}}}({{t}_{{i - }}}) = g_{x}^{ + }({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}}),\quad i = 1,...,N;$

3) условию трансверсальности

(3.8)
$\{ {{F}_{t}}[{{t}_{F}}] - H[{{t}_{F}}]\} \delta {{t}_{F}} + \{ {{F}_{x}}[{{t}_{F}}] + {{\psi }_{N}}({{t}_{F}})\} \,\delta {{x}_{F}} = 0$
для любых вариаций, связанных равенством ${{\Gamma }_{t}}[{{t}_{F}}]\delta {{t}_{F}} + {{\Gamma }_{x}}[{{t}_{F}}]\delta {{x}_{F}} = 0$. В (3.8), как и ранее, $H[{{t}_{F}}] \triangleq H({{\psi }_{N}}({{t}_{F}}),{{t}_{F}},x({{t}_{F}}),{{y}_{N}})$ – значение функции ГП на опорном режиме в момент ${{t}_{F}}$.

Записываем тождество (3.4) для функций ${{\varphi }_{i}}(t) = {{\psi }_{i}}(t)\delta x(t)$. Учитывая непрерывность $\delta x(t)$, а также равенство δx(t0) = 0, получаем

(3.9)
${{\psi }_{N}}({{t}_{F}})\delta x({{t}_{F}}) - \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\{ {{{\dot {\psi }}}_{i}}(t)\delta x(t) + {{\psi }_{i}}(t)\delta \dot {x}(t)\} dt} } - \sum\limits_{i = 1}^N {[\psi ({{t}_{i}}) - {{\psi }_{{i - 1}}}({{t}_{{i - }}})]\delta x({{t}_{i}})} = 0.$

Добавляем левую часть этого выражения в правую часть (3.3). В терминальных членах исчезнут вариации $\delta {{t}_{F}}$ и $\delta x({{t}_{F}})$. Действительно, учитывая равенство $\delta x({{t}_{F}}) = \delta {{x}_{F}} - f[{{t}_{F}}]\,\delta {{t}_{F}}$, имеем

${{\psi }_{N}}({{t}_{F}})\delta x({{t}_{F}}) + {{f}^{0}}[{{t}_{F}}]\delta {{t}_{F}} = {{\psi }_{N}}({{t}_{F}})\{ \delta {{x}_{F}} - f[{{t}_{F}}]\delta {{t}_{F}}\} + {{f}^{0}}[{{t}_{F}}]\delta {{t}_{F}} = {{\psi }_{N}}({{t}_{F}})\delta {{x}_{F}} - H[{{t}_{F}}]\delta {{t}_{F}}.$

Тогда

$\begin{gathered} \{ {{F}_{t}}[{{t}_{F}}] + {{f}^{0}}[{{t}_{F}}]\} \delta {{t}_{F}} + {{F}_{x}}[{{t}_{F}}]\delta {{x}_{F}} + {{F}_{y}}[{{t}_{F}}]\delta {{y}_{N}} + {{\psi }_{N}}({{t}_{F}})\delta x({{t}_{F}}) = \\ \, = \{ {{F}_{t}}[{{t}_{F}}] - H[{{t}_{F}}]\} \delta {{t}_{F}} + \{ {{F}_{x}}[{{t}_{F}}] + {{\psi }_{N}}({{t}_{F}})\} \delta {{x}_{F}} + {{F}_{y}}[{{t}_{F}}]\delta {{y}_{N}} = {{F}_{y}}[{{t}_{F}}]\delta {{y}_{N}}, \\ \end{gathered} $
согласно условию трансверсальности (3.8).

Преобразуем интегральные члены после добавления к правой части (3.3) левой части (3.9). С учетом уравнения в вариациях (3.1) и сопряженного уравнения (3.6) подынтегральная функция не будет содержать вариацию $\delta x(t)$:

$\begin{gathered} f_{x}^{0}[t]\delta x(t) + f_{y}^{0}[t]\delta {{y}_{i}} - {{{\dot {\psi }}}_{i}}(t)\delta x(t) - {{\psi }_{i}}(t)\delta \dot {x}(t) = f_{x}^{0}[t]\delta x(t) + \{ {{\psi }_{i}}(t){{f}_{x}}[t] - f_{x}^{0}[t]\} \delta x(t) + \\ \, + f_{y}^{0}[t]\delta {{y}_{i}} - {{\psi }_{i}}(t)\{ {{f}_{x}}[t]\delta x(t) + {{f}_{y}}[t]\delta {{y}_{i}}\} = \{ {{\psi }_{i}}(t){{f}_{y}}[t] - f_{y}^{0}[t]\} \delta {{y}_{i}} = - {{H}_{y}}[t]\delta {{y}_{i}}. \\ \end{gathered} $

Осталось преобразовать суммы. Записываем слагаемые с вариациями $\delta x({{t}_{i}})$:

$g_{x}^{ + }[{{t}_{i}}]\delta x({{t}_{i}}) - [\psi ({{t}_{i}}) - {{\psi }_{{i - 1}}}({{t}_{{i - }}})]\delta x({{t}_{i}}) = \{ g_{x}^{ + }[{{t}_{i}}] - \psi ({{t}_{i}}) + {{\psi }_{{i - 1}}}({{t}_{{i - }}})\} \delta x({{t}_{i}}) = 0,$
согласно промежуточным условиям (3.7). Таким образом, вариации траектории $\delta x( \cdot )$ и момента окончания $\delta {{t}_{F}}$ исключены из выражения (3.3). Теперь вариация функционала (1.6) зависит только от вариаций $\delta {{y}_{i}}$, причем $\delta {{y}_{0}} = 0$:

(3.10)
$\begin{gathered} \delta I = - \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{H}_{y}}[t]\delta {{y}_{i}}dt} } + \sum\limits_{i = 1}^N {\{ g_{y}^{ + }[{{t}_{i}}]\delta {{y}_{{i - 1}}} + g_{z}^{ + }[{{t}_{i}}]\delta {{y}_{i}}\} } + {{F}_{y}}[{{t}_{F}}]\delta {{y}_{N}} = \\ \, = \sum\limits_{i = 1}^{N - 1} {\{ g_{y}^{ + }[{{t}_{{i + 1}}}] + g_{z}^{ + }[{{t}_{i}}] - \int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{H}_{y}}[t]dt} \} \delta {{y}_{i}}} + \{ g_{z}^{ + }[{{t}_{N}}] + {{F}_{y}}[{{t}_{F}}] - \int\limits_{{{t}_{N}}}^{{{t}_{F}}} {{{H}_{y}}[t]dt} \} \delta {{y}_{N}}. \\ \end{gathered} $

Второй случай. Вариации $\delta {{t}_{i}}$ моментов ti, $k = 1,...,N$. Предполагаем, что они настолько малы, что выполняются неравенства

${{t}_{0}} \leqslant {{t}_{1}} + \delta {{t}_{1}} \leqslant ... \leqslant {{t}_{N}} + \delta {{t}_{N}} \leqslant {{t}_{F}}.$

Величину ${\text{|}}\delta t{\text{|}}\; = \;{\text{|}}\delta {{t}_{1}}{\text{|}}\; + ... + \;{\text{|}}\delta {{t}_{N}}{\text{|}}$ будем считать малой первого порядка. Вариация $\delta x( \cdot )$ имеет тот же порядок. Вариации $\delta y(t) = \tilde {y}(t) - y(t)$ отличны от нуля соответственно на промежутках $\Delta {{T}_{i}}$ между точками ${{t}_{i}}$ и ${{t}_{i}} + \delta {{t}_{i}}$, причем $\delta y(t) = {{y}_{{i - 1}}} - {{y}_{i}}$ при $\delta {{t}_{i}} > 0$ и $\delta y(t) = {{y}_{i}} - {{y}_{{i - 1}}}$ при $\delta {{t}_{i}} < 0$. Вариация $\delta x( \cdot )$ траектории динамической части удовлетворяет уравнению [26]

(3.11)
$\delta \dot {x}(t) = {{f}_{x}}[t]\delta x(t) + \Delta f[t],$
где разность $\Delta f[t] = f(t,x(t),\tilde {y}(t)) - f(t,x(t),y(t))$ отлична от нуля только на множестве малой меры ${\text{|}}\delta t{\text{|}}$, где $\delta y(t) \ne 0$. Уравнение в вариациях (3.11) справедливо с точностью до $o({\text{|}}\delta t{\text{|}})$. Учитывая члены только первого порядка малости, запишем приращение затрат на одно переключение:

(3.12)
$\begin{gathered} \Delta {{g}^{ + }}[{{t}_{i}}] = {{g}^{ + }}({{t}_{i}} + \delta {{t}_{i}},x({{t}_{i}} + \delta {{t}_{i}}) + \delta x({{t}_{i}} + \delta {{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}}) - {{g}^{ + }}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}}) = \\ \, = g_{t}^{ + }({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}})\delta {{t}_{i}} + g_{x}^{ + }({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}})\delta x({{t}_{i}}) + g_{x}^{ + }({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}})\dot {x}({{t}_{i}})\delta {{t}_{i}} = \\ \, = g_{x}^{ + }[{{t}_{i}}]\delta x({{t}_{i}}) + \{ g_{t}^{ + }[{{t}_{i}}] + g_{x}^{ + }[{{t}_{i}}]f[t]\} \delta {{t}_{i}}. \\ \end{gathered} $

В последнем преобразовании использовалось равенство $\delta \dot {x}(t) = \Delta f[t]$, которое получается из (3.11) при отбрасывании бесконечно малой ${{f}_{x}}[t]\,\delta x(t)$. Точка t лежит между точками ti и ${{t}_{i}} + \delta {{t}_{i}}$, поэтому

$\Delta f[t] = \left\{ {\begin{array}{*{20}{c}} {f({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}) - f({{t}_{i}},x({{t}_{i}}),{{y}_{i}}),\quad \delta {{t}_{i}} > 0,} \\ {f({{t}_{i}},x({{t}_{i}}),{{y}_{i}}) - f({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}),\quad \delta {{t}_{i}} < 0.} \end{array}} \right.$

Если обозначить $\Delta f[{{t}_{i}}] = f({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}) - f({{t}_{i}},x({{t}_{i}}),{{y}_{i}})$, то приращение (3.12) можно представить в виде

$\Delta {{g}^{ + }}[{{t}_{i}}] = g_{x}^{ + }[{{t}_{i}}]\,\delta x({{t}_{i}}) + \{ g_{t}^{ + }[{{t}_{i}}] + g_{x}^{ + }[{{t}_{i}}]\,f[{{t}_{i}}]\,\} \,\delta {{t}_{i}}$
для вариации $\delta {{t}_{i}}$ любого знака.

Преобразуем интегральные члены приращения функционала (1.6). Для $\delta {{t}_{i}} > 0$ и $\delta {{t}_{{i + 1}}} > 0$ имеем

$\int\limits_{{{t}_{i}} + \delta {{t}_{i}}}^{{{t}_{{i + 1}}} + \delta {{t}_{{i + 1}}}} {{{{\tilde {f}}}^{0}}[t]dt} - \int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{f}^{0}}[t]dt} = \int\limits_{{{t}_{i}} + \delta {{t}_{i}}}^{{{t}_{{i + 1}}}} {\{ {{{\tilde {f}}}^{0}}[t] - {{f}^{0}}[t]\} dt} + \int\limits_{{{t}_{{i + 1}}}}^{{{t}_{{i + 1}}} + \delta {{t}_{{i + 1}}}} {{{{\tilde {f}}}^{0}}[t]dt} - \int\limits_{{{t}_{i}}}^{{{t}_{i}} + \delta {{t}_{i}}} {{{f}^{0}}[t]dt} .$

Суммируем эти выражения, учитывая, что $\delta {{t}_{0}} = 0$, $\delta {{t}_{{N + 1}}} = 0$:

$\sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}} + \delta {{t}_{i}}}^{{{t}_{{i + 1}}}} {\{ {{{\tilde {f}}}^{0}}[t] - {{f}^{0}}[t]\} dt} } + \sum\limits_{i = 1}^N {\int\limits_{{{t}_{i}}}^{{{t}_{i}} + \delta {{t}_{i}}} {\{ {{{\tilde {f}}}^{0}}[t] - {{f}^{0}}[t]\} dt} } = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\{ {{{\tilde {f}}}^{0}}[t] - {{f}^{0}}[t]\} dt} } .$

Для отрицательных вариаций $\delta {{t}_{i}}$ получаем такое же выражение.

Теперь находим вариацию функционала (1.6)

(3.13)
$\delta I = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\{ f_{x}^{0}[t]\delta x(t) + \Delta {{f}^{0}}[t]\} dt} } + \sum\limits_{i = 1}^N {\{ (g_{t}^{ + }[{{t}_{i}}]\; + \;{\text{|}}g_{x}^{ + }[{{t}_{i}}]\Delta f[{{t}_{i}}]{\text{|}})\delta {{t}_{i}} + g_{x}^{ + }[{{t}_{i}}]\delta x({{t}_{i}})\} } + {{F}_{x}}[{{t}_{F}}]\delta x({{t}_{F}}).$

Здесь $\Delta {{f}^{0}}[t] = {{f}^{0}}(t,x(t),\tilde {y}(t)) - {{f}^{0}}(t,x(t),y(t))$. Исключаем вариацию $\delta x( \cdot )$ в выражении (3.13). Пусть, как и ранее, вспомогательная функция $\psi ( \cdot )$ удовлетворяет условиям (3.6)–(3.8). Прибавляем к правой части (3.13) левую часть (3.9). Сумма терминальных членов равна нулю, согласно условию трансверсальности, которое при $\delta {{t}_{F}} = 0$ и $\delta {{y}_{N}} = 0$ имеет вид ${{F}_{x}}[{{t}_{F}}]\,\delta x({{t}_{F}}) + \psi ({{t}_{F}})\delta x({{t}_{F}})$ = 0. Вариации $\delta x({{t}_{i}})$ удаляются из (3.13) из-за промежуточных условий (3.7).

Преобразуем подынтегральную функцию, учитывая уравнения (3.6) и (3.11):

$\begin{gathered} f_{x}^{0}[t]\delta x(t) + \Delta {{f}^{0}}[t] - \dot {\psi }(t)\delta x(t) - \psi (t)\delta \dot {x}(t) = \\ \, = \Delta {{f}^{0}}[t] - \psi (t)\Delta f[t] = H({{\psi }_{i}}(t),t,x(t),y(t)) - H({{\psi }_{i}}(t),t,x(t),\tilde {y}(t)) = - \Delta H[t]. \\ \end{gathered} $

Учитывая, что разность $\Delta H[t] = H(\psi (t),t,x(t),\tilde {y}(t)) - H(\psi (t),t,x(t),y(t))$ отлична от нуля только на малых промежутках времени $\Delta {{T}_{i}}$ между ${{t}_{i}}$ и ${{t}_{i}} + \delta {{t}_{i}}$, приходим к выражению

$\sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\Delta H[t]dt} } = \int\limits_{{{t}_{0}}}^{{{t}_{F}}} {\Delta H[t]dt} = \sum\limits_{i = 1}^N {\Delta H[{{t}_{i}}]\delta {{t}_{i}}} ,$
где $\Delta H[{{t}_{i}}] = H({{\psi }_{{i - 1}}}({{t}_{i}}),{{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}) - H({{\psi }_{i}}({{t}_{i}}),{{t}_{i}},x({{t}_{i}}),{{y}_{i}})$.

Таким образом, при вариации моментов переключений получаем

(3.14)
$\delta I = \sum\limits_{i = 1}^N {\{ g_{t}^{ + }[{{t}_{i}}] - \Delta H[{{t}_{i}}]\} \delta {{t}_{i}}} .$

Вариации (3.10) и (3.14) функционала (1.6), определенного на траекториях ПС, позволяют сформулировать необходимые условия оптимальности. Поскольку решаемая задача конечномерная, применяем известные результаты условной минимизации [27].

Теорема 2. Пусть оптимальный процесс $(x( \cdot ),y( \cdot ))$ имеет N переключений в моменты ${{t}_{1}}$, …, ${{t}_{N}}$: ${{t}_{0}} \leqslant {{t}_{1}} \leqslant ... \leqslant {{t}_{N}} \leqslant {{t}_{F}}$. Тогда существуют функции ${{\psi }_{i}}( \cdot )$, $i = 0,1,...,N,$ и такие числа ${{\lambda }_{0}}$, ${{\lambda }_{1}}$, …, ${{\lambda }_{{N + 1}}}$, неравные нулю одновременно, что выполняются:

1) сопряженные уравнения

${{\dot {\psi }}_{i}}(t) = - {{H}_{x}}({{\psi }_{i}}(t),t,x(t),{{y}_{i}}),\quad t \in {{T}_{i}},\quad i \in \mathcal{N};$

2) промежуточные условия

${{\psi }_{i}}({{t}_{i}}) - {{\psi }_{{i - 1}}}({{t}_{{i - }}}) = g_{x}^{ + }({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}},{{y}_{i}}),\quad i = 1,...,N;$

3) условия трансверсальности

$\{ {{F}_{t}}[{{t}_{F}}] - H[{{t}_{F}}]\} \delta {{t}_{F}} + \{ {{F}_{x}}[{{t}_{F}}] + {{\psi }_{N}}({{t}_{F}})\} \delta {{x}_{F}} = 0$
для любых вариаций, связанных равенством ${{\Gamma }_{t}}[{{t}_{F}}]\,\delta {{t}_{F}} + {{\Gamma }_{x}}[{{t}_{F}}]\,\delta {{x}_{F}} = 0$;

4) условия неубывания

$\{ g_{y}^{ + }[{{t}_{{i + 1}}}] + g_{z}^{ + }[{{t}_{i}}] - \int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{H}_{y}}[t]dt} \} \delta {{y}_{i}} \geqslant 0,\quad i = 1,...,N - 1,$
$\{ g_{z}^{ + }[{{t}_{N}}] + {{F}_{y}}[{{t}_{F}}] - \int\limits_{{{t}_{N}}}^{{{t}_{F}}} {{{H}_{y}}[t]dt} \} \delta {{y}_{N}} \geqslant 0$
для любых допустимых вариаций $\delta {{y}_{i}}$, $i = 1,...,N$;

5) условия стационарности

$g_{t}^{ + }[{{t}_{i}}] - \Delta H[{{t}_{i}}] + {{\lambda }_{{i + 1}}} - {{\lambda }_{i}} = 0,\quad i = 1,...,N;$

6) условия дополняющей нежесткости ${{\lambda }_{i}}({{t}_{{i - 1}}} - {{t}_{i}}) = 0$, $i = 1,...,N + 1$;

7) условия неотрицательности ${{\lambda }_{i}} \geqslant 0$, $i = 0,1,...,N + 1$.

Доказательство теоремы 2 следует из необходимых условий первого порядка экстремума функции при ограничениях типа неравенств ${{t}_{{i - 1}}} \leqslant {{t}_{i}}$, $i = 1,...,N + 1$. Функция Лагранжа для рассматриваемой задачи имеет вид [27]

$L = {{\lambda }_{0}}I + \sum\limits_{i = 1}^{N + 1} {{{\lambda }_{i}}({{t}_{{i - 1}}} - {{t}_{i}})} ,$
а ее частные производные выражаются через вариации (3.10) и (3.14). Неравенства 4) обеспечивают неотрицательность приращения функционала при малых вариациях состояний yi. Равенства 5) соответствуют условиям стационарности функции Лагранжа по переменным ti. Условия 6) и 7) отвечают методу Лагранжа снятия ограничений типа неравенств [23].

Заметим, что условия 1)–3) теоремы вместе с уравнениями движения позволяют получить вспомогательные функции, зависящие от $3N + 2$ параметров ${{t}_{1}},...,{{t}_{N}}$, ${{y}_{1}},...,{{y}_{N}}$, ${{\lambda }_{0}},{{\lambda }_{1}},...,{{\lambda }_{{N + 1}}}$. Для нахождения этих параметров имеется система из $3N + 1$ условий 4)–6). Этих уравнений хватает, так как коэффициенты ${{\lambda }_{i}}$ определяются с точностью до положительного множителя. Как правило, систему дополняют либо равенством ${{\lambda }_{0}} = 0$ (вырожденный случай), либо равенством ${{\lambda }_{0}} = 1$ (невырожденный случай). Таким образом, теорема, как и принцип максимума [21], дает “полную” систему условий для нахождения процесса, который может быть оптимальным.

4. Решение задачи оптимального управления непрерывными системами в классе кусочно-постоянных управлений. Рассмотрим классическую задачу оптимального управления непрерывной системой [21, 23, 2527]:

(4.1)
$\begin{gathered} \dot {x}(t) = f(t,x(t),u(t)),\quad u(t) \in U,\quad t \in T, \\ x({{t}_{0}}) = {{x}_{0}},\quad \Gamma ({{t}_{F}},x({{t}_{F}})) = 0, \\ I = \int\limits_{{{t}_{0}}}^{{{t}_{F}}} {{{f}^{0}}(t,x(t),u(t))dt} + F({{t}_{F}},x({{t}_{F}})) \to \min . \\ \end{gathered} $

Обозначения в задаче (4.1) стандартные: $x(t)$, $u(t)$ – состояние системы и управление в момент времени $t \in T$, $T = [{{t}_{0}},{{t}_{F}}]$; $x(t) \in X \subset {{\mathbb{R}}^{n}}$; $u(t) \in U \subset {{\mathbb{R}}^{m}}$. Терминальные ограничения определяются функцией $\Gamma :T \times X \to {{\mathbb{R}}^{l}}$. Требуется найти наименьшее значение minI функционала (4.1) и оптимальное кусочно-непрерывное управление $u( \cdot )$, на котором это значение достигается.

Будем решать задачу (4.1) в классе кусочно-постоянных управлений. Пусть на заданном промежутке времени $T = [{{t}_{0}},{{t}_{F}}]$ кусочно-постоянное управление $y( \cdot )$ динамической системой совершает N переключений в моменты времени ${{t}_{i}}$, $i = 1,...,N$, образующие возрастающую конечную последовательность $\mathcal{T} = \{ {{t}_{1}},...,{{t}_{N}}\} $:

(4.2)
${{t}_{0}} < {{t}_{1}} < ... < {{t}_{N}} < {{t}_{{N + 1}}} \triangleq {{t}_{F}}$.

Движение системы и функционал задаются соотношениями

(4.3)
$\dot {x}(t) = f(t,x(t),{{y}_{i}}),\quad t \in {{T}_{i}} \triangleq [{{t}_{i}},{{t}_{{i + 1}}}),$
(4.4)
${{y}_{i}} \in U,\quad i = 0,1,...,N,$
$x({{t}_{0}}) = {{x}_{0}},\quad \Gamma ({{t}_{F}},x({{t}_{F}})) = 0,$
(4.5)
${{I}_{N}}(d) = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{f}^{0}}(t,x(t),{{y}_{i}})dt} } + F({{t}_{F}},x({{t}_{F}})) \to \min .$

В задаче (4.3)–(4.5) требуется найти наименьшее значение $\min {{I}_{N}}$ функционала (4.5) и кусочно-постоянное управление $y{\kern 1pt} {\text{*}}( \cdot )$, на котором это значение достигается. Отметим, что в этой задаче количество переключений N задано.

Сформулируем теперь задачу минимизации количества переключений. Требуется найти наименьшее количество переключений ${{N}^{\varepsilon }}$, при котором наименьшее значение ${{I}_{{{{N}^{\varepsilon }}}}}$ функционала (4.5) не превосходит заданной величины $\varepsilon $:

(4.6)
$\min {{I}_{{{{N}^{\varepsilon }}}}} = \mathop {\min }\limits_{d \in {{\mathcal{D}}_{{{{N}^{\varepsilon }}}}}({{t}_{0}},{{x}_{0}},{{y}_{0}})} {{I}_{{{{N}^{\varepsilon }}}}}(d) \leqslant \varepsilon .$

Формулировку задачи (4.6) можно уточнить, если известно минимальное значение minI функционала (4.1). В этом случае требуется найти наименьшее количество переключений ${{N}^{\varepsilon }}$, при котором решение задачи в классе кусочно-постоянных управлений отличается по функционалу от решения задачи в классе кусочно-непрерывных управлений не более чем на заданную величину $\varepsilon $:

(4.7)
$\min {{I}_{{{{N}^{\varepsilon }}}}} - \min I \leqslant \varepsilon .$

Решение задач (4.6) и (4.7) естественным образом сводится к многократному решению задачи (4.5) для разных фиксированных значений N. При этом, разумеется, применяются необходимые или достаточные условия оптимальности ПС. Сравнивая задачу (4.5) с общей постановкой задачи (1.7), заключаем, что мгновенные многократные переключения исключаются, множество допустимых состояний дискретной части постоянно ($G(t,x,y) = U)$, в функционале качества управления не учитываются затраты на переключения (${{g}^{ + }} = 0$). Начальное состояние y0 дискретной части системы не задано. Оно является ресурсом управления и определяется при решении задачи минимизации. Учитывая эти отличия, запишем уравнения для образующих функции цены.

Нулевая образующая ${{\varphi }^{0}}(t,x,y)$ находится по формуле (2.5). Остальные образующие удовлетворяют уравнению (2.7):

(4.8)
${{\varphi }^{k}}(t,x,y) = \mathop {\min }\limits_{t < \tau \leqslant {{t}_{F}}} \left\{ {\int\limits_t^\tau {{{f}^{0}}(\theta ,x(\theta ),y)d\theta } + \mathop {\min }\limits_{z \in U} {{\varphi }^{{k - 1}}}(\tau ,x(\tau ),z)} \right\}.$

Здесь $x(\theta ) = {\mathbf{x}}(\theta {\mathbf{|}}t,x,y)$, $t \leqslant \theta \leqslant \tau $, – решение задачи Коши (2.6) при постоянном значении y. Уравнение (2.7) позволяет найти образующие ${{\varphi }^{k}}(t,x,y)$, $k \in \mathbb{N}$. При решении уравнения (4.8) выполняются две операции минимизации. Как и ранее, обозначим через

(4.9)
${{{\mathbf{\tau }}}_{k}}(t,x,y) = \arg \mathop {\min }\limits_{t < \tau \leqslant {{t}_{F}}} \left\{ {\int\limits_t^\tau {{{f}^{0}}(\theta ,x(\theta ),y)d\theta } + \mathop {\min }\limits_{z \in U} {{\varphi }^{{k - 1}}}(\tau ,x(\tau ),z)} \right\},$
(4.10)
${{{\mathbf{y}}}_{k}}(\tau ,x,y) = \arg \mathop {\min }\limits_{z \in U} {{\varphi }^{{k - 1}}}(\tau ,x,z)$
момент $k$-го переключения и состояние дискретной части системы после $k$-го переключения соответственно. Позиционные конструкции (4.9), (4.10) проще аналогичных функций (2.10), (2.9), полученных ранее для общей постановки задачи. Достаточные условия оптимальности для задачи (4.5) являются частным случаем теоремы 1 и формулируются следующим образом.

Теорема 3. Если для задачи (4.3)–(4.5) существует последовательность функций ${{\varphi }^{k}}$, $k = 0,1,...,N$, удовлетворяющих на области определения уравнениям (2.5), (4.8), то для оптимальности допустимого процесса $d = (x( \cdot ),y( \cdot )) \in \mathcal{D}({{t}_{0}},{{x}_{0}},{{y}_{0}})$ с моментами переключений ${{t}_{1}}$, …, ${{t}_{N}}$, образующими возрастающую последовательность (4.2), достаточно, чтобы выполнялись условия

(4.11)
${{y}_{0}} = \arg \mathop {\min }\limits_{y \in U} {{\varphi }^{N}}({{t}_{0}},{{x}_{0}},y),$
(4.12)
${{y}_{i}} = {{{\mathbf{y}}}_{{N - i + 1}}}({{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}),$
(4.13)
${{t}_{i}} = {{{\mathbf{\tau }}}_{{N - i + 1}}}({{t}_{{i - 1}}},x({{t}_{{i - 1}}}),{{y}_{{i - 1}}}),$
где ${{t}_{{i - 1}}} < t < {{t}_{i}}$, $i = 1,...,N$. При N = 0 формулы (4.12), (4.13) не используются, так как переключений нет.

В теореме 3 добавлено (по сравнению с теоремой 1) условие (4.11), которое обеспечивает оптимальный выбор начального состояния y0. Это условие в теореме 1 отсутствует, поскольку в задаче (1.7) начальное состояние y0 задано.

Сформулируем необходимые условия оптимальности в задаче (4.5). Они следуют из теоремы 2. Нужно только исключить мгновенные многократные переключения и не учитывать затраты на каждое переключение. Так как многократных переключений нет, то все неравенства в (4.1) строгие. В конечный момент времени переключение исключается, поскольку оно не изменяет значение функционала. Значит, все неотрицательные множители Лагранжа равны нулю (λ1 = ... = = ${{\lambda }_{{N + 1}}}$ = 0), что следует из условия дополняющей нежесткости. Кроме того, из-за отсутствия мгновенных многократных переключений набор вспомогательных функций ${{\psi }_{i}}( \cdot )$, $i = 0,1,...,N,$ можно заменить одной непрерывной справа функцией $\psi (t)$, полагая ${{\psi }_{i}}(t) = \psi (t)$, $t \in {{T}_{i}}$, поскольку промежутки ${{T}_{i}}$ не пересекаются.

Чтобы не учитывать затраты на переключения, полагаем ${{g}^{ + }} = 0$. Тогда в моменты переключений ${{t}_{i}}$, $i = 1,...,N,$  непрерывная справа вспомогательная функция $\psi ( \cdot )$ будет непрерывной, так как промежуточные условия (3.7) будут иметь вид $\psi ({{t}_{i}}) - \psi ({{t}_{i}} - 0) = 0$. Приращение функции ГП в каждый момент переключения будет равно нулю:

$\Delta H[{{t}_{i}}] = H(\psi ({{t}_{i}}),{{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}) - H(\psi ({{t}_{i}}),{{t}_{i}},x({{t}_{i}}),{{y}_{i}}) = 0,$
что следует из условия 5) теоремы 2.

Необходимые условия оптимальности для задачи (4.5) являются частным случаем теоремы 2 и формулируются следующим образом.

Теорема 4. Пусть оптимальный процесс $(x( \cdot ),y( \cdot ))$ имеет $N$ переключений в моменты ${{t}_{1}}$, …, ${{t}_{N}}$: ${{t}_{0}} < {{t}_{1}} < ... < {{t}_{N}} < {{t}_{F}}$. Тогда существуeт такая абсолютно непрерывная функция $\psi ( \cdot )$, что выполняются:

1) сопряженное уравнение

$\dot {\psi }(t) = - {{H}_{x}}(\psi (t),t,x(t),{{y}_{i}}),\quad t \in T;$

2) условие трансверсальности

$\{ {{F}_{t}}[{{t}_{F}}] - H[{{t}_{F}}]\} \delta {{t}_{F}} + \{ {{F}_{x}}[{{t}_{F}}] + \psi ({{t}_{F}})\} \,\delta {{x}_{F}} = 0$
для любых вариаций, связанных равенством ${{\Gamma }_{t}}[{{t}_{F}}]\,\delta {{t}_{F}} + {{\Gamma }_{x}}[{{t}_{F}}]\,\delta {{x}_{F}} = 0$;

3) неравенства

$\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{H}_{y}}[t]dt} \cdot \delta {{y}_{i}} \leqslant 0,\quad i = 0,1,...,N - 1,\quad \left\{ {{{F}_{y}}[{{t}_{F}}] - \int\limits_{{{t}_{N}}}^{{{t}_{F}}} {{{H}_{y}}[t]dt} } \right\}\delta {{y}_{N}} \geqslant 0$
для любых допустимых вариаций $\delta {{y}_{i}}$, $i = 1,...,N$;

4) равенства

$H(\psi ({{t}_{i}}),{{t}_{i}},x({{t}_{i}}),{{y}_{{i - 1}}}) - H(\psi ({{t}_{i}}),{{t}_{i}},x({{t}_{i}}),{{y}_{i}}) = 0,\quad i = 1,...,N.$

Доказательство теоремы 4 следует из теоремы 2. По сравнению с теоремой 2 упрощения получены вследствие равенств ${{g}^{ + }} = 0$, ${{\lambda }_{1}} = ... = {{\lambda }_{{N + 1}}} = 0$. Кроме того, в п. 3) добавлено неравенство с вариацией $\delta {{y}_{0}}$, поскольку начальное состояние y0 не задано.

Отметим, что решение задачи оптимального управления в классе кусочно-постоянных функций можно рассматривать как приближенное (с погрешностью ε) решение задачи с кусочно-непрерывным управлением. При увеличении количества переключений погрешность ε, вообще говоря, уменьшается, а в пределе – равна нулю, так как любую ограниченную измеримую функцию можно представить как предел ступенчатой.

5. Пример. Рассмотрим задачу гашения малых колебаний с минимальными энергетическими затратами под действием неограниченного ускорения. Классическая постановка задачи оптимального управления имеет вид

(5.1)
$\begin{gathered} {{{\dot {x}}}_{1}}(t) = {{x}_{2}}(t),\quad {{{\dot {x}}}_{2}}(t) = - {{x}_{1}}(t) + u(t),\quad u(t) \in \mathbb{R},\quad 0 \leqslant t \leqslant \pi {\text{/}}2, \\ {{x}_{1}}(0) = 1,\quad {{x}_{2}}(0) = 1,\quad {{x}_{1}}(\pi {\text{/}}2) = 0,\quad {{x}_{2}}(\pi {\text{/}}2) = 0; \\ I = \int\limits_0^{\pi /2} {\frac{1}{2}{{u}^{2}}(t)dt} \to \min . \\ \end{gathered} $

Требуется найти наименьшее значение minI  функционала и оптимальное кусочно-непрерывное управление $u( \cdot )$, на котором этот минимум достигается.

Решение поставленной задачи получено, например в [30], при помощи принципа максимума. Наименьшее значение функционала (5.1) и оптимальное управление имеют вид

(5.2)
$\min I = \frac{4}{{\pi - 2}} \approx 3.5039;\quad u(t) = \frac{4}{{\pi - 2}}(\sin t - \cos t),\quad 0 \leqslant t \leqslant \pi {\text{/}}2.$

Рассмотрим задачу оптимизации в классе кусочно-постоянных управлений. Пусть на промежутке функционирования $[0;\pi {\text{/}}2]$ система совершает N переключений в моменты времени ${{t}_{1}},...,{{t}_{N}}$, образующие возрастающую последовательность:

(5.3)
$0 < {{t}_{1}} < ... < {{t}_{N}} < {{t}_{{N + 1}}} \triangleq \pi {\text{/}}2.$

Уравнения движения системы и функционал качества имеют вид

(5.4)
${{\dot {x}}_{1}}(t) = {{x}_{2}}(t),\quad {{\dot {x}}_{2}}(t) = - {{x}_{1}}(t) + {{y}_{i}},\quad t \in [{{t}_{i}},{{t}_{{i + 1}}}),\quad {{y}_{i}} \in \mathbb{R},\quad i = 0,1,...,N,$
(5.5)
${{x}_{1}}(0) = 1,\quad {{x}_{2}}(0) = 1,\quad {{x}_{1}}(\pi {\text{/}}2) = 0,\quad {{x}_{2}}(\pi {\text{/}}2) = 0;$
(5.6)
${{I}_{N}} = \sum\limits_{i = 0}^N {\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\frac{1}{2}y_{i}^{2}(t)dt} } \to \min .$

Требуется найти наименьшее значение $\min {{I}_{N}}$ функционала (5.6) и оптимальное кусочно-постоянное управление $y( \cdot )$, на котором этот минимум достигается.

Сформулируем теперь задачу минимизации количества переключений. Требуется найти наименьшее количество переключений Nε, при котором наименьшее значение $\min {{I}_{{{{N}^{\varepsilon }}}}}$ функционала (5.6) отличается от наименьшего значения minI  функционала (5.1) не более чем на заданную величину $\varepsilon = 0.1$:

(5.7)
$\min {{I}_{{{{N}^{\varepsilon }}}}} - \min I \leqslant \varepsilon .$

Поставленную задачу можно рассматривать как приближенное с точностью $\varepsilon $ решение задачи (5.1) в классе кусочно-постоянных управлений.

По сравнению с общей постановкой задачи (4.5) имеем: ${{t}_{0}} = 0$, ${{t}_{F}} = \pi {\text{/}}2$, $x = {{({{x}_{1}},{{x}_{2}})}^{T}} \in {{\mathbb{R}}^{2}}$, $y \in U = \mathbb{R}$, $x(0) = {{(1,\,1)}^{T}}$, $f(t,x,y) = {{({{x}_{2}},\; - {{x}_{1}} + y)}^{T}}$, ${{f}^{0}}(t,x,y) = {{y}^{2}}{\text{/}}2$, $F = 0$, $\Gamma ({{t}_{F}}) = x(\pi {\text{/}}2) = 0$. Запишем функцию ГП

$H(\psi ,t,x,y) = {{\psi }_{1}}{{x}_{2}} + {{\psi }_{2}}( - {{x}_{1}} + y) - \tfrac{1}{2}{{y}^{2}}$
и условия теоремы 4 для задачи (5.4):

1) сопряженное уравнение

(5.8)
${{\dot {\psi }}_{1}}(t) = {{\psi }_{2}}(t),\quad {{\dot {\psi }}_{2}}(t) = - {{\psi }_{1}}(t),\quad t \in T;$

2) условия трансверсальности выполняются, так как вариации $\delta {{t}_{F}} = 0$, $\delta x({{t}_{F}}) = 0$ при фиксированном правом конце траектории;

3) для всех допустимых вариаций $\delta {{y}_{i}}$, $i = 0,1,...,N$, выполняются неравенства

(5.9)
$\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {\,[{{\psi }_{2}}(t) - {{y}_{i}}]dt} \cdot \delta {{y}_{i}} \leqslant 0 \Leftrightarrow {{y}_{i}} = \frac{1}{{{{t}_{{i + 1}}} - {{t}_{i}}}}\int\limits_{{{t}_{i}}}^{{{t}_{{i + 1}}}} {{{\psi }_{2}}(t)dt} ,$
поскольку ограничений на вариации $\delta {{y}_{i}}$ нет;

4) в моменты переключений ${{t}_{i}}$, $i = 1,...,N$, справедливы равенства

${{\psi }_{1}}({{t}_{i}}){{x}_{2}}({{t}_{i}}) + {{\psi }_{2}}({{t}_{i}})[ - {{x}_{1}}({{t}_{i}}) + {{y}_{{i - 1}}}] - \frac{1}{2}y_{{i - 1}}^{2} - {{\psi }_{1}}({{t}_{i}}){{x}_{2}}({{t}_{i}}) - {{\psi }_{2}}({{t}_{i}})[ - {{x}_{1}}({{t}_{i}}) + {{y}_{i}}] + \frac{1}{2}y_{i}^{2} = 0$
(5.10)
$ \Leftrightarrow {{\psi }_{2}}({{t}_{i}})({{y}_{{i - 1}}} - {{y}_{i}}) - \tfrac{1}{2}(y_{{i - 1}}^{2} - y_{i}^{2}) = 0 \Rightarrow 2{{\psi }_{2}}({{t}_{i}}) = {{y}_{{i - 1}}} + {{y}_{i}}.$

В последнем преобразовании уравнения учитывалось, что ${{y}_{{i - 1}}} \ne {{y}_{i}}$, иначе нет переключения.

Таким образом, задача оптимального управления сведена к краевой задаче для уравнений движения (5.4) и сопряженной системы (5.8) с краевыми условиями (5.5). Для нахождения $2N + 1$ управляющих параметров ${{t}_{1}},...,{{t}_{N}}$, ${{y}_{0}},{{y}_{1}},...,{{y}_{N}}$ имеются $2N + 1$ уравнений (5.9) и (5.10).

Будем искать решение краевой задачи. Согласно уравнениям движения, траектория имеет вид

(5.11)
${{x}_{1}}(t) = {{A}_{i}}\cos t + {{B}_{i}}\sin t + {{y}_{i}},\quad {{x}_{2}}(t) = - {{A}_{i}}\sin t + {{B}_{i}}\cos t,\quad {{t}_{i}} \leqslant t \leqslant {{t}_{{i + 1}}},\quad i = 0,1,...,N.$

Условия непрерывности траектории (5.11) в моменты переключений приводят к рекуррентным уравнениям

(5.12)
${{A}_{i}} = {{A}_{{i - 1}}} + ({{y}_{{i - 1}}} - {{y}_{i}})\cos {{t}_{i}},\quad {{B}_{i}} = {{B}_{{i - 1}}} + ({{y}_{{i - 1}}} - {{y}_{i}})\sin {{t}_{i}},\quad i = 1,...,N.$

Следовательно,

(5.13)
${{A}_{N}} = {{A}_{0}} + \sum\limits_{i = 1}^N {({{y}_{{i - 1}}} - {{y}_{i}})\cos {{t}_{i}}} ,\quad {{B}_{N}} = {{B}_{0}} + \sum\limits_{i = 1}^N {({{y}_{{i - 1}}} - {{y}_{i}})\sin {{t}_{i}}} ,$
причем из начальных и конечных условий следует, что

(5.14)
${{A}_{0}} = 1 - {{y}_{0}},\quad {{B}_{0}} = 1,\quad {{A}_{N}} = 0,\quad {{B}_{N}} = - {{y}_{N}}.$

Поэтому

(5.15)
$1 - {{y}_{0}} + \sum\limits_{i = 1}^N {({{y}_{{i - 1}}} - {{y}_{i}})\cos {{t}_{i}}} = 0,\quad 1 + {{y}_{N}} + \sum\limits_{i = 1}^N {({{y}_{{i - 1}}} - {{y}_{i}})\sin {{t}_{i}}} = 0.$

Траектория движения имеет вид (5.11) с коэффициентами, удовлетворяющими условиям (5.12)–(5.14). Отметим сразу, что управление без переключения не является допустимым. В самом деле, при N = 0 имеем ${{y}_{N}} = {{y}_{0}}$. Тогда уравнения (5.15) противоречат друг другу: $1 - {{y}_{0}} = 0$ и $1 + {{y}_{0}} = 0$, что невозможно. Следовательно, допустимые управления обязательно имеют переключения, т.е. N ≥ 1.

Траектория $x( \cdot )$ определяется управляющими параметрами – значениями управления ${{y}_{i}}$ и моментами переключений ${{t}_{i}}$, которые удовлетворяют системе уравнений (5.9), (5.10). Эти уравнения тригонометрические, так как вспомогательные функции ${{\psi }_{1}}( \cdot )$, ${{\psi }_{2}}( \cdot )$ – периодические, поскольку описываются уравнениями колебаний (5.8). Найти решение системы тригонометрических уравнений сложно. Для упрощения воспользуемся следующим соображением. График оптимального непрерывного управления (5.2) $u = u(t)$, $0 \leqslant t \leqslant \pi {\text{/}}2$, в задаче (5.1) симметричен относительно точки $(\pi {\text{/}}4,0)$. Предположим, что график оптимального кусочно-постоянного управления $y = y(t)$, $0 \leqslant t \leqslant \pi {\text{/}}2$, имеет тот же центр симметрии. При этом будут выполняться равенства

(5.16)
${{y}_{i}} + {{y}_{{N - i}}} = 0,\quad i = 0,1,...,N;\quad {{t}_{i}} + {{t}_{{N + 1 - i}}} = \frac{\pi }{2},\quad i = 1,...,N.$

Неравенства для ${{y}_{i}}$ и для ${{t}_{i}}$ в (5.16) повторяются. Поэтому фактически в (5.16) имеется [N/2] + 1 + + $[(N + 1){\text{/}}2] = N + 1$ равенств. Здесь $[x]$ – целая часть числа $x$.

Значения ${{y}_{i}}$ выражаются через ${{\psi }_{2}}$ по формуле (5.9). Чтобы обеспечить равенства (5.16), график функции ${{\psi }_{2}}(t)$, $0 \leqslant t \leqslant \pi {\text{/}}2$, также должен иметь центр симметрии $(\pi {\text{/}}4,0)$. Поэтому из решений уравнений (5.8) нужно взять следующее:

${{\psi }_{1}}(t) = C\cos \left( {t - \frac{\pi }{4}} \right),\quad {{\psi }_{2}}(t) = - \,C\sin \left( {t - \frac{\pi }{4}} \right),$
где $C$ – произвольная постоянная. Так как функция ${{\psi }_{1}}$ является первообразной для ${{\psi }_{2}}$, условие (5.9) можно записать в виде
${{y}_{i}} = \frac{{{{\psi }_{1}}({{t}_{{i + 1}}}) - {{\psi }_{1}}({{t}_{i}})}}{{{{t}_{{i + 1}}} - {{t}_{i}}}} = \frac{С}{{{{t}_{{i + 1}}} - {{t}_{i}}}}\left[ {\cos \left( {{{t}_{{i + 1}}} - \frac{\pi }{4}} \right) - \cos \left( {{{t}_{i}} - \frac{\pi }{4}} \right)} \right]$
или, выделяя общий множитель,

(5.17)
${{y}_{i}} = C{{\Delta }_{i}},\quad {{\Delta }_{i}} \triangleq [\cos ({{t}_{{i + 1}}} - \pi {\text{/}}4) - \cos ({{t}_{i}} - \pi {\text{/}}4)]/({{t}_{{i + 1}}} - {{t}_{i}}),\quad i = 0,1,...,N.$

Подставляя управление (5.17) в (5.10) и сокращая на множитель $С$, получаем

(5.18)
${{\Delta }_{i}} + {{\Delta }_{{i - 1}}} - 2\sin \left( {{{t}_{i}} - \frac{\pi }{4}} \right) = 0,\quad i = 1,...,N.$

Количество уравнений в (5.18) из-за симметрии (5.16) можно уменьшить, полагая i = 1, ..., $[(N + 1){\text{/}}2]$.

Итак, для нахождения N моментов переключений составлена система (5.18) $N$ трансцендентных уравнений. Пусть найдено решение ${{t}_{1}},...,{{t}_{N}}$ этой системы. Тогда значения управления можно вычислить по формуле (5.17). Нужно только определить значение произвольной постоянной C. Для этого воспользуемся первым уравнением в (5.15). Второе уравнение из-за условий симметрии (5.16) равносильно первому. Перепишем уравнение в виде

$1 - {{y}_{0}} + \sum\limits_{i = 1}^N {({{y}_{{i - 1}}} - {{y}_{i}})\cos {{t}_{i}}} = 0 \Leftrightarrow 1 + \sum\limits_{i = 0}^N {{{y}_{i}}(\cos {{t}_{{i + 1}}} - \cos {{t}_{i}})} = 0.$

Учитывая симметрию (5.16) и (5.17), получаем равенство

(5.19)
$С = - {{\left\{ {\sqrt 2 \sum\limits_{i = 0}^k {\Delta _{i}^{2}({{t}_{{i + 1}}} - {{t}_{i}})} } \right\}}^{{ - 1}}},$
где $k = [N{\text{/}}2]$ – целая часть числа $N{\text{/}}2$.

Таким образом, при помощи необходимых условий задача поиска оптимального кусочно-постоянного управления сведена к решению системы N трансцендентных уравнений (5.18) относительно N неизвестных ${{t}_{1}},...,{{t}_{N}}$, которые должны удовлетворять неравенствам (5.3). Если моменты переключений найдены, то по формуле (5.19) определяем постоянную C, а затем по формулам (5.17) – значения управлений ${{y}_{0}},{{y}_{1}},...,{{y}_{N}}$. После этого вычисляем минимальное значение функционала (5.6).

К сожалению, указанный план трудно реализовать, так как система уравнений (5.18) весьма сложная. Ее численное решение является серьезной проблемой, не говоря об аналитическом решении, которое невозможно даже при N = 1. Поэтому был использован другой подход, который заключается в минимизации функционала ${{I}_{N}}$ по моментам переключений. Действительно, при заданных моментах ${{t}_{1}},...,{{t}_{N}}$ функционал ${{I}_{N}}$, учитывая (5.17), можно представить в виде

(5.20)
${{I}_{N}}({{t}_{1}},...,{{t}_{k}}) = \sum\limits_{i = 0}^k {({{t}_{{i + 1}}} - {{t}_{i}})y_{i}^{2}} .$

Функция (5.20) зависит от $k = [N{\text{/}}2]$ моментов переключений, так как ${{y}_{k}} = 0$ при четном $N = 2k$ и ${{t}_{{k + 1}}} = \pi /4$ при нечетном $N = 2k + 1$. Ее нужно минимизировать при ограничениях 0 < < ${{t}_{1}} < ... < {{t}_{k}}$ < π/4. После нахождения моментов переключений ${{t}_{1}},...,{{t}_{k}}$, доставляющих условный минимум функции (5.20), нужно проверить выполнение необходимых условий оптимальности, подставляя эти моменты в систему (5.18).

Таким образом, процедура приближенного решения задачи (5.6) при $N \geqslant 1$ сводится к условной минимизации функции (5.20) с последующей проверкой выполнения равенств (5.18). Описанная процедура решения – численно-аналитическая, поскольку часть необходимых условий оптимальности использованы для получения уравнений (5.17)–(5.19) и составления функции (5.20), минимизация которой производится численным методом.

Результаты приближенных вычислений представлены в таблице 1. Кроме минимальных значений функционала (5.6) и погрешности (5.7) в таблице приводится величина невязки ${\mathbf{|}}\,\delta \,{\mathbf{|}}$, которая вычисляется по значениям левых частей уравнений (5.18):

${\text{|}}\delta {\text{|}} = \sqrt {\delta _{1}^{2} + ... + \delta _{k}^{2}} ,\quad {{\delta }_{i}} = {{\Delta }_{i}} + {{\Delta }_{{i - 1}}} + 2\sin \left( {{{t}_{i}} - \frac{\pi }{4}} \right),\quad i = 1,...,k = \left[ {\frac{N}{2}} \right].$
Таблица 1.

Результаты вычислений

Число переключений N Минимальное значение функционала minIN Невязка |δ| Погрешность ${{\varepsilon }_{N}} = \min {{I}_{N}} - \min I$
1 4.57764 0 1.07376
2 3.90544 0.00046 0.40156
3 3.71780 0.00042 0.21393
4 3.63751 0.82095 0.13363
5 3.59548 0.68004 0.09160

Невязка характеризует точность приближенного решения системы (5.18), т.е. “степень выполнения” необходимых условий оптимальности.

Минимизация выполнялась перебором на сгущающихся сетках. Наименьший шаг сетки $\Delta t = 0.001$. При пяти переключениях погрешность ${{\varepsilon }_{5}} = 0.091$ оказалась меньше допустимой погрешности $\varepsilon = 0.1$, поэтому процесс решения закончился. Оптимальные моменты переключений и значений управления следующие:

${{t}_{1}} = {\text{0}}{\text{.284,}}\quad {{t}_{{\text{2}}}} = {\text{0}}{\text{.540}},\quad {{t}_{{\text{3}}}} = {\text{0}}{\text{.785}},\quad {{t}_{{\text{4}}}} = {\text{1}}{\text{.031,}}\quad {{t}_{{\text{5}}}} = {\text{1}}{\text{.287}};$
${{y}_{0}} = - 3.0402,\quad {{y}_{1}} = - 1.8498,\quad {{y}_{2}} = - 0.6208,\quad {{y}_{3}} = 0.6208,\quad {{y}_{4}} = 1.8498,\quad {{y}_{5}} = 3.0402.$

С ростом количества переключений величина минимального значения функционала (5.6), разумеется, монотонно убывает, а невязка – меняется нерегулярно. Видимо, чем больше уравнений в системе (5.18), тем больше невязка.

Заключение. Предлагаемые условия оптимальности применяются для решения задач оптимизации траекторий переключаемых систем. Эти задачи отличаются от оптимизации непрерывно-дискретных систем свободными моментами переключений, которые могут выбираться при оптимизации процесса управления. Именно поиск оптимальных моментов переключений является наиболее сложной частью решения. Как показывают примеры (академические и прикладные), минимизируемый функционал как функция моментов переключений имеет овражный характер и множество локальных минимумов. Необходимые условия оптимальности в этом случае служат для проверки результатов оптимизации.

Исследованная задача минимизации количества переключений использована для приближенного решения задач оптимального управления путем сужения класса допустимых управлений и аппроксимации оптимальных траекторий. Дальнейшая разработка этого направления представляется актуальной.

Условия оптимальности получены для переключаемых систем, в которых отсутствует непрерывное управление динамической частью, а состояния дискретной части ограничиваются рекуррентным включением. Несомненный интерес представляют необходимые условия оптимальности в более широком классе гибридных систем – с непрерывным управлением и со скачками, описываемыми рекуррентными уравнениями.

Список литературы

  1. Васильев С.Н., Маликов А.И. О некоторых результатах по устойчивости переключаемых и гибридных систем. Актуальные проблемы механики сплошной среды. К 20-летию ИММ КазНЦ РАН. Т. 1. Казань: Фолиант, 2011. С. 23–81.

  2. Бортаковский А.С. Оптимизация переключающих систем. М.: Изд-во МАИ, 2016.

  3. Бортаковский А.С. Достаточные условия оптимальности управления переключаемыми системами // Изв. РАН. ТиСУ. 2017. № 4. С. 86–103.

  4. Бортаковский А.С. Синтез оптимальных систем управления со сменой моделей движения // Изв. РАН. ТиСУ. 2018. № 4. С. 57–74.

  5. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. М.: Наука, 2005.

  6. Котов К.Ю., Шпилевая О.Я. Переключаемые системы: устойчивость и проектирование (обзор) // Автометрия. 2008. Т. 44. № 5. С. 71–87.

  7. Бортаковский А.С., Пантелеев А.В. Достаточные условия оптимальности управления непрерывно-дискретными системами // // АиТ. 1987. № 7. С. 57–66.

  8. Бортаковский А.С. Необходимые условия оптимальности автоматной части логико-динамической системы // Тр. МИАН им. В.А. Стеклова. 2008. Т. 262. С. 50–63.

  9. Branicky M.S., Borkar V.S., Mitter S.K. A Unified Framework for Hybrid Control: Model and Optimal Control Theory // IEEE Trans. Automatic Control. 1998. V. 43. № 1. P. 31–45.

  10. Brockett R.W. Hybrid Models for Motion Control Systems // Perspectives in the Theory and its Applications. Boston: Birkhäuser, 1993. P. 29–53.

  11. Hedlund S., Rantzer A. Optimal Control of Hybrid Systems // Proc. 38th IEEE Conf. on Decision and Control. Phoenix, AZ, 1999. P. 3972–3977.

  12. Sussmann H.J. A Maximum Principle for Hybrid Optimal Control Problems // Proc. of 38th IEEE Conf. on Decision and Control. Phoenix, AZ, USA, 1999. P. 425–430.

  13. Engell S., Frehse G., Schnieder E. Modeling, Analysis and Design of Hybrid Systems. Springer, 2002.

  14. Modelling and Analysis of Logic Controlled Dynamic Systems: IFAC Workshop. Irkutsk: Inst. Syst. Dyn. and Control Theory. Sib. Branch RAS, 2003.

  15. Liberzon D. Switching in Systems and Control. Berlin: Springer, 2003.

  16. Li Z., Soh Y., Wen C. Switched and Impulsive Systems: Analysis, Design and Applications. Berlin: Springer, 2005.

  17. Xu X.P., Antsaklis P.J. A Dynamic Programming Approach for Optimal Control of Switched System // Proc. IEEE Conf. Decision Control. Sydney, Australia, 2000. P. 1822–1827.

  18. Axelsson H., Boccadoro M., Egerstedt M. et al. Optimal Mode-Switching for Hybrid Systems with Varying Initial States // J. of Nonlinear Analysis: Hybrid Systems and Applications. 2008. V. 2. № 3. P. 765–772.

  19. Boltyanski V.G. The Maximum Principle for Variable Structure Systems // Int. J. on Control. 2004. V. 77. № 17. P. 1445–1451.

  20. Дмитрук А.В., Каганович А.М. Принцип максимума для задач оптимального управления с промежуточными ограничениями // Нелинейная динамика и управление. Вып. 6. М.: Физматлит, 2008. С. 101–136.

  21. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз, 1961.

  22. Журавин Ю. Разгонный блок “Бриз-М” // Новости космонавтики. 2000. Т. 10. № 8 (211). С. 52–55.

  23. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.

  24. Бортаковский А.С., Урюпин И.В. Минимизация количества переключений оптимальных непрерывно-дискретных управляемых процессов // Изв. РАН. ТиСУ. 2019. № 4. С. 29–46.

  25. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.

  26. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.

  27. Васильев Ф.П. Методы оптимизации. М.: Факториал Пресс, 2002.

  28. Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит., 1960.

  29. Летов А.М. Динамика полета и управление. М.: Наука, 1973.

  30. Аграчев А.А., Сачков Ю.Л. Геометрическая теория управления. М.: Физматлит, 2005.

Дополнительные материалы отсутствуют.