Журнал вычислительной математики и математической физики, 2019, T. 59, № 7, стр. 1125-1136

Вычисление оптимального по расходу ресурса управления в реальном времени

В. М. Александров^*, **

ИМ СОРАН
630090 Новосибирск, пр-т Акад. Коптюга, 4, Россия

^* E-mail: vladalex@math.nsc.ru
^** E-mail: alexhome.a@yandex.ru

Поступила в редакцию 14.01.2019
После доработки 14.01.2019
Принята к публикации 11.03.2019

DOI: 10.1134/S0044466919070020

Аннотация

Для линейных систем с ограниченным управлением предложен новый подход к реализации оптимального по расходу ресурса управления в реальном времени. Он основан на разделении вычислительных затрат на предварительные вычисления и вычисления в процессе управления. Предварительные вычисления не зависят от конкретного начального условия и основаны на аппроксимации областей достижимости за различные времена семейством гиперплоскостей. Дан метод построения аппроксимирующей конструкции и выделения опорной гиперплоскости. Предложен метод нахождения приближенного значения времени оптимального быстродействия и корректного задания времени перевода системы в задаче минимизации расхода ресурса. Разработан способ задания начального приближения для итерационной процедуры вычисления оптимального по расходу ресурса управления, обладающей малыми вычислительными затратами. Приведены вычислительный алгоритм, результаты моделирования и численных расчетов. Библ. 21. Фиг. 2. Табл. 6.

Ключевые слова: оптимальное управление, быстродействие, расход ресурсов, область достижимости, гиперплоскость, реальное время, сопряженная система, граничная точка, начальное приближение, вариация, итерационный процесс.

1. ВВЕДЕНИЕ

Оптимальное управление по различным критериям качества представляет значительный теоретический и практический интерес [1]. Одной из актуальных является задача оптимального по расходу ресурсов управления. Сформулированная первоначально как задача оптимального управления по расходу топлива, она рассматривалась многими как отечественными, так и зарубежными авторами [2]–[6]. Так как аналитическое решение задачи в общем случае невозможно, то отечественными и зарубежными специалистами предложены различные численные методы ее решения, каждый из которых обладает определенными достоинствами и недостатками [7]–[11]. Одним из недостатков является фиксированное задание времени перевода для любых начальных условий системы. Для существования решения задачи время перевода должно быть больше (либо равно) времени оптимального по быстродействию управления. Но время оптимального по быстродействию перевода системы заранее не известно и зависит от начального условия. Произвольное фиксированное задание времени перевода, во-первых, ограничивает область начальных условий, для которых такой перевод возможен, а во-вторых, делает неравномерным расход ресурсов от начальных условий. К тому же большие вычислительные затраты не позволяют реализовать оптимальное управление в реальном времени, что сдерживает широкое применение на практике оптимального управления и приводят к необходимости разработки новых численных методов, учитывающих специфику решаемой задачи и обладающих в процессе управления малой вычислительной трудоемкостью.

Одним из возможных подходов является разделение всего объема необходимых вычислительных затрат на: 1) предварительные вычисления; 2) вычисления в процессе управления. Предварительные вычисления содержат необходимые для нахождения оптимального по расходу ресурса управления вычислительные процедуры, которые не зависят от конкретного начального условия. Разделением достигается существенное уменьшение вычислительных затрат в процессе самого управления, что позволяет реализовать оптимальное управление в реальном времени.

Следует подчеркнуть, что в случае реализации оптимального управления в реальном времени: 1) предварительные вычислительные затраты не имеют значения, так как важны лишь вычислительные затраты в процессе самого управления; 2) процесс управления начинается с момента задания конкретного начального условия, которое может быть любым из области начальных условий; 3) время перевода системы должно быть не меньше времени оптимального быстродействия, так как в противном случае не существует решения задачи минимизации расхода ресурсов; 4) для уменьшения вычислительных затрат в процессе управления необходимо разработать метод задания начального приближения. В настоящей работе предлагается реализация такого подхода.

Область начальных условий динамической системы разбивается на области достижимости за различные времена. Для этого на фазовых осях находятся точки пересечения границы области достижимости за время ${{T}_{s}},\;s = \overline {1,q} $, c осями фазового пространства. Одновременно в каждом октанте фазового пространства находится граничная точка на луче, исходящем из начала координат до пересечения луча с границей множества достижимости. Каждая область достижимости аппроксимируется семейством гиперплоскостей, проходящих через различные комбинации граничных точек. Рассмотрены процедура выделения подмножества начальных условий и алгоритм определения для подмножества опорной гиперплоскости. В результате получаем аппроксимирующую конструкцию, позволяющую получить приближенное решение задачи нахождения времени оптимального по быстродействию перевода системы [12]–[14]. Одновременно к каждой граничной точке “прикрепляем”: 1) найденные предварительно до начала процесса управления моменты переключений оптимального по расходу ресурса управления, переводящего систему из этой граничной точки фазового пространства в начало координат соответственно за времена: ${{T}_{{s + 1}}},\;{{T}_{{s + 2}}},\;{{T}_{{s + 3}}},\;...$; 2) начальные условия сопряженной системы; 3) весовые коэффициенты для формирования квазиоптимального по расходу ресурса управления [15]. В качестве начального приближения для итерационной процедуры вычисления (уточнения) найденных приближенных значений моментов переключений искомого оптимального по расходу ресурса управления берем значения ближайшей граничной точки. Самое главное состоит в том, что аппроксимирующая конструкция строится предварительно до начала процесса управления, так как ее реализация не зависит от конкретного начального условия. Разработан итерационный алгоритм вычисления оптимального по расходу ресурсов управления, использующий полученное приближенное решение. Проведено моделирование метода и приведены результаты численных расчетов.

2. ПОСТАНОВКА ЗАДАЧИ

Пусть управляемая система описывается линейным дифференциальным уравнением

(2.1)

$\dot {x} = A(t)x + B(t)u,\quad x({{t}_{0}}) = {{x}_{0}},\quad {{x}_{0}} \in D,\quad D \subset V,$

где $x$ есть $n$-мерный вектор фазового состояния; $A(t)$ и $B(t)$ – непрерывные матрицы размера $n \times n$ и $n \times m$ соответственно; $u$ есть $m$-мерный вектор управления, компоненты которого принадлежат классу кусочно-непрерывных функций и подчинены ограничениям

(2.2)

${\text{|}}{{u}_{j}}{\text{|}} \leqslant {{M}_{j}},\quad {{M}_{j}} > 0,\quad j = \overline {1,m} .$

Предполагается, что система (2.1) полностью управляема, т.е.

(2.3)

${\text{rank}}\left[ {\int\limits_{{{t}_{0}}}^{{{t}_{k}}} \,\Phi ({{t}_{0}},\tau )B(\tau )B{\text{*}}(\tau )\Phi {\text{*}}({{t}_{0}},\tau )d\tau } \right] = n,$

и переводима в начало координат из ограниченной области начальных условий $D$; $V$ – область управляемости; $\Phi (t,{{t}_{0}})$ – фундаментальная матрица решений однородного дифференциального уравнения;* – знак транспонирования.

Задача 1. Найти в реальном времени допустимое управление ${{u}^{0}}(t)$, переводящее за время $T = {{t}_{k}} - {{t}_{0}}(T \geqslant {{T}_{0}})$ систему (2.1) из заданного начального состояния $x({{t}_{0}}) = {{x}_{0}} \in D$ в начало координат $x({{t}_{k}}) = 0$ и минимизирующее функционал

(2.4)

$J(u) = \int\limits_{{{t}_{0}}}^{{{t}_{k}}} \,\sum\limits_{j = 1}^m \,{\text{|}}{{u}_{j}}(\tau ){\text{|}}d\tau .$

Здесь ${{T}_{0}}$ – время оптимального по быстродействию перевода системы.

Замечание. Перевод системы в любое ненулевое конечное состояние (принимаемое за новое начало координат) преобразованием координат сводится без потери общности к переводу системы из нового начального состояния в начало координат [13].

3. РЕАЛИЗАЦИЯ ВЫЧИСЛЕНИЯ ПРИБЛИЖЕННОГО ЗНАЧЕНИЯ ВРЕМЕНИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ

Задача 2. Найти в реальном времени приближенное значение времени ${{T}_{0}} \approx {{t}_{k}} - {{t}_{0}}$ оптимального по быстродействию перевода системы (2.1) из начального состояния $x({{t}_{0}}) = {{x}_{0}}$ в начало координат $x({{t}_{k}}) = 0$.

3.1. Аппроксимация области достижимости гиперплоскостями

Область достижимости за время $T$ – это область фазового пространства $X$, из точек которого система (2.1) может быть переведена оптимальным по быстродействию управлением в начало координат за время $ \leqslant {\kern 1pt} T$. Известно, что для линейных систем области достижимости по форме близки к эллипсоидам [16], [17]. Приближенное и точное описание множеств достижимости, их верхние и нижние оценки, свойства (выпуклость, гладкость границы и др.) рассматривались в [18]–[21]. Для линейных систем область достижимости является выпуклым ограниченным замкнутым множеством.

Обозначим через $x_{{(i)}}^{ * }$ – граничные точки на фазовых осях, переход из которых в начало координат происходит за время $T$, т.е. $x_{{(i)}}^{ * }$ – точки пересечения с осями фазового пространства границы области достижимости за время $T$. Задача нахождения $x_{{(i)}}^{ * }$ является обратной задачей оптимального быстродействия и решается предварительно до начала процесса управления. Для системы $n$ поряка имеем на фазовых осях $2n$ граничных точек.

Проведем через $n$ различных граничных точек, принадлежащих различным фазовым осям, гиперплоскости, каждая из которых описывается одним из нижеследующих уравнений в отрезках

(3.1)

$\sum\limits_{i = 1}^n \frac{{{{x}_{i}}}}{{ \pm x_{{(i)}}^{ * }}} - 1 = 0.$

Число гиперплоскостей, которые проходят через $2n$ граничных точек, равно ${{2}^{n}}$. Совокупность гиперплоскостей (3.1), ограничивающих часть фазового пространства, может быть описана векторным уравнением

(3.2)

$Px - I = 0.$

Здесь $x$ суть $n$-мерный вектор фазового пространства; $I$ – единичный вектор-столбец размера ${{2}^{n}}$; $P$ – матрица размера ${{2}^{n}} \times n$, составленная из ${{2}^{n}}$ комбинаций различных значений $\tfrac{1}{{ \pm x_{{(i)}}^{ * }}}$ по $n$ в каждой строке. Если выполнено условие

(3.3)

$Px({{t}_{0}}) - I \leqslant 0$

для всех ${{2}^{n}}$ линейных неравенств, то точка $x({{t}_{0}})$ лежит внутри (либо на границе в случае равенства) фазового пространства, ограниченного гиперплоскостями (3.1). Нетрудно видеть, что (3.3) выделяет многогранник $Y$, вписанный в область достижимости за время $T$ и имеющий с ней $2n$ общих граничных точек. Процедуру выделения $x({{t}_{0}}) \in Y$ можно существенно упростить. Нет необходимости в одновременном рассмотрении всех ${{2}^{n}}$ линейных неравенств (3.3). Так как справедливо соотношение

$\sum\limits_{i = 1}^n \frac{{{{x}_{i}}({{t}_{0}})}}{{ \pm x_{{(i)}}^{ * }}} \leqslant \sum\limits_{i = 1}^n \left| {\frac{{{{x}_{i}}({{t}_{0}})}}{{x_{{(i)}}^{ * }}}} \right|,$

то достаточно рассмотреть предельное соотношение, которое имеет место при любом расположении начальной точки в фазовом пространстве

(3.4)

$\sum\limits_{i = 1}^n \left| {\frac{{{{x}_{i}}({{t}_{0}})}}{{x_{{(i)}}^{ * }}}} \right| - 1 \leqslant 0.$

Если (3.4) выполняется, то $x({{t}_{0}}) \in Y$.

Достоинством рассмотренного способа является простота реализации [15 ] . Недостатком такого способа является малая выделяемая область достижимости, которая может быть значительно увеличена. Дополним рассмотрение в каждом октанте $\alpha ,\alpha = \overline {1,{{2}^{n}}} $, фазового пространства еще одной граничной точкой $x_{ * }^{\alpha }$, принадлежащей границе множества достижимости и максимально удаленной от начала координат. Точку $x_{ * }^{\alpha }$ находим, двигаясь по границе множества достижимости методом наискорейшего спуска или методом градиента. Составим из $n$ различных граничных точек, находящихся на фазовых осях в каждом октанте фазового пространства $n$ сочетаний по $(n - 1)$ различных значений в каждом сочетании. Дополним каждое сочетание граничной точкой $x_{ * }^{\alpha }$. Получим $n$ различных комбинаций по $n$ точек в каждой комбинации. Проведем через каждую комбинацию из $n$ точек гиперплоскость. Получим совокупность из $n$ гиперплоскостей. Каждая гиперплоскость проходит через граничную точку $x_{ * }^{\alpha }$ и $(n - 1)$ различных граничных точек на фазовых осях и описывается одним из уравнений вида

(3.5)

$\sum\limits_{i = 1}^n \,c_{{ik}}^{\alpha }{{x}_{i}} - 1 = 0,\quad k = \overline {1,n} .$

Численные $n$ значений коэффициентов $c_{{ik}}^{\alpha },i = \overline {1,n} $, для каждого конкретного $k \in [1,n]$ находятся следующим образом. Подставляем в уравнение (3.5) координаты каждой граничной точки, через которую проходит данная гиперплоскость. Таких граничных точек $n$ в каждой комбинации. Получаем систему из $n$ линейных неоднородных алгебраических уравнений относительно $n$ неизвестных коэффициентов $c_{{ik}}^{\alpha },i = \overline {1,n} $:

(3.6)

$\begin{gathered} c_{{1k}}^{\alpha }{{x}_{1}}(1) + c_{{2k}}^{\alpha }{{x}_{2}}(1) + ... + c_{{nk}}^{\alpha }{{x}_{n}}(1) - 1 = 0, \\ \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\ c_{{1k}}^{\alpha }{{x}_{1}}(N) + c_{{2k}}^{\alpha }{{x}_{2}}(N) + ... + c_{{nk}}^{\alpha }{{x}_{n}}(N) - 1 = 0, \\ \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \\ c_{{1k}}^{\alpha }{{x}_{1}}(n) + c_{{2k}}^{\alpha }{{x}_{2}}(n) + ... + c_{{nk}}^{\alpha }{{x}_{n}}(n) - 1 = 0. \\ \end{gathered} $

Здесь $N = \overline {1,n} $ – порядковый номер граничной точки в каждой комбинации из $n$ граничных точек; ${{x}_{i}}(N)$ есть i-я фазовая координата N-й граничной точки. Так как граничные точки на осях содержат все нулевые значения, кроме одного, то каждый из $n$ коэффициентов находится непосредственно из одного из $n$ уравнений. Другими словами, выбор граничных точек на фазовых осях резко упрощает процесс вычисления коэффициентов.

В результате получаем ${{2}^{n}}n$ гиперплоскостей, аппроксимирующих область достижимости за время $T$. Важно отметить, что для определения принадлежности начального условия $x({{t}_{0}}) = {{x}_{0}}$ области достижимости нет необходимости в проверке всех ${{2}^{n}}n$ неравенств. Начальное условие принадлежит такому $\alpha $ октанту фазового пространства, знаки которого определяются знаками начального условия $\operatorname{sign} {{x}_{i}}({{t}_{0}}),\;i = \overline {1,n} $, и принадлежит области достижимости при выполнении всех $n$ неравенств

(3.7)

$\sum\limits_{i = 1}^n \,c_{{ik}}^{\alpha }{{x}_{i}}({{t}_{0}}) - 1 \leqslant 0,\quad k = \overline {1,n} .$

Покажем, каким образом можно приближенно определить время оптимального быстродействия ${{T}_{0}}$ для любого начального условия ${{x}_{0}} \in D$, принадлежащего ограниченной области начальных условий $D$.

3.2. Деление области начальных условий на области достижимости

Разобъем все ограниченное множество начальных условий ${{x}_{0}} \in D$ на $q$ областей достижимости за разные времена ${{T}_{s}},s = \overline {1,q} $, где ${{T}_{{s - 1}}} < {{T}_{s}}.$ Каждое подмножество достижимости за время ${{T}_{s}}$ задается семейством из ${{2}^{n}}n$ гиперплоскостей. Каждая из гиперплоскостей описывается следующим уравнением при фиксированных $k$ и $s$:

(3.8)

$\sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha s}}{{x}_{i}} - 1 = 0,\quad k = \overline {1,n} ,\quad s = \overline {1,q} .$

На фиг. 1 показано деление области начальных условий на области достижимости за различные времена.

Фиг. 1.

Деление области начальных условий на области достижимости.

Подмножество ${{Y}_{s}}$ выделяется следующим образом. Находится минимальное значение $s$, при котором для каждого $k = \overline {1,n} $ выполняется неравенство (3.7), а при $(s - 1)$ существуют такие $k \in [1,n]$ (или хотя бы одно значение), для которых неравенство (3.7) не выполняется:

(3.9)

${{Y}_{s}} = \left[ {x({{t}_{0}}):\sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha s}}{{x}_{i}}({{t}_{0}}) - 1 \leqslant 0,\;k = \overline {1,n} ;\;\exists k \in [1,n]\;\;\sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha (s - 1)}}{{x}_{i}}({{t}_{0}}) - 1 > 0} \right].$

Если для произольно выбранного $s$ выполняются для каждого $k = \overline {1,n} $ соотношения

(3.10)

$\sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha s}}{{x}_{i}}({{t}_{0}}) - 1 < 0,\quad \sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha (s - 1)}}{{x}_{i}}({{t}_{0}}) - 1 \leqslant 0,\quad k = \overline {1,n} ,$

то это является условием уменьшения $s$. Если существуют такие значения $k \in [1,n]$ (или хотя бы одно значение), для которых выполняются неравенства

(3.11)

$\sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha s}}{{x}_{i}}({{t}_{0}}) - 1 > 0,\quad \sum\limits_{i = 1}^n \,c_{{ik}}^{{\alpha (s - 1)}}{{x}_{i}}({{t}_{0}}) - 1 > 0,\quad \exists k \in [1,n],$

то это является условием увеличения $s$. Процесс выбора $s$ заканчивается, когда выполняются условия (3.9).

Важно подчеркнуть, что процесс нахождения подобласти, которой принадлежит заданное начальное условие, следует начинать с минимального значения $s$. Рассматриваются гиперплоскости того октанта, в котором находится заданное начальное условие управляемой системы.

Итак, $s$ найдено. Перейдем к выбору гиперплоскости, которую следует принять в качестве опорной.

Величина $d = \sum\nolimits_{i = 1}^n {{{c}_{{ik}}}{{x}_{i}}({{t}_{0}}) - 1} $ является нормированным расстоянием от точки $x({{t}_{0}}) = {{x}_{0}}$ до гиперплоскости $\sum\nolimits_{i = 1}^n {{{c}_{{ik}}}{{x}_{i}} - 1} = 0$. В [13] доказано, что в качестве опорной следует взять гиперплоскость, для которой нормированное расстояние ${{d}_{k}} = \sum\nolimits_{i = 1}^n {{{c}_{{ik}}}{{x}_{i}}({{t}_{0}}) - 1} ,$ $k = \overline {1,n} $, от начального условия $x({{t}_{0}}) = {{x}_{0}}$ до опорной гиперплоскости ${{\Gamma }_{r}},r \in [1,n]$, области достижимости за время ${{T}_{{s - 1}}}$ неотрицательно ($d \geqslant 0$) и максимально: ${{d}_{r}} = \mathop {max}\limits_k {{d}_{k}}$.

Нетрудно видеть, что для каждого начального условия выделяется многогранник, вписанный в множество достижимости за время ${{T}_{s}}$. Поэтому такая конструкция является аппроксимирующей и дает приближенное решение задачи быстродействия. С момента задания конкретного начального условия начинается определение конкретной опорной гиперплоскости, соответствующей заданному начальному условию. Эта операция выполняется уже в процессе управления. Процедура выделения соответствующей опорной гиперплоскости не требует сложных вычислений и сводится к проверке простых неравенств.

4. ВЫЧИСЛЕНИЕ И РЕАЛИЗАЦИЯ ОПТИМАЛЬНОГО ПО РАСХОДУ РЕСУРСОВ УПРАВЛЕНИЯ

4.1. Задание начального приближения

Точка $x({{t}_{0}}) = {{x}_{0}}$ находится между опорной гиперплоскостью Г$_{1}$ и гиперплоскостью Г$_{2}$, которая “параллельна” опорной. Опорная гиперплоскость проходит через $(n - 1)$ граничные точки $x_{{(i)}}^{{ * (s - 1)}}$ на фазовых осях и максимально удаленную точку $x_{{ * (s - 1)}}^{\alpha }$ на границе множества достижимости за время ${{T}_{{s - 1}}}$. Параллельная опорной гиперплоскость Г$_{2}$ проходит через граничные точки на тех же фазовых осях и через граничную точку $x_{{ * (s)}}^{\alpha }$ на границе множества достижимости за время ${{T}_{s}}$. Следовательно, время оптимального быстродействия ${{T}_{{s - 1}}} \leqslant {{T}_{0}} \leqslant {{T}_{s}}$. ( Процедура более точного приближенного определения времени оптимального быстродействия рассмотрена в [12]–[14].) Для существования решения рассматриваемой в данной работе задачи минимизации расхода ресурса необходимо и достаточно, чтобы задаваемое время $T$ перевода системы удовлетворяло условию $T > {{T}_{s}}$ ( с гарантией в силу аппроксимации множеств достижимости гиперплоскостями).

Для каждой граничной точки предварительно вычисляем оптимальные по расходу ресурса управления, переводящие систему (2.1) в начало координат за время $T$, которое равно последовательно значениям: ${{T}_{{s + 1}}},\;{{T}_{{s + 2}}},\;...$ Вычисленные значения оптимального управления для нескольких значений времени перевода “прикрепляем” к каждой граничой точке. Для заданного начального условия $x({{t}_{0}}) = {{x}_{0}}$ из области начальных условий ${{x}_{0}} \in D$ находим ближайшую (по норме) граничную точку из $2n$ граничных точек, принадлежащих гиперплоскостям ${{\Gamma }_{1}}$ и ${{\Gamma }_{2}}$. В качестве начального приближения при вычислении искомого оптимального по расходу ресурса управления выбираем одно из значений времени перевода и принимаем “прикрепленные” к этой граничной точке значения оптимального управления: моменты переключений управления, начальные условия сопряженной системы, весовые коэффициенты для формирования квазиоптимального по расходу ресурса управления. В силу близости начального условия и граничной точки несколько (двух) итераций достаточно для вычисления (уточнения) искомого оптимального управления.

4.2. Отклонение фазовой траектории от начала координат

Зададим “прикрепленные” к ближайшей граничной точке значения моментов переключений $t_{j}^{\alpha },\;j = \overline {1,m} ;\;\alpha = \overline {1,2({{r}_{j}} - 1} ).$ Управляемая система (2.1) переводится в некоторую точку фазового пространства, которая отклоняется от начала координат на величину

(4.1)

$\Delta \hat {x}({{t}_{k}}) = \Phi ({{t}_{k}},{{t}_{0}})x({{t}_{0}}) + \sum\limits_{j = 1}^m \,\sum\limits_{p = 1}^{{{r}_{j}}} \,\int\limits_{t_{j}^{{2(p - 1)}}}^{t_{j}^{{2p - 1}}} \Phi ({{t}_{k}},\tau ){{B}_{j}}(\tau ){{M}_{j}}{{S}_{j}}(p)d\tau ,$

где ${{S}_{j}}(p)$ – знак управления на $p$ интервале знакопостоянства $j$ компоненты вектора управления. Знаки определяются по знакам квазиоптимального управления [15], [21].

Это отклонение должно быть скомпенсировано соответствующим изменением моментов переключений управления.

4.3. Вариация моментов переключений управления

Изменение $t_{j}^{\alpha }$ на величину $\Delta t_{j}^{\alpha },\;\alpha = \overline {1,2({{r}_{j}} - 1)} $, вызывает следующее отклонение фазовых координат в конечный момент времени $t = {{t}_{k}}$ для кусочно-постоянного управления $u_{j}^{p}(t)$, компоненты которого переключаются в моменты времени $t = t_{j}^{\alpha },\;j = \overline {1,m} ;\;\alpha = \overline {1,2({{r}_{j}} - 1)} $, и принимают значения $u_{j}^{p}(t) = {{M}_{j}}{{S}_{j}}(p),\;t \in [t_{j}^{{2(p - 1)}},t_{j}^{{2p - 1}}],\;p = \overline {1,{{r}_{j}}} $:

(4.2)

$\Delta \tilde {x}({{t}_{k}}) = \sum\limits_{j = 1}^m \,\sum\limits_{\alpha = 1}^{2({{r}_{j}} - 1)} \,\int\limits_{t_{j}^{\alpha }}^{t_{j}^{\alpha } + \Delta t_{j}^{\alpha }} \Phi ({{t}_{k}},\tau ){{B}_{j}}(\tau ){{( - 1)}^{{\alpha - 1}}}{{M}_{j}}{{S}_{j}}(p)d\tau .$

Параметры $p$ и $\alpha $ связаны соотношением $p = E(\alpha {\text{/}}2 + 1)$, $\alpha = 1,2,3,\;...$, где $E(\, \cdot \,)$ – целая часть числа.

Если $\Delta t_{j}^{\alpha }$ достаточно малы (а это всегда достижимо), то получаем приближенное соотношение, которое тем точнее, чем меньше по модулю $\Delta t_{j}^{\alpha }$

(4.3)

$\Delta \tilde {x}({{t}_{k}}) \approx \sum\limits_{j = 1}^m \,\sum\limits_{\alpha = 1}^{2({{r}_{j}} - 1)} \Phi ({{t}_{k}},t_{j}^{\alpha }){{B}_{j}}(t_{j}^{\alpha }){{( - 1)}^{{\alpha - 1}}}{{M}_{j}}{{S}_{j}}(p)\Delta t_{j}^{\alpha }.$

4.4. Уравнение баланса отклонений

Отклонения фазовых координат (4.1), порождаемые неточным заданием моментов переключений, должны быть скомпенсированы соответствующим изменением моментов переключений, т.е. должно выполняться уравнение баланса отклонений: $\Delta \tilde {x}({{t}_{k}}) + \Delta \hat {x}({{t}_{k}}) = 0.$ Подставив в это уравнение выражения (4.1) и (4.3), получим систему из $n$ линейных алгебраических уравнений

(4.4)

$\sum\limits_{j = 1}^m \,\sum\limits_{\alpha = 1}^{2({{r}_{j}} - 1)} \,\Phi ({{t}_{k}},t_{j}^{\alpha }){{B}_{j}}(t_{j}^{\alpha }){{( - 1)}^{{\alpha - 1}}}{{M}_{j}}{{S}_{j}}(p)\Delta t_{j}^{\alpha }\, + \,\sum\limits_{j = 1}^m \,\sum\limits_{p = 1}^{{{r}_{j}}} \,\int\limits_{t_{j}^{{2(p - 1)}}}^{t_{j}^{{2p - 1}}} \,\Phi ({{t}_{k}},\tau ){{B}_{j}}(\tau ){{M}_{j}}{{S}_{j}}(p)d\tau \, + \,\Phi ({{t}_{k}},{{t}_{0}})x({{t}_{0}})\, = \,0.$

Число неизвестных $\Delta t_{j}^{\alpha },\;j = \overline {1,m} ;\;\alpha = \overline {1,2({{r}_{j}} - 1)} $, в (4.4) может быть больше числа уравнений, однако, только $n$ из них являются независимыми переменными. Выше отмечалось, что с помощью сопряженной системы заданием $n$ моментов переключений однозначно задаются все остальные моменты переключений на интервале $[{{t}_{0}},{{t}_{k}}]$. Поэтому для нахождения оптимального управления (а не просто допустимого управления) необходимо перейти к определению расположения моментов переключений с помощью сопряженной системы. С этой целью установим связь между отклонениями $\Delta t_{j}^{\alpha },\;j = \overline {1,m} ;\;\alpha = \overline {1,2({{r}_{j}} - 1)} $, моментов переключений и отклонениями $\Delta {{\psi }_{i}}({{t}_{0}}),\;i = \overline {1,n} $, начальных условий сопряженной системы. Число последних равно $n$. В результате получим систему из $n$ линейных алгебраических уравнений с $n$ неизвестными $\Delta {{\psi }_{i}}({{t}_{0}}),\;i = \overline {1,n} $. Такая связь была получена [6]:

(4.5)

$\begin{gathered} \Delta t_{j}^{\alpha } \approx {{\{ \{ [{{B}_{j}}(t_{j}^{\alpha })]{\kern 1pt} {\text{*}}A{\text{*}}(t_{j}^{\alpha }) - [{{{\dot {B}}}_{j}}(t_{j}^{\alpha })]{\kern 1pt} {\text{*}}\} [{{\Phi }^{{ - 1}}}(t_{j}^{\alpha },{{t}_{0}})]{\kern 1pt} {\text{*}}\psi ({{t}_{0}})\} }^{{ - 1}}}[{{B}_{j}}(t_{j}^{\alpha })]{\text{*}}[{{\Phi }^{{ - 1}}}(t_{j}^{\alpha },{{t}_{0}})]{\kern 1pt} {\text{*}}\Delta \psi ({{t}_{0}}), \\ j = \overline {1,m} ;\quad \alpha = \overline {1,2({{r}_{j}} - 1)} . \\ \end{gathered} $

Запишем соотношение (4.5) в компактном виде

(4.5)'

$\Delta t_{j}^{\alpha } \approx \mathcal{L}(t_{j}^{\alpha })\Delta \psi ({{t}_{0}}),\quad j = \overline {1,m} ;\quad \alpha = \overline {1,2({{r}_{j}} - 1)} .$

Cледует отметить, что, несмотря на кажущуюся сложность, выражение (4.5) имеет простой вид благодаря матрицам размера $(1 \times n)$ и $(n \times 1)$, входящим в это выражение.

4.5. Основное уравнение

Подставив (4.5)' в (4.4), получим основную систему из $n$ линейных алгебраических уравнений относительно $n$ неизвестных $\vartriangle {{\psi }_{i}}({{t}_{0}}),\;i = \overline {1,n} $:

(4.6)

$\begin{gathered} \sum\limits_{j = 1}^m \,\sum\limits_{\alpha = 1}^{2({{r}_{j}} - 1)} \,\Phi ({{t}_{k}},t_{j}^{\alpha }){{B}_{j}}(t_{j}^{\alpha }){{( - 1)}^{{\alpha - 1}}}{{M}_{j}}{{S}_{j}}(p)\mathcal{L}(t_{j}^{\alpha })\Delta \psi ({{t}_{0}}) + \Phi ({{t}_{k}},{{t}_{0}})x({{t}_{0}}) + \\ + \;\sum\limits_{j = 1}^m \,\sum\limits_{p = 1}^{{{r}_{j}}} \,\int\limits_{t_{j}^{{2(p - 1)}}}^{t_{j}^{{2p - 1}}} \Phi ({{t}_{k}},\tau ){{B}_{j}}(\tau ){{M}_{j}}{{S}_{j}}(p)d\tau = 0. \\ \end{gathered} $

Решив (4.6), находим $\Delta \psi ({{t}_{0}}).$ По формуле (4.5) вычисляем отклонения $\Delta t_{j}^{\alpha },$ на которые следует изменить каждый из моментов переключений, чтобы уменьшить в конечный момент отклонение от начала координат фазовой траектории движения системы (2.1). Приближенность выражений (4.3) и (4.5) приводит к итерационной процедуре нахождения оптимального управления. Доказательство сходимости вычислительного процесса аналогично доказательству в [6].

4.6. Изменение момента включения управления

Если заданное время перевода $T$ значительно больше времени оптимального быстродействия $T_{0}^{ * }$, то на интервале $t \in [{{t}_{0}},t_{j}^{1})$ управление $u(t) \equiv 0$, где $t_{j}^{1}$ – момент включения управления. Ранее принималось, что ${{t}_{0}}$ – момент включения управления. Изменение момента включения управления требует соответственно изменения расчетных выражений. Следует перейти к следующим соотношениям. Основное уравнение (4.6) теперь запишем в виде

(4.6)'

$\sum\limits_{j = 1}^m \,\sum\limits_{\alpha = 1}^{2{{r}_{j}} - 1} \,\Phi ({{t}_{k}},t_{j}^{\alpha }){{B}_{j}}(t_{j}^{\alpha }){{( - 1)}^{\alpha }}{{M}_{j}}{{S}_{j}}(p)\mathcal{L}(t_{j}^{\alpha })\Delta \psi ({{t}_{0}}) + \Delta \hat {x}({{t}_{k}}) = 0.$

Параметры $p$ и $\alpha $ теперь связаны так: $p = E(1{\text{/}}2(\alpha + 1))$, $\alpha = \overline {1,2{{r}_{j}} - 1} $, где $E(\, \cdot \,)$ – целая часть числа. Приближенное выражение (4.5) для каждого $\Delta t_{j}^{\alpha },\;\alpha = \overline {1,2{{r}_{j}} - 1} $, остается без изменений. Выражение (4.1) следует записать в виде

(4.1)'

$\Delta \hat {x}({{t}_{k}}) = \Phi ({{t}_{k}},{{t}_{0}})x({{t}_{0}}) + \sum\limits_{j = 1}^m \,\sum\limits_{p = 1}^{{{r}_{j}}} \,\int\limits_{t_{j}^{{2p - 1}}}^{t_{j}^{{2p}}} \,\Phi ({{t}_{k}},\tau ){{B}_{j}}(\tau ){{M}_{j}}{{S}_{j}}(p)d\tau .$

5. МОДЕЛИРОВАНИЕ И РЕЗУЛЬТАТЫ ВЫЧИСЛЕНИЙ

Рассмотрим систему линейных дифференциальных уравнений

(5.1)

$\begin{gathered} {{{\dot {x}}}_{1}} = {{x}_{2}},\quad {{x}_{1}}({{t}_{0}}) = {{x}_{{10}}}, \\ {{{\dot {x}}}_{2}} = {{x}_{3}},\quad {{x}_{2}}({{t}_{0}}) = {{x}_{{20}}}, \\ {{{\dot {x}}}_{3}} = {{x}_{4}},\quad {{x}_{3}}({{t}_{0}}) = {{x}_{{30}}}, \\ {{{\dot {x}}}_{4}} = {{a}_{{41}}}{{x}_{1}} + {{a}_{{42}}}{{x}_{2}} + {{a}_{{43}}}{{x}_{3}} + {{a}_{{44}}}{{x}_{4}} + bu,\quad {{x}_{4}}({{t}_{0}}) = {{x}_{{40}}},\quad {\text{|}}u{\text{|}} \leqslant M. \\ \end{gathered} $

Система (5.1) при ${{a}_{{41}}} = - 2.9684$; ${{a}_{{42}}} = - 5.84$; ${{a}_{{43}}} = - 6.33$; ${{a}_{{44}}} = - 3.4$ имеет следующие комплексно-сопряженные собственные значения матрицы $A$: ${{\lambda }_{{1,2}}} = - 0.784 \pm j0.986$; ${{\lambda }_{{3,4}}} = - 0.916 \pm j1.016$. Принято $b = 4$, $M = 5$, ${{T}_{{s + 1}}} - {{T}_{s}} = 0.5$, $s = \overline {1,10} $.

Пусть задано $x({{t}_{0}}) = (1,0.8, - 1.2,2).$ Начальное условие принадлежит октанту $[ + + - + ]$ фазового пространства. Проверяем выполнение условий (3.9) и получаем, что заданное начальное условие принадлежит области достижимости за время $T = 2.5$ и не принадлежит области достижимости за время $T = 2$. Опорная гиперплоскость Г$_{1}$ при $T = 2$ проходит через граничные точки на фазовых осях ${{x}_{1}},\;{{x}_{2}},\;{{x}_{4}}$: $x_{{(1)}}^{{ * 2}} = 0.833;$ $x_{{(2)}}^{{ * 2}} = 0.799;$ $x_{{(4)}}^{{ * 2}} = 9.053$ и максимально удаленную граничную точку $x_{{ * 2}}^{\alpha } = (2;1.98; - 11.088;13.86)$ и описывается уравнением

(5.2)

$1.20048{{x}_{1}} + 1.251564{{x}_{2}} + 0.487919{{x}_{3}} + 0.110461{{x}_{4}} - 1 = 0.$

Нормированное расстояние (${{d}_{1}} > 0$) от точки $x({{t}_{0}})$ до опорной гиперплоскости равно ${{d}_{1}} = 0.83715$.

Параллельная опорной гиперплоскость ${{\Gamma }_{2}}$ при $T = 2.5$ проходит через граничные точки на тех же фазовых осях ${{x}_{1}},{{x}_{2}},{{x}_{4}}{\kern 1pt} :x_{{(1)}}^{{ * 2.5}} = 2.0835;$ $x_{{(2)}}^{{ * 2.5}} = 1.62;$ $x_{{(4)}}^{{ * 2.5}} = 13.304$, максимально удаленную граничную точку $x_{{ * 2.5}}^{\alpha } = (4.267;4.224; - 23.654;29.567)$ и описывается уравнением

(5.3)

$0.479962{{x}_{1}} + 0.617284{{x}_{2}} + 0.259334{{x}_{3}} + 0.075165{{x}_{4}} - 1 = 0.$

Нормированное расстояние $({{d}_{2}} < 0)$ от точки $x({{t}_{0}})$ до гиперплоскости ${{\Gamma }_{2}}$ равно ${{d}_{2}} = - 0.187082$.

Ближайшей граничной точкой к точке $x({{t}_{0}}) = (1,0.8, - 1.2,2)$ является граничная точка на оси ${{x}_{1}}$: $x_{{(1)}}^{{ * 2}} = 0.833$, принадлежащая опорной гиперплоскости ${{\Gamma }_{1}}$. Расстояние от начального условия $x({{t}_{0}})$ до граничной точки на оси ${{x}_{1}} = (0.833,0,0,0)$ равно $R = \left\| {x({{t}_{0}}) - {{x}_{1}}} \right\| = 2.4714.$ В качестве начального приближения при вычислении оптимального по расходу ресурса управления принимаем предварительно вычисленные и “привязанные” к этой точке значения моментов переключений оптимальных управлений соответственно для $T = 3;\;T = 3.5;\;T = 4$. “Привязываем” также начальные условия сопряженной системы и значения весовых коэффициентов для формирования квазиоптимальных управлений, которые необходимы для определения структуры искомого оптимального управления.

В табл. 1–3 соответственно приведены вычисленные на каждой итерации (h) значения моментов переключений искомого оптимального управления и нормы $\left\| {x({{t}_{k}})} \right\|$ системы (5.1) в конечный момент времени $t = {{t}_{k}}$. Двух итераций достаточно для вычисления оптимального управления с погрешностью перевода ${{10}^{{ - 4}}}$ для $T = 3;\;T = 3.5$ и с погрешностью менее 0.05 для $T = 4$. Для случаев $T = 3$ и $T = 3.5$ структура (т.е. последовательность знаков) искомого оптимального управления следующая: $[ - M,0, + M,0, - M,0, + M]$. Для $T = 4$ на первом интервале $t \in [{{t}_{0}},{{t}_{1}}]\;\;u(t) \equiv 0$ и структура оптимального управления уже следующая: $[0, - M,0, + M,0, - M,0, + M]$.

Таблица 1.

T = 3

h	t₁	t₂	t₃	t₄	t₅	t₆	\|\|x(t_k)\|\|
0	0.123240	1.386342	1.465234	2.540592	2.588479	2.974115	0.415482
1	0.257018	1.380381	1.516752	2.509195	2.597922	2.953254	0.043831
2	0.258609	1.376559	1.521762	2.504450	2.599030	2.950866	0.000395

Таблица 2.

T = 3.5

h	t₁	t₂	t₃	t₄	t₅	t₆	\|\|x(t_k)\|\|
0	0.074539	1.787636	1.833612	3.033819	3.059240	3.485209	0.289452
1	0.174632	1.779561	1.853757	3.017407	3.061832	3.474402	0.021276
2	0.173212	1.778806	1.855808	3.016103	3.062217	3.473632	0.000227

Таблица 3.

T = 4

h	t₁	t₂	t₃	t₄	t₅	t₆	t₇	\|\|x(t_k)\|\|
0	0.129934	0.157804	2.260721	2.295517	3.532561	3.550965	3.988875	0.213683
1	0.088051	0.192187	2.251764	2.297076	3.525641	3.550310	3.985061	0.086245
2	0.087507	0.189142	2.247527	2.297812	3.522379	3.549756	3.983164	0.041808

Зададим другое начальное условие $x({{t}_{0}}) = (2,4, - 11,3.8).$ Эта точка находится в том же октанте $[ + \; + \; - \; + ]$ фазового пространства. Проверяем выполнение неравенств (3.9) и находим, что начальное условие принадлежит области достижимости за время $T = 2.5$ и не принадлежит области достижимости за время $T = 2$. Опорная гиперплоскость проходит уже через другую комбинацию граничных точек на фазовых осях ${{x}_{1}},{{x}_{2}},{{x}_{3}},:x_{{(1)}}^{{ * 2}} = 0.833;$ $x_{{(2)}}^{{ * 2}} = 0.799;$ $x_{{(3)}}^{{ * 2}} = - 1.8372$ и максимально удаленную граничную точку $x_{{ * 2}}^{\alpha } = (2;1.98; - 11.088;13.86)$ и описывается уравнением

(5.4)

$1.20048{{x}_{1}} + 1.251564{{x}_{2}} - 0.544306{{x}_{3}} - 0.715319{{x}_{4}} - 1 = 0.$

Нормированное расстояние (${{d}_{1}} > 0$) от точки $x({{t}_{0}})$ до опорной гиперплоскости равно ${{d}_{1}} = 9.67637$.

Параллельная опорной гиперплоскость ${{\Gamma }_{2}}$ при $T = 2.5$ проходит через граничные точки на тех же фазовых осях ${{x}_{1}},{{x}_{2}},{{x}_{3}}{\kern 1pt} :x_{{(1)}}^{{ * 2.5}} = 2.0835;$ $x_{{(2)}}^{{ * 2.5}} = 1.62;$ $x_{{(3)}}^{{ * 2.5}} = - 3.1464$ и максимально удаленную точку с координатами $x_{{ * 2.5}}^{\alpha } = (4.267;4.224; - 23.654;29.567)$. Начальное условие $x({{t}_{0}})$ находится между гиперплоскостями ${{\Gamma }_{1}}$ и ${{\Gamma }_{2}}$. Ближайшей граничной точкой является граничная точка на оси ${{x}_{3}} = (0,0, - 3.1464,0)$, принадлежащая гиперплоскости ${{\Gamma }_{2}}$. Минимальное расстояние равно $R = \left\| {x({{t}_{0}}) - {{x}_{3}}} \right\| = 9.804$.

В табл. 4–6 приведены вычисленные на каждой итерации значения моментов переключений искомого оптимального по расходу ресурса управления для трех значений времени перевода $T = 3;\;T = 3.5;\;T = 4$. Двух итераций достаточно для вычисления оптимального управления с точностью ${{10}^{{ - 3}}}{\kern 1pt} - {\kern 1pt} {{10}^{{ - 5}}}$. Для случаев $T = 3$ и $T = 3.5$ структура искомого оптимального управления вырожденная и следующая: $[ + M,0, + M,0, - M,0, + M]$. Для $T = 4$ на первой итерации структура еще $[ + M,0, + M,0, - M,0, + M]$, затем изменяется и уже со второй становится следующей $[ + M,0, - M,0, - M,0, + M]$.

Таблица 4.

T = 3

h	t₁	t₂	t₃	t₄	t₅	t₆	\|\|x(t_k)\|\|
0	0.557453	1.421509	1.664527	2.493375	2.632098	2.936724	1.318188
1	0.313201	1.375552	1.512205	2.467885	2.593482	2.927501	0.201952
2	0.340915	1.405634	1.511743	2.470284	2.597756	2.927039	0.004436

Таблица 5.

T = 3.5

h	t₁	t₂	t₃	t₄	t₅	t₆	\|\|x(t_k)\|\|
0	0.440493	1.802190	1.932715	3.007106	3.079471	3.463860	0.594712
1	0.419590	1.864021	1.879092	3.034010	3.067980	3.473338	0.008859
2	0.418743	1.863105	1.878720	3.034432	3.068343	3.473561	0.000047

Таблица 6.

T = 4

h	t₁	t₂	t₃	t₄	t₅	t₆	\|\|x(t_k)\|\|
0	0.350605	2.231857	2.315107	3.507048	3.553112	3.975043	0.520622
1	0.443570	2.297803	2.299281	3.546006	3.550801	3.991409	0.041128
2	0.438128	2.298037	2.300535	3.548447	3.551082	3.992869	0.000077

На фиг. 2 приведены оптимальные вырожденные управления для двух значений времени перевода $T = 3.5$ и $T = 4$.

Фиг. 2.

Оптимальные вырожденные управления для $T = 3.5$ и $T = 4$.

6. ЗАКЛЮЧЕНИЕ

Реализация оптимального управления в реальном времени требует нового подхода к проблеме. Одним из возможных подходов является разделение вычислительных затрат на: 1) предварительные вычисления; 2) вычисления в процессе управления. Каждый из этих этапов обладает своей спецификой. Предварительные вычисления требуют разработки метода, который не зависит от конкретного начального условия, т.е. не требует знания начального условия. На этом этапе вычисляется начальное приближение. Метод вычисления оптимального управления в процессе управления должен обладать малыми вычислительными затратами, что позволяет реализовать его в реальном времени. По существу это уточнение начального приближения. В работе рассмотрена реализация такого подхода для задачи оптимального по расходу ресурсов управления.

Предварительные вычисления состоят в построении аппроксимирующей конструкции. Каждая из областей достижимости аппроксимируется семейством из ${{2}^{n}}n$ гиперплоскостей, а вся область начальных условий – семейством из ${{2}^{n}}nq$ гиперплоскостей. Каждая гиперплоскость проходит через $n$ граничных точек. Из них $(n - 1)$ находятся на фазовых осях, а одна на луче, исходящем из начала координат. Для каждой граничной точки предварительно вычисляются несколько значений оптимального по расходу ресурса управлений и “прикрепляются” к соответствующей граничной точке. Для каждого начального условия находится ближайшая (по норме) граничная точка. Это позволяет: 1) выбрать из нескольких значений время $(T)$ перевода системы; 2) выполнить необходимое условие $T > {{T}_{0}}$; 3) использовать “прикрепленные” значения в качестве начального приближения в итерационной процедуре вычисления оптимального по расходу ресурса управления. В силу близости начального условия к граничной точке достаточно двух итераций для вычисления искомого оптимального по расходу ресурса управления с высокой точностью. Малые вычислительные затраты позволяют реализовать оптимальное управление в реальном времени.

Список литературы

Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976.
Singh T. Fuel/Time Optimal Control of the Benchmark Problem // J. Guid. Control Dyn. 1995. V. 18. № 6. P. 1225–1231.
Иванов В.А., Кожевников С.А. Одна задача синтеза оптимального по “расходу топлива” управления линейными объектами второго порядка с производными управления // Известия РАН. Теория и системы управления. 1996. № 4. С. 77–83.
Dewell L.D., Speyer J.L. Fuel-Optimal Periodic Control and Regulation in Constrained Hypersonic Flight // J. Guid. Control Dyn. 1997. V. 20. № 5. P. 923–932.
Liu S.W., Singh T. Fuel/Time Optimal Control of Spacecraft Maneuvers // J. Guid. Control Dyn. 1997. V. 20. № 2. P. 394–397.
Александров В.М. Оптимальное по расходу ресурсов управление линейными системами // Ж. вычисл. матем. и матем. физ. 2011. Т. 51. № 4. С. 562–579.
Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.
Грачев Н.И., Евтушенко Ю.Г. Библиотека программ для решения задач оптимального управления // Ж. вычисл. матем. и матем. физ. 1979. Т. 19. № 2. С. 367–387.
Габасов Р., Кириллова Ф.М. Конструктивные методы оптимизации. Ч. 2. Задачи управления. Минск: Изд-во “Университетское”, 1984.
Срочко В.А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000.
Осипов Ю.С. Пакеты программ: подход к решению задач позиционного управления с неполной информацией // Успехи матем. наук. 2006. Т. 61. Вып. 4. С. 25–76.
Александров В.М. Построение аппроксимирующей конструкции для вычисления и реализации оптимального управления в реальном времени // Сиб. журнал вычисл. матем. 2012. Т. 15. № 1. С. 1–19.
Александров В.М. Вычисление оптимального управления в реальном времени // Ж. вычисл. матем. и матем. физ. 2012. Т. 52. № 10. С. 1778–1800.
Александров В.М. Аппроксимация множеств достижимости и вычисление оптимального по быстродействию управления в реальном времени // Сиб. электрон. матем. изв. 2011. Т. 8. С. 72–104.
Александров В.М. Квазиоптимальное управление динамическими системами // Автоматика и телемехан. 2016. № 7. С. 47–67.
Черноусько Ф.Л. Эллипсоидальные оценки области достижимости управляемой системы // Прикл. матем. и механ. 1981. Т. 45. Вып. 1. С. 11–19.
Овсеевич А.И., Черноусько Ф.Л. Некоторые свойства оптимальных эллипсоидов, аппроксимирующих множества достижимости // Докл. АН. 2003. Т. 388. № 4. С. 462–465.
Овсеевич А.И., Тарабанько Ю.В. Явные формулы для эллипсодов, аппроксимирующих области достижимости // Изв. РАН. Теория и системы управления. 2007. № 2. С. 33–44.
Хрусталев М.М. Точное описание множеств достижимости и условие глобальной оптимальности динамических систем. I. Оценки и точное описание множеств достижимости и управляемости // Автоматика и телемехан. 1988. № 5. С. 62–71.
Райсиг Г. Выпуклость множеств достижимости систем управления // Автоматика и телемехан. 2007. № 9. С. 64–78.
Александров В.М. Вырожденное решение задачи минимизации расхода ресурса // Сиб. журнал вычисл. матем. 2015. Т. 19. № 1. С. 5–18.

Дополнительные материалы отсутствуют.

Инструменты

следующая статья выпуска предыдущая статья выпуска содержание выпуска

Журнал вычислительной математики и математической физики

Архивы выпусков Информация о журнале Отправить рукопись в журнал

Журнал вычислительной математики и математической физики, 2019, T. 59, № 7, стр. 1125-1136

Вычисление оптимального по расходу ресурса управления в реальном времени

1. ВВЕДЕНИЕ

2. ПОСТАНОВКА ЗАДАЧИ

(2.1)

(2.2)

(2.3)

(2.4)

3. РЕАЛИЗАЦИЯ ВЫЧИСЛЕНИЯ ПРИБЛИЖЕННОГО ЗНАЧЕНИЯ ВРЕМЕНИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ

3.1. Аппроксимация области достижимости гиперплоскостями

(3.1)

(3.2)

(3.3)

(3.4)

(3.5)

(3.6)

(3.7)

3.2. Деление области начальных условий на области достижимости

(3.8)

Фиг. 1.

(3.9)

(3.10)

(3.11)

4. ВЫЧИСЛЕНИЕ И РЕАЛИЗАЦИЯ ОПТИМАЛЬНОГО ПО РАСХОДУ РЕСУРСОВ УПРАВЛЕНИЯ

4.1. Задание начального приближения

4.2. Отклонение фазовой траектории от начала координат

(4.1)

4.3. Вариация моментов переключений управления

(4.2)

(4.3)

4.4. Уравнение баланса отклонений

(4.4)

(4.5)

(4.5)'

4.5. Основное уравнение

(4.6)

4.6. Изменение момента включения управления

(4.6)'

(4.1)'

5. МОДЕЛИРОВАНИЕ И РЕЗУЛЬТАТЫ ВЫЧИСЛЕНИЙ

(5.1)

(5.2)

(5.3)

Таблица 1.

T = 3

Таблица 2.

T = 3.5

Таблица 3.

T = 4

(5.4)

Таблица 4.

T = 3

Таблица 5.

T = 3.5

Таблица 6.

T = 4

Фиг. 2.

6. ЗАКЛЮЧЕНИЕ

Свяжитесь с нами

Время работы