Известия РАН. Механика твердого тела, 2021, № 5, стр. 64-91

ИСПОЛЬЗОВАНИЕ КОМБИНИРОВАННОГО КРИТЕРИЯ КАЧЕСТВА В ДИНАМИЧЕСКОЙ ЗАДАЧЕ ОПТИМАЛЬНОГО РАЗВОРОТА ТВЕРДОГО ТЕЛА (КОСМИЧЕСКОГО АППАРАТА) С ОГРАНИЧЕНИЕМ НА ФАЗОВЫЕ ПЕРЕМЕННЫЕ

М. В. Левский *

НИИ космических систем им. А.А. Максимова – филиал Государственного космического научно-производственного центра им. М.В. Хруничева
Королев, Россия

* E-mail: levskii1966@mail.ru

Поступила в редакцию 25.07.2020
После доработки 30.09.2020
Принята к публикации 24.12.2020

Полный текст (PDF)

Аннотация

Аналитическими методами решена динамическая задача оптимального разворота твердого тела (например, космического аппарата) из произвольного начального положения покоя в требуемое конечное положение покоя при ограниченном управлении (ограничены как управляющие функции, так и фазовые переменные). Время окончания маневра не фиксировано. Рассматривается случай, когда существенным ограничением является максимально допустимая кинетическая энергия вращения. Для оптимизации используется комбинированный критерий качества, объединяющий в заданной пропорции время разворота и интеграл от кинетической энергии вращения. Построение оптимального управления разворотом основано на кватернионных переменных и принципе максимума. Показано, что во время оптимального разворота момент сил параллелен прямой, неподвижной в инерциальном пространстве, и направление кинетического момента твердого тела (космического аппарата) постоянно относительно инерциальной системы координат. Ключевые свойства оптимального решения сформулированы в аналитическом виде. Подробно исследован особый режим управления и сформулированы условия существования или невозможности возникновения такого режима. Приведены расчетные выражения для нахождения основных характеристик программы управления. Даны пример и результаты математического моделирования движения космического аппарата как твердого тела при оптимальном управлении, демонстрирующие практическую реализуемость разработанного метода управления. Для динамически симметричного космического аппарата поставленная задача оптимального управления решается до конца – получены зависимости как явные функции времени для управляющих переменных и соотношения для расчета параметров закона управления. Созданные алгоритмы управления позволяют совершать развороты с ограниченной энергией вращения за минимальное время.

Ключевые слова: ориентация, кватернион, оптимальное управление, критерий качества, релейное управление, принцип максимума, краевая задача

Введение. В статье решается задача перевода твердого тела (в частности, космического аппарата (КА)) в положение заданной ориентации оптимальным образом с использованием комбинированного показателя качества. Способ решения и формализация описания кинематики вращательного движения основаны на методе кватернионов [1]. Для определения оптимальной траектории вращения использовались кватернионные модели, принцип максимума и универсальные переменные [2]. Оптимальная программа управления ориентацией при развороте КА, как твердого тела, из одного пространственного положения в другое построена с учетом ограничений на управление и фазовые переменные (ограничены силовой момент и угловая скорость). Приведенное ниже решение отличается от всех известных.

Исследованием задачи управления разворотом твердого тела в различных постановках занимались неоднократно [121]. Большинство существующих решений задачи пространственного разворота соответствуют вращению вокруг неподвижной оси [1, 36]. И хотя принципы оптимизации и алгоритмы управления различны (на основе нечеткой логики [3], обратных задач динамики [4, 5] и др.), результирующее управление приводит к развороту вокруг оси Эйлера. В то же время разворот в плоскости наименьшего угла разворота во многих практических случаях не является наилучшим, как бы точно он не исполнялся. Особое место занимают вопросы оптимального управления движением твердого тела [1, 2, 720], в том числе с неограниченным управлением [8, 9] (с фиксированным [8] и нефиксированным временем окончания маневра [9]). Наиболее детально задача оптимального управления угловым движением КА решена лишь для двух частных случаев – плоских вращений КА вокруг одной из главных центральных осей инерции [6] и пространственного вращения сферически-симметричного тела [1]. В большом количестве работ изучаются задачи оптимального по времени разворота [1017]. Практический интерес представляют аналитические решения задачи оптимального разворота в замкнутой форме, так как они позволяют применять на борту КА готовые законы программного управления и изменения оптимальной траектории движения КА. Для сферически-симметричного [1] и осесимметричного тела некоторые решения известны [1518] (иногда авторы решали краевую задачу принципа максимума путем замены переменных и последующего сведения исходной задачи к краевой задаче разворота сферически-симметричного тела [18]). Для КА с произвольным распределением масс при произвольных граничных условиях по угловому положению КА аналитическое решение задачи пространственного разворота не найдено, кроме некоторых особых случаев (например, [1, 19]). Управление ориентацией КА с помощью инерционных исполнительных органов (гиродинов) имеет свои особенности [6, 2225] (ранее был разработан и запатентован известный метод [26]).

Создание высокоэффективных алгоритмов управления ориентацией КА и сегодня является актуальной проблемой. В отличие от задач максимального быстродействия, нередко приходится учитывать стоимость затраченных ресурсов, кроме времени (например, топлива, расходуемого исполнительными органами системы ориентации КА при выполнении динамической операции). Ниже исследуется динамическая задача оптимального управления разворотом КА, когда ограничения накладываются как на управляющие функции, так и на фазовые переменные (ограничен не только силовой момент, но и угловая скорость). Принятый в статье минимизируемый функционал также включает фазовые переменные (угловые скорости КА). Найденное решение позволяет разворачивать КА с ограниченной кинетической энергией вращения за минимальное время, что крайне важно для практики космических полетов. Вопросы экономичности управления движением КА (в частности, ограниченности энергии вращения) и быстродействия маневров остаются до сих пор актуальными, поэтому решаемая в статье задача является практически важной.

1. Уравнения углового движения и постановка задачи управления. Динамика углового движения КА как твердого тела описывается динамическими уравнениями Эйлера [1, 6]:

(1.1)
${{J}_{1}}{{\dot {\omega }}_{1}} + ({{J}_{3}} - {{J}_{2}}){{\omega }_{2}}{{\omega }_{3}} = {{M}_{1}},\quad {{J}_{2}}{{\dot {\omega }}_{2}} + ({{J}_{1}} - {{J}_{3}}){{\omega }_{1}}{{\omega }_{3}} = {{M}_{2}},\quad {{J}_{3}}{{\dot {\omega }}_{3}} + ({{J}_{2}} - {{J}_{1}}){{\omega }_{1}}{{\omega }_{2}} = {{M}_{3}}$
где Ji, i = $\overline {1,3} $ – главные центральные моменты инерции аппарата, Мi – проекции главного момента М сил на главные центральные оси эллипсоида инерции аппарата, ωi – проекции вектора ω абсолютной угловой скорости КА на оси связанного базиса E, образованного главными центральными осями эллипсоида инерции аппарата.

Для описания пространственного движения КА используем математический аппарат кватернионов (параметров Родрига–Гамильтона). Движение связанного базиса Е относительно опорного базиса I будем задавать кватернионом Λ, который для удобства полагаем нормированным [1] (||Λ|| = 1). Для определенности базис I считается инерциальным. Поэтому справедливо следующее кинематическое уравнение [1]:

(1.2)
$2\dot {\Lambda } = \Lambda \circ {\mathbf{\omega }}$
где символ “$ \circ $” – знак умножения кватернионов [1, с. 11–20]. Здесь и далее операция кватернионного умножения на вектор понимается как умножение на кватернион с нулевой скалярной частью; в частности $\Lambda \circ {\mathbf{\omega }} = \Lambda \circ \Omega $, где Ω – кватернион, у которого sqal Ω = 0, vect Ω = ω.

Управление движением КА относительно центра масс осуществляется за счет изменения момента сил М. Считается, что область возможных значений вектора М подобна эллипсоиду инерции КА и описывается неравенством [15]

(1.3)
$\frac{{M_{1}^{2}}}{{{{J}_{1}}}} + \frac{{M_{2}^{2}}}{{{{J}_{2}}}} + \frac{{M_{3}^{2}}}{{{{J}_{3}}}} \leqslant u_{0}^{2}$
где u0 > 0 – некоторая положительная величина, характеризующая мощность исполнительных органов системы ориентации КА. Интерес представляет задача разворота с закрепленными левым и правым концами траектории движения, когда начальная и конечная угловые скорости полагаются равными нулю (относительно опорного базиса I); такие задачи встречаются достаточно часто и имеют большое практическое значение. Граничные условия для динамической системы (1.1), (1.2) для исследуемого управления разворотом из положения покоя в положение покоя представляются в виде равенств:
(1.4)
$\Lambda \left( 0 \right) = {{\Lambda }_{{{\text{in}}}}},\quad \omega \left( 0 \right) = 0$
(1.5)
$\Lambda (T) = {{\Lambda }_{{\text{f}}}},\quad \omega (T) = 0$
где Т – время окончания поворотного маневра. Кватернионы Λin и Λf, задающие ориентацию связанных осей КА в начальный и конечный моменты времени, имеют произвольные наперед заданные значения, удовлетворяющие условию ||Λin|| = ||Λf|| = 1 (полагаем, что Λf ≠ ±Λin). Допустимыми считаются движения, у которых кинетическая энергия вращения КА не превышает некоторой положительной величины Eadm. Следовательно, управление имеет ограничение
(1.6)
${{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2} \leqslant 2{{E}_{{{\text{adm}}}}}$
где Eadm – максимально допустимая кинетическая энергия вращения. Эффективность управления будем оценивать следующим показателем качества
(1.7)
$G = T + {{k}_{0}}\int\limits_0^T {({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2})dt} $
где k0 ≥ 0 – неотрицательный постоянный коэффициент. Задачу оптимального управления пространственным разворотом КА сформулируем следующим образом: КА необходимо перевести из состояния (1.4) в состояние (1.5) в соответствии с уравнениями (1.1), (1.2) и ограничениями (1.3), (1.6) с минимальным значением функционала (1.7). Время Т окончания маневра переориентации КА не фиксировано (оно оптимизируется вместе с G). Цена разворота складывается из стоимости потерь полезного полетного времени, вызванных длительностью совершаемого маневра, и интегральных энергозатрат. Интеграл в (1.7) характеризует нежелательность или опасность движения с большими энергиями. Коэффициент k0 определяет во сколько раз безопасность при движении (в интегральном смысле) дороже времени движения. Очевидно, он может быть разным для пилотируемых и грузовых аппаратов. Решение М(t) ищется в классе кусочно-непрерывных функций времени.

Принятый критерий оптимальности позволяет определить режим вращения КА, при котором разворот КА из исходного своего положения Λin в заданное конечное угловое положение Λf происходит с минимальными интегральными затратами энергии и времени, и найти соответствующую программу управления. Сформулированная задача управления КА отличается от ранее рассматриваемых задач видом функционала (1.7) при наличии ограничений на фазовые переменные, а не только на управляющий момент. Поскольку время управления Т не задано, разворот КА из состояния (1.4) в состояние (1.5) всегда осуществим (решение М(t) задачи (1.1)–(1.7) существует для любых сочетаний значений Λin, Λf, J1, J2, J3, и0). Оптимальное управление пространственной переориентацией КА в соответствии с критерием (1.7) обладает важными полезными свойствами. В частности, для оптимального по критерию (1.7) управления, ограниченного условием (1.3), остановка вращения КА (при необходимости прекращения маневра в критической или нештатной ситуации) занимает время, не превышающее заранее известной величины.

2. Решение задачи оптимального управления разворотом. Сформулированная задача управления (1.1)–(1.7) – динамическая задача оптимального разворота твердого тела [1], в которой управляющими функциями являются моменты Мi, $i = \overline {1,\;3} $. Будем решать поставленную задачу с помощью принципа максимума Л.С. Понтрягина [27]. Введем сопряженные переменные φi, соответствующие угловым скоростям ωi, i = $\overline {1,3} $. Поскольку критерий оптимальности не содержит позиционных координат (элементов кватерниона ориентации Λ), целесообразно использовать универсальные переменные ri, i = $\overline {1,3} $ [2], заменяющие сопряженные переменные ψj, которые соответствуют компонентам λj кватерниона Λ, $j = \overline {0,\;3} $. Ограничение на фазовую переменную Λ (и соответственно λj) несущественно, так как оно выполняется при любых движениях КА вокруг центра масс; ||Λ(t)|| = const в силу уравнения (1.2) [1]; мы полагали ||Λ(0)|| = ||Λin|| = 1, а значит |Λ(t)|| = 1 в любой момент времени t ∈ [0, T].

Для динамической задачи оптимального управления (1.1)–(1.7) гамильтониан Н равен [2]

$H = - 1 - {{k}_{0}}({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}) + {{\varphi }_{1}}({{М}_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{{3~}}}{\text{)/}}{{J}_{1}} + $
$ + {\kern 1pt} \,{{\varphi }_{2}}({{М}_{2}} + ({{J}_{3}}--{{J}_{1}}){{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + {{\varphi }_{3}}({{М}_{3}} + ({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} + {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}}$
где

${{r}_{1}} = ({{\lambda }_{0}}{{\psi }_{1}} + {{\lambda }_{3}}{{\psi }_{2}} - {{\lambda }_{1}}{{\psi }_{0}} - {{\lambda }_{2}}{{\psi }_{3}}){\text{/}}2,\quad {{r}_{2}} = ({{\lambda }_{0}}{{\psi }_{2}} + {{\lambda }_{1}}{{\psi }_{3}} - {{\lambda }_{2}}{{\psi }_{0}} - {{\lambda }_{3}}{{\psi }_{1}}){\text{/}}2,$
${{r}_{3}} = ({{\lambda }_{0}}{{\psi }_{3}} + {{\lambda }_{2}}{{\psi }_{1}} - {{\lambda }_{3}}{{\psi }_{0}} - {{\lambda }_{1}}{{\psi }_{2}}){\text{/}}2$

Оптимальные функции ri, как компоненты вектора r, и вектор r удовлетворяют уравнениям [2]

(2.1)
$\begin{gathered} {\mathbf{\dot {r}}} = - {\mathbf{\omega }} \times {\mathbf{r}} \\ {{{\dot {r}}}_{1}} = {{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}},\quad {{{\dot {r}}}_{2}} = {{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}},\quad {{{\dot {r}}}_{3}} = {{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}} \\ \end{gathered} $
(символ × означает векторное произведение векторов). Уравнения для φ i имеют вид [27]
${{\dot {\varphi }}_{i}} = - \frac{{\partial H}}{{\partial {{\omega }_{i}}}}\quad (i = \overline {1,\;3} )$
или в развернутой форме:

${{\dot {\varphi }}_{1}} = 2{{k}_{0}}{{J}_{1}}{{\omega }_{1}} + {{\omega }_{3}}{{\varphi }_{2}}({{J}_{1}} - {{J}_{3}}){\text{/}}{{J}_{2}} + {{\omega }_{2}}{{\varphi }_{3}}({{J}_{2}} - {{J}_{1}}){\text{/}}{{J}_{3}} - {{r}_{1}}$
(2.2)
${{\dot {\varphi }}_{2}} = 2{{k}_{0}}{{J}_{2}}{{\omega }_{2}} + {{\omega }_{1}}{{\varphi }_{3}}({{J}_{2}} - {{J}_{1}}){\text{/}}{{J}_{3}} + {{\omega }_{3}}{{\varphi }_{1}}({{J}_{3}} - {{J}_{2}}){\text{/}}{{J}_{1}} - {{r}_{2}}$
${{\dot {\varphi }}_{3}} = 2{{k}_{0}}{{J}_{3}}{{\omega }_{3}} + {{\omega }_{2}}{{\varphi }_{1}}({{J}_{3}} - {{J}_{2}}){\text{/}}{{J}_{1}} + {{\omega }_{1}}{{\varphi }_{2}}({{J}_{1}} - {{J}_{3}}){\text{/}}{{J}_{2}} - {{r}_{3}}$

Гамильтониан Н составлен без учета ограничения ||Λ|| = 1 для фазовых переменных λj в силу равенства ||Λ(0)|| = 1, о чем договорились выше. Вектор r является постоянным относительно инерциального базиса I и |r| = const ≠ 0 (постоянство модуля |r| следует из свойств уравнений (2.1)). Решение r(t) системы (2.1) определяется начальным Λin и конечным Λf положениями КА. Оптимальная функция r(t) вычисляется через кватернион Λ(t) [1, 2]:

${\mathbf{r}} = \tilde {\Lambda } \circ {{{\mathbf{c}}}_{E}} \circ \Lambda ,\quad {\text{где}}\quad {{{\mathbf{c}}}_{E}} = {\text{const}} = {{\Lambda }_{{{\text{in}}}}} \circ {\mathbf{r}}(0) \circ {{\tilde {\Lambda }}_{{{\text{in}}}}}$
(составляющие вектора cE – проекции вектора r на оси инерциального базиса I); $\tilde {\Lambda }$ – кватернион, сопряженный кватерниону Λ [1, с. 11–20]. Считается, что r(0) ≠ 0 (в противном случае r1 = r2 = r3 ≡ 0 и дальнейшее решение задачи теряет смысл). Направление вектора cE зависит от начального и конечного положений КА. Для того, чтобы КА имел требуемую ориентацию на правом конце Λ(T) = Λf, необходимо определить вектор cE (или значение вектора r в начальный момент времени) исходя из получающихся при этом решений уравнения (1.2).

Для формулирования условий максимума функции Н запишем ее в следующем виде

$H = {{{{M}_{1}}{{\varphi }_{1}}} \mathord{\left/ {\vphantom {{{{M}_{1}}{{\varphi }_{1}}} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}}$
где Hinv не зависит явно от управляющих функций Mi ($i = \overline {1,3} $). Область возможных управлений описывается неравенством (1.3). Обозначим

${{{{g}_{i}} = {{\varphi }_{i}}} \mathord{\left/ {\vphantom {{{{g}_{i}} = {{\varphi }_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }},\quad {{{{u}_{i}} = {{M}_{i}}} \mathord{\left/ {\vphantom {{{{u}_{i}} = {{M}_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }}$

После замены переменных гамильтониан H принимает вид $H = {{g}_{1}}{{u}_{1}} + {{g}_{2}}{{u}_{2}} + {{g}_{3}}{{u}_{3}}$ + + Hinv. Для вспомогательных переменных $u_{1}^{2} + u_{2}^{2} + u_{3}^{2} \leqslant u_{0}^{2}$, и гамильтониан H максимален, если

${{{{u}_{i}} = {{u}_{0}}{{g}_{i}}} \mathord{\left/ {\vphantom {{{{u}_{i}} = {{u}_{0}}{{g}_{i}}} {\sqrt {g_{1}^{2} + g_{2}^{2} + g_{3}^{2}} }}} \right. \kern-0em} {\sqrt {g_{1}^{2} + g_{2}^{2} + g_{3}^{2}} }}$

Пусть φ – вектор, компонентами которого являются φi. Нетрудно видеть, что в случае φ ≠ 0 максимум функции Н для управлений Мi(t) при ограничении (1.3) достигается, когда

(2.3)
${{M}_{i}} = \frac{{{{u}_{0}}{{\varphi }_{i}}}}{{\sqrt {{{\varphi _{1}^{2}} \mathord{\left/ {\vphantom {{\varphi _{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{\varphi _{2}^{2}} \mathord{\left/ {\vphantom {{\varphi _{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{\varphi _{3}^{2}} \mathord{\left/ {\vphantom {{\varphi _{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}$

Случай φ = 0, при котором гамильтониан не зависит явным образом от управления М, требует отдельного рассмотрения. Ниже покажем, что М = 0, если $\dot {\varphi } = 0$. Введем обозначение

$E(t) = ({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}){\text{/}}2$

В начале и в конце разворота ограничение (1.6) несущественно, оно переходит в строгое неравенство, так как угловые скорости в начальный и конечный моменты времени равны нулю ω(0) = ω(T) = 0. Поэтому, в интервалах движения, когда E(t) < Eadm, оптимальное решение определяется замкнутой системой уравнений (1.1), (1.2), (2.1)–(2.3) с учетом требований (1.4), (1.5). Найдем характерные свойства оптимального движения для задачи (1.1)–(1.7).

Системе (1.1), (2.1)–(2.3) удовлетворяют функции φi и ωi, пропорциональные ri. С учетом условий разворота ω(0) = ω(Т) = 0 система уравнений (1.1), (2.1)–(2.3) имеет единственное решение, в котором φi и угловые скорости ωi связаны с переменными ri зависимостями

(2.4)
${{\varphi }_{i}} = a(t){{r}_{i}}$
(2.5)
${{\omega }_{i}} = b(t){{r}_{i}}{\text{/}}{{J}_{i}}$
где a(t), b(t) – скалярные функции времени. Подстановка равенств (2.4), (2.5) в систему (2.2) с учетом уравнений (1.1), (2.1), (2.3) превращает все три уравнения (2.2) в тождества, что доказывает истинность решения (2.4), (2.5). При этом оптимальные функции a(t) и b(t) должны удовлетворять равенству $\dot {a}$ = 2k0b(t) – 1.

Построение оптимальной программы разворота во многом зависит от значения коэффициента k0 в минимизируемом функционале (1.7). Необходимо выделить два принципиальных случая: k0 = 0 и k0 > 0. Рассмотрение начнем с более простого варианта, когда k0 = 0.

3. Частный случай задачи оптимального разворота, когда k0 = 0. Если k0 = 0, то решается задача максимального быстродействия (разворот КА за минимальное время). Гамильтониан несколько упрощается и имеет следующий вид

$\begin{gathered} {{H}_{0}} = --1 + {{\varphi }_{1}}({{М}_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{3}}){\text{/}}{{J}_{1}} + {{\varphi }_{2}}({{М}_{2}} + ({{J}_{3}}--{{J}_{1}}){{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + \\ + \,{{\varphi }_{3}}({{М}_{3}} + ({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} + {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}} \\ \end{gathered} $

Сопряженная система уравнений (2.2) также принимает более простую форму

(3.1)
$\begin{gathered} {{{\dot {\varphi }}}_{1}} = {{\omega }_{3}}{{n}_{2}}{{\varphi }_{2}} + {{\omega }_{2}}{{n}_{3}}{{\varphi }_{3}} - {{r}_{1}},\quad {{{\dot {\varphi }}}_{2}} = {{\omega }_{3}}{{n}_{1}}{{\varphi }_{1}} + {{\omega }_{1}}{{n}_{3}}{{\varphi }_{3}} - {{r}_{2}}, \\ {{{\dot {\varphi }}}_{3}} = {{\omega }_{2}}{{n}_{1}}{{\varphi }_{1}} + {{\omega }_{1}}{{n}_{2}}{{\varphi }_{2}} - {{r}_{3}} \\ \end{gathered} $
где n1 = (J3 J2 )/J1, n2 = (J1 J3)/J2, n3 = (J2 J1)/J3 есть постоянные коэффициенты.

Очевидно, что разворот КА совершается максимально быстро, если в каждый текущий момент времени t угловая скорость максимальна, насколько это позволяют ограничения (1.3) и (1.6). Выше было показано, что если E(t) < Eadm, то оптимальным является управление (2.3) и М ≠ 0, если φ ≠ 0. При условии E(t) = сonst = Eadm область возможных управлений сокращается из шара |u| ≤ u0 до плоского круга, ограниченного окружностью, образованной пересечением сферы с плоскостью, перпендикулярной вектору, компонентами которого являются ${{\omega }_{i}}\sqrt {{{J}_{i}}} $ (так как при E(t) = сonst = Eadm должно быть $\dot {E} = 0$ и следовательно М1ω1 + М2ω2 + М3ω3 = 0); компонентами вектора u являются ui. Оптимальный момент М обязан находиться внутри сечения эллипсоида (1.3) плоскостью, перпендикулярной угловой скорости ω с тем, чтобы $\dot {E} = 0$ пока не наступит момент начала остановки вращения (а он существует, поскольку ω(T) = 0).

На участке разгона (начиная с момента времени t = 0), когда E(t) < Eadm и $\dot {E} > 0$, оптимальным является М ≠ 0 и a(t) > 0 (так как кинетическая энергия вращения E(t) возрастает), и как следствие

(3.2)
${{M}_{i}} = \frac{{{{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2}} }}$
(управляющий момент М и кинетический момент L имеют одинаковое направление, и значение E(t) = Eadm достигается за минимальное время при ограничении (1.3)). На участке торможения (в интервале времени слева от момента t = T), когда E(t) < Eadm и $\dot {E} < 0$, оптимальным является М ≠ 0 и a(t) < 0, чтобы кинетическая энергия вращения E(t) уменьшалась, и поэтому
(3.3)
${{M}_{i}} = \frac{{ - {{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2}} }}$
(слева от момента времени t = T управляющий момент М и кинетический момент L имеют противоположные направления, и время остановки вращения минимально).

На участках разгона и торможения, когда E(t) < Eadm, кинетическая энергия E изменяется в соответствии с уравнением $\dot {E} = \pm {{u}_{0}}\sqrt {2E} $ (“+” соответствует разгону, “–“ – торможению); приведенная зависимость получается из (3.2) и (3.3). Поэтому для участка разгона E(t) = u02t2/2, а для участка торможения E(t) = u02(Tt)2/2. В момент окончания разгона и в момент начала торможения кинетическая энергия одна и та же, поэтому длительности разгона и торможения одинаковы и равны τ = tac = $\sqrt {2{{E}_{{\max }}}} {\text{/}}{{u}_{0}}$, где Emax = E(T/2) – максимальная энергия вращения.

В случае k0 = 0 оптимальным решением (т.е. единственным решением, удовлетворяющим уравнениям движения (1.1) и необходимым условиям оптимальности (2.1), (3.1) с учетом максимальности гамильтониана H0 в каждый текущий момент времени t) является (2.5) и

(3.4)
${{\varphi }_{i}} = ({{\rho }_{0}} - t){{r}_{i}}$
где ρ0 = const > 0 (константа ρ0 определяется временными характеристиками оптимального разворота). Оптимальные функции b(t) и ρ(t) = ρ0 удовлетворяют следующим условиям:
$\begin{gathered} \dot {b}(0) > 0,\quad \dot {b}(T) < 0,\quad \rho \left( 0 \right) > 0,\quad \rho (T) < 0,\quad \rho \left( 0 \right)--\rho (T) = T \\ {\text{|}}\rho (T){\text{|}} \leqslant \rho (0),\quad \rho (0) \geqslant T{\text{/}}2,\quad {\text{|}}\rho (T){\text{|}} \leqslant T{\text{/}}2 \\ \end{gathered} $
(указанные неравенства будут обоснованы ниже).

Подставив равенства (2.5), (3.4) в систему (3.1) с учетом уравнений (1.1), (2.1), (2.3), получим тождества для всех трех уравнений (3.1) (так как $\dot {\rho }$ = –1), что доказывает истинность решения (2.5), (3.4) для задачи максимального быстродействия.

В зависимости от условий разворота (сочетания значений Λin, Λf и J1, J2, J3, u0) в оптимальном движении из начального положения Λin в конечное положение Λf максимальная кинетическая энергия вращения может быть меньше Eadm, а может возникнуть необходимость вращения какое-то время с выполнением равенства E(t) = const = = Eadm. Найдем условия, когда оптимальное управление исключает наличие моментов времени, в которые КА вращается с постоянной кинетической энергией. Обозначим Tfast – длительность максимально быстрого разворота без ограничений на энергию вращения (при этом силовой момент M ограничен условием (1.3)). Для такого разворота максимальная кинетическая энергия составляет Emax = $u_{0}^{2}T_{{fast}}^{2}{\text{/}}8$ (поскольку E(t) = $u_{0}^{2}{{t}^{2}}{\text{/}}2$, если t ≤ Tfast/2, и $E(t) = u_{0}^{2}{{(T - t)}^{2}}{\text{/}}2$, если t > Tfast/2). Вполне понятно, что если Eadm$u_{0}^{2}T_{{fast}}^{2}{\text{/}}8$, то ограничение (1.6) несущественно, и искомое оптимальное управление находится известными методами [19]. Чтобы закономерность $\dot {E} \ne 0$ имела место на всем отрезке времени t ∈ [0, T], длительность разворота T должна быть меньше, чем $2\sqrt {2{{E}_{{{\text{adm}}}}}} {\text{/}}{{u}_{0}}$. Для определения времени оптимального разворота T используем понятие “функционал пути” [20]

(3.5)
$S = \int\limits_0^T {\sqrt {{{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}} dt} $
который не зависит от характера изменения скалярной функции b(t), если движение КА удовлетворяет уравнениям (2.1), (2.5) (характеристика S зависит только от значений Λin, Λf и J1, J2, J3 [20]). Из соотношений T = 2τ, Emax = u02τ2/2, $T\sqrt {2{{E}_{{\max }}}} = 2S$ получим $T = 2\sqrt {S{\text{/}}{{u}_{0}}} $ = Tfast – минимально возможное время разворота при одном ограничении (1.3) (без учета требования (1.6) к энергии вращения). Величина Tfast соответствует развороту, во время которого отсутствует участок движения с E(t) = const. Для оптимального управления с одной точкой переключения Emax = u0S/2 и в момент времени t = T/2 необходимо выполнение условия Tfast$2\sqrt {2{{E}_{{{\text{adm}}}}}} {\text{/}}{{u}_{0}}$. Если и0S ≤ 2Eadm, то во время максимально быстрого разворота вращение КА в режиме E(t) = const невозможно.

Более подробно остановимся на ситуации, когда $u_{0}^{2}T_{{fast}}^{2}{\text{/}}8$ > Eadm. В этом случае неизбежен интервал времени, когда E(t) = const = Eadm. Оптимальное движение включает три фазы – раскрутка КА до максимально допустимой кинетической энергии вращения, вращение с постоянной максимально допустимой кинетической энергией и торможение до полной остановки КА. Если и0S > 2Eadm, то неизбежно вращение КА с постоянной кинетической энергией вращения, при котором ρ(t) ≥ 0. Разница S – 2Eadm/и0 определяет продолжительность участка движения, когда E(t) = const = Eadm. Найдем, каким должно быть оптимальное управление М, чтобы удовлетворялось условие $\dot {E} = 0$ с одновременной максимизацией гамильтониана H0. При выполнении соотношений (2.4), (2.5) гамильтониан H0 равен

${{H}_{0}} = --1 + a({{М}_{1}}{{r}_{1}}{\text{/}}{{J}_{1}} + {{М}_{2}}{{r}_{2}}{\text{/}}{{J}_{2}} + {{М}_{3}}{{r}_{3}}{\text{/}}{{J}_{3}}) + b(r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}})$

В интервале вращения с постоянной кинетической энергией E(t) = Eadm выполняется условие

(3.6)
${{М}_{1}}{{\omega }_{1}} + {{М}_{2}}{{\omega }_{2}} + {{М}_{3}}{{\omega }_{3}} = 0$

Для решения (2.4), (2.5) при условии E(t) = const = Eadm имеем

${{\varphi }_{1}}{{М}_{1}}{\text{/}}{{J}_{1}} + {{\varphi }_{2}}{{М}_{2}}{\text{/}}{{J}_{2}} + {{\varphi }_{3}}{{М}_{3}}{\text{/}}{{J}_{3}} = а(t)({{М}_{1}}{{\omega }_{1}} + {{М}_{2}}{{\omega }_{2}} + {{М}_{3}}{{\omega }_{3}}){\text{/}}b(t) = 0{\text{ }}\,\,{\text{и поэтому}}$
(3.7)
${{H}_{0}} = {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}} - 1$
(очевидно, b(t) ≠ 0 в интервале времени, когда E(t) = Eadm). Угловые скорости ωi, при которых достигается максимум функции H0 (с учетом E(t) = Eadm), будут следующими

(3.8)
${{\omega }_{i}} = \frac{{{{r}_{i}}\sqrt {2{{E}_{{{\text{adm}}}}}} }}{{{{J}_{i}}\sqrt {r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}} }}$

Подставив указанные зависимости для оптимальных угловых скоростей ωi в динамические уравнения (1.1) с учетом уравнений (2.1) для оптимальных функций ri, получим оптимальный силовой момент М = 0 для моментов времени, когда E(t) = сonst = Eadm (на участке между разгоном и торможением). Найдем производную ${{\dot {H}}_{0}}$ с учетом условия E(t) = сonst.

$\begin{gathered} {{{\dot {H}}}_{0}} = {{{\dot {\omega }}}_{1}}{{r}_{1}} + {{{\dot {\omega }}}_{2}}{{r}_{2}} + {{{\dot {\omega }}}_{3}}{{r}_{3}} + {{\omega }_{1}}{{{\dot {r}}}_{1}} + {{\omega }_{2}}{{{\dot {r}}}_{2}} + {{\omega }_{3}}{{{\dot {r}}}_{3}} = \\ = {{\omega }_{1}}({{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}}) + {{\omega }_{2}}({{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}}) + {{\omega }_{3}}({{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}) + \\ + \,{{r}_{1}}({{М}_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{3}}){\text{/}}{{J}_{1}} + {{r}_{2}}({{М}_{2}} + ({{J}_{3}}--{{J}_{1}}){{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + {{r}_{3}}({{М}_{3}} + ({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} = 0 \\ \end{gathered} $
так как на этапе разгона оптимальный момент М и вектор φ имеют одинаковое направление и на конец разгона ri = Jiωi/b. Покажем, что $r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}} = {\text{const}}$. Возьмем производную от левой части указанного равенства с учетом (2.1), (2.5).

$\begin{gathered} {{r}_{1}}{{{\dot {r}}}_{1}}{\text{/}}{{J}_{1}} + {{r}_{2}}{{{\dot {r}}}_{2}}{\text{/}}{{J}_{2}} + {{r}_{3}}{{{\dot {r}}}_{3}}{\text{/}}{{J}_{3}} = {{r}_{1}}({{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}}){\text{/}}{{J}_{1}} + {{r}_{2}}({{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}}){\text{/}}{{J}_{2}} + {{r}_{3}}({{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}){\text{/}}{{J}_{3}} = \\ = b{{r}_{1}}{{r}_{2}}{{r}_{3}}({{J}_{2}}--{{J}_{3}} + {{J}_{3}}--{{J}_{1}} + {{J}_{1}}--{{J}_{2}}){\text{/}}({{J}_{1}}{{J}_{2}}{{J}_{3}}) \equiv 0 \\ \end{gathered} $

Поскольку |r| ≠ 0 и H0 = сonst внутри отрезка времени, на котором E(t) = сonst = Eadm (так как ${{\dot {H}}_{0}}$ = 0), то b = сonst = $(1 + {{H}_{0}}){\text{/}}(r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}})$. Это означает, что в оптимальном развороте в интервале времени, когда E(t) = сonst = Eadm, будет |L| = const. Этот факт только подтверждает вывод об оптимальности значения М = 0 в моменты времени, когда E(t) = сonst. Вращение по инерции есть частный случай закономерности (2.5) с учетом уравнений (2.1). В момент достижения равенства E(t) = Eadm направления оптимального вектора φ и кинетического момента L совпадают, поэтому единственным решением системы (1.1), (2.1), (3.1) в интервале времени, когда E(t) = const, являются зависимости (2.4), (2.5), (3.4) в которых $\dot {a} = - 1$. Из свойства непрерывности функции a(t) следует, что a(t) = a(0) – t для любого момента времени t, пока a(t) ≥ 0. Как только a(t) < 0, так управление (2.3) становится оптимальным, потому что φ ≠ 0 и силовой момент (2.3) (а значит, и (3.3)) не нарушает требования (1.6), поскольку при таком управлении будет МL < 0 и $\dot {E} < 0$ (символ означает скалярное произведение векторов). Значит, решение (2.4), (2.5), (3.4), в котором a(t) = a(0) – t, справедливо для всего интервала времени t ∈ [0, T] (в оптимальном решении a(0) > 0, a(T) < 0).

Таким образом, в зависимости от значения “функционала пути” (3.5), вычисленного для движения в соответствии с уравнениями (2.1), (2.5), реализуется один из двух вариантов оптимального управления: если и0S ≤ 2Eadm, то оптимальным является релейное управление с одной точкой переключения, при котором ρ(Т) = –ρ(0), а если и0S > 2Eadm, то оптимальным является релейное управление с двумя точками переключения, при котором ρ(0) > –ρ(T). Рисунок 1 отражает второй вариант оптимального управления, при котором существует отрезок времени с E(t) = const (для выполнения условия S > 2Eadm/и0 для значения (3.5)); t1 – ближайший к началу разворота момент достижения равенства E(t) = Eadm; t2 – момент смены знака скалярной функции a(t) (начиная с момента времени t = t2 для функции a(t) выполняется условие a(t) < 0). Для значений t > t2 имеем ρ(t) < 0 и оптимальным является управление (2.3), потому что при таком силовом моменте будет Мω = $\dot {E}$ < 0 и ограничение (1.6) становится несущественным (его можно не учитывать при дальнейшем приближении к t = T). В интервалах времени t < t1 и t > t2 оптимальным управлением является (2.3), при котором, соответственно, будет |M| = const = u0/C. Здесь обозначено $С\, = \,\sqrt {p_{1}^{2}{\text{/}}{{J}_{1}}\, + \,p_{2}^{2}{\text{/}}{{J}_{2}}\, + \,p_{3}^{2}{\text{/}}{{J}_{3}}} $ = = const, pi = ri/r0, r0 = const = |r| ≠ 0.

Рис. 1.

Вид функций ρ(t) и E(t) при релейном управлении с двумя точками переключения

На участке вращения с максимально допустимой кинетической энергией оптимальный силовой момент М определяется из трех условий: ограничения (1.3), требования (3.6) и условия, что в каждый текущий момент времени t, пока E(t) = const = = Eadm, гамильтониан H0 принимает максимальное значение. Учитывая структуру гамильтониана (3.7), приходим к выводу, что во время вращения КА с постоянной максимально допустимой кинетической энергией оптимальным является такое управление М, при котором в каждый текущий момент времени t, пока E(t) = const = Eadm, угловая скорость ω удовлетворяет соотношениям (3.8). Требование (3.6) привело к структуре (3.7), при которой гамильтониан H0 не зависит явным образом от силового момента М. Справедливость утверждения, что движение с угловой скоростью (3.8) соответствует максимуму гамильтониана H0, легко доказать заменой переменных и записав

${{y}_{i}} = {{\omega }_{i}}\sqrt {{{J}_{i}}} ,\quad {{{{z}_{i}} = {{r}_{i}}} \mathord{\left/ {\vphantom {{{{z}_{i}} = {{r}_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }}{\text{,}}\quad {{H}_{0}} = {{y}_{1}}{{z}_{1}} + {{y}_{2}}{{z}_{2}} + {{y}_{3}}{{z}_{3}} - 1$
с учетом равенств ${{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}$ = 2Eadm, $y_{1}^{2} + y_{2}^{2} + y_{3}^{2}$ = 2Eadm для угловой скорости ω. Оптимальное значение момента М вычисляем путем подстановки оптимальных угловых скоростей (3.8) в динамические уравнения (1.1) с учетом зависимостей (2.1) для универсальных переменных ri и проверки выполнения условий (1.3), (3.6) (чтобы управляющий момент М находился внутри области допустимых значений). В результате получили М = 0. Очевидно, что найденное управление М удовлетворяет требованиям (1.3), (3.6).

Таким образом, структура оптимального управления полностью определена:

${\mathbf{M}}(t) = \left\{ \begin{gathered} \frac{{{{u}_{0}}{\text{sign}}\rho (t)}}{{\sqrt {{{r_{1}^{2}} \mathord{\left/ {\vphantom {{r_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{r_{2}^{2}} \mathord{\left/ {\vphantom {{r_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{r_{3}^{2}} \mathord{\left/ {\vphantom {{r_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}{\mathbf{r}},\quad {\text{если}}\quad E(t) < {{E}_{{{\text{adm}}}}}\quad {\text{или}}\quad \rho (t) < 0 \hfill \\ 0,\quad {\text{если}}\quad \rho (t) > 0\quad {\text{и}}\quad E(t) = {{E}_{{{\text{adm}}}}} \hfill \\ \end{gathered} \right.$

Заметим, что вращение по инерции полностью соответствует решению (2.5), (3.4) (угловые скорости (3.8) есть частный случай (2.5) и не противоречат соотношениям (3.4)). Поэтому найденное оптимальное решение (2.5), (3.4) справедливо на всем интервале управления t ∈ [0, T]. Краевая задача принципа максимума заключается в определении такого значения вектора r(0), при котором решение системы дифференциальных уравнений (1.1), (1.2), (2.1), (3.1) с одновременным выполнением условия (2.3), если φr < 0 или E(t) < Eadm, или М = 0, если φr > 0 и E(t) = Eadm, удовлетворяло условиям разворота (1.4), (1.5).

Если k0 = 0, то константа r0 определяется из уравнения H0(Т) = 0 (так как время окончания оптимального процесса не фиксировано). Вычислим H0(Т) с учетом зависимостей (3.4).

${{H}_{0}}\left( Т \right) = - 1 + \rho (T)( - {{u}_{0}}\sqrt {r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}} ) = - 1 - {{u}_{0}}\rho (T){{r}_{0}}C$
(угловые скорости в конечный момент t = T равны нулю); C = $\sqrt {p_{{10}}^{2}{\text{/}}{{J}_{1}}\, + \,p_{{20}}^{2}{\text{/}}{{J}_{2}}\, + \,p_{{30}}^{2}{\text{/}}{{J}_{3}}} $, где p10, p20, p30 – компоненты вектора p0 = p(0) (p = r/|r| – орт вектора r). Значение ρ(Т) оптимальной функции ρ(t) в конечный момент времени равно ρ(Т) = –1/(u0r0C). При любом типе оптимального управления (с одной или с двумя точками переключения) ρ(Т) = –τ (напомним, τ – длительность разгона и торможения). Поэтому r0 = 1/(u0τC). Отсюда оптимальное значение r0 равно r0 = ${1 \mathord{\left/ {\vphantom {1 {(C\sqrt {2{{E}_{{{\text{adm}}}}}} )}}} \right. \kern-0em} {(C\sqrt {2{{E}_{{{\text{adm}}}}}} )}}$, если присутствует участок вращения с постоянной максимально допустимой кинетической энергией Eadm (так как ρ(Т) = $ - {{{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } u}} \right. \kern-0em} u}}_{0}}$). Для оптимального управления с одной точкой переключения ρ(Т) = –Т/2 = $ - \sqrt {S{\text{/}}{{u}_{0}}} $ и поэтому r0 = ${1 \mathord{\left/ {\vphantom {1 {(C\sqrt {{{u}_{{\text{0}}}}S} )}}} \right. \kern-0em} {(C\sqrt {{{u}_{{\text{0}}}}S} )}}$. В результате

${{r}_{0}} = \max (1{\text{/}}\sqrt {{{u}_{0}}S} ,1{\text{/}}\sqrt {2{{E}_{{{\text{adm}}}}}} ){\text{/}}C$

Время оптимального разворота T рассчитывается на основании “функционала пути” (3.5). Поскольку оптимальное движение КА удовлетворяет уравнениям (2.1), (2.5), то значение S не зависит от характера изменения скалярной функции b(t) и является минимально возможным [20]. Если и0S > 2Eadm, то имеет место участок вращения КА с E(t) = const, и длительность оптимального разворота T вычисляется по формуле

$T = {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{adm}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{adm}}}}}} }} + {{{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } u}} \right. \kern-0em} u}}_{0}}$

При этом время разгона τ и длительность неуправляемого вращения tfree составляют

$\tau = {{{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } u}} \right. \kern-0em} u}}_{0}},\quad {{t}_{{{\text{free}}}}} = {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{adm}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{adm}}}}}} }} - {{{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } u}} \right. \kern-0em} u}}_{0}}$

Интервал времени, внутри которого E(t) = const, назовем участком номинального вращения. Для него характерно два свойства: во-первых, Enom = Emax и, во-вторых, КА вращается по инерции (силовой момент М = 0).

Если и0S ≤ 2Eadm, то в оптимальном движении не существует моментов времени, когда E(t) = const (tfree = 0), и длительность оптимального разворота равна T = $2\sqrt {S{\text{/}}{{u}_{0}}} $ = Tfast.

С учетом того, что уравнения (2.1), (2.5) удовлетворяются на всем интервале управления t ∈ [0, T], оптимальное движение определяют зависимости:

(3.9)
${{M}_{i}} = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{ac}}}--t} \right) + {\text{sign}}\left( {{{t}_{{br}}}--t} \right)} \right]{{p}_{i}}$
(3.10)
${{J}_{i}}{{\omega }_{i}} = 0.5{{m}_{0}}\left( {{{t}_{{{\text{ac}}}}} + {{t}_{{{\text{br}}}}}--\left| {t--{{t}_{{{\text{ac}}}}}} \right|--\,{\text{|}}t--{{t}_{{{\text{br}}}}}{\text{|}}} \right){{p}_{i}}$
где pi – компоненты вектора p, tac – время окончания разгона, tbr – момент начала торможения, m0 = u0/C и

${{t}_{{ac}}} = \min (\sqrt {S{\text{/}}{{u}_{0}}} ,{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}),\quad {{t}_{{br}}} = \max (\sqrt {S{\text{/}}{{u}_{0}}} ,{S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{adm}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{adm}}}}}} }}),\quad {\mathbf{p}} = \tilde {\Lambda } \circ {{\Lambda }_{{{\text{in}}}}} \circ {{p}_{0}} \circ {{\tilde {\Lambda }}_{{{\text{in}}}}} \circ \Lambda $

Закон вращения (3.10) удовлетворяет граничным условиям ω(0) = 0 и ω(T) = 0, так как tac + tbr = Т, и выражение в скобках обнуляется при t = 0 и t = Т. Зависимости (2.1), (3.9), (3.10) с учетом равенств ri = r0рi – единственное решение задачи оптимального управления (1.1)–(1.7). Из (2.1), (3.9) и соотношений ri = r0рi явно видно, что при оптимальном управлении момент сил М действует вдоль прямой, неподвижной в инерциальной системе координат. Уравнения (3.10) отчетливо показывают, что в геометрическом представлении вектор р интерпретируется как орт оптимального кинетического момента КА L в связанной с КА системе координат. Оптимальным (в смысле минимума времени Т) будет разворот КА, при котором направление кинетического момента остается неизменным относительно инерциальной системы координат (векторы М и L коллинеарны). Еще одним основным свойством оптимального разворота КА является тот факт, что во все время движения (на всем отрезке времени [0, T]) отношение кинетической энергии вращения Е к квадрату модуля кинетического момента КА постоянно.

$Е{\text{/}}{{\left| {\mathbf{L}} \right|}^{2}} = 0.5({{r_{1}^{2}} \mathord{\left/ {\vphantom {{r_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{r_{2}^{2}} \mathord{\left/ {\vphantom {{r_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{r_{3}^{2}} \mathord{\left/ {\vphantom {{r_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}})/{\text{|}}{\mathbf{r}}{{{\text{|}}}^{2}} = {\text{const}} = ({{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}){\text{/}}2$

Для вращений в соответствии с (2.1), (2.5) значение «функционала пути» (3.5) минимально.

4. Решение задачи оптимального разворота, если k0 0. В общем случае k0 ≠ 0, и уравнения для сопряженных функций φ i имеют вид (2.2). Свойства оптимального решения и оптимальных функций φi(t), ωi(t), удовлетворяющих системе уравнений (1.1), (2.1)–(2.3), будут отличаться от случая максимально быстрого разворота в условиях ограниченности управляющего момента М и угловой скорости ω, соответствующих неравенствам (1.3) и (1.6).

В случае ω(0) = ω(Т) = 0 решение (2.4), (2.5) удовлетворяет необходимым условиям оптимальности (системе (1.1), (2.1), (2.2) с учетом максимизации гамильтониана H). Возможны четыре варианта изменения оптимальной функции а(t), которые приведены на рис. 2, где обозначено: t1 – момент достижения максимально допустимой энергии вращения, t2 – момент времени, начиная с которого a(t) < 0, t0 – момент начала особого режима управления, при котором φ(t) = const = 0. Левые два графика соответствуют релейному управлению с двумя точками переключения, при котором существует интервал вращения КА с постоянной кинетической энергией; верхний левый график соответствует случаю, когда $\dot {a}$(t2) ≠ 0, Eadm < 1/(2k0) и $\dot {\varphi }$ ≠ 0 на всем интервале движения t ∈ [0, T], при этом $\dot {a}$(t1) = $\dot {a}$(t2) ≠ 0; нижний левый график соответствует случаю, когда в оптимальном движении присутствует особый режим управления и на отрезке времени [t0, t2 ] наблюдается $\dot {\varphi } = $ 0, E(t) = сonst = 1/(2k0), $\dot {a}$(t0) = $\dot {a}$(t2) = 0. Правые два графика соответствуют релейному управлению с одной точкой переключения в момент времени t = T/2, причем верхний правый график соответствует случаю, когда Emax < 1/(2k0) и не существует момента времени, в который $\dot {a}(t) = 0$, а нижний правый график соответствует случаю, когда Emax = 1/(2k0) и $\dot {a}$(T/2) = 0. Заметим, что для вариантов управления, соответствующих верхним двум графикам, $\dot {a}$(T/2) < 0 и Emax = = E(T/2) < 1/(2k0); для вариантов управления, соответствующих нижним двум графикам, $\dot {a}(T{\text{/}}2) = 0$ и Emax = E(T/2) = 1/(2k0). В случае релейного управления с одной точкой переключения возможна ситуация, когда максимальная энергия вращения E(T/2) = = Emax$\min ({{E}_{{{\text{adm}}}}};1{\text{/}}(2{{k}_{0}}))$. Для управления с двумя точками переключения, в котором присутствует участок вращения КА с постоянной кинетической энергией, всегда будет Emax = E(T/2) = $\min ({{E}_{{{\text{adm}}}}};\;1{\text{/}}(2{{k}_{0}}))$.

Рис. 2.

Возможное изменение оптимальной функции a(t) в случае k0 ≠ 0

Начиная с момента t = 0 будет r0b(t) = m0t, а значит, $\dot {a}$ = 2k0m0t/r0 – 1 и a(t) = = ${{k}_{0}}{{m}_{0}}{{t}^{2}}{\text{/}}{{r}_{0}}--t + {{C}_{1}}$ (C1 = const)

Приближаясь к моменту времени t = T будет r0b(t) = m0(Т t) и $\dot {a}$ = 2k0m0(Тt)/r0 – 1

$а\left( t \right) = (2{{k}_{0}}{{m}_{0}}T{\text{/}}{{r}_{0}}--{\text{ }}1)t--{{k}_{0}}{{m}_{0}}{{t}^{2}}{\text{/}}{{r}_{0}} + {{C}_{2}}$
где C2 = const.

Если b(t) ≠ const, то ${\text{sign}}\ddot {a} = {\text{sign}}a(t)$ (так как ${\text{sign}}\dot {b} = {\text{sign}}a(t)$). Если b(t) = const, то $\ddot {a} = 0$. Нетрудно показать, что а(t) = 0, если $\dot {a}$ = 0 (в противном случае направление силового момента M не меняется, и КА будет вращаться с неуменьшающейся кинетической энергией, из-за чего краевое условие ω(T) = 0 не сможет быть удовлетворено). Значения констант C1, C2 и r0 существенно зависят от типа управления. Чтобы были точки переключения необходимо выполнение условия b(t) ≤ 1/(2k0) (так как при любом типе управления должно быть $\dot {a}$ ≤ 0).

Ситуация, когда $\dot {a}$ ≥ 0 и а > 0, невозможна (в противном случае КА станет вращаться бесконечно и краевое условие ω(T) = 0 будет нарушено). Если $\dot {b}$ ≠ 0 и а ≠ 0, то ${\text{sign}}\ddot {a} = {\text{sign}}a(t)$. Из соотношения $\dot {a}$ = 2k0b – 1 следует $\ddot {a} = 2{{k}_{0}}\dot {b}$ и ${\text{sign}}\ddot {a} = {\text{sign}}\dot {b}$, Mr имеет тот же знак, что и а(t); ${\text{sign}}\dot {b} = $ sign(Mr). Гипотетически предположим, что в какой-то момент времени t+ будет а(t+) > 0 и $\dot {a}$(t+) ≥ 0. Тогда в любой момент времени t ≥ t+ будет а(t) > 0 (так как при сделанном предположении $\ddot {a}$ ≥ 0, поскольку ${\text{sign}}\ddot {a} = {\text{sign}}a(t)$), а при такой функции а(t) КА раскрутится до E = Eadm, вращаясь бесконечно, и краевое условие ω(T) = 0 не сможет быть удовлетворено. Допустим, что в оптимальном управлении существует момент времени, когда $\dot {a}$ = 0. В этом случае в тот же самый момент времени должно быть а = 0 (иначе функция а(t) не сменит знак и КА будет вращаться до бесконечности, нарушив требование ω(T) = 0). У оптимальной функции а(t) должно быть $\dot {a}$ < 0, если а ≠ 0. В итоге выяснили, что в оптимальном движении, удовлетворяющем условиям разворота (1.4), (1.5), во-первых, невозможна ситуация, когда а ≠ 0 и $\dot {a}$ = 0, во-вторых, не существует ни одного момента времени, в который $\dot {a}$ > 0. Всегда $\dot {a}$(t) ≤ 0; причем если $\dot {a}$ = 0, то а = 0. В-третьих, а(0) > 0. Вариант а(0) ≤ 0 не рассматривается, так как $\dot {a}$(0) = –1, b(0) = 0, и поэтому в этом случае $\ddot {a}$ ≤ 0 и а < 0 при любом t > 0, а значит КА будет вращаться бесконечно, если а(0) ≤ 0, и условие ω(T) = 0 окажется нарушенным (а такое движение не может быть оптимальным, поскольку не удовлетворяет условиям задачи разворота).

Рассмотрим интервалы времени, на которых E(t) < Eadm (несомненно участки разгона и торможения удовлетворяют этому условию). Внутри этих интервалов времени ограничение (1.6) не учитывается и оптимальное управление находится без учета ограничений на фазовые переменные (максимум гамильтониана ищется внутри области, описываемой неравенством (1.3)). Если а(t) ≠ const = 0, то оптимальным по критерию (1.7) управлением является (2.3). Если φ(t) = const = 0, то гамильтониан H не зависит явным образом от управления и имеет место особый режим управления, а сопряженная система уравнений (2.2) преобразуется к виду:

(4.1)
${{J}_{i}}{{\omega }_{i}} = {{r}_{i}}{\text{/}}(2{{k}_{0}})$

Уравнения (4.1) с учетом уравнений (2.1) для универсальных переменных ri демонстрируют постоянство вектора кинетического момента КА относительно инерциальной системы координат во время особого режима управления, а подстановка (4.1) в динамические уравнения (1.1) определит оптимальный управляющий момент М = 0 в особом режиме управления.

На временах t > t2 имеем a(t) < 0 и оптимальным является управление (2.3). Как только a(t) < 0, так управление (2.3) становится оптимальным, потому что при таком силовом моменте M будет Mω = $\dot {E}$ < 0 и ограничение (1.6) оказывается несущественным (его не надо учитывать). Задача (1.1)–(1.7) – задача оптимального управления с закрепленным левым и правым концами траектории и нефиксированным временем окончания маневра. Поэтому необходимым условием оптимальности является равенство H(T) = 0. Найдем значение гамильтониана H в конечный момент времени t = T с учетом оптимального решения (2.4), (2.5).

$H(T) = --1--{{u}_{0}}a(T)\sqrt {r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}} = --1--{{u}_{0}}{{r}_{0}}a(T)C$
(так как по условиям задачи оптимального разворота ωi(T) = 0). Отсюда a(Т) = –1/(u0r0C) < < 0; значение a(Т) не зависит от k0.

Если есть участок с особым режимом управления, то в момент времени t = t2 должно быть $\dot {a}$ = 0. Оптимальная функция b(t) удовлетворяет неравенству 2k0b(t) – 1 ≤ 0 (так как оптимальная функция a(t) должна удовлетворять условию $\dot {a}$ ≤ 0, причем $\dot {a}$ = 0 только в случае a = 0). Поэтому bmax = 1/(2k0) (bmax – максимальное значение функции b(t)). На участке торможения (когда tt2) будет b = m0(Tt)/r0, $\dot {a}$ = 2k0m0(Tt)/r0 – 1, $\ddot {a}$ = –2k0m0/r0 и a(t) = –k0m0(tt2)2/r0 < 0, если tt2. В конечный момент времени t = T должно быть a(Т) = –1/(u0r0C) < 0 и $\dot {a}$(Т) = –1 (так как b(Т) = 0); значит k0m0(Tt2)2/r0 = = 1/(u0r0C) и $\dot {a}$(t2) = 2k0m0(Tt2)/r0 – 1 = 0, откуда u02(Tt2)2 = 1/k0 = 2Enom и r0 = = 2k0u0(Tt2)/C (напомним, Enom – кинетическая энергия вращения по инерции, когда М = 0). Время остановки вращения τ = Tt2 = ${{\sqrt {1{\text{/}}{{k}_{0}}} } \mathord{\left/ {\vphantom {{\sqrt {1{\text{/}}{{k}_{0}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$; a(Т) = $ - {1 \mathord{\left/ {\vphantom {1 {(2{{u}_{0}}\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2{{u}_{0}}\sqrt {{{k}_{0}}} )}}$ и r0 = = ${{2\sqrt {{{k}_{{\text{0}}}}} } \mathord{\left/ {\vphantom {{2\sqrt {{{k}_{{\text{0}}}}} } C}} \right. \kern-0em} C}$. В начальный момент времени t = 0 будет $\ddot {a}(0)$ = 2k0m0/r0 и поэтому a(t) = = k0m0(tt0)2/r0 > 0, если tt0; t0 = ${{{{\sqrt {2{{E}_{{{\text{nom}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{nom}}}}}} } u}} \right. \kern-0em} u}}_{0}}$ = ${{\sqrt {1{\text{/}}{{k}_{0}}} } \mathord{\left/ {\vphantom {{\sqrt {1{\text{/}}{{k}_{0}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$. Соответственно, a(0) = = ${1 \mathord{\left/ {\vphantom {1 {(2{{u}_{0}}\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2{{u}_{0}}\sqrt {{{k}_{0}}} )}}$ = –a(Т). В случае наличия участка с особым режимом управления bmax = = 1/(2k0), так как максимальное значение производной $\dot {a}$ равно нулю, а максимальная энергия вращения равна Emax = Enom = 1/(2k0).

Если Eadm < 1/(2k0), то bmax = Eadm. Рассмотрим вариант, когда 2k0Eadm < 1. В этом случае ограничителем кинетической энергии вращения будет (1.6). В оптимальном движении будет три фазы – разгон КА до достижения условия E(t) = Eadm, вращение с постоянной кинетической энергией E(t) = const = Eadm, и, наконец, гашение кинетической энергии до полной остановки КА, когда ω = 0. На участках разгона и торможения φ ≠ 0 и E(t) < Eadm, поэтому оптимальным моментом М является (2.3), а оптимальное движение удовлетворяет системе уравнений (1.1), (2.1)–(2.5), причем $\dot {a}$ = 2k0b(t) – 1 (указанное уравнение получаем, подставив выражения ${{\dot {\varphi }}_{i}} = \dot {a}{{r}_{i}} + a{{\dot {r}}_{i}}$ в систему (2.2) с учетом зависимостей (2.1), (2.4), (2.5)). Получили

(4.2)
${{M}_{i}} = \frac{{{{u}_{0}}{{p}_{i}}{\text{sign}}a(t)}}{{\sqrt {{{p_{1}^{2}} \mathord{\left/ {\vphantom {{p_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }},\quad {{M}_{i}} = \pm \frac{{{{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}} }}$
(знак + соответствует раскрутке КА, знак – соответствует остановке вращения). После дифференцирования вторых равенств (4.2) с учетом (1.1) получим

(4.3)
${{\dot {M}}_{1}} = {{\omega }_{3}}{{M}_{2}} - {{\omega }_{2}}{{M}_{3}},\quad {{\dot {M}}_{2}} = {{\omega }_{1}}{{M}_{3}} - {{\omega }_{3}}{{M}_{1}},\quad {{\dot {M}}_{3}} = {{\omega }_{2}}{{M}_{1}} - {{\omega }_{1}}{{M}_{2}},\quad {\mathbf{\dot {M}}} = - {\mathbf{\omega }} \times {\mathbf{M}}$

Из (4.3) следует, что |M| = const, если E(t) < Eadm и a(t) ≠ 0 (т.е. на участках разгона и торможения), а значит ${{p_{1}^{2}} \mathord{\left/ {\vphantom {{p_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}$ = const = С2.

Из уравнений (1.1), (2.5) имеем $\dot {b} = {\mathbf{M}} \cdot {\mathbf{r}}{\text{/}}r_{0}^{2}$. Поскольку на этапах разгона и торможения |M| = const, то и $\dot {b} = {\text{const }}$ в моменты времени, когда a(t) ≠ 0 и E(t) < Eadm. На этапе разгона $\dot {b}$ > 0 и b = m0t/r0; на этапе торможения $\dot {b}$ < 0 и b = m0(Tt)/r0; между разгоном и торможением E(t) = const = Eadm и $\dot {b}$ = 0 (b = const) и поэтому $\dot {a}$ = const (причем $\dot {a}$ ≤ 0). При любом оптимальном движении $\dot {a}$(t) ≤ 0 (в противном случае a(t) > 0 в любой момент времени t, направление силового момента M не меняется, и КА будет вращаться с ненулевой кинетической энергией, из-за чего краевое условие ω(T) = 0 не будет выполнено). Возможны следующие варианты изменения оптимальной функции a(t). В первом варианте $\dot {a}$(T/2) ≠ 0, $\dot {a}(t) \ne {\text{const}}$ для любого t и Emax < 1/(2k0), Emax ≤ ≤ Eadm. Во втором варианте $\dot {a}$(T/2) = 0, $\dot {a}(t) \ne {\text{const}}$ для любого t и Emax = 1/(2k0), Emax ≤ ≤ Eadm. В третьем варианте $\dot {a}$(T/2) ≠ 0, $\dot {a}$ < 0 для любого t, но существует участок линейного изменения функции a(t), когда $\dot {a}(t) = {\text{const}} \ne {\text{0}}$, и Emax = Eadm < 1/(2k0). Наконец, возможен вариант оптимального разворота с участком особого режима управления, во время которого $\dot {a}$ = const = 0, a(t) = const = 0 (и поэтому на участке с особым режимом управления M = 0), Emax = 1/(2k0) и EmaxEadm. Указанные варианты поведения оптимальной функции a(t) приведены на рис. 2, где t1 – момент начала выполнения условия E(t) = сonst = Eadm; t2 – момент, начиная с которого функция a(t) < 0 (t ∈ [t1, t2] – участок с постоянной максимально допустимой энергией вращения Eadm); t0 – начало участка с особым режимом управления, когда φ = сonst = 0 (t ∈ [t0, t2] – участок с особым режимом управления). Для оптимального движения с особым режимом управления r0 = ${{2\sqrt {{{k}_{{\text{0}}}}} } \mathord{\left/ {\vphantom {{2\sqrt {{{k}_{{\text{0}}}}} } C}} \right. \kern-0em} C}$ и функция а(t) имеет аналитический вид

$a(t) = \left\{ \begin{gathered} 2{{k}_{0}}{{u}_{0}}{{(t--{{t}_{0}})}^{2}}{\text{/}}({{r}_{0}}C)\quad {\text{для}}\quad t < {{t}_{0}} \hfill \\ 0,\quad {\text{если}}\quad {{t}_{0}} \leqslant t \leqslant {{t}_{2}} \hfill \\ ~--2{{k}_{0}}{{u}_{0}}{{(t--{{t}_{2}})}^{2}}{\text{/}}({{r}_{0}}C)\quad {\text{для}}\quad t > {{t}_{2}} \hfill \\ \end{gathered} \right.$

С учетом равенств а (0) = k0m0$t_{0}^{2}$/r0 и а (T) = –k0m0(Tt2)2/r0 получаем

$Н\left( 0 \right) = {{\varphi }_{1}}{{M}_{1}} + {{\varphi }_{2}}{{M}_{2}} + {{\varphi }_{3}}{{M}_{3}}--1 = {{k}_{0}}u_{0}^{2}t_{0}^{2}--1 = 0$
$Н(T) = {{\varphi }_{1}}{{M}_{1}} + {{\varphi }_{2}}{{M}_{2}} + {{\varphi }_{3}}{{M}_{3}}--1 = {{k}_{0}}u_{0}^{2}{{(T--{{t}_{2}})}^{2}}--1 = 0$
откуда t0 = $\sqrt {1{\text{/}}{{k}_{0}}} {\text{/}}{{u}_{0}}$ и t2 = $S\sqrt {{{k}_{0}}} $ (так как u0t0t2 = S); время оптимального разворота T = = $S\sqrt {{{k}_{0}}} $ + $\sqrt {1{\text{/}}{{k}_{0}}} {\text{/}}{{u}_{0}}$. Энергия вращения на участке с особым режимом управления Е = = 1/(2k0). Заметим, что вращение по инерции полностью соответствует решению (2.4), (2.5) (это частный случай (2.5), когда b(t) = const, и не противоречит соотношениям (2.4)). Поэтому найденное оптимальное решение (2.4), (2.5) справедливо на всем интервале управления t ∈ [0, T].

Если 2Eadm ≥ 1/k0, то ограничение (1.6) несущественно. Если k0и0S ≤ 1, то оптимальным является релейное управление с одной точкой переключения, |М| = const ≠ 0 (особый режим управления невозможен). При любых значениях k0, Eadm, u0, S оптимальное управление описывается зависимостями (3.9), (3.10), в которых окончание разгона tac и начало торможения tbr равны

$\begin{gathered} {{t}_{{ac}}} = \min (\sqrt {S{\text{/}}{{u}_{0}}} ,{{\sqrt {2{{E}_{{{\text{nom}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{nom}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}),\quad {{t}_{{br}}} = \max (\sqrt {S{\text{/}}{{u}_{0}}} ,{S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }}), \\ {{E}_{{nom}}} = \min (1{\text{/}}(2{{k}_{0}});{{E}_{{{\text{adm}}}}}) \\ \end{gathered} $
максимальная кинетическая энергия Emax = $\mathop {\max }\limits_{0 < t < T} E(t)$ = $\min ({{u}_{0}}S{\text{/}}2;1{\text{/}}(2{{k}_{0}});{{E}_{{{\text{adm}}}}})$. (Enom – кинетическая энергия между разгоном и торможением, когда $\dot {a}$(t) = сonst и КА вращается по инерции). Для оптимальной функции a(t) выполняются следующие соотношения:

$\begin{gathered} \dot {a}(0) = \dot {a}(T) = --1,\quad a({{t}_{2}}) = 0,\quad a(Т) = --1{\text{/}}\left( {{{u}_{0}}{{r}_{0}}C} \right)~ \\ \ddot {a} = 2{{k}_{0}}{{u}_{0}}{\text{/}}({{r}_{0}}C);~\quad \ddot {a} = --2{{k}_{0}}{{u}_{0}}{\text{/}}({{r}_{0}}C) \\ \end{gathered} $
(значение a(Т) найдено из необходимого условия оптимальности H(Т ) = 0 с учетом ωi(Т) = 0).

Если Eadm ≥ 1/(2k0), то может существовать особый режим управления, при котором $\dot {a}$ = const = 0. Если оптимальным является управление с двумя точками переключения, когда между разгоном и торможением E(t) = const = Eadm и $\dot {a}$ = const < 0, то временные характеристики t1, t2, T таковы: ${{t}_{1}} = {{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$, ${{t}_{2}} = {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{adm}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{adm}}}}}} }}$; время разворота T = t1 + t2.

Если Eadm < 1/(2k0), то ${{r}_{0}} = {{(1 + 2{{k}_{0}}{{E}_{{{\text{adm}}}}})} \mathord{\left/ {\vphantom {{(1 + 2{{k}_{0}}{{E}_{{{\text{adm}}}}})} {(C\sqrt {2{{E}_{{{\text{adm}}}}}} )}}} \right. \kern-0em} {(C\sqrt {2{{E}_{{{\text{adm}}}}}} )}}$; a(Т) = –${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {({{u}_{0}}(1\, + \,2{{k}_{0}}{{E}_{{{\text{adm}}}}}))}}} \right. \kern-0em} {({{u}_{0}}(1\, + \,2{{k}_{0}}{{E}_{{{\text{adm}}}}}))}}$ < 0

$a(0) = \dot {a}({{t}_{2}})({{t}_{1}}--{{t}_{2}}) + 1{\text{/}}\left( {{{u}_{0}}{{r}_{0}}C} \right),\quad \dot {a}({{t}_{2}}) = \dot {a}({{t}_{1}}) = 4{{k}_{0}}{{E}_{{adm}}}{\text{/}}(1 + 2{{k}_{0}}{{E}_{{adm}}})--1 \leqslant 0$ $\ddot {a}(0) = 2{{k}_{0}}{{u}_{0}}{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {(1 + 2{{k}_{0}}}}} \right. \kern-0em} {(1 + 2{{k}_{0}}}}{{E}_{{{\text{adm}}}}}),\quad \ddot {a}(T) = - 2{{k}_{0}}{{u}_{0}}{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {(1 + 2{{k}_{0}}}}} \right. \kern-0em} {(1 + 2{{k}_{0}}}}{{E}_{{{\text{adm}}}}})$
$\begin{gathered} {{a(0) = (4{{k}_{0}}{{E}_{{adm}}}{\text{/}}(1 + 2{{k}_{0}}{{E}_{{adm}}})--1)(\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{a(0) = (4{{k}_{0}}{{E}_{{adm}}}{\text{/}}(1 + 2{{k}_{0}}{{E}_{{adm}}})--1)(\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}} - {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{adm}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{adm}}}}}} }}) + \\ + {{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {({{u}_{0}}(1 + 2{{k}_{0}}}}} \right. \kern-0em} {({{u}_{0}}(1 + 2{{k}_{0}}}}{{E}_{{{\text{adm}}}}})) > 0 \\ \end{gathered} $
(так как a(0) – a(t1) = –a(Т); время свободного вращения tfree = tbrtac = ${S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{adm}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{adm}}}}}} }}$ – ‒ ${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$).

В момент t = t2, когда скалярная функция a(t) меняет знак, имеем: |L| = ${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } C}} \right. \kern-0em} C}$, b = ${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}$, a(t2) = 0; $\dot {a}$(t2) = $2{{k}_{0}}{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}$ – 1 < 0; $\ddot {a}({{t}_{2}})$ = $\ddot {a}(T)$ = –2k0u0/(r0C) < 0 (для t < t2 будет $\ddot {a}(t) \geqslant 0$). Производная $\dot {a}(t)$ для моментов времени tt2 будет следующей: $\dot {a}(t)$ = ${{2{{k}_{0}}({{u}_{0}}{{t}_{2}} + \sqrt {2{{E}_{{{\text{adm}}}}}} )} \mathord{\left/ {\vphantom {{2{{k}_{0}}({{u}_{0}}{{t}_{2}} + \sqrt {2{{E}_{{{\text{adm}}}}}} )} {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}$ – 2k0u0t/(r0C) – 1; $\dot {a}$(t2) = $\dot {a}$(t1) = 4k0Eadm/(1 + + 2k0Eadm ) – 1 ≤ 0. Значит, a(t) = (${{2{{k}_{0}}({{u}_{0}}{{t}_{2}} + \sqrt {2{{E}_{{{\text{adm}}}}}} )} \mathord{\left/ {\vphantom {{2{{k}_{0}}({{u}_{0}}{{t}_{2}} + \sqrt {2{{E}_{{{\text{adm}}}}}} )} {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}$ – 1)tk0u0t2/(r0C) + t2(1 – ‒ k0(2$\sqrt {2{{E}_{{{\text{adm}}}}}} $ + u0t2)/(r0C)), если t > t2. Таким образом, получили a(t) = = ($2{{k}_{0}}{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}$ – 1)(tt2) – k0u0(tt2)2/(r0C). Следовательно, a(Т) = = 2k0Eadm/(u0r0C) – ${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ (так как Tt2 = t1 = ${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$). Из необходимого условия оптимальности H(T) = 0 нашли a(Т) = –1/(u0r0C). Получили уравнение ${{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ – – 2k0Eadm/(u0r0C) = 1/(u0r0C), из которого ${{r}_{0}} = {{(1 + 2{{k}_{0}}{{E}_{{{\text{adm}}}}})} \mathord{\left/ {\vphantom {{(1 + 2{{k}_{0}}{{E}_{{{\text{adm}}}}})} {(C\sqrt {2{{E}_{{{\text{adm}}}}}} )}}} \right. \kern-0em} {(C\sqrt {2{{E}_{{{\text{adm}}}}}} )}}$.

Если Eadm = 1/(2k0), то $\dot {a}$(t2) = 0. С другой стороны

$\dot {a}({{t}_{2}}) = 2{{k}_{0}}{{\sqrt {2{{E}_{{{\text{adm}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{adm}}}}}} } {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}--1 = 2{{k}_{0}}{{\sqrt {1{\text{/}}{{k}_{0}}} } \mathord{\left/ {\vphantom {{\sqrt {1{\text{/}}{{k}_{0}}} } {({{r}_{0}}C)}}} \right. \kern-0em} {({{r}_{0}}C)}}~--1 = 0.{\text{ }}\,\,{\text{Откуда}}\quad {{r}_{0}} = 2{{\sqrt {{{k}_{0}}} } \mathord{\left/ {\vphantom {{\sqrt {{{k}_{0}}} } C}} \right. \kern-0em} C}$

Напомним, что в случае оптимального управления с одной точкой переключения ${{r}_{0}} = {1 \mathord{\left/ {\vphantom {1 {(C\sqrt {{{u}_{0}}S} )}}} \right. \kern-0em} {(C\sqrt {{{u}_{0}}S} )}}$ и Emax = и0S/2 (такой режим является оптимальным, если и0S ≤ 2Enom).

Вычислим значение показателя (1.7) при оптимальном управлении. Если ${{u}_{0}}S > \min (2{{E}_{{{\text{adm}}}}};1{\text{/}}{{k}_{0}})$, то $G = (1 + 2{{k}_{0}}{{E}_{{\max }}}){S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{max}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{max}}}}}} }}$ + $(1 - 2{{k}_{0}}{{E}_{{\max }}}{\text{/}}3){{{{\sqrt {2{{E}_{{{\text{max}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{max}}}}}} } u}} \right. \kern-0em} u}}_{0}}$, где Emax = $\min (1{\text{/}}(2{{k}_{0}})$; Eadm). Если ${{u}_{0}}S \leqslant \min (2{{E}_{{{\text{adm}}}}};1{\text{/}}{{k}_{0}})$, то $G = {{k}_{0}}u_{0}^{2}{{T}^{3}}{\text{/}}6 + T$, где T = = $2\sqrt {S{\text{/}}{{u}_{0}}} $.

Оптимальным значением максимальной энергии вращения Emax является такое значение Emax, при котором величина (1.7) минимальна. Минимум функции G(Emax) ищется на отрезке [0, Eadm]. Если Eadm ≥ 1/(2k0), то Emax = 1/(2k0) и особый режим управления может существовать. Если Eadm < 1/(2k0), то минимум функции G(Emax) находится на правом конце отрезка [0, Eadm], т.е. Emax = Eadm и особый режим управления невозможен (но возможен участок движения с постоянной кинетической энергией вращения E(t) = const = Eadm). Если ${{u}_{0}}S \leqslant \min (2{{E}_{{{\text{adm}}}}};1{\text{/}}{{k}_{0}})$, то отсутствует отрезок времени, внутри которого E(t) = const, и М ≠ 0 на всем интервале управления [0, T] (вращение КА происходит с максимально возможным по модулю силовым моментом в течение всего разворота из положения Λ(0) = Λin в положение Λ(Т) = Λf). Наличие интегрального члена в минимизируемом функционале (1.7) равносильно введению дополнительного ограничения ${{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}$ ≤ 1/k0 в условия задачи оптимального разворота. Таким образом, найденное решение (3.9), (3.10) соответствует задаче максимального быстродействия при наличии ограничений (1.3) и ${{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2} \leqslant 2{{E}_{{{\text{lim}}}}}$, где Еlim = min(1/(2k0), Eadm) – уровень, ограничивающий максимально возможную кинетическую энергию вращения КА во время разворота из положения (1.4) в положение (1.5). Если 2Eadm ≥ 1/k0, то ограничение (1.6) становится несущественным, поскольку минимизация показателя качества (1.7) ограничивает сверху кинетическую энергию вращения КА величиной 1/(2k0) (при оптимальном по критерию минимума (1.7) движении энергия вращения E(t) не может быть больше 1/(2k0)).

5. Обоснование единственности оптимального решения. Покажем, что найденное решение (2.4), (2.5) – единственное решение системы уравнений (1.1), (2.1)–(2.3). Введем единичный вектор q для вектора φ, такой, что q(0) ⋅ φ(0) > 0 и φ = χq, где χ – скалярная функция c начальным значением χ(0) > 0 (|q| = 1). Тогда оптимальный момент М равен

${\mathbf{M}} = \frac{{{{u}_{0}}{\text{sign}}\chi }}{{\sqrt {{{q_{1}^{2}} \mathord{\left/ {\vphantom {{q_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{q_{2}^{2}} \mathord{\left/ {\vphantom {{q_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{q_{3}^{2}} \mathord{\left/ {\vphantom {{q_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}{\mathbf{q}}$

Так как χ(0) > 0, то в окрестности точки t = 0 имеем М = hq и М $||$ L, L = Kq, где h – скалярная величина (на участке разгона h > 0; на участке торможения h < 0); L = JSCω – кинетический момент КА; JSC = diag{J1, J2, J3} – тензор инерции КА. Подставим формулы (2.3) с учетом зависимости φ = χ(t)q в уравнения (1.1) при наличии равенств Jiωi = Kqi:

(5.1)
$\dot {K}{\mathbf{q}} + K{\mathbf{\dot {q}}} + {\mathbf{\omega }} \times {\mathbf{q}}K = h{\mathbf{q}}$

Сумма $K{\mathbf{\dot {q}}} + {\mathbf{\omega }} \times {\mathbf{q}}K$ ортогональна орту q или равна нулю (всегда q${\mathbf{\dot {q}}}$ = 0, так как |q| = 1). Поэтому уравнение (5.1) выполняется в единственном случае, если $\dot {K} = h$ и ${\mathbf{\dot {q}}} = - {\mathbf{\omega }} \times {\mathbf{q}}$ (т.е. когда вектор q остается неизменным относительно инерциального базиса I). Теперь подставим равенства φi = χqi и ωi = Kqi/Ji в уравнения (2.2), которые запишем в виде

(5.2)
${\mathbf{\dot {\varphi }}} = 2{{k}_{0}}({{J}_{{{\text{SC}}}}}{\mathbf{\omega }}) + ({{J}_{{{\text{SC}}}}}{\mathbf{\omega }}) \times (J_{{{\text{SC}}}}^{{ - 1}}{\mathbf{\varphi }}) - {{J}_{{{\text{SC}}}}}({\mathbf{\omega }} \times (J_{{{\text{SC}}}}^{{ - 1}}{\mathbf{\varphi }})) - {\mathbf{r}}$

Левая часть уравнения (5.2) для вектора сопряженных переменных равна

$\dot {\chi }{\mathbf{q}} + \chi {\mathbf{\dot {q}}} = \dot {\chi }{\mathbf{q}}--\chi {\mathbf{\omega }} \times {\mathbf{q}}$
(уравнения (1.1), (2.2) должны выполняться одновременно, поэтому свойство ${\mathbf{\dot {q}}} = - {\mathbf{\omega }} \times {\mathbf{q}}$ взято из (5.1)). Правая часть уравнения (5.2) будет такой:

$\begin{gathered} 2{{k}_{0}}K{\mathbf{q}} + K{\mathbf{q}} \times (J_{{SC}}^{{ - 1}}\chi {\mathbf{q}})--\chi {{J}_{{{\text{SC}}}}}((J_{{SC}}^{{ - 1}}K{\mathbf{q}}) \times (J_{{SC}}^{{ - 1}}{\mathbf{q}}))--{\mathbf{r}} = \\ = 2{{k}_{0}}K{\mathbf{q}}--\chi (KJ_{{SC}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}}--{\mathbf{r}} = 2{{k}_{0}}K{\mathbf{q}}--\chi {\mathbf{\omega }} \times {\mathbf{q}}--{\mathbf{r}} \\ \end{gathered} $

Приравняв левую и правую части уравнения (5.2), получаем уравнение для вектора q:

$\dot {\chi }{\mathbf{q}} = 2{{k}_{0}}K{\mathbf{q}} - {\mathbf{r}}$

Отсюда следует необходимое условие оптимальности r0p = (2k0K$\dot {\chi }$)q, из которого неизбежны равенства (2.4), в которых а(0) > 0, так как $\dot {a}$(0) = –1, причем 2k0K$\dot {\chi }$ = = const и q = p, откуда имеем следующие соотношения: $\dot {\chi }$ = 2k0Kr0, χ(t) = r0а(t), K = = |L| = r0b(t), где r0 = const = |r(0)| (так как χ(0) > 0 и χ(T) < 0, а потому $\dot {\chi }$ < 0). В итоге, если в какой-нибудь момент времени t кинетический момент L и вектор φ коллинеарны, то они коллинеарны на всем интервале времени 0 < t < T. В силу наличия краевых условий ω(0) = 0 и ω(T) = 0 векторы L и φ коллинеарны как минимум два раза – в самом начале разворота (L = htq при t → 0) и в самом конце маневра (L = h (tT)q при t → T); во время остановки вращения h < 0. Между разгоном и торможением (если существует интервал движения, когда E(t) = const) оптимальным является вращение по инерции и уравнения (2.1), (2.5) выполняются, из-за чего единственным решением уравнений (2.2) будет (2.4). Следовательно, на всем интервале управления t ∈ [0, T] зависимости (2.4), (2.5) – единственное решение, удовлетворяющее необходимым условиям оптимальности. Значит, никакое отличное от (3.9), (3.10) движение не может быть оптимальным, так как оно не будет удовлетворять необходимым условиям оптимальности.

Чем больше k0, тем больше цена израсходованной энергии. Если k0 = 0, то исследуемая задача оптимального управления (1.1)–(1.7) соответствует задаче максимального быстродействия, которая подробно изучена и решена в разделе 3. Если k0 > 1 /(u0S), то в оптимальном движении обязательно присутствует участок вращения с постоянной кинетической энергией, во время которого управление M отсутствует (независимо от значения Eadm). Если k0 ≥ 1/(2Eadm), то в любой момент времени E(t) ≤ Eadm.

Для идеального разворота (это когда u0 → ∞ и переходные участки разгона и торможения практически отсутствуют, занимая бесконечно малое время) кинетическая энергия вращения изменяется скачком в моменты времени t = 0 и t = T. Значение показателя (1.7) равно

$\begin{gathered} G = (1 + 2{{k}_{0}}{{E}_{{{\text{nom}}}}})T = {{{\text{(1}} + {\text{2}}{{k}_{{\text{0}}}}{{E}_{{{\text{nom}}}}})S} \mathord{\left/ {\vphantom {{{\text{(1}} + {\text{2}}{{k}_{{\text{0}}}}{{E}_{{{\text{nom}}}}})S} {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }} = ({1 \mathord{\left/ {\vphantom {1 {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }} + {{k}_{0}}\sqrt {2{{E}_{{{\text{nom}}}}}} )S \\ ({\text{так как}}\,\,T = {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }}) \\ \end{gathered} $
где S – значение функционала пути (3.5) для траектории вращения в соответствии с уравнениями (2.1), (2.5) из положения Λ(0) = Λin в положение Λ(Т) = Λf; Enom – значение кинетической энергии во время вращения по инерции. Значение G минимально, если Enom = 1/(2k0). Поэтому минимизация показателя (1.7) делает невыгодным движение с энергией вращения больше уровня 1/(2k0). Условие (1.6) отражает требования к кинетической энергии вращения КА, и значение Enom не может быть больше Eadm. Если Eadm < 1/(2k0), то Enom = Eadm и величина G оказывается больше, чем $2S\sqrt {{{k}_{{\text{0}}}}} $.

6. Построение типовой программы оптимального разворота. Задача нахождения оптимального управления сводится к решению системы дифференциальных уравнений (1.1), (1.2), (2.1), (2.2) с одновременным выполнением условия (2.3), если φr < 0 или E(t) < Eadm и ${\mathbf{\dot {\varphi }}} \ne 0$, или М = 0, если ${\mathbf{\dot {\varphi }}} = 0$ или φr > 0 и E(t) = Eadm, чтобы удовлетворялись условия разворота (1.4), (1.5). Для компонент pi единичного вектора p имеют место следующие уравнения:

${{\dot {p}}_{1}} = {{\omega }_{3}}{{p}_{2}} - {{\omega }_{2}}{{p}_{3}},\quad {{\dot {p}}_{2}} = {{\omega }_{1}}{{p}_{3}} - {{\omega }_{3}}{{p}_{1}},\quad {{\dot {p}}_{3}} = {{\omega }_{2}}{{p}_{1}} - {{\omega }_{1}}{{p}_{2}}\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,(6.1)$

Краевая задача принципа максимума заключается в определении такого значения вектора p0 и величины r0, при которых решение истемы уравнений (1.2), (3.10), (6.1) с учетом того, что

$\begin{gathered} {{t}_{{{\text{ac}}}}} = \min (\sqrt {S{\text{/}}{{u}_{0}}} ,{{\sqrt {2{{E}_{{{\text{nom}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{nom}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}),\quad {{t}_{{{\text{br}}}}} = \max (\sqrt {S{\text{/}}{{u}_{0}}} ,{S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }}), \\ {{m}_{0}} = {{u}_{0}}{\text{/}}\sqrt {p_{{10}}^{2}{\text{/}}{{J}_{1}} + p_{{20}}^{2}{\text{/}}{{J}_{2}} + p_{{30}}^{2}{\text{/}}{{J}_{3}}} \\ \end{gathered} $
удовлетворяло условиям разворота (1.4), (1.5); напомним, что Enom = $\min (1{\text{/}}(2{{k}_{0}})$; Eadm). Значение S определяется интегрированием уравнений (1.2), (2.1), (2.5) с начальными условиями Λ(0) = Λin, r(0) = r0p0 и удовлетворением требования Λ(Т) = Λf и вычислением интеграла (3.5). Значения p0 и S не зависят от характера изменения функции b(t) [20] и поэтому могут быть вычислены в предположении b(t) = const.

Указанная система имеет аналитическое решение только для динамически симметричного и сферического тел (отметим, что к динамически симметричному телу относится, например, КА “Спейс Шаттл” [9, 10]). Для сферически-симметричного КА (J1 = J2 = J3) система (3.10), (6.1) принимает вид ${{\dot {p}}_{i}} = 0$, и решение системы уравнений (1.2), (1.4), (1.5), (3.9), (3.10), (6.1) такое:

${{{{р}_{i}}\left( t \right) = {\text{const}} = {{р}_{i}}_{0} = {{\nu }_{i}}} \mathord{\left/ {\vphantom {{{{р}_{i}}\left( t \right) = {\text{const}} = {{р}_{i}}_{0} = {{\nu }_{i}}} {\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} }}} \right. \kern-0em} {\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} }};\quad {{М}_{i}}(t) = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{ac}}}--t} \right) + {\text{sign}}\left( {{{t}_{{br}}}--t} \right)} \right]{{р}_{i}}_{0}$
${{\omega }_{i}}\left( t \right) = 0.5{{m}_{0}}\left( {T--\left| {t--{{t}_{{{\text{ac}}}}}} \right|--\,{\text{|}}t--{{t}_{{{\text{br}}}}}{\text{|}}} \right){{р}_{i}}_{0}{\text{/}}{{J}_{i}},\quad \Lambda (t) = {{\Lambda }_{{{\text{in}}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\theta /2}}}$ $\theta = \frac{{{{m}_{0}}}}{{2{{J}_{1}}}}\int\limits_0^t {({{t}_{{{\text{ac}}}}} + {{t}_{{{\text{br}}}}} - \left| {t - {{t}_{{{\text{ac}}}}}} \right| - \left| {t - {{t}_{{{\text{br}}}}}} \right|)dt} $
где ν1, ν2, ν3 – компоненты векторной части кватерниона разворота ${{\Lambda }_{{\text{t}}}} = {{\tilde {\Lambda }}_{{{\text{in}}}}} \circ {{\Lambda }_{{\text{f}}}}$; ${{m}_{0}} = {{u}_{0}}\sqrt {{{J}_{1}}} $; Т = tac + tbr; tac = $\min (\sqrt {S{\text{/}}{{u}_{0}}} ,{{\sqrt {2{{E}_{{{\text{nom}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{nom}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}})$, tbr = $\max (\sqrt {S{\text{/}}{{u}_{0}}} ,{S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }})$, в которых S = 2J1Carccos(sqalΛt). Оптимальные развороты вокруг оси, неподвижной относительно инерциальной системы координат, подробно рассмотрены в [1].

Для динамически симметричного КА (например, когда J2 = J3) задача оптимального управления разворотом решается до конца (не умаляя общности рассуждений, за ось симметрии принята ось ОХ КА). Оптимальное движение в этом частном, но достаточно распространенном случае представляет собой одновременное вращение КА как твердого тела вокруг своей продольной оси ОХ и вокруг некоторого направления η, неподвижного в инерциальном пространстве и составляющего с продольной осью КА определенный постоянный угол ϑ. Угловые скорости относительно осей ОХ и η изменяются пропорционально с постоянным коэффициентом пропорциональности, и поэтому справедливо соотношение [15]

${{\Lambda }_{{\text{f}}}} = {{\Lambda }_{{{\text{in}}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\beta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\alpha /2}}}$
где вектор в показателе степени кватернионной экспоненты понимается как кватернион с нулевой скалярной частью; р0 = р(0); е1 – орт продольной оси КА; α, β – углы поворота КА вокруг продольной оси ОХ и вокруг вектора р соответственно (считается |α| ≤ |π, 0 ≤ β ≤ π). Решение p(t) системы уравнений (1.1), (3.10), (6.1) представим в следующей форме:
(6.2)
где pi0 = рi(0); J = J2 = J3; продольная угловая скорость ω1(t) вычисляется из равенств (3.10) с учетом р1 = const = р10. Зависимость pi0, α, β от Λin и Λf определяется уравнениями
(6.3)
$\begin{gathered} \alpha = \frac{{J - {{J}_{1}}}}{{{{J}_{1}}}}{{p}_{{10}}}\beta ;\quad \cos \frac{\beta }{2}\cos \frac{\alpha }{2} - {{p}_{{10}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{0}} \\ \cos \frac{\beta }{2}\sin \frac{\alpha }{2} + {{p}_{{10}}}{\text{sin}}\frac{\beta }{2}\cos \frac{\alpha }{2} = {{\nu }_{1}};\quad {{p}_{{20}}}{\text{sin}}\frac{\beta }{2}{\text{cos}}\frac{\alpha }{2} + {{p}_{{30}}}{\text{sin}}\frac{\beta }{2}{\text{sin}}\frac{\alpha }{2} = {{\nu }_{2}} \\ - {{р}_{{20}}}\sin \frac{{{\beta }}}{2}\cos \frac{{{\alpha }}}{{\text{2}}} + {{p}_{{30}}}\sin \frac{{{\beta }}}{2}\cos \frac{{{\alpha }}}{2} = {{{{\nu }}}_{3}} \\ \end{gathered} $
где ν0, ν1, ν2, ν3 – компоненты кватерниона разворота Λt; –π ≤ α ≤ π, 0 ≤ β ≤ π. Существование решения системы (6.3) для любых значений кватерниона разворота Λt доказано в [15]. Оптимальное значение управляющего момента М удовлетворяет соотношениям (3.9). Программные значения функций ωi (проекции требуемой угловой скорости ω* на связанные оси) рассчитываются по формулам (3.10) и (6.2). В явном виде оптимальное решение Mi(t), ωi(t) запишем следующим образом:
$\begin{gathered} {{M}_{1}} = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{{\text{ac}}}}}--t} \right) + {\text{sign}}\left( {{{t}_{{br}}}--t} \right)} \right]{{р}_{{10}}} \\ {{M}_{2}} = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{ac}}}--t} \right) + {\text{sign}}\left( {{{t}_{{br}}}--t} \right)} \right]\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma ) \\ \end{gathered} $
${{M}_{3}} = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{ac}}}--t} \right) + {\text{sign}}\left( {{{t}_{{br}}}--t} \right)} \right]\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma )$
$\begin{gathered} {{\omega }_{1}} = 0.5{{m}_{0}}(T--\left| {t--{{t}_{{{\text{ac}}}}}} \right|\,--\,{\text{|}}t--{{t}_{{{\text{br}}}}}{\text{|}}){{р}_{{10}}}{\text{/}}{{J}_{1}} \\ {{\omega }_{2}} = 0.5{{m}_{0}}(T--\left| {t--{{t}_{{{\text{ac}}}}}} \right|--\,{\text{|}}t--{{t}_{{{\text{br}}}}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma ){\text{/}}{{J}_{2}} \\ \end{gathered} $
${{\omega }_{3}} = 0.5{{m}_{0}}\left( {T--\left| {t--{{t}_{{{\text{ac}}}}}} \right|--\,{\text{|}}t--{{t}_{{{\text{br}}}}}{\text{|}}} \right)\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma ){\text{/}}{{J}_{3}}$
где tac = $\min (\sqrt {{{J}_{2}}\beta {\text{/}}{{m}_{0}}} ,{{\sqrt {2{{E}_{{{\text{nom}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{nom}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}})$; tbr = $\max (\sqrt {{{J}_{2}}\beta {\text{/}}{{m}_{0}}} ,{{{{J}_{2}}\beta C} \mathord{\left/ {\vphantom {{{{J}_{2}}\beta C} {\sqrt {2{{E}_{{{\text{nom}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{nom}}}}}} }})$; γ = arcsin(p20/$\sqrt {1 - p_{{10}}^{2}} )$, если р30 ≥ 0, или $\gamma = \pi - \arcsin ({{{{p}_{{20}}}} \mathord{\left/ {\vphantom {{{{p}_{{20}}}} {\sqrt {1 - p_{{10}}^{2}} }}} \right. \kern-0em} {\sqrt {1 - p_{{10}}^{2}} }})$, если р30 < 0 (|р10| ≠ 1; а случай |р10| = 1 не рассматривается, так как он соответствует плоскому вращению вокруг продольной оси ОХ); Т = tac + tbr. В любой текущий момент времени t кватернион ориентации Λ описывается функцией
$\Lambda (t) = {{\Lambda }_{{{\text{in}}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\theta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\sigma /2}}}$
где $\sigma = (J - {{J}_{1}}){{p}_{{10}}}\theta {\text{/}}{{J}_{1}}$; значение вектора p0 определяется из системы (6.3); угол θ равен

$\theta = \frac{1}{J}\int\limits_0^t {\left| {{\mathbf{L}}(t)} \right|dt} ,\quad {\text{или}}\quad \theta = \frac{{{{m}_{0}}}}{{2J}}\int\limits_0^t {({{t}_{{{\text{ac}}}}} + {{t}_{{{\text{br}}}}} - \left| {t - {{t}_{{{\text{ac}}}}}} \right| - \left| {t - {{t}_{{{\text{br}}}}}} \right|)dt} $

Для несимметричного КА (${{J}_{1}} \ne {{J}_{2}} \ne {{J}_{3}}$) решение системы уравнений (1.2), (3.10), (6.1) в квадратурах не представляется возможным и находится исключительно численными методами (например, методом последовательных приближений). Расчет вектора p0 производится путем решения краевой задачи Λ(0) = Λin, Λ(Т) = Λf с учетом накладываемых на движение связей (1.2), (2.1), (2.5) (искомое значение p0 может определяться при допущении b(t) = const и нахождении начальной угловой скорости ω(0) для вращения по инерции).

Для построения оптимального управления при развороте КА необходимо знать не только программу изменения координат рi(t), но и величину максимального момента m0, определяющего темп приближения к требуемому конечному состоянию (1.5), а также моменты выключения и включения управления tac и tbr. Конкретные значения параметров m0, tac, tbr, r0 = |r| и длительность разворота Т зависят от вектора р0 и характеристики S = QC, где

$Q = \int\limits_0^T {\left| {{\mathbf{L}}(t)} \right|dt} $

Для динамически симметричного КА интеграл Q вычисляется значительно проще (расчет величин r0, tac, tbr и Emax также упрощается). В этом частном случае |L| = J2${{\dot {\beta }}}$ и Q = J2β, где J2 – момент инерции относительно поперечной оси (J2 = J3); ${{\dot {\beta }}}$ – скорость вращения вокруг кинетического момента L; β – угол поворота КА вокруг кинетического момента L (из физического смысла β ≥ 0). Значения r0, tac, tbr, Т, Emax, Lmax зависят от угла β поворота КА вокруг кинетического момента L. Чтобы S и G были минимальными, необходимо выполнить условие β ≤ π, при котором Q минимально (именно поэтому система (6.3) включает неравенство 0 ≤ β ≤ π).

Решение задачи оптимального по времени разворота с ограничением на фазовые переменные (1.6) подчиняется уравнениям (2.1), (2.4), (2.5), а управляющие переменные Мi и угловые скорости ωi изменяются в соответствии с законами (3.9), (3.10), (6.1). Решение (3.9), (3.10) оптимально, потому что оно – единственное; только оно одно (и никакое другое) удовлетворяет необходимым условиям оптимальности. Любое отличное от (3.9), (3.10) движение заведомо хуже (в смысле минимума (1.7) при ограничениях (1.3), (1.6)), так как не удовлетворяет необходимым условиям оптимальности. Значение m0 в законах движения (3.9), (3.10) определяет максимальную величину управляющего момента, максимальный модуль кинетического момента и длительность участка свободного вращения. Оптимальный вектор р0 рассчитывается в результате решения краевой задачи принципа максимума. Константы S, С, m0 полностью определяют вращение КА при оптимальном законе управления пространственным разворотом. Программное изменение силового момента М описывается зависимостью

${\mathbf{М}} = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{{\text{ac}}}}}--t} \right) + {\text{sign}}\left( {{{t}_{{{\text{br}}}}}--t} \right)} \right]\tilde {\Lambda } \circ {{{\mathbf{c}}}_{p}} \circ \Lambda $
где cp = const = Λin$ \circ $ р0$ \circ {{\tilde {\Lambda }}_{{{\text{in}}}}}$. Оптимальная программа управления М(t) имеет следующие оригинальные свойства, а движение КА подчиняется соотношениям:

$\begin{gathered} \Lambda \circ {\mathbf{M}}\left( {T--t} \right) \circ \tilde {\Lambda } = - \Lambda \circ {\mathbf{M}}(t) \circ \tilde {\Lambda };\quad \Lambda \circ {\mathbf{L}}(T - t) \circ \tilde {\Lambda } = \Lambda \circ {\mathbf{L}}(t) \circ \tilde {\Lambda } \\ \int\limits_0^{T/2} {\left| {{\mathbf{L}}(t)} \right|dt} = \int\limits_{Т/2}^T {\left| {{\mathbf{L}}(t)} \right|dt} \\ \end{gathered} $
${{E}_{{{\text{max}}}}} = \left| {E\left( {T{\text{/}}2} \right)} \right|,\quad {{L}_{{{\text{max}}}}} = \mathop {\max }\limits_{0 < t < T} \sqrt {J_{1}^{2}\omega _{1}^{2} + J_{2}^{2}\omega _{2}^{2} + J_{3}^{2}\omega _{3}^{2}} = \left| {{\mathbf{L}}\left( {T{\text{/}}2} \right)} \right|$

Раскрутка КА в начале разворота продолжается до тех пор, пока его кинетический момент L не станет равен заданному значению Lpr, который вычисляется по формуле

${{{\mathbf{L}}}_{{{\text{pr}}}}} = {{m}_{0}}{{t}_{{{\text{ac}}}}}\tilde {\Lambda } \circ {{{\mathbf{c}}}_{p}} \circ \Lambda $

Гашение угловой скорости в конце оптимального разворота осуществляется по закону (3.3). В момент времени t = T, когда ω = 0, управление выключается и M = 0, разворот завершен. Если 2Enom$ \ll $ u0S, то торможение КА можно начать с момента выполнения равенства

$4{\text{arcsin}}\frac{{K\sqrt {\delta _{2}^{2} + \delta _{3}^{2}} }}{{\sqrt {{{{({{J}_{2}}{{\omega }_{2}})}}^{2}} + {{{({{J}_{3}}{{\omega }_{3}})}}^{2}}} }} = \frac{{{{K}^{2}}\sqrt {\omega _{2}^{2} + \omega _{3}^{2}} }}{{{{m}_{0}}\sqrt {{{{({{J}_{2}}{{\omega }_{2}})}}^{2}} + {{{({{J}_{3}}{{\omega }_{3}})}}^{2}}} }},\quad {\text{если}}\quad \omega _{2}^{2} + \omega _{3}^{2} \ne 0$
или $4\arccos {{\delta }_{0}} = {{\omega }_{1}}K{\text{/}}{{m}_{0}}$, если $\omega _{2}^{2} + \omega _{3}^{2} = 0$, где δj – компоненты кватерниона рассогласования $\tilde {\Lambda }(t) \circ {{\Lambda }_{{\text{f}}}}$, $j = \overline {0,\;3} $; K = |JSCω| – величина кинетического момента КА. Указанное условие повышает точность приведения КА в требуемое конечное состояние (1.5) за счет возможности в бортовой системе управления формировать сигнал на остановку вращения по информации о текущей ориентации КА и измерениям угловой скорости.

7. Результаты математического моделирования. Приведем численный пример решения задачи управления КА во время программного разворота и построения оптимальной программы вращения. Рассмотрим разворот КА на 180° из исходного положения, соответствующего кватерниону Λin с элементами λ0 = 0, λ1 = 0.7071, λ2 = 0.5, λ3 = 0.5, в требуемое угловое положение Λf, при котором оси КА совмещены (совпадают по направлению) с осями опорного базиса I. При этом начальная и конечная угловые скорости отсутствуют, ω(0) = ω(Т) = 0. Будем полагать, что инерционные характеристики КА равны: J1 = 4710 кг ⋅ м2, J2 = 17 160 кг ⋅ м2, J3 = 18 125 кг ⋅ м2, а мощность исполнительных органов характеризуется величиной u0 = 0.05 ⋅ Н ⋅ кг–1/2. Во время разворота кинетическая энергия вращения не должна быть больше Eadm = 2 Дж. Считаем, что k0 = 1 Дж–1 (энергозатраты имеют такой же вес, как и время).

При решении краевой задачи принципа максимума в уравнениях (2.5) полагаем b = = const (и, соответственно, |L| = const), так как искомое значение p0 не зависит от характера изменения функции b(t) [20]. Нахождение расчетного вектора p0 начинаем с решения той же краевой задачи для динамически-симметричного КА с моментами инерции J1 и J, где J – момент инерции относительно поперечной оси, равный среднему значению между J2 и J3 (принцип осреднения нередко используется исследователями [28]). Например, примем такое значение

$J = \frac{{{{J}_{2}}{{J}_{3}}}}{{{{J}_{2}} + {{J}_{3}} - {{J}_{1}}}}(\sqrt {(1 - {{J}_{1}}{\text{/}}{{J}_{2}})(1 - {{J}_{1}}{\text{/}}{{J}_{3}})} + 1)$

В предположении динамической симметричности КА решение p0 определяется системой (6.3). Полученный из уравнений (6.3) вектор p0 и угол β являются начальным приближением к истинному решению. Они уточняются до тех пор, пока не будут удовлетворять системе уравнений (1.2), (1.1), в которых момент сил отсутствует (M = 0), с учетом накладываемых на движение КА ограничений Λ(0) = Λin, Λ(tpr) = Λf, а начальные угловые скорости ωist определяются вектором p0 и углом β по формулам:

${{\omega }_{{1{\text{st}}}}} = \frac{{J\beta }}{{{{J}_{1}}T}}{{p}_{{10}}},\quad {{\omega }_{{2{\text{st}}}}} = \frac{{J\beta }}{{{{J}_{2}}T}}{{p}_{{20}}},\quad {{\omega }_{{3{\text{st}}}}} = \frac{{J\beta }}{{{{J}_{3}}T}}{{p}_{{30}}}\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,\,(7.1)$
где Т – время разворота (при уточнении вектора p0 было принято значение Т = 300 с). “Свободное” движение прогнозируется интегрированием системы уравнений (1.1), (1.2), описывающих вращение КА, при начальных условиях Λ(0) = Λin, ω(0) = ωst и с учетом того, что M = 0. Степень приближения найденного значения р0 к искомому решению характеризуется мерой ε = sqal(${{\tilde {\Lambda }}_{{{\text{pr}}}}} \circ {{\Lambda }_{{\text{f}}}}$), где Λpr – наиболее близкое к Λf положение, полученное в ходе моделирования движения КА около центра масс (согласно уравнений (1.2), (1.1), в которых Mi = 0). Вектор р0 уточняется до тех пор, пока ε < εthth – некоторое близкое к единице пороговое значение, отражающее точность найденного решения). Как только условие ε ≥ εth достигнуто (прогнозируемая ошибка соответствует требуемой точности), истинное значение p0, удовлетворяющее граничным условиям Λ(0) = Λin, Λ(tpr) = Λf, будет найдено и краевая задача решена. Вектор p0 уточняется с помощью следующего рекуррентного соотношения
$\Lambda _{{\text{t}}}^{{{\text{(}}k + {\text{1)}}}} = \Lambda _{{\text{t}}}^{{{\text{(}}k{\text{)}}}} \circ {{\tilde {\Lambda }}_{{\text{f}}}} \circ {{\Lambda }_{{{\text{pr}}}}}$
где $\Lambda _{{\text{t}}}^{{(k)}}$ – значение кватерниона разворота на k-й итерации, используемое в системе (6.3). На каждом k-м шаге итераций обновляются элементы кватерниона разворота $\Lambda _{{\text{t}}}^{{(k)}}$ (правые части системы (6.3)), и из уравнений (6.3) мы получаем p0 и β, а также соответствующую начальную угловую скорость ωst (в соответствии с (7.1)) и прогноз Λpr. Если ε < εth, то вычисляется кватернион разворота $\Lambda _{{\text{t}}}^{{(k + 1)}}$ для следующего (k + 1)-го шага итераций и процесс уточнения вектора p0 повторяется. За начальное приближение в правых частях системы (6.3) берутся элементы кватерниона $\Lambda _{{\text{t}}}^{{{\text{(0)}}}} = {{\tilde {\Lambda }}_{{{\text{in}}}}} \circ {{\Lambda }_{{\text{f}}}}$. Итерационный процесс прекращается, когда ε ≥ εth.

Принятая схема итераций аналогична итерационному методу решения уравнения вида x = f(x) для скалярной функции f(x) скалярного (одномерного) аргумента x. В нашем случае аргумент – гиперкомплексное число (кватернион) Λt. Функцией является кватернионная величина ${{\Lambda }_{{\text{t}}}} \circ {{\tilde {\Lambda }}_{{\text{f}}}} \circ {{\Lambda }_{{{\text{pr}}}}}$, где Λf – постоянный кватернион (он не зависит от аргумента Λt); Λpr зависит от аргумента Λt через систему уравнений (6.3), (7.1) посредством модели движения (1.1), (1.2) (в уравнениях (1.1) принимается Мi = 0). Изменяя Λt, изменяются вектор p0 (в соответствии с (6.3)) и угловые скорости ωist, а значит изменится и значение Λpr, что вызовет изменение функции ${{\Lambda }_{{\text{t}}}} \circ {{\tilde {\Lambda }}_{{\text{f}}}} \circ {{\Lambda }_{{{\text{pr}}}}}$. Как только sqal(${{\tilde {\Lambda }}_{{{\text{pr}}}}} \circ {{\Lambda }_{{\text{f}}}}$) ≥ εth, итерационный процесс прекращается, а решение p0 считается найденным. Так как |vect(${{\tilde {\Lambda }}_{{\text{f}}}} \circ \Lambda _{{{\text{pr}}}}^{{(k)}}$)| < |vect$\Lambda _{{\text{t}}}^{{(k)}}$| для всех k, то итерационный процесс приближения p0 к искомому решению сходится. Аналогичный метод определения значения р0 в решении краевой задачи принципа максимума использовался в предыдущих работах [8, 19]. Заметим, что это лишь один из возможных (но далеко не единственный) итерационных алгоритмов поиска оптимального вектора р0.

В результате решения краевой задачи разворота из положения Λ(0) = Λin в положение Λ(Т) = Λf получили расчетное значение вектора р0 = {–0.4249361; –0.8707327; 0.2474951} и интеграл Q = 31867 Н ⋅ м ⋅ с2, “функционал пути” составил S = 292 м ⋅ кг1/2. Исходя из найденного значения р0 получили максимальную величину управляющего момента m0 = 5.4 ⋅ Н ⋅ м. Так как 2k0Eadm > 1 и k0u0S > 1, то максимальная энергия вращения Emax = 1/(2k0) = 0.5 Дж, а значит время достижения максимальной кинетической энергии Emax равно τ = ${{\sqrt {2{{E}_{{{\text{max}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{max}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ = 20 с. Оптимальным управлением является релейное управление с двумя точками переключения, при котором между набором и гашением кинетической энергии КА вращается по инерции с постоянной кинетической энергией вращения до момента времени tbr = ${S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{max}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{max}}}}}} }}$ = 292 с. Время разворота оказалось равным Т = 312 с. Основные константы оптимального движения такие:

$a(0) = {1 \mathord{\left/ {\vphantom {1 {(2{{u}_{0}}\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2{{u}_{0}}\sqrt {{{k}_{0}}} )}}~\, = 10{\text{ с}},\quad а(Т) = --a\left( 0 \right) = --10{\text{ с}},\quad {{r}_{0}} = {{2\sqrt {{{k}_{{\text{0}}}}} } \mathord{\left/ {\vphantom {{2\sqrt {{{k}_{{\text{0}}}}} } C}} \right. \kern-0em} C}~\, = 216{\text{ с}}$

Результаты математического моделирования динамики оптимального разворота представлены рис. 3–5. На рис. 3 изображены графики изменения угловых скоростей в связанной с КА системе координат ω1(t), ω2(t), ω3(t) по времени (переменные ωi приведены в град./с, время t дано в секундах). Максимальная величина кинетического момента составляет Lmax = 108 Н ⋅ м ⋅ с. Из соотношения моментов инерции J1, J2, J3 следует, что ОХ – продольная ось КА. Отмечаем, что угловая скорость ω1, соответствующая продольной оси КА, – знакопостоянна. На рис. 4 отображены графики изменения компонент кватерниона Λ(t), определяющего текущую ориентацию КА в процессе совершаемого поворотного маневра: λ0(t), λ1(t), λ2(t), λ3(t). Оптимальная траектория движения Λ(t) получается из решения уравнения (1.2) с учетом начальных условий Λ(0) = Λin и известного закона изменения угловой скорости ω(t). Динамика изменения составляющих p1(t), p2(t), p3(t) орта кинетического момента по времени приведена на рис. 5. Характерным является незначительное изменение проекции p1 (угловая скорость ω1 относительно продольной оси КА на участке между разгоном и торможением также меняется гораздо меньше, чем угловые скорости ω2 и ω3 относительно поперечных осей КА). При оптимальном управлении в отличие от переменных ωi переменные pi и λj – гладкие функции времени.

Рис. 3.

Оптимальное изменение угловых скоростей во время разворота

Рис. 4.

Изменение компонент кватерниона ориентации Λ(t) во время разворота

Рис. 5.

Вид функций p1(t), p2(t), p3(t) во время оптимального разворота

Заключение. Предложено кватернионное решение динамической задачи оптимального управления пространственным разворотом твердого тела (в частности, КА) из произвольного начального в требуемое конечное угловое положение с учетом ограничений на управляющий момент и кинетическую энергию вращения. Ограниченность максимальной кинетической энергии вращения позволяет в экстренных случаях погасить угловую скорость за время, не превышающее заданного значения (в том числе в нештатной ситуации, когда требуется срочно прекратить маневр и максимально быстро стабилизировать КА). Постановка задачи имеет традиционную форму, в которой управление считается кусочно-непрерывной функцией времени. Оптимизация выполнена для случая, когда минимизируемый функционал качества объединяет в заданной пропорции длительность разворота и интеграл кинетической энергии вращения. Нахождение оптимального режима переориентации КА с минимальным значением такого функционала весьма актуально.

Представлено аналитическое решение предложенной задачи оптимального разворота, и получены формализованные уравнения и расчетные выражения для построения оптимальной программы переориентации КА. Определен тип траектории и изучены ключевые свойства оптимального движения. Найдены условия оптимальности и обоснована структура оптимального управления. Доказано, что в процессе всего разворота отношение кинетической энергии вращения к квадрату модуля кинетического момента КА есть величина постоянная. Для решения сформулированной задачи управления применялся принцип максимума, основываясь на универсальных переменных ri [2], а использование кватернионов значительно упрощает расчетные процедуры и снижает вычислительные затраты алгоритма управления, делая его наиболее удобным для бортовой реализации. Задача оптимального управления разворотом решается до конца; даны выражения для расчета ключевых характеристик маневра переориентации.

В отличие от известных работ [8, 9], где рассматривается неограниченное управление (в тех задачах отсутствуют какие-либо ограничения, кроме краевых условий), мы оптимизируем ограниченное управление, когда ограничены не только управляющие функции (силовой момент М), но и фазовые переменные (ограничена угловая скорость КА); это существенное отличие. Кроме того, в [8] оптимальным является непрерывное управление, когда все управляющие функции – непрерывные гладкие функции времени и на всем интервале управления [0, T] (кроме единственного момента времени t = Т/2) управляющий момент М отличен от нуля, а в приведенном решении оптимально релейное управление (с одной или с двумя точками переключения) и может существовать отрезок времени ненулевой продолжительности, на котором М = 0 и КА вращается по инерции. В оптимальном решении, представленном в работе [8], отсутствуют участки с постоянным модулем управляющего момента. В работе [9] коэффициент пропорциональности в критерии оптимальности не равен нулю (это категорическое требование к минимизируемому функционалу, который используется авторами для решения задачи управления).

Свойства оптимального решения существенно зависят от коэффициента k0. Сначала была рассмотрена и решена задача максимально быстрого разворота при наличии ограничения на фазовые переменные (ограничена кинетическая энергия вращения). Затем подробно изучен общий случай оптимального управления, когда k0 отличен от нуля. Учет одновременно нескольких факторов, влияющих на затратность (трудоемкость, ”стоимость”) разворота, позволяет найти удачный компромисс, отвечающий сразу нескольким критериям (в нашем случае экономии времени и расходования энергии). Важность и значение выполненных исследований состоят в том, что в отличие от предыдущих публикаций выбранный критерий оптимальности ограничивает кинетическую энергию вращения (когда k0 ≠ 0) и минимизирует время переориентации. Так как время окончания переориентации Т не ограничено, требуемый поворотный маневр осуществим при любых условиях разворота.

Показано, что на всем интервале переориентации момент сил действует вдоль прямой, неподвижной в инерциальной системе координат. В общем случае оптимальным является релейное управление с двумя точками переключения, при котором весь разворот делится на раскрутку КА с максимально возможным управляющим моментом, вращение по инерции и торможение с максимально возможным управляющим моментом, противоположно направленным кинетическому моменту КА. Модуль управляющего момента при разгоне и торможении не меняется. Длительности участков разгона и торможения одинаковы (так как начальная и конечная угловые скорости равны нулю) и зависят от мощности исполнительных органов u0, максимально допустимой кинетической энергии вращения, коэффициента функционала качества, взаимной ориентации начального и конечного положений КА и его моментов инерции. Если критерий оптимальности учитывает кинетическую энергию вращения (а не только время разворота), то возможно существование особого режима управления, при котором КА вращается с постоянной кинетической энергией, которая меньше заданного максимально допустимого значения. Проведен подробный анализ особого режима управления и сформулированы условия существования такого режима. На основе условий трансверсальности как необходимых условий оптимальности, определены оптимальное время действия ненулевого управляющего момента и кинетическая энергия вращения на участке с особым режимом управления, а также модуль кинетического момента при движении по инерции. В случае наличия участка вращения по инерции максимальная кинетическая энергия не зависит от мощности исполнительных органов и соответственно от длительности этапов набора и гашения угловой скорости. В случае неограниченного управления (когда u0 → ∞) времена разгона и торможения бесконечно малы, и практически на всем интервале движения КА вращается с постоянным относительно инерциальной системы координат кинетическим моментом. Другим предельным случаем является управление с одной точкой переключения, при котором участок неуправляемого движения отсутствует (длительность разгона и торможения максимальна и составляет половину времени разворота).

В статье описана процедура реализации оптимального управления переориентацией КА. Момент начала торможения определяется по фактическим параметрам движения (кватерниону рассогласования и кинетическому моменту), исходя из принципов терминального управления (используются информация об угловом положении КА и измерения угловой скорости). Структура построенного управления сравнительно проста, и оно легко может быть реализовано существующими бортовыми системами управления движением КА. Дается описание конструктивной схемы решения краевой задачи принципа максимума для произвольных условий разворота и моментов инерции КА. Для динамически симметричного КА представлено законченное решение задачи переориентации в замкнутой форме, что придает практическую значимость проведенным исследованиям, поскольку реальные КА во многих случаях близки по инерционным характеристикам к телам с осевой симметрией (среди них, например, КА системы “Спейс Шаттл” [10]). Записанная в аналитическом виде система уравнений (6.3) позволяет непосредственно найти решение краевой задачи принципа максимума и вычислить необходимые константы оптимального закона управления; при этом искомые значения параметров закона управления могут быть определены известным устройством [29]. Приводятся данные математического моделирования, иллюстрирующие характер движения КА во время оптимального разворота.

Принципиальным отличием предложенной динамической задачи оптимального управления относительно известных работ является наличие ограничений не только на управляющие функции, но и на фазовые переменные, что придает полученному решению существенную новизну. Наличие готовых формул для синтеза программы оптимального движения во время маневра переориентации делает описанный метод управления практически значимым и пригодным для непосредственного применения в практике космических полетов.

Список литературы

  1. Бpанец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М.: Наука, 1973. 320 с.

  2. Левский М.В. Использование универсальных переменных в задачах оптимального управления ориентацией космических аппаратов // Мехатроника, автоматизация, управление. 2014. № 1. С. 53–59.

  3. Алексеев К.Б., Малявин А.А., Шадян А.В. Экстенсивное управление ориентацией космического аппарата на основе нечеткой логики // Полет. 2009. № 1. С. 47–53.

  4. Ермошина О.В., Крищенко А.П. Синтез программных управлений ориентацией КА методом обратной задачи динамики // Изв. РАН. ТиСУ. 2000. № 2. С. 155–162.

  5. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Синтез алгоритмов переориентации космического аппарата на основе концепции обратной задачи динамики // Изв. РАН. ТиСУ. 2003. № 5. С. 156–163.

  6. Раушенбах Б.В., Токарь Е.Н. Управление ориентацией космических аппаратов. М.: Наука, 1974. 600 с.

  7. Junkins J.L., Turner J.D. Optimal Spacecraft Rotational Maneuvers. Elsevier, 1986. 515 p.

  8. Левский М.В. Квадратично оптимальное управление переориентацией космического аппарата за фиксированное время в динамической постановке // Изв. РАН. ТиСУ. 2018. № 1. С. 133–149.

  9. Молоденков A.В., Сапунков Я.Г. Аналитическое приближенное решение задачи оптимального разворота космического аппарата при произвольных граничных условиях // Изв. РАН. ТиСУ. 2015. № 3. С. 131–141.

  10. Li F., Bainum P.M. Numerical approach for solving rigid spacecraft minimum time attitude maneuvers // J. Guid. Contr. Dyn. 1990. V. 13. № 1. P. 38–45.

  11. Scrivener S., Thompson R. Survey of time-optimal attitude maneuvers // J. Guid. Contr. Dyn. 1994. V. 17. № 2. P. 225–233.

  12. Zhou H., Wang D., Wu B., Poh E.K. Time-optimal reorientation for rigid satellite with reaction wheels // Int. J. Contr. 2012. V. 85. № 10. P. 1–12

  13. Решмин С.А. Пороговая абсолютная величина релейного управления при наискорейшем приведении спутника в желаемое угловое положение // Изв. РАН. ТиСУ. 2018. № 5. С. 30–41.

  14. Решмин С.А. Пороговая абсолютная величина релейного управления при наискорейшем приведении спутника в гравитационно-устойчивое положение // Доклады Академии наук. 2018. Т. 480. № 6. С. 671–675.

  15. Бранец В.Н., Черток М.Б., Казначеев Ю.В. Оптимальный разворот твердого тела с одной осью симметрии // Космич. исслед. 1984. Т. 22. Вып. 3. С. 352–360.

  16. Shen H., Tsiotras P. Time-optimal control of axi-symmetric rigid spacecraft with two controls // AIAA J. Guid. Contr. Dyn. 1999. V. 22. № 5. P. 682–694.

  17. Молоденков А.В., Сапунков Я.Г. Аналитическое решение задачи оптимального по быстродействию разворота осесимметричного космического аппарата в классе конических движений // Изв. РАН. ТиСУ. 2018. № 2. С. 131–147.

  18. Молоденков A.В., Сапунков Я.Г. Решение задачи оптимального разворота осесимметричного космического аппарата с ограниченным и импульсным управлением при произвольных граничных условиях // Изв. РАН. ТиСУ. 2007. № 2. С. 152–165.

  19. Левский М.В. Применение принципа максимума Л.С. Понтрягина к задачам оптимального управления ориентацией космического аппарата // Изв. РАН. ТиСУ. 2008. № 6. С. 144–157.

  20. Левский М.В. Синтез оптимального управления терминальной ориентацией космического аппарата с использованием метода кватернионов // Изв. РАН. МТТ. 2009. № 2. С. 7–24.

  21. Зубов Н.Е., Ли М.В., Микрин Е.А., Рябченко В.Н. Терминальное построение орбитальной ориентации космического аппарата // Изв. РАН. ТиСУ. 2017. № 4. С. 154–173.

  22. Сарычев В.А., Беляев М.Ю., Зыков С.Г., Сазонов В.В., Тесленко В.П. Математические модели процессов поддержания ориентации орбитальной станции “Мир” с помощью гиродинов. М.: Препринт ИПМ им. М.В. Келдыша АН СССР. 1989. № 10.

  23. Левский М.В. Особенности управления ориентацией космического аппарата, оборудованного инерционными исполнительными органами // Мехатроника, автоматизация, управление. 2015. Т. 16. № 3. С. 188–195.

  24. Levskii M.V. Special aspects in attitude control of a spacecraft, equipped with inertial actuators // J. Comp. Sci. Appl. Inf. Techn. 2017. V. 2. № 4. P. 1–9.

  25. Lam Q.M. Robust and adaptive reconfigurable control for satellite attitude control subject to under-actuated control condition of reaction wheel assembly // Math. Eng. Sci. Aerosp. 2018. V. 9. № 1. P. 47–63.

  26. Левский М.В. Способ управления разворотом космического аппарата. Патент на изобретение РФ № 2093433 // Бюллетень “Изобретения. Заявки и патенты”. 1997. № 29. Опубликован 20.10.1997. С. 271.

  27. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. M.: Наука, 1983. 392 с.

  28. Журавлев В.Ф., Климов Д.М. Прикладные методы в теории колебаний. М.: Наука, 1988. 328 с.

  29. Левский М.В. Устройство формирования параметров регулярной прецессии твердого тела. Патент на изобретение РФ № 2146638 // Бюллетень “Изобретения. Заявки и патенты”. 2000. № 8. Опубликован 20.03.2000. С. 148.

Дополнительные материалы отсутствуют.