Известия РАН. Теория и системы управления, 2021, № 6, стр. 158-176

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ОРИЕНТАЦИЕЙ КОСМИЧЕСКОГО АППАРАТА С ОГРАНИЧЕНИЯМИ НА УПРАВЛЯЮЩИЕ И ФАЗОВЫЕ ПЕРЕМЕННЫЕ

М. В. Левский *

Научно-исследовательский институт космических систем им. А.А. Максимова – филиал Государственного космического научно-производственного центра им. М.В. Хруничева
Королев, Россия

* E-mail: levskii1966@mail.ru

Поступила в редакцию 12.02.2020
После доработки 02.08.2020
Принята к публикации 26.10.2020

Полный текст (PDF)

Аннотация

Аналитическим путем решается задача оптимального управления переориентацией космического аппарата из произвольного начального углового положения в заданное конечное угловое положение при наличии эллипсоидальных ограничений на фазовые переменные и управляющие функции (ограничены угловая скорость и силовой момент). Минимизируется время разворота. Рассматривается случай, когда существенным ограничением является максимально допустимая кинетическая энергия вращения. Построение оптимального управления разворотом основано на кватернионных переменных и моделях. Показано, что во время оптимального разворота момент сил параллелен прямой, неподвижной в инерциальном пространстве, и при вращении космического аппарата направление кинетического момента постоянно относительно инерциальной системы координат. Выписаны аналитические уравнения и соотношения для нахождения оптимальной программы управления. Даны расчетные формулы для определения временных характеристик маневра и вычисления длительности разгона и торможения. Для осесимметричного космического аппарата поставленная задача оптимального управления решается до конца – получены зависимости как явные функции времени для управляющих переменных и соотношения для расчета ключевых параметров закона управления. Приводятся численный пример и результаты математического моделирования движения космического аппарата при оптимальном управлении, демонстрирующие практическую реализуемость разработанного метода управления ориентацией космического аппарата.

Введение. В статье решается задача приведения космического аппарата (КА) в положение заданной ориентации оптимальным образом. Пространственное движение КА относительно центра масс задается кватернионом [1]. Построение оптимальной программы вращения основано на кватернионных моделях, принципе максимума и универсальных переменных [2].

Вопросы управляемого движения твердого тела вокруг центра масс исследовались многими авторами неоднократно [125]. Наиболее детально задача оптимального управления угловым движением КА решена только для плоских вращений КА вокруг одной из главных центральных осей инерции [3] и пространственных вращений сферически-симметричного тела [1]. Для построения программы управления ориентацией КА используются различные методы и алгоритмы (в том числе на основе нечеткой логики [4], концепции обратных задач динамики [5, 6] и др.). Также хорошо известны проблемы оптимального управления движением КА [1, 2, 719], в том числе с неограниченным управлением [8, 9] (как с фиксированным [8], так и с нефиксированным временем окончания маневра [9]). Наиболее популярны задачи оптимального по времени разворота [1, 1016, 18]. Несомненно, практический интерес представляют аналитические решения задачи оптимального разворота, так как они позволяют применять на борту КА готовые законы программного управления и изменения оптимальной траектории движения КА. Некоторые решения получены для осесимметричных КА [1417]. В частности, авторы работы [17] для решения краевой задачи принципа максимума сделали замену переменных и свели исходную задачу к краевой задаче разворота сферически-симметричного тела. Для КА с произвольным распределением масс при произвольных граничных условиях по угловому положению КА аналитическое решение задачи пространственного разворота не найдено, кроме некоторых особых случаев (например, [1, 18]). Управление ориентацией КА с инерционными исполнительными органами (гиродинами) имеет свои особенности [11, 2023], и для таких КА ранее был разработан запатентованный метод [26]. Проблема создания высокоэффективных алгоритмов управления ориентацией КА остается актуальной и сегодня.

Ниже исследуется динамическая задача оптимального по времени управления разворотом КА, когда ограничения накладываются как на управляющие функции, так и на фазовые переменные (ограничен не только силовой момент, но и угловая скорость). Найденное решение позволяет разворачивать КА с ограниченной кинетической энергией вращения за минимальное время, что крайне важно для практики космических полетов. Вопросы быстродействия маневров при экономном управлении движением КА остаются до сих пор актуальными, поэтому решаемая в статье задача является практически важной.

1. Уравнения углового движения и постановка задачи управления. Динамика углового движения КА как твердого тела описывается динамическими уравнениями Эйлера [3]:

(1.1)
${{J}_{1}}{{\dot {\omega }}_{1}} + \left( {{{J}_{3}} - {{J}_{2}}} \right){{\omega }_{2}}{{\omega }_{3}} = {{M}_{1}},\quad {{J}_{2}}{{\dot {\omega }}_{2}} + \left( {{{J}_{1}} - {{J}_{3}}} \right){{\omega }_{1}}{{\omega }_{3}} = {{M}_{2}},\quad {{J}_{3}}{{\dot {\omega }}_{3}} + \left( {{{J}_{2}} - {{J}_{1}}} \right){{\omega }_{1}}{{\omega }_{2}} = {{M}_{3}},$
где Ji, i = $\overline {1,3} $, – главные центральные моменты инерции аппарата, Мi – проекции главного момента М сил на главные центральные оси эллипсоида инерции аппарата, ωi – проекции вектора ω абсолютной угловой скорости КА на оси связанного базиса E, образованного главными центральными осями эллипсоида инерции аппарата.

Для описания пространственного движения КА воспользуемся математическим аппаратом кватернионов (параметров Родрига–Гамильтона). Движение связанного базиса Е относительно опорного базиса I будем задавать кватернионом Λ [1]. Для определенности базис I считается инерциальным. Поэтому справедливо следующее кинематическое уравнение [1]:

(1.2)
$2\dot {\Lambda } = \Lambda \circ \omega ,$
где символ “$ \circ $” – знак умножения кватернионов [1, с. 11–20]. Для удобства кватернион Λ, отражающий текущую ориентацию КА, полагаем нормированным ||Λ|| = 1 [1]. Здесь и далее операция кватернионного умножения на вектор понимается как умножение на кватернион с нулевой скалярной частью; в частности $\Lambda \circ {\mathbf{\omega }} = \Lambda \circ \Omega $, где Ω – кватернион, у которого sqal Ω = 0, vect Ω = ω.

Управление движением КА относительно центра масс осуществляется путем изменения момента сил М. Предположим, что область возможных значений вектора М подобна эллипсоиду инерции КА и описывается неравенством [14]

(1.3)
$\frac{{M_{1}^{2}}}{{{{J}_{1}}}} + \frac{{M_{2}^{2}}}{{{{J}_{2}}}} + \frac{{M_{3}^{2}}}{{{{J}_{3}}}} \leqslant u_{0}^{2},$
где u0 > 0 – некоторая положительная величина, характеризующая мощность исполнительных органов системы ориентации КА. Рассматривается задача разворота с закрепленными левым и правым концами траектории движения, причем начальная и конечная угловые скорости полагаются равными нулю (относительно опорного базиса I); такие задачи встречаются достаточно часто и имеют большое практическое значение. Для исследуемого управления разворотом из положения покоя в положение покоя граничные условия для динамической системы (1.1), (1.2) представляются в виде равенств:
(1.4)
$\Lambda (0) = {{\Lambda }_{{\text{н}}}},\quad {\mathbf{\omega }}(0) = 0,$
(1.5)
$\Lambda (T) = {{\Lambda }_{{\text{к}}}},\quad {\mathbf{\omega }}(T) = 0,$
где Т – время окончания поворотного маневра. Кватернионы Λн и Λк, задающие ориентацию связанных с КА осей в начальный и конечный моменты времени, имеют произвольные наперед заданные значения, удовлетворяющие условию ||Λн|| = ||Λк|| = 1 (считается, что Λк ≠ ±Λн). Далее полагаем, что для допустимых движений кинетическая энергия вращения КА не должна превышать некоторой положительной величины Eдоп. Т.е. управление ограничено условием
(1.6)
${{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2} \leqslant 2{{E}_{{{\text{доп}}}}},$
где Eдоп – максимально допустимая кинетическая энергия вращения. Задача оптимального управления пространственным разворотом КА формулируется следующим образом: необходимо перевести КА из состояния (1.4) в состояние (1.5) в соответствии с уравнениями (1.1), (1.2) и ограничениями (1.3), (1.6) за минимальное время Т. Оптимальное решение М(t) ищется в классе кусочно-непрерывных функций.

Сформулированная динамическая задача управления КА отличается от рассматриваемых ранее задач максимального быстродействия тем, что оптимальная траектория вращения определяется при наличии ограничений не только на управляющий момент, но и на фазовые переменные (на угловую скорость КА), в этом состоит ее принципиальное отличие. Поскольку время окончания маневра Т не задано, разворот КА из состояния (1.4) в состояние (1.5) всегда можно осуществить (решение М(t) задачи (1.1)–(1.6) существует для любых сочетаний значений Λн, Λк, J1, J2, J3, и0). Оптимальное управление пространственной переориентацией КА обладает важными полезными свойствами. В частности, для управления, ограниченного условием (1.6), остановка вращения (при необходимости прекращения маневра в критической или нештатной ситуации) занимает время, не превышающее заранее известной величины.

2. Решение задачи оптимального управления разворотом. Поставленная задача управления (1.1)–(1.6) есть динамическая задача оптимального разворота твердого тела [1], в которой управляющими переменными являются моменты Мi, $i = \overline {1,3} $. Будем решать указанную задачу, используя принцип максимума Л.С. Понтрягина [27]. Пусть φi – сопряженные переменные, соответствующие переменным ${{\omega }_{i}}$, i = $\overline {1,3} $. Вместо сопряженных переменных ψj, соответствующих компонентам λj кватерниона Λ, $j = \overline {0,\;3} $, используем универсальные переменные ri, i = $\overline {1,3} $ [2], поскольку критерий оптимальности не включает позиционных координат (элементов кватерниона ориентации Λ). Ограничение на фазовые переменные λ j (и соответственно Λ) несущественно, так как оно выполняется при любых движениях КА вокруг центра масс; ||Λ(t)|| = const в силу уравнения (1.2) [1]; мы полагали ||Λ(0)|| = ||Λн|| = 1, поэтому ||Λ(t)|| = 1 в любой момент времени t ∈ [0, T ].

2.1. Функция Гамильтона и сопряженная система уравнений. Для динамической задачи оптимального управления (1.1)–(1.6) гамильтониан Н равен [2]

$\begin{gathered} H = --1 + {{\varphi }_{1}}({{М}_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{3}}){\text{/}}{{J}_{1}} + {{\varphi }_{2}}({{М}_{2}} + ({{J}_{3}}--{{J}_{1}}){{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + \\ + \,{{\varphi }_{3}}({{М}_{3}} + ({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} + {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}}, \\ \end{gathered} $
где

$\begin{gathered} {{r}_{1}} = ({{\lambda }_{0}}{{\psi }_{1}} + {{\lambda }_{3}}{{\psi }_{2}} - {{\lambda }_{1}}{{\psi }_{0}} - {{\lambda }_{2}}{{\psi }_{3}}){\text{/}}2;\quad {{r}_{2}} = ({{\lambda }_{0}}{{\psi }_{2}} + {{\lambda }_{1}}{{\psi }_{3}} - {{\lambda }_{2}}{{\psi }_{0}} - {{\lambda }_{3}}{{\psi }_{1}}){\text{/}}2; \\ {{r}_{3}} = ({{\lambda }_{0}}{{\psi }_{3}} + {{\lambda }_{2}}{{\psi }_{1}} - {{\lambda }_{3}}{{\psi }_{0}} - {{\lambda }_{1}}{{\psi }_{2}}){\text{/}}2. \\ \end{gathered} $

Оптимальные функции ri как компоненты вектора r и вектор r удовлетворяют уравнениям [2]

(2.1)
$\begin{gathered} {\mathbf{\dot {r}}} = - \omega \times {\mathbf{r}}, \\ {{{\dot {r}}}_{1}} = {{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}},\quad {{{\dot {r}}}_{2}} = {{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}},\quad {{{\dot {r}}}_{3}} = {{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}, \\ \end{gathered} $
где символ × обозначает операцию векторного произведения векторов. Уравнения для сопряженных функций φi имеют вид [27]
${{\dot {\varphi }}_{i}} = - \frac{{\partial H}}{{\partial {{\omega }_{i}}}},\quad i = \overline {1,3} ,$
или в развернутой форме:

(2.2)
$\begin{gathered} {{{\dot {\varphi }}}_{1}} = {{\omega }_{3}}{{\varphi }_{2}}({{J}_{1}} - {{J}_{3}}){\text{/}}{{J}_{2}} + {{\omega }_{2}}{{\varphi }_{3}}({{J}_{2}} - {{J}_{1}}){\text{/}}{{J}_{3}} - {{r}_{1}}, \\ {{{\dot {\varphi }}}_{2}} = {{\omega }_{3}}{{\varphi }_{1}}({{J}_{3}} - {{J}_{2}}){\text{/}}{{J}_{1}} + {{\omega }_{1}}{{\varphi }_{3}}({{J}_{2}} - {{J}_{1}}){\text{/}}{{J}_{3}} - {{r}_{2}}, \\ {{{\dot {\varphi }}}_{3}} = {{\omega }_{2}}{{\varphi }_{1}}({{J}_{3}} - {{J}_{2}}){\text{/}}{{J}_{1}} + {{\omega }_{1}}{{\varphi }_{2}}({{J}_{1}} - {{J}_{3}}){\text{/}}{{J}_{2}} - {{r}_{3}}. \\ \end{gathered} $

Гамильтониан Н составлен без учета ограничения ||Λ|| = 1 в силу равенства ||Λ(0)|| = 1, о чем договорились выше. Вектор r неподвижен относительно инерциального базиса I и |r| = const ≠ 0 (постоянство модуля |r| следует из свойств уравнений (2.1)). Решение r(t) системы (2.1) определяется начальным Λн и конечным Λк положениями КА. Оптимальная функция r(t) вычисляется через кватернион Λ(t) [1, 2]:

${\mathbf{r}} = \tilde {\Lambda } \circ {{{\mathbf{c}}}_{E}} \circ \Lambda ,\quad {\text{где}}\quad {{{\mathbf{c}}}_{E}} = {\text{const}} = {{\Lambda }_{{\text{н}}}} \circ {\mathbf{r}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}}$
(составляющие вектора cE – проекции вектора r на оси инерциального базиса I); $\tilde {\Lambda }$ – кватернион, сопряженный кватерниону Λ [1, с. 11–20]. Считается, что r(0) ≠ 0 (в противном случае r1 = = r2 = r3 ≡ 0 и дальнейшее решение задачи теряет смысл). Направление вектора cE зависит от начального и конечного положений КА. Для того, чтобы КА имел требуемую ориентацию на правом конце Λ(T) = Λк, необходимо определить вектор cE (или значение вектора r в начальный момент времени) исходя из получающихся при этом решений системы (1.2).

2.2. Условия максимума гамильтониана и структура оптимального решения. Определим условия максимума для функции Н. Перепишем гамильтониан в следующем виде:

$H = {{{{M}_{1}}{{\varphi }_{1}}} \mathord{\left/ {\vphantom {{{{M}_{1}}{{\varphi }_{1}}} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}}{\text{,}}$
где Hinv не зависит явно от управляющих функций Mi, $i = \overline {1,3} $. Введем вспомогательные переменные

${{{{g}_{i}} = {{\varphi }_{i}}} \mathord{\left/ {\vphantom {{{{g}_{i}} = {{\varphi }_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }},\quad {{{{u}_{i}} = {{M}_{i}}} \mathord{\left/ {\vphantom {{{{u}_{i}} = {{M}_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }}.$

После замены переменных гамильтониан H принимает вид H = ${{g}_{1}}{{u}_{1}} + {{g}_{2}}{{u}_{2}} + {{g}_{3}}{{u}_{3}}$ + Hinv, а ограничение (1.3) запишется так: $u_{1}^{2} + u_{2}^{2} + u_{3}^{2} \leqslant u_{0}^{2}$. Функция H максимальна, когда

${{{{u}_{i}} = {{u}_{0}}{{g}_{i}}} \mathord{\left/ {\vphantom {{{{u}_{i}} = {{u}_{0}}{{g}_{i}}} {\sqrt {g_{1}^{2} + g_{2}^{2} + g_{3}^{2}} }}} \right. \kern-0em} {\sqrt {g_{1}^{2} + g_{2}^{2} + g_{3}^{2}} }}.$

Нетрудно видеть, что в случае, когда $\varphi _{1}^{2} + \varphi _{2}^{2} + \varphi _{3}^{2}$ ≠ 0, максимум функции Н для управлений Мi(t) при ограничении (1.3) достигается, если

(2.3)
${{M}_{i}} = \frac{{{{u}_{0}}{{\varphi }_{i}}}}{{\sqrt {{{\varphi _{1}^{2}} \mathord{\left/ {\vphantom {{\varphi _{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{\varphi _{2}^{2}} \mathord{\left/ {\vphantom {{\varphi _{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{\varphi _{3}^{2}} \mathord{\left/ {\vphantom {{\varphi _{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }},\quad i = \overline {1,3} .$

Обозначим

$E(t) = ({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}){\text{/}}2.$

В начале и в конце разворота ограничение (1.6) несущественно, оно переходит в строгое неравенство, так как угловые скорости в начальный и конечный моменты времени равны нулю: ω(0) = ω(T) = 0. Поэтому в интервалах движения, когда E(t) < Eдоп, оптимальное решение определяется замкнутой системой уравнений (1.1), (1.2), (2.1)–(2.3) с учетом требований (1.4), (1.5). Системе (1.1), (2.1)–(2.3) удовлетворяют функции φi, пропорциональные ri. С учетом условий разворота ω(0) = ω(Т) = 0 система уравнений (1.1), (2.1)–(2.3) имеет единственное решение, в котором φi и угловые скорости ωi связаны с переменными ri выражениями

(2.4)
${{\varphi }_{i}} = a(t){{r}_{i}},\quad i = \overline {1,3} ,$
(2.5)
${{\omega }_{i}} = b(t){{r}_{i}}{\text{/}}{{J}_{i}},\quad i = \overline {1,3} ,$
где a(t), b(t) – скалярные функции времени. Подстановка равенств (2.4), (2.5) в систему (2.2) с учетом уравнений (1.1), (2.1), (2.3) превращает все три уравнения (2.2) в тождества, если $\dot {a}$ = –1, что доказывает истинность решения (2.4), (2.5). Оптимальная функция a(t) описывается зависимостью a(t) = a(0) – t. Значение a(0) определяется временными параметрами разворота. Значение r(0) такое, чтобы в результате интегрирования уравнений (1.1), (1.2), (2.1), (2.5) с начальными условиями Λ(0) = Λн для траектории движения Λ(t) выполнялось равенство Λ(Т) = Λк.

Разворот КА совершается максимально быстро, если в каждый момент времени t угловая скорость максимальна, насколько это позволяют ограничения (1.3) и (1.6). Выше было показано, что если E(t) < Eдоп, то оптимальным является управление (2.3) и М ≠ 0, если φ ≠ 0 (компонентами вектора φ являются сопряженные переменные φi, а ui – компоненты вектора u). При условии E(t) = const = Eдоп область возможных значений u сокращается из шара |u| ≤ u0 до плоского круга, ограниченного окружностью, образованной пересечением сферы с плоскостью, перпендикулярной вектору, компонентами которого являются ${{\omega }_{i}}\sqrt {{{J}_{i}}} $ (так как для выполнения E(t) = const = Eдоп должно быть $\dot {E} = 0$ и, следовательно, Мω = 0); знак умножения “” означает скалярное произведение векторов. Оптимальный момент М обязан находиться внутри сечения эллипсоида (1.3) плоскостью, перпендикулярной угловой скорости ω с тем, чтобы $\dot {E} = 0$, пока не наступит момент начала остановки вращения (а он существует, поскольку ω(T) = 0).

На участке разгона (начиная с момента t = 0), когда E(t) < Eдоп и кинетическая энергия вращения E(t) возрастает, оптимальным является М ≠ 0 и a(t) > 0, и как следствие

(2.6)
${{M}_{i}} = \frac{{{{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2}} }}$
(заметим, что управляющий момент (2.6) делает раскрутку максимально быстрой [24] и значение E(t) = Eдоп достигается за минимальное время при ограничении (1.3)). На участке торможения (в интервале времени слева от момента t = T), когда E(t) < Eдоп и кинетическая энергия вращения E(t) уменьшается, оптимальным является М ≠ 0 и a(t) < 0, чтобы $\dot {E} < 0$, и поэтому
(2.7)
${{M}_{i}} = \frac{{ - {{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2} + {{J}_{3}}\omega _{3}^{2}} }}$
(слева от момента t = T управляющий момент М и кинетический момент L имеют противоположные направления и длительность остановки вращения минимальна [24]). На участках разгона и торможения, когда E(t) < Eдоп, кинетическая энергия вращения изменяется в соответствии с уравнением $\dot {E} = \pm {{u}_{0}}\sqrt {2E} $ (“+” соответствует разгону, “–” – торможению). Поэтому для участка разгона E(t) = $u_{0}^{2}{{t}^{2}}{\text{/}}2$, а для участка торможения E(t) = $u_{0}^{2}$(T – t)2/2. Поскольку в момент окончания разгона и в момент начала торможения кинетическая энергия одна и та же, то длительности разгона и торможения одинаковы и равны τ = tр = $\sqrt {2{{E}_{{\max }}}} {\text{/}}{{u}_{0}}$, где Emax = E(T/2) – максимальная энергия вращения.

В зависимости от условий разворота (сочетания значений Λн, Λк и J1, J2, J3, u0) в оптимальном движении из начального положения Λн в конечное положение Λк максимальная кинетическая энергия вращения может быть меньше Eдоп, а может возникнуть необходимость вращения какое-то время с выполнением равенства E(t) = const = Eдоп. Сформулируем условия, когда оптимальное управление исключает наличие моментов времени, в которые КА вращается с постоянной кинетической энергией. Для того, чтобы $\dot {E} \ne 0$ на всем отрезке времени t ∈ [0, T], время разворота T должно быть меньше, чем $2\sqrt {2{{E}_{{{\text{доп}}}}}} {\text{/}}{{u}_{0}}$. Чтобы рассчитать время оптимального разворота T, воспользуемся понятием “функционал пути” [19]:

(2.8)
$S = \int\limits_0^T {\sqrt {{{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}} dt} ,$
который не зависит от характера изменения скалярной функции b(t), если движение КА удовлетворяет уравнениям (2.1), (2.5) [19]. Исходя из соотношений $T\sqrt {2{{E}_{{\max }}}} = 2S$, Emax = $u_{0}^{2}{{\tau }^{2}}{\text{/}}2$ и T = 2τ, получаем T = $2\sqrt {S{\text{/}}{{u}_{0}}} $ = Tfast – минимально возможное время разворота в условиях ограничения (1.3) даже без учета требования (1.6) к кинетической энергии вращения. Значение Tfast соответствует развороту, во время которого отсутствует участок движения с E(t) = const. Для оптимального управления с одной точкой переключения в момент времени t = T/2 необходимо выполнение условия Tfast$2\sqrt {2{{E}_{{{\text{доп}}}}}} {\text{/}}{{u}_{0}}$. Если и0S ≤ 2Eдоп, то во время максимально быстрого разворота вращение КА в режиме E(t) = const невозможно.

Если и0S > 2Eдоп, то неизбежно вращение КА с постоянной кинетической энергией вращения (при этом a(t) ≥ 0). Разница S – 2Eдоп/и0 определяет продолжительность участка движения, когда E(t) = const = Eдоп. Найдем, каким должно быть оптимальное управление М, чтобы удовлетворялось условие $\dot {E} = 0$ с одновременной максимизацией гамильтониана H.

При выполнении соотношений (2.4), (2.5) гамильтониан H равен

$H = --1 + a({{М}_{1}}{{r}_{1}}{\text{/}}{{J}_{1}} + {{М}_{2}}{{r}_{2}}{\text{/}}{{J}_{2}} + {{М}_{3}}{{r}_{3}}{\text{/}}{{J}_{3}}) + b(r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}).$

В интервале вращения с постоянной кинетической энергией E(t) = Eдоп выполняется условие

(2.9)
${{М}_{1}}{{\omega }_{1}} + {{М}_{2}}{{\omega }_{2}} + {{М}_{3}}{{\omega }_{3}} = 0.~$

Для решения (2.4), (2.5) при условии E(t) = const = Eдоп имеем φ1М1/J1 + φ2М2/J2 + φ3М3/J3 = = а(t)(М1ω1 + М2ω2 + М3ω3)/b(t) = 0 и поэтому

(2.10)
$H = {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}} - 1$
(очевидно, b(t) ≠ 0 в интервале времени, когда E(t) = Eдоп). Угловые скорости ωi, при которых достигается максимум гамильтониана H (с учетом E(t) = Eдоп), будут следующими:

(2.11)
${{\omega }_{i}} = \frac{{{{r}_{i}}\sqrt {2{{E}_{{{\text{доп}}}}}} }}{{{{J}_{i}}\sqrt {r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}} }}.$

Подставив указанные зависимости для оптимальных угловых скоростей ωi в динамические уравнения (1.1) с учетом уравнений (2.1) для оптимальных функций ri, получим оптимальный силовой момент М = 0 для моментов времени, когда E(t) = const = Eдоп (на участке между разгоном и торможением). Найдем производную $\dot {H}$ с учетом условия E(t) = const :

$\begin{gathered} \dot {H} = {{{\dot {\omega }}}_{1}}{{r}_{1}} + {{{\dot {\omega }}}_{2}}{{r}_{2}} + {{{\dot {\omega }}}_{3}}{{r}_{3}} + {{\omega }_{1}}{{{\dot {r}}}_{1}} + {{\omega }_{2}}{{{\dot {r}}}_{2}} + {{\omega }_{3}}{{{\dot {r}}}_{3}} = {{\omega }_{1}}{{{\dot {r}}}_{1}} + {{\omega }_{2}}{{{\dot {r}}}_{2}} + {{\omega }_{3}}{{{\dot {r}}}_{3}} + \\ + \,~{{r}_{1}}({{М}_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{3}}){\text{/}}{{J}_{1}} + {{r}_{2}}({{М}_{2}} + ({{J}_{3}}--{{J}_{1}}){{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + {{r}_{3}}({{М}_{3}} + ({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} = \\ \end{gathered} $
$ = {{\omega }_{1}}{{\dot {r}}_{1}} + {{\omega }_{2}}{{\dot {r}}_{2}} + {{\omega }_{3}}{{\dot {r}}_{3}} = {{\omega }_{1}}({{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}}) + {{\omega }_{2}}({{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}}) + {{\omega }_{3}}({{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}) = 0,$
так как на этапе разгона оптимальный момент М и вектор φ имеют одинаковое направление и в момент окончания разгона ri = Jiωi/b. Покажем, что $r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}} = {\text{const}}$. Возьмем производную от левой части указанного равенства с учетом (2.5):

$\begin{gathered} {{r}_{1}}{{{\dot {r}}}_{1}}{\text{/}}{{J}_{1}} + {{r}_{2}}{{{\dot {r}}}_{2}}{\text{/}}{{J}_{2}} + {{r}_{3}}{{{\dot {r}}}_{3}}{\text{/}}{{J}_{3}} = {{r}_{1}}({{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}}){\text{/}}{{J}_{1}} + {{r}_{2}}({{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}}){\text{/}}{{J}_{2}} + {{r}_{3}}({{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}){\text{/}}{{J}_{3}} = \\ = b{{r}_{1}}{{r}_{2}}{{r}_{3}}({{J}_{2}}--{{J}_{3}} + {{J}_{3}}--{{J}_{1}} + {{J}_{1}}--{{J}_{2}}){\text{/}}({{J}_{1}}{{J}_{2}}{{J}_{3}}) \equiv 0. \\ \end{gathered} $

Поскольку |r| ≠ 0 и H = const внутри отрезка времени, на котором E(t) = const = Eдоп (так как $\dot {H}$ = 0), то b = const = $(1 + H){\text{/}}(r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}})$. Это означает, что в оптимальном развороте в интервале времени, когда E(t) = const = Eдоп, будет |L| = const. Этот факт только подтверждает вывод об оптимальности значения М = 0 в моменты времени, когда E(t) = const. Вращение по инерции есть частный случай закономерности (2.5) с учетом (2.1). На момент достижения равенства E(t) = Eдоп направления оптимального вектора φ и кинетического момента L совпадают, поэтому единственным решением системы (1.1), (2.1), (2.2) в интервале времени, когда E(t) = const, являются зависимости (2.4), в которых $\dot {a}$ = –1. Из свойства непрерывности функции a(t) следует, что a(t) = a(0) – t  для любого момента времени t, пока a(t) ≥ 0. Как только a(t) < 0, так управление (2.3) становится оптимальным, потому что φ ≠ 0 и силовой момент (2.3) (а значит, и (2.7)) не нарушает требования (1.6), поскольку при таком управлении будет МL < 0 и $\dot {E} < 0$. Следовательно, решение (2.4), (2.5), в котором a(t) = a(0) – t, справедливо для всего интервала времени t ∈ [0, T] (в оптимальном решении a(0) > 0, a(T) < 0).

Таким образом, в зависимости от значения “функционала пути” (2.8), вычисленного для движения в соответствии с уравнениями (2.1), (2.5), реализуется один из двух вариантов оптимального управления: если и0S ≤ 2Eдоп, то оптимальным является релейное управление с одной точкой переключения, при котором a(Т) = –a(0), а если и0S > 2Eдоп, то оптимальным является релейное управление с двумя точками переключения, при котором a(0) > –a(T). Рисунок 1 отражает второй вариант оптимального управления, при котором существует отрезок времени с E(t) = const (при выполнении условия S > 2Eдоп/и0 для значения (2.8)); t1 – ближайший к началу разворота момент достижения равенства E(t) = Eдоп; t2 – момент смены знака скалярной функции a(t) (начиная с момента времени t = t2 для функции a(t) верно условие a(t) < 0). На временах t > t2 имеем a(t) < 0 и оптимальным является управление (2.3), потому что при таком силовом моменте будет Мω = $\dot {E}$ < 0 и ограничение (1.6) становится несущественным (его можно не учитывать при дальнейшем приближении к t = T). В интервалах t < t1 и t > t2 оптимальным управлением является (2.3), при котором соответственно будет |M| = const = u0/C. Здесь обозначено C = = $\sqrt {p_{1}^{2}{\text{/}}{{J}_{1}} + p_{2}^{2}{\text{/}}{{J}_{2}} + p_{3}^{2}{\text{/}}{{J}_{3}}} $ = const, pi = ri/r0, r0 = const = |r| ≠ 0.

Рис. 1

На участке вращения с максимально допустимой кинетической энергией оптимальный момент М определяется из трех условий: ограничения (1.3), требования (2.9) и условия, что в каждый текущий момент времени t, пока E(t) = const = Eдоп, гамильтониан H принимает максимальное значение. Учитывая структуру гамильтониана (2.10), приходим к выводу, что во время вращения КА с постоянной максимально допустимой кинетической энергией оптимальным является такое управление М, при котором в каждый текущий момент времени t, пока E(t) = const = Eдоп, угловая скорость ω удовлетворяет соотношениям (2.11). Требование (2.9) привело к структуре (2.10), при которой гамильтониан H не зависит явным образом от силового момента М. Справедливость утверждения, что движение с угловой скоростью (2.11) соответствует максимуму гамильтониана H, легко доказать после замены переменных

${{y}_{i}} = {{\omega }_{i}}\sqrt {{{J}_{i}}} ,\quad {{{{z}_{i}} = {{r}_{i}}} \mathord{\left/ {\vphantom {{{{z}_{i}} = {{r}_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }},$
записав
$H = {{y}_{1}}{{z}_{1}} + {{y}_{2}}{{z}_{2}} + {{y}_{3}}{{z}_{3}} - 1$
с учетом равенств ${{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}$ = 2Eдоп, $y_{1}^{2} + y_{2}^{2} + y_{3}^{2}$ = 2Eдоп для угловой скорости ω. Оптимальное значение момента М вычисляем путем подстановки оптимальных угловых скоростей (2.11) в динамические уравнения (1.1) с учетом зависимостей (2.1) для универсальных переменных ri и проверки выполнения условий (1.3), (2.9) (т.е. чтобы управляющий момент М находился внутри области допустимых значений). В результате получили М = 0. Очевидно, что найденное управление М удовлетворяет неравенству (1.3) и равенству (2.9).

Таким образом, структура оптимального управления полностью определена:

${\mathbf{M}}(t) = \left\{ \begin{gathered} \frac{{{{u}_{0}}{\text{sign}}a(t)}}{{\sqrt {{{r_{1}^{2}} \mathord{\left/ {\vphantom {{r_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{r_{2}^{2}} \mathord{\left/ {\vphantom {{r_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{r_{3}^{2}} \mathord{\left/ {\vphantom {{r_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}{\mathbf{r}},\quad {\text{если}}\quad E(t) < {{E}_{{{\text{доп}}}}}\quad {\text{или}}\quad a(t) < 0; \hfill \\ 0,\quad {\text{если}}\quad a(t) > 0\quad {\text{и}}\quad E(t) = {{E}_{{{\text{доп}}}}}. \hfill \\ \end{gathered} \right.$

Заметим, что вращение по инерции полностью соответствует решению (2.4), (2.5) (угловые скорости (2.11) есть частный случай (2.5) и не противоречат соотношениям (2.4)). Поэтому найденное оптимальное решение (2.4), (2.5) справедливо на всем интервале управления t ∈ [0, T].

Краевая задача принципа максимума заключается в определении такого значения вектора r(0), при котором решение системы дифференциальных уравнений (1.1), (1.2), (2.1), (2.2) с одновременным выполнением условия (2.3), если φr < 0 или E(t) < Eдоп, или М = 0, если φr > 0 и E(t) = Eдоп, удовлетворяло условиям разворота (1.4), (1.5). Константа r0 определяется из уравнения H(Т) = 0 (так как время окончания оптимального процесса не фиксировано). Вычислим H(Т) с учетом зависимостей (2.4):

$H(Т) = - 1 + a(T)( - {{u}_{0}}\sqrt {r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}} ) = - 1 - {{u}_{0}}a(T){{r}_{0}}C$
(угловые скорости в конечный момент t = T равны нулю); $С = \sqrt {p_{{10}}^{2}{\text{/}}{{J}_{1}} + p_{{20}}^{2}{\text{/}}{{J}_{2}} + p_{{30}}^{2}{\text{/}}{{J}_{3}}} $, где p10, p20, p30 – компоненты вектора p0 = p(0) (p = r/|r| – орт вектора r). Значение a(Т) оптимальной функции a(t) в конечный момент времени равно a(Т) = –1/(u0r0C). При любом типе оптимального управления (с одной или двумя точками переключения) a(Т) = –τ (напомним, τ – длительность разгона и торможения). Поэтому r0 = 1/(u0τC). Отсюда оптимальное значение r0 равно r0 = = ${1 \mathord{\left/ {\vphantom {1 {(C\sqrt {2{{E}_{{{\text{доп}}}}}} )}}} \right. \kern-0em} {(C\sqrt {2{{E}_{{{\text{доп}}}}}} )}}$, если присутствует участок вращения с постоянной максимально допустимой кинетической энергией Eдоп (так как a(Т) = $ - {{{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } u}} \right. \kern-0em} u}}_{0}}$). Для оптимального управления с одной точкой переключения a(Т) = –Т/2 = $ - \sqrt {S{\text{/}}{{u}_{0}}} $, поэтому r0 = ${1 \mathord{\left/ {\vphantom {1 {(C\sqrt {{{u}_{{\text{0}}}}S} )}}} \right. \kern-0em} {(C\sqrt {{{u}_{{\text{0}}}}S} )}}$. В результате

${{r}_{0}} = \max (1{\text{/}}\sqrt {{{u}_{0}}S} ,1{\text{/}}\sqrt {2{{E}_{{{\text{доп}}}}}} ){\text{/}}C$.

Время оптимального разворота T рассчитывается на основании “функционала пути” (2.8). Поскольку оптимальное движение КА удовлетворяет уравнениям (2.1), (2.5), то значение S не зависит от характера изменения скалярной функции b(t) и является минимально возможным [19]. Если и0S > 2Eдоп, то имеет место участок вращения КА с E(t) = const и длительность оптимального разворота T вычисляется по формуле

(2.12)
$T = {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }} + {{{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } u}} \right. \kern-0em} u}}_{0}}.$

При этом время разгона τ составляет

$\tau = {{{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } u}} \right. \kern-0em} u}}_{0}},$
а длительность неуправляемого вращения будет

${{t}_{{{\text{св}}}}} = {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }} - {{{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } u}} \right. \kern-0em} u}}_{0}}.$

Если и0S ≤ 2Eдоп, то в оптимальном движении не существует моментов времени, когда E(t) = = const (tсв = 0) и длительность оптимального разворота T равна T = $2\sqrt {S{\text{/}}{{u}_{0}}} $ = Tfast.

С учетом того, что уравнения (2.1), (2.5) удовлетворяются на всем интервале управления t ∈[0, T ], оптимальное движение определяют зависимости:

(2.13)
${{M}_{i}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{р}}--t) + {\text{sign}}({{t}_{т}}--t)]{{p}_{i}},\quad i = \overline {1,3} $,
(2.14)
${{J}_{i}}{{\omega }_{i}} = 0.5{{m}_{0}}({{t}_{{\text{р}}}} + {{t}_{{\text{т}}}}--\,{\text{|}}t--{{t}_{{\text{р}}}}{\text{|}}--\,{\text{|}}t--{{t}_{{\text{т}}}}{\text{|}}){{p}_{i}},\quad i = \overline {1,3} ,$
где pi – компоненты вектора p, tр – время окончания разгона, tт – момент начала торможения,

$\begin{gathered} {{t}_{{\text{p}}}} = \min (\sqrt {S{\text{/}}{{u}_{0}}} ,{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}),\quad {{t}_{{\text{т}}}} = \max (\sqrt {S{\text{/}}{{u}_{0}}} ,{S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }}), \\ {\mathbf{p}} = \tilde {\Lambda } \circ {{\Lambda }_{{\text{н}}}} \circ {{{\mathbf{p}}}_{0}} \circ {{{\tilde {\Lambda }}}_{{\text{н}}}} \circ \Lambda ,\quad {{m}_{0}} = {{u}_{0}}{\text{/}}C. \\ \end{gathered} $

Закон вращения (2.14) удовлетворяет граничным условиям ω(0) = 0 и ω(T) = 0, так как tр + tт = Т, и выражение в скобках обнуляется при t = 0 и t = Т. Зависимости (2.1), (2.13), (2.14) с учетом равенств ri = r0рi – единственное решение задачи оптимального управления (1.1)–(1.6). Из (2.1), (2.13) и соотношений ri = r0рi явно видно, что при оптимальном управлении момент сил М действует вдоль прямой, неподвижной в инерциальной системе координат. Уравнения (2.14) отчетливо показывают, что в геометрическом представлении вектор р интерпретируется как орт оптимального кинетического момента КА L в связанной с КА системе координат. Оптимальным (в смысле минимума времени Т) будет разворот КА, при котором направление кинетического момента остается неизменным относительно инерциальной системы координат (векторы М и L коллинеарны). Еще одним основным свойством оптимального разворота КА является тот факт, что во все время движения (на всем отрезке времени [0, T ]) отношение кинетической энергии вращения Е к квадрату модуля кинетического момента КА постоянно:

$E/{\text{|}}{\mathbf{L}}{{{\text{|}}}^{2}} = 0.5({{r_{1}^{2}} \mathord{\left/ {\vphantom {{r_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{r_{2}^{2}} \mathord{\left/ {\vphantom {{r_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{r_{3}^{2}} \mathord{\left/ {\vphantom {{r_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}})/{\text{|}}{\mathbf{r}}{{{\text{|}}}^{2}} = {\text{const}} = ({{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}){\text{/}}2.$

Для вращений в соответствии с (2.1), (2.5) значение “функционала пути” (2.8) минимально.

2.3. Обоснование единственности оптимального решения. Покажем, что найденное решение (2.4), (2.5) – единственное решение системы уравнений (1.1), (2.1)–(2.3). Введем единичный вектор q для вектора φ, такой, что q(0) ⋅ φ(0) > 0 и φ = χq, где χ – скалярная функция c начальным значением χ(0) > 0; |q| = 1. Тогда оптимальный момент М будет равен

${\mathbf{M}} = \frac{{{{u}_{0}}{\text{sign}}\chi }}{{\sqrt {{{q_{1}^{2}} \mathord{\left/ {\vphantom {{q_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{q_{2}^{2}} \mathord{\left/ {\vphantom {{q_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{q_{3}^{2}} \mathord{\left/ {\vphantom {{q_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}{\mathbf{q}}$.

Так как χ(0) > 0, то в окрестности точки t = 0 имеем М = hq и М || L, L = Kq, где h – скалярная величина (на участке разгона h > 0); L = JКАω – кинетический момент КА; JКА = diag {J1, J2, J3} – тензор инерции КА. Подставим формулы (2.3) с учетом зависимости φ = χ (t) q в уравнения (1.1) при наличии равенств Jiωi = Kqi:

(2.15)
$\dot {K}{\mathbf{q}} + K{\mathbf{\dot {q}}} + \omega \times {\mathbf{q}}K = h{\mathbf{q}}.$

Сумма $K{\mathbf{\dot {q}}} + \omega \times {\mathbf{q}}K$ ортогональна орту q или равна нулю (всегда q${\mathbf{\dot {q}}}$ = 0, так как |q| = 1). Поэтому уравнение (2.15) выполняется в единственном случае, если $\dot {K} = h$ и ${\mathbf{\dot {q}}} = - \omega \times {\mathbf{q}}$ (т.е. когда направление вектора q остается неизменным относительно инерциального базиса I). Теперь подставим равенства φi = χqi и ωi = Kqi/Ji в уравнения (2.2), которые представим в виде

(2.16)
${\mathbf{\dot {\varphi }}} = ({{J}_{{{\text{КА}}}}}{\mathbf{\omega }}) \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{\varphi }}) - {{J}_{{{\text{КА}}}}}({\mathbf{\omega }} \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{\varphi }})) - {\mathbf{r}}.$

Левая часть уравнения (2.16) для вектора сопряженных переменных равна

$\dot {\chi }{\mathbf{q}} + \chi {\mathbf{\dot {q}}} = \dot {\chi }{\mathbf{q}} - \chi {\mathbf{\omega }} \times {\mathbf{q}}$
(уравнения (1.1), (2.2) должны выполняться одновременно, поэтому свойство ${\mathbf{\dot {q}}} = - \omega \times {\mathbf{q}}$ взято из (2.15)). Правая часть уравнения (2.16) будет такой:

$K{\mathbf{q}} \times (J_{{{\text{КА}}}}^{{ - 1}}\chi {\mathbf{q}})--c{{J}_{{{\text{КА}}}}}((J_{{{\text{КА}}}}^{{ - 1}}K{\mathbf{q}}) \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}))--{\mathbf{r}} = --\chi (KJ_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}}--{\mathbf{r}} = --\chi {\mathbf{\omega }} \times {\mathbf{q}}--{\mathbf{r}}.$

Приравнивая левую и правую части уравнения (2.16), получим уравнение для вектора q:

$\dot {\chi }{\mathbf{q}}--\chi {\mathbf{\omega }} \times {\mathbf{q}} = --\chi {\mathbf{\omega }} \times {\mathbf{q}}--{\mathbf{r}}.$

Отсюда следует необходимое условие оптимальности r = –$\dot {\chi }$q, из которого неизбежны равенства (2.4), в которых а (0) > 0, так как $\dot {a}$(t) = –1, причем $\dot {\chi }$ = const и q = r/|r|, откуда имеем следующие свойства: $\dot {\chi }$ = –r0, χ(t) = r0а(t), К = |L| = r0b(t), где r0 = const = |r(0)| (так как χ(0) > 0 и χ(T) < 0, а поэтому $\dot {\chi }$ < 0). В итоге заключаем, что если в какой-нибудь момент времени t кинетический момент L и вектор φ коллинеарны, то они коллинеарны на всем интервале времени 0 < t < T. В силу наличия граничных условий ω(0) = 0 и ω(T) = 0 векторы L и φ коллинеарны как минимум 2 раза – в самом начале разворота (L = htq при t → 0) и в самом конце маневра (L = h(tT)q при tT); во время остановки вращения h < 0.

На участке разгона существует как минимум один момент времени, когда векторы L и φ коллинеарны, и на участке торможения существует как минимум один момент времени, когда векторы L и φ коллинеарны, а между разгоном и торможением (если существует интервал движения с E(t) = const) оптимальным является вращение по инерции и уравнения (2.1), (2.5) выполняются, из-за чего единственным решением уравнений (2.2) будет (2.4). Следовательно, на всем интервале управления t ∈[0, T ] зависимости (2.4), (2.5) – единственное решение, удовлетворяющее необходимым условиям оптимальности. Значит, никакое отличное от (2.13), (2.14) движение не может быть оптимальным, так как оно не будет удовлетворять необходимым условиям оптимальности.

На участке разгона (когда E(t) < Eдоп и $\dot {E}$ > 0) L(t) = |L|$\tilde {\Lambda } \circ $ Λн $ \circ $ p(0) $ \circ \,{{\tilde {\Lambda }}_{{\text{н}}}}$ $ \circ $ Λ, на участке вращения с E(t) = const = Eдоп будет Λ $ \circ $ L(t) $ \circ \,\tilde {\Lambda }$ = const, а на участке торможения (когда E(t) < Eдоп и $\dot {E}$ < 0) L(t) = |L|$\tilde {\Lambda } \circ $ Λк $ \circ $ p(T) $ \circ \,{{\tilde {\Lambda }}_{{\text{к}}}}$ $ \circ $ Λ. Поэтому для характерных моментов времени имеем:

${\mathbf{L}}({{t}_{{\text{p}}}}) = {\text{|}}{\mathbf{L}}({{t}_{{\text{p}}}}){\text{|}}\tilde {\Lambda }({{t}_{{\text{p}}}}) \circ {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}} \circ \Lambda ({{t}_{{\text{p}}}}),$
${\mathbf{L}}({{t}_{{\text{т}}}}) = \tilde {\Lambda }({{t}_{{\text{т}}}}) \circ \Lambda ({{t}_{{\text{p}}}}) \circ {\mathbf{L}}({{t}_{{\text{p}}}}) \circ \tilde {\Lambda }({{t}_{{\text{p}}}}) \circ \Lambda ({{t}_{{\text{т}}}}) = {\text{|}}{\mathbf{L}}({{t}_{{\text{p}}}}){\text{|}}\tilde {\Lambda }({{t}_{{\text{т}}}}) \circ {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}} \circ \Lambda ({{t}_{{\text{т}}}}),$
${\mathbf{L}}(t > {{t}_{{\text{т}}}}) = \tilde {\Lambda } \circ \Lambda ({{t}_{{\text{т}}}}) \circ {\mathbf{L}}({{t}_{{\text{т}}}}) \circ \tilde {\Lambda }({{t}_{{\text{т}}}}) \circ \Lambda = {\text{|}}{\mathbf{L}}{\text{|}}\tilde {\Lambda } \circ {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}} \circ \Lambda ,$

Подставив L(tт) в соотношение Λ(tт) $ \circ $ L(tт) $ \circ \,\tilde {\Lambda }({{t}_{{\text{т}}}})$ = |L(tт)|Λк $ \circ $ p(T) $ \circ \,{{\tilde {\Lambda }}_{{\text{к}}}}$, получим

${\mathbf{p}}(T) = {{\tilde {\Lambda }}_{{\text{к}}}} \circ \Lambda ({{t}_{{\text{т}}}}) \circ {\mathbf{L}}({{t}_{{\text{т}}}}) \circ \tilde {\Lambda }({{t}_{{\text{т}}}}) \circ {{\Lambda }_{{\text{к}}}}/{\text{|}}{\mathbf{L}}({{t}_{{\text{т}}}}){\text{|}} = {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}.$

Установлено, что все три участка движения принадлежат одной траектории, определяемой системой уравнений (1.2), (2.1), (2.5); при этом b(t) – кусочно-линейная функция времени с точками излома tр и tт, у которой $\dot {b}$ > 0 для ttр, $\dot {b}$ = 0 для tр < ttт и $\dot {b}$ < 0 для t > tт, а b(0) = b(T) = 0. Кроме того, |$\dot {b}$| = const = u0 /(r0C), если ttр и t > tт; и в моменты перехода с одного участка траектории на другой участок выполняются соотношения:

$\Lambda ({{t}_{{\text{p}}}}) \circ {\mathbf{L}}({{t}_{{\text{p}}}}) \circ \tilde {\Lambda }({{t}_{{\text{p}}}}) = {\text{|}}{\mathbf{L}}({{t}_{{\text{p}}}}){\text{|}}{{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}},\quad \Lambda ({{t}_{{\text{т}}}}) \circ {\mathbf{L}}({{t}_{{\text{т}}}}) \circ \tilde {\Lambda }({{t}_{{\text{т}}}}) = \Lambda ({{t}_{{\text{p}}}}) \circ {\mathbf{L}}({{t}_{{\text{p}}}}) \circ \tilde {\Lambda }({{t}_{{\text{p}}}}),$
$\Lambda ({{t}_{{\text{т}}}}) \circ {\mathbf{L}}({{t}_{{\text{т}}}}) \circ \tilde {\Lambda }({{t}_{{\text{т}}}}) = {\text{|}}{\mathbf{L}}({{t}_{{\text{т}}}}){\text{|}}{{\Lambda }_{{\text{к}}}} \circ {\mathbf{p}}(T) \circ {{\tilde {\Lambda }}_{{\text{к}}}},\quad {\text{|}}{\mathbf{L}}({{t}_{{\text{т}}}}){\text{|}} = {\text{|}}{\mathbf{L}}({{t}_{{\text{p}}}}){\text{|}}\,,$
$\begin{gathered} {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{{\tilde {\Lambda }}}_{{\text{н}}}} = \Lambda ({{t}_{{\text{p}}}}) \circ {\mathbf{p}}({{t}_{{\text{p}}}}) \circ \tilde {\Lambda }({{t}_{{\text{p}}}}) = \Lambda ({{t}_{{\text{т}}}}) \circ {\mathbf{p}}({{t}_{{\text{т}}}}) \circ \tilde {\Lambda }({{t}_{{\text{т}}}}) = {{\Lambda }_{{\text{к}}}} \circ {\mathbf{p}}(T) \circ {{{\tilde {\Lambda }}}_{{\text{к}}}}, \\ {\mathbf{p}}(t) = \tilde {\Lambda } \circ {{\Lambda }_{{\text{н}}}} \circ {{{\mathbf{p}}}_{0}} \circ {{{\tilde {\Lambda }}}_{{\text{н}}}} \circ \Lambda . \\ \end{gathered} $

Функции Λ(t), ω(t), p(t) непрерывны внутри всего отрезка времени t ∈[0, T] и Λ $ \circ $ p(t) $ \circ \,\tilde {\Lambda }$ = const.

На участке разгона Λ $ \circ $ l(t) $ \circ \,\tilde {\Lambda }$ = const и l(t) = $\tilde {\Lambda } \circ $ Λн $ \circ $ p(0) $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ $ \circ $ Λ, между разгоном и торможением КА вращается по инерции и Λ $ \circ $ l(t) $ \circ \tilde {\Lambda }$ = const = Λ(tр) $ \circ $ l(tр) $ \circ $ $\tilde {\Lambda }({{t}_{{\text{р}}}})$ = Λн $ \circ $ p(0) $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ (так как l(tр) = $\tilde {\Lambda }({{t}_{{\text{р}}}}) \circ $ Λн $ \circ $ p(0) $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ $ \circ $ Λ(tр)), а l(t) = $\tilde {\Lambda } \circ $ Λ(tр) $ \circ $ l(tр) $ \circ $ $\tilde {\Lambda }({{t}_{{\text{р}}}}) \circ $ Λ = $\tilde {\Lambda } \circ $ Λн $ \circ $ p(0) $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ $ \circ $ Λ; на участке торможения Λ $ \circ $ l(t) $ \circ \tilde {\Lambda }$ = const = Λ(tт) $ \circ $ l(tт) $ \circ \tilde {\Lambda }({{t}_{{\text{т}}}})$ = Λн $ \circ $ p(0) $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ (так как l(tт) = $\tilde {\Lambda }({{t}_{{\text{т}}}}) \circ $ Λн $ \circ $ p(0) $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ $ \circ $ $ \circ $ Λ(tт)) и l(t) = $\tilde {\Lambda } \circ $ Λк $ \circ $ p(T) $ \circ {{\tilde {\Lambda }}_{{\text{к}}}}$ $ \circ $ Λ, откуда l(t) = p(t) на всем отрезке времени t ∈ [0, T], где l = L/|L| – орт кинетического момента КА.

Для функций a(t), b(t) оптимального решения справедливы следующие соотношения:

$a(0) = Т--1{\text{/}}({{u}_{0}}{{r}_{0}}C),\quad a(T) = --1{\text{/}}({{u}_{0}}{{r}_{0}}C),\quad b(t) = 0.5{{u}_{0}}(T--\,{\text{|}}t--{{t}_{р}}{\text{|}}--\,{\text{|}}t--{{t}_{т}}{\text{|}}){\text{ /}}({{r}_{0}}C).$

Время разворота T и оптимальное значение r0 равны:

(2.17)
$T = \max ({{2\sqrt {S{\text{/}}{{u}_{0}}} ;S} \mathord{\left/ {\vphantom {{2\sqrt {S{\text{/}}{{u}_{0}}} ;S} {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }} + {{{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } u}} \right. \kern-0em} u}}_{0}}),\quad {{r}_{0}} = \max (1{\text{/}}\sqrt {{{u}_{0}}S} ,1{\text{/}}\sqrt {2{{E}_{{{\text{доп}}}}}} ){\text{/}}C.$

Максимальная энергия вращения за время оптимального разворота Emax = min(u0S/2, Eдоп). Максимальный модуль кинетического момента Lmax = ${{\sqrt {\min ({{u}_{0}}S,2{{E}_{{{\text{доп}}}}})} } \mathord{\left/ {\vphantom {{\sqrt {\min ({{u}_{0}}S,2{{E}_{{{\text{доп}}}}})} } С}} \right. \kern-0em} С}$.

Покажем, что найденное управление (2.13) действительно оптимально (ему соответствует значение T, определяемое первой формулой (2.17), которое обозначим Topt). Рассмотрим функцию ${{f}_{0}} = \sqrt {2E(t)} $. Соответственно ${{f}_{{\max }}} = \sqrt {2{{E}_{{{\text{max}}}}}} $. При ограничении (1.3) максимально быстрая раскрутка КА происходит при управлении (2.6) [24], при котором $\ddot {E} = u_{0}^{2}$, а силовой момент M и кинетический момент L одинаково направлены (причем |M| = const и ${\mathbf{\dot {M}}} = - {\mathbf{\omega }} \times {\mathbf{M}}$), что соответствует управлению (2.13). Для наискорейшей остановки вращения при ограничении (1.3) необходимо управление (2.7), при котором управляющий момент M и кинетический момент L имеют противоположные направления, |M| = const и ${\mathbf{\dot {M}}} = - {\mathbf{\omega }} \times {\mathbf{M}}$, что находится в рамках управления (2.13). Если u0 → ∞, то время разгона и торможения τ → 0 и в течение всего разворота E(t) = const = Eдоп. Для любого управления, удовлетворяющего ограничению (1.3), выполняются два условия: f0(t) ≤ u0t, если tT/2, и f0(t) ≤ u0(Tt), если t > T/2 (так как ω(0) = ω(T) = 0). При одном и том же значении “функционала пути” S величина T минимальна, если интервал времени, когда Eк(t) = const = Emax, является максимально длительным, а интервалы времени, когда Eк(t) < Emax, максимально короткие. Управление (2.13) удовлетворяет обоим требованиям. Кроме того, для движения (2.13), (2.14) значение S минимально возможное, из-за чего Topt – абсолютно минимальное время разворота при наличии ограничений (1.3) и (1.6).

Если u0S ≤ 2Eдоп, то в законах (2.13), (2.14) tт = tр = T/2 = $\sqrt {S{\text{/}}{{u}_{0}}} $ (оптимальным является релейное управление с одной точкой переключения); при этом Emax = u0S/2 и ограничение (1.6) несущественно. Время оптимального разворота составляет Topt = $2\sqrt {S{\text{/}}{{u}_{0}}} $.

Если u0S > 2Eдоп, то tт > tр (tр = τ, tт = T – τ), в оптимальном по времени развороте имеется участок вращения с постоянной кинетической энергией (реализуется релейное управление с двумя точками переключения). В этом случае при оптимальном управлении (2.13) время разворота Topt равно (2.12). Каким бы ни было движение, удовлетворяющее условиям разворота (1.4), (1.5) и ограничениям (1.3), (1.6), время разворота T удовлетворяет неравенству

(2.18)
$T \geqslant {S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{\max }}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{\max }}}} }} + {{\sqrt {2{{E}_{{\max }}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{\max }}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}.$

Правая часть указанного неравенства – монотонно убывающая функция аргумента Еmax на всем отрезке [0, u0S/2] (Emax не может быть больше u0S/2, так как значение Emax = u0S/2 соответствует релейному управлению с одной точкой переключения, когда участок вращения КА по инерции отсутствует). При прочих равных условиях время разворота минимально, если “функционал пути” S имеет минимальное значение. Поскольку для всех интересующих нас управлений EmaxEдоп, то правая часть неравенства (2.18) не может быть меньше (2.12), так как для управления (2.13) “функционал пути” S принимает минимальное значение. В результате всегда время разворота TTopt. Следовательно, Topt – действительно минимально возможное время разворота при условии E(t) ≤ Eдоп и ограничении (1.3).

3. Построение типовой программы оптимального разворота КА. Выше было продемонстрировано, что функции Мi(t), рi(t), ωi(t) будут оптимальными тогда и только тогда, когда они удовлетворяют уравнениям (2.1), (2.13), (2.14) (с учетом равенств ri = r0  pi) и краевым условиям (1.4), (1.5) для решения Λ(t) уравнения (1.2). Задача построения оптимального управления М(t) состоит главным образом в нахождении такого вектора р0 = р(0) (и значения S), чтобы в результате движения в соответствии с уравнениями (1.2), (2.1), (2.14) и начальными условиями (1.4) выполнялись равенства Λ(Т) = Λк и ω(Т) = 0. Для получения функциональной зависимости управлений от фазовых координат необходимо вычислить оптимальное значение r0 и решить уравнения (2.1). Если J1, J2, J3, и0, Eдоп не меняются, то для всех сочетаний Λн, Λк с одинаковым кватернионом Λр = = ${{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$ решение r(t), М(t), ω(t) будет одним и тем же.

Так как оптимальное решение описывается уравнениями (2.1), (2.5), а для любых движений, удовлетворяющих зависимостям (2.1), (2.5) значение р0 и интеграл (2.8) не зависят от характера изменения скалярной функции b(t), то при поиске расчетных значений р0 и S, удовлетворяющих заданным условиям разворота, принимаем b(t) = const > 0 (такой прием применяется для упрощения решения краевой задачи принципа максимума). В этом случае (когда b(t) = const) система уравнений (2.1), (2.5) преобразуется в уравнения

(3.1)
${{\dot {\omega }}_{1}} = {{\omega }_{2}}{{\omega }_{3}}({{J}_{2}} - {{J}_{3}}){\text{/}}{{J}_{1}},\quad {{\dot {\omega }}_{2}} = {{\omega }_{1}}{{\omega }_{3}}({{J}_{3}} - {{J}_{1}}){\text{/}}{{J}_{2}},\quad {{\dot {\omega }}_{3}} = {{\omega }_{1}}{{\omega }_{2}}({{J}_{1}} - {{J}_{2}}){\text{/}}{{J}_{3}}.$

Отметим, что значения р0 и S определяют время разворота Т, наличие или отсутствие интервала вращения по инерции, максимальный управляющий момент, который равен

${{m}_{0}} = {{{{u}_{0}}} \mathord{\left/ {\vphantom {{{{u}_{0}}} {\sqrt {p_{{10}}^{2}{\text{/}}{{J}_{1}} + p_{{20}}^{2}{\text{/}}{{J}_{2}} + p_{{30}}^{2}{\text{/}}{{J}_{3}}} }}} \right. \kern-0em} {\sqrt {p_{{10}}^{2}{\text{/}}{{J}_{1}} + p_{{20}}^{2}{\text{/}}{{J}_{2}} + p_{{30}}^{2}{\text{/}}{{J}_{3}}} }},$
а также длительности разгона и торможения, участка неуправляемого движения и максимальную энергию вращения Emax (и максимальную величину кинетического момента Lmax).

Управляющие переменные рассчитываются в соответствии с законом (2.13), для реализации которого необходимо в каждый момент времени t знать все три переменные р1, р2, р3. Общее решение системы уравнений (1.2), (2.1), (2.14) (с учетом равенств ri = r0pi) получить практически невозможно; трудность заключается в определении граничных значений p(0) и p(T), которые связаны между собой выражением

${{\Lambda }_{{\text{к}}}} \circ {\mathbf{p}}(T) \circ {{\tilde {\Lambda }}_{{\text{к}}}} = {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}}\quad {\text{или}}\quad {\mathbf{p}}(T) = {{\tilde {\Lambda }}_{{\text{p}}}} \circ {\mathbf{p}}(0) \circ {{\Lambda }_{{\text{p}}}},$
где ${{\Lambda }_{{\text{р}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$ – кватернион разворота.

Указанная система имеет аналитическое решение только для динамически симметричного и сферического тел. Для сферически-симметричного КА (J1 = J2 = J3) система (2.1), (2.14) принимает вид ${{\dot {p}}_{i}} = 0$, и решение системы уравнений (1.2), (1.4), (1.5), (2.1), (2.13), (2.14) такое:

${{p}_{i}}(t) = {\text{const}} = {{p}_{{i0}}} = {{\nu }_{i}}{\text{/}}\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} ;\quad {{M}_{i}}(t) = 0.5{{m}_{0}}[{\text{sign}}({{t}_{{\text{p}}}} - t) + {\text{sign}}({{t}_{{\text{т}}}} - t)]{{p}_{{i0}}},\quad i = \overline {1,3} ,$
${{\omega }_{i}}(t) = 0.5{{m}_{0}}(T - \,{\text{|}}t - {{t}_{{\text{p}}}}{\text{|}} - \,{\text{|}}t - {{t}_{{\text{т}}}}{\text{|)}}{{p}_{{i0}}}{\text{/}}{{J}_{i}},$
$\Lambda (t) = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\theta /2}}},\quad \theta = \frac{{{{m}_{0}}}}{{2{{J}_{2}}}}\int\limits_0^t {({{t}_{{\text{р}}}} + {{t}_{{\text{т}}}} - \left| {t - {{t}_{{\text{р}}}}} \right| - \left| {t - {{t}_{{\text{т}}}}} \right|)dt} ,$
где ${{\nu }_{1}},{{\nu }_{2}},{{\nu }_{3}}$ – компоненты векторной части кватерниона разворота Λр; ${{m}_{0}} = {{u}_{0}}\sqrt {{{J}_{1}}} $; Т = tр + tт; tр = = $\min (\sqrt {S{\text{/}}{{u}_{0}}} ,{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}})$, tт = $\max (\sqrt {S{\text{/}}{{u}_{0}}} ,{S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }})$, в которых S = 2J1Carccos(sqalΛр).

Оптимальные развороты вокруг оси, неподвижной относительно инерциальной системы координат, подробно рассмотрены в [1].

Для динамически-симметричного КА (например, когда J2 = J3) задача оптимального управления разворотом решается до конца (не умаляя общности рассуждений, за ось симметрии принята ось ОХ КА). Оптимальное движение в этом частном, но достаточно распространенном случае представляет собой одновременное вращение КА как твердого тела вокруг своей продольной оси ОХ и вокруг некоторого направления η, неподвижного в инерциальном пространстве и составляющего с продольной осью КА определенный постоянный угол ϑ. Угловые скорости относительно осей ОХ и η изменяются пропорционально с постоянным коэффициентом пропорциональности, и поэтому справедливо соотношение [14]

${{\Lambda }_{{\text{к}}}} = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\beta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\alpha /2}}},$
где вектор в показателе степени кватернионной экспоненты понимается как кватернион с нулевой скалярной частью; р0 = р(0); е1 – орт продольной оси КА; α, β – углы поворота КА вокруг продольной оси ОХ и вокруг вектора р соответственно (считается |α| ≤ π, 0 ≤ β ≤ π). Решение p(t) системы уравнений (1.1), (2.1), (2.14) представим в следующей форме:
(3.2)
${{р}_{1}} = {{р}_{{10}}} = \cos \vartheta ,\quad {{p}_{2}} = {{p}_{{20}}}\cos \kappa + {{p}_{{30}}}\sin \kappa ,\quad {{p}_{3}} = - {{p}_{{20}}}\sin \kappa + {{p}_{{30}}}\cos \kappa ,\quad \kappa = \frac{{J - {{J}_{1}}}}{J}\int\limits_0^t {{{\omega }_{1}}(t)dt} ,$
где pi 0 = рi(0); J = J2 = J3; продольная угловая скорость ω1(t) вычисляется из равенств (2.14) с учетом р1 = const = р10. Зависимость pi 0, α, β от Λн и Λк определяется уравнениями
(3.3)
$\begin{gathered} \alpha = \frac{{J - {{J}_{1}}}}{{{{J}_{1}}}}{{p}_{{10}}}\beta ;\quad \cos \frac{\beta }{2}\cos \frac{\alpha }{2} - {{p}_{{10}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{0}};\quad \cos \frac{\beta }{2}\sin \frac{\alpha }{2} + {{p}_{{10}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} = {{\nu }_{1}}; \\ {{p}_{{20}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} + {{p}_{{30}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{2}};\quad - {{р}_{{20}}}\sin \frac{{{\beta }}}{2}\cos \frac{{{\alpha }}}{{\text{2}}} + {{p}_{{30}}}\sin \frac{{{\beta }}}{2}\cos \frac{{{\alpha }}}{2} = {{{{\nu }}}_{3}}, \\ \end{gathered} $
где ${{\nu }_{0}},{{\nu }_{1}},{{\nu }_{2}},{{\nu }_{3}}$ – компоненты кватерниона разворота Λр; –π ≤ α ≤ π, 0 ≤ β ≤ π. Существование решения системы (3.3) для любых значений кватерниона разворота Λр доказано в [14]. Оптимальное значение управляющего момента М удовлетворяет соотношениям (2.13). Программные значения функций ωi (проекции требуемой угловой скорости ω* на связанные оси) рассчитываются по формулам (2.14) и (3.2). В явном виде оптимальное решение Mi(t), ωi(t) запишем следующим образом:
$\begin{gathered} {{M}_{1}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{{\text{р}}}}--t) + {\text{sign}}({{t}_{{\text{т}}}}--t)]{{р}_{{10}}}; \\ {{M}_{2}} = {\text{ }}0.5{{m}_{0}}[{\text{sign }}({{t}_{{\text{р}}}}--t) + {\text{sign }}({{t}_{{\text{т}}}}--t)]\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma ); \\ \end{gathered} $
${{M}_{3}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{{\text{р}}}}--t) + {\text{sign}}({{t}_{{\text{т}}}}--t)]\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma );$
$\begin{gathered} {{\omega }_{1}} = 0.5{{m}_{0}}(T--\,{\text{|}}t--{{t}_{{\text{р}}}}{\text{|}}--\,{\text{|}}t--{{t}_{{\text{т}}}}{\text{|}}){{р}_{{10}}}{\text{/}}{{J}_{1}}; \\ {{\omega }_{2}} = 0.5{{m}_{0}}(T--\,{\text{|}}t--{{t}_{{\text{р}}}}{\text{|}}--\,{\text{|}}t--\,{{t}_{{\text{т}}}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma ){\text{/}}{{J}_{2}}; \\ \end{gathered} $
${{\omega }_{3}} = 0.5{{m}_{0}}(T--\,{\text{|}}t--{{t}_{р}}{\text{|}}--\,{\text{|}}t--{{t}_{т}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma ){\text{/}}{{J}_{3}},$
где tр = $\min (\sqrt {{{J}_{2}}\beta {\text{/}}{{m}_{0}}} ,{{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}})$; tт = $\max (\sqrt {{{J}_{2}}\beta {\text{/}}{{m}_{0}}} ,{{{{J}_{2}}\beta C} \mathord{\left/ {\vphantom {{{{J}_{2}}\beta C} {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }})$; $\gamma = \arcsin ({{p}_{{20}}}{\text{/}}\sqrt {1 - p_{{10}}^{2}} )$, если р30 ≥ 0, или $\gamma = \pi - \arcsin ({{p}_{{20}}}{\text{/}}\sqrt {1 - p_{{10}}^{2}} )$, если р30 < 0 (|р10| ≠ 1; а случай |р10| = 1 не рассматривается, так как он соответствует плоскому вращению вокруг продольной оси ОХ); Т = t1 + t2. В любой текущий момент времени t кватернион ориентации Λ описывается функцией
$\Lambda (t) = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\theta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\rho /2}}},$
где $\rho = (J - {{J}_{1}}){{p}_{{10}}}\theta {\text{/}}{{J}_{1}}$; значение вектора p0 определяется из системы (3.3); угол θ равен

$\theta = \frac{1}{J}\int\limits_0^t {\left| {{\mathbf{L}}(t)} \right|dt} ,\quad {\text{или}}\quad \theta = \frac{{{{m}_{0}}}}{{2J}}\int\limits_0^t {({{t}_{{\text{р}}}} + {{t}_{{\text{т}}}} - \left| {t - {{t}_{{\text{р}}}}} \right| - \left| {t - {{t}_{{\text{т}}}}} \right|)dt} .$

Для несимметричного КА (${{J}_{1}} \ne {{J}_{2}} \ne {{J}_{3}}$) решение системы уравнений (1.2), (2.1), (2.14) в квадратурах не представляется возможным и находится исключительно численными методами (например, методом последовательных приближений). Определение вектора p0 производится путем решения краевой задачи Λ(0) = Λн, Λ(Т) = Λк с учетом накладываемых на движение связей (1.2), (3.1) и нахождения начальной угловой скорости ω(0) для вращения по инерции.

Для построения оптимального управления при развороте КА необходимо знать не только программу изменения координат рi(t), но и величину максимального момента m0, определяющего темп приближения к требуемому конечному состоянию (1.5), а также моменты выключения и включения управления tр и tт. Конкретные значения параметров m0, tр, tт, r0 = |r| и длительность разворота Т зависят от вектора р0 и характеристики S. Для динамически симметричного КА значение S вычисляется значительно проще (расчет величин r0, tр, tт и Emax также упрощается). В этом частном случае |L| = J2${{\dot {\beta }}}$ и S = J2βC, где J2 – момент инерции относительно поперечной оси (J2 = J3); ${{\dot {\beta }}}$ – скорость вращения вокруг кинетического момента L; β – угол поворота КА вокруг кинетического момента L (из физического смысла β ≥ 0). Значения r0, tр, tт, Т, Emax, Lmax зависят от угла β поворота КА вокруг кинетического момента L. Чтобы время Т было минимальным, необходимо выполнить условие β ≤ π, при котором S минимально (именно поэтому система (3.3) включает неравенство 0 ≤ β ≤ π).

Решение задачи оптимального по времени разворота с ограничением на фазовые переменные (1.6) подчиняется уравнениям (2.1), (2.4), (2.5), а управляющие переменные Мi и угловые скорости ωi изменяются в соответствии с законами (2.13), (2.14). Решение (2.13), (2.14) оптимально, потому что оно – единственное; только оно одно (и никакое другое) удовлетворяет необходимым условиям оптимальности. Любое отличное от (2.13), (2.14) движение будет заведомо хуже (в смысле минимума времени разворота T при ограничениях (1.3), (1.6)), поскольку не будет удовлетворять необходимым условиям оптимальности. Значение m0 в законах движения (2.13), (2.14) определяет максимальную величину управляющего момента, максимальный модуль кинетического момента и длительность участка свободного вращения. Оптимальный вектор р0 рассчитывается в результате решения краевой задачи принципа максимума. Константы S, С, m0 полностью определяют программу движения при оптимальном законе управления пространственным разворотом КА. Программное изменение силового момента М описывается зависимостью

${\mathbf{М}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{{\text{р}}}}--t) + {\text{sign}}({{t}_{{\text{т}}}}--t)]\tilde {\Lambda } \circ {{{\mathbf{c}}}_{p}} \circ \Lambda ,$
где cp = const = Λн$ \circ $ р0 $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$ . Для оптимальной программы управления М(t) движение КА относительно центра масс обладает следующими оригинальными свойствами и соотношениями:

$\Lambda \circ M({\mathbf{T}} - t) \circ \tilde {\Lambda } = - \Lambda \circ {\mathbf{M}}(t) \circ \tilde {\Lambda };\quad \Lambda \circ {\mathbf{L}}(T - t) \circ \tilde {\Lambda } = \Lambda \circ {\mathbf{L}}(t) \circ \tilde {\Lambda };\quad \int\limits_0^{T/2} {\left| {{\mathbf{L}}(t)} \right|dt} = \int\limits_{Т/2}^T {\left| {{\mathbf{L}}(t)} \right|dt} ,$
${{E}_{{{\text{max}}}}} = {\text{|}}E(T{\text{/}}2){\text{|}},\quad {{L}_{{{\text{max}}}}} = \mathop {\max }\limits_{0 < t < T} \sqrt {J_{1}^{2}\omega _{1}^{2} + J_{2}^{2}\omega _{2}^{2} + J_{3}^{2}\omega _{3}^{2}} = {\text{|}}{\mathbf{L}}(T{\text{/}}2){\text{|}}\,.$

Раскрутка КА в начале разворота продолжается до тех пор, пока его кинетический момент L не станет равен заданному значению Lpr, который рассчитывается по формуле

${{{\mathbf{L}}}_{{{\text{pr}}}}} = {{m}_{0}}\tau \tilde {\Lambda } \circ {{{\mathbf{c}}}_{p}} \circ \Lambda .$

Гашение кинетического момента в конце оптимального разворота осуществляется по закону (2.7). В момент времени t = T, когда ω = 0, управление выключается и M = 0, разворот завершен. Если 2Eдопu0S, то торможение КА можем начать с момента выполнения равенства

$\begin{gathered} 4{\text{arcsin}}\frac{{K\sqrt {\delta _{2}^{2} + \delta _{3}^{2}} }}{{\sqrt {{{{({{J}_{2}}{{\omega }_{2}})}}^{2}} + {{{({{J}_{3}}{{\omega }_{3}})}}^{2}}} }} = \frac{{{{K}^{2}}\sqrt {\omega _{2}^{2} + \omega _{3}^{2}} }}{{{{m}_{0}}\sqrt {{{{({{J}_{2}}{{\omega }_{2}})}}^{2}} + {{{({{J}_{3}}{{\omega }_{3}})}}^{2}}} }},\quad {\text{если}}\quad \omega _{2}^{2} + \omega _{3}^{2} \ne 0, \\ {\text{или}}\quad 4\arccos {{\delta }_{0}} = {{\omega }_{1}}K{\text{/}}{{m}_{0}},\quad {\text{если}}\quad \omega _{2}^{2} + \omega _{3}^{2} = 0, \\ \end{gathered} $
где δj – компоненты кватерниона рассогласования $\tilde {\Lambda }(t) \circ {{\Lambda }_{{\text{к}}}}$, j = $\overline {0,\;3} $; К = |JКАω| – величина кинетического момента КА. Указанное условие позволяет повысить точность приведения КА в требуемое конечное состояние Λ(Т) = Λк, ω(Т) = 0 за счет возможности в бортовой системе управления формировать сигнал на гашение кинетического момента по информации о текущей ориентации КА и измерениям его угловой скорости.

4. Результаты математического моделирования. Приведем численный пример решения задачи управления КА во время программного разворота и построения оптимальной программы вращения. Рассмотрим разворот КА на 180° из начального положения Λн, при котором оси КА совмещены (совпадают по направлению) с осями опорного базиса I, в заданное конечное положение Λк = Λзад. При этом считается, что начальная и конечная угловые скорости нулевые: ω(0) = = ω(Т) = 0. Значения элементов кватерниона Λзад, характеризующего требуемое угловое положение КА, были равны: λ0 = 0; λ1 = 0.707; λ2 = 0.39; λ3 = 0.59. Будем полагать, что инерционные характеристики КА имеют следующие значения, кг ⋅ м2 : J1 = 25 603, J2 = 91 495, J3 = 80 662, а мощность исполнительных органов характеризуется величиной u0 = 0.07077 Н ⋅ кг–1/2. Во время разворота кинетическая энергия вращения не должна быть больше Eдоп = 5 Дж.

Нахождение расчетного значения вектора p0 начинаем с решения той же краевой задачи для динамически-симметричного КА с моментами инерции J1 и J, где J – момент инерции относительно поперечной оси, принимаемый равным

$J = \frac{{{{J}_{2}}{{J}_{3}}}}{{{{J}_{2}} + {{J}_{3}} - {{J}_{1}}}}(\sqrt {(1 - {{J}_{1}}{\text{/}}{{J}_{2}})(1 - {{J}_{1}}{\text{/}}{{J}_{3}})} + 1).$

В предположении динамической симметричности КА решение p0 определяется системой (3.3) (для симметричного твердого тела искомое значение следующее: ${\mathbf{p}}_{0}^{{(0)}}$ = {0.4652435; –0.3714789; 0.8034625}). Полученный из уравнений (3.3) вектор p0 и угол β являются начальным приближением к истинному решению. Они уточняются до тех пор, пока не будут удовлетворять системе уравнений (1.2), (3.1) с учетом накладываемых на движение КА ограничений Λ(0) = Λн, Λ(tпр) = Λк, а начальные угловые скорости ωiн определяются по формулам:

(4.1)
${{\omega }_{{1{\text{н}}}}} = \frac{{J\beta }}{{{{J}_{1}}T}}{{p}_{{10}}},\quad {{\omega }_{{2{\text{н}}}}} = \frac{{J\beta }}{{{{J}_{2}}T}}{{p}_{{20}}},\quad {{\omega }_{{3{\text{н}}}}} = \frac{{J\beta }}{{{{J}_{3}}T}}{{p}_{{30}}},$
где Т – время разворота (при уточнении вектора p0 было принято значение Т = 300 с). Прогнозирование “свободного” движения осуществляется интегрированием системы уравнений (1.1), (1.2), описывающих вращение КА, при начальных условиях Λ(0) = Λн, ω(0) = ωн и с учетом того, что M = 0. Степень приближения найденного значения р0 к искомому решению характеризуется мерой ε = sqal (${{\tilde {\Lambda }}_{{{\text{пр}}}}} \circ {{\Lambda }_{{\text{к}}}}$), где Λпр – наиболее близкое к Λк положение, полученное в ходе моделирования движения КА около центра масс (согласно уравнениям (1.2), (1.1), в которых Mi = 0). Вектор р0 уточняется до тех пор, пока ε < εпорпор – некоторое близкое к единице пороговое значение, отражающее точность найденного решения). Как только условие ε ≥ εпор достигнуто (прогнозируемая ошибка соответствует требуемой точности), истинное значение p0, удовлетворяющее граничным условиям Λ(0) = Λн, Λ(tпр) = Λк, будет найдено и краевая задача решена. Вектор p0 уточняется с помощью следующего рекуррентного соотношения:
$\Lambda _{{\text{р}}}^{{{\text{(}}k + {\text{1)}}}} = \Lambda _{{\text{р}}}^{{{\text{(}}k{\text{)}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}},$
где $\Lambda _{{\text{p}}}^{{(k)}}$ – значение кватерниона разворота на k-й итерации, используемое в системе (3.3). На каждом k-м шаге итераций обновляются элементы кватерниона разворота $\Lambda _{{\text{p}}}^{{(k)}}$ (правые части системы (3.3)), и из уравнений (3.3) мы получаем p0 и β, а также соответствующую начальную угловую скорость ωн (в соответствии с (4.1)) и прогноз Λпр. Если ε < εпор, то вычисляется кватернион разворота $\Lambda _{{\text{p}}}^{{(k + 1)}}$ для следующего (k + 1)-го шага итераций и процесс уточнения вектора p0 повторяется. За начальное приближение в правых частях системы (3.3) берутся элементы кватерниона $\Lambda _{{\text{р}}}^{{{\text{(0)}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$. Итерационный процесс прекращается, когда ε ≥ εпор.

Принятая схема итераций аналогична итерационному методу решения уравнения вида x = f(x) для скалярной функции f(x) скалярного (одномерного) аргумента x. В нашем случае аргумент – гиперкомплексное число (кватернион) Λр. Функцией является кватернионная величина ${{\Lambda }_{{\text{р}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}}$, где Λк – постоянный (не зависящий от аргумента Λр) кватернион; Λпр зависит от аргумента Λр через систему уравнений (3.3), (4.1) посредством модели движения (1.1), (1.2) (в уравнениях (1.1) принимается Мi = 0). Изменяя Λр, изменяются вектор p0 (в соответствии с (3.3)) и угловые скорости ωiн, а значит, изменится и значение Λпр, что вызовет изменение функции ${{\Lambda }_{{\text{р}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}}$. Как только sqal(${{\tilde {\Lambda }}_{{{\text{пр}}}}} \circ {{\Lambda }_{{\text{к}}}}$) ≥ εпор, итерационный процесс прекращается, а решение p0 считается найденным. Так как |vect (${{\tilde {\Lambda }}_{{\text{к}}}} \circ \Lambda _{{{\text{пр}}}}^{{(k)}}$)| < |vect$\Lambda _{{\text{р}}}^{{(k)}}$| для всех k, то итерационный процесс приближения p0 к искомому решению сходится. Аналогичный метод определения значения р0 в решении краевой задачи принципа максимума использовался в предыдущих работах [8, 18]. Заметим, что это лишь один из возможных (но далеко не единственный) итерационных алгоритмов поиска оптимального вектора р0.

В результате решения краевой задачи разворота из положения Λ(0) = Λн в положение Λ(Т) = Λк получили расчетное значение вектора р(0) = {0.4552153; –0.3475442; 0.8197513} и “функционал пути” S = 665 м ⋅ кг1/2. Исходя из найденного значения р0 получили максимальную величину управляющего момента m0 = 16.8 Н ⋅ м. Так как и0S > 2Eдоп, то оптимальное управление имеет две точки переключения и между набором и гашением кинетической энергии КА вращается по инерции. Время достижения максимально допустимой кинетической энергии Eдоп равно tр = = ${{\sqrt {2{{E}_{{{\text{доп}}}}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{{\text{доп}}}}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ = 44.7 с, а момент начала торможения tт = ${S \mathord{\left/ {\vphantom {S {\sqrt {2{{E}_{{{\text{доп}}}}}} }}} \right. \kern-0em} {\sqrt {2{{E}_{{{\text{доп}}}}}} }}$ = 210.3 с. Время разворота оказалось равным Т = 255 с. Основные константы оптимального движения такие:

$a(0) = {{t}_{{\text{т}}}} = 210.3\,\,{\text{c}},\quad a(T) = - \tau = - 44.7\,\,{\text{c}},\quad {{r}_{0}} = 1{\text{/}}(C\sqrt {2{{E}_{{{\text{доп}}}}}} ) = 75\,\,{\text{c,}}$
${\mathbf{\varphi }}(0) = \{ 7179.8\,\,{{{\text{c}}}^{2}}; - 5481.6\,\,{{{\text{c}}}^{2}};\,\,12929.6\,\,{{{\text{c}}}^{2}}\} .$

Результаты математического моделирования динамики оптимального по быстродействию разворота представлены рис. 2–5. На рис. 2 изображены графики изменения угловых скоростей в связанной с КА системе координат ω1(t), ω2(t), ω3(t) по времени. Максимальная величина кинетического момента составила Lmax = 750.7 Н ⋅ м ⋅ с. Из соотношения моментов инерции J1, J2, J3 следует, что ОХ – продольная ось КА. Отмечаем, что угловая скорость ω1, соответствующая продольной оси КА, – знакопостоянна. На рис. 3 отображены графики изменения компонент кватерниона Λ(t), определяющего текущую ориентацию КА в процессе совершаемого поворотного маневра: λ0(t), λ1(t), λ2(t), λ3(t). Оптимальная траектория движения Λ(t) получается из решения уравнений (1.1) с учетом начальных условий Λ(0) = Λн и закона изменения угловой скорости ω(t), отраженного на рис. 2. Динамика изменения составляющих p1(t), p2(t), p3(t) орта р по времени приведена на рис. 4. Характерным является незначительное изменение проекции p1 (угловая скорость ω1 относительно продольной оси КА на участке между разгоном и торможением также меняется гораздо меньше, чем угловые скорости ω2 и ω3 относительно поперечных осей КА). При оптимальном управлении в отличие от переменных ωi переменные pi и λj – гладкие функции времени. Наконец, рисунок 5 демонстрирует изменение сопряженных переменных φi во время оптимального по быстродействию разворота.

Рис. 2
Рис. 3
Рис. 4
Рис. 5

Заключение. Рассмотрена и решена динамическая задача оптимального по времени управления пространственным разворотом твердого тела (в частности, КА) из произвольного начального в требуемое конечное угловое положение с учетом ограничений на управляющий момент и кинетическую энергию вращения. Ограниченность максимальной кинетической энергии вращения позволяет в экстренных случаях погасить угловую скорость за время, не превышающее заданного значения (в том числе в нештатной ситуации, когда требуется срочно прекратить маневр и максимально быстро стабилизировать КА). Постановка задачи имеет традиционную форму, в которой управление считается кусочно-непрерывной функцией времени. Нахождение оптимальной по быстродействию программы переориентации КА с кинетической энергией вращения, не превышающей допустимого уровня, весьма актуально.

Представлено аналитическое решение предложенной задачи оптимального разворота и получены формализованные уравнения и расчетные выражения для построения оптимальной программы переориентации КА. Определен тип траектории и изучены ключевые свойства оптимального движения. Найдены условия оптимальности и обоснована структура оптимального управления. Доказано, что в процессе всего разворота отношение кинетической энергии вращения к квадрату модуля кинетического момента КА есть величина постоянная. Для решения сформулированной задачи управления применялся принцип максимума, основываясь на универсальных переменных ri [2]. Использование кватернионов значительно упрощает расчетные процедуры и снижает вычислительные затраты алгоритма управления, делая его наиболее удобным для бортовой реализации. Задача оптимального управления разворотом решается до конца; даны выражения для расчета ключевых характеристик маневра переориентации.

Показано, что на всем интервале переориентации момент сил действует вдоль прямой, неподвижной в инерциальной системе координат. В общем случае оптимальным является релейное управление с двумя точками переключения, при котором весь разворот делится на раскрутку КА с максимально возможным управляющим моментом, вращение по инерции и торможение с максимально возможным управляющим моментом, противоположно направленным кинетическому моменту КА. Модуль управляющего момента при разгоне и торможении не меняется. Длительности участков разгона и торможения одинаковы (так как начальная и конечная угловые скорости равны нулю) и зависят от мощности исполнительных органов u0, максимально допустимой кинетической энергии вращения, взаимной ориентации начального и конечного положений КА и его моментов инерции. В случае неограниченного управления (когда u0 → ∞) времена разгона и торможения бесконечно малы, и практически на всем интервале движения КА вращается с постоянным относительно инерциальной системы координат кинетическим моментом. Другим предельным случаем является управление с одной точкой переключения, при котором участок неуправляемого движения отсутствует (длительность разгона и торможения максимальна и составляет половину времени разворота).

Важность и значение выполненных исследований состоят в том, что в отличие от предыдущих публикаций искомое управление и соответствующее ему движение ограничено максимально допустимой энергией вращения (задача оптимального разворота включает ограничения на силовой момент и угловую скорость КА). В статье приведена процедура реализации оптимального управления переориентацией КА. Момент начала торможения определяется по фактическим параметрам движения (кватерниону рассогласования и кинетическому моменту), исходя из принципов терминального управления (используются информация об угловом положении КА и измерения угловой скорости). Структура построенного управления сравнительно проста, и оно легко может быть реализовано существующими бортовыми системами управления движением КА. Дается описание конструктивной схемы решения краевой задачи принципа максимума для произвольных условий разворота и моментов инерции КА. Для динамически-симметричного КА представлено законченное решение задачи переориентации в замкнутой форме, что придает практическую значимость проведенным исследованиям, поскольку реальные КА во многих случаях близки к телам с осевой симметрией. Записанная в аналитическом виде система уравнений (3.3) позволяет непосредственно найти решение краевой задачи принципа максимума и вычислить необходимые константы оптимального закона управления; при этом искомые значения параметров закона управления могут быть определены известным устройством [28]. Приводятся результаты математического моделирования, иллюстрирующие характер движения КА во время оптимального разворота.

В отличие от работ [8, 9], где рассматривается неограниченное управление (в тех задачах отсутствуют какие-либо ограничения, кроме краевых условий), мы оптимизируем ограниченное управление, когда ограничены не только управляющие функции (силовой момент М), но и фазовые переменные (ограничена угловая скорость КА); это существенное отличие. Кроме того, в [8] оптимальным является непрерывное управление, когда все управляющие функции – непрерывные гладкие функции времени и на всем интервале управления [0, T] (кроме единственного момента времени t = Т/2) управляющий момент М отличен от нуля, а в приведенном решении оптимально релейное управление (с одной или с двумя точками переключения) и может существовать отрезок времени ненулевой продолжительности, на котором М = 0 и КА вращается по инерции. Кроме того, в оптимальном решении, представленном в [8], отсутствуют участки с постоянным модулем управляющего момента.

Принципиальным отличием предложенной динамической задачи оптимального управления относительно известных работ является наличие ограничений как на управляющие функции, так и на фазовые переменные, что придает полученному решению существенную новизну. Наличие готовых формул для синтеза программы оптимального движения во время маневра переориентации делает выполненное исследование практически значимым и пригодным для непосредственного применения в практике космических полетов.

Список литературы

  1. Бpанец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М.: Наука, 1973. 320 с.

  2. Левский М.В. Использование универсальных переменных в задачах оптимального управления ориентацией космических аппаратов // Мехатроника, автоматизация, управление. 2014. № 1. С. 53–59.

  3. Раушенбах Б.В., Токарь Е.Н. Управление ориентацией космических аппаратов. М.: Наука, 1974. C. 600.

  4. Алексеев К.Б., Малявин А.А., Шадян А.В. Экстенсивное управление ориентацией космического аппарата на основе нечеткой логики // Полет. 2009. № 1. С. 47–53.

  5. Ермошина О.В., Крищенко А.П. Синтез программных управлений ориентацией КА методом обратной задачи динамики // Изв. РАН. ТиСУ. 2000. № 2. С. 155–162.

  6. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Синтез алгоритмов переориентации космического аппарата на основе концепции обратной задачи динамики // Изв. РАН. ТиСУ. 2003. № 5. С. 156–163.

  7. Junkins J.L., Turner J.D. Optimal Spacecraft Rotational Maneuvers. Elsevier. USA, 1986. 515 p.

  8. Левский М.В. Квадратично оптимальное управление переориентацией космического аппарата за фиксированное время в динамической постановке // Изв. РАН. ТиСУ. 2018. № 1. С. 133–149.

  9. Молоденков A.В., Сапунков Я.Г. Аналитическое приближенное решение задачи оптимального разворота космического аппарата при произвольных граничных условиях // Изв. РАН. ТиСУ. 2015. № 3. С. 131–141.

  10. Scrivener S., Thompson R. Survey of Time-optimal Attitude Maneuvers // J. Guidance, Control and Dynamics. 1994. V. 17. № 2. P. 225–233.

  11. Zhou H., Wang D., Wu B., EK Poh. Time-optimal Reorientation for Rigid Satellite with Reaction Wheels // International Journal of Control. 2012. V. 85. № 10. P. 1–12.

  12. Решмин С.А. Пороговая абсолютная величина релейного управления при наискорейшем приведении спутника в желаемое угловое положение // Изв. РАН. ТиСУ. 2018. № 5. С. 30–41.

  13. Решмин С.А. Пороговая абсолютная величина релейного управления при наискорейшем приведении спутника в гравитационно-устойчивое положение // ДАН. 2018. Т. 480. № 6. С. 671–675.

  14. Бранец В.Н., Черток М.Б., Казначеев Ю.В. Оптимальный разворот твердого тела с одной осью симметрии // Космич. исслед. 1984. Т. 22. Вып. 3. С. 352–360.

  15. Shen H., Tsiotras P. Time-optimal Control of Axi-symmetric Rigid Spacecraft with two Controls // AIAA J. Guidance, Control and Dynamics. 1999. V. 22. № 5. P. 682–694.

  16. Молоденков А.В., Сапунков Я.Г. Аналитическое решение задачи оптимального по быстродействию разворота осесимметричного космического аппарата в классе конических движений // Изв. РАН. ТиСУ. 2018. № 2. С. 131–147.

  17. Молоденков A.В., Сапунков Я.Г. Решение задачи оптимального разворота осесимметричного космического аппарата с ограниченным и импульсным управлением при произвольных граничных условиях // Изв. РАН. ТиСУ. 2007. № 2. С. 152–165.

  18. Левский М.В. Применение принципа максимума Л.С. Понтрягина к задачам оптимального управления ориентацией космического аппарата // Изв. РАН. ТиСУ. 2008. № 6. С. 144–157.

  19. Левский М.В. Синтез оптимального управления терминальной ориентацией космического аппарата с использованием метода кватернионов // Изв. РАН. МТТ. 2009. № 2. С. 7–24.

  20. Сарычев В.А., Беляев М.Ю., Зыков С.Г., Сазонов В.В., Тесленко В.П. Математические модели процессов поддержания ориентации орбитальной станции “Мир” с помощью гиродинов. М.: Препринт ИПМ им. М.В. Келдыша АН СССР. 1989. № 10.

  21. Левский М.В. Особенности управления ориентацией космического аппарата, оборудованного инерционными исполнительными органами // Мехатроника, автоматизация, управление. 2015. Т. 16. № 3. С. 188–195.

  22. Levskii M.V. Special Aspects in Attitude Control of a Spacecraft, Equipped with Inertial Actuators // J. Computer Science Applications and Information Technology. 2017. V. 2. № 4. P. 1–9.

  23. Quang M. Lam. Robust and Adaptive Reconfigurable Control for Satellite Attitude Control Subject to Under-Actuated Control Condition of Reaction Wheel Assembly // Mathematics in Engineering, Science and Aerospace. 2018. V. 9. № 1. P. 47–63.

  24. Левский М.В. К вопросу оптимального успокоения космического аппарата // Изв. РАН. ТиСУ. 2011. № 1. С. 147–161.

  25. Зубов Н.Е., Ли М.В., Микрин Е.А., Рябченко В.Н. Терминальное построение орбитальной ориентации космического аппарата // Изв. РАН. ТиСУ. 2017. № 4. С. 154–173.

  26. Левский М.В. Способ управления разворотом космического аппарата. Патент на изобретение РФ № 2093433 // Бюллетень “Изобретения. Заявки и патенты”. 1997. № 29. Опубликован 20.10.1997. С. 271.

  27. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. M.: Наука, 1983. 392 с.

  28. Левский М.В. Устройство формирования параметров регулярной прецессии твердого тела. Патент на изобретение РФ № 2146638 // Бюллетень “Изобретения. Заявки и патенты”. 2000. № 8. Опубликован 20.03.2000. С. 148.

Дополнительные материалы отсутствуют.