Известия РАН. Теория и системы управления, 2023, № 4, стр. 137-152

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПЕРЕОРИЕНТАЦИЕЙ КОСМИЧЕСКОГО АППАРАТА ЗА ЗАДАННОЕ ВРЕМЯ С КВАДРАТИЧНЫМ КРИТЕРИЕМ КАЧЕСТВА ОТНОСИТЕЛЬНО УПРАВЛЯЮЩИХ И ФАЗОВЫХ ПЕРЕМЕННЫХ

М. В. Левский *

Научно-исследовательский институт космических систем им. А.А. Максимова – филиал Государственного космического научно-производственного центра им. М.В. Хруничева
Королев, Россия

* E-mail: levskii1966@mail.ru

Поступила в редакцию 23.12.2021
После доработки 15.12.2022
Принята к публикации 06.02.2023

Полный текст (PDF)

Аннотация

Рассмотрена и решена задача динамического оптимального разворота космического аппарата из произвольного начального в требуемое конечное угловое положение. Время разворота фиксировано. Для оптимизации программы управления вращением используется комбинированный критерий качества, минимизируемый функционал характеризует энергетические затраты и объединяет в заданной пропорции затраты управляющих усилий и интеграл энергии вращения. Аналитическим путем получено решение поставленной задачи. Построение оптимального управления разворотом основано на кватернионных моделях и принципе максимума Л.С. Понтрягина. Условия оптимальности записаны в аналитической форме, и изучены свойства оптимального движения. Приведены формализованные уравнения и расчетные выражения для определения оптимальной программы разворота. Закон управления сформулирован в виде явной зависимости управляющих переменных от фазовых координат. Выписаны аналитические уравнения и соотношения для нахождения оптимального движения КА. Даны ключевые соотношения, определяющие оптимальные значения параметров алгоритма управления вращением. Также описана конструктивная схема решения краевой задачи принципа максимума для произвольных условий разворота. Для осесимметричного космического аппарата дается полное решение задачи переориентации в замкнутой форме. Приводятся пример и результаты математического моделирования динамики движения космического аппарата при оптимальном управлении, демонстрирующие практическую реализуемость разработанного метода управления пространственной ориентацией космического аппарата.

Введение. Решается задача перевода космического аппарата (КА) как твердого тела из исходного углового положения в положение заданной ориентации. Главное отличие предложенного решения заключается в использовании нового функционала качества. Способ решения и формализация описания кинематики вращательного движения КА основаны на методе кватернионов [1]. Для построения оптимальной программы разворота применяются кватернионные модели, принцип максимума и универсальные переменные [2].

Исследованию задач управления разворотом твердого тела в различных постановках посвящено множество работ [124]. Большинство существующих решений задачи пространственного разворота соответствуют вращению вокруг неподвижной оси [1, 39]. И хотя принципы построения алгоритмов управления различны (на базе нечеткой логики [5], концепции обратной задачи динамики [6], с помощью прогнозирующих моделей [7] и пр.), результирующее управление приводит к развороту вокруг оси, неподвижной относительно связанной системы координат. Однако разворот в плоскости наименьшего угла разворота во многих практических случаях не является оптимальным, как бы точно он не исполнялся.

Вопросы разработки эффективных алгоритмов управления ориентацией КА остаются актуальными и сегодня. Особое место занимают задачи оптимального управления КА [14, 823]. Большой практический интерес представляют аналитические решения задачи оптимального разворота в замкнутой форме, так как они позволяют применять на борту КА готовые законы программного управления и изменения оптимальной траектории движения КА. Наиболее подробно задача оптимального управления угловым движением КА решена только для плоских вращений КА вокруг одной из главных центральных осей инерции [4] и пространственного вращения сферически-симметричного тела [1, 10]. Некоторые решения известны для осесимметричного КА [1114]. Для КА с произвольным распределением масс при произвольных граничных условиях по угловому положению КА аналитическое решение задачи пространственного разворота не найдено; известны лишь некоторые особые случаи решения задачи разворота (например, [1, 3]). Поэтому в общем случае приходится рассчитывать только на приближенное численное решение задачи. Интересные результаты приведены в работе [11], где для решения краевой задачи принципа максимума была сделана замена переменных и исходная задача свелась к краевой задаче разворота сферически-симметричного тела. Хорошо известна задача оптимального по времени разворота [1, 8, 1218]. Некоторые предыдущие публикации посвящены кинематической задаче разворота [19–22]. В них в отличие от предлагаемого решения для оптимизации использовались функционал “пути” [19], интеграл от кинетической энергии вращения [20], минимизировался модуль кинетического момента на заданном отрезке времени [21] или ограничивались динамические нагрузки, вызванные вращением КА [22].

Ниже исследуется задача управления угловым движением КА, когда силовой момент не ограничен, фазовыми переменными являются кватернион ориентации связанной системы координат относительно инерциального базиса и угловая скорость КА (как твердого тела), а для оптимизации программы управления применяется новый функционал качества, который объединяет в заданной пропорции интеграл от квадратичной свертки по силовым моментам и интеграл от кинетической энергии вращения. Вопросы экономичности управления движением КА остаются до сих пор актуальными, поэтому решаемая в статье задача является практически важной. Приведенное ниже решение отличается от всех известных; во время оптимального разворота и управляющие функции, и фазовые переменные – гладкие непрерывные функции времени.

1. Уравнения углового движения и постановка задачи управления. Динамика углового движения КА как твердого тела описывается уравнениями Эйлера [1, 4]:

(1.1)
${{J}_{1}}{{\dot {\omega }}_{1}} + ({{J}_{3}} - {{J}_{2}}){{\omega }_{2}}{{\omega }_{3}} = {{M}_{1}},\quad {{J}_{2}}{{\dot {\omega }}_{2}} + ({{J}_{1}} - {{J}_{3}}){{\omega }_{1}}{{\omega }_{3}} = {{M}_{2}},\quad {{J}_{3}}{{\dot {\omega }}_{3}} + ({{J}_{2}} - {{J}_{1}}){{\omega }_{1}}{{\omega }_{2}} = {{M}_{3}},$
где Ji , i = $\overline {1,\;3} $, – главные центральные моменты инерции аппарата, Мi – проекции главного момента М сил на главные центральные оси эллипсоида инерции аппарата, ωi – проекции вектора ω абсолютной угловой скорости КА на оси связанного базиса, образованного главными центральными осями эллипсоида инерции аппарата. В условиях космического полета особенность управления заключается в малости возмущающих моментов, обусловленных взаимодействием КА с внешними полями и сопротивлением среды. Управление движением КА относительно центра масс производится путем изменения силового момента М. Полагаем, что управление ориентацией КА осуществляется посредством исполнительных механизмов, создающих вращающие моменты относительно всех трех главных центральных осей инерции КА.

Для описания пространственного движения КА воспользуемся математическим аппаратом кватернионов (параметров Родрига–Гамильтона). Положение связанного базиса относительно опорного базиса I будем задавать кватернионом Λ [1]. Для определенности базис I считается инерциальным. В этом случае справедливо следующее кинематическое уравнение [1]:

(1.2)
$2\dot {\Lambda } = \Lambda \circ {\mathbf{\omega }},$
где символ “$ \circ $”– знак умножения кватернионов [1, с. 11–20]. Здесь и далее операция кватернионного умножения на вектор понимается как умножение на кватернион с нулевой скалярной частью. В частности, $\Lambda \circ {\mathbf{\omega }} = \Lambda \circ \Omega $, где Ω – кватернион, у которого sqal Ω = 0 , vect Ω = ω. Для удобства кватернион Λ, определяющий текущую ориентацию КА, принят нормированным [1] (||Λ|| = 1).

Практическое значение имеют задачи, в которых в начальный и конечный моменты времени угловые скорости относительно опорного базиса отсутствуют, поэтому начальная и конечная скорости равны нулю: ω(0) = ω(T) = 0 (так как опорный базис I не вращается, он фиксированный); разворот выполняется из состояния покоя в состояние покоя. Для динамической системы (1.1), (1.2) запишем граничные условия задачи оптимального разворота:

(1.3)
$L\left( 0 \right) = {{L}_{{\text{н}}}},\quad {\mathbf{\omega }}\left( 0 \right) = 0,$
(1.4)
$L\left( Т \right) = {{L}_{{\text{к}}}},\quad w\left( T \right) = 0,$
где Т – время окончания поворотного маневра. Кватернионы Λн и Λк, задающие ориентацию связанных с КА осей в начальный и конечный моменты времени, имеют произвольные наперед заданные значения, удовлетворяющие условию ||Λн|| = ||Λк|| = 1 (предполагается, что Λк ≠ ±Λн).

Эффективность управления будем оценивать интегральной величиной

(1.5)
$G = \int\limits_0^T {(М_{1}^{2}{\text{/}}{{J}_{1}} + М_{2}^{2}{\text{/}}{{J}_{2}} + М_{3}^{2}{\text{/}}{{J}_{3}})dt} + {{k}_{0}}\int\limits_0^T {({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2})dt} ,$
где k0 > 0 – постоянный положительный коэффициент (k0 ≠ 0). Задача оптимального управления пространственным разворотом КА формулируется следующим образом: КА необходимо перевести из состояния (1.3) в состояние (1.4) в соответствии с уравнениями (1.1), (1.2) с минимальным значением функционала (1.5). Время разворота T фиксировано. Решение М(t) ищется в классе кусочно-непрерывных функций времени.

Принятый критерий качества позволяет определить режим вращения КА, при котором КА перейдет из исходного своего положения Λн в заданное конечное угловое положение Λк с минимальными затратами управляющих ресурсов и энергии, и найти соответствующую программу управления. Сформулированная задача управления отличается от рассматриваемых ранее задач видом функционала (1.5), при котором даже в отсутствие ограничений на управление управляющие переменные не могут быть неограниченно большими. И еще одна особенность. Поскольку на управляющий момент М не наложено ограничений, то требуемый поворотный маневр может быть выполнен при любых условиях разворота Λн, Λк, любых значениях J1, J2, J3, k0 и при любом заданном времени Т. Так как оптимизация основана на квадратичном критерии качества, то с ростом времени T величина (1.5) уменьшается. От коэффициента k0 зависит, насколько пологим будет изменение модуля кинетического момента во время оптимального разворота.

2. Решение задачи оптимального управления разворотом. Рассматриваемая задача оптимального управления (1.1)–(1.5) есть задача динамического оптимального разворота твердого тела [1], в которой управляющими функциями являются моменты Мi, $i = \overline {1,\;3} $. Поставленную задачу решаем на основе необходимых условий оптимальности в форме принципа максимума Л.С. Понтрягина [25]. Введем сопряженные переменные ${{\phi }_{i}}$, соответствующие угловым скоростям ${{\omega }_{i}}$, $i = \overline {1,\;3} $. Критерий оптимальности не содержит позиционных координат (элементов кватерниона ориентации Λ), поэтому используем универсальные переменные ri , i = $\overline {1,3} $ [2], заменяющие сопряженные переменные ψj , которые соответствуют компонентам λj кватерниона Λ, $j = \overline {0,\;3} $. Ограничение на фазовую переменную Λ (и соответственно на λj) несущественно, так как оно выполняется при любых движениях КА вокруг центра масс; ||Λ(t)|| = const в силу уравнения (1.2) [1]. Мы полагали ||Λ(0)|| = ||Λн|| = 1, а значит, ||Λ(t)|| = 1 в любой момент времени t ∈ [0 , T].

2.1. Функция Гамильтона и сопряженная система уравнений. Для задачи оптимального управления (1.1)–(1.5) функция Гамильтона имеет вид [2]

$H = - ({{M_{1}^{2}} \mathord{\left/ {\vphantom {{M_{1}^{2}} {{{J}_{1}} + {{M_{2}^{2}} \mathord{\left/ {\vphantom {{M_{2}^{2}} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}} \right. \kern-0em} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{M_{2}^{2}} \mathord{\left/ {\vphantom {{M_{2}^{2}} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}} \right. \kern-0em} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}}}) - {{k}_{0}}({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}) + {{\varphi }_{1}}({{М}_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{3}}){\text{/}}{{J}_{1}} + $
$ + \,{{\varphi }_{2}}({{М}_{2}} + ({{J}_{3}}--{{J}_{1}}){{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + {{j}_{3}}({{М}_{3}} + {\text{ }}({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} + {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}},$
где

$\begin{gathered} {{r}_{1}} = ({{\lambda }_{0}}{{\psi }_{1}} + {{\lambda }_{3}}{{\psi }_{2}} - {{\lambda }_{1}}{{\psi }_{0}} - {{\lambda }_{2}}{{\psi }_{3}}){\text{/}}2,\quad {{r}_{2}} = ({{\lambda }_{0}}{{\psi }_{2}} + {{\lambda }_{1}}{{\psi }_{3}} - {{\lambda }_{2}}{{\psi }_{0}} - {{\lambda }_{3}}{{\psi }_{1}}){\text{/}}2, \\ {{r}_{3}} = ({{\lambda }_{0}}{{\psi }_{3}} + {{\lambda }_{2}}{{\psi }_{1}} - {{\lambda }_{3}}{{\psi }_{0}} - {{\lambda }_{1}}{{\psi }_{2}}){\text{/}}2. \\ \end{gathered} $

Оптимальные функции ri, как компоненты вектора r, и вектор r удовлетворяют уравнениям [2]

${\mathbf{\dot {r}}} = - {\mathbf{\omega }} \times {\mathbf{r}},$
(2.1)
${{\dot {r}}_{1}} = {{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}},\quad {{\dot {r}}_{2}} = {{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}},\quad {{\dot {r}}_{3}} = {{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}$
(символ × означает векторное произведение векторов). Уравнения для сопряженных функций φi известны [25]:

${{\dot {\varphi }}_{i}} = - \frac{{\partial H}}{{\partial {{\omega }_{i}}}},\quad i = \overline {1,\;3} .$

Поэтому сопряженная система уравнений для функций φ1, φ2, φ3 выглядит следующим образом:

${{\dot {\varphi }}_{1}} = 2{{k}_{0}}{{J}_{1}}{{\omega }_{1}} + {{\omega }_{3}}{{\varphi }_{2}}({{J}_{1}} - {{J}_{3}}){\text{/}}{{J}_{2}} + {{\omega }_{2}}~{{\varphi }_{3}}({{J}_{2}} - {{J}_{1}}){\text{/}}{{J}_{3}} - {{r}_{1}},$
(2.2)
${{\dot {\varphi }}_{2}} = 2{{k}_{0}}{{J}_{2}}{{\omega }_{2}} + {{\omega }_{3}}{{\varphi }_{1}}({{J}_{3}} - {{J}_{2}}){\text{/}}{{J}_{1}} + {{\omega }_{1}}{{\varphi }_{3}}({{J}_{2}} - {{J}_{1}}){\text{/}}{{J}_{3}} - {{r}_{2}},$
${{\dot {\varphi }}_{3}} = 2{{k}_{0}}{{J}_{3}}{{\omega }_{3}} + {{\omega }_{2}}{{\varphi }_{1}}({{J}_{3}} - {{J}_{2}}){\text{/}}{{J}_{1}} + {{\omega }_{1}}{{\varphi }_{2}}({{J}_{1}} - {{J}_{3}}){\text{/}}{{J}_{2}} - {{r}_{3}}.$

Гамильтониан Н составлен без учета ограничения ||Λ|| = 1 в силу равенства ||Λ(0)|| = 1, о чем договорились выше. Вектор r является постоянным относительно инерциального базиса I и |r| = const ≠ 0 (постоянство модуля |r| следует из свойств уравнений (2.1)). Решение r(t) системы (2.1) определяется начальным Λн и конечным Λк положениями КА. Оптимальная функция r(t) вычисляется через кватернион Λ(t) [1, 2]:

${\mathbf{r}} = \tilde {\Lambda } \circ {{{\mathbf{c}}}_{E}} \circ \Lambda ,\quad {\text{где}}\quad {{{\mathbf{c}}}_{E}} = {\text{const}} = {{\Lambda }_{{\text{н}}}} \circ {\mathbf{r}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}}$
(составляющие вектора cE – проекции вектора r на оси инерциального базиса I); $\tilde {\Lambda }$ – кватернион, сопряженный кватерниону Λ [1, с. 11–20]. Считается, что r(0) ≠ 0 (в противном случае r1 = r2 = r3 ≡ 0 и дальнейшее решение задачи теряет смысл). Направление вектора cE зависит от начального и конечного положений КА. Для того, чтобы КА имел требуемую ориентацию на правом конце Λ(T) = Λк, необходимо определить вектор cE (или значение вектора r в начальный момент времени) исходя из получающихся при этом решений системы (1.2).

2.2. Условия максимума гамильтониана и структура оптимального управления. Для определения условий максимума функции H в явном виде представим гамильтониан:

$H = - \left( {{{M_{1}^{2}} \mathord{\left/ {\vphantom {{M_{1}^{2}} {{{J}_{1}} + {{M_{2}^{2}} \mathord{\left/ {\vphantom {{M_{2}^{2}} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}} \right. \kern-0em} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{M_{2}^{2}} \mathord{\left/ {\vphantom {{M_{2}^{2}} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}} \right. \kern-0em} {{{J}_{2}} + {{M_{3}^{2}} \mathord{\left/ {\vphantom {{M_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}}}} \right) + {{{{M}_{1}}{{\varphi }_{1}}} \mathord{\left/ {\vphantom {{{{M}_{1}}{{\varphi }_{1}}} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}},$
где Hinv не зависит явно от управляющих функций Mi. Гамильтониан Н – квадратичная функция моментов Mi, и ее максимум определяется необходимыми условиями экстремума ${{\partial Н} \mathord{\left/ {\vphantom {{\partial Н} {\partial {{M}_{i}}}}} \right. \kern-0em} {\partial {{M}_{i}}}} = 0$, которым удовлетворяют значения:

(2.3)
${{M}_{i}} = {{\varphi }_{i}}{\text{/}}2,\quad i = \overline {1,3} .$

Оптимальное решение определяется замкнутой системой уравнений (1.1), (1.2), (2.1)–(2.3). Система уравнений (2.1)–(2.3) формализует необходимые условия оптимальности для исходной задачи оптимального управления (1.1)–(1.5). Задача построения оптимальной программы управления свелась к решению системы уравнений углового движения КА (1.1), (1.2), сопряженных уравнений (2.2) и уравнений (2.1) при условии, что управляющие функции Mi вычисляются в соответствии с (2.3). Сформулированная задача оптимального управления (1.1)–(1.5) решается до формализованной системы уравнений, определяющих оптимальное движение; эта система позволяет обнаружить закономерности оптимального движения в явном виде.

Решение системы уравнений (1.1), (2.1)–(2.3) существует и оно единственное (при условии ω(0) = ω(Т) = 0). Значение r(0) таково, чтобы в результате интегрирования уравнений (1.1), (1.2), (2.1)–(2.3) с начальными условиями (1.3) для траектории движения Λ(t) выполнялись равенства (1.4). В силу свойства |r| = const = |r(0)| ≠ 0, для удобства дальнейших рассуждений перейдем к нормированному вектору р = r/|r| и дальше будем использовать его. Обозначим r0 = |r(t)|, при этом ri = r0pi. Учитывая соотношения (2.1) и то, что r0 = const ≠ 0 , для вектора p(t) справедливо уравнение ${\mathbf{\dot {p}}}$ = –ω × p или

(2.4)
${{\dot {p}}_{1}} = {{\omega }_{3}}{{p}_{2}} - {{\omega }_{2}}{{p}_{3}},\quad {{\dot {p}}_{2}} = {{\omega }_{1}}{{p}_{3}} - {{\omega }_{3}}{{p}_{1}},\quad {{\dot {p}}_{3}} = {{\omega }_{2}}{{p}_{1}} - {{\omega }_{1}}{{p}_{2}},$
где pi – компоненты вектора р. Уравнения (1.1), (2.2), (2.4) совместно с равенствами (2.3) и ri = r0pi образуют замкнутую систему уравнений.

Краевая задача принципа максимума заключается в определении значения вектора р(0) и положительной величины r0, при которых решение системы дифференциальных уравнений (1.1), (1.2), (2.2), (2.4) с одновременным выполнением (2.3) удовлетворяло условиям разворота (1.3), (1.4). С учетом условий разворота ω(0) = ω(Т) = 0 система уравнений (1.1), (2.2)–(2.4) имеет единственное решение, в котором функции pi, φi, ωi связаны следующими равенствами:

(2.5)
${{\varphi }_{i}} = a(t){{p}_{i}},\quad i = \overline {1,\;3} ,$
(2.6)
${{\omega }_{i}} = b(t){{p}_{i}}{\text{/}}{{J}_{i}},$
где a(t) и b(t) – скалярные функции времени, а pi = ri/r0. Соответственно Mi = a(t)pi/2.

Истинность решений (2.5), (2.6) для системы дифференциальных уравнений (1.1), (2.2)–(2.4) подтверждается последовательной подстановкой соотношений (2.5) в уравнение (2.2) с учетом зависимостей ri = r0pi и связей (2.6) для всех i = 1, 2, 3 (равенства (2.6) – прямое следствие системы (1.1), (2.3)–(2.5)). Если обозначить JКА = diag{J1, J2, J3} – тензор инерции КА, φ – вектор, компонентами которого являются φi, то система (2.2) принимает вид

(2.7)
${\mathbf{\dot {\varphi }}} = 2{{k}_{0}}({{J}_{{{\text{КА}}}}}{\mathbf{\omega }}) + ({{J}_{{{\text{КА}}}}}{\mathbf{\omega }}) \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{\varphi }})--{{J}_{{{\text{КА}}}}}({\mathbf{\omega }} \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{\varphi }}))--{\mathbf{r}}.$

Правая часть уравнения (2.7) с учетом (2.5), (2.6) будет равна

$\begin{array}{*{20}{c}} {2{{k}_{0}}b{\mathbf{p}} + b{\mathbf{p}} \times (J_{{{\text{КА}}}}^{{ - 1}}a{\mathbf{p}})--{{J}_{{{\text{КА}}}}}((J_{{{\text{КА}}}}^{{ - 1}}b{\mathbf{p}}) \times (J_{{{\text{КА}}}}^{{ - 1}}a{\mathbf{p}}))--{\mathbf{r}} = 2{{k}_{0}}b{\mathbf{p}} + a{\mathbf{p}} \times (J_{{{\text{КА}}}}^{{ - 1}}b{\mathbf{p}})--{\mathbf{r}} = } \\ { = 2{{k}_{0}}b{\mathbf{p}} - {\mathbf{\omega }} \times {\mathbf{\varphi }}--{{r}_{0}}{\mathbf{p}} = 2{{k}_{0}}b{\mathbf{p}} - а(t){\mathbf{\omega }} \times {\mathbf{p}}--{{r}_{0}}{\mathbf{p}}.} \end{array}$

Левая часть уравнения (2.7) с учетом (2.4), (2.5) такова: ${\mathbf{\dot {\varphi }}} = \dot {a}(t){\mathbf{p}} + a(t){\mathbf{\dot {p}}} = \dot {a}(t){\mathbf{p}}$а(t)ω × p и она тождественно равна правой части, если в зависимостях (2.5) скалярная функция а(t) удовлетворяет условию $\dot {a}(t)$ = 2k0br0

Характер изменения функции а(t) при оптимальном управлении демонстрирует рис. 1, на котором сплошная линия соответствует оптимальной функции а(t); пунктирная линия обозначает гипотетическое поведение функции а(t), которое однозначно не может быть оптимальным, так как оно не удовлетворяет краевому условию ω(T) = 0 и равенству $\dot {a}(T) = - {{r}_{0}}$.

Рис. 1

2.3. Свойства оптимального движения. Найдем связь между a(t) и b(t). Из уравнений (1.1), (2.3)–(2.6) для оптимальной функции b(t) следует зависимость $\dot {b} = a{\text{/}}2$ или

(2.8)
$b(t) = \frac{1}{2}\int\limits_0^t {a(t)dt} .$

Из (2.2), (2.4), (2.5) видно, что оптимальные функции a(t), b(t) удовлетворяют соотношению

$\dot {a}(t) = 2{{k}_{0}}b--{{r}_{0}}.$

Учитывая последнее равенство и свойство (2.8), для a(t) запишем уравнение $\ddot {a} = {{k}_{0}}a$, решением которого является функция

$a(t) = {{C}_{1}}\exp ( - t\sqrt {{{k}_{0}}} ) + {{C}_{2}}\exp (t\sqrt {{{k}_{0}}} ).$

Анализ структуры функции a(t) показывает, что в любой момент времени t ∈ [0, T] производная $\dot {a} < 0$, причем на левом и на правом концах траектории она минимальна: $\dot {a}(0) = \dot {a}(T) = - {{r}_{0}}$. Так как граничные угловые скорости равны нулю ω(0) = 0 и ω(T) = 0, то b(0) = b(T) = 0, откуда r0 = $\sqrt {{{k}_{0}}} ({{C}_{1}} - {{C}_{2}})$. Соответственно оптимальная функция b(t) имеет вид

$b(t) = {{[{{C}_{2}}\exp (t\sqrt {{{k}_{0}}} ) - {{C}_{1}}\exp ( - t\sqrt {{{k}_{0}}} ) + {{C}_{1}} - {{C}_{2}}]} \mathord{\left/ {\vphantom {{[{{C}_{2}}\exp (t\sqrt {{{k}_{0}}} ) - {{C}_{1}}\exp ( - t\sqrt {{{k}_{0}}} ) + {{C}_{1}} - {{C}_{2}}]} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}.$

Из (2.3)–(2.5) отчетливо видно, что при оптимальном управлении силовой момент М действует вдоль прямой, неподвижной в инерциальной системе координат. Поэтому при нулевых граничных угловых скоростях ω(0) = ω(T) = 0 решение системы (1.1), (2.2)–(2.4) описывает движение, при котором кинетический момент КА L имеет постоянное направление в инерциальной системе координат, причем это решение единственное. Для движения ω(t) как решения системы (1.1), (2.2)–(2.4) (с учетом равенств ri = r0pi) выполняются соотношения (2.6) (то, что равенства (2.6) удовлетворяют уравнениям (2.4), легко проверить, подставив (2.6) в уравнения движения (1.1) с учетом равенств (2.3), (2.5)).

Легко показать, что для оптимального движения, соответствующего уравнениям (2.4), (2.6), выполняется условие ${{p_{1}^{2}} \mathord{\left/ {\vphantom {{p_{1}^{2}} {{{J}_{1}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}} \right. \kern-0em} {{{J}_{2}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}} \right. \kern-0em} {{{J}_{2}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}}}}} = {\text{const}}$. Для этого достаточно продифференцировать по времени левую часть указанного равенства с учетом (2.4), (2.6) и убедиться, что полученная производная равна нулю после подстановки${{\dot {p}}_{i}}$ по формулам (2.4) и затем ωi по выражениям (2.6). Отсюда следует одно из основных свойств оптимального разворота КА: отношение кинетической энергии вращения Е к квадрату модуля кинетического момента КА остается постоянным во все время движения (на всем отрезке времени [0, T]). Действительно

$E = {{b}^{2}}({{p_{1}^{2}} \mathord{\left/ {\vphantom {{p_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}){\text{/}}2,\quad {\text{и}}\quad Е{\text{/}}{{\left| {\mathbf{L}} \right|}^{2}} = ({{p_{1}^{2}} \mathord{\left/ {\vphantom {{p_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}){\text{/}}2 = {\text{const}}$
(зависимость b2 = |L|2 следует непосредственно из формул (2.6)).

Задача построения оптимального управления М(t) состоит главным образом в нахождении такого вектора p0 = р(0) и значений констант C1 и C2, чтобы в результате движения КА в соответствии с уравнениями (1.2), (2.4), (2.6) выполнялись равенства Λ(Т) = Λк и ω(Т) = 0. Для получения функциональной зависимости управлений от фазовых координат необходимо решить уравнения (2.4), которые для закона (2.6) примут следующий вид:

(2.9)
${{\dot {p}}_{1}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{2}} - {{J}_{3}}}}{{{{J}_{2}}{{J}_{3}}}}{{p}_{2}}{{p}_{3}},\quad {{\dot {p}}_{2}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{3}} - {{J}_{1}}}}{{{{J}_{1}}{{J}_{3}}}}{{p}_{1}}{{p}_{3}},\quad {{\dot {p}}_{3}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{1}} - {{J}_{2}}}}{{{{J}_{1}}{{J}_{2}}}}{{p}_{1}}{{p}_{2}}.$

Общее решение приведенной системы уравнений определить практически невозможно. Трудность заключается в определении граничных значений p(0) и p(T), которые связаны между собой выражением

${{\Lambda }_{{\text{к}}}} \circ \,~{\mathbf{p}}\left( Т \right) \circ {{\tilde {\Lambda }}_{{\text{к}}}} = {{L}_{{\text{н}}}}~ \circ \,{\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}}$
или р(Т) = ${{\tilde {\Lambda }}_{{\text{Р}}}} \circ $ р(0) $ \circ \,{{\Lambda }_{{\text{Р}}}}$ , где ${{\Lambda }_{{\text{р}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$ – кватернион разворота.

2.4. Определение основных констант оптимального управления. Поскольку b(T) = 0, то постоянные C1 и C2 связаны соотношением ${{C}_{1}} = - {{C}_{2}}\exp (T\sqrt {{{k}_{0}}} )$. Нетрудно видеть, что a(T/2) = 0 и $\dot {a}(T{\text{/}}2) < 0$, а также a(T) = –a(0). Конкретные значения констант C1 и C2 вычисляем, используя интеграл

(2.10)
$Q = \int\limits_0^T {b(t)dt} ,$

значение которого для движений в соответствии с уравнениями (2.4), (2.6) не зависит от характера изменения функции b(t) и определяется исключительно кватернионами Λн, Λк и моментами инерции КА J1, J2, J3 [19] (величина Q рассчитывается одновременно с вектором р0). В оптимальном решении постоянные C1 и C2 таковы:

(2.11)
$\begin{gathered} {{C}_{1}} = {Q \mathord{\left/ {\vphantom {Q {[{{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} + {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}]}}} \right. \kern-0em} {[{{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} + {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}]}}, \\ {{C}_{2}} = {Q \mathord{\left/ {\vphantom {Q {[{{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} - {{T(\exp (T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{T(\exp (T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}]}}} \right. \kern-0em} {[{{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} - {{T(\exp (T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{T(\exp (T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}]}}. \\ \end{gathered} $

При любых значениях Q, k0 и T выполняются условия C1 > 0, C2 < 0 и тем самым обеспечивается r0 > 0 и a(0) > 0, a(T) < 0, а b(t) ≥ 0 на всем отрезке времени t ∈ [0, T]. Чем ближе коэффициент k0 к нулю, тем ближе b(t) к квадратичной функции времени (при k0 → 0 функция b(t) изменяется по параболическому закону, а(t) – линейная функция времени). Чем больше значение k0, тем дальше функция b(t) отдаляется от параболического изменения. При неограниченном увеличении k0 функция b(t) приближается по форме к прямоугольному импульсу высотой Q/T (значение Q не зависит от коэффициента k0 и определяется исключительно граничными значениями Λн, Λк и моментами инерции КА J1, J2, J3). Рисунки 2, 3 наглядно показывают характер поведения оптимальных функций b(t) и а(t) в зависимости от значения коэффициента k0 минимизируемого функционала (1.5) (здесь $k_{0}^{{(1)}}$ > 0, $k_{0}^{{(2)}}$$k_{0}^{{(1)}}$); пунктирная линия на обоих рисунках соответствует случаю k0 → 0.

Рис. 2
Рис. 3

Уравнения (2.6) отчетливо показывают, что в геометрическом представлении вектор р есть ни что иное, как орт оптимального кинетического момента КА L в связанной с КА системе координат. Оптимальные функции ωi(t), φi(t), рi(t) удовлетворяют равенствам (2.5), (2.6), в которых переменные рi(t) являются решением уравнений (2.4). Оптимальные управления вычисляются по формулам (2.3) с учетом (2.5). Оптимальным (в смысле минимума показателя (1.5)) будет разворот КА, при котором направление кинетического момента остается неизменным относительно инерциальной системы координат (векторы М и L параллельны).

Для оптимальной программы управления М(t) движение КА относительно центра масс обладает следующими оригинальными свойствами и соотношениями:

$\Lambda \circ {\mathbf{M}}(T - t) \circ \tilde {\Lambda } = - \Lambda \circ {\mathbf{M}}(t) \circ \tilde {\Lambda };\quad \Lambda \circ {\mathbf{L}}(T - t) \circ \tilde {\Lambda } = \Lambda \circ {\mathbf{L}}(t) \circ \tilde {\Lambda };\quad \mathop {\max }\limits_{t < T} {\text{|}}{\mathbf{M}}(t){\text{|}} = {\text{|}}{\mathbf{M}}(0){\text{|}} = {\text{|}}{\mathbf{M}}(T){\text{|}}{\kern 1pt} ;$
$\int\limits_0^{T/2} {\left| {{\mathbf{L}}(t)} \right|dt} = \int\limits_{Т/2}^T {\left| {{\mathbf{L}}(t)} \right|dt} ,\quad {{L}_{{{\text{max}}}}} = \mathop {\max }\limits_{0 < t < T} \sqrt {J_{1}^{2}\omega _{1}^{2} + J_{2}^{2}\omega _{2}^{2} + J_{3}^{2}\omega _{3}^{2}} = {\text{|}}{\mathbf{L}}(T{\text{/}}2){\text{|}}{\text{.}}$

В момент времени t = T/2 (посередине разворота) момент сил М равен нулю M (T/2) = 0, а кинетический момент КА достигает максимального значения |L(T/2)| = Lmax.

3. Обоснование единственности оптимального решения. Покажем, что найденное решение (2.5), (2.6) – единственное решение системы уравнений (1.1), (2.2)–(2.4). Пусть q – орт, параллельный моменту М, причем в начальный момент времени t = 0 направления векторов φ и q совпадают, т.е. q(0)φ(0) > 0 (знак умножения “⋅” означает скалярное произведение векторов). Тогда φ = χ q, где χ – скалярная функция c начальным значением χ(0) > 0 (|q| = 1). В окрестности точки t = 0 имеем М || L и L = Kq, где L = JКАω – кинетический момент КА; K – скалярная величина. Подставим формулы (2.3) с учетом зависимости φ = χ(t)q в уравнения (1.1) при наличии равенств Jiωi = Kqi. Получим соотношение

(3.1)
$\dot {K}{\mathbf{q}} + {\mathbf{\dot {q}}}K + {\mathbf{\omega }} \times {\mathbf{q}}K = \chi (t){\mathbf{q}}{\text{/}}2.$

Сумма ${\mathbf{\dot {q}}}K + {\mathbf{\omega }} \times {\mathbf{q}}K$ ортогональна орту q или равна нулю (всегда q${\mathbf{\dot {q}}}$ = 0, так как |q| = 1). Уравнение (3.1) будет выполнено в единственном случае, если $\dot {K} = \chi (t){\text{/}}2$ и ${\mathbf{\dot {q}}} = - {\mathbf{\omega }} \times {\mathbf{q}}$. Теперь подставим равенства φ = χ(t) q и L = Kq в (2.7). Левая часть уравнения (2.7) равна

$\dot {\chi }{\mathbf{q}} + \chi {\mathbf{\dot {q}}} = \dot {\chi }{\mathbf{q}} - \chi \omega \times {\mathbf{q}}.$
(уравнения (1.1), (2.2) должны выполняться одновременно, поэтому свойство ${\mathbf{\dot {q}}} = - {\mathbf{\omega }} \times {\mathbf{q}}$ взято из (3.1)). Правая часть уравнения (2.7) будет такой:

$\begin{array}{*{20}{c}} {2{{k}_{0}}K{\mathbf{q}} + K{\mathbf{q}} \times (J_{{{\text{КА}}}}^{{ - 1}}\chi {\mathbf{q}})--\chi {{J}_{{{\text{КА}}}}}((J_{{{\text{КА}}}}^{{ - 1}}K{\mathbf{q}}) \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}))--{\mathbf{r}} = 2{{k}_{0}}K{\mathbf{q}}--\chi (KJ_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}}--{\mathbf{r}} = } \\ { = 2{{k}_{0}}K{\mathbf{q}} - \chi {\mathbf{\omega }} \times {\mathbf{q}}--{\mathbf{r}}.} \end{array}$

Приравняв левую и правую части уравнения (2.7), получаем уравнение для вектора q:

$\dot {\chi }{\mathbf{q}} = 2{{k}_{0}}K{\mathbf{q}}--{{r}_{0}}{\mathbf{р}},$
из чего следуют равенства r0 = 2k0K$\dot {\chi }$ = – const и qр (так как χ(0) > 0 и χ(T) < 0, а потому $\dot {\chi }$ < 0). В итоге пришли к выводу: если в какой-либо момент времени t кинетический момент L и вектор φ параллельны, то они параллельны на всем интервале управления 0 < t < T. В самом начале разворота (L = htφ при t → 0) и в самом конце маневра (L = −h(Тt)φ при tT) векторы φ и L параллельны (в силу наличия граничных условий ω(0) = 0 и ω(T) = 0), где h – скалярная величина. Поэтому заключаем, что при оптимальном движении на всем отрезке времени t ∈ [0, T] имеет место свойство L $||$ р. Отсюда становятся очевидны соотношения (2.5), (2.6), определяющие оптимальное управление.

Доказано, что зависимости (2.5), (2.6) есть единственное решение системы уравнений (1.1), (2.2)–(2.4) с граничными условиями ω(0) = 0, ω(T) = 0 (с учетом равенств ri = r0pi). Имея ввиду выражения (2.3), (2.5), (2.6) и оптимальные значения C1 и C2 для функций a(t), b(t), оптимальное управление и оптимальное движение определяют следующие зависимости:

(3.2)
${{M}_{i}} = {{C}_{1}}[\exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]{{p}_{i}}{\text{/}}2,\quad i = \overline {1,3} ,$
(3.3)
${{J}_{i}}{{\omega }_{i}} = {{C}_{1}}{{[1 + \exp ( - T\sqrt {{{k}_{0}}} ) - \exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]{{p}_{i}}} \mathord{\left/ {\vphantom {{[1 + \exp ( - T\sqrt {{{k}_{0}}} ) - \exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]{{p}_{i}}} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}),\quad i = \overline {1,\;3,} $
где pi – компоненты вектора p, удовлетворяющего уравнениям (2.4) или p = $\tilde {\Lambda } \circ $ ΛН $ \circ $ р0 $ \circ \,{{\tilde {\Lambda }}_{{\text{н}}}}$ $ \circ $ Λ, ${{C}_{1}} = {Q \mathord{\left/ {\vphantom {Q {[{{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} + {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}]}}} \right. \kern-0em} {[{{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp ( - T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} + {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{T(\exp ( - T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}]}}$.

Таким образом, решение (3.2), (3.3) системы уравнений (1.1), (2.2)–(2.4) – единственное.

4. Построение типовой программы оптимального разворота КА. Функции φi(t), рi(t), ωi(t) будут оптимальными тогда и только тогда, когда они удовлетворяют уравнениям (2.4), (2.5), (3.3). Ключевой проблемой в решении задачи оптимального разворота (при построении оптимального программного движения ω(t)) является нахождение начальных условий р(0). Максимальный управляющий момент |М(0)| оптимального закона управления определяется значением коэффициента k0 минимизируемого функционала качества и временем разворота T (вектор р(0) зависит исключительно от кватерниона разворота Λр и моментов инерции КА J1, J2, J3 и не зависит от k0 и Т); |М (0)| = (C1 + C2)/2. Если р(0) известно, то φ(0) = (C1 + C2)р(0).

Управляющие переменные рассчитываются в соответствии с законом (3.2), для реализации которого необходимо в каждый текущий момент времени t знать все три переменные р1, р2, р3. Система (1.2), (2.4), (2.6) имеет аналитическое решение только для динамически симметричного и сферического тел. Для сферически-симметричного твердого тела (J1 = J2 = J3) решение следующее:

${{{{р}_{i}}\left( t \right) = {\text{const}} = {{р}_{i}}_{0} = {{\nu }_{i}}} \mathord{\left/ {\vphantom {{{{р}_{i}}\left( t \right) = {\text{const}} = {{р}_{i}}_{0} = {{\nu }_{i}}} {\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} }}} \right. \kern-0em} {\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} }};\quad {{М}_{i}}\left( t \right) = {{C}_{1}}[\exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]{{р}_{i}}_{0}{\text{/}}2;$
${{\omega }_{i}}(t) = {{C}_{1}}{{[1 + \exp ( - T\sqrt {{{k}_{0}}} ) - \exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]{{p}_{{i0}}}} \mathord{\left/ {\vphantom {{[1 + \exp ( - T\sqrt {{{k}_{0}}} ) - \exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]{{p}_{{i0}}}} {(2{{J}_{i}}\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2{{J}_{i}}\sqrt {{{k}_{0}}} )}},\quad i = \overline {1,\;3,} $
где ${{\nu }_{1}}$, ${{\nu }_{2}}$, ${{\nu }_{3}}$ – компоненты векторной части кватерниона разворота Λр. Во время оптимального разворота КА вращается вокруг оси Эйлера, поэтому траектория оптимального движения Λ(t) имеет аналитический вид
$\Lambda (t) = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{0}}}}s(t)/(2{{J}_{1}})}}},\quad s\left( t \right) = \int\limits_0^t {b(t)dt} ,$
где e – кватернионная экспонента [1]; вектор в показателе степени кватернионной экспоненты понимается как кватернион с нулевой скалярной частью. Приведенное решение существенно отличается от известных случаев [1, 10].

Для динамически симметричного КА (например, когда J2 = J3) задача оптимального управления разворотом решается до конца (не умаляя общности рассуждений, за ось симметрии принята ось ОХ КА). Оптимальное движение в этом частном, но достаточно распространенном случае представляет собой одновременное вращение КА как твердого тела вокруг своей продольной оси ОХ и вокруг некоторого направления η, неподвижного в инерциальном пространстве и составляющего с продольной осью КА определенный постоянный угол ϑ. Угловые скорости относительно осей ОХ и η изменяются пропорционально с постоянным коэффициентом пропорциональности, и поэтому справедливо соотношение

${{\Lambda }_{{\text{к}}}} = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\beta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\alpha /2}}},$
где векторы в показателе степени кватернионной экспоненты понимаются как кватернионы с нулевой скалярной частью; р0 = р(0); е1 – орт продольной оси КА; α , β – углы поворота КА вокруг продольной оси ОХ и вокруг вектора р соответственно (считается |α| ≤ π, 0 ≤ β ≤ π). Решение p(t) системы (1.2), (2.4), (2.6) представим в следующей форме:
${{р}_{1}} = {{р}_{{10}}} = {\text{cos}}\vartheta ,\quad {{p}_{2}} = {{p}_{{20}}}\cos \kappa + {{p}_{{30}}}\sin \kappa ,\quad {{p}_{3}} = - {{p}_{{20}}}\sin \kappa + {{p}_{{30}}}\cos \kappa ,$
(4.1)
${\text{a}}\quad \kappa = \frac{{J - {{J}_{1}}}}{J}\int\limits_0^t {{{\omega }_{1}}(t)dt} ,$
где pi0 = рi(0); J = J2 = J3; продольная угловая скорость ω1(t) определяется из соотношений (3.3) с учетом р1 = const = р10. Зависимость параметров pi0 , α , β от значений кватернионов Λн и Λк определяется системой уравнений:
(4.2)
$\alpha = \frac{{J - {{J}_{1}}}}{{{{J}_{1}}}}{{p}_{{10}}}\beta ;\quad \cos \frac{\beta }{2}\cos \frac{\alpha }{2} - {{p}_{{10}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{0}};\quad \cos \frac{\beta }{2}\sin \frac{\alpha }{2} + {{p}_{{10}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} = {{\nu }_{1}},$
${{p}_{{20}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} + {{p}_{{30}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{2}};\quad - {{р}_{{20}}}\sin \frac{{{\beta }}}{2}\cos \frac{{{\alpha }}}{{\text{2}}} + {{p}_{{30}}}\sin \frac{{{\beta }}}{2}\cos \frac{{{\alpha }}}{2} = {{{{\nu }}}_{3}},$
где ${{\nu }_{0}}$, ${{\nu }_{1}}$, ${{\nu }_{2}}$, ${{\nu }_{3}}$ – компоненты кватерниона разворота ${{\Lambda }_{{\text{р}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$; –π ≤ α ≤ π , 0 ≤ β ≤ π.

Существование решения системы (4.2) для любых значений кватерниона Λр доказано в [12]. Программные значения функций ωi (проекции требуемого вектора угловой скорости ω* на связанные оси) вычисляются по формулам (4.1) и (3.3), где коэффициент C1 находится из (2.11). В явном виде оптимальное решение Mi(t), ωi(t), $i = \overline {1,\;3} $, запишем следующим образом:

${{M}_{1}} = {{C}_{1}}{{\left[ {\exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]{{p}_{{10}}}} \mathord{\left/ {\vphantom {{\left[ {\exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]{{p}_{{10}}}} 2}} \right. \kern-0em} 2},$
${{M}_{2}} = {{C}_{1}}\left[ {\exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]{{\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma )} \mathord{\left/ {\vphantom {{\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma )} 2}} \right. \kern-0em} 2},$
${{M}_{3}} = {{C}_{1}}\left[ {\exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]{{\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma )} \mathord{\left/ {\vphantom {{\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma )} 2}} \right. \kern-0em} 2},$
${{\omega }_{1}} = {{C}_{1}}{{\left[ {1 + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]{{p}_{{10}}}} \mathord{\left/ {\vphantom {{\left[ {1 + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]{{p}_{{10}}}} {\left( {2{{J}_{1}}\sqrt {{{k}_{0}}} } \right)}}} \right. \kern-0em} {\left( {2{{J}_{1}}\sqrt {{{k}_{0}}} } \right)}},$
${{\omega }_{2}} = {{C}_{1}}{{\left[ {1 + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma )} \mathord{\left/ {\vphantom {{\left[ {1 + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma )} {\left( {2J\sqrt {{{k}_{0}}} } \right)}}} \right. \kern-0em} {\left( {2J\sqrt {{{k}_{0}}} } \right)}},$
${{\omega }_{3}} = {{C}_{1}}{{\left[ {1 + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma )} \mathord{\left/ {\vphantom {{\left[ {1 + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left( { - t\sqrt {{{k}_{0}}} } \right) - \exp \left( {(t - T)\sqrt {{{k}_{0}}} } \right)} \right]\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma )} {(2J\sqrt {{{k}_{0}}} }}} \right. \kern-0em} {(2J\sqrt {{{k}_{0}}} }}),$
где $\gamma = \arcsin ({{{{p}_{{20}}}} \mathord{\left/ {\vphantom {{{{p}_{{20}}}} {\sqrt {1 - p_{{10}}^{2}} }}} \right. \kern-0em} {\sqrt {1 - p_{{10}}^{2}} }})$, если р30 ≥ 0 , или $\gamma = \pi - \arcsin ({{{{p}_{{20}}}} \mathord{\left/ {\vphantom {{{{p}_{{20}}}} {\sqrt {1 - p_{{10}}^{2}} }}} \right. \kern-0em} {\sqrt {1 - p_{{10}}^{2}} }})$, если р30 < 0 (|р10| ≠ 1). Случай |р10| = 1 не рассматривается, так как он соответствует плоскому вращению КА вокруг продольной оси ОХ. Оптимальный угол ϑ = arcos р10 (значение р10 находится из системы (4.2)). Оптимальная траектория движения Λ(t) может быть представлена в аналитическом виде
$\Lambda (t) = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{0}}}}\sigma /2}}} \circ {{e}^{{\mu {{{\mathbf{e}}}_{{\text{1}}}}/2}}},$
где σ = ${{C}_{1}}{{\left[ {{{\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) + 1} \right)t} \mathord{\left/ {\vphantom {{\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) + 1} \right)t} {\left( {2\sqrt {{{k}_{0}}} } \right)}}} \right. \kern-0em} {\left( {2\sqrt {{{k}_{0}}} } \right)}}} \right. + \left( {\exp \left( { - t\sqrt {{{k}_{0}}} } \right)} \right. + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left. {{{\left. {\left( {(t - T)\sqrt {{{k}_{0}}} } \right) - 1} \right)} \mathord{\left/ {\vphantom {{\left. {\left( {(t - T)\sqrt {{{k}_{0}}} } \right) - 1} \right)} {(2{{k}_{0}})}}} \right. \kern-0em} {(2{{k}_{0}})}}} \right]} \mathord{\left/ {\vphantom {{\left[ {{{\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) + 1} \right)t} \mathord{\left/ {\vphantom {{\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) + 1} \right)t} {\left( {2\sqrt {{{k}_{0}}} } \right)}}} \right. \kern-0em} {\left( {2\sqrt {{{k}_{0}}} } \right)}}} \right. + \left( {\exp \left( { - t\sqrt {{{k}_{0}}} } \right)} \right. + \exp \left( { - T\sqrt {{{k}_{0}}} } \right) - \exp \left. {{{\left. {\left( {(t - T)\sqrt {{{k}_{0}}} } \right) - 1} \right)} \mathord{\left/ {\vphantom {{\left. {\left( {(t - T)\sqrt {{{k}_{0}}} } \right) - 1} \right)} {(2{{k}_{0}})}}} \right. \kern-0em} {(2{{k}_{0}})}}} \right]} J}} \right. \kern-0em} J}$; μ = σр10(J J1)/J1 (значения Т и k0 заданы, а коэффициент C1 определяется формулой (2.11)).

Для несимметричного КА (${{J}_{1}} \ne {{J}_{2}} \ne {{J}_{3}}$) решение системы уравнений (1.2), (2.4), (2.6) находится только численными методами (например, методом последовательных приближений или [26]). Определение вектора p0 производится путем решения краевой задачи р(0) = р0, р(Т) = = ${{\tilde {\Lambda }}_{{\text{р}}}} \circ {{{\mathbf{p}}}_{0}} \circ {{\Lambda }_{{\text{р}}}}$ с учетом накладываемых на движение связей (2.9). В способе [27] и системе [28] такая задача решена для КА с произвольными моментами инерции (методом итераций). Заметим, что решение р0 не зависит от характера изменения модуля кинетического момента, входящего в уравнения (2.9). Поэтому для нахождения оптимального значения р0 правомерно принять |L| = const ≠ 0. Случай решения р(t) системы (2.9) с |L| = const соответствует вращению твердого тела с М = 0 (поскольку уравнения (1.1), (2.4) и (2.6) выполняются одновременно).

Для вращения твердого тела с постоянным направлением кинетического момента относительно инерциальной системы координат (независимо от изменения модуля |L|) имеет место равенство

$\int\limits_0^T {\left| {{\mathbf{L}}(t)} \right|dt} = {{K}_{{\text{c}}}}{{t}_{{{\text{пр}}}}},$
где Kc – произвольная средняя величина кинетического момента (Kc > 0); tпр – прогнозируемое время разворота из положения Λн в положение Λк, т.е. время, когда выполнится равенство Λ = Λк для решения Λ(t) системы уравнений (1.2), (2.4), (2.6), в которых b = Kc, а Λ(0) = Λн. Если b(t) = const = Kc, то Q = ${{K}_{{\text{c}}}}{{t}_{{{\text{пр}}}}}$. Каждой конкретной величине Kc соответствует свое значение tпр (значения tпр и Kc связаны обратно пропорциональной зависимостью). Взяв Kc ≠ 0 и моделируя неуправляемое вращение КА (когда М = 0) для соответствующих начальных условий Λ(0) = Λн, ${{\omega }_{{i0}}} = {{{{K}_{{\text{c}}}}{{p}_{{i0}}}} \mathord{\left/ {\vphantom {{{{K}_{{\text{c}}}}{{p}_{{i0}}}} {{{J}_{i}}}}} \right. \kern-0em} {{{J}_{i}}}}$, получим прогнозируемое время tпр.

Для построения оптимального управления при развороте КА необходимо знать не только программу изменения координат рi(t), но и значения постоянных параметров C1 и C2, определяющих темп приближения к требуемому конечному состоянию Λ(Т) = Λк, ω(Т) = 0 (коэффициент k0 и время разворота Т заданы). Конкретное значение r0 = |r| и параметры C1 и C2 зависят от длительности разворота T, коэффициента k0 функционала качества и от интеграла Q.

Решение задачи оптимального разворота (в смысле минимума (1.5)) подчиняется уравнениям (2.4)(2.6), а управляющие переменные Мi и угловые скорости ωi изменяются в соответствии с законами (3.2), (3.3). Решение (3.2), (3.3) оптимально, потому что оно единственное; только оно одно (и никакое другое) удовлетворяет необходимым условиям оптимальности. Любое отличное от (3.2), (3.3) движение будет заведомо хуже (в смысле минимума интеграла (1.5)), поскольку не является решением системы (2.2)–(2.4), а значит, не удовлетворяет необходимым условиям оптимальности (согласно принципу максимума). Значение C1 в законах движения (3.2), (3.3) определяет максимальную величину управляющего момента |M(0)| и максимальное значение кинетического момента Lmax = |L (T/2)|. Значение вектора р0 рассчитывается в результате решения краевой задачи принципа максимума. Константы r0, C1 полностью определяют программу движения при оптимальном законе управления пространственным разворотом КА. Программное изменение момента сил М описывается зависимостью

(4.3)
${\mathbf{M}} = {{C}_{1}}[\exp ( - t\sqrt {{{k}_{0}}} ) - \exp ((t - T)\sqrt {{{k}_{0}}} )]\tilde {\Lambda } \circ {{\Lambda }_{{\text{Н}}}} \circ {{{\mathbf{р}}}_{0}} \circ {{\tilde {\Lambda }}_{{\text{н}}}} \circ \Lambda {\text{/}}2.$

Необходимо заметить, что чем больше коэффициент k0, тем больше максимальный управляющий момент |M(0)| и тем меньше максимальная энергия вращения Emax = E(T/2) и максимальный кинетический момент Lmax = |L(T/2)|. Чем меньше коэффициент k0, тем меньше максимальный управляющий момент |M(0)|, но тем больше максимальная энергия вращения Emax = E(T/2) и максимальный кинетический момент Lmax = |L(T/2)|. Если k0 → 0, то a(t) – линейная функция времени ($\dot {a}(t)$ ≈ const = –r0), а b(t) – квадратичная функция времени (этому случаю соответствуют пунктирная линия на рис. 2). Если k0 → ∞, то в середине разворота $\dot {a}(t)$ близка нулю ($\dot {a}(t)$ ≈ 0, хотя $\dot {a}(t)$ < 0) и b(t) ≈ const (см. рис. 2).

Для динамически симметричного КА значения Q, C1, C2 и r0 вычисляются значительно проще (расчет величин |M(0)| и Lmax также упрощается). В этом частном случае |L| = J2${{\dot {\beta }}}$ и Q = J2β, где J2 – момент инерции относительно поперечной оси (J2 = J3); ${{\dot {\beta }}}$ – скорость вращения вокруг кинетического момента L; β – угол поворота КА вокруг вектора L (из физического смысла β ≥ 0). Чтобы значение оптимизируемого функционала (1.5) было минимальным, необходимо выполнить условие β ≤ π (именно поэтому система (4.2) включает неравенство 0 ≤ β ≤ π). Значения C1, C2 и r0 зависят только от угла поворота КА вокруг кинетического момента L и численно равны:

${{C}_{1}} = {{{{J}_{2}}\beta } \mathord{\left/ {\vphantom {{{{J}_{2}}\beta } {{{\left[ {\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) - 1} \right)} \right.} \mathord{\left/ {\vphantom {{\left[ {\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) - 1} \right)} \right.} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} + T}}} \right. \kern-0em} {{{\left[ {\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) - 1} \right)} \right.} \mathord{\left/ {\vphantom {{\left[ {\left( {\exp \left( { - T\sqrt {{{k}_{0}}} } \right) - 1} \right)} \right.} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}} + T}}\left. {{{\left( {\exp ( - T\sqrt {{{k}_{0}}} ) + 1} \right)} \mathord{\left/ {\vphantom {{\left( {\exp ( - T\sqrt {{{k}_{0}}} ) + 1} \right)} {\left( {2\sqrt {{{k}_{0}}} } \right)}}} \right. \kern-0em} {\left( {2\sqrt {{{k}_{0}}} } \right)}}} \right],$
${{C}_{2}} = {{{{J}_{2}}\beta } \mathord{\left/ {\vphantom {{{{J}_{2}}\beta } {\left[ {{{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}}} \right. - T}}} \right. \kern-0em} {\left[ {{{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} \mathord{\left/ {\vphantom {{(\exp (T\sqrt {{{k}_{0}}} ) - 1)} {{{k}_{0}}}}} \right. \kern-0em} {{{k}_{0}}}}} \right. - T}}\left. {{{(\exp (T\sqrt {{{k}_{0}}} ) + 1)} \mathord{\left/ {\vphantom {{(\exp (T\sqrt {{{k}_{0}}} ) + 1)} {(2\sqrt {{{k}_{0}}} )}}} \right. \kern-0em} {(2\sqrt {{{k}_{0}}} )}}} \right],\quad {{r}_{0}} = \sqrt {{{k}_{0}}} ({{C}_{1}} - {{C}_{2}}).$

В случае осевой симметрии КА полученное решение принципиально отличается от известного [12], так как оно не имеет интервалов времени, на которых модуль управляющего момента постоянный; второе отличие – все управляющие функции Мi(t) и все фазовые переменные Λ, ωi есть непрерывные (даже гладкие) функции времени.

5. Результаты математического моделирования. Для примера рассмотрим разворот некоторого КА на 180° из положения, при котором связанные оси совпадают по направлению с одноименными осями инерциального базиса I, в положение, соответствующее кватерниону Λк с элементами λ0 = 0; λ1${{k}_{0}}$ = 0.707; λ2 = 0.39; λ3 = 0.59 . Приведем численное решение задачи оптимального управления программным разворотом КА с минимальным значением показателя (1.5). При этом считалось, что начальные и конечные угловые скорости нулевые: ω(0) = ω(Т) = 0. Определим оптимальную программу управления скоростью вращения КА ω(t) для перевода КА из состояния (1.3) в состояние (1.4) за время Т = 300 с. Инерционные характеристики КА полагаем равными: J1 = 25603 кг⋅м2, J2 = 91495 кг⋅м2, J3 = 80662 кг⋅м2. Считаем, что коэффициент k0 = 0.01 с–2.

При решении краевой задачи принципа максимума в уравнениях (2.6) полагаем b = const (и соответственно |L| = const), так как искомое значение p0 не зависит от характера изменения функции b(t) [19]. Нахождение расчетного значения вектора p0 начинаем с решения той же краевой задачи для динамически симметричного КА с моментами инерции J1 и J, где J – момент инерции относительно поперечной оси, принимаемый равным

$J = \frac{{{{J}_{2}}{{J}_{3}}}}{{{{J}_{2}} + {{J}_{3}} - {{J}_{1}}}}\left( {\sqrt {(1 - {{J}_{1}}{\text{/}}{{J}_{2}})(1 - {{J}_{1}}{\text{/}}{{J}_{3}})} + 1} \right).$

В предположении динамической симметричности КА решение p0 определяется системой (4.2), в которой элементы кватерниона разворота таковы: ν0 = 0; ν1 = 0.707; ν2 = 0.39; ν3 = 0.59. Для симметричного твердого тела искомый вектор p0 такой: ${\mathbf{p}}_{0}^{{(0)}}$ = {0.465250; –0.371480; 0.803458}. Полученные из уравнений (4.2) значения p0 и β являются начальным приближением к истинному решению. Они уточняются до тех пор, пока не будут удовлетворять системе уравнений (1.2), (1.1), в которых момент сил отсутствует (M = 0), с учетом накладываемых на движение КА ограничений Λ(0) = Λн, Λ(tпр) = Λк, а начальные угловые скорости ωiн определяются вектором p0 и углом β по следующим выражениям:

(5.1)
${{\omega }_{{1{\text{н}}}}} = \frac{{J\beta }}{{{{J}_{1}}T}}{{p}_{{10}}},\quad {{\omega }_{{2{\text{н}}}}} = \frac{{J\beta }}{{{{J}_{2}}T}}{{p}_{{20}}},\quad {{\omega }_{{3{\text{н}}}}} = \frac{{J\beta }}{{{{J}_{3}}T}}{{p}_{{30}}}.$

Прогнозирование “свободного” движения осуществляется интегрированием системы уравнений (1.1), (1.2), описывающих вращение КА, при начальных условиях Λ(0) = Λн, ω(0) = ωн и с учетом того, что M = 0. Степень приближения найденных р0 и β к искомому решению характеризуется мерой ε = sqal(${{\tilde {\Lambda }}_{{{\text{пр}}}}} \circ {{\Lambda }_{{\text{к}}}}$), где Λпр – наиболее близкое к Λк положение, полученное в ходе моделирования движения КА около центра масс (согласно уравнений (1.2), (1.1), в которых Mi = 0). Вектор р0 уточняется до тех пор, пока ε < εпорпор – некоторое близкое к единице пороговое значение, отражающее точность найденного решения). Как только условие ε ≥ εпор достигнуто (прогнозируемая ошибка соответствует требуемой точности), истинные значения p0 и β, удовлетворяющие граничным условиям Λ(0) = Λн, Λ(tпр) = Λк, будут найдены и краевая задача решена. Вектор p0 уточняется, используя следующее рекуррентное соотношение:

$\Lambda _{{\text{р}}}^{{{\text{(}}k + {\text{1)}}}} = \Lambda _{{\text{р}}}^{{{\text{(}}k{\text{)}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}},$
где $\Lambda _{{\text{р}}}^{{{\text{(}}k{\text{)}}}}$ – значение кватерниона разворота на k-й итерации, используемое в системе (4.2). “Свободное” движение прогнозируется интегрированием системы уравнений (1.1), (1.2), описывающей вращение КА с начальными условиями Λ(0) = Λн, ω(0) = ωн и с учетом того, что M = 0. На каждом k-м шаге итераций обновляются элементы кватерниона разворота $\Lambda _{{\text{р}}}^{{{\text{(}}k{\text{)}}}}$ (правые части системы (4.2)), и из уравнений (4.2) мы получаем p0 и β, а также соответствующую начальную угловую скорость ωн (согласно (5.1)) и прогноз Λпр. Если ε < εпор, то вычисляется кватернион разворота $\Lambda _{{\text{р}}}^{{{\text{(}}k + {\text{1)}}}}$ для следующего (k + 1)-го шага итераций и процесс уточнения вектора p0 повторяется. За начальное приближение в правых частях системы (4.2) берутся элементы кватерниона $\Lambda _{{\text{р}}}^{{{\text{(0)}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$. Итерационный процесс прекращается, когда ε ≥ εпор.

Принятая схема итераций аналогична итерационному методу решения уравнения вида x = g(x) для скалярной функции g(x) скалярного (одномерного) аргумента x. В нашем случае аргумент – гиперкомплексное число (кватернион) Λр. Функцией является кватернионная величина ${{\Lambda }_{{\text{р}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}}$, где Λк – постоянный (не зависящий от аргумента Λр) кватернион; Λпр зависит от аргумента Λр через систему уравнений (4.2), (5.1) посредством модели движения (1.1), (1.2) (в уравнениях (1.1) принимается Мi = 0). Изменяя Λр, изменяются вектор p0 (в соответствии с (4.2)) и угловые скорости ωiн, а значит, изменится и значение Λпр, что вызовет изменение функции ${{\Lambda }_{{\text{р}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}}$. Как только sqal(${{\tilde {\Lambda }}_{{{\text{пр}}}}} \circ {{\Lambda }_{{\text{к}}}}$) ≥ εпор, итерационный процесс прекращается, а решение p0 считается найденным. Так как |vect(${{\tilde {\Lambda }}_{{\text{к}}}} \circ \Lambda _{{{\text{пр}}}}^{{(k)}}$)| < |vect$\Lambda _{{\text{р}}}^{{(k)}}$| для всех k, то итерационный процесс приближения p0 к искомому решению сходится. Аналогичный метод определения значения р0 в решении краевой задачи принципа максимума использовался в задаче оптимального по быстродействию управления [16]. Заметим, что это лишь один из возможных (но далеко не единственный) итерационных алгоритмов поиска оптимального вектора р0.

В результате решения краевой задачи разворота из положения Λ(0) = Λн в положение Λ(Т) = Λк получили расчетное значение вектора p0 = {0.455215; –0.347544; 0.819751} и значение интеграла (2.10) Q = 15837 Н⋅м⋅с2. Максимальная величина управляющего момента равна |M(0)| = 56 Н⋅м. Максимальный модуль кинетического момента составил Lmax = 563.7 Н⋅м⋅с, а максимальная энергия вращения за время разворота оказалась равной Emax = 2.82 Дж. Значение функции a(t) в начальный момент времени следующее: a(0) = 112 Н⋅м. Оптимальный вектор φ (0) = {51.0; –38.9; 91.8}. Значение константы r0 = 11.274 Вт.

Данные математического моделирования динамики оптимального разворота представлены рис. 4–7. На рис. 4 изображены графики изменения угловых скоростей в связанной с КА системе координат ω1(t), ω2(t), ω3(t) по времени. Отмечаем, что угловая скорость ω1, соответствующая оси ОХ КА, – знакопостоянна, а характер ее изменения повторяет поведение модуля кинетического момента (в отличие от составляющих угловой скорости ω2 и ω3). Это свидетельствует о том, что ось ОХ – продольная ось КА. На рис. 5 отображены графики изменения компонент кватерниона Λ(t), определяющего текущую ориентацию КА в процессе совершаемого поворотного маневра: λ0(t), λ1(t), λ2(t), λ3(t). На рис. 6 приведена динамика изменения составляющих р1(t), р2(t), р3(t) орта р во времени. Характерным является незначительное изменение проекции р1. На рис. 7 изображены графики изменения управляющих функций М1(t), М2(t), М3(t). Значение показателя (1.5), отражающего экономичность программы М(t) управления разворотом, составило G = 19.2 Дж/с. При оптимальном управлении переменные рi и λj являются гладкими функциями времени; угловые скорости ωi – гладкие функции времени (за исключением моментов времени t = 0 и t = Т).

Рис. 4
Рис. 5
Рис. 6
Рис. 7

Заключение. Рассмотрена и решена задача оптимального управления пространственным разворотом КА из исходного углового положения в заданное конечное угловое положение. Принятый нами показатель оптимальности включает как управляющие функции, так и фазовые переменные и характеризует энергетические затраты, расходуемые на переориентацию КА. Вопросы экономичности управления движением КА актуальны и сегодня, поэтому решаемая в статье задача разворота является практически важной.

На основе принципа максимума Л.С. Понтрягина и кватернионных моделей и методов исследования управляемого движением твердого тела (КА), а также используя универсальные переменные ri [2], получено решение поставленной задачи. Выписаны выражения для оптимального управления, функции Гамильтона и сопряженной системы уравнений для исходной задачи. Определены ключевые свойства оптимального движения и тип траектории, оптимальной по выбранному критерию. Так в процессе всего разворота отношение кинетической энергии вращения к квадрату модуля кинетического момента КА есть величина постоянная. Найдены необходимые условия оптимальности и раскрыта структура оптимального управления; приведены формализованные соотношения для определения программного движения КА. Показано, что на всем интервале переориентации момент сил действует вдоль прямой, неподвижной в инерциальном пространстве, и направление кинетического момента остается неизменным относительно инерциальной системы координат. Управление (4.3) оптимально, потому что оно является единственным решением системы уравнений (1.1), (2.2)–(2.4), которые формализуют необходимые условия оптимальности.

В статье описывается процедура реализации оптимального режима управления. Задача оптимального управления разворотом решается до конца; даны выражения для расчета ключевых характеристик маневра переориентации. Так как на управляющий момент не наложено никаких ограничений, требуемый поворотный маневр осуществим для любого заданного времени Т. Для динамически симметричного КА представлено законченное решение задачи пространственного разворота: во-первых, получены зависимости как явные функции времени для оптимального закона движения и соотношения для расчета ключевых параметров алгоритма управления поворотным маневром; во-вторых, записана система уравнений (в аналитическом виде), из которой непосредственно находится решение краевой задачи принципа максимума и вычисляются необходимые константы закона управления (оптимальные значения указанных параметров могут быть определены устройством [29]). Приводятся данные математического моделирования, иллюстрирующие динамику движения КА во время оптимального разворота.

Главное отличие предлагаемого решения состоит в использовании нового функционала качества, который объединяет в заданной пропорции вклад управляющих сил (по энергетическим затратам) в движение КА за время разворота и интеграл от кинетической энергии вращения. Наличие интеграла от квадратичной свертки по силовым моментам в функционале качества делает управление, во-первых, ограниченным, а, во-вторых, управляющие функции гладкими (угловые скорости – также гладкие функции времени). Введение интеграла от кинетической энергии вращения в минимизируемый функционал уменьшает (насколько это возможно при заданном времени T) кинетическую энергию вращения во время разворота. Коэффициент k0, устанавливающий пропорцию между затратами управляющих усилий и интегралом энергии вращения, определяет, насколько пологим будет изменение модуля кинетического момента во время оптимального разворота. Если k0 → 0, то модуль кинетического момента изменяется по параболическому закону и достигает максимального значения в момент t = T/2. При неограниченном увеличении k0 оптимальный процесс приближается к импульсному управлению, при котором участки разгона и торможения, когда управляющий момент неограниченно большой, бесконечно малы, и почти на всем интервале разворота КА вращается практически по инерции (между импульсными разгоном и торможением управляющий момент пренебрежимо мал М ≈ 0).

Полученное решение отличается и от известной работы [12], где оптимально релейное управление с двумя точками переключения (для задачи разворота за фиксированное время), а в нашей задаче оптимальным является непрерывное управление. В оптимальном по критерию (1.5) решении отсутствуют участки с постоянным модулем управляющего момента. Кроме того, возможность разворота по способу [12] зависит от длительности маневра. Перечисленные выше отличия вызваны различием в форме минимизируемого функционала и отсутствием ограничений на управляющие переменные. Наконец, результаты [12] применимы исключительно к динамически симметричному твердому телу. Для решения [12] управление разворотом происходит с постоянным углом между кинетическим моментом и продольной осью КА.

Необходимо отметить, что метод разворота с минимальными затратами (1.5) может оказаться полезным для КА с системой ориентации на базе электрореактивных двигателей (ЭРД), поскольку при управлении с помощью ЭРД (и, в частности, ионными двигателями) первый интеграл в показателе (1.5) пропорционален потребляемой электроэнергии (тяга ЭРД прямо пропорциональна потребляемому электрическому току [30], с высокой степенью достоверности, а вращающий момент пропорционален плечу установки управляющего ЭРД). Учитывая необходимость всемерного снижения электропотребления ЭРД для управления КА, становится понятным выбор функционала; второе слагаемое в (1.5) ограничивает кинетическую энергию вращения, делая ее минимально возможной при заданном времени разворота, что также крайне желательно (в практике космических полетов). Заметим, что в настоящее время на многих зарубежных КА в качестве двигателей ориентации применяются ионные двигатели (в космической программе США для решения задач ориентации КА использовались ионные двигатели XIPS-25 разработки Boeing Space Systems). В последние годы в связи с ростом сроков активного существования КА (более 10 лет), а также применением высокоточных систем ориентации интерес к ЭРД значительно возрос [31] (неоспоримыми преимуществами ЭРД является возможность малой величины единичного импульса тяги, высокая точность дозирования импульсов, практическое отсутствие импульса последействия, что обеспечивает выполнение особо точной ориентации). Благодаря невообразимо высоким значениям удельного импульса (до 6000 с) массовое применение ЭРД на КА (в том числе для ориентации КА) – одна из ведущих и закономерных тенденций космической деятельности в мире.

Список литературы

  1. Бранец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М.: Наука, 1973. 320 с.

  2. Левский М.В. Об одном методе решения задач оптимального управления пространственной ориентацией космического аппарата // Проблемы нелинейного анализа в инженерных системах. 2015. Т. 21. № 2 (44). С. 45–60.

  3. Levskii M.V. About Method for Solving the Optimal Control Problems of Spacecraft Spatial Orientation // Problems of Nonlinear Analysis in Engineering Systems. 2015. V. 21. № 2. P. 61–75.

  4. Раушенбах Б.В., Токарь Е.Н. Управление ориентацией космических аппаратов. М.: Наука, 1974. 600 с. 320 с.

  5. Алексеев К.Б., Малявин А.А., Шадян А.В. Экстенсивное управление ориентацией космического аппарата на основе нечеткой логики // Полет. 2009. № 1. С. 47–53.

  6. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Синтез алгоритмов переориентации космического аппарата на основе концепции обратной задачи динамики // Изв. РАН. ТиСУ. 2003. № 5. С. 156–163.

  7. Ваньков А.И. Адаптивное робастное управление угловым движением КА с использованием прогнозирующих моделей // Космич. исслед. 1994. Т. 32. Вып. 4–5. С. 13–21.

  8. Решмин С.А. Пороговая абсолютная величина релейного управления при наискорейшем приведении спутника в гравитационно-устойчивое положение // ДАН. 2018. Т. 480. № 6. С. 671–675.

  9. Junkins J.L., Turner J.D. Optimal Spacecraft Rotational Maneuvers. Elsevier. USA, 1986. 515 p.

  10. Молоденков A.В., Сапунков Я.Г. Новый класс аналитических решений в задаче оптимального разворота сферически-симметричного твердого тела // Изв. РАН. МТТ. 2012. № 2. С. 16–27.

  11. Молоденков А.В., Сапунков Я.Г. Решение задачи оптимального разворота осесимметричного космического аппарата с ограниченным и импульсным управлением при произвольных граничных условиях // Изв. РАН. ТиСУ. 2007. № 2. С. 152–165.

  12. Бранец В.Н., Черток М.Б., Казначеев Ю.В. Оптимальный разворот твердого тела с одной осью симметрии // Космич. исслед. 1984. Т. 22. Вып. 3. С. 352–360.

  13. Shen H., Tsiotras P. Time-optimal Control of Axi-symmetric Rigid Spacecraft with two Controls // AIAA J. Guidance, Control and Dynamics. 1999. V. 22. № 5. P. 682–694.

  14. Молоденков A.В., Сапунков Я.Г. Аналитическое решение задачи оптимального по быстродействию разворота осесимметричного космического аппарата в классе конических движений // Изв. РАН. ТиСУ. 2018. № 2. С. 131–147.

  15. Zhou H., Wang D., Wu B., Poh E.K. Time-optimal Reorientation for Rigid Satellite with Reaction Wheels // International Journal of Control. 2012. V. 85. № 10. P. 1–12.

  16. Левский М.В. Применение принципа максимума Л.С. Понтрягина к задачам оптимального управления ориентацией космического аппарата // Изв. РАН. ТиСУ. 2008. № 6. С. 144–157.

  17. Решмин С.А. Пороговая абсолютная величина релейного управления при наискорейшем приведении спутника в желаемое угловое положение // Изв. РАН. ТиСУ. 2018. № 5. С. 30–41.

  18. Левский М.В. О повышении маневренности космического аппарата, управляемого инерционными исполнительными органами // Изв. РАН. ТиСУ. 2020. № 5. С. 115–130.

  19. Левский М.В. Синтез оптимального управления терминальной ориентацией космического аппарата с использованием метода кватернионов // Изв. РАН. МТТ. 2009. № 2. С. 7–24.

  20. Левский М.В. Использование интеграла энергии в оптимальном управлении пространственной ориентацией космического аппарата // Изв. РАН. МТТ. 2009. № 4. С. 10–23.

  21. Левский М.В. Об одном случае оптимального управления пространственной ориентацией космического аппарата // Изв. РАН. ТиСУ. 2012. № 4. С. 115–130.

  22. Левский М.В. Кинематически оптимальное управление переориентацией космического аппарата // Изв. РАН. ТиСУ. 2015. № 1. С. 119–136.

  23. Levskii M.V. Special Aspects in Attitude Control of a Spacecraft, Equipped with Inertial Actuators // Journal of Computer Science Applications and Information Technology. 2017. V. 2. № 4. P. 1–9.

  24. Зубов Н.Е., Ли М.В., Микрин Е.А., Рябченко В.Н. Терминальное построение орбитальной ориентации космического аппарата // Изв. РАН. ТиСУ. 2017. № 4. С. 154–173.

  25. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. M.: Наука, 1983. 392 с.

  26. Sanjeev Kumar, Vinay Kanwar, Sukhjit Singh. Modified Efficient Families of Two and Three-step Predictor-corrector Iterative Methods for Solving Nonlinear Equations // Journal of Applied Mathematics. 2010. V. 1. № 3. P. 153–158.

  27. Левский М.В. Способ управления разворотом космического аппарата и система для его реализации. Патент на изобретение РФ № 2114771 // Бюллетень “Изобретения. Заявки и патенты”. 1998, № 19. Опубликован 10.07.1998. С. 234–236.

  28. Левский М.В. Система управления пространственным разворотом космического аппарата. Патент на изобретение РФ № 2006431 // Бюллетень “Изобретения. Заявки и патенты”. 1994, № 2. Опубликован 20.01.1994. С. 49–50.

  29. Левский М.В. Устройство формирования параметров регулярной прецессии твердого тела. Патент на изобретение РФ № 2146638 // Бюллетень “Изобретения. Заявки и патенты”. 2000. № 8. Опубликован 20.03.2000. С. 148.

  30. Горшков О.А., Муравьев В.А., Шагайда А.А. Холловские и ионные плазменные двигатели для космических аппаратов. М.: Машиностроение, 2008. 280 с.

  31. Кульков В.М., Обухов В.А., Егоров Ю.Г., Белик А.А., Крайнов А.М. Сравнительная оценка эффективности применения перспективных типов электроракетных двигателей в составе малых космических аппаратов // Вестн. Самарск. гос. аэрокосмического ун-та. 2012. № 3 (34). С. 187–195.

Дополнительные материалы отсутствуют.