Известия РАН. Теория и системы управления, 2019, № 1, стр. 131-152

ОГРАНИЧЕННОЕ КВАДРАТИЧНО ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ РАЗВОРОТОМ КОСМИЧЕСКОГО АППАРАТА ЗА ФИКСИРОВАННОЕ ВРЕМЯ

М. В. Левский

Научно-исследовательский институт космических систем им. А.А. Максимова (филиал Государственного космического научно-производственного центра им. М.В. Хруничева)
Королев, Россия

Поступила в редакцию 18.05.2018
После доработки 27.07.2018

Полный текст (PDF)

Аннотация

Рассмотрена и решена динамическая задача разворота космического аппарата из произвольного начального в требуемое конечное угловое положение с ограниченным управлением. Время окончания маневра известно. Для оптимизации программы управления используется квадратичный критерий качества, минимизируемый функционал соответствует энергетическим затратам на разворот. Построение оптимального управления разворотом основано на кватернионных переменных и принципе максимума Л.С. Понтрягина. Показано, что во время оптимального разворота момент сил параллелен прямой, неподвижной в инерциальном пространстве, и при вращении космического аппарата направление кинетического момента постоянно относительно инерциальной системы координат. Получены формализованные уравнения и расчетные выражения для определения оптимальной программы разворота. Подробно исследован особый режим управления и сформулированы условия невозможности возникновения такого режима. Созданные алгоритмы управления позволяют совершать развороты за заданное время с минимальной кинетической энергией вращения. Для динамически симметричного космического аппарата поставленная задача управления решается до конца – получены зависимости как явные функции времени для управляющих переменных и соотношения для расчета ключевых параметров закона управления поворотным маневром. Приводятся численный пример и результаты математического моделирования движения космического аппарата при оптимальном управлении, демонстрирующие практическую реализуемость разработанного метода управления пространственной ориентацией космического аппарата.

Введение. В статье решается задача приведения космического аппарата (КА) в положение заданной ориентации оптимальным образом. Способ решения и формализация описания кинематики вращательного движения КА основаны на методе кватернионов [1]. Исследованию задачи оптимального управления разворотом твердого тела в различных постановках посвящено множество работ [119]. В частности, рассматривались вопросы оптимального разворота КА по быстродействию и минимуму энергетических затрат [2]; однако в [2] искомое решение строилось в рамках исключительно частного случая, когда КА вращается вокруг вектора конечного поворота (так называемое экстенсивное управление ориентацией). В [3] оптимальные управления находились методом совмещенного синтеза на основе алгоритма с прогнозирующей моделью, причем минимизировался функционал обобщенной работы. В известных публикациях [34] выбранная прогнозирующая модель такова, что полученное решение не является принципиально новым – реализующееся при синтезе управление приводит к тому, что КА поворачивается вокруг оси Эйлера, несмотря на отличия законов управления разворотом. В [5] также описывается построение управлений, стабилизирующих вращение КА вокруг мгновенной оси Эйлера. Заметим, что большинство существующих решений задачи пространственного разворота соответствуют вращению вокруг неподвижной оси [17], хотя принципы оптимизации и алгоритмы управления различны (в том числе с использованием прогнозирующих моделей [3, 4]). В то же время разворот в плоскости наименьшего угла разворота во многих практических случаях не является оптимальным, как бы точно он не исполнялся. Наиболее детально задача оптимального управления угловым движением КА решена лишь для двух частных случаев – плоских вращений КА вокруг одной из главных центральных осей инерции [8] и пространственного вращения сферически-симметричного тела [1, 6].

Вопросы создания эффективных режимов и алгоритмов управления ориентацией КА остаются актуальными и сегодня. Как отмечено многими авторами [9, 10], аналитическое решение задачи оптимального разворота в замкнутой форме, если бы оно было найдено, имело бы большой практический интерес, так как позволяет применять на борту КА готовые законы программного управления и изменения оптимальной траектории движения КА (для осесимметричного КА некоторые решения известны [1113]). Однако аналитическое решение задачи пространственного разворота для КА с произвольным распределением масс при произвольных граничных условиях по угловому положению КА не найдено; известны лишь некоторые особые случаи решения задачи разворота (например, [1, 10]). Поэтому в общем случае приходится рассчитывать только на приближенное численное решение задачи. Часто при проектировании практических (адекватных реальности) алгоритмов управления ориентацией КА за отправную точку берется завершенное решение кинематической задачи разворота. При попытке найти численные решения оптимизационных краевых задач для задач оптимального разворота КА некоторые авторы столкнулись с трудностями, связанными с неоднородностью оптимальной управляющей функции. Численное решение задачи оптимального разворота динамически-симметричного КА подробно рассмотрено в [12], где авторы решали краевую задачу принципа максимума путем замены переменных и сведением ее к краевой задаче разворота сферически-симметричного тела.

Принятый в статье показатель оптимальности характеризует энергетические затраты на переориентацию КА. В отличие от решения [17], где оптимизировано неограниченное управление, в данной работе управление ограничено, а минимизируемый функционал включает фазовые переменные (угловые скорости КА). Вопросы экономичности при управлении движением КА остаются до сих пор актуальными, поэтому решаемая в статье задача является практически важной. Нахождению и исследованию оптимальной программы управления ориентацией при развороте КА из одного пространственного положения в другое посвящена представленная работа. Найденное решение позволяет разворачивать КА за заданное время с минимальной кинетической энергией вращения при наличии ограничения на управляющий момент, что крайне важно для практики космических полетов.

1. Уравнения углового движения и постановка задачи управления. Динамика углового движения КА как твердого тела описывается динамическими уравнениями Эйлера [8]:

(1.1)
${{J}_{1}}{{\dot {\omega }}_{1}} + \left( {{{J}_{3}} - {{J}_{2}}} \right){{\omega }_{2}}{{\omega }_{3}} = {{M}_{1}},\quad {{J}_{2}}{{\dot {\omega }}_{2}} + \left( {{{J}_{1}} - {{J}_{3}}} \right){{\omega }_{1}}{{\omega }_{3}} = {{M}_{2}},\quad {{J}_{3}}{{\dot {\omega }}_{3}} + \left( {{{J}_{2}} - {{J}_{1}}} \right){{\omega }_{1}}{{\omega }_{2}} = {{M}_{3}},$
где Ji,i = $\overline {1,\;3} $, – главные центральные моменты инерции аппарата, Мi – проекции главного момента М сил на главные центральные оси эллипсоида инерции аппарата, ωi – проекции вектора ω абсолютной угловой скорости КА на оси связанного базиса E, образованного главными центральными осями эллипсоида инерции аппарата.

Для описания пространственного движения КА воспользуемся математическим аппаратом кватернионов (параметров Родрига–Гамильтона). Движение связанного базиса Е относительно опорного базиса I будем задавать кватернионом Λ [1]. Для определенности базис I считается инерциальным. В этом случае справедливы следующие кинематические уравнения:

(1.2)
$\begin{gathered} 2{{{\dot {\lambda }}}_{0}} = - {{\lambda }_{1}}{{\omega }_{1}} - {{\lambda }_{2}}{{\omega }_{2}} - {{\lambda }_{3}}{{\omega }_{3}},\quad 2{{{\dot {\lambda }}}_{1}} = {{\lambda }_{0}}{{\omega }_{1}} + {{\lambda }_{2}}{{\omega }_{3}} - {{\lambda }_{3}}{{\omega }_{2}}, \\ 2{{{\dot {\lambda }}}_{2}} = {{\lambda }_{0}}{{\omega }_{2}} + {{\lambda }_{3}}{{\omega }_{1}} - {{\lambda }_{1}}{{\omega }_{3}},\quad 2{{{\dot {\lambda }}}_{3}} = {{\lambda }_{0}}{{\omega }_{3}} + {{\lambda }_{1}}{{\omega }_{2}} - {{\lambda }_{2}}{{\omega }_{1}} \\ \end{gathered} $
или в кватернионной форме:
$2\dot {\Lambda } = \Lambda \circ \omega ,$
где λj, j = $\overline {0,\;3} $, – компоненты кватерниона Λ (sqal Λ = λ0 – скалярная часть кватерниона Λ; vect Λ = = λ1e1 + λ2e2 + λ3e3 – векторная часть кватерниона Λ; e1,e2,e3 – орты осей связанного базиса E), причем $\left\| \Lambda \right\| = \lambda _{0}^{2} + \lambda _{1}^{2} + \lambda _{2}^{2} + \lambda _{3}^{2}$ = 1; символ “$ \circ $” – знак умножения кватернионов [1, с. 11–20]. Здесь и далее операция кватернионного умножения на вектор понимается как умножение на кватернион с нулевой скалярной частью; в частности $\Lambda \circ {\mathbf{\omega }} = \Lambda \circ \Omega $, где Ω – кватернион, у которого sqalΩ = 0, vectΩ = ω. Кватернион Λ, задающий текущую ориентацию КА, принят нормированным [1] для удобства ($\left\| \Lambda \right\| = 1$).

Управление движением КА относительно центра масс осуществляется путем изменения момента сил М. В условиях космического полета особенность управления заключается в малости возмущающих моментов, обусловленных взаимодействием КА с внешними полями и сопротивлением среды. Допустим, что суммарный импульс от возмущающих моментов пренебрежимо мал по сравнению с управляющим импульсом. В этом случае момент сил М определяется главным образом моментом управления, создаваемым системой исполнительных органов, а переменные Мi, стоящие в правых частях системы (1.1), есть управления. Далее предположим, что область допустимых значений вектора М описывается неравенством [13]

(1.3)
$\frac{{M_{1}^{2}}}{{{{J}_{1}}}} + \frac{{M_{2}^{2}}}{{{{J}_{2}}}} + \frac{{M_{3}^{2}}}{{{{J}_{3}}}} \leqslant u_{0}^{2},$
где u0 > 0 – некоторая положительная величина, характеризующая мощность исполнительных органов КА. Практическое значение имеют задачи, в которых начальная и конечная скорости равны нулю (относительно опорного базиса). Далее считаем, что разворот выполняется из состояния покоя в состояние покоя; поэтому угловые скорости в начальный и конечный моменты времени равны нулю ω(0) = ω(T) = 0 (так как опорный базис I не вращается, он фиксированный). Граничные условия задачи разворота запишем в виде равенств:
(1.4)
$\Lambda (0) = {{\Lambda }_{{\text{н }}}},\quad \omega (0) = 0,$
(1.5)
$\Lambda (Т ) = {{\Lambda }_{{\text{к }}}},\quad \quad\omega (T) = 0,$
где Т – время окончания поворотного маневра. Кватернионы Λн и Λк, задающие ориентацию связанных с КА осей в начальный и конечный моменты времени, имеют произвольные наперед заданные значения, удовлетворяющие условию $\left\| {{{\Lambda }_{{\text{н }}}}} \right\| = \left\| {{{\Lambda }_{{\text{к }}}}} \right\| = 1$ (полагаем, что Λк ≠ ±Λн).

Эффективность управления будем оценивать интегральной величиной

(1.6)
$G = \int\limits_0^T {({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2})dt} .$

Задача оптимального управления пространственным разворотом КА формулируется следующим образом: КА необходимо перевести из состояния (1.4) в состояние (1.5) в соответствии с уравнениями (1.1), (1.2) и ограничением (1.3) с минимальным значением функционала (1.6). Время Т окончания маневра переориентации КА фиксировано. Решение М(t) ищется в классе кусочно-непрерывных функций.

Принятый критерий оптимальности позволяет определить режим вращения КА, при котором разворот КА из исходного своего положения Λн в заданное конечное угловое положение Λк происходит с минимальными интегральными затратами энергии, и найти соответствующую программу управления. Сформулированная задача управления КА отличается от рассматриваемых ранее задач видом функционала (1.6) при наличии ограничений на управляющий момент. Поскольку время управления Т задано, разворот КА из состояния (1.4) в состояние (1.5) может оказаться не осуществим (для некоторых сочетаний значений Λн, Λк, J1, J2, J3, и0 и Т решение М(t) задачи (1.1)–(1.6) отсутствует).

Оптимальное управление пространственной переориентацией КА в соответствии с критерием (1.6) обладает важными полезными свойствами (подробности описаны в Приложении). В частности, для оптимального по критерию (1.6) управления, ограниченного условием (1.3), имеем максимально широкий диапазон допустимых значений длительности разворота T.

2. Решение задачи оптимального управления разворотом. В задаче (1.1)–(1.6) управляющими переменными являются моменты Мi, $i = \overline {1,\;3} $. Будем решать поставленную задачу, используя принцип максимума Л.С. Понтрягина [20]. Ограничение на фазовые переменные λj несущественно, так как оно выполняется при любых движениях КА вокруг центра масс; $\lambda _{0}^{2} + \lambda _{1}^{2} + \lambda _{2}^{2} + \lambda _{3}^{2} = {\text{const}}$ в силу уравнений (1.2); мы полагали $\left\| {\Lambda (0)} \right\| = \left\| {{{\Lambda }_{{\text{н }}}}} \right\| = 1$, и поэтому $\left\| {\Lambda {\text{(}}t{\text{)}}} \right\| = 1$ в любой момент времени t ∈[0, T]. Пусть φi – сопряженные переменные, соответствующие переменным ${{\omega }_{i}}$, i = $\overline {1,3} $. Так как критерий оптимальности не включает позиционных координат λ j, можно использовать универсальные переменные ri, i = $\overline {1,3} $ [14], заменяющие сопряженные переменные ψ j, которые соответствуют компонентам λj кватерниона Λ, $j = \overline {0,\;3} $.

2.1. Функция Гамильтона и сопряженная система уравнений. Для задачи управления (1.1)–(1.6) функция Гамильтона Н равна [14]

$\begin{gathered} H = - ({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}) + {{\varphi }_{1}}({{М }_{1}} + ({{J}_{2}}--{{J}_{3}}){{\omega }_{2}}{{\omega }_{3}}{\text{)/}}{{J}_{1}} + {{\varphi }_{2}}({{М }_{2}} + ({{J}_{3}}--{{J}_{1}}{\text{)}}{{\omega }_{1}}{{\omega }_{3}}){\text{/}}{{J}_{2}} + \\ \, + {{\varphi }_{3}}({{М }_{3}} + {\text{ }}({{J}_{1}}--{{J}_{2}}){{\omega }_{1}}{{\omega }_{2}}){\text{/}}{{J}_{3}} + {{\omega }_{1}}{{r}_{1}} + {{\omega }_{2}}{{r}_{2}} + {{\omega }_{3}}{{r}_{3}}, \\ \end{gathered} $
где

$\begin{gathered} {{r}_{1}} = ({{\lambda }_{0}}{{\psi }_{1}} + {{\lambda }_{3}}{{\psi }_{2}} - {{\lambda }_{1}}{{\psi }_{0}} - {{\lambda }_{2}}{{\psi }_{3}}){\text{/}}2;\quad {{r}_{2}} = ({{\lambda }_{0}}{{\psi }_{2}} + {{\lambda }_{1}}{{\psi }_{3}} - {{\lambda }_{2}}{{\psi }_{0}} - {{\lambda }_{3}}{{\psi }_{1}}){\text{/}}2; \\ {{r}_{3}} = ({{\lambda }_{0}}{{\psi }_{3}} + {{\lambda }_{2}}{{\psi }_{1}} - {{\lambda }_{3}}{{\psi }_{0}} - {{\lambda }_{1}}{{\psi }_{2}}){\text{/}}2. \\ \end{gathered} $

Оптимальные функции ri, как компоненты вектора r, удовлетворяют уравнениям [14]

(2.1)
${{\dot {r}}_{1}} = {{\omega }_{3}}{{r}_{2}} - {{\omega }_{2}}{{r}_{3}},\quad {{\dot {r}}_{2}} = {{\omega }_{1}}{{r}_{3}} - {{\omega }_{3}}{{r}_{1}},\quad {{\dot {r}}_{3}} = {{\omega }_{2}}{{r}_{1}} - {{\omega }_{1}}{{r}_{2}}$
или в векторной форме:
${\mathbf{\dot {r}}} = - {\mathbf{\omega }} \times {\mathbf{r}},$
где символ × обозначает операцию векторного произведения векторов.

Уравнения для сопряженных функций φi имеют вид [20]

${{\dot {\varphi }}_{i}} = - \frac{{\partial H}}{{\partial {{\omega }_{i}}}},\quad i = \overline {1,3} ,$
или в развернутой форме:
(2.2)
$\begin{gathered} {{{\dot {\varphi }}}_{1}} = 2{{J}_{1}}{{\omega }_{1}} - {{\omega }_{3}}{{n}_{2}}{{\varphi }_{2}} - {{\omega }_{2}}{{n}_{3}}{{\varphi }_{3}} - {{r}_{1}}, \\ {{{\dot {\varphi }}}_{2}} = 2{{J}_{2}}{{\omega }_{2}} - {{\omega }_{3}}{{n}_{1}}{{\varphi }_{1}} - {{\omega }_{1}}{{n}_{3}}{{\varphi }_{3}} - {{r}_{2}}, \\ {{{\dot {\varphi }}}_{3}} = 2{{J}_{3}}{{\omega }_{3}} - {{\omega }_{2}}{{n}_{1}}{{\varphi }_{1}} - {{\omega }_{1}}{{n}_{2}}{{\varphi }_{2}} - {{r}_{3}}, \\ \end{gathered} $
где n1 = (J2– J3)/J1, n2 = (J3– J1)/J2, n3 = (J1– J2)/J3 есть постоянные коэффициенты.

Функция Гамильтона Н составлена без учета ограничения $\left\| \Lambda \right\| = 1$ для фазовых переменных в силу равенства $\left\| {\Lambda (0)} \right\| = 1$, о чем договорились выше. Вектор r неподвижен относительно инерциального базиса I и $\left| {\mathbf{r}} \right|$ = const ≠ 0 (постоянство модуля $\left| {\mathbf{r}} \right|$ следует из свойств уравнений (2.1)). Решение r(t) системы (2.1) определяется начальным Λн и конечным Λк положениями КА. Оптимальная функция r(t) вычисляется через кватернион Λ(t) [1, 14]:

${\mathbf{r}} = \tilde {\Lambda } \circ {{{\mathbf{c}}}_{E}} \circ \Lambda ,\quad {\text{г д е }}\quad {{{\mathbf{c}}}_{E}} = {\text{const}} = {{\Lambda }_{{\text{н }}}} \circ {\mathbf{r}}(0) \circ {{\tilde {\Lambda }}_{{\text{н }}}}$
(составляющие вектора cE – проекции вектора r на оси инерциального базиса I); $\tilde {\Lambda }$– кватернион, сопряженный кватерниону Λ [1, с. 11–20]. Считается, что r(0) ≠ 0 (в противном случае r1 = r2 = = r3 ≡ 0 и дальнейшее решение задачи теряет смысл). Направление вектора cE зависит от начального и конечного положений КА. Для того, чтобы КА имел требуемую ориентацию на правом конце Λ(T) = Λк, необходимо определить вектор cE (или значение вектора r в начальный момент времени) исходя из получающихся при этом решений системы (1.2).

Оптимальные сопряженные переменные должны удовлетворять условиям трансверсальности. Так как решаемая задача управления движением КА – это задача оптимального управления с закрепленными левым и правым концами траектории и фиксированным временем окончания маневра, то условия трансверсальности выполняются автоматически. Поясним сказанное. Если r(0) ≠ 0, то хотя бы одно из значений ψj (0) ≠ 0. Аналогично если r(T) ≠ 0, то хотя бы одно из значений ψj(Т) ≠ 0. Условия трансверсальности можно записать как $\left| {{\mathbf{r}}(0)} \right| + \left| {\varphi (0)} \right| \ne 0$ и $\left| {{\mathbf{r}}(T)} \right| + \left| {\varphi (T)} \right| \ne 0$, где φ = {φ1, φ2, φ3} – вектор сопряженных переменных φi. Поскольку r(0) ≠ 0 (и как следствие r(T) ≠ 0), то приходим к выводу о том, что условия трансверсальности для оптимальных функций φ i(t), ri(t) (а значит, и ψj(t)) будут выполнены. Система уравнений (2.1), (2.2) совместно с требованием максимальности гамильтониана H и условием r(0) ≠ 0 являются необходимыми условиями оптимальности.

2.2. Максимизация гамильтониана. Определим условия максимальности гамильтониана. Функция Гамильтона Н равна

$H = {{{{M}_{1}}{{\varphi }_{1}}} \mathord{\left/ {\vphantom {{{{M}_{1}}{{\varphi }_{1}}} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}}} \right. \kern-0em} {{{J}_{1}} + {{{{M}_{2}}{{\varphi }_{2}}} \mathord{\left/ {\vphantom {{{{M}_{2}}{{\varphi }_{2}}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{{{M}_{3}}{{\varphi }_{3}}} \mathord{\left/ {\vphantom {{{{M}_{3}}{{\varphi }_{3}}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} + {{H}_{{{\text{inv}}}}}}},$
где Hinv не зависит явно от управляющих функций Mi, $i = \overline {1,3} $. Введем вспомогательные переменные

${{{{g}_{i}} = {{\varphi }_{i}}} \mathord{\left/ {\vphantom {{{{g}_{i}} = {{\varphi }_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }},\quad {{{{u}_{i}} = {{M}_{i}}} \mathord{\left/ {\vphantom {{{{u}_{i}} = {{M}_{i}}} {\sqrt {{{J}_{i}}} }}} \right. \kern-0em} {\sqrt {{{J}_{i}}} }}.$

После замены переменных гамильтониан H принимает вид $H = {{g}_{1}}{{u}_{1}} + {{g}_{2}}{{u}_{2}} + {{g}_{3}}{{u}_{3}} + {{H}_{{{\text{inv}}}}}$, а ограничение (1.3) запишется так: $u_{1}^{2} + u_{2}^{2} + u_{3}^{2} \leqslant u_{0}^{2}$. Гамильтониан максимален, когда

${{{{u}_{i}} = {{u}_{0}}{{g}_{i}}} \mathord{\left/ {\vphantom {{{{u}_{i}} = {{u}_{0}}{{g}_{i}}} {\sqrt {g_{1}^{2} + g_{2}^{2} + g_{3}^{2}} }}} \right. \kern-0em} {\sqrt {g_{1}^{2} + g_{2}^{2} + g_{3}^{2}} }}$.

Нетрудно видеть, что в случае φ ≠ 0 максимум функции Н для управлений Мi(t) при ограничении (1.3) достигается, если

(2.3)
${{M}_{i}} = \frac{{{{u}_{0}}{{\varphi }_{i}}}}{{\sqrt {{{\varphi _{1}^{2}} \mathord{\left/ {\vphantom {{\varphi _{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{\varphi _{2}^{2}} \mathord{\left/ {\vphantom {{\varphi _{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{\varphi _{3}^{2}} \mathord{\left/ {\vphantom {{\varphi _{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }},\quad i = \overline {1,3} $
(случай φ = 0, при котором гамильтониан не зависит явным образом от управления М, требует отдельного рассмотрения). Ниже покажем, что М = 0, если $\dot {\varphi } = 0$φ = 0). Оптимальное решение определяется замкнутой системой уравнений (1.1), (1.2), (2.1)–(2.3) с учетом требований (1.4), (1.5). Найдем характерные свойства оптимального движения для задачи (1.1)–(1.6).

Решение системы уравнений (1.1), (2.1)–(2.3) существует и оно единственное (при условии ω(0) = ω(Т) = 0). Сопряженные переменные φi подчиняются уравнениям

(2.4)
${{\varphi }_{i}} = a(t){{r}_{i}},\quad i = \overline {1,3} ,$
где а(t) – скалярная функция времени. Значение r(0) таково, чтобы в результате интегрирования уравнений (1.1), (1.2), (2.1)–(2.3) с начальными условиями Λ(0) = Λн для траектории движения Λ(t) выполнялось равенство Λ(Т) = Λк. Для движения ω(t) как решения системы (1.1), (2.1)–(2.3) с учетом (2.4) выполняются равенства
(2.5)
${{\omega }_{i}} = b{{r}_{i}}{\text{/}}{{J}_{i}},\quad i = \overline {1,3} ,$
показывающие связь между векторами ω и r, где b – коэффициент пропорциональности, зависящий от времени (то, что равенства (2.5) удовлетворяют уравнениям (2.1), легко проверить, подставив (2.5) в уравнения движения (1.1) с учетом соотношений (2.3), (2.4)).

2.3. Анализ начальных значений сопряженных переменных. Изучим свойства функций а(t), b(t). Представим систему (2.2) в виде

(2.6)
$\dot {\varphi } = 2{{J}_{{{\text{К А }}}}}\omega + ({{J}_{{{\text{К А }}}}}\omega ) \times (J_{{{\text{К А }}}}^{{ - 1}}\varphi ) - {{J}_{{{\text{К А }}}}}(\omega \times (J_{{{\text{К А }}}}^{{ - 1}}\varphi )) - {\mathbf{r}},$
где JКА = diag{J1, J2, J3} – тензор инерции КА. После подстановки решения (2.4), (2.5) в систему (2.2) с учетом уравнений (2.1) для производных ${{\dot {r}}_{i}}$ получим тождества, если $\dot {a}$r = (2b – 1)r. Следовательно, оптимальные функции а(t) и b(t) удовлетворяют условию $\dot {a}$= 2b – 1 (так как $\left| {\mathbf{r}} \right| \ne 0$), из которого вытекают две особенности: $\dot {a}$(0) = $\dot {a}$(T) = –1 и b(0) = b(T) = 0 (из-за требования ω(0) = = ω(T) = 0). Из (1.1), (2.5) $\dot {b}$ = Mr/|r|2 (знак умножения “⋅” означает скалярное произведение векторов). Если выполняются соотношения (2.5), то

${{r_{1}^{2}} \mathord{\left/ {\vphantom {{r_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{r_{2}^{2}} \mathord{\left/ {\vphantom {{r_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{r_{3}^{2}} \mathord{\left/ {\vphantom {{r_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} = {\text{const}}{\text{.}}$

Чтобы убедиться в этом, продифференцируем по времени левую часть указанного равенства с учетом уравнений (2.1) для ri и зависимостей (2.5) для компонент вектора ω:

$\begin{gathered} {{r}_{1}}{{{\dot {r}}}_{1}}{\text{/}}{{J}_{1}} + {{r}_{2}}{{{\dot {r}}}_{2}}{\text{/}}{{J}_{2}} + {{r}_{3}}{{{\dot {r}}}_{3}}{\text{/}}{{J}_{3}} = \\ = {{\omega }_{1}}{{r}_{2}}{{r}_{3}}{\text{/}}{{J}_{3}} - {{\omega }_{1}}{{r}_{2}}{{r}_{3}}{\text{/}}{{J}_{2}} + {{\omega }_{1}}{{r}_{2}}{{r}_{3}}{\text{/}}{{J}_{2}} - {{\omega }_{2}}{{r}_{1}}{{r}_{3}}{\text{/}}{{J}_{3}} + {{\omega }_{2}}{{r}_{1}}{{r}_{3}}{\text{/}}{{J}_{3}} - {{\omega }_{1}}{{r}_{2}}{{r}_{3}}{\text{/}}{{J}_{3}} \equiv 0. \\ \end{gathered} $

Следовательно, когда φ ≠ 0, справедливо утверждение |M| = const ≠ 0, а значит, и $\dot {b}$ = const.

Определим, каким может быть в начальный момент времени значение φ(0) для оптимальной функции φ(t). Если предположить, что φ(0) = 0, то φ = –rt при t → 0 (из (2.2) ${{\dot {\varphi }}_{i}}$= –ri в момент t = 0). Тогда в начале разворота Mr < 0 и М = –μr, где μ > 0 (для убеждения в этом достаточно взять предел правых частей формул (2.3) для t → 0). Следовательно, Jiωi = –μtri при t → 0. Видно, что полученные соотношения совпадают с (2.4), (2.5), в которых а (0) = 0 и b ≤ 0. Таким образом, для варианта φ(0) = 0 должно быть а(0) = 0 и $\dot {a}$ < 0 при любом t, а значит, а(t) < 0 при t > 0. Но при таком сценарии точка переключения отсутствует (так как b ≤ 0 и $\dot {a}$ < 0), момент М действует в одном направлении, раскручивая КА до ω → ∞. Очевидно, такой вариант управления не может быть оптимальным, поскольку не обеспечивает выполнение краевого условия ω(T) = 0. Отсюда вывод: только φ(0) ≠ 0 является оптимальным.

2.4. Обоснование единственности оптимального решения. Введем орт q для вектора φ, такой, что q(0) ⋅ φ(0) > 0, и поэтому φ = χq, где χ – скалярная функция c начальным значением χ (0) > 0 (|q| = 1). Тогда оптимальный момент М будет равен

${\mathbf{M}} = \frac{{{{u}_{0}}{\text{sign}}\chi }}{{\sqrt {{{q_{1}^{2}} \mathord{\left/ {\vphantom {{q_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{q_{2}^{2}} \mathord{\left/ {\vphantom {{q_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{q_{3}^{2}} \mathord{\left/ {\vphantom {{q_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}{\mathbf{q}}.$

Так как χ (0) > 0, то в окрестности точки t = 0 имеем М = hq и М $||$ L, L = Kq, где L = JКАω – кинетический момент КА; h > 0 – скалярная величина. Подставим формулы (2.3) с учетом зависимости φ = χ(t)q в уравнения (1.1) при наличии равенств Jiωi = Kqi:

(2.7)
$\dot {K}{\mathbf{q}} + K{\mathbf{\dot {q}}} + {\mathbf{\omega }} \times {\mathbf{q}}K = h{\mathbf{q}}.$

Сумма $K{\mathbf{\dot {q}}} + {\mathbf{\omega }} \times {\mathbf{q}}K$ ортогональна орту q или равна нулю (всегда ${\mathbf{q}} \cdot {\mathbf{\dot {q}}}$ = 0, так как |q| = 1). Поэтому уравнение (2.7) выполняется в единственном случае, если $\dot {K} = h$ и ${\mathbf{\dot {q}}} = - {\mathbf{\omega }} \times {\mathbf{q}}$ (т.е. когда направление вектора q остается неизменным относительно инерциальной системы координат). Теперь подставим зависимости φi = χqi и ωi = Kqi/Ji в уравнения (2.2). Левая часть уравнения (2.6) для вектора сопряженных переменных равна

$\dot {\chi }{\mathbf{q}} + \chi {\mathbf{\dot {q}}} = \dot {\chi }{\mathbf{q}} - \chi {\mathbf{\omega }} \times {\mathbf{q}}$
(уравнения (1.1), (2.2) должны выполняться одновременно, поэтому свойство ${\mathbf{\dot {q}}} = - {\mathbf{\omega }} \times {\mathbf{q}}$ взято из (2.7)). Правая часть уравнения (2.6) будет такой:

$\begin{gathered} K{\mathbf{q}} \times (J_{{{\text{К А }}}}^{{ - 1}}\chi {\mathbf{q}}) - \chi {{J}_{{{\text{К А }}}}}((J_{{{\text{К А }}}}^{{ - 1}}K{\mathbf{q}}) \times (J_{{{\text{К А }}}}^{{ - 1}}{\mathbf{q}})) + 2K{\mathbf{q}} - {\mathbf{r}} = 2K{\mathbf{q}} - \chi (KJ_{{{\text{К А }}}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}} - {\mathbf{r}} = \\ = 2K{\mathbf{q}} - \chi \omega \times {\mathbf{q}} - {\mathbf{r}}. \\ \end{gathered} $

Приравнивая левую и правую части уравнения (2.6), получим уравнение для вектора q:

$\dot {\chi }{\mathbf{q}} - \chi \omega \times {\mathbf{q}} = 2K{\mathbf{q}} - \chi \omega \times {\mathbf{q}} - {\mathbf{r}}.$

Отсюда следует необходимое условие оптимальности r = (2K$\dot {\chi }$)q, из которого неизбежны равенства (2.4), в которых а (0) > 0, $\dot {a}$(0) = –1, причем 2K$\dot {\chi }$ = const и q = r/|r|, откуда получаем следующие свойства: $\dot {\chi }$= 2Kr0, χ (t) = r0а(t), K = r0b(t), где r0 = const = |r(0)|. В моменты времени t = 0 и t = Т величина K = 0, из чего заключаем, что $\dot {\chi }$(0) = –r0 и $\dot {\chi }$(Т) = –r0.

В случае φ(0) ≠ 0 вариант а(0) < 0 не рассматривается, так как в каждый момент времени $\dot {a}$ < 0, и тогда а (t) < 0 при любом t; а значит, точка переключения отсутствует и |M(t)| > 0, ML > 0, из-за чего требование ω(T) = 0 будет нарушено. Таким образом, для оптимальных функций φi необходимо, чтобы φi(0) ≠ 0 и направление векторов φ(0) и r(0) было одинаковое.

Аналогичные рассуждения в отношении решения системы (2.2) и оптимальной функции φ(t), начиная с момента t = T в сторону уменьшения времени t, дают функцию а(t) для t > Т/2 и показывают справедливость решения (2.4), (2.5) для всего интервала управления 0 ≤ tT. Доказано, что при φ(0) ≠ 0 единственным решением системы уравнений (1.1), (2.1)–(2.3) являются функции, удовлетворяющие равенствам: φi = χ(t)qi, ri = r0qi, ωi = K qi/Ji, $\dot {\chi }$ = 2Kr0.

В итоге пришли к выводу – если в какой-либо момент времени t кинетический момент L и вектор φ параллельны, то φ × L = 0 на всем интервале управления 0 < t < T. А из-за наличия граничных условий ω(0) = 0 и ω(T) = 0 векторы φ и L параллельны как минимум 2 раза – в самом начале разворота (L = σtφ при t → 0) и в самом конце маневра (L = –σ (Тt)φ при tT), где σ – скалярная величина. Поэтому заключаем, что при оптимальном движении на всем отрезке времени t ∈ [0, T] имеет место свойство L $||$ φ. Отсюда становятся очевидны соотношения (2.4), (2.5). Поскольку φ(0) ≠ 0, то зависимости (2.4), (2.5) есть единственное решение системы уравнений (1.1), (2.1)–(2.3) с граничными условиями ω(0) = 0, ω(T) = 0.

Система уравнений (2.1)–(2.3) формализует необходимые условия оптимальности для исходной задачи оптимального управления (1.1)–(1.6). Задача построения оптимальной программы управления свелась к решению системы уравнений углового движения КА (1.1), (1.2), сопряженных уравнений (2.2) и уравнений (2.1) при условии, что управляющие функции Mi вычисляются в соответствии с (2.3). Сформулированная задача управления (1.1)–(1.6) решается до формализованной системы уравнений, определяющих оптимальное движение; эта система позволяет обнаружить закономерности оптимального движения в явном виде.

2.5. Основные свойства масштабирующих функций. Из краевых условий задачи управления (разворот КА из положения покоя в положение покоя) и необходимых условий оптимальности следуют такие соотношения: φ(0) ≠ 0; $\dot {a}$(0) = –1 и $\dot {a}$(T) = –1; а(0) > 0. Возможное поведение функции а(t) (в том числе в зависимости от значения |φ(0)|) приведено на рис. 1. Пунктирными линиями обозначены гипотетические варианты поведения функции a(t), которые однозначно не могут быть оптимальными, так как они не приемлемы с точки зрения удовлетворения краевому условию ω(T) = 0 и равенству $\dot {a}$(T) = –1 (кривая 1 соответствует случаю φ(0) = 0). Сплошные линии соответствуют двум типам оптимального управления – релейному управлению с одной точкой переключения в момент t = Т/2 (тонкие линии 2 и 3) и управлению с участком особого режима управления, соответствующего вращению КА по инерции, когда М = 0 (жирная линия 4, где t1, t2 – времена начала и окончания интервала с φ = 0 и $\dot {\varphi }$ = 0). Так как а(0) > 0, то а(Т) < 0 (в противном случае sign(Mr) = const, sign(ML) = const и условие ω(T) = 0 не сможет выполниться никогда). Для кривой 2 в момент времени t = Т/2 производная $\dot {\varphi }$(T/2) ≠ 0 ; для кривой 3 в момент времени t = Т/2 производная $\dot {\varphi }$(T/2) = 0. Функция a(t), соответствующая линии 3, – частный случай оптимального управления, у которого t1 = t2.

Рис. 1

При нулевых граничных угловых скоростях ω(0) = ω(T) = 0 решение системы (1.1), (2.1)–(2.3) описывает движение, при котором кинетический момент КА L имеет постоянное направление в инерциальной системе координат. Чтобы удовлетворить системе (1.1), (2.1), (2.2) при условии φ × М = 0, у функций φi, ri и ωi должно быть: φ(0) ≠ 0, φ × JКАω = 0, φ × r = 0 для любого t и φ1(0)r1(0) + φ2(0)r2(0) + φ3(0)r3(0) > 0 (это компактная форма записи равенств φi = χ(t)qi и ri = r0qi, в которых χ (0) > 0 и r0 > 0). Только при таких условиях функции φi, ri и ωi смогут стать оптимальными. Отсюда неизбежно следуют закономерности (2.4), (2.5), описывающие оптимальное движение, в которых а (0) > 0 и 0 ≤ b ≤ 0.5. При этом если $\dot {\varphi }$ = 0, то φ = 0.

Векторы М и φ имеют одинаковое направление; b(t) – непрерывная функция времени (как и r(t)); производная $\dot {a}$ существует в каждый момент времени t ∈[0, T], значит, а(t) – гладкая функция времени. При любом типе оптимального управления φ(T/2) = 0. Если а(t) ≠ 0, то

(2.8)
$\dot {b} = \frac{{{{m}_{0}}}}{{{{r}_{0}}}}{\text{sign}}a(t);$
если $\dot {a}$(t) = 0, то $\dot {b}$ = 0, где m0 = u0/С, $C = \sqrt {{{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} $, рi0 = ri(0)/|r(0)|.

Обозначим

$F = \int\limits_0^T {\left| {{\mathbf{L}}(t)} \right|dt} .$

Очевидно, независимо от варианта оптимального управления Fm02/4. Если 4F < m02, то оптимальным является управление с двумя точками переключения t1 и t2 (t1t2). Если 4F = m02, то реализуется предельный случай – управление с одной точкой переключения t = Т/2, при котором М ≠ 0 в течение всего разворота (|M| = m0). Интерес представляет наиболее общий случай оптимального разворота КА, когда имеет место особый режим управления на некотором конечном отрезке времени t1tt2. Так как на отрезке времени [t1, t2] будет φ(t) = 0, то определить оптимальный управляющий момент М из условия максимальности гамильтониана Н невозможно (поскольку Н не зависит явным образом от управления М). Однако мы можем найти оптимальные управляющие функции Мi из решения уравнений движения (1.1) с учетом системы (2.2) и равенств φ(t) = 0, $\dot {\varphi }$(t) = 0. После подстановки значений φi = 0 и ${{\dot {\varphi }}_{i}}$ = 0 в уравнения (2.2) получим равенства 2Jiωi = ri для всех $i = \overline {1,\;3} $. Выразив из них угловые скорости ωi и подставив их в систему (1.1) с учетом зависимостей (2.1) для производных ${{\dot {r}}_{i}}$, получим Мi = 0, а значит, на отрезке времени [t1, t2] оптимальным управлением является М = 0. Таким образом, на всем интервале управления [0, T] оптимальный момент М определяется однозначно – по формулам (2.3), если φ ≠ 0; а если $\dot {\varphi }$ = 0, то М = 0. На оптимальных движениях вектор L кинетического момента имеет то же направление, что и вектор r, который неподвижен относительно инерциального базиса I. Краевая задача принципа максимума заключается в определении значения вектора r (0), при котором решение системы дифференциальных уравнений (1.1), (1.2), (2.1), (2.2) с одновременным выполнением условия (2.3), если φ ≠ 0, или М = 0, если $\dot {\varphi }$ = 0, удовлетворяло условиям разворота (1.4), (1.5). Зависимости (2.4), (2.5) есть единственное решение задачи оптимального управления (1.1)–(1.6).

2.6. Типы оптимального управления. В общем случае оптимальным решением по критерию (1.6) в условиях ограничения (1.3) является релейное управление с двумя точками переключения t = t1 и t = t2, которые удовлетворяют соотношениям: 0 < t1Т/2, Т/2 ≤ t2 < Т и t1 + + t2 = Т. На участках разгона [0, t1] и торможения [t2, T] модуль момента М максимально возможный: |M| = const = m0. Между разгоном и торможением (в интервале времени [t1, t2]) момент М = 0. При нулевых начальной и конечной угловых скоростях времена разгона и торможения равны τ = t1 = Тt2. Длительность вращения по инерции (свободного движения) составляет tсв = Т – 2τ. Предельным является случай, когда tсв = 0 и t1 = t2 = τ = Т/2 (управление с одной точкой переключения, когда на всем интервале времени [0, Т] момент М максимален и |M| = const = m0). Другим предельным случаем является разворот при неограниченном управлении (когда u0 → ∞); тогда время переходных участков (разгона и торможения) бесконечно мало: τ → 0.

Для любого варианта оптимального управления (с одной или с двумя точками переключения) b – безразмерная величина, не превышающая 0.5, а константа r0 имеет размерность кинетического момента. Очевидно, что в момент времени t = Т/2 функция b (t) равна максимальному значению. Для варианта с участком неуправляемого движения b(t) = 0.5, когда М = 0. Следует подчеркнуть, что не всегда при заданных значениях Λн, Λк, и0, Ji можно осуществить разворот КА за отведенное время Т. Если соотношение параметров F, Т, m0 таково, что решение задачи оптимального быстродействия при ограничении (1.3) дает значение Тfast > Т, то реализация маневра разворота с такими исходными данными Λн, Λк, и0, Ji, Т невозможна и поставленная задача оптимального управления (1.1)–(1.6) не имеет решения (здесь Тfast – минимально возможное время разворота в условиях (1.3), Т – заданное время разворота).

Оптимальные функции ωi(t), φi(t), ri(t) удовлетворяют равенствам (2.4), (2.5), в которых переменные ri(t) являются решением уравнений (2.1). Детальное изучение системы дифференциальных уравнений (2.2) для сопряженных переменных φi приводит к следующим выводам: вектор φ(0) ≠ 0; а(0) > 0; $\dot {a}$(0) = –1 и $\dot {a}$(T) = –1; а(T) < 0 и а(T) = –а(0). В общем случае для функции a(t) как коэффициента пропорциональности для оптимальных функций φi справедливы следующие свойства:

$a(0) > 0\quad {\text{и }}\quad \dot {a}(0) = - 1;\quad a(T{\text{/}}2) = 0;\quad \dot {a}(t) \leqslant 0;$
$a(T - t) = - a(t)\quad {\text{и }}\quad \dot {a}(T - t) = \dot {a}(t);\quad {\text{е с л и }}\quad \dot {a} = 0,\quad {\text{т о }}\quad a = 0.$

В начале разворота (начиная с момента t = 0) будет r0b(t) = m0t, а значит, $\dot {a}$ = 2m0t/r0 – 1 и а(t) = m0t2/r0t + C1, где С1 = const. В конце маневра (приближаясь к моменту времени t = T) будет r0b(t) = m0(Тt) и $\dot {a}$ = 2m0(Тt)/r0 – 1, а(t) = (2m0T/r0 – 1)tm0t2/r0 + C2, где С2 = const. Значения констант C1, C2 и r0 существенно зависят от типа управления (от наличия или отсутствия неуправляемого участка с М = 0, т.е. от числа точек переключения).

Вариант 1. Управление с одной точкой переключения. В этом случае |M| = const и $\ddot {a}$ ≠ 0. Определим условия для возможности такого управления (здесь особые режимы управления отсутствуют, так как гамильтониан явным образом зависит от М). В точке переключения a(t) = 0. Учитывая непрерывность функций $\dot {a}$(t) и a(t), запишем систему уравнений, связывающих C1, C2, r0 и определяющих момент смены знака у М(t):

${{m}_{0}}{{t}^{2}}{\text{/}}{{r}_{0}} - t + {{C}_{1}} = 0;\quad (2{{m}_{0}}T{\text{/}}{{r}_{0}} - 1)t - {{m}_{0}}{{t}^{2}}{\text{/}}{{r}_{0}} + {{C}_{2}} = 0;\quad 2{{m}_{0}}t{\text{/}}{{r}_{0}} - 1 = 2{{m}_{0}}(T - t){\text{/}}{{r}_{0}} - 1,$
из которой получаем t = Т/2 – точка переключения, C1 = Т/2 – m02/4r0, C2 = Т/2 – 3m02/4r0. При r0 → ∞ C1 = C2 = Т/2, а a(t) – линейная функция времени, изменяющаяся с a(0) = Т/2 до a(T) = –Т/2. Для оптимального движения $\dot {a}$ ≤ 0 и b ≤ 0.5 при любом t. Поэтому должно быть r0 ≥ ≥ m0T (так как b(T/2) = m0T/2r0 ≤ 0.5). Случай, когда $\dot {a}$(T/2) = 0, b(T/2) = 0.5 и r0 = m0T, C1 = Т/4, C2 = –Т/4, является предельным.

Вариант 2. Управление с двумя точками переключения. Рассмотрим общий случай – оптимальное управление, когда при 0 ≤ t < t1 момент М = m0р, при t2 < tT момент М = –m0р, а при t1tt2 момент M = 0, где р = r/|r| – орт вектора r. Значение r0 определяется однозначно: r0 = 2Lном, где Lном = m0τ – модуль кинетического момента между разгоном и торможением, т.е. при номинальном вращении (в том числе в момент времени t = Т/2). При подходе к точке t = t1 слева φ ≠ 0 (при этом а > 0), и поэтому М = m0р и $\dot {b}$ = m0/r0; справа от точки t = t1 имеем φ = 0 и $\dot {\varphi } = $ 0, из-за чего М = 0 и b = const, $\ddot {a} = 0$. В окрестности точки t = t2 слева φ = 0 и $\dot {\varphi } = $ 0, а при t > t2 будет φ ≠ 0 и a(t) < 0, М = –m0р, $\dot {b}$ = –m0/r0. Учитывая требования $\dot {a}$(t1) = 0, a(t1) = 0 и $\dot {a}$(t2) = 0, a(t2) = 0, константы C1, C2 находим на основе уравнений

$\begin{gathered} 2{{m}_{0}}\tau {\text{/}}{{r}_{0}} = 1,\quad {{m}_{0}}{{\tau }^{2}}{\text{/}}{{r}_{0}} - \tau + {{C}_{1}} = 0, \\ (2{{m}_{0}}T{\text{/}}{{r}_{0}} - 1)(T - \tau ) - {{m}_{0}}{{(T - \tau )}^{2}}{\text{/}}{{r}_{0}} + {{C}_{2}} = 0, \\ \end{gathered} $
из которых C1 = τ/2, C2 = –(T – τ)2/2τ, r0 = 2m0τ. Если τ = Т/2, то C1 = Т/4, C2 = –Т/4.

При оптимальном управлении sign$\ddot {a}$ = sign$\dot {b}$ = signа (если а = 0, то последующее поведение функций а (t), b (t) определяет производная $\dot {a}$). Моменты выключения и включения управления определяет функция b (t), так как $\ddot {a}$ = 2$\dot {b}$ (если b = const, то $\ddot {a} = 0$ и для оптимальных функций φi коэффициент а ≡ 0). По мере приближения к t = t1 функция a(t) стремится к нулю. В момент, когда $\dot {a}$ = 0, для дальнейшего сохранения условий а = 0, $\dot {a}$ = 0 (вплоть до t = t2) производная $\dot {b}$ переключается с m0/r0 в нуль (управление выключается). Чтобы выйти из ситуации $\dot {a}$ = 0 и обеспечить требование $\dot {a}$(T) = –1, в некоторый момент времени t = t2 производная $\dot {b}$ переключается с нуля до –m0/r0. Если оптимальным является релейное управление с одной точкой переключения, то в момент t = Т/2 отключения управления не происходит, а $\dot {b}$ сменяется одномоментно с $\dot {b}$ = m0/r0 до $\dot {b}$ = –m0/r0 (при таком варианте управления $\left| {\dot {b}} \right|$ = const с t = 0 до t = T). Длительность выключенного управления (когда $\dot {b}$ = 0 и $\ddot {a} = 0$) определяется временем Т достижения состояния (1.5) (для конкретных значений Λн, Λк, J1, J2, J3, и0).

Из уравнений (2.1), (2.5) получим следующие уравнения для компонент рi вектора р:

(2.9)
${{\dot {p}}_{1}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{2}} - {{J}_{3}}}}{{{{J}_{2}}{{J}_{3}}}}{{p}_{2}}{{p}_{3}},\quad {{\dot {p}}_{2}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{3}} - {{J}_{1}}}}{{{{J}_{1}}{{J}_{3}}}}{{p}_{1}}{{p}_{3}},\quad {{\dot {p}}_{3}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{1}} - {{J}_{2}}}}{{{{J}_{1}}{{J}_{2}}}}{{p}_{1}}{{p}_{2}}.$

Для векторов р(0) и р(Т) имеем

(2.10)
${{\Lambda }_{{\text{к }}}} \circ {\mathbf{p}}(T) \circ {{\tilde {\Lambda }}_{{\text{к }}}} = {{\Lambda }_{{\text{н }}}} \circ {\mathbf{p}}(0) \circ {{\tilde {\Lambda }}_{{\text{н }}}}$
или р(Т) = ${{\tilde {\Lambda }}_{{\text{Р }}}} \circ {\mathbf{р }}\left( 0 \right) \circ {{\Lambda }_{{\text{Р }}}}$, где ${{\Lambda }_{{\text{р }}}} = {{\tilde {\Lambda }}_{{\text{н }}}} \circ {{\Lambda }_{{\text{к }}}}$ – кватернион разворота.

Как было показано выше b ≥ 0, и поэтому b = |L|/r0. При разгоне b = m0t/r0; при торможении b = m0(Тt)/r0. При оптимальном управлении b(t) – неотрицательная кусочно-линейная функция времени, не превышающая 0.5 и равная

$b(t) = \frac{{{{m}_{0}}}}{{{{r}_{0}}}}\int\limits_0^t {m(t)dt} ,$
где

$m(t) = \left\{ \begin{gathered} {\text{sign}}a(t),\quad {\text{е с л и }}\quad a(t) \ne 0; \hfill \\ 0,\quad {\text{е с л и }}\quad a(t) = 0. \hfill \\ \end{gathered} \right.$

Возможные варианты поведения функции b(t) показаны на рис. 2, где жирные линии соответствуют общему случаю управления, при котором $\dot {a}$(T/2) = 0 и b(T/2) = 0.5; тонкие линии соответствуют релейному управлению с одной точкой переключения, если $\dot {a}$(T/2) ≠ 0 и r0 > m0T (соответственно b (T/2) < 0.5). Здесь обозначено uкр – критическое значение u0, при котором разворот за время Т еще возможен. Для b(t) с двумя точками излома $u_{0}^{{(3)}}$ > $u_{0}^{{(2)}}$ > $u_{0}^{{(1)}}$ > uкр. С увеличением параметра u0 длительность участка с особым режимом управления, когда М = 0, возрастает. При u0 → ∞ значение b изменяется практически скачком с нуля до 0.5 в начале разворота и с 0.5 до нуля в конце разворота (τ → 0). Если участок неуправляемого движения отсутствует (для такого варианта u0 = uкр), то $\left| {\dot {b}} \right|$ ≤ 1/T для любого r0. Для b(t) с одной точкой излома $r_{0}^{{(3)}}$ > $r_{0}^{{(2)}}$ > $r_{0}^{{(1)}}$ > uкрT/С.

Рис. 2

2.7. Расчет ключевых параметров оптимального закона управления. Условие 2τ ≤ Т определяет требование к времени маневра Т, при котором задача управления (1.1)–(1.6) имеет решение для известных значений Λн, Λк и параметров КА и0, J1, J2, J3. Для нахождения времени разгона (торможения) τ и длительности свободного движения tсв воспользуемся следующим свойством: для вращения твердого тела с постоянным направлением кинетического момента относительно инерциальной системы координат интеграл (2.8) не зависит от характера изменения модуля |L| кинетического момента и равен F = ${{K}_{{\text{c}}}}{{t}_{{{\text{п р }}}}}$ [15], где Kc – произвольная ненулевая величина кинетического момента (Kc > 0); tпр – прогнозируемое время разворота из положения Λн в положение Λк, т.е. время, когда выполнится равенство Λ = Λк для решения Λ(t) системы уравнений (1.2), (2.1), (2.5), в которых b = Kc/|r(0)|, а Λ(0) = Λн. Каждой конкретной величине Kc соответствует свое значение tпр (значения tпр и Kc связаны обратно пропорциональной зависимостью). Взяв Kc ≠ 0 и моделируя неуправляемое вращение КА (когда М = 0) для соответствующих начальных условий Λ(0) = Λн, ${{\omega }_{i}}(0) = {{{{K}_{{\text{c}}}}{{p}_{{i0}}}} \mathord{\left/ {\vphantom {{{{K}_{{\text{c}}}}{{p}_{{i0}}}} {{{J}_{i}}}}} \right. \kern-0em} {{{J}_{i}}}}$, получим прогнозируемое время tпр и значение F. Если для параметров F, Т, m0 окажется 4F > m0T  2, то разворот не осуществим (решения задачи (1.1)–(1.6) не существует).

Запишем уравнения, связывающие длительность tсв с константой F. На участках разгона и торможения модуль кинетического момента изменяется по линейному закону, а между разгоном и торможением |L| = const = Lном. Поэтому Lном (Т + tсв) = 2F, Lном = m0τ = m0(Тtсв)/2. Подставив последнее уравнение в первое, получим ${{m}_{0}}({{T}^{2}} - t_{{{\text{с в }}}}^{2}) = 4F$, откуда

$t_{{{\text{с в }}}}^{{}} = \sqrt {{{T}^{2}} - 4F{\text{/}}{{m}_{0}}} ,\quad L_{{{\text{н о м }}}}^{{}} = {{m}_{0}}(T - \sqrt {{{T}^{2}} - 4F{\text{/}}{{m}_{0}}} ){\text{/}}2,\quad {{r}_{0}} = {{m}_{0}}(T - \sqrt {{{T}^{2}} - 4F{\text{/}}{{m}_{0}}} ).$

Для варианта, когда 4F = u0T2/С, интервал вращения по инерции отсутствует, τ = Т/2, а константа r0 может принимать любое значение в диапазоне r0u0T/С.

Начиная с момента t = 0 до t = t1 функция а(t) = m0t2/r0t + C1, в конце маневра (когда tt2) функция а (t) = (2m0T/r0 – 1) tm0t2/r0 + C2; C1, C2 и r0 определяются соотношением величин F, m0, T. Если 4F < m0T2, то C1 = τ/2, C2 = –(T – τ)2/2τ, r0 = 2m0τ и в интервале t1tt2 функция а(t) = 0. Если 4F = m0T2, то C1 = Т/2 – m0T2/4r0, C2 = Т/2 – 3m0T2/4r0, r0m0T, τ = Т/2. Оптимальные управления Мi и угловые скорости ωi изменяются по законам

(2.11)
${{M}_{i}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]{{p}_{i}},\quad i = \overline {1,3} ,$
(2.12)
${{J}_{i}}{{\omega }_{i}} = 0.5{{m}_{0}}(T - {\text{|}}t - {{t}_{1}}{\text{|}} - \,{\text{|}}t - {{t}_{2}}{\text{|}}){{p}_{i}},\quad i = \overline {1,3} ,$
где ${{t}_{1}} = \tau = (T - \sqrt {{{T}^{2}} - {{4{{K}_{c}}{{t}_{{{\text{п р }}}}}} \mathord{\left/ {\vphantom {{4{{K}_{c}}{{t}_{{{\text{п р }}}}}} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$; ${{t}_{2}} = (T + \sqrt {{{T}^{2}} - {{4{{K}_{c}}{{t}_{{{\text{п р }}}}}} \mathord{\left/ {\vphantom {{4{{K}_{c}}{{t}_{{{\text{п р }}}}}} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$.

Закон вращения (2.12) удовлетворяет граничным условиям ω(0) = 0 и ω(T) = 0, так как t1 + + t2 = Т, и выражение в скобках обнуляется при t = 0 и t = Т. Зависимости (2.1), (2.11), (2.12) с учетом равенств ri = r0рi – единственное решение задачи оптимального управления (1.1)–(1.6). Из (2.1), (2.11) и равенств ri = r0рi явно видно, что при оптимальном управлении момент сил М действует вдоль прямой, неподвижной в инерциальной системе координат. Уравнения (2.12) отчетливо показывают, что в геометрическом представлении вектор р есть ни что иное, как орт оптимального кинетического момента КА L в связанной с КА системе координат. Оптимальным (в смысле минимума показателя (1.6)) будет разворот КА, при котором направление кинетического момента остается неизменным относительно инерциальной системы координат (векторы М и L параллельны). Одним из основных свойств оптимального разворота КА является следующее: во все время движения (на всем отрезке времени [0, T ]) отношение кинетической энергии вращения Е к квадрату модуля кинетического момента КА постоянно. Действительно,

$E{\text{/|}}L{{{\text{|}}}^{2}} = 0.5(r_{1}^{2}{\text{/}}{{J}_{1}} + r_{2}^{2}{\text{/}}{{J}_{2}} + r_{3}^{2}{\text{/}}{{J}_{3}}){\text{/|}}{\mathbf{r}}{{{\text{|}}}^{2}} = {\text{const}} = (p_{{10}}^{2}{\text{/}}{{J}_{1}} + p_{{20}}^{2}{\text{/}}{{J}_{2}} + p_{{30}}^{2}{\text{/}}{{J}_{3}}){\text{/}}2.$

Условием осуществимости разворота является неравенство T2 ≥ 4F/m0 = 4/и0. При этом значение r0 будет удовлетворять условию r0 > 2F/Т (причем r0 → 2F/Т при и0 → ∞).

Функции Мi(t), рi(t), ωi(t) будут оптимальными тогда и только тогда, когда они удовлетворяют уравнениям (2.1), (2.11), (2.12). Задача построения оптимального управления М(t) состоит главным образом в нахождении такого значения r0 и вектора р(0), чтобы в результате движения КА в соответствии с уравнениями (1.2), (2.1), (2.12) выполнялись равенства Λ(Т) = Λк и ω(Т) = 0. Для получения функциональной зависимости управлений от фазовых координат необходимо решить уравнения (2.1), которые для закона (2.5) примут вид (2.9). Если J1, J2, J3, и0, Т не меняются, то для всех сочетаний Λн, Λк с одинаковым значением кватерниона ${{\tilde {\Lambda }}_{{\text{н }}}} \circ {{\Lambda }_{{\text{к }}}}$ решение r(0), М(t), ω(t) будет одним и тем же.

Необходимо отметить, что оптимизация в соответствии с критерием (1.6) минимизирует максимальную кинетическую энергию вращения во время разворота за фиксированное время T (подробности относительно сделанного утверждения приведены в Приложении, где указаны и другие положительные качества предложенного оптимального управления). Минимум максимальной кинетической энергии вращения позволяет максимально быстро погасить угловую скорость в экстренных случаях (в том числе при возникновении нештатной ситуации, когда требуется прервать маневр и как можно быстрее стабилизировать КА).

3. Построение типовой программы оптимального разворота КА. Для динамической системы (1.1), (1.2) управление (2.11), при котором направление момента сил М параллельно прямой, неподвижной в инерциальном пространстве, удовлетворяет необходимым условиям оптимальности для критерия (1.6) при наличии ограничения (1.3). Так как начальная ω(0) и конечная ω(T) угловые скорости равны нулю, то такое управление и такое вращение КА осуществимо (замкнутая система (1.1), (2.2), (2.9), (2.11) имеет решение), если конечно ТТfast, где Тfast = $2\sqrt {F{\text{/}}{{m}_{0}}} $– минимально возможное время разворота КА из состояния (1.4) в состояние (1.5) при ограничении (1.3). Для оптимального движения ω(t) выполняются равенства (2.12). Определяющим в решении задачи оптимального разворота (при построении оптимального программного движения ω(t) и оптимальной траектории Λ(t)) является нахождение начальных условий р(0) и соответствующего момента m0 = |М(0)| (вектор р(0) зависит исключительно от параметров разворота ΛР и моментов инерции КА J1, J2, J3 и не зависит от Т).

Для случая нулевых граничных условий ω(0) = ω(T) = 0 реализуется только один единственный тип движения: первый участок – разгон КА с максимальным управляющим моментом |M| = m0 до |L| = Lзад, далее участок свободного движения КА (M = 0) с постоянным по величине кинетическим моментом |L| = Lзад продолжительностью $T\sqrt {1 - {{4F} \mathord{\left/ {\vphantom {{4F} {{{m}_{0}}{{T}^{2}}}}} \right. \kern-0em} {{{m}_{0}}{{T}^{2}}}}} $ и затем симметричный участок торможения КА с максимальным управляющим моментом |M| = m0 до остановки КА (M || L). Максимальная величина кинетического момента во время разворота равна заданному значению ${{L}_{{{\text{з а д }}}}} = {{m}_{0}}\tau $, где $\tau = (T - \sqrt {{{T}^{2}} - {{4F} \mathord{\left/ {\vphantom {{4F} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$ – время разгона (торможения), F = ${{K}_{{\text{c}}}}{{t}_{{{\text{п р }}}}}$ – постоянная, не зависящая от характера изменения модуля |L(t)|. Из (2.4) φi находятся с учетом

${\text{|}}{\mathbf{r}}(0){\text{|}} = {{r}_{0}} = 2{{m}_{0}}\tau \quad {\text{и }}\quad a(t) = \left\{ \begin{gathered} {{t}^{2}}{\text{/}}2\tau - t + \tau {\text{/}}2,\quad {\text{е с л и }}\quad t < \tau ; \hfill \\ 0,\quad {\text{е с л и }}\quad \tau \leqslant t \leqslant T - \tau ; \hfill \\ (T{\text{/}}\tau - 1)t - {{t}^{2}}{\text{/}}2\tau - {{(T - \tau )}^{2}}{\text{/}}2\tau ,\quad {\text{е с л и }}\quad t > T - \tau . \hfill \\ \end{gathered} \right.$

Для одних и тех же значений Λн, Λк, J1, J2, J3 и Т вид функции b(t) определяется параметром и0. Решение задачи (1.1)–(1.6) существует, если и0 ≥ 4S/T2, где

$S = \int\limits_0^T {\sqrt {{{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}} dt} $
– функционал пути [15] для траектории свободного движения из положения Λн в положение Λк твердого тела с моментами инерции J1, J2, J3 (значение S и интеграл F связаны зависимостью S = FC). Если и0 = 4S/T2, то t1 = t2 и максимальная величина кинетического момента равна Lmax = 2F/T; оптимальное значение r0 ≥ 4F/T, а bmax = 2F/r0T. Если и0 > 4S/T2, то t1t2 и оптимальное значение r0 = 2Lном, где Lном = ${{u}_{0}}(T - \sqrt {{{T}^{2}} - 4S{\text{/}}{{u}_{0}}} ){\text{/}}2C$ = ${{m}_{0}}(T - \sqrt {{{T}^{2}} - 4F{\text{/}}{{m}_{0}}} ){\text{/}}2$ – модуль кинетического момента КА в интервале между разгоном и торможением, когда М = 0 (напомним, m0 = u0/C – максимальный модуль момента М). Если и0 < 4S/T2, то задача (1.1)–(1.6) не имеет решения.

Управляющие переменные рассчитываются в соответствии с законом (2.11), для реализации которого необходимо в каждый момент времени t знать все три переменные р1, р2, р3. При оптимальном движении компоненты рi вектора р подчиняются уравнениям (2.9), в которых |L| рассчитывается в соответствии с (2.12). Управление (2.11) оптимально, потому что оно является единственным решением системы уравнений (1.1), (2.1)–(2.3), которые формализуют необходимые условия оптимальности.

3.1. Частные случаи оптимального управления разворотом. Общее решение системы уравнений (1.2), (2.5), (2.9) с учетом равенств ri = r0pi получить практически невозможно; трудность заключается в определении граничных значений p(0) и p(T), которые связаны между собой выражением (2.10). Приведенная система имеет аналитическое решение только для динамически-симметричного и сферического тел.

Для сферически-симметричного КА (J1 = J2 = J3) решение такое:

${{p}_{i}}(t) = {\text{const}} = {{p}_{{i0}}} = {{\nu }_{i}}{\text{/}}\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} ;\quad {{M}_{i}}(t) = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]{{p}_{{i0}}};$
${{\omega }_{i}}(t) = 0.5{{m}_{0}}(T - \,{\text{|}}t - {{t}_{1}}{\text{|}} - \,{\text{|}}t - {{t}_{2}}{\text{|}}){{p}_{{i0}}}{\text{/}}{{J}_{i}},\quad i = \overline {1,3} ,$
где ${{\nu }_{1}},\;{{\nu }_{2}},\;{{\nu }_{3}}$ – компоненты векторной части кватерниона разворота Λр; ${{m}_{0}} = {{u}_{0}}\sqrt {{{J}_{1}}} $; t1 = = $(T - \sqrt {{{T}^{2}} - {{4F} \mathord{\left/ {\vphantom {{4F} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$; ${{t}_{2}} = (T + \sqrt {{{T}^{2}} - {{4F} \mathord{\left/ {\vphantom {{4F} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$, причем F = 2J1arccos(sqalΛр).

Для динамически-симметричного КА (например, когда J2 = J3) задача оптимального управления разворотом решается до конца (не умаляя общности рассуждений, за ось симметрии принята ось ОХ КА). Оптимальное движение в этом частном, но достаточно распространенном случае представляет собой одновременное вращение КА как твердого тела вокруг своей продольной оси ОХ и вокруг некоторого направления η, неподвижного в инерциальном пространстве и составляющего с продольной осью КА определенный постоянный угол ϑ. Угловые скорости относительно осей ОХ и η изменяются пропорционально с постоянным коэффициентом пропорциональности, и поэтому справедливо соотношение

${{\Lambda }_{{\text{к }}}} = {{\Lambda }_{{\text{н }}}} \circ {{е }^{{{{{\mathbf{p}}}_{{\text{o}}}}\beta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\alpha /2}}},$
где вектор в показателе степени кватернионной экспоненты понимается как кватернион с нулевой скалярной частью; р0 = р(0); е1 – орт продольной оси КА; α, β – углы поворота КА вокруг продольной оси ОХ и вокруг вектора р соответственно (считается |α| ≤ π, 0 ≤ β ≤ π). Решение p(t) системы уравнений (1.1), (2.9), (2.12) представим так:
(3.1)
${{p}_{1}} = {{p}_{{10}}} = \cos \vartheta ,\quad {{p}_{2}} = {{p}_{{20}}}\cos \kappa + {{p}_{{30}}}\sin \kappa ,\quad {{p}_{3}} = - {{p}_{{20}}}\sin \kappa + {{p}_{{30}}}\cos \kappa ,\quad \kappa = \frac{{J - {{J}_{1}}}}{J}\int\limits_0^t {{{\omega }_{1}}(t)dt} ,$
где pi0 = рi(0); J = J2 = J3; продольная угловая скорость ω1(t) определяется из соотношений (2.12) с учетом р1 = const = р10. Зависимость pi0, α, β от ΛН и ΛК определяется уравнениями
(3.2)
$\begin{gathered} \alpha = \frac{{J - {{J}_{1}}}}{{{{J}_{1}}}}{{p}_{{10}}}\beta ;\quad \cos \frac{\beta }{2}\cos \frac{\alpha }{2} - {{p}_{{10}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{0}};\quad \cos \frac{\beta }{2}\sin \frac{\alpha }{2} + {{p}_{{10}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} = {{\nu }_{1}}; \\ {{p}_{{20}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} + {{p}_{{30}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{2}};\quad - {\kern 1pt} {{р }_{{20}}}\sin \frac{{\beta }}{2}\cos \frac{{\alpha }}{{\text{2}}} + {{p}_{{30}}}\sin \frac{{\beta }}{2}\cos \frac{{\alpha }}{2} = {{{\nu }}_{3}}; \\ \end{gathered} $
где ${{\nu }_{0}},\;{{\nu }_{1}},\;{{\nu }_{2}},\;{{\nu }_{3}}$ – компоненты кватерниона разворота ${{\Lambda }_{{\text{р }}}} = {{\tilde {\Lambda }}_{{\text{н }}}} \circ {{\Lambda }_{{\text{к }}}}$; –π ≤ α ≤ π, 0 ≤ β ≤ π. Существование решения системы (3.2) для любых значений кватерниона Λр доказано в [13]. Оптимальное значение управляющего момента М удовлетворяет соотношениям (2.11). Программные значения функций ωi (проекции требуемого вектора угловой скорости ω* на связанные оси) вычисляются по формулам (3.1) и (2.12). В явном виде оптимальное решение Mi(t), ωi(t), $i = \overline {1,\;3} $, запишем следующим образом:
${{M}_{1}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]{{p}_{{10}}};$
${{M}_{2}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma );$
${{M}_{3}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma );$
${{\omega }_{1}} = 0.5{{m}_{0}}(T - \,{\text{|}}t - {{t}_{1}}{\text{|}} - \,{\text{|}}t - {{t}_{2}}{\text{|}}){{p}_{{10}}}{\text{/}}{{J}_{1}};\quad {{\omega }_{2}} = 0.5{{m}_{0}}(T - \,{\text{|}}t - {{t}_{1}}{\text{|}} - \,{\text{|}}t - {{t}_{2}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma ){\text{/}}{{J}_{2}};$
${{\omega }_{3}} = 0.5{{m}_{0}}(T - \,{\text{|}}t - {{t}_{1}}{\text{|}} - \,{\text{|}}t - {{t}_{2}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma {\text{)/}}{{J}_{3}},$
где ${{t}_{1}} = (T - \sqrt {{{T}^{2}} - {{4{{J}_{2}}\beta } \mathord{\left/ {\vphantom {{4{{J}_{2}}\beta } {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$; ${{t}_{2}} = (T + \sqrt {{{T}^{2}} - {{4{{J}_{2}}\beta } \mathord{\left/ {\vphantom {{4{{J}_{2}}\beta } {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$; $\gamma = \arcsin ({{p}_{{20}}}{\text{/}}\sqrt {1 - p_{{10}}^{2}} )$, если р30 ≥ 0, или $\gamma = \pi - \arcsin ({{p}_{{20}}}{\text{/}}\sqrt {1 - p_{{10}}^{2}} )$, если р30 < 0 (|р10| ≠ 1; а случай |р10| = 1 не рассматривается, так как он соответствует плоскому вращению КА вокруг продольной оси ОХ).

Для несимметричного КА (${{J}_{1}} \ne {{J}_{2}} \ne {{J}_{3}}$) решение системы уравнений (1.2), (2.9), (2.12) в квадратурах не представляется возможным и находится исключительно численными методами (например, методом последовательных приближений). Определение вектора p0 производится путем решения краевой задачи р(0) = р0, р(Т) = ${{\tilde {\Lambda }}_{{\text{Р }}}} \circ $р0$ \circ {{\Lambda }_{{\text{Р }}}}$ с учетом накладываемых на движение связей (2.9). В системе [16] такая задача решена для КА с произвольными моментами инерции (методом итераций). Заметим, что решение р0 не зависит от характера изменения модуля кинетического момента, входящего в уравнения (2.9). Поэтому для нахождения оптимального значения р0 правомерно принять |L| = const ≠ 0. Случай решения р(t) системы (2.9) с |L| = const соответствует вращению твердого тела с М = 0 (поскольку уравнения (2.9) и (2.5) выполняются одновременно).

3.2. Основные количественные характеристики оптимального разворота. Вычислим значение функционала (1.6) для оптимального управления:

$G = {{C}^{2}}\int\limits_0^T {{{{\left| {\mathbf{L}} \right|}}^{2}}dt} = {{C}^{2}}m_{0}^{2}{{\tau }^{2}}(T - 2\tau ) + 2{{C}^{2}}\int\limits_0^\tau {m_{0}^{2}{{t}^{2}}dt{{ = }^{{}}}} u_{0}^{2}{{\tau }^{2}}(T - 4\tau {\text{/}}3),$
где $\tau = (T - \sqrt {{{T}^{2}} - {{4F} \mathord{\left/ {\vphantom {{4F} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$; $C = \sqrt {{{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} $. Если τ → 0, то GGmin = S 2/T. Если τ = Т/2, то G = Gmax = $u_{{\text{0}}}^{2}{{T}^{3}}{\text{/}}2 = {{2{{C}^{2}}\sqrt {{{m}_{0}}F} } \mathord{\left/ {\vphantom {{2{{C}^{2}}\sqrt {{{m}_{0}}F} } 3}} \right. \kern-0em} 3}$.

Из-за наличия участков разгона и торможения превышение значения (1.6) относительно минимально возможного Gmin (когда управление неограниченно u0 → ∞ и τ → 0) составляет

$\Delta G = G - {{G}_{{\min }}} = {{C}^{2}}{{F}^{2}}(T - 4\tau {\text{/}}3){{(T - \tau )}^{{ - 2}}} - {{S}^{2}}{\text{/}}T.$

Относительный проигрыш будет равен ΔG/Gmin = T (Т – 4τ/3)(Т – τ) –2 – 1. Чем меньше τ, тем меньше величина проигрыша ΔG/Gmin. Это хорошо видно, если записать

$\Delta G{\text{/}}{{G}_{{\min }}} = \frac{{2\tau }}{{3(T - \tau )}} - \frac{1}{3}{{\left( {\frac{\tau }{{T - \tau }}} \right)}^{2}}$.

Время τ изменяется в пределах от нуля до Т/2. Функция ΔG/Gmin возрастает всюду в диапазоне 0 ≤ τ ≤ Т/2. Минимальное значение соответствует режиму τ → 0, а критической точкой (максимумом) является предельный случай τ = Т/2. Превышение ΔG составит треть от Gmin.

Для построения оптимального управления при развороте КА необходимо знать не только программу изменения координат рi(t), но и значения характеристик F, m0, определяющих темп приближения к требуемому конечному состоянию Λ(Т) = Λк, ω(Т) = 0, а также моменты выключения и включения управления t1 и t2. Конкретные значения параметров F, m0, t1, t2 и r0 = |r| зависят от длительности разворота Т. Для динамически-симметричного КА значение F вычисляется значительно проще (расчет величин r0, t1, t2 и функционала G также упрощается). В этом частном случае |L| = J2${\dot {\beta }}$ и F = J2β, где J2 – момент инерции относительно поперечной оси (J2 = J3); ${\dot {\beta }}$ – скорость вращения вокруг кинетического момента L; β – угол поворота КА вокруг вектора L (из физического смысла β ≥ 0). Чтобы значение оптимизируемого функционала (1.6) было минимальным, необходимо выполнить условие β ≤ π (именно поэтому система (3.2) включает неравенство 0 ≤ β ≤ π). Значения r0, t1, t2, G зависят только от угла поворота КА вокруг кинетического момента L и численно равны:

${{t}_{1}} = \tau = (T - \sqrt {{{T}^{2}} - {{4{{J}_{2}}\beta } \mathord{\left/ {\vphantom {{4{{J}_{2}}\beta } {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2,\quad {{t}_{2}} = (T + \sqrt {{{T}^{2}} - {{4{{J}_{2}}\beta } \mathord{\left/ {\vphantom {{4{{J}_{2}}\beta } {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2;\quad {{r}_{0}} = 2{{m}_{0}}\tau ;\quad G = u_{0}^{2}{{\tau }^{2}}(T - 4\tau {\text{/}}3).$

Решение задачи оптимального разворота (в смысле минимума (1.6)) подчиняется уравнениям (2.1), (2.4), (2.5), а управляющие переменные Мi и угловые скорости ωi изменяются согласно законам (2.11), (2.12). Решение (2.11), (2.12) оптимально, потому что оно – единственное; только оно одно (и никакое другое) удовлетворяет необходимым условиям оптимальности. Любое отличное от (2.11), (2.12) движение будет заведомо хуже (в смысле минимума интеграла (1.6)), поскольку не будет удовлетворять необходимым условиям оптимальности (согласно принципу максимума). Значение m0 в законах движения (2.11), (2.12) определяет максимальную величину управляющего момента, максимальное значение модуля кинетического момента и длительность участка свободного движения. Значение вектора р0 рассчитывается в результате решения краевой задачи принципа максимума. Константы F, m0, r0 полностью определяют программу движения при оптимальном законе управления пространственным разворотом КА. Программное изменение момента сил М описывается зависимостью

${\mathbf{M}} = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]\tilde {\Lambda } \circ {{\Lambda }_{{\text{н }}}} \circ {{{\mathbf{p}}}_{0}} \circ {{\tilde {\Lambda }}_{{\text{н }}}} \circ \Lambda {\kern 1pt} .$

Для оптимальной программы управления М(t) движение КА относительно центра масс обладает следующими оригинальными свойствами и соотношениями:

$\Lambda \circ {\mathbf{M}}(T - t) \circ \tilde {\Lambda } = - \Lambda \circ {\mathbf{M}}(t) \circ \tilde {\Lambda };\quad \Lambda \circ {\mathbf{L}}(T - t) \circ \tilde {\Lambda } = \Lambda \circ {\mathbf{L}}(t) \circ \tilde {\Lambda };\quad \int\limits_0^{T/2} {\left| {{\mathbf{L}}(t)} \right|dt} = \int\limits_{Т /2}^T {\left| {{\mathbf{L}}(t)} \right|dt} ,$
${{L}_{{\max }}} = \mathop {\max }\limits_{0 < t < T} \sqrt {J_{1}^{2}\omega _{1}^{2} + J_{2}^{2}\omega _{2}^{2} + J_{3}^{2}\omega _{3}^{2}} = {\text{|}}{\mathbf{L}}(T{\text{/}}2){\text{|}}.$

Раскрутка КА в начале разворота продолжается до тех пор, пока его кинетический момент L не станет равен заданному уровню Lpr, который рассчитывается по формуле

${{{\mathbf{L}}}_{{{\text{pr}}}}} = {{m}_{0}}\tau \tilde {\Lambda } \circ {{\Lambda }_{{\text{н }}}} \circ {{{\mathbf{p}}}_{0}} \circ {{\tilde {\Lambda }}_{{\text{н }}}} \circ \Lambda .$

Момент начала торможения определяется условием

$\begin{gathered} 4{\text{arcsin}}\frac{{K\sqrt {\delta _{2}^{2} + \delta _{3}^{2}} }}{{\sqrt {{{{({{J}_{2}}{{\omega }_{2}})}}^{2}} + {{{({{J}_{3}}{{\omega }_{3}})}}^{2}}} }} = \frac{{{{K}^{2}}\sqrt {\omega _{2}^{2} + \omega _{3}^{2}} }}{{{{m}_{0}}\sqrt {{{{({{J}_{2}}{{\omega }_{2}})}}^{2}} + {{{({{J}_{3}}{{\omega }_{3}})}}^{2}}} }},\quad {\text{е с л и }}\quad \omega _{2}^{2} + \omega _{3}^{2} \ne 0, \\ {\text{и л и }}\quad 4\arccos {{\delta }_{0}} = {{\omega }_{1}}K{\text{/}}{{m}_{0}},\quad {\text{е с л и }}\quad \omega _{2}^{2} + \omega _{3}^{2} = 0, \\ \end{gathered} $
где δj – компоненты кватерниона рассогласования $\tilde {\Lambda }(t) \circ {{\Lambda }_{{\text{к }}}}$ (j = $\overline {0,\;3} $); К = |JКАω| – величина кинетического момента КА.

Указанный критерий позволяет бортовой системе управления формировать сигнал на гашение угловой скорости по информации о текущей ориентации КА и измерениям его угловой скорости, что повышает точность приведения КА в конечное положение Λк.

Несмотря на то, что предлагаемое оптимальное управление имеет одно общее свойство с известным решением [17] (во время разворота кинетический момент L сохраняет направление постоянным относительно инерциальной системы координат), существует ряд принципиальных отличий. Главное отличие – возможность разворота по способу [17] не зависит от длительности маневра. В [17] оптимизируется неограниченное управление, а здесь рассмотрен разворот с ограниченным моментом М. При этом минимизируется квадратичная форма угловой скорости, а не силового момента М. Кроме того, в задаче [17] на всем интервале управления [0, T] (кроме единственного момента времени t = Т/2) управляющий момент М не равен нулю, а в предлагаемом решении может существовать интервал времени ненулевой продолжительности, на котором управляющий момент М равен нулю и КА вращается по инерции. Решение задачи оптимального разворота [17] не имеет интервалов времени, на которых модуль управляющего момента постоянный. Наконец, в решении [17] все управляющие функции Mi(t) – непрерывные гладкие функции времени.

4. Результаты математического моделирования. Приведем численный пример решения задачи оптимального управления программным разворотом КА с минимальным значением интеграла (1.6). Рассмотрим разворот КА на 180° из начального положения Λн, при котором оси КА совмещены (совпадают по направлению) с осями опорного базиса I, в заданное конечное положение Λк = Λзад с минимальным значением интеграла (1.6). При этом считалось, что начальные и конечные угловые скорости нулевые ω(0) = ω(Т) = 0. Значения элементов кватерниона Λзад, характеризующего требуемое угловое положение КА, были равны: λ0 = 0; λ1 = 0.7071; λ2 = 0.39; λ3 = 0.59. Будем полагать, что инерционные характеристики КА имеют значения: J1 = 64008 кг ⋅ м2, J2 = 228737 кг ⋅ м2, J3 = 201655 кг ⋅ м2. Мощность исполнительных органов характеризуется величиной и0 = 0.37886 Н/$\sqrt {{\text{к г }}} $. Пусть длительность разворота Т = 200 с. Определим оптимальную программу управления скоростью вращения КА ω(t) для перевода КА из состояния Λ(0) = Λн, ω(0) = 0 в состояние Λ(Т) = Λк, ω(Т) = 0.

Нахождение расчетного значения вектора p0 начинаем с решения той же краевой задачи для динамически-симметричного КА с моментами инерции J1 и J, где J – момент инерции относительно поперечной оси, принимаемый равным

$J = \frac{{{{J}_{2}}{{J}_{3}}}}{{{{J}_{2}} + {{J}_{3}} - {{J}_{1}}}}(\sqrt {(1 - {{J}_{1}}{\text{/}}{{J}_{2}})(1 - {{J}_{1}}{\text{/}}{{J}_{3}})} + 1).$

В предположении динамической симметричности КА решение p0 определяется системой (3.2). Для симметричного твердого тела значения искомых переменных будут такими:

${\mathbf{p}}_{0}^{{(0)}} = \{ 0.4667597;\; - 0.3691570;\;0.8036532\} ;$
${{\beta }^{{(0)}}} = 106.2^\circ ;\quad {\text{и н т е г р а л }}\quad {{F}^{{(0)}}} = {\text{ }}396.9{\text{ к Н }} \cdot {\text{м }} \cdot {{{\text{с }}}^{2}}.$

Полученные из уравнений (3.2) значения p0 и β являются начальным приближением к истинному решению. Они уточняются до тех пор, пока не будут удовлетворять системе уравнений (1.2), (1.1), в которых момент сил отсутствует (M = 0), с учетом накладываемых на движение КА ограничений Λ(0) = Λн, Λ(tпр) = Λк, а начальные угловые скорости ωiн определяются вектором p0 и углом β:

(4.1)
${{\omega }_{{1{\text{н }}}}} = \frac{{J\beta }}{{{{J}_{1}}T}}{{p}_{{10}}},\quad {{\omega }_{{2{\text{н }}}}} = \frac{{J\beta }}{{{{J}_{2}}T}}{{p}_{{20}}},\quad {{\omega }_{{3{\text{н }}}}} = \frac{{J\beta }}{{{{J}_{3}}T}}{{p}_{{30}}},$
где Т – время разворота. Прогнозирование “свободного” движения осуществляется интегрированием системы уравнений (1.1), (1.2), описывающих вращение КА, при начальных условиях Λ(0) = Λн, ω(0) = ωн и с учетом того, что M = 0. Степень приближения найденных р0 и β к искомому решению характеризуется мерой ε = sqal (${{\tilde {\Lambda }}_{{{\text{п р }}}}} \circ {{\Lambda }_{{\text{к }}}}$), где Λпр – наиболее близкое к Λк положение, полученное в ходе моделирования движения КА около центра масс (согласно уравнений (1.2), (1.1), в которых Mi = 0). Вектор р0 уточняется до тех пор, пока ε < εпорпор – некоторое близкое к единице пороговое значение, отражающее точность найденного решения). Как только условие ε ≥ εпор достигнуто (прогнозируемая ошибка соответствует требуемой точности), истинные значения p0 и β, удовлетворяющие граничным условиям Λ(0) = Λн, Λ(tпр) = Λк, будут найдены и краевая задача решена. Вектор p0 уточняется, используя следующее рекуррентное соотношение
$\Lambda _{{\text{р }}}^{{{\text{(}}k + {\text{1)}}}} = \Lambda _{{\text{р }}}^{{{\text{(}}k{\text{)}}}} \circ {{\tilde {\Lambda }}_{{\text{к }}}} \circ {{\Lambda }_{{{\text{п р }}}}},$
где $\Lambda _{{\text{p}}}^{{(k)}}$ – значение кватерниона разворота на k-й итерации, используемое в системе (3.2). На каждом k-м шаге итераций обновляются элементы кватерниона разворота $\Lambda _{{\text{р }}}^{{{\text{(}}k{\text{)}}}}$ (правые части системы (3.2)), и из уравнений (3.2) мы получаем p0 и β, а также соответствующую начальную угловую скорость ωн (согласно (4.1)) и прогноз Λпр. Если ε < εпор, то вычисляется кватернион разворота $\Lambda _{{\text{р }}}^{{{\text{(}}k + {\text{1)}}}}$ для следующего (k + 1)-го шага итераций и процесс уточнения вектора p0 повторяется. За начальное приближение в правых частях системы (3.2) берутся элементы кватерниона $\Lambda _{{\text{р }}}^{{{\text{(0)}}}} = {{\tilde {\Lambda }}_{{\text{н }}}} \circ {{\Lambda }_{{\text{к }}}}$. Итерационный процесс прекращается, когда ε ≥ εпор.

Принятая схема итераций аналогична итерационному методу решения уравнения вида x = f(x) для скалярной функции f (x) скалярного (одномерного) аргумента x. В нашем случае аргумент – гиперкомплексное число (кватернион) Λр. Функцией является кватернионная величина ${{\Lambda }_{{\text{р }}}} \circ {{\tilde {\Lambda }}_{{\text{к }}}} \circ {{\Lambda }_{{{\text{п р }}}}}$, где Λк – постоянный (не зависящий от аргумента Λр) кватернион; Λпр зависит от аргумента Λр через систему уравнений (3.2), (4.1) посредством модели движения (1.1), (1.2) (в уравнениях (1.1) принимается Мi = 0). Изменяя Λр, изменяются вектор p0 (в соответствии с (3.2)) и угловые скорости ωiн, а значит, изменится и значение Λпр, что вызовет изменение функции ${{\Lambda }_{{\text{р }}}} \circ {{\tilde {\Lambda }}_{{\text{к }}}} \circ {{\Lambda }_{{{\text{п р }}}}}$. Как только sqal (${{\tilde {\Lambda }}_{{{\text{п р }}}}} \circ {{\Lambda }_{{\text{к }}}}$) ≥ εпор, итерационный процесс прекращается, а решение p0 считается найденным. Так как ${\text{|vect}}({{\tilde {\Lambda }}_{{\text{к }}}} \circ \Lambda _{{{\text{п р }}}}^{{(k)}}){\text{|}} < {\text{|vect}}\Lambda _{{\text{р }}}^{{(k)}}{\text{|}}$ для всех k, то итерационный процесс приближения p0 к искомому решению сходится. Аналогичный метод определения значения р0 в решении краевой задачи принципа максимума использовался в задаче оптимального по быстродействию управления [18]. Заметим, что это лишь один из возможных (но далеко не единственный) итерационных алгоритмов поиска оптимального вектора р0.

В результате решения краевой задачи разворота из положения Λ(0) = Λн в положение Λ(Т) = Λк получили расчетное значение вектора p0 = {0.4552575; –0.3475526; 0.8197242}. Максимальная величина управляющего момента равна m0 = 142.2 Н ⋅ м, а интеграл F = 394.6 кН ⋅ м ⋅ с2. Оптимальные управления вычисляются по формулам (2.11), в которых t1t2, потому что 4F < m0T2. Зная значения характеристик m0, F и T, определяем времена ${{t}_{1}} = (T - \sqrt {{{T}^{2}} - {{4F} \mathord{\left/ {\vphantom {{4F} {{{m}_{0}}}}} \right. \kern-0em} {{{m}_{0}}}}} ){\text{/}}2$ = 15 с и t2 = 185 с, а также ${{r}_{0}} = {{m}_{0}}(T - \sqrt {{{T}^{2}} - 4F{\text{/}}{{m}_{0}}} )$ = 4266 Н ⋅ м ⋅ с, максимальная величина кинетического момента составляет Lmax = 2133 Н ⋅ м ⋅ с.

Результаты математического моделирования динамики оптимального разворота представлены рис. 3–6. На рис. 3 изображены графики изменения угловых скоростей в связанной с КА системе координат ω1(t), ω2(t), ω3(t) по времени. Отмечаем, что угловая скорость ω1, соответствующая оси ОХ КА, – знакопостоянна. На этапе между разгоном и торможением КА вращается с постоянной кинетической энергией, равной Е = 16.15 Дж. Значение интеграла (1.6), отражающего экономичность программы М(t) управления разворотом, составило G = 5813 Дж ⋅ с. На рис. 4 отображены графики изменения компонент кватерниона Λ(t), определяющего текущую ориентацию КА в процессе совершаемого поворотного маневра: λ0(t), λ1(t), λ2(t), λ3(t). На рис. 5 приведена динамика изменения составляющих р1(t), р2(t), р3(t) вектора р во времени. Характерным является незначительное изменение проекции р1 (составляющая угловой скорости ω1 на участке вращения по инерции также меняется гораздо меньше, чем составляющие угловой скорости ω2 и ω3). Это свидетельствует о том, что ОХ – продольная ось КА. При оптимальном управлении в отличие от переменных ωi переменные рi и λj – гладкие функции времени. На рис. 6 изображены графики изменения управляющих функций М1(t), М2(t), М3(t).

Рис. 3
Рис. 4
Рис. 5
Рис. 6

Заключение. Рассмотрена и решена задача оптимального управления пространственным разворотом КА из произвольного начального в требуемое конечное угловое положение за заданное время при ограниченном управляющем моменте. Для решения поставленной задачи используются необходимые условия оптимальности в форме принципа максимума и кватернионы. Оптимизация производится в соответствии с квадратичным критерием качества, в котором минимизируемым функционалом является интеграл энергии; сформулированная задача управления достаточно актуальна. Постановка задачи имеет традиционную форму, в которой управление положено кусочно-непрерывной функцией времени. На основании принципа максимума и использовании универсальных переменных ri [14] получены выражения для оптимального управления, функции Гамильтона и сопряженной системы уравнений для исходной задачи. Сформулированы условия оптимальности и найдена структура оптимального управления; получены формализованные соотношения для построения программного движения КА. Определены тип траектории и ключевые свойства оптимального движения. Доказано, что в процессе всего разворота отношение кинетической энергии вращения к квадрату модуля кинетического момента КА есть величина постоянная. Так как управляющий момент ограничен, требуемый поворотный маневр осуществим не для любого времени Т окончания разворота.

Показано, что на всем интервале переориентации КА совершает вращение по траектории “свободного движения”. Момент сил действует вдоль прямой, неподвижной в инерциальной системе координат. В общем случае оптимальным является релейное управление с двумя точками переключения, при котором весь разворот делится на раскрутку с максимально возможным управляющим моментом, вращение по инерции и торможение с максимально возможным управляющим моментом, противоположно направленным кинетическому моменту КА. Модуль управляющего момента при разгоне и торможении не меняется. Длительности участков разгона и торможения одинаковы (так как начальная и конечная скорости равны нулю) и зависят от заданного времени Т, мощности исполнительных органов u0, взаимной ориентации начального и конечного положений КА и его моментов инерции. В случае неограниченного управления (когда u0 → ∞) времена разгона и торможения бесконечно малы, и практически на всем интервале движения КА вращается с постоянным относительно инерциальной системы координат кинетическим моментом. Другим предельным случаем является управление с одной точкой переключения, при котором участок неуправляемого движения отсутствует (длительность разгона и торможения максимальна и составляет половину заданного времени разворота). Задача оптимального управления разворотом решается до конца; даны выражения для расчета ключевых характеристик маневра переориентации. В статье описывается процедура реализации оптимального режима управления переориентацией КА. Момент начала торможения определяется по фактическим параметрам движения (кватерниону рассогласования и кинетическому моменту), исходя из принципов терминального управления (используются информация об угловом положении и измерения угловой скорости). Структура построенного управления сравнительно проста, и оно легко может быть реализовано существующими бортовыми системами управления движением КА. Определены условия осуществимости разворота для заданного времени Т, исходя из начального и конечного положений и инерционных характеристик КА. Также дается описание конструктивной схемы решения краевой задачи принципа максимума для произвольных условий разворота и моментов инерции КА.

Выбранный функционал качества обеспечивает вращение КА с минимальной кинетической энергией во время разворота за заданное время. Вопросы экономичности остаются актуальными и сегодня. Развороты КА с минимальной кинетической энергией вращения выгодны и с энергетической точки зрения (так как минимизируют затраты энергии на разворот), и с точки зрения безопасности космических полетов, поскольку минимум кинетической энергии вращения позволяет максимально быстро остановить вращение КА в случае необходимости прервать маневр разворота (по разным причинам). Еще одним достоинством предложенного оптимального управления является максимально широкий диапазон значений длительности разворота T, при которых маневр переориентации можно осуществить в условиях ограничения (1.3). Для динамически-симметричного КА представлено законченное решение задачи переориентации в замкнутой форме и записана система уравнений (в аналитическом виде), из которой непосредственно находится решение краевой задачи принципа максимума и вычисляются необходимые константы закона управления; при этом оптимальные значения параметров закона управления могут быть определены устройством [21]. Приводятся данные математического моделирования, иллюстрирующие характер движения КА во время оптимального разворота.

Полученное решение, оптимальное по критерию (1.6), отличается от результатов работы [19], в которой исследуется кинематическая задача оптимального разворота без каких-либо ограничений на управление. В данной работе решена более сложная динамическая задача оптимального управления. Хотя в задаче [19] оптимизируемый функционал – интеграл от квадратичной формы угловых скоростей, но он минимизирует модуль кинетического момента, в то время как в предлагаемой задаче минимизируется максимальная кинетическая энергия во время разворота. В отличие от решения [19], где момент M и кинетический момент L перпендикулярны во время разворота, при управлении (2.11), (2.12) момент M и кинетический момент L параллельны. Оптимальное по критерию (1.6) управление отличается и от другого известного решения [17], в котором оптимальным является непрерывное управление, а в нашей задаче оптимально релейное управление (с одной точкой переключения или с двумя точками переключения в зависимости от наличия или отсутствия особого режима управления). В оптимальном решении, приведенном в работе [17], отсутствуют участки с постоянным модулем управляющего момента. В обеих задачах [17, 19] отсутствуют ограничения на управляющие переменные. Для них характерным является некритичность к длительности разворота Т [17, 19]. В этих задачах оптимального управления разворот можно выполнить при любом времени Т, в то время как в предлагаемой задаче оптимального управления существует некоторый диапазон времен Т, при которых разворот невозможен. Различие в форме минимизируемого функционала определило уникальность свойств оптимального по критерию (1.6) управления.

ПРИЛОЖЕНИЕ

Если КА разворачивается с минимальным значением интеграла (1.6), то можно остановить вращение КА за минимально возможное время (при ограничении (1.3)), так как одновременно с функционалом (1.6) минимизируется максимальная кинетическая энергия вращения.

Покажем, что оптимизация в соответствии с критерием (1.6) минимизирует кинетическую энергию вращения при развороте КА из положения Λ(0) = Λн в положение Λ(Т) = Λк за фиксированное время T. Обозначим

${{E}_{{\max }}} = \mathop {\max }\limits_{0 \leqslant t \leqslant T} E(t),$
где E(t) – текущая кинетическая энергия вращения; Emax – максимальная кинетическая энергия вращения во время разворота. При одном и том же значении интеграла G минимальное значение Emax достигается, если интервал времени, когда E(t) = const = Emax, является максимально длительным, а интервалы времени, когда E(t) < Emax, максимально короткие. Управление (2.11) удовлетворяет обоим требованиям. При ограничении (1.3) оптимальным по быстродействию гашением кинетической энергии вращения является управление [22]
(П.1)
${{M}_{i}} = - \frac{{{{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}} }},$
при котором управляющий момент M и кинетический момент L имеют противоположные направления, |M| =const и ${\mathbf{\dot {M}}} = - {\mathbf{\omega }} \times {\mathbf{M}}$, что находится в рамках управления (2.11). В условиях ограничения (1.3) максимально быстрая раскрутка КА происходит при управлении [22]
(П.2)
${{M}_{i}} = \frac{{{{u}_{0}}{{J}_{i}}{{\omega }_{i}}}}{{\sqrt {{{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2}} }},$
при котором управляющий момент M и кинетический момент L параллельны, что также соответствует управлению (2.11). Если u0 → ∞, то время разгона и торможения τ → 0 и Emax = G/2T.

Скорость изменения кинетической энергии вращения равна $\dot {E}$ = ω1M1 + ω2M2 + ω3M3. Каким бы ни было управление M, в начальный и конечный моменты времени скорость изменения кинетической энергии вращения равна нулю, $\dot {E}(0) = \dot {E}(T) = 0$ (так как $\dot {E} = {\mathbf{\omega }} \cdot {\mathbf{M}}$, а по условиям разворота ω(0) = ω(T) = 0). При управлении (П.1) и (П.2) в каждый текущий момент времени t модуль $\left| {\dot {E}} \right|$ скорости изменения кинетической энергии вращения – максимально возможный при ограничении (1.3). При максимально быстрой раскрутке $\dot {E} = {{u}_{0}}\sqrt {2E} $ (моменты Mi находятся из (П.2)); из этого уравнения следуют зависимости $\ddot {E} = u_{0}^{2}$ и $E(t) = u_{0}^{2}{{t}^{2}}{\text{/}}2$ (так как E(0) = 0). При максимально быстром гашении имеющейся энергии $\dot {E} = - {{u}_{0}}\sqrt {2E} $ (так как Mi и ωi связаны равенствами (П.1)) и $E(t) = u_{0}^{2}{{(T - t)}^{2}}{\text{/}}2$, поскольку $\ddot {E} = u_{0}^{2}$, E(T) = 0. Кинетическая энергия вращения E не может быть больше $u_{0}^{2}{{T}^{2}}{\text{/}}8$, поскольку время остановки вращения не должно превышать T/2. Для оптимального управления значение интеграла (1.6) равно

$G = 2{{E}_{{\max }}}(T - 4\tau {\text{/}}3) = 2{{E}_{{\max }}}(T - {{4\sqrt {2{{E}_{{\max }}}} } \mathord{\left/ {\vphantom {{4\sqrt {2{{E}_{{\max }}}} } {3{{u}_{0}})}}} \right. \kern-0em} {3{{u}_{0}})}},$
где τ – минимальное время, за которое кинетическая энергия вращения E изменяется с Emax до 0 или с 0 до Emax. Правая часть последнего равенства – монотонно возрастающая функция аргумента Emax на всем отрезке [0,$u_{0}^{2}{{T}^{2}}{\text{/}}8$], поэтому Emax – монотонно возрастающая функция аргумента G. Отсюда получили закономерность: чем меньше значение функционала (1.6), тем меньше максимальная кинетическая энергия вращения во время разворота КА.

Каким бы не было управление, в начале разворота (когда tT/2) $E(t) \leqslant u_{0}^{2}{{t}^{2}}{\text{/}}2$ в силу ограничения (1.3), а в конце разворота (когда tT/2) $E(t) \leqslant u_{0}^{2}{{(T - t)}^{2}}{\text{/}}2$ по той же причине. Поэтому для любого управления, удовлетворяющего условию (1.3), выполняется неравенство

(П.3)
$\int\limits_0^T {({{J}_{1}}\omega _{1}^{2} + {{J}_{2}}\omega _{2}^{2} + {{J}_{3}}\omega _{3}^{2})dt} \leqslant 2{{E}_{{\max }}}(T - {{4\sqrt {2{{E}_{{\max }}}} } \mathord{\left/ {\vphantom {{4\sqrt {2{{E}_{{\max }}}} } {3{{u}_{0}})}}} \right. \kern-0em} {3{{u}_{0}})}}.$

Из (П.3) видно, что если левая часть неравенства (П.3) превышает значение функционала (1.6), соответствующее оптимальному управлению (2.11), то правая часть (П.3) должна быть заведомо больше, чем Gopt, где Gopt – значение интеграла (1.6) при оптимальном управлении (2.11). Для любого управления, отличного от (2.11), значение интеграла (1.6) больше Gopt, а значит, и Emax > Eopt, где Eopt – значение максимальной кинетической энергии вращения во время разворота при оптимальном управлении (2.11).

Таким образом доказано, что минимизация интеграла (1.6) приводит к вращению КА с минимально возможной кинетической энергией вращения, что важно в практике космических полетов. Из сделанного заключения вытекают сопутствующие положительные свойства предложенного оптимального управления (2.11). Рассмотрим их подробнее.

Для остановки вращения КА при наличии ограничения (1.3) необходимо время не меньше Δt = ${{\sqrt {2E(t)} } \mathord{\left/ {\vphantom {{\sqrt {2E(t)} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$. Так как во время космического полета прекратить вращение КА может потребоваться в любой момент времени, то надо ориентироваться на величину ${{t}_{{{\text{о с т }}}}} = {{\sqrt {2{{E}_{{\max }}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{\max }}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$. Поэтому крайне полезно найти способ разворота КА из известного начального углового положения Λн в заданное конечное угловое положение Λк за заданное время T с минимальной кинетической энергией вращения Emax. Как было показано выше, решение задачи (1.1)–(1.6) позволило синтезировать управление, обеспечивающее разворот КА за фиксированное время T с минимальной кинетической энергией вращения. В случае необходимости (например, при возникновении нештатной ситуации, требующей прекратить маневр, или в других экстренных случаях) мы сможем максимально быстро остановить вращение КА, поскольку одновременно с функционалом (1.6) оптимальное управление (2.11) минимизирует максимальную кинетическую энергию вращения Emax во время разворота за фиксированное время T.

В предельном случае, когда по условиям разворота ${{K}_{{\text{c}}}}{{t}_{{{\text{п р }}}}}$ = T2u0/4C, без минимизации интеграла (1.6) разворот КА с моментами инерции J1, J2, J3 из положения Λн в положение Λк за время T будет невозможен (при наличии ограничения (1.3) с известным значением u0), так как если значение G больше минимально возможного, то максимальная кинетическая энергия вращения будет больше величины Emax, соответствующей оптимальному управлению (2.11), и длительность разгона и торможения окажется больше T/2, а, значит, завершить маневр в назначенное время T не удастся (физический смысл величин Kc, tпр и C раскрыт в разд. 2). Чтобы уложиться в заданное время T, максимальная кинетическая энергия вращения Emax должна быть не больше $u_{0}^{2}{{T}^{2}}{\text{/}}8$, а для этого значение интеграла (1.6) не должно превышать $u_{0}^{2}{{T}^{3}}{\text{/}}12$.

Получили еще одно полезное свойство оптимального управления с минимальным значением интеграла (1.6): оптимальное в смысле минимума функционала (1.6) управление расширяет диапазон допустимых значений времени разворота T, при котором разворот КА с моментами инерции J1, J2, J3 из положения Λн в положение Λк в условиях ограничения (1.3) может быть осуществим. Это очень ценное качество оптимального управления (2.11), (2.12).

Убедились, что минимизация функционала (1.6) делает пространственный разворот КА весьма привлекательным во многих смыслах, актуальных для практики космических полетов.

Список литературы

  1. Бpанец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М.: Наука, 1973. С. 320.

  2. Алексеев К.Б., Бебенин Г.Г. Управление космическими летательными аппаратами. М.: Машиностроение, 1974.

  3. Зубов Н.Е. Оптимальное управление терминальной переориентацией КА на основе алгоритма с прогнозирующей моделью // Космич. исслед. 1991. Т. 29. Вып. 3. С. 340–351.

  4. Ваньков А.И. Адаптивное робастное управление угловым движением КА с использованием прогнозирующих моделей // Космич. исслед. 1994. Т. 32. Вып. 4–5. С. 13–21.

  5. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Синтез алгоритмов переориентации космического аппарата на основе концепции обратной задачи динамики // Изв. РАН. ТиСУ. 2003. № 5. С. 156–163.

  6. Молоденков A.В., Сапунков Я.Г. Особый режим управления в задаче оптимального разворота сферически-симметричного космического аппарата // Изв. РАН. ТиСУ. 2009. № 6. С. 47–54.

  7. Levskii M. V. About Method For Solving the Optimal Control Problems of Spacecraft Spatial Orientation // Problems of Nonlinear Analysis in Engineering Systems. 2015. V. 21. № 2. P. 61–75.

  8. Раушенбах Б.В., Токарь Е.Н. Управление ориентацией космических аппаратов. М.: Наука, 1974.

  9. Liu S., Singh T. Fuel/time Optimal Control of Spacecraft Maneuvers // Guidance. 1996. V. 20. № 2. P. 394–397.

  10. Scrivener S., Thompson R. Survey of Time-optimal Attitude Maneuvers // Guidance. Control and Dynamics. 1994. V. 17. № 2. P. 225–233.

  11. Shen H., Tsiotras P. Time-optimal Control of Axi-symmetric Rigid Spacecraft with Two Controls // AIAA Guidance, Control and Dynamics. 1999. V. 22. № 5. P. 682–694.

  12. Молоденков A.В., Сапунков Я.Г. Решение задачи оптимального разворота осесимметричного космического аппарата с ограниченным и импульсным управлением при произвольных граничных условиях // Изв. РАН. ТиСУ. 2007. № 2. С. 90–105.

  13. Бранец В.Н., Черток М.Б., Казначеев Ю.В. Оптимальный разворот твердого тела с одной осью симметрии // Космич. исслед. 1984. Т. 22. Вып. 3. С. 352–360.

  14. Левский М.В. Использование универсальных переменных в задачах оптимального управления ориентацией космических аппаратов // Мехатроника, автоматизация, управление. 2014. № 1. С. 53–59.

  15. Левский М.В. Синтез оптимального управления терминальной ориентацией космического аппарата с использованием метода кватернионов // Изв. РАН. МТТ. 2009. № 2. С. 7–24.

  16. Левский М.В. Система управления пространственным разворотом космического аппарата. Патент на изобретение РФ № 2006431 // Бюллетень “Изобретения. Заявки и патенты”. 1994. № 2. Опубликован 20.01.1994.

  17. Левский М.В. Квадратично оптимальное управление переориентацией космического аппарата за фиксированное время в динамической постановке // Изв. РАН. ТиСУ. 2018. № 1. С. 133–149.

  18. Левский М.В. Применение принципа максимума Л.С. Понтрягина к задачам оптимального управления ориентацией космического аппарата // Изв. РАН. ТиСУ. 2008. № 6. С. 144–157.

  19. Левский М.В. Об одном случае оптимального управления пространственной ориентацией космического аппарата // Изв. РАН. ТиСУ. 2012. № 4. С. 115–130.

  20. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В. и др. Математическая теория оптимальных процессов. М.: Наука, 1983.

  21. Левский М.В. Устройство формирования параметров регулярной прецессии твердого тела. Патент на изобретение РФ № 2146638 // Бюллетень “Изобретения. Заявки и патенты”. 2000. № 8. Опубликован 20.03.2000.

  22. Левский М.В. К вопросу оптимального успокоения космического аппарата // Изв. РАН. ТиСУ. 2011. № 1. С. 147–161.

Дополнительные материалы отсутствуют.