Известия РАН. Теория и системы управления, 2019, № 6, стр. 139-162

СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ОРИЕНТАЦИЕЙ КОСМИЧЕСКОГО АППАРАТА С ИСПОЛЬЗОВАНИЕМ КОМБИНИРОВАННОГО КРИТЕРИЯ КАЧЕСТВА

М. В. Левский *

Научно-исследовательский институт космических систем им. А.А. Максимова – филиал Государственного космического научно-производственного центра им. М.В. Хруничева
Королев, Россия

* E-mail: levskii1966@mail.ru

Поступила в редакцию 16.11.2018
После доработки 27.02.2019
Принята к публикации 25.03.2019

Полный текст (PDF)

Аннотация

Рассмотрена и решена динамическая задача разворота космического аппарата из произвольного начального углового положения в требуемое конечное угловое положение. Исследуется случай, когда управление ограничено, а минимизируемый функционал объединяет в заданной пропорции время маневра и интеграл энергии вращения. Построение оптимального управления основано на кватернионном дифференциальном уравнении, связывающем вектор кинетического момента космического аппарата с кватернионом ориентации связанной системы координат. Сформулирован закон управления в виде явной зависимости управляющих переменных от фазовых координат. Проведен анализ особого режима управления космическим аппаратом. На основе условий трансверсальности как необходимых условий оптимальности определено оптимальное значение кинетической энергии вращения при движении в особом режиме управления. Созданные алгоритмы управления позволяют совершать развороты с кинетической энергией вращения, не превышающей заданного уровня. Для динамически симметричного космического аппарата задача пространственной переориентации решается до конца. Приводятся результаты математического моделирования движения космического аппарата при оптимальном управлении, демонстрирующие практическую реализуемость разработанного алгоритма управления пространственной ориентацией космического аппарата.

Введение. Решается задача приведения космического аппарата (КА) в положение заданной ориентации оптимальным образом. Способ решения и формализация описания кинематики вращательного движения КА основаны на методе кватернионов [1]. Главное отличие предлагаемого решения заключается в использовании нового функционала качества. В отличие от предыдущих работ [25], где оптимальное решение строится на фиксированном интервале управления, в предложенной задаче оптимального разворота КА время маневра не фиксировано. Кроме того, задача оптимального управления сформулирована в динамической постановке, когда силовой момент ограничен.

Многие авторы исследовали оптимальные решения в задачах управления угловым положением твердого тела [122]. Большинство решений соответствуют вращению вокруг неподвижной оси [1, 610]. И хотя принципы оптимизации и алгоритмы управления различны (в том числе, используя прогнозирующие модели [7] или метод обратной задачи динамики [8]), результирующее управление приводит к развороту вокруг оси Эйлера. В то же время разворот в плоскости наименьшего угла разворота во многих практических случаях далек от оптимального, как бы точно он не исполнялся. Наиболее детально задача оптимального управления угловым движением КА изучена лишь в случае плоских вращений КА вокруг одной из главных центральных осей инерции [11] и пространственного вращения сферически-симметричного тела [1, 12]. Для КА с произвольным распределением масс при произвольных граничных условиях по угловому положению КА аналитическое решение задачи пространственного разворота не найдено; известно лишь несколько особых случаев решения задачи разворота (в частности, [1, 13]). Существуют некоторые решения для осесимметричных КА [1416]. Например, в [15] дано численное решение задачи оптимального разворота динамически симметричного КА, где авторы решали краевую задачу принципа максимума путем замены переменных и сведением ее к краевой задаче разворота сферически-симметричного тела.

Нахождение аналитического решения задачи оптимального разворота в замкнутой форме имеет большой практический интерес, так как позволяет применять на борту КА готовые законы программного управления и изменения оптимальной траектории движения [13, 17]. Большее количество предыдущих работ посвящено кинематической задаче разворота [24, 18] либо оптимальному вращению с неограниченным управлением [5]. В них в отличие от предлагаемого решения для оптимизации использовались критерий максимального быстродействия [18], функционал “пути” [2], интеграл от кинетической энергии вращения [3], интеграл от квадратичной свертки по силовым моментам [5] или минимизировался модуль кинетического момента на заданном отрезке времени [4]. Ниже исследуется задача управления угловым движением КА, когда силовой момент ограничен, фазовыми переменными являются вектор кинетического момента КА (как твердого тела) и кватернион ориентации связанной системы координат относительно инерциального базиса, а для оптимизации программы управления используется новый функционал качества, который объединяет в заданной пропорции энергетические затраты на переориентацию КА и время разворота (фактор времени позволяет ограничить длительность маневра). Используя необходимые условия оптимальности в форме принципа максимума Л.С. Понтрягина и метод кватернионов для решения задач управления движением КА, получено аналитическое решение поставленной задачи. Представлены формализованные уравнения и даны расчетные выражения для синтеза оптимальной программы управления. В отличие от известного решения [5], где оптимизировано неограниченное управление на фиксированном интервале времени, в рассмотренной задаче управляющий момент ограничен, а минимизируемый функционал включает фазовые переменные (компоненты кинетического момента), а не управляющие функции. Вопросы экономичности управления движением КА актуальны и сегодня, поэтому решаемая в статье задача разворота с ограниченным управлением является практически важной. Найденное решение гарантирует движение КА с кинетической энергией вращения, не превышающей заранее установленного уровня, что крайне важно для практики космических полетов. Для динамически симметричного КА задача пространственной переориентации решена до конца – получены зависимости как явные функции времени для оптимального закона изменения вектора кинетического момента и соотношения для расчета ключевых параметров закона управления поворотным маневром.

1. Уравнения углового движения и постановка задачи управления. Динамика углового движения КА как твердого тела описывается динамическими уравнениями [23]:

(1.1)
${{\dot {L}}_{1}} + \left( {1{\text{/}}{{J}_{2}} - 1{\text{/}}{{J}_{3}}} \right){{L}_{2}}{{L}_{3}} = {{M}_{1}},\quad {{\dot {L}}_{2}} + \left( {1{\text{/}}{{J}_{3}} - 1{\text{/}}{{J}_{1}}} \right){{L}_{1}}{{L}_{3}} = {{M}_{2}},\quad {{\dot {L}}_{3}} + \left( {1{\text{/}}{{J}_{1}} - 1{\text{/}}{{J}_{2}}} \right){{L}_{1}}{{L}_{2}} = {{M}_{3}},$
где Ji, $i = \overline {1,3} $, – главные центральные моменты инерции аппарата, Мi – проекции главного момента М сил на главные центральные оси эллипсоида инерции аппарата, Li – проекции вектора L кинетического момента КА на оси связанного базиса E, образованного главными центральными осями эллипсоида инерции аппарата.

Для описания пространственного движения КА используем математический аппарат кватернионов (параметров Родрига–Гамильтона). Движение связанного базиса Е относительно опорного базиса I будем задавать кватернионом Λ [1]. Для определенности базис I считается инерциальным. В этом случае справедливы следующие кинематические уравнения [1]:

(1.2)
$\begin{gathered} 2{{{\dot {\lambda }}}_{0}} = - {{\lambda }_{1}}{{L}_{1}}{\text{/}}{{J}_{1}} - {{\lambda }_{2}}{{L}_{2}}{\text{/}}{{J}_{2}} - {{\lambda }_{3}}{{L}_{3}}{\text{/}}{{J}_{3}},\quad 2{{{\dot {\lambda }}}_{1}} = {{\lambda }_{0}}{{L}_{1}}{\text{/}}{{J}_{1}} + {{\lambda }_{2}}{{L}_{3}}{\text{/}}{{J}_{3}} - {{\lambda }_{3}}{{L}_{2}}{\text{/}}{{J}_{2}}, \\ 2{{{\dot {\lambda }}}_{2}} = {{\lambda }_{0}}{{L}_{2}}{\text{/}}{{J}_{2}} + {{\lambda }_{3}}{{L}_{1}}{\text{/}}{{J}_{1}} - {{\lambda }_{1}}{{L}_{3}}{\text{/}}{{J}_{3}},\quad 2{{{\dot {\lambda }}}_{3}} = {{\lambda }_{0}}{{L}_{3}}{\text{/}}{{J}_{3}} + {{\lambda }_{1}}{{L}_{2}}{\text{/}}{{J}_{2}} - {{\lambda }_{2}}{{L}_{1}}{\text{/}}{{J}_{1}}, \\ \end{gathered} $
где λj, $j = \overline {0,3} $, – компоненты кватерниона Λ (λ0 = sqalΛ – скалярная часть кватерниона Λ; vectΛ = λ1e1 + λ2e2 + λ3e3 – векторная часть кватерниона Λ; e1, e2, e3 – орты осей связанного базиса E), причем кватернион Λ, задающий текущую ориентацию КА, для удобства принят нормированным ||Λ|| = $\lambda _{0}^{2} + \lambda _{1}^{2} + \lambda _{2}^{2} + \lambda _{3}^{2} = 1$ [1].

Управление движением КА относительно центра масс осуществляется путем изменения момента сил М. В условиях космического полета особенность управления заключается в малости возмущающих моментов, обусловленных взаимодействием КА с внешними полями и сопротивлением среды. Как правило, суммарный импульс от возмущающих моментов пренебрежимо мал по сравнению с управляющим импульсом. В этом случае силовой момент М определяется главным образом управляющим моментом, создаваемым системой исполнительных органов, а переменные Мi, стоящие в правых частях уравнений (1.1), есть управления. Предположим, что область допустимых значений вектора М описывается неравенством

(1.3)
$\frac{{M_{1}^{2}}}{{{{J}_{1}}}} + \frac{{M_{2}^{2}}}{{{{J}_{2}}}} + \frac{{M_{3}^{2}}}{{{{J}_{3}}}} \leqslant u_{0}^{2},$
где u0 > 0 – некоторая положительная величина, характеризующая мощность исполнительных органов КА. Практическое значение имеют задачи, в которых начальная и конечная угловые скорости равны нулю относительно опорного базиса (такие условия разворота КА наиболее характерны). Так как опорный базис I не вращается (он фиксированный), то граничные условия маневра пространственного разворота КА задаются равенствами:
(1.4)
$\Lambda \left( 0 \right) = {{\Lambda }_{н}},\quad {\mathbf{L}}\left( 0 \right) = 0,$
(1.5)
$\Lambda \left( Т \right) = {{\Lambda }_{к}},\quad {\mathbf{L}}\left( T \right) = 0,$
где Т – время окончания процесса переориентации. Кватернионы Λн и Λк, определяющие ориентацию связанных с КА осей в начальный и конечный моменты времени, имеют произвольные наперед заданные значения, удовлетворяющие условию ||Λн|| = ||Λк|| = 1 (предполагается, что Λк ≠ ±Λн). Эффективность управления будем оценивать интегральной величиной
(1.6)
$G = \int\limits_0^T {({{a}_{1}}(L_{1}^{2}{\text{/}}{{J}_{1}} + L_{2}^{2}{\text{/}}{{J}_{2}} + L_{3}^{2}{\text{/}}{{J}_{3}}) + {{a}_{2}})dt} ,$
где а1 > 0, а2 > 0 – постоянные положительные коэффициенты. Задачу оптимального управления пространственной переориентацией сформулируем следующим образом: необходимо КА перевести из состояния (1.4) в состояние (1.5) в соответствии с уравнениями (1.1), (1.2) и ограничением (1.3) с минимальным значением функционала (1.6); при этом время разворота Т не фиксировано (оно также подлежит оптимизации и определяется одновременно со значением G). Решение М(t) ищется в классе кусочно-непрерывных функций.

Данная задача достаточно актуальна (в том числе для КА, оборудованных силовыми гироскопами – гиродинами или двигателями-маховиками [11]). Задачи оптимального управления ориентацией КА с использованием комбинированных критериев качества исследовались и другими авторами [12, 15]. Но в отличие от известных работ в данной статье задача оптимального управления разворотом решена применительно произвольного КА (т.е. когда для формы эллипсоида инерции КА ограничения отсутствуют) и выбранный критерий оптимальности гарантирует движение КА с кинетической энергией вращения, не превышающей требуемого значения. Фактор времени, присутствующий в критерии оптимальности (1.6), ограничивает длительность Т оптимального разворота некоторым конечным значением Тopt (коэффициент a2 ≠ 0).

2. Решение задачи оптимального управления разворотом. Сформулированная задача управления (1.1)–(1.6) – классическая динамическая задача оптимального разворота [1], в которой управляющими переменными являются моменты Мi, $i = \overline {1,\;3} $. Будем решать поставленную задачу, используя принцип максимума Л.С. Понтрягина [24]. Ограничение на фазовые переменные λj несущественно, так как оно выполняется при любых движениях КА относительно центра масс; $\lambda _{0}^{2} + \lambda _{1}^{2} + \lambda _{2}^{2} + \lambda _{3}^{2}$ = const в силу уравнений (1.2); мы полагали ||Λ(0)|| = ||Λн|| = 1, и поэтому ||Λ(t)|| = 1 в любой момент времени t ∈ [0, T]. Так как функционал качества не содержит позиционных координат λj, мы можем использовать универсальные переменные ri, $i = \overline {1,3} $ [19], заменяющие сопряженные переменные ψj, $j = \overline {0,\;3} $, соответствующие компонентам λj кватерниона Λ. Функции λj, ψj, ri связаны следующими соотношениями [19]:

${{r}_{1}} = ({{\lambda }_{0}}{{\psi }_{1}} + {{\lambda }_{3}}{{\psi }_{2}} - {{\lambda }_{1}}{{\psi }_{0}} - {{\lambda }_{2}}{{\psi }_{3}}){\text{/}}2;\quad {{r}_{2}} = ({{\lambda }_{0}}{{\psi }_{2}} + {{\lambda }_{1}}{{\psi }_{3}} - {{\lambda }_{2}}{{\psi }_{0}} - {{\lambda }_{3}}{{\psi }_{1}}){\text{/}}2;$${{r}_{3}} = ({{\lambda }_{0}}{{\psi }_{3}} + {{\lambda }_{2}}{{\psi }_{1}} - {{\lambda }_{3}}{{\psi }_{0}} - {{\lambda }_{1}}{{\psi }_{2}}){\text{/}}2.$

Оптимальные функции ri, как компоненты вектора r, удовлетворяют уравнениям [19]

(2.1)
${{\dot {r}}_{1}} = {{L}_{3}}{{r}_{2}}{\text{/}}{{J}_{3}} - {{L}_{2}}{{r}_{3}}{\text{/}}{{J}_{2}},\quad {{\dot {r}}_{2}} = {{L}_{1}}{{r}_{3}}{\text{/}}{{J}_{1}} - {{L}_{3}}{{r}_{1}}{\text{/}}{{J}_{3}},\quad {{\dot {r}}_{3}} = {{L}_{2}}{{r}_{1}}{\text{/}}{{J}_{2}} - {{L}_{1}}{{r}_{2}}{\text{/}}{{J}_{1}}.$

Пусть φi – сопряженные переменные, соответствующие переменным Li, $i = \overline {1,3} $. Тогда функция Гамильтона для задачи оптимального управления (1.1)–(1.6) равна [19]

$\begin{gathered} H = {{\varphi }_{{\text{1}}}}({{M}_{{\text{1}}}} + ({{J}_{{\text{2}}}} - {{J}_{{\text{3}}}}){{L}_{{\text{2}}}}{{L}_{{\text{3}}}}{\text{/}}{{J}_{{\text{2}}}}{{J}_{{\text{3}}}}) + {{\varphi }_{{\text{2}}}}({{M}_{{\text{2}}}} + ({{J}_{{\text{3}}}} - {{J}_{{\text{1}}}}){{L}_{{\text{1}}}}{{L}_{{\text{3}}}}{\text{/}}{{J}_{{\text{1}}}}{{J}_{{\text{3}}}}) + \\ + \;{{\varphi }_{{\text{3}}}}({{M}_{{\text{3}}}} + ({{J}_{{\text{1}}}} - {{J}_{{\text{2}}}}){{L}_{{\text{1}}}}{{L}_{{\text{2}}}}{\text{/}}{{J}_{{\text{1}}}}{{J}_{{\text{2}}}}) + {{L}_{1}}{{r}_{1}}{\text{/}}{{J}_{1}} + \\ + \;{{L}_{2}}{{r}_{2}}{\text{/}}{{J}_{2}} + {{L}_{3}}{{r}_{3}}{\text{/}}{{J}_{3}} - {{a}_{1}}(L_{1}^{2}{\text{/}}{{J}_{1}} + L_{2}^{2}{\text{/}}{{J}_{2}} + L_{3}^{2}{\text{/}}{{J}_{3}}) - {{a}_{2}}. \\ \end{gathered} $

Уравнения для сопряженных функций φi имеют вид [24]

${{\dot {\varphi }}_{i}} = - \frac{{\partial H}}{{\partial {{L}_{i}}}},\quad i = \overline {1,3} ,$
или в развернутой форме:

(2.2)
$\begin{gathered} {{{\dot {\varphi }}}_{1}} = 2{{a}_{1}}{{L}_{1}}{\text{/}}{{J}_{1}} - {{L}_{3}}{{\varphi }_{2}}(1{\text{/}}{{J}_{1}} - 1{\text{/}}{{J}_{3}}) - {{L}_{2}}{{\varphi }_{3}}(1{\text{/}}{{J}_{2}} - 1{\text{/}}{{J}_{1}}) - {{r}_{1}}{\text{/}}{{J}_{1}}, \\ {{{\dot {\varphi }}}_{2}} = 2{{a}_{1}}{{L}_{2}}{\text{/}}{{J}_{2}} - {{L}_{3}}{{\varphi }_{1}}(1{\text{/}}{{J}_{3}} - 1{\text{/}}{{J}_{2}}) - {{L}_{1}}{{\varphi }_{3}}(1{\text{/}}{{J}_{2}} - 1{\text{/}}{{J}_{1}}) - {{r}_{2}}{\text{/}}{{J}_{2}}, \\ {{{\dot {\varphi }}}_{3}} = 2{{a}_{1}}{{L}_{3}}{\text{/}}{{J}_{3}} - {{L}_{2}}{{\varphi }_{1}}(1{\text{/}}{{J}_{3}} - 1{\text{/}}{{J}_{2}}) - {{L}_{1}}{{\varphi }_{2}}(1{\text{/}}{{J}_{1}} - 1{\text{/}}{{J}_{3}}) - {{r}_{3}}{\text{/}}{{J}_{3}} \\ \end{gathered} $

Функция Гамильтона Н составлена без учета ограничения ||Λ|| = 1 для фазовых переменных в силу равенства ||Λ(0)|| = 1, о чем договорились выше. Вектор r неподвижен относительно инерциального базиса I, и |r| = const = r0 ≠ 0 (постоянство модуля |r| следует из свойств уравнений (2.1)). Решение r(t) системы (2.1) определяется начальным Λн и конечным Λк положениями КА. Оптимальная функция r(t) вычисляется через кватернион Λ(t) [1, 19]:

${\mathbf{r}} = \tilde {\Lambda } \circ {{{\mathbf{c}}}_{E}} \circ L,~\quad {\text{где}}\quad ~{{{\mathbf{c}}}_{E}} = {\text{const}} = {{\Lambda }_{{\text{н}}}} \circ ~{\mathbf{r}}(0) \circ {{\tilde {\Lambda }}_{{\text{н}}}}$
(составляющие вектора cE – проекции вектора r на оси инерциального базиса I). Символ “$ \circ $” – знак умножения кватернионов; $\tilde {\Lambda }$– кватернион, сопряженный кватерниону Λ [1, с. 11–20]. Здесь и далее операция кватернионного умножения на вектор понимается как умножение на кватернион с нулевой скалярной частью; в частности $\Lambda \circ {\mathbf{r}} = \Lambda \circ \Omega $, где Ω – кватернион, у которого sqalΩ = 0, vectΩ = r. Считается, что r(0) ≠ 0 (в противном случае r1 = r2 = r3 ≡ 0 и дальнейшее решение задачи теряет смысл). Направление вектора cE зависит от начального и конечного положений КА. Для того, чтобы КА имел требуемую ориентацию на правом конце Λ(T) = Λк, необходимо определить вектор cE (или значение вектора r в начальный момент времени) исходя из получающихся при этом решений системы (1.2).

2.1. Формализация условий оптимальности. В решаемой задаче время разворота не фиксировано, поэтому должно удовлетворяться следующее условие трансверсальности H = 0 [25] (так как гамильтониан Н не зависит явно от времени). Система уравнений (2.1), (2.2) совместно с требованием максимальности гамильтониана H и условиями r(0) ≠ 0, H = 0 являются необходимыми условиями оптимальности. Определим условия максимальности гамильтониана Н, который представим в форме

$Н = {{\varphi }_{1}}{{M}_{1}} + {{\varphi }_{2}}{{M}_{2}} + {{\varphi }_{3}}{{M}_{3}} + {{H}_{{{\text{inv}}}}},$
где Hinv не зависит явно от управляющих функций Mi, $i = \overline {1,3} $. Нетрудно видеть, что в случае φ ≠ 0 максимум функции Н для управлений Мi(t) при ограничении (1.3) достигается, если
(2.3)
${{M}_{i}} = \frac{{{{u}_{0}}{{J}_{i}}{{\varphi }_{i}}}}{{\sqrt {{{J}_{1}}\varphi _{1}^{2} + {{J}_{2}}\varphi _{2}^{2} + {{J}_{3}}\varphi _{3}^{2}} }},\quad i = \overline {1,3} $
(случай φ = 0, при котором гамильтониан не зависит явным образом от управления М, требует отдельного рассмотрения). Ниже покажем, что М = 0, если ${\mathbf{\dot {\varphi }}} = 0$φ = 0).

Оптимальное решение определяется замкнутой системой уравнений (1.1), (1.2), (2.1)–(2.3) с учетом требований (1.4), (1.5). Найдем характерные свойства оптимального движения, используя нормированный вектор р = r/|r|. Система уравнений (1.1), (2.1)–(2.3) имеет единственное решение (при условии L(0) = L(Т) = 0), в котором сопряженные переменные φi подчиняются зависимостям

(2.4)
${{\varphi }_{i}} = a(t){{p}_{i}}{\text{/}}{{J}_{i}},\quad i = \overline {1,3} ,$
при этом искомые функции Mi, Li в оптимальном решении удовлетворяют соотношениям
(2.5)
${{M}_{i}} = m(t){{p}_{i}},\quad {{L}_{i}} = b(t){{p}_{i}},\quad {{r}_{i}} = {{r}_{0}}{{p}_{i}}\quad {\text{для}}\,{\text{всех}}\quad i = \overline {1,3} {\text{\;}}\quad ({{r}_{0}} = {\text{const}} \ne 0,\,{\text{|}}{\mathbf{p}}{\text{|}} = {\text{ }}1),~$
где а(t), b(t), m(t) – скалярные функции времени (причем b(t) ≥ 0). Для функций pi имеем

(2.6)
${{\dot {p}}_{1}} = {{L}_{3}}{{p}_{2}}{\text{/}}{{J}_{3}} - {{L}_{2}}{{p}_{3}}{\text{/}}{{J}_{2}},\quad {{\dot {p}}_{2}} = {{L}_{1}}{{p}_{3}}{\text{/}}{{J}_{1}} - {{L}_{3}}{{p}_{1}}{\text{/}}{{J}_{3}},\quad {{\dot {p}}_{3}} = {{L}_{2}}{{p}_{1}}{\text{/}}{{J}_{2}} - {{L}_{1}}{{p}_{2}}{\text{/}}{{J}_{1}}.$

Значения p(0) и r0 таковы, чтобы в результате интегрирования уравнений (1.1), (1.2), (2.1)–(2.3) с начальными условиями Λ(0) = Λн для траектории движения Λ(t) выполнялось равенство Λ(Т) = Λк. Оптимальные функции а(t), b(t), m(t) связаны соотношениями

$\dot {a} = {\text{2}}{{a}_{{\text{1}}}}b(t) - {{r}_{0}};\quad ~b(t) = \int\limits_0^t {m(t)dt} ,\quad \ddot {a} = {\text{2}}{{a}_{{\text{1}}}}{{m}_{{\text{ }}}}(t);$
причем а(0) > 0, а(Т) < 0, $\dot {a}$(0) = $\dot {a}$(T) = –r0, b(0) = b(Т) = 0, m(0) = m0, m(Т) = –m0 (m0 > 0).

Для подтверждения истинности решения (2.4), (2.5) достаточно подставить его в уравнения (2.2) с учетом (2.6). Левая часть уравнений (2.2) такова: ${{\dot {\varphi }}_{i}} = (\dot {a}{{p}_{i}} + a{{\dot {p}}_{i}}){\text{/}}{{J}_{i}}$. Например,

${{\dot {\varphi }}_{1}} = (\dot {a}{{p}_{1}} + a{{\dot {p}}_{1}}){\text{/}}{{J}_{1}} = \dot {a}{{p}_{1}}{\text{/}}{{J}_{1}} + a({{L}_{3}}{{p}_{2}}{\text{/}}{{J}_{3}} - {{L}_{2}}{{p}_{3}}{\text{/}}{{J}_{2}}){\text{/}}{{J}_{1}} = \dot {a}{{p}_{1}}{\text{/}}{{J}_{1}} + ab(1/{{J}_{3}} - 1{\text{/}}{{J}_{2}}){{p}_{2}}{{p}_{3}}{\text{/}}{{J}_{1}}.$

Правая часть первого уравнения (2.2) равна

$\begin{gathered} 2{{a}_{1}}b{{p}_{1}}{\text{/}}{{J}_{1}} - ab(1{\text{/}}{{J}_{1}} - 1{\text{/}}{{J}_{3}}){{p}_{2}}{{p}_{3}}{\text{/}}{{J}_{2}} - ab(1{\text{/}}{{J}_{2}} - 1{\text{/}}{{J}_{1}}){{p}_{2}}{{p}_{3}}{\text{/}}{{J}_{3}} - {{r}_{0}}{{p}_{1}}{\text{/}}{{J}_{1}} = \\ = ab(1{\text{/}}{{J}_{3}} - 1{\text{/}}{{J}_{2}}){{p}_{2}}{{p}_{3}}{\text{/}}{{J}_{1}} + (2{{a}_{1}}b - {{r}_{0}}){{p}_{1}}{\text{/}}{{J}_{1}}. \\ \end{gathered} $

Приравняв правую и левую части (2.2), получим уравнение $\dot {a}$ = 2a1br0. Если функции а(t) и b(t) удовлетворяют указанному соотношению, то все три уравнения системы (2.2) превращаются в тождества (при условии выполнения равенств (2.4)–(2.6)). Решение (2.5) удовлетворяет системе (1.1), (2.6), если $\dot {b}$ = m(t).

Система уравнений (2.1)–(2.3) формализует необходимые условия оптимальности. Задача построения оптимальной программы управления свелась к решению системы уравнений углового движения КА (1.1), (1.2), сопряженных уравнений (2.2) и уравнений (2.1) при условии, что управляющие функции Mi вычисляются в соответствии с (2.3).

После подстановки зависимостей (2.4) в (2.3) находим оптимальное управление

${{M}_{i}} = \frac{{{{u}_{0}}{{p}_{i}}{\text{sign}}a(t)}}{{\sqrt {p_{1}^{2}{\text{/}}{{J}_{1}} + p_{2}^{2}{\text{/}}{{J}_{2}} + p_{3}^{2}{\text{/}}{{J}_{3}}} }},\quad i = \overline {1,3} .$

Особым режимом управления принято называть ситуацию, когда гамильтониан явным образом не зависит от управления. Из структуры функции Гамильтона H видно, что неопределенность в нахождении оптимального момента М наступает, если φ = 0, и (2.3) становится некорректной. Если а = const = 0, то b = r0/2a1, что после подстановки в (1.1) с учетом (2.5) дает М = 0. При оптимальном управлении в момент, когда $\dot {a}$ = 0, должно быть а = 0, иначе функция а(t) не меняет знак, из-за чего момент М имеет постоянное направление, а значит, нарушается условие L(T) = 0. Нетрудно показать, что если Li пропорциональны pi (т.е. Li = bpi), то

(2.7)
${{p_{1}^{2}} \mathord{\left/ {\vphantom {{p_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{2}^{2}} \mathord{\left/ {\vphantom {{p_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{3}^{2}} \mathord{\left/ {\vphantom {{p_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}} = {\text{const,}}$
поэтому |M| = const = m0 = u0/C при а ≠ 0, где $C = \sqrt {{{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} $, р0 = р(0) (если $\dot {a}$ = 0, то а = 0 и М = 0). Для подтверждения (2.7) достаточно продифференцировать по времени левую часть указанного равенства (интеграла движения для pi) и подставить в полученное выражение производные ${{\dot {p}}_{i}}$, вычисленные в соответствии с уравнениями (2.6) с учетом пропорциональности функций Li и pi.

Изучим более подробно свойства функций а(t), b (t). Легко видеть, что у оптимальных функций φ(0) ≠ 0 и а(0) > 0 (при этом а(Т) < 0), а производная $\dot {a}$(0) = $\dot {a}$(T) = –r0 (так как по условиям задачи разворота L(0) = 0, L(T) = 0, и поэтому b(0) = b (T) = 0). Из (1.1), (2.5) получаем $\dot {b}$ = Mp (знак умножения “” означает скалярное произведение векторов). Момент |M| = const ≠ 0, когда φ ≠ 0, а значит, и $\dot {b}$ = const. При оптимальном управлении b (t) – кусочно-линейная функция времени. Понятно, что когда а = 0, будет b = bmax, где ${{b}_{{\max }}} = \mathop {\max }\limits_{0 \leqslant t \leqslant T} b(t)$.

Определим, каким может быть в начальный момент времени значение φ(0) для оптимальной функции φ(t). Если предположить, что φ(0) = 0, то Ji φi = –rit при t → 0 (из (2.2) ${{\dot {\varphi }}_{i}}$ = –ri/Ji в момент t = 0). Тогда в начале разворота Mr < 0 и М = –μr, где μ > 0 (для убеждения в этом достаточно взять предел правых частей формул (2.3) для t → 0). Следовательно, Li = –μtri при t → 0. Видно, что полученные соотношения совпадают с (2.4), (2.5), в которых а(0) = 0 и b ≤ 0. Таким образом, для варианта φ(0) = 0 должно быть а (0) = 0, а $\dot {a}$ < 0 при любом t, и, значит, а(t) < 0 при t > 0. Но при таком сценарии точка переключения отсутствует (так как b ≤ 0 и $\dot {a}$ < 0), момент М действует в одном направлении, раскручивая КА до |L| → ∞. Очевидно, такой вариант управления не может быть оптимальным, поскольку не обеспечивает выполнение краевого условия L(T) = 0. Отсюда вывод: только φ(0) ≠ 0 является оптимальным.

Из краевых условий задачи управления (разворот КА из состояния покоя в состояние покоя) и необходимых условий оптимальности следуют такие соотношения: φ(0) ≠ 0; $\dot {a}$(0) = –r0 и $\dot {a}$(T) = –r0; а(0) > 0. Возможное поведение функции а(t) (в том числе в зависимости от значения |φ(0)|) приведено на рис. 1. Пунктирными линиями обозначены гипотетические варианты поведения функции a(t), которые однозначно не могут быть оптимальными, так как они не приемлемы с точки зрения удовлетворения краевому условию L(T) = 0 и равенству $\dot {a}$(T) = –r0 (кривая 1 соответствует случаю φ(0) = 0). Сплошные линии соответствуют двум типам оптимального управления – релейному управлению с одной точкой переключения в момент t = Т/2 (тонкие линии 2 и 3) и управлению с участком особого режима управления, соответствующего вращению КА по инерции, когда М = 0 (жирная линия 4, где t1, t2 – времена начала и окончания интервала, на котором φ = const = 0). Так как а(0) > 0, то а(Т) < 0 (в противном случае sign(M r) = const, sign(ML) = const и условие L(T) = 0 не сможет выполниться никогда). Для кривой 2 в момент времени t = Т/2 производная $\dot {\phi }$(T/2) ≠ 0; для кривой 3 в момент времени t = Т/2 производная ${\mathbf{\dot {\varphi }}}$(T/2) = 0. Функция a(t), соответствующая линии 3, – частный случай оптимального управления, у которого t1 = t2. Оптимальные функции Li(t), φi(t), pi(t) удовлетворяют равенствам (2.4), (2.5), в которых переменные pi (t) являются решением уравнений (2.6). Детальное изучение системы дифференциальных уравнений (2.2) для сопряженных переменных φi приводит к следующим выводам: вектор φ(0) ≠ 0; a(t) – непрерывная невозрастающая функция времени, у которой а(0) > 0; $\dot {a}$(0) = –r0 и $\dot {a}$(T) = –r0; а(T) < 0 и а(T) = –а(0).

Рис. 1

Очевидно, для функции а(t) существует момент времени t1, при котором а (t) = 0 (в противном случае функции φi не будут иметь точек переключения и КА будет раскручиваться бесконечно, следовательно, требование L(T) = 0 не выполнится). Вторая особенность: а(t) ≥ 0 для tТ/2 и а(t) ≤ 0, если tТ/2. В начале разворота (начиная с момента t = 0 до t = t1) будет b(t) = m0t, а значит, $\dot {a}$ = 2a1m0tr0 и функция а(t) = a1m0t2r0t + C1. В конце маневра (приближаясь к моменту времени t = T слева) будет b(t) = m0(Т – t), производная $\dot {a}$ = 2a1m0(Тt) – r0 и а(t) = (2a1m0Tr0)t – – a1m0t2 + C2, где С1 = const > 0, С2 = const. Значения констант C1, C2 определяются условием трансверсальности Н = 0.

Найдем Н(0) = φ1M1 + φ2M2 + φ3M3a2 = С1m0(${{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}$). Для выполнения условия трансверсальности H = 0 необходимо, чтобы С1 = а2/(u0С) (напомним, С = const = = $\sqrt {{{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} $). Момент достижения уровня а(t) = 0 происходит в точке t1 = = $({{r}_{0}} - \sqrt {r_{0}^{2} - 4{{a}_{1}}{{a}_{2}}{\text{/}}{{C}^{2}}} ){\text{/}}(2{{a}_{1}}{{m}_{0}})$. Поэтому b(t1) = m0t1 = $({{r}_{0}} - \sqrt {r_{0}^{2} - 4{{a}_{1}}{{a}_{2}}{\text{/}}{{C}^{2}}} ){\text{/}}2{{a}_{1}}$, а производная $\dot {a}$(t1) = $ - \sqrt {r_{0}^{2} - 4{{a}_{1}}{{a}_{2}}{\text{/}}{{C}^{2}}} $≤ 0. Значение t1 определяется из уравнения ${{a}_{1}}{{m}_{0}}t_{1}^{2}$r0t1 + а2/(u0С) = 0. Условие ${{r}_{0}} \geqslant 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$ – требование для константы r0.

Найдем Н(T) = φ1M1 + φ2M2 + φ3M3a2 = u0С(r0Ta1m0T  2C2) – a2 = 0 (так как Li(T) = 0 и а(T) = a1m0T 2r0T + C2 < 0). Отсюда С2 = T (r0a1m0T) – а2/(u0С). Для функции а(t) получили а(0) = а2/(u0С) и а(T) = –а2/(u0С) (оба значения не зависят от r0 и коэффициента a1).

2.2. Определение точек переключения. Важнейшей характеристикой является величина

(2.8)
$F = \int\limits_0^T {\left| {{\mathbf{L}}(t)} \right|dt} ,$
которая определяется из решения краевой задачи принципа максимума вместе со значением р0 (интеграл F зависит исключительно от значений Λн, Λк и моментов инерции J1, J2, J3).

Независимо от варианта оптимального управления Fm0T2/4. Если оптимальным является управление с двумя точками переключения t1 и t2(t1t2), то m0T2 > 4F. Если m0T2 = 4F, то реализуется предельный случай – управление с одной точкой переключения t = Т/2, при котором М ≠ 0 в течение всего разворота (|M| = m0). Интерес представляет наиболее общий случай оптимального разворота КА, когда имеет место особый режим управления на некотором конечном отрезке времени t1tt2. Так как на отрезке времени [t1, t2 ] будет φ(t ) = 0, то определить оптимальный управляющий момент М из условия максимальности гамильтониана Н невозможно (поскольку Н не зависит явным образом от управления М). Однако мы можем найти оптимальные управляющие функции Мi из решения уравнений движения (1.1) с учетом системы (2.2) и равенств φ(t) = 0, ${\mathbf{\dot {\varphi }}}$(t) = 0. После подстановки значений φi = 0 и ${{\dot {\varphi }}_{i}}$ = 0 в уравнения (2.2) получим равенства 2a1Li = ri  для всех  $i = \overline {1,\;3} $. Выразив из них составляющие Li и подставив их в систему (1.1) с учетом зависимостей (2.1) для производных ${{\dot {r}}_{i}}$, получим Мi = 0, а значит, на отрезке времени [t1, t2 ] оптимальным управлением является М = 0. Таким образом, на всем интервале управления [0, T ] оптимальный момент М определяется однозначно – по формулам (2.3), если φ ≠ 0; а если φ = 0, то М = 0. На оптимальных движениях вектор L кинетического момента имеет одинаковое направление с вектором r, который неподвижен относительно инерциального базиса I. Краевая задача принципа максимума заключается в определении значения вектора r (0), при котором решение системы дифференциальных уравнений (1.1), (1.2), (2.1), (2.2) с одновременным выполнением (2.3), если φ ≠ 0, или М = 0, если φ = 0, удовлетворяло условиям разворота (1.4), (1.5). Зависимости (2.4), (2.5) с учетом (2.6) есть единственное решение задачи оптимального управления (1.1)–(1.6). Принимая во внимание соотношение ω = $J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{L}}$, заключаем, что при оптимальном управлении угловая скорость ω и вектор φ параллельны (здесь JКА = diag ( J1, J2, J3 ) – тензор инерции КА).

Заметим, $\ddot {a}$ = $\dot {b}$ = m0signа(t), если а ≠ 0 (если а = const = 0, то $\ddot {a}$ = $\dot {b}$ = 0). Функции b(t), $\dot {a}$(t), а(t) – непрерывные функции времени. Поэтому в бесконечной близости слева и справа от точки t = t1 значение $\dot {a}$ одно и то же, причем $\dot {a}$ < 0 и а > 0 при t < t1. Учитывая непрерывность функций $\dot {a}$(t) и a(t), запишем условие невозможности особого режима управления ${{r}_{0}} > 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$ (при выполнении указанного неравенства $\dot {a}$(t1) ≠ 0, а значит, $\dot {a}$(t) ≠ 0 на всем интервале управления t ∈ [0, T]). В случае оптимального разворота с особым режимом управления при подходе к точке t = t1 слева φ ≠ 0 (при этом а > 0), и поэтому М = m0р и $\dot {b}$ = m0; справа от точки t = t1 имеем φ = 0 и $\dot {\phi } = $ 0, из-за чего b = const и М = 0, $\ddot {a} = 0$. В окрестности точки t = t2 слева φ = 0 и ${\mathbf{\dot {\varphi }}} = $ 0, а при t > t2 будет φ ≠ 0 и a(t) < 0, М = –m0р, $\dot {b}$ = –m0. Модуль кинетического момента между разгоном и торможением (в том числе в момент времени t = Т/2) равен Lnom = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$.

В общем случае оптимального управления функция а(t) отвечает свойствам: $\ddot {a}$ > 0, если t < t1; $\ddot {a} < 0,$ если tt2; $\ddot {a}$ = 0, если t1t < t2. Для функции b(t) имеем: $\dot {b}$ > 0, если t < t1; $\dot {b}$ < 0, если tt2; $\dot {b}$ = 0, если t1t < t2. Участок особого режима управления t ∈ [t1, t2] характеризуется тем, что а(t) = = const = 0, $\dot {a}$ = 0 и φ = 0, ${\mathbf{\dot {\varphi }}} = $ 0, из-за чего М = 0. Если t1 = t2, то особый режим управления отсутствует и М ≠ 0 на всем отрезке времени t ∈ [0, T]. Если ${{r}_{0}} > 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$, то t1 = Т/2 и $\dot {a}$(T/2) < 0; время оптимального разворота Тopt = Тfast, где Тfast – минимально возможное время разворота в условиях (1.3) (очевидно, Тfast = $2\sqrt {F{\text{/}}{{m}_{0}}} $). Если ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$, то $\dot {a}$(T/2) = 0 и возможен участок с особым режимом управления (когда М = 0). Подставим ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$ в выражение для расчета t1 и получим t1 = r0/2a1m0 = $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$. Если 2 t1 < Тfast, то возможен участок неуправляемого вращения с М = 0; если $2\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$Тfast, то особого режима управления не может быть, и М ≠ 0 на всем отрезке времени [0, Т ]. Равенство ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$ есть необходимое условие для наличия особого режима управления.

В случае наличия участка с особым режимом управления время t1 – момент выключения управления. Для tt1 оптимальной функцией а(t) является а (t) = a1m0t2r0t + а2/u0С = a0(t). Чтобы обеспечить выполнение требования L(T) = 0, необходимо в какой-то момент t2 включить управление (|M| = m0) для остановки вращения КА. Для t > t2 оптимальной функцией будет а(t) = = r0(Tt) – a1m0(Tt)2а2/u0С = aТ(t). Момент включения управления t = t2 (когда $\ddot {a} < 0$) наступает в момент выполнения равенства

$\int\limits_0^t {\left| {{\mathbf{L}}(t)} \right|dt} = F - \frac{{{{a}_{2}}}}{{2{{a}_{1}}{{u}_{0}}C}}.$

Если исходить из наличия особого режима управления во время оптимального разворота, то должны выполняться следующие уравнения:

${{t}_{1}} = \sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}},\quad {{t}_{2}}{{L}_{{nom}}} = F,\quad ~{{t}_{1}}{{ < }_{~}}{{t}_{2}},\quad {{t}_{1}} + {{t}_{2}} = Т,\quad {\text{где}}\quad {{L}_{{nom}}} = {{m}_{0}}{{t}_{1}} = \sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}C.$

Из этой системы уравнений получаем t2 = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $ = Timp. Из требования t1 < t2 находим условие существования особого режима управления: a2 < a1u0FC.

Константа r0 существенно зависит от типа управления (от наличия или отсутствия неуправляемого участка с М = 0, т.е. от числа точек переключения). Допустим, что ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$. Тогда в момент t = t1 (когда а (t) = 0) производная $\dot {a}$ = 0. Если при этом t1 = r0/2a1m0 = $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$< Тfast/2, то существует  некоторый  отрезок времени [t1, t2],  когда а (t) = const = 0 и  М = 0.  В этом случае  оптимальная  функция  а(t)  состоит  из трех участков:  если t < t1,  то а(t)  =  a1m0t2 – – $(2t\sqrt {{{a}_{1}}{{a}_{2}}} - {{a}_{2}}{\text{/}}{{u}_{0}}){\text{/}}С$; если t1t < t2, то а(t) = const = 0; если tt2, то а(t) = –a1m0(Тt )2 + + ($2\sqrt {{{a}_{1}}{{a}_{2}}} $(Тt ) – а2/u0)/С. С учетом известности интеграла (2.8) (значение F определяется значениями Λн, Λк, J1, J2, J3 ) приходим к следующему:

а) если $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} < {{u}_{0}}\sqrt {F{\text{/}}{{m}_{0}}} $, то оптимальным значением является ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$, так как только оно удовлетворяет уравнениям

$a({{t}_{{\text{1}}}}) = {{a}_{1}}{{m}_{0}}t_{1}^{2} - {{r}_{0}}{{t}_{{\text{1}}}} + {{а}_{2}}{\text{/}}{{u}_{0}}С = 0\quad ~{\text{и}}\quad ~\dot {a}\left( {{{t}_{{\text{1}}}}} \right) = {\text{2}}{{a}_{{\text{1}}}}{{m}_{0}}{{t}_{{\text{1}}}} - {{r}_{0}} = 0;$

б) если a2a1u0FC, то |M| = const > 0, особый режим управления отсутствует, у функции b(t) производная $\dot {b}$ ≠ 0, константа r0 должна удовлетворять условию ${{r}_{0}} \geqslant 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$, оптимальное значение r0 вычисляется из уравнений

$~{{a}_{1}}{{m}_{0}}t_{1}^{2} - {{r}_{0}}{{t}_{1}} + {{а}_{2}}{\text{/}}{{u}_{0}}С = {\text{ }}0~\quad {\text{и}}\quad {{t}_{1}} = \sqrt {F{\text{/}}{{m}_{0}}} ;\quad {\text{откуда}}\quad {{r}_{0}} = {{a}_{1}}\sqrt {{{m}_{0}}F} + {{a}_{2}}\sqrt {{{m}_{0}}{\text{/}}F} {\text{/}}{{u}_{0}}C.$

Найдем длительность оптимального разворота Тopt и величину G. Обозначим Ек = (${{L_{1}^{2}} \mathord{\left/ {\vphantom {{L_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}}$ + + ${{L_{2}^{2}} \mathord{\left/ {\vphantom {{L_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}}$ + ${{L_{3}^{2}} \mathord{\left/ {\vphantom {{L_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}$)/2. Если u0 → ∞, то интеграл (1.6) составит G = $2FC\sqrt {{{a}_{1}}{{a}_{2}}} $ = Gimp или G = $2S\sqrt {{{a}_{1}}{{a}_{2}}} $, где S – значение функционала “пути” [2] c коэффициентами ki = Ji. Если a2 < a1u0FC, то bmax = = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$ и Тopt = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $ + $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$ (так как t1 = $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$); максимальная энергия вращения Ек(T/2) = a2/2a1, поэтому Gopt = $2{{a}_{2}}(FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} + {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {3{{u}_{0}}}}} \right. \kern-0em} {3{{u}_{0}}}})$. Время t1 рассчитано из условия минимума функционала (1.6) с учетом соотношения t2m0t1 = F (минимум G по аргументу t1 ищется на отрезке t1 ∈ [0, Tfast/2]). Если a2a1u0FC, то Тopt = Тfast = $2\sqrt {F{\text{/}}{{m}_{0}}} $; значение bmax = $\sqrt {{{m}_{0}}F} $, максимальная энергия вращения Ек(T/2) = u0FC/2, поэтому G = 2(a1u0FC/3 + a2)$\sqrt {F{\text{/}}{{m}_{0}}} $. Поскольку для любого типа оптимального управления Ек(T/2) = $u_{0}^{2}t_{1}^{2}{\text{/}}2$, получаем t1 = ${{\sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } \mathord{\left/ {\vphantom {{\sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$.

Обозначим Lmax – максимальное значение модуля кинетического момента внутри интервала управления [0, T]; Lnom – модуль кинетического момента на участке с особым режимом управления (между разгоном и торможением); Limp, Timp – модуль кинетического момента и оптимальное время разворота при импульсном управлении (когда кинетический момент в моменты времени t = 0 и t = Т изменяется скачком с |L| = 0 до |L| = Lnom и с |L| = Lnom до |L| = 0 соответственно). Для оптимального разворота (независимо от наличия или отсутствия особого режима управления) t1t2, t1 + t2 = Т, t2Lmax = F, Lmax = m0t1, и поэтому всегда t1$\sqrt {F{\text{/}}{{m}_{0}}} $. Если участок с особым режимом управления имеет место, то t2 = Timp = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $, а Lmax = Lnom = Limp = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$; длительность торможения τ = t1, так как на этапах разгона и торможения |M| = m0 и ${\mathbf{M}}\,{\text{||}}\,{\mathbf{L}}$. Если a2 ≥ ≥ a1u0FC, то участок с особым режимом управления отсутствует и t2 = t1 = $\sqrt {F{\text{/}}{{m}_{0}}} $, Lmax = $\sqrt {{{m}_{0}}F} $. Независимо от u0 будет bmaxLimp, причем если u0uкр, то bmax = Limp и Тopt = Timp + Limp/m0, а если u0 < uкр, то bmax < Limp и Тopt = Тfast; критическим значением uкр является uкр = a2/(a1FC). Если u0 = uкр, то Тopt = 2Timp, G = ${{8FC\sqrt {{{a}_{1}}{{a}_{2}}} } \mathord{\left/ {\vphantom {{8FC\sqrt {{{a}_{1}}{{a}_{2}}} } 3}} \right. \kern-0em} 3}$, а относительный “проигрыш” в оптимальности (рост функционала (1.6)) составляет δG = G/Gimp – 1 = 1/3.

2.3. Доказательство единственности оптимального решения. Введем орт q для вектора JКАφ, такой, что q(0) ⋅ φ(0) > 0, и поэтому φ = χ$J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}$, где χ – скалярная функция c начальным значением χ(0) > 0 (|q| = 1). Тогда оптимальный момент М равен

${\mathbf{M}} = \frac{{{{u}_{0}}{\text{sign}}\chi }}{{\sqrt {{{q_{1}^{2}} \mathord{\left/ {\vphantom {{q_{1}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{q_{2}^{2}} \mathord{\left/ {\vphantom {{q_{2}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{q_{3}^{2}} \mathord{\left/ {\vphantom {{q_{3}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} }}{\mathbf{q}}.$

Так как χ(0) > 0, то в окрестности точки t = 0 имеем М = hq и М $||$ L, L = Kq, где h > 0, K – скалярные величины. Подставим формулы (2.3) с учетом зависимости φ = χ(t)$J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}$ в уравнения (1.1) при наличии равенств Li = Kqi. Получили соотношение

(2.9)
$\dot {K}{\mathbf{q}} + K{\mathbf{\dot {q}}} + (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}}{{K}^{2}} = h{\mathbf{q}}.$

Сумма $K{\mathbf{\dot {q}}} + (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}}{{K}^{2}}$ ортогональна орту q или равна нулю (всегда ${\mathbf{q}} \cdot {\mathbf{\dot {q}}}$ = 0, так как |q| = 1); символ × означает векторное произведение векторов. Уравнение (2.9) выполняется в единственном случае, если $\dot {K} = h$ и ${\mathbf{\dot {q}}} = - (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{L}}) \times {\mathbf{q}}$ (т.е. когда направление вектора JКАφ остается неизменным относительно инерциальной системы координат). Теперь подставим зависимости φi = χqi/Ji и Li = Kqi в уравнения (2.2). Представим систему (2.2) в таком виде

(2.10)
${{J}_{{{\text{КА}}}}}{\mathbf{\dot {\varphi }}} = {\text{2}}{{a}_{{\text{1}}}}{\mathbf{L}} + {\mathbf{L}} \times {\mathbf{\varphi }} + {{J}_{{КА}}}({\mathbf{\varphi }} \times (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{L}})) - {\mathbf{r}}.$

Левая часть уравнения (2.10) для вектора сопряженных переменных равна

$\dot {\chi }{\mathbf{q}} + \chi {\mathbf{\dot {q}}} = \dot {\chi }{\mathbf{q}} - \chi (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{L}}) \times {\mathbf{q}}$
(уравнения (1.1), (2.2) должны выполняться одновременно, поэтому свойство ${\mathbf{\dot {q}}} = - (J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{L}}) \times {\mathbf{q}}$ взято из (2.9)). Правая часть уравнения (2.10) будет следующей

$\begin{gathered} K{\mathbf{q}} \times (J_{{{\text{KA}}}}^{{ - 1}}\chi {\mathbf{q}})--{{J}_{{{\text{КА}}}}}(\chi (J_{{{\text{KA}}}}^{{ - 1}}{\mathbf{q}}) \times (J_{{{\text{KA}}}}^{{ - 1}}{\mathbf{q}})K) + 2{{a}_{1}}K{\mathbf{q}}--{\mathbf{r}} = \\ = 2{{a}_{1}}K{\mathbf{q}}--\chi K(J_{{{\text{KA}}}}^{{ - 1}}{\mathbf{q}}) \times {\mathbf{q}}--{{r}_{0}}{\mathbf{p}} = 2{{a}_{1}}K{\mathbf{q}}--\chi (J_{{{\text{KA}}}}^{{ - 1}}{\mathbf{L}}) \times {\mathbf{q}}--{{r}_{0}}{\mathbf{p}}. \\ \end{gathered} $

Приравнивая левую и правую части уравнения (2.10), получим уравнение для вектора q:

$\dot {\chi }{\mathbf{q}} = {\text{2}}{{a}_{{\text{1}}}}K{\mathbf{q}} - {{r}_{0}}{\mathbf{p}}.$

Отсюда следует необходимое условие оптимальности r0p = (2a1K$\dot {\chi }$)q, а из него неизбежны равенства (2.4), в которых а(0) > 0, $\dot {a}$(0) = –r0, причем 2a1K$\dot {\chi }$ = const и q = p; откуда получаем следующие свойства: $\dot {\chi }$ = 2a1Kr0, χ(t) = а(t), К = b(t), где r0 = const = |r(0)|. В моменты времени t = 0 и t = Т величина К = 0, из чего заключаем, что $\dot {\chi }$(0) = –r0 и $\dot {\chi }$(Т) = –r0.

На участке с особым режимом управления (если он имеет место быть) вектор φ = 0 (и ${\mathbf{\dot {\varphi }}} = $ 0, как было показано выше), в силу чего сопряженная система (2.2) преобразуется в уравнение 2a1L = r, что является частным случаем решения (2.4), (2.5), в котором а(t) = const = 0, b(t) = r0/2а1, m (t) = 0. Очевидно, что зависимости Li = ri/2а1 являются единственным решением системы уравнений (1.1), (2.1), (2.2), если φ = const = 0 и M = 0. Убедились, что независимо от наличия или отсутствия особого режима управления соотношения (2.4), (2.5) есть единственное решение задачи оптимального управления (1.1)–(1.6).

В случае φ(0) ≠ 0 вариант а(0) < 0 не рассматривается, так как в каждый момент времени $\dot {a}$ < 0, и тогда а(t) < 0 при любом t; а значит, точка переключения отсутствует и |M(t)| > 0, ML > 0, из-за чего требование L(Т) = 0 будет нарушено. Таким образом, для оптимальных функций φi необходимо, чтобы φi(0) ≠ 0 и направление векторов JКАφ(0) и r(0) было одинаковое.

Аналогичные рассуждения в отношении решения системы (2.2) и оптимальной функции φ(t), начиная с момента t = T в сторону уменьшения времени t, дают функцию а(t) для t > Т/2 и показывают справедливость решения (2.4), (2.5) для всего интервала управления 0 ≤ tT. Доказано, что при φ(0) ≠ 0 единственным решением системы уравнений (1.1), (2.1)–(2.3) являются функции, удовлетворяющие равенствам: Jiφi = χ(t)qi, ri = r0qi, Li = Kqi, $\dot {\chi }$ = 2a1Kr0.

В итоге пришли к следующему выводу: если в какой-либо момент времени t кинетический момент L и вектор JКАφ параллельны, то (JКАφ) × L = 0 на всем интервале управления 0 < t < T. А из-за наличия граничных условий L(0) = 0 и L(T) = 0 векторы JКАφ и L параллельны как минимум 2 раза – в самом начале разворота (L = JКАσtφ при t → 0) и в самом конце маневра (L = = –σ(Тt)JКАφ при tT), где σ – скалярная величина. Поэтому заключаем, что при оптимальном движении на всем отрезке времени t ∈ [ 0, T ] имеет место свойство ω $||$ φ. Отсюда становятся очевидны соотношения (2.4), (2.5). Поскольку φ(0) ≠ 0, то зависимости (2.4), (2.5) есть единственное решение системы уравнений (1.1), (2.1)–(2.3) с граничными условиями (1.4), (1.5). При нулевых граничных значениях кинетического момента L(0) = L(T) = 0 решение системы (1.1), (2.1)–(2.3) описывает движение, при котором кинетический момент КА L имеет постоянное направление в инерциальной системе координат. Чтобы удовлетворить системе (1.1), (2.1), (2.2) при условии JКАφ × М = 0, у функций φi, ri и Li должно быть: φ(0) ≠ 0, (JКАφ) × L = 0, (JКАφ) × r = 0 для любого t и φ1(0)r1(0) + φ2(0)r2(0) + φ3(0)r3(0) > 0 (это компактная форма записи равенств Jiφi = χ(t)qi и ri = r0qi, в которых χ(0) > 0 и r0 > 0). Только при таких условиях функции φi, ri и Li смогут стать оптимальными. Отсюда неизбежно следуют закономерности (2.4), (2.5), описывающие оптимальное движение, в которых а(0) > 0 и 0 ≤ b${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$. При этом если ${\mathbf{\dot {\varphi }}} = $ 0, то φ = 0.

Решаемая задача управления движением КА – это задача оптимального управления с закрепленными левым и правым концами траектории и нефиксированным временем окончания маневра. Выше было показано, что φ(0) ≠ 0 и φ(T) ≠ 0. Поскольку при любой программе оптимального разворота (независимо от наличия или отсутствия особого режима управления) константа r0 ≠ 0, то r(0) ≠ 0 и r(T) ≠ 0, а значит, хотя бы одно из значений ψ j(0) ≠ 0 и хотя бы одно из значений ψj(Т) ≠ 0. Следовательно, условия трансверсальности для оптимальных функций φi(t) и ri(t) (а значит, и ψ j(t)) выполняются; условие Н = 0 обеспечивается тем, что значения а(0) = = а2/(u0С), а(T) = –а2/(u0С).

2.4. Основные свойства оптимального разворота. При оптимальном управлении векторы М и JКАφ имеют одинаковое направление; r(t) и b(t) – непрерывные функции времени; производная $\dot {a}$ существует в каждый момент времени t ∈ [0, T], значит, а(t) – гладкая функция времени. При любом типе оптимального управления φ(T/2) = 0. В общем случае для функции a(t) как коэффициента пропорциональности для оптимальных функций φi справедливы следующие свойства:

$\begin{gathered} а(0) > 0\quad {\text{и}}\quad \dot {a}(0) = --{{r}_{0}};\quad а(T{\text{/}}2) = 0;\quad \dot {a}(t) \leqslant 0; \\ a(Т--t) = --a(t)\quad {\text{и}}\quad \dot {a}(Т--t) = \dot {a}(t);\quad {\text{если}}\quad \dot {a} = 0,\quad {\text{то}}\quad а = 0. \\ \end{gathered} $

Если а(t) ≠ 0, то $\dot {b} = {{m}_{0}}{\text{sign}}a(t)$; если а(t) = 0, то $\dot {b}$ = 0. Для а(t) и b(t) имеем sign $\ddot {a}$ = sign$\dot {b}$ = sign а (если а = 0, то последующее поведение функций а(t), b(t) определяет производная $\dot {a}$). Моменты выключения и включения управления определяет функция b(t), так как $\ddot {a}$ = 2$\dot {b}$ (если b = const, то $\ddot {a} = 0$ и для оптимальных функций φi коэффициент а = 0). По мере приближения к t = t1 функция a(t) стремится к нулю. В момент, когда $\dot {a}$ = 0, для дальнейшего сохранения условий а = 0, $\dot {a}$ = 0 (вплоть до t = t2) производная $\dot {b}$ переключается с m0 в нуль (управление выключается). Чтобы выйти из ситуации $\dot {a}$ = 0 и обеспечить требование $\dot {a}$(T) = –r0, в некоторый момент времени t = t2 производная $\dot {b}$ переключается с нуля до –m0. Если существует режим особого управления, то а(t) = a1m0(tt1)2 для tt1 и а(t) = –a1m0(tt2)2 для tt2 (а(t) = 0, если t1 < t < t2 ). Времена t1, t2 находятся  из  условия  трансверсальности  Н  = 0.  С учетом равенств а(0) = a1m0$t_{1}^{2}$ и а (T) = = –a1m0(Tt2)2 получаем

$Н\left( 0 \right) = {{\varphi }_{{\text{1}}}}{{M}_{{\text{1}}}} + {{\varphi }_{{\text{2}}}}{{M}_{{\text{2}}}} + {{\varphi }_{{\text{3}}}}{{M}_{{\text{3}}}} - {{a}_{{\text{2}}}} = {{a}_{{\text{1}}}}u_{0}^{2}t_{1}^{2} - {{a}_{{\text{2}}}} = 0,$
$Н\left( T \right) = {{\varphi }_{{\text{1}}}}{{M}_{{\text{1}}}} + {{\varphi }_{{\text{2}}}}{{M}_{{\text{2}}}} + {{\varphi }_{{\text{3}}}}{{M}_{{\text{3}}}} - {{a}_{{\text{2}}}} = {{a}_{{\text{1}}}}{{u}_{0}}^{{\text{2}}}{{\left( {T - {{t}_{{\text{2}}}}} \right)}^{{\text{2}}}} - {{a}_{{\text{2}}}} = 0,$
откуда t1 = $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$ и t2 = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $ (так как m0t1t2 = F); время оптимального разворота T = = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $ + $\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$. Если оптимальным является релейное управление с одной точкой переключения, то в момент t = Т/2 отключения управления не происходит, а $\dot {b}$ меняется одномоментно с $\dot {b}$ = m0 до $\dot {b}$ = –m0 (при таком варианте управления |$\dot {b}$| = const с t = 0 до t = T).

Длительность выключенного управления (когда $\dot {b}$ = 0 и $\dot {a}$ = 0) определяется исключительно параметром и0 (для конкретных значений Λн, Λк, J1, J2, J3 и коэффициентов а1, а2). Для оптимального движения $\dot {a}$ ≤ 0 и bLimp при любом t; Lmax = min(${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {C,}}} \right. \kern-0em} {C,}}$ $\sqrt {{{m}_{0}}F} $), максимальная энергия вращения Ек(T/2) = min(а2/2а1, u0FC/2). Использование функционала (1.6) ограничивает кинетическую энергию вращения во время разворота. Значение (1.6) равно

$G = {\text{ }}2{\text{min}}({{a}_{2}}(FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} + \sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}3{{u}_{0}}),({{a}_{1}}{{u}_{0}}FC{\text{/}}3{\text{ }} + {{a}_{2}})\sqrt {F{\text{/}}{{m}_{0}}} ).$

Интегральные затраты G – убывающая функция параметра u0, асимптотически приближающаяся к уровню Gmin = $2FC\sqrt {{{a}_{1}}{{a}_{2}}} $при u0 → ∞ (для u0 → 0 затраты G → ∞).

Из уравнений (2.5), (2.6) получим следующие уравнения для компонент рi вектора р:

(2.11)
${{\dot {p}}_{1}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{2}} - {{J}_{3}}}}{{{{J}_{2}}{{J}_{3}}}}{{p}_{2}}{{p}_{3}},\quad {{\dot {p}}_{2}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{3}} - {{J}_{1}}}}{{{{J}_{1}}{{J}_{3}}}}{{p}_{1}}{{p}_{3}},\quad {{\dot {p}}_{3}} = \left| {\mathbf{L}} \right|\frac{{{{J}_{1}} - {{J}_{2}}}}{{{{J}_{1}}{{J}_{2}}}}{{p}_{1}}{{p}_{2}}.$

Как было показано выше, b ≥ 0, и поэтому b = |L|. При разгоне b = m0t; при торможении b = = m0(Т – t). При оптимальном управлении b(t) – неотрицательная кусочно-линейная функция времени, не превышающая Limp = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$ и равная

$b(t) = \int\limits_0^t {m(t)dt} ,$
где

$m(t) = \left\{ \begin{gathered} {{m}_{0}}{\text{sign}}a(t),\quad {\text{если}}\quad a(t) \ne 0; \hfill \\ 0,\quad {\text{если}}\quad a(t) = 0. \hfill \\ \end{gathered} \right.$

В общем случае оптимальные функции m(t) и b(t) таковы:

$m(t) = 0.{\text{5}}{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{\text{1}}}} - t} \right) + {\text{sign}}\left( {{{t}_{{\text{2}}}} - t} \right)} \right],\quad b\left( t \right) = 0.{\text{5}}{{m}_{0}}({{t}_{{\text{1}}}} + {{t}_{{\text{2}}}} - \,{\text{|}}t - {{t}_{1}}{\text{|}} - \;{\text{|}}t - {{t}_{2}}{\text{|}}).$

Если r0 принимает минимально допустимое значение ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}C$ (оно совпадает с найденным для кинематической задачи разворота), то t1 = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$. Соответственно максимальный модуль кинетического момента составит Lmax = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$, а максимальная кинетическая энергия вращения равна Ек = а2/2а1 (значения Lmax, Ек совпадают с аналогичными характеристиками оптимального разворота в импульсной постановке). Отмечаем, что в случае наличия участка с особым управлением (когда a2 < a1u0FC и t1t2 ) максимальные энергия вращения Ек и модуль кинетического момента Lmax не зависят от параметра u0 и длительности разгона t1. В предельном случае, когда t1 → 0 (кинетический момент изменяется скачком), имеем T = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $, и в интервале времени 0 < t < T будет |L| = Limp =${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$.

Возможные варианты поведения функции b(t) показаны на рис. 2, где линия с отметками времен t1, t2 соответствует общему случаю управления, при котором $\ddot {a}$(T/2) = 0 и b(T/2) = Limp. Более тонкие линии соответствуют оптимальному изменению b(t) для различных значений параметра u0. Для b(t) с двумя точками излома $u_{0}^{{(3)}}$ > $u_{0}^{{(2)}}$ > $u_{0}^{{(1)}}$ > uкр; с увеличением параметра u0 длительность участка с особым режимом управления, когда М = 0, возрастает. Величина uкр – критическое значение u0, при котором точка переключения t1 = Timp. При u0 → ∞ значение b изменяется практически скачком с нуля до Limp в начале разворота и с Limp до нуля в конце разворота (t1 → 0). Если u0uкр, то участок неуправляемого движения отсутствует и |$\dot {b}$| = const = m0. Значения $u_{0}^{{(5)}}$ < $u_{0}^{{(4)}}$< uкр соответствуют релейному управлению с одной точкой переключения, при котором $\dot {a}$(T/2) ≠ 0 и ${{r}_{0}} > 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$. Для любого типа управления (с особым режимом управления или с одной точкой переключения и |M| = const)2t1Тfast, причем если ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ < Тimp, то t1 = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ и t2 = Тimp. Пограничной является ситуация, когда t1 = Timp; в этом случае t1 = ${{r}_{0}}{\text{/}}2{{a}_{1}}{{m}_{0}}$ = $\sqrt {F{\text{/}}{{m}_{0}}} $ и r0 = $2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}C$ = = $2{{a}_{1}}\sqrt {{{m}_{0}}F} $. Для любого варианта оптимального управления (с одной или с двумя точками переключения) b имеет размерность кинетического момента и не превышает Limp (константа r0 также имеет размерность кинетического момента, если a1 – безразмерная величина). Очевидно, что в момент времени t = Т/2 функция b(t) равна максимальному значению. Для варианта с участком неуправляемого движения b(t) = Limp, когда М = 0.

Рис. 2

Так как время окончания маневра Т не ограничено, то задача разворота в смысле минимума (1.6) имеет решение для любых условий разворота Λн, Λк и характеристик КА (моментов инерции J1, J2, J3 и значения u0). Для вращения твердого тела с постоянным направлением кинетического момента относительно инерциальной системы координат интеграл (2.8) не зависит от характера изменения модуля |L| кинетического момента и равен F = ${{K}_{{\text{c}}}}{{t}_{{{\text{пр}}}}}$ [2], где Kc – произвольная ненулевая величина кинетического момента (Kc > 0 ); tпр – прогнозируемое время разворота из положения Λн в положение Λк, т.е. время, когда выполнится равенство Λ = Λк для решения Λ(t) системы уравнений (1.2), (2.5), (2.6), в которых b = Kc, а Λ(0) = Λн. Каждой конкретной величине Kc соответствует свое значение tпр (значения tпр и Kc связаны обратно пропорциональной зависимостью). Взяв Kc ≠ 0 и моделируя неуправляемое вращение КА (когда М = 0) для соответствующих начальных условий Λ(0) = Λн, ${{L}_{i}}(0) = {{K}_{{\text{c}}}}{{p}_{{i0}}}$, получим прогнозируемое время tпр и значение F. На основании этой закономерности вычислим ключевые константы оптимального управления:

$\begin{gathered} {{{{t}_{1}} = \sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } \mathord{\left/ {\vphantom {{{{t}_{1}} = \sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}},\quad {{t}_{2}} = \max (FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} ,\sqrt {F{\text{/}}{{m}_{0}}} );\quad T = {{t}_{1}} + {{t}_{2}}; \\ {{r}_{0}} = (\sqrt {{{a}_{1}}{{a}_{2}}} + \max ({{a}_{1}}\sqrt {{{u}_{0}}FC} ,{{{{a}_{2}}} \mathord{\left/ {\vphantom {{{{a}_{2}}} {\sqrt {{{u}_{0}}FC} }}} \right. \kern-0em} {\sqrt {{{u}_{0}}FC} }}) - \,{\text{|}}{{a}_{1}}\sqrt {{{u}_{0}}FC} - \sqrt {{{a}_{1}}{{a}_{2}}} {\text{|}}){\text{/}}C, \\ \end{gathered} $
где F = ${{K}_{{\text{c}}}}{{t}_{{{\text{пр}}}}}$ – характеристика, найденная в результате решения кинематической задачи разворота вместе с вектором p0; $C = \sqrt {{{p_{{10}}^{2}} \mathord{\left/ {\vphantom {{p_{{10}}^{2}} {{{J}_{1}}}}} \right. \kern-0em} {{{J}_{1}}}} + {{p_{{20}}^{2}} \mathord{\left/ {\vphantom {{p_{{20}}^{2}} {{{J}_{2}}}}} \right. \kern-0em} {{{J}_{2}}}} + {{p_{{30}}^{2}} \mathord{\left/ {\vphantom {{p_{{30}}^{2}} {{{J}_{3}}}}} \right. \kern-0em} {{{J}_{3}}}}} $. Все ключевые характеристики оптимального разворота и параметры t1, t2, Т, m0,r0 для функций а(t), b(t), m(t) определяются однозначно. Оптимальные управления Мi и кинетический момент L изменяются по законам

(2.12)
${{M}_{i}} = 0.{\text{5}}{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{\text{1}}}} - t} \right) + {\text{sign}}\left( {{{t}_{{\text{2}}}} - t} \right)} \right]{{p}_{i}},\quad i = \overline {1,3} ,$
(2.13)
${{L}_{i}} = 0.{\text{5}}{{m}_{0}}(T - \;{\text{|}}t - \;{{t}_{{\text{1}}}}{\text{|}}\; - \;{\text{|}}t - {{t}_{{\text{2}}}}{\text{|}}){{p}_{i}},\quad i = \overline {1,3} .$

Если r0 = ${{a}_{1}}\sqrt {{{m}_{0}}F} + {{a}_{2}}{{\sqrt {{{m}_{0}}{\text{/}}F} } \mathord{\left/ {\vphantom {{\sqrt {{{m}_{0}}{\text{/}}F} } {{{u}_{0}}C}}} \right. \kern-0em} {{{u}_{0}}C}}$, то моменты обнуления функций a0(t) и aТ(t) совпадают. Если ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}C$, то моменты обнуления функций a0(t) и aТ(t) могут не совпадать. Если 2t1 = Тfast, то t2 = t1, |M| = const = m0 и не существует моментов времени t, когда b (t) = const.

Зависимости (2.6), (2.12), (2.13) – единственное решение задачи оптимального управления (1.1)–(1.6). Из (2.6), (2.12) явно видно, что при оптимальном управлении момент сил М действует вдоль прямой, неподвижной в инерциальной системе координат. Уравнения (2.13) отчетливо показывают, что в геометрическом представлении вектор р есть орт оптимального кинетического момента КА L в связанной с КА системе координат. Оптимальным в смысле минимума показателя (1.6) будет разворот КА, при котором направление кинетического момента остается неизменным относительно инерциальной системы координат (векторы М и L параллельны). При наличии ограничений на момент М для функционала (1.6) имеем G >$2FC\sqrt {{{a}_{1}}{{a}_{2}}} $, разница ΔG = G – – $2FC\sqrt {{{a}_{1}}{{a}_{2}}} $ возрастает с увеличением времени t1. Минимальное значение функционала (1.6) Gmin соответствует режиму t1 → 0, а для критического значения uкр превышение ΔG составит треть от Gmin. С дальнейшим уменьшением параметра u0 величина (1.6) увеличивается и G → ∞ при u0 → 0 (для u0 → ∞ значение G$2FC\sqrt {{{a}_{1}}{{a}_{2}}} $).

Одним из основных свойств оптимального разворота КА является следующее: во все время движения (на всем отрезке времени [0, T]) отношение кинетической энергии вращения Ек к квадрату модуля кинетического момента КА постоянно:

${{E}_{{\text{к}}}}{\text{/|}}{\mathbf{L}}{{{\text{|}}}^{2}} = {\text{const}} = (p_{{10}}^{2}{\text{/}}{{J}_{1}} + p_{{20}}^{2}{\text{/}}{{J}_{2}} + p_{{30}}^{2}{\text{/}}{{J}_{3}}){\text{/}}2.$

Другим ключевым свойством является то, что при любой программе оптимального управления максимальная кинетическая энергия вращения не превышает уровень a2/2a1 (т.е. всегда Ек ≤ ≤ a2/2a1). Если u0 > uкр, то Ек(T/2) = a2/2a1 (так как имеет место особый режим управления). Если u0uкр, то особый режим управления отсутствует и Ек(T/2) = u0FC/2 ≤ uкрFC/2 = a2/2a1. По существу пропорция между коэффициентами функционала качества (отношение a2 к a1) ограничивает энергию вращения КА во время разворота. Оптимизация маневра переориентации в соответствии с критерием качества (1.6) приводит к тому, что в любой момент времени t длительность полной остановки вращения будет заведомо не больше заранее известного значения, равного ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$. Поэтому предложенное управление (2.12) оказывается крайне полезным, так как во многих случаях (например, при нештатных ситуациях) время торможения не должно быть больше некоторой известной величины.

Оптимизация с использованием функционала (1.6) не только ограничивает максимальную кинетическую энергию вращения во время разворота, но и минимизирует время разворота КА из положения (1.4) в положение (1.5). Обозначим через

${{E}_{{\max }}} = \mathop {\max }\limits_{0 \leqslant t \leqslant T} {{E}_{{\text{к}}}}(t)$
максимальную кинетическую энергию вращения во время разворота. В случае кинематически оптимального разворота Eк(t) = const = а2/2а1 и G = 2а2T.

В случае оптимального разворота КА из положения покоя в положение покоя с ограничением (1.3) значение функционала (1.6) зависит от наличия или отсутствия особого режима управления. Если есть участок вращения по инерции, то значение интеграла (1.6) равно

$G = 2{{a}_{1}}{{E}_{{\max }}}(T - 4{{\sqrt {2{{E}_{{\max }}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{\max }}}} } {3{{u}_{0}}}}} \right. \kern-0em} {3{{u}_{0}}}}) + {{a}_{2}}T = 2{{a}_{2}}(T - 2{{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {3{{u}_{0}}}}} \right. \kern-0em} {3{{u}_{0}}}}),$
так как 2Emax = а2/а1, $\tau = {{\sqrt {2{{E}_{{\max }}}} } \mathord{\left/ {\vphantom {{\sqrt {2{{E}_{{\max }}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ – время торможения (разгона).

Если оптимальным является управление с одной точкой переключения, то

$G = {{a}_{1}}u_{0}^{2}{{T}^{3}}{\text{/}}6 + {{a}_{2}}T.$

Из приведенных выше формул видно, что каким бы не было оптимальное управление (с наличием или отсутствием участка вращения по инерции) значение функционала (1.6) – монотонно возрастающая функция времени разворота T. Следовательно, время разворота T – монотонно возрастающая функция аргумента G. Поэтому T минимизируется вместе с G. Минимизация функционала (1.6) минимизирует время разворота даже при неограниченной кинетической энергии вращения (как было показано выше, кинетическая энергия вращения оказывается ограниченной автоматически). Вопросы быстродействия остаются актуальными и сегодня.

По существу, найдено решение задачи оптимального разворота твердого тела из состояния (1.4) в состояние (1.5) за минимальное время при наличии ограничений (1.3) и

$L_{1}^{2}{\text{/}}{{J}_{1}} + L_{2}^{2}{\text{/}}{{J}_{2}} + L_{3}^{2}{\text{/}}{{J}_{3}} \leqslant 2{{E}_{{{\text{доп}}}}},$
где Eдоп = а2/2а1 – максимально допустимая энергия вращения КА (подробности обоснования этого утверждения приведены в Приложении). Из свойств оптимального по критерию (1.6) движения следует, что ни при каких обстоятельствах длительность разворота T не может быть меньше значения ${{T}_{{{\text{imp}}}}} = S\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $, так как функционал “пути” S не зависит от значения u0.

Функции Мi(t), рi(t), Li(t) будут оптимальными тогда и только тогда, когда они удовлетворяют уравнениям (2.6), (2.12), (2.13). Задача построения оптимального управления М (t) состоит главным образом в нахождении такого вектора р(0) (и значения F), чтобы в результате движения КА в соответствии с уравнениями (1.2), (2.6), (2.13) и начальными условиями (1.4) выполнялись равенства Λ(Т) = Λк и L(Т) = 0. Для получения функциональной зависимости управлений от фазовых координат необходимо решить уравнения (2.6), которые для закона (2.13) примут вид (2.11). Если J1, J2, J3, и0 не меняются, то для всех сочетаний Λн, Λк с одинаковым значением кватерниона Λр = ${{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$ решение r(t), М(t), L(t) будет одним и тем же.

3. Построение типовой программы оптимального разворота КА. Для динамической системы (1.1), (1.2) управление (2.12), при котором направление момента сил М параллельно прямой, неподвижной в инерциальном пространстве, удовлетворяет необходимым условиям оптимальности для критерия (1.6) при наличии ограничения (1.3). Так как начальный L(0) и конечный L(T ) кинетический моменты равны нулю, а время Т не ограничено, то такое вращение КА всегда можно осуществить (замкнутая система (1.1), (2.2), (2.11), (2.12) имеет решение). Для оптимального движения L(t) выполняются равенства (2.13). Определяющим в решении задачи оптимального разворота (при построении оптимального программного движения L(t) и оптимальной траектории Λ(t)) является нахождение начальных условий р(0) и соответствующего момента m0 = |М (0)| (вектор р(0) зависит исключительно от параметров разворота ΛР и моментов инерции КА J1, J2, J3 и не зависит от и0). Для константы r0 существует правило: если a2a1u0FC, то ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}C$; если a2 > a1u0FC, то r0 = ${{a}_{1}}\sqrt {{{m}_{0}}F} + {{a}_{2}}{{\sqrt {{{m}_{0}}{\text{/}}F} } \mathord{\left/ {\vphantom {{\sqrt {{{m}_{0}}{\text{/}}F} } {{{u}_{0}}C}}} \right. \kern-0em} {{{u}_{0}}C}}$.

В общем случае оптимальным решением по критерию (1.6) в условиях ограничения (1.3) является релейное управление с двумя точками переключения t = t1 и t = t2, которые удовлетворяют соотношениям: 0 < t1Т/2, Т/2 ≤ t2 < Т и t1 + t2 = Т. На участках разгона [0, t1] и торможения [t2T] модуль момента М максимально возможный: |M| = const = m0. Между разгоном и торможением (в интервале времени t1 < t < t2) момент М = 0. При нулевых начальной и конечной угловых скоростях времена разгона и торможения равны: τ = t1 = Тt2. Длительность вращения по инерции (свободного движения) составляет tсв = Т – 2τ. Предельным является случай, когда tсв = 0 и t1 = t2 = τ = Т/2 (управление с одной точкой переключения, когда на всем отрезке времени [0, Т] момент М максимален и |M| = const = m0). Другим предельным случаем будет разворот при неограниченном управлении (когда u0 → ∞); при таком вращении время переходных участков (разгона и торможения) бесконечно мало τ → 0.

Максимальная величина кинетического момента во время разворота равна ${{L}_{{{\text{max}}}}} = {{m}_{0}}\tau $, где τ = = ${{\sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } \mathord{\left/ {\vphantom {{\sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ – время разгона (торможения), F = ${{K}_{{\text{c}}}}{{t}_{{{\text{пр}}}}}$ – постоянная, не зависящая от характера изменения модуля |L(t)|. Функции φi находятся из (2.4) с учетом того, что

$a(t) = \left\{ \begin{gathered} {{a}_{1}}{{m}_{0}}{{t}^{2}} - {{r}_{0}}t + {{a}_{2}}{\text{/}}({{u}_{0}}C),\quad {\text{если}}\quad t < \tau ; \hfill \\ 0,\quad {\text{если}}\quad \tau \leqslant t \leqslant {{T}_{{imp}}}; \hfill \\ {{r}_{0}}(T - t) - {{a}_{1}}{{m}_{0}}{{(T - t)}^{2}} - {{a}_{2}}{\text{/}}({{u}_{0}}C)\quad {\text{если}}\quad t > {{t}_{2}}. \hfill \\ \end{gathered} \right.$

Из рис. 2 отчетливо видно, что bmax не может быть больше модуля кинетического момента на участке с особым режимом управления (когда М = 0), равного ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$, т.е. Lmax${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$. Для управления с одной точкой переключения Lmax = $\sqrt {{{m}_{0}}F} $. Так как Lnom = ${{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } C}} \right. \kern-0em} C}$ не зависит от параметра u0 и характеристики разворота F, то получаем условие отсутствия особых режимов управления: u0F Cа2/a1. Для одних и тех же значений Λн, Λк, J1, J2, J3 вид функции b(t) определяется параметром и0. Если u0uкр, то t1 = t2 и максимальная величина кинетического момента равна Lmax = $\sqrt {{{m}_{0}}F} $. Если u0 > uкр, то t1t2 и существует особый режим управления с М = 0 в интервале между разгоном и торможением; оптимальное значение ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$ и bmax = r0/2а1.

Управляющие переменные рассчитываются в соответствии с законом (2.12), для реализации которого необходимо в каждый момент времени t знать все три переменные р1, р2, р3. При оптимальном движении компоненты рi вектора р подчиняются уравнениям (2.11), в которых |L| рассчитывается в соответствии с (2.13). Управление (2.12) оптимально, потому что оно является единственным решением системы уравнений (1.1), (2.1)–(2.3), которые формализуют необходимые условия оптимальности. Общее решение системы уравнений (1.2), (2.11) с учетом равенств Li = bpi, ri = r0pi получить практически невозможно; трудность заключается в определении граничных значений p(0) и p(T), которые связаны между собой выражением

${{\Lambda }_{{\text{к}}}} \circ {\mathbf{p}}(T) \circ {{\tilde {\Lambda }}_{{\text{к}}}} = {{\Lambda }_{{\text{н}}}} \circ {\mathbf{p}}(T) \circ {{\tilde {\Lambda }}_{{\text{н}}}}\quad {\text{или}}\quad {\mathbf{p}}(T) = {{\tilde {\Lambda }}_{{\text{P}}}} \circ {\mathbf{p}}(T) \circ {{\Lambda }_{{\text{P}}}},$
где ${{\Lambda }_{{\text{р}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$ – кватернион разворота.

Указанная система имеет аналитическое решение только для динамически симметричного и сферического тел. Для сферически-симметричного КА (J1 = J2 = J3 ) уравнения (2.11) имеют вид ${{\dot {p}}_{i}} = 0$, и поэтому решение системы уравнений (1.2), (1.4), (1.5), (2.12), (2.13), (2.11) такое:

$\begin{gathered} {{p}_{i}}(t) = {\text{const}} = {{p}_{{i0}}} = {{{{\nu }_{i}}} \mathord{\left/ {\vphantom {{{{\nu }_{i}}} {\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} }}} \right. \kern-0em} {\sqrt {\nu _{1}^{2} + \nu _{2}^{2} + \nu _{3}^{2}} }};\quad {{M}_{i}}(t) = 0.5{{m}_{0}}[{\text{sign}}({{t}_{1}} - t) + {\text{sign}}({{t}_{2}} - t)]{{p}_{{i0}}}; \\ {{L}_{i}}(t) = 0.5{{m}_{0}}(T - \,{\text{|}}t - {{t}_{1}}{\text{|}} - \,{\text{|}}t - {{t}_{2}}{\text{|}}){{p}_{{i0}}},\quad i = \overline {1,3} , \\ \end{gathered} $
где ${{\nu }_{1}},{{\nu }_{2}},{{\nu }_{3}}$ – компоненты векторной части кватерниона разворота Λр; ${{m}_{0}} = {{u}_{0}}\sqrt {{{J}_{1}}} $; Т = t1 + t2; t1 = = ${{\sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } \mathord{\left/ {\vphantom {{\sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}FC)} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$; t2 = max($FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $, $\sqrt {F{\text{/}}{{m}_{0}}} $), в которых F = 2J1arccos(sqalΛр). Оптимальные развороты вокруг оси, неподвижной относительно инерциальной системы координат, подробно рассмотрены в [1].

Для динамически симметричного КА (например, когда J2 = J3) задача оптимального управления разворотом решается до конца [16] (не умаляя общности рассуждений, за ось симметрии принята ось ОХ КА). Оптимальное движение в этом частном, но достаточно распространенном случае представляет собой одновременное вращение КА как твердого тела вокруг своей продольной оси ОХ и вокруг некоторого направления η, неподвижного в инерциальном пространстве и составляющего с продольной осью КА определенный постоянный угол ϑ. Угловые скорости относительно осей ОХ и η изменяются пропорционально с постоянным коэффициентом пропорциональности, и поэтому справедливо соотношение [16]

${{\Lambda }_{{\text{к}}}} = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\beta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\alpha /2}}},$
где вектор в показателе степени кватернионной экспоненты понимается как кватернион с нулевой скалярной частью; р0 = р(0); е1 – орт продольной оси КА; α, β – углы поворота КА вокруг продольной оси ОХ и вокруг вектора р соответственно (считается |α| ≤ π, 0 ≤ β ≤ π). Решение p(t) системы уравнений (1.1), (2.11), (2.12) представим в следующей форме:
(3.1)
$\begin{gathered} {{р}_{{\text{1}}}} = {{р}_{{{\text{1}}0}}} = {\text{cos}}\,\vartheta ,\quad {{p}_{2}} = {{p}_{{20}}}\cos \kappa + {{p}_{{30}}}\sin \kappa , \\ {{p}_{3}} = - {{p}_{{20}}}\sin \kappa + {{p}_{{30}}}\cos \kappa ,\quad = \frac{{J - {{J}_{1}}}}{{{{J}_{1}}J}}\int\limits_0^t {{{L}_{1}}(t)dt} , \\ \end{gathered} $
где pi 0 = рi(0); J = J2 = J3; продольная составляющая L1(t) вектора L определяется из равенств (2.13) с учетом р1 = const = р10. Зависимость pi 0, α, β от Λн и Λк определяется уравнениями
(3.2)
$\begin{gathered} \alpha = \frac{{J - {{J}_{1}}}}{{{{J}_{1}}}}{{p}_{{10}}}\beta ;\quad \cos \frac{\beta }{2}\cos \frac{\alpha }{2} - {{p}_{{10}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{0}};\quad \cos \frac{\beta }{2}\sin \frac{\alpha }{2} + {{p}_{{10}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} = {{\nu }_{1}}; \\ {{p}_{{20}}}\sin \frac{\beta }{2}\cos \frac{\alpha }{2} + {{p}_{{30}}}\sin \frac{\beta }{2}\sin \frac{\alpha }{2} = {{\nu }_{2}};\quad - {{р}_{{20}}}\sin \frac{{\beta }}{2}\cos \frac{{\alpha }}{{\text{2}}} + {{p}_{{30}}}\sin \frac{{\beta }}{2}\cos \frac{{\alpha }}{2} = {{{\nu }}_{3}}, \\ \end{gathered} $
где ${{\nu }_{0}},{{\nu }_{1}},{{\nu }_{2}},{{\nu }_{3}}$ – компоненты кватерниона разворота Λр; –π ≤ α ≤ π, 0 ≤ β ≤ π. Существование решения системы (3.2) для любых значений кватерниона разворота Λр доказано в [16]. Оптимальное значение управляющего момента М удовлетворяет соотношениям (2.12). Программные значения функций Li (проекции требуемого вектора кинетического момента L* на связанные оси) вычисляются по формулам (3.1) и (2.13). В явном виде оптимальное решение Mi(t), Li(t) запишем следующим образом:
$\begin{gathered} {{M}_{1}} = {\text{ }}0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{1}}--t} \right) + {\text{sign}}\left( {{{t}_{2}}--t} \right)} \right]{{р}_{{10}}}; \\ {{M}_{2}} = {\text{ }}0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{1}}--t} \right) + {\text{sign}}\left( {{{t}_{2}}--t} \right)} \right]\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma ); \\ \end{gathered} $
${{M}_{3}} = 0.5{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{1}}--t} \right) + {\text{sign}}\left( {{{t}_{2}}--t} \right)} \right]\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma );$
${{L}_{1}} = 0.5{{m}_{0}}(T--\,{\text{|}}t--{{t}_{1}}{\text{|}}--\,{\text{|}}t--{{t}_{2}}{\text{|}}){{р}_{{10}}};\quad {{L}_{2}} = 0.5{{m}_{0}}(T--\,{\text{|}}t--{{t}_{1}}{\text{|}}--\,{\text{|}}t--{{t}_{2}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \sin (\kappa + \gamma );$
${{L}_{3}} = {\text{ }}0.5{{m}_{0}}(T--\,{\text{|}}t--{{t}_{1}}{\text{|}}--\,{\text{|}}t--{{t}_{2}}{\text{|}})\sqrt {1 - p_{{10}}^{2}} \cos (\kappa + \gamma ),$
где ${{{{t}_{1}} = \sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}{{J}_{2}}\beta C)} } \mathord{\left/ {\vphantom {{{{t}_{1}} = \sqrt {\min ({{a}_{2}}{\text{/}}{{a}_{1}},{{u}_{0}}{{J}_{2}}\beta C)} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$; t2 = max(${{J}_{2}}\beta C\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} $, $\sqrt {{{J}_{2}}\beta {\text{/}}{{m}_{0}}} $); $\gamma = \arcsin ({{p}_{{20}}}{\text{/}}\sqrt {1 - p_{{10}}^{2}} )$, если р30 ≥ 0, или $\gamma = \pi - \arcsin ({{p}_{{20}}}{\text{/}}\sqrt {1 - p_{{10}}^{2}} )$, если р30 < 0 (|р10| ≠ 1; а случай |р10| = 1 не рассматривается, так как он соответствует плоскому вращению вокруг продольной оси ОХ); Т = t1 + t2. В любой текущий момент времени t кватернион ориентации Λ описывается функцией
$\Lambda (t) = {{\Lambda }_{{\text{н}}}} \circ {{е}^{{{{{\mathbf{p}}}_{{\text{o}}}}\theta /2}}} \circ {{e}^{{{{{\mathbf{e}}}_{{\text{1}}}}\rho /2}}},$
где $\rho = (J - {{J}_{1}}){{p}_{{10}}}\theta {\text{/}}{{J}_{1}}$; значение вектора p0 определяется из системы (3.2); угол θ равен

$\theta = \frac{1}{J}\int\limits_0^t {\left| {{\mathbf{L}}(t)} \right|dt} .$

Для несимметричного КА (${{J}_{1}} \ne {{J}_{2}} \ne {{J}_{3}}$) решение системы уравнений (1.2), (2.11), (2.13) в квадратурах не представляется возможным и находится исключительно численными методами (например, методом последовательных приближений). Определение вектора p0 производится путем решения краевой задачи р(0) = р0,р(Т) = ${{\tilde {\Lambda }}_{{\text{Р}}}} \circ $р0$ \circ {{\Lambda }_{{\text{Р}}}}$ с учетом накладываемых на движение связей (2.11). В системе [20] такая задача решена для КА с произвольными моментами инерции (методом итераций). Заметим, что решение р0 не зависит от характера изменения модуля кинетического момента, входящего в уравнения (2.11). Поэтому для нахождения оптимального значения р0 правомерно принять |L| = const ≠ 0. Случай решения р(t) системы (2.11) с |L| = const соответствует вращению твердого тела с М = 0 (поскольку уравнения (2.11) и (2.5) выполняются одновременно).

Для построения оптимального управления при развороте КА необходимо знать не только программу изменения координат рi(t), но и величину максимального момента m0, определяющего темп приближения к требуемому конечному состоянию Λ(Т) = Λк, L(Т) = 0, а также моменты выключения и включения управления t1 и t2. Конкретные значения параметров m0, t1, t2, r0 = |r| и длительность разворота Т зависят от вектора р0 и характеристики F. Для динамически симметричного КА значение F вычисляется значительно проще (расчет величин r0, t1, t2 и функционала G также упрощается). В этом частном случае |L| = J2${\dot {\beta }}$ и F = J2 β, где J2 – момент инерции относительно поперечной оси (J2 = J3); ${\dot {\beta }}$ – скорость вращения вокруг кинетического момента L; β – угол поворота КА вокруг кинетического момента L (из физического смысла β ≥ 0). Значения r0, t1, t2, Т, G зависят от угла β поворота КА вокруг кинетического момента L. Чтобы оптимизируемый функционал (1.6) был минимальным, необходимо выполнить условие β ≤ π (именно поэтому система (3.2) включает неравенство 0 ≤ β ≤ π).

Решение задачи оптимального разворота (в смысле минимума (1.6)) подчиняется уравнениям (2.4)(2.6), а управляющие переменные Мi и компоненты Li вектора L изменяются в соответствии с законами (2.12), (2.13). Решение (2.12), (2.13) оптимально, потому что оно – единственное; только оно одно (и никакое другое) удовлетворяет необходимым условиям оптимальности. Любое отличное от (2.12), (2.13) движение будет заведомо хуже (в смысле минимума интеграла (1.6)), поскольку не будет удовлетворять необходимым условиям оптимальности (согласно принципу максимума). Значение m0 в законах движения (2.12), (2.13) определяет максимальную величину управляющего момента, максимальный модуль кинетического момента и длительность участка свободного вращения. Оптимальный вектор р0 рассчитывается в результате решения краевой задачи принципа максимума. Константы F, С, m0 полностью определяют программу движения при оптимальном законе управления пространственным разворотом КА. Программное изменение момента сил М описывается зависимостью

${\mathbf{М}} = 0.{\text{5}}{{m}_{0}}\left[ {{\text{sign}}\left( {{{t}_{{\text{1}}}} - t} \right) + {\text{sign}}\left( {{{t}_{{\text{2}}}} - t} \right)} \right]\tilde {\Lambda } \circ {{{\mathbf{c}}}_{p}} \circ \Lambda ,$
где cp = const = Λн $ \circ $ р0 $ \circ {{\tilde {\Lambda }}_{{\text{н}}}}$. Для оптимальной программы управления М(t) движение КА относительно центра масс обладает следующими оригинальными свойствами и соотношениями:

$L \circ {\mathbf{M}}\left( {T--t} \right) \circ \tilde {\Lambda } = - \Lambda \circ {\mathbf{M}}\left( t \right) \circ \tilde {\Lambda };\quad \Lambda \circ {\mathbf{L}}(T - t) \circ \tilde {\Lambda } = \Lambda \circ {\mathbf{L}}(t) \circ \tilde {\Lambda };\quad \int\limits_0^{T/2} {\left| {{\mathbf{L}}(t)} \right|dt} = \int\limits_{Т/2}^T {\left| {{\mathbf{L}}(t)} \right|dt} ,$
${{L}_{{\max }}} = \mathop {\max }\limits_{0 < t < T} \sqrt {L_{1}^{2} + L_{2}^{2} + L_{3}^{2}} = {\text{|}}{\mathbf{L}}(T{\text{/}}2){\text{|}}{\text{.}}$

Раскрутка КА в начале разворота продолжается до тех пор, пока его кинетический момент L не станет равен заданному значению Lpr, который рассчитывается по формуле Lpr = m0τ $\tilde {\Lambda } \circ $ cp $ \circ $ Λ. Гашение кинетического момента до состояния L = 0 в конце оптимального разворота осуществляется по закону

${{{{M}_{i}} = - {{u}_{0}}{{L}_{i}}} \mathord{\left/ {\vphantom {{{{M}_{i}} = - {{u}_{0}}{{L}_{i}}} {\sqrt {L_{1}^{2}{\text{/}}{{J}_{1}} + L_{2}^{2}{\text{/}}{{J}_{2}} + L_{3}^{2}{\text{/}}{{J}_{3}}} }}} \right. \kern-0em} {\sqrt {L_{1}^{2}{\text{/}}{{J}_{1}} + L_{2}^{2}{\text{/}}{{J}_{2}} + L_{3}^{2}{\text{/}}{{J}_{3}}} }}\quad {\text{или}}\quad {\mathbf{M}} = - {{m}_{0}}{\mathbf{L}}/{\text{|}}{\mathbf{L}}{\text{|}}.$

В момент времени t = T, когда L = 0, управление выключается и M = 0, разворот завершен.

Если a2/a1$ \ll $ u0FC, то торможение КА можно начать с момента выполнения равенства

$4{\text{arcsin}}\frac{{K\sqrt {\delta _{2}^{2} + \delta _{3}^{2}} }}{{\sqrt {L_{2}^{2} + L_{3}^{2}} }} = \frac{{{{K}^{2}}\sqrt {{{{({{L}_{2}}{\text{/}}{{J}_{2}})}}^{2}} + {{{({{L}_{3}}{\text{/}}{{J}_{3}})}}^{2}}} }}{{{{m}_{0}}\sqrt {L_{2}^{2} + L_{3}^{2}} }},\quad {\text{если}}\quad L_{2}^{2} + L_{3}^{2} \ne 0,$
${\text{или}}\quad 4\arccos {{\delta }_{0}} = {{L}_{1}}K{\text{/}}({{m}_{0}}{{J}_{1}}),\quad {\text{если}}\quad L_{2}^{2} + L_{3}^{2} = 0,$
где δj – компоненты кватерниона рассогласования $\tilde {\Lambda }(t) \circ {{\Lambda }_{{\text{к}}}}$, j = $\overline {0,\;3} $; К = |JКАω| – величина кинетического момента КА. Данное условие позволяет повысить точность приведения КА в требуемое конечное состояние Λ(Т) = Λк, L(Т) = 0 за счет возможности в бортовой системе управления формировать сигнал на гашение кинетического момента по информации о текущей ориентации КА и измерениям его угловой скорости (поскольку L = JКАω).

Таким образом, задача управления (1.1)–(1.6) решена полностью; формализована система уравнений, определяющих оптимальное движение, которая позволила обнаружить закономерности оптимального вращения в явном виде; закон управления представлен в форме зависимости управляющих переменных от фазовых координат. Исследуемая задача оптимального управления КА отличается от рассматриваемых ранее задач видом функционала (1.6) при наличии ограничений на управляющий момент. Выбранный функционал качества обеспечивает движение КА с ограниченной кинетической энергией вращения за минимальное время. Развороты КА с ограниченной кинетической энергией вращения выгодны не только с энергетической точки зрения, но и с точки зрения безопасности космических полетов, поскольку при таких разворотах время остановки вращения КА не превышает известного значения, что крайне важно в случаях экстренного прерывания маневра (по разным причинам, но чаще в аварийных ситуациях).

4. Результаты математического моделирования. Приведем численный пример решения задачи управления кинетическим моментом КА во время программного разворота, оптимального в смысле минимума (1.6). Рассмотрим разворот КА на 180° из начального положения Λн, при котором оси КА совмещены (совпадают по направлению) с осями опорного базиса I, в заданное конечное положение Λк = Λзад с минимальным значением интеграла (1.6). При этом считалось, что начальная и конечная угловые скорости нулевые: ω(0) = ω(Т) = 0. Значения элементов кватерниона Λзад, характеризующего требуемое угловое положение КА, были равны: λ0 = 0; λ1 = 0.7071; λ2 = 0.5; λ3 = 0.5. Коэффициенты а1 и а2 примем близкими к единице (для лучшей соразмерности); без учета размерностей (единиц измерения) a1 + a2 ≈ 2, чтобы величина G была не слишком большой и не слишком маленькой. Полагаем, что кинетическая энергия вращения не должна превышать 1 Дж, для чего численные значения a1, a2 должны удовлетворять условию a2 = 2a1. Пусть, например, а1 = 0.7 с–1, а2 = 1.4 Вт. Инерционные характеристики КА следующие: J1 = = 12801.6 кг ⋅ м2, J2 = 45747.3 кг ⋅ м2, J3 = 40331.1 кг ⋅ м2. Мощность исполнительных органов характеризуется величиной и0 = 0.05 Н/$\sqrt {{\text{кг}}} $.

Определим оптимальную программу управления кинетическим моментом КА L(t) для перевода КА из состояния Λ(0) = Λн, L(0) = 0 в состояние Λ(Т) = Λк, L(Т) = 0. Нахождение расчетного значения вектора p0 начинаем с решения той же краевой задачи для динамически симметричного КА с моментами инерции J1 и J, где J – момент инерции относительно поперечной оси, принимаемый равным

$J = \frac{{{{J}_{2}}{{J}_{3}}}}{{{{J}_{2}} + {{J}_{3}} - {{J}_{1}}}}(\sqrt {(1 - {{J}_{1}}{\text{/}}{{J}_{2}})(1 - {{J}_{1}}{\text{/}}{{J}_{3}})} + 1).$.

В предположении динамической симметричности КА решение p0 определяется системой (3.2). Для симметричного твердого тела значения искомых переменных будут такими:

$\begin{gathered} {\mathbf{p}}_{0}^{{(0)}} = \left\{ {0.4667895;--0.2009462;0.8612364} \right\};\quad {{\beta }^{{(0)}}} = 106.2^\circ ;~ \\ {\text{интеграл}}\quad {{F}^{{(0)}}} = 79374{\text{ Н}} \cdot {\text{м}} \cdot {{{\text{с}}}^{2}}. \\ \end{gathered} $

Полученные из уравнений (3.2) значения p0 и β являются начальным приближением к истинному решению. Они уточняются до тех пор, пока не будут удовлетворять системе уравнений (1.1), (1.2), в которых момент сил отсутствует (M = 0), с учетом накладываемых на движение КА ограничений Λ(0) = Λн, Λ(tпр) = Λк, а компоненты Liн начального кинетического момента Lн определяются вектором p0 и углом β по выражениям

(4.1)
${{L}_{{1{\text{н}}}}} = \frac{{J\beta }}{T}{{p}_{{10}}},\quad {{L}_{{2{\text{н}}}}} = \frac{{J\beta }}{T}{{p}_{{20}}},\quad {{L}_{{3{\text{н}}}}} = \frac{{J\beta }}{T}{{p}_{{30}}},$
где Т – время разворота (при уточнении вектора p0 было принято значение Т = 200 с). Прогнозирование “свободного” движения осуществляется интегрированием системы уравнений (1.1), (1.2), описывающих вращение КА, при начальных условиях Λ(0) = Λн, L(0) = Lн и с учетом того, что M = 0. Степень приближения найденных р0 и β к искомому решению характеризуется мерой ε = sqal(${{\tilde {\Lambda }}_{{{\text{пр}}}}} \circ {{\Lambda }_{{\text{к}}}}$), где Λпр – наиболее близкое к Λк положение, полученное в ходе моделирования движения КА около центра масс (согласно уравнений (1.2), (1.1), в которых Mi = 0). Вектор р0 уточняется до тех пор, пока ε < εпорпор – некоторое близкое к единице пороговое значение, отражающее точность найденного решения). Как только условие ε ≥ εпор достигнуто (прогнозируемая ошибка соответствует требуемой точности), истинные значения p0 и β, удовлетворяющие граничным условиям Λ(0) = Λн, Λ(tпр) = Λк, будут найдены и краевая задача решена. Вектор p0 уточняется, используя следующее рекуррентное соотношение:
$\Lambda _{{\text{р}}}^{{{\text{(}}k + {\text{1)}}}} = \Lambda _{{\text{р}}}^{{{\text{(}}k{\text{)}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}},$
где $\Lambda _{{\text{p}}}^{{(k)}}$ – значение кватерниона разворота на k-й итерации, используемое в системе (3.2). На каждом k-м шаге итераций обновляются элементы кватерниона разворота $\Lambda _{{\text{p}}}^{{(k)}}$ (правые части системы (3.2)), и из уравнений (3.2) мы получаем p0 и β, а также соответствующий начальный кинетический момент Lн (согласно (4.1)) и прогноз Λпр. Если ε < εпор, то вычисляется кватернион разворота $\Lambda _{{\text{p}}}^{{(k + 1)}}$ для следующего (k + 1)-го шага итераций и процесс уточнения вектора p0 повторяется. За начальное приближение в правых частях системы (3.2) берутся элементы кватерниона $\Lambda _{{\text{р}}}^{{{\text{(0)}}}} = {{\tilde {\Lambda }}_{{\text{н}}}} \circ {{\Lambda }_{{\text{к}}}}$. Итерационный процесс прекращается, когда ε ≥ εпор.

Принятая схема итераций аналогична итерационному методу решения уравнения вида x = f(x) для скалярной функции f(x) скалярного (одномерного) аргумента x. В нашем случае аргумент – гиперкомплексное число (кватернион) Λр. Функцией является кватернионная величина ${{\Lambda }_{{\text{р}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}}$, где Λк – постоянный (не зависящий от аргумента Λр) кватернион; Λпр зависит от аргумента Λр через систему уравнений (3.2), (4.1) посредством модели движения (1.1), (1.2) (в уравнениях (1.1) принимается Мi = 0). С изменением Λр изменяются вектор p0 (в соответствии с (3.2)) и компоненты L iн начального кинетического момента Lн, а значит, изменится и значение Λпр, что вызовет изменение функции ${{\Lambda }_{{\text{р}}}} \circ {{\tilde {\Lambda }}_{{\text{к}}}} \circ {{\Lambda }_{{{\text{пр}}}}}$. Как только sqal(${{\tilde {\Lambda }}_{{{\text{пр}}}}} \circ {{\Lambda }_{{\text{к}}}}$) ≥ εпор, итерационный процесс прекращается, а решение p0 считается найденным. Так как |vect(${{\tilde {\Lambda }}_{{\text{к}}}} \circ \Lambda _{{{\text{пр}}}}^{{(k)}}$)| < < |vect$\Lambda _{{\text{р}}}^{{(k)}}$| для всех k, то итерационный процесс приближения p0 к искомому решению сходится. Аналогичный метод определения значения р0 в решении краевой задачи принципа максимума использовался в задаче оптимального по быстродействию управления [21]. Заметим, что это лишь один из возможных (но далеко не единственный) итерационных алгоритмов поиска оптимального вектора р0.

В результате решения краевой задачи разворота из положения Λ(0) = Λн в положение Λ(Т) = Λк получили расчетное значение вектора p0 = {0.4469347; –0.1861273; 0.8749891} и интеграл F = = 79243 Н ⋅ м ⋅ с2. Максимальная величина управляющего момента равна m0 = 8.41 Н ⋅ м. В рассматриваемом примере имеет место оптимальный разворот с особым режимом управления, когда при 0 ≤ t < t1 момент М = m0р, при t2 < tT момент М = –m0р, а при t1tt2 момент M = 0. Оптимальные управления Mi вычисляются по формулам (2.12), в которых t1t2, потому что a2 < < a1u0FC. В силу нулевых граничных условий L(0) = L(T) = 0 реализуется только один единственный тип оптимального движения: первый участок – разгон КА с максимальным управляющим моментом |M| = m0 до |L| = Lmax, далее участок свободного движения КА (M = 0) с постоянным по величине кинетическим моментом |L| = Lзад продолжительностью tсв и затем симметричный участок торможения КА с максимальным управляющим моментом |M| = m0 до остановки КА (M || L). Зная значения характеристик F и C, определяем длительность оптимального разворота Topt = = $FC\sqrt {{{a}_{1}}{\text{/}}{{a}_{2}}} + {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } \mathord{\left/ {\vphantom {{\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} } {{{u}_{0}}}}} \right. \kern-0em} {{{u}_{0}}}}$ = 361.4 с, и времена t1 =$\sqrt {{{a}_{2}}{\text{/}}{{a}_{1}}} {\text{/}}{{u}_{0}}$ = 28.3 с, t2 = 333.1 с, а также ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} ){\text{/}}С$ = 333 Н ⋅ м, максимальная величина кинетического момента составляет Lmax = = 238 Н ⋅ м ⋅ с, длительность tсв = 304.8 с.

Результаты математического моделирования динамики оптимального разворота представлены рис. 3–5. На рис. 3 изображены графики изменения проекций кинетического момента на оси связанной с КА системы координат L1(t), L2(t), L3(t) по времени. Отмечаем, что составляющая L1, соответствующая оси ОХ КА, – знакопостоянна. Переход с режима раскрутки КА (когда m(t) = m0) в режим с особым управлением (когда φ = const = 0 и ${\mathbf{\dot {L}}} = {\mathbf{L}} \times J_{{{\text{КА}}}}^{{ - 1}}{\mathbf{L}}$) происходит обнулением управляющего момента; переход с режима особого управления (когда φ = const = 0 и M = 0) в режим гашения кинетического момента до L = 0 происходит за счет включения управления, при котором кинетический момент L и момент M имеют противоположные направления и |M| = const = m0. На этапе между разгоном и торможением КА вращается с постоянной кинетической энергией, равной Ек = а2/2a1 = 1 Дж. Значение интеграла (1.6), отражающего экономичность программы М(t) управления кинетическим моментом во время разворота, составило G = 959 Дж. На рис. 4 отображены графики изменения компонент кватерниона Λ(t), определяющего текущую ориентацию КА в процессе совершаемого поворотного маневра: λ0(t), λ1(t), λ2(t), λ3(t). Оптимальная траектория движения Λ(t) получается из решения уравнений (1.2) с учетом начальных условий Λ(0) = Λн и известного закона изменения кинетического момента L(t), который для оптимального управления М(t) имеет форму (2.13). Оптимальное значение константы cp и вектор р0 выбираются из условия выполнения равенства Λ(Т) = Λк для решения Λ(t) системы (1.2), (2.6), (2.13). Динамика изменения составляющих р1(t), р2(t), р3(t) вектора р во времени приведена на рис. 5 (напомним, что переменные р1, р2, р3 определяют изменение управляющих функций М1(t), М2(t), М3(t) на участках разгона и торможения с постоянным коэффициентом пропорциональности). Характерным является незначительное изменение проекции р1 (составляющая кинетического момента L1 на участке вращения по инерции также меняется гораздо меньше, чем составляющие кинетического момента L2 и L3). Это свидетельствует о том, что ОХ – продольная ось КА. При оптимальном управлении в отличие от переменных Li переменные рi и λj – гладкие функции времени.

Рис. 3
Рис. 4
Рис. 5

Отметим, что если a2 → 0, то скорость вращения бесконечно мала (для оптимальной в смысле минимума (1.6) программы движения) и разворот длится бесконечно долго. Если a1 → 0, то особый режим управления невозможен, поскольку при a1 → 0 кинетическая энергия вращения, соответствующая особому режиму управления, становится бесконечно большой, а максимальная кинетическая энергия вращения при оптимальном управлении с одной точкой переключения, равная Emax = u0S/2, меньше бесконечности.

Если принять a1 = 0, то функционал (1.6) соответствует задаче разворота за минимальное время и соответственно, применяя описанный выше метод управления, должно получиться решение задачи максимального быстродействия. Действительно, если a1 = 0, то необходимое условие существования особого режима управления, которое выражается равенством ${{r}_{0}} = 2\sqrt {{{a}_{1}}{{a}_{2}}} {\text{/}}С$, не выполняется (так как |r| ≠ 0 для оптимальных функций ri) и оптимальным является релейное управление с одной точкой переключения, при котором |M| ≠ 0 на всем отрезке времени [0, T], в первой половине разворота (до момента t = T/2) направления силового момента M и кинетического момента L совпадают, а во второй половине разворота (начиная с момента t = T/2 и до окончания маневра) силовой момент M и кинетический момент L имеют противоположные направления, что полностью совпадает с решением задачи оптимального по быстродействию управления в условиях ограничения (1.3), так как производная $\dot {a}$ в этом частном случае равна $\dot {a}$ = 2a1br0 = const = –r0 ≠ 0. Заметим, что для релейного управления с одной точкой переключения (когда |M| = const > 0) значение r0 равно r0 = ${{a}_{1}}\sqrt {{{m}_{0}}F} + {{a}_{2}}{{\sqrt {{{m}_{0}}{\text{/}}F} } \mathord{\left/ {\vphantom {{\sqrt {{{m}_{0}}{\text{/}}F} } {({{u}_{0}}C)}}} \right. \kern-0em} {({{u}_{0}}C)}}$. Даже при a1 = 0 условие |r| ≠ 0 удовлетворяется.

Заключение. Исследована задача оптимального управления пространственным разворотом КА из произвольного начального в требуемое конечное угловое положение при ограниченном управляющем моменте. Оптимизация основана на использовании нового функционала качества, который учитывает одновременно кинетическую энергию вращения и длительность маневра. Для решения поставленной задачи используются необходимые условия оптимальности в форме принципа максимума и кватернионы. Постановка задачи имеет традиционную форму, в которой управление считается кусочно-непрерывной функцией времени. Рассмотренная задача управления достаточно актуальна. Принципиальное отличие приведенного решения от известных публикаций состоит в том, что принятый критерий оптимальности обеспечивает вращение КА с кинетической энергией, не превышающей заранее установленного уровня, определяемого исключительно значениями коэффициентов функционала качества. Оптимизируемый функционал (1.6) ограничивает кинетическую энергию вращения и в этих условиях минимизирует время маневра, что крайне важно для практики космических полетов; при этом он позволил решить динамическую задачу управления (с учетом инерционности КА и динамических уравнений движения).

На основании принципа максимума и при использовании универсальных переменных ri [19] получены выражения для оптимального управления, функции Гамильтона и сопряженной системы уравнений для исходной задачи. Найдены условия оптимальности и обоснована структура оптимального управления; представлены формализованные соотношения для построения программного движения КА. Определен тип траектории и изучены ключевые свойства оптимального движения. Доказано, что в процессе всего разворота отношение кинетической энергии вращения к квадрату модуля кинетического момента КА есть величина постоянная. Так как время окончания переориентации Т не ограничено, требуемый поворотный маневр осуществим для любых условий разворота.

Сформулированы условия существования особого режима управления КА и проведен анализ такого режима. На основе условий трансверсальности как необходимых условий оптимальности, определены оптимальное время действия ненулевого управляющего момента и кинетическая энергия вращения на участке с особым режимом управления, а также модуль кинетического момента при движении по инерции. Доказано, что при оптимальном управлении кинетическая энергия вращения КА ограничена уровнем, который зависит только от коэффициентов a1, a2 минимизируемого функционала. В случае наличия участка с особым режимом управления модуль кинетического момента во время движения с нулевым моментом сил и максимальная кинетическая энергия вращения не зависят от мощности исполнительных органов и соответственно от длительности этапов набора и гашения угловой скорости.

Показано, что на всем интервале переориентации момент сил действует вдоль прямой, неподвижной в инерциальной системе координат. В общем случае оптимальным является релейное управление с двумя точками переключения, при котором весь разворот делится на раскрутку КА с максимально возможным управляющим моментом, вращение по инерции и торможение с максимально возможным управляющим моментом, противоположно направленным кинетическому моменту КА. Модуль управляющего момента при разгоне и торможении не меняется. Длительности участков разгона и торможения одинаковы (так как начальная и конечная угловые скорости равны нулю) и зависят от мощности исполнительных органов u0, коэффициентов функционала качества, взаимной ориентации начального и конечного положений КА и его моментов инерции. В случае неограниченного управления (когда u0 → ∞) времена разгона и торможения бесконечно малы, и практически на всем интервале движения КА вращается с постоянным относительно инерциальной системы координат кинетическим моментом. Другим предельным случаем является управление с одной точкой переключения, при котором участок неуправляемого движения отсутствует (длительность разгона и торможения максимальна и составляет половину времени разворота). Задача оптимального управления разворотом решается до конца; даны выражения для расчета ключевых характеристик маневра переориентации.

Описана процедура реализации оптимального управления переориентацией КА. Момент начала торможения определяется по фактическим параметрам движения (кватерниону рассогласования и кинетическому моменту), исходя из принципов терминального управления (используются информация об угловом положении КА и измерения угловой скорости). Структура построенного управления сравнительно проста, и оно легко может быть реализовано существующими бортовыми системами управления движением КА. Определены условия наличия участка с особым режимом управления, исходя из начального и конечного положений, инерционных характеристик КА и коэффициентов функционала качества. Дается описание конструктивной схемы решения краевой задачи принципа максимума для произвольных условий разворота и моментов инерции КА. Для динамически симметричного КА представлено законченное решение задачи переориентации в замкнутой форме, что придает практическую значимость проведенным исследованиям, поскольку реальные КА во многих случаях близки к телам с осевой симметрией. Записанная в аналитическом виде система уравнений (3.2) позволяет непосредственно найти решение краевой задачи принципа максимума и вычислить необходимые константы оптимального закона управления; при этом искомые значения параметров закона управления могут быть определены известным устройством [26]. Приводятся данные математического моделирования, иллюстрирующие характер движения КА во время оптимального разворота.

Разработанные алгоритмы управления позволяют совершать развороты за минимальное время с кинетической энергией вращения, не превышающей заранее установленного уровня. Известность максимальной кинетической энергии вращения позволяет погасить угловую скорость в экстренных случаях (в том числе при возникновении нештатной ситуации, когда требуется прервать маневр и как можно быстрее стабилизировать КА) за время, не превышающее заданного значения. Полученное управление, оптимальное по критерию (1.6), отличается от предыдущих решений [4, 5]. В [4] исследуется кинематическая задача оптимального разворота без каких-либо ограничений на управление, а в данной работе решена более сложная динамическая задача оптимального разворота с ограниченным управлением. В отличие от решения [4], где момент M и кинетический момент L перпендикулярны во время разворота, при управлении (2.12), (2.13) момент M и кинетический момент L параллельны. В отличие от задачи [5], для которой оптимальным является непрерывное управление, когда все управляющие функции – непрерывные гладкие функции времени и на всем интервале управления [0, T ] (кроме единственного момента времени t = Т/2) управляющий момент М отличен от нуля, в приведенном решении оптимально релейное управление (с одной или с двумя точками переключения в зависимости от наличия или отсутствия особого режима управления) и может существовать отрезок времени ненулевой продолжительности, на котором М = 0 и КА вращается по инерции. В оптимальном решении, представленном в работе [5], отсутствуют участки с постоянным модулем управляющего момента. В обеих задачах [4, 5] отсутствуют ограничения на управляющие переменные и время разворота задано. Различие в используемом критерии качества определило уникальность свойств оптимального по критерию (1.6) управления.

Список литературы

  1. Бpанец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М.: Наука, 1973. 320 с.

  2. Левский М.В. Синтез оптимального управления терминальной ориентацией космического аппарата с использованием метода кватернионов // Изв. РАН. МТТ. 2009. № 2.

  3. Левский М.В. Использование интеграла энергии в оптимальном управлении пространственной ориентацией космического аппарата // Изв. РАН. МТТ. 2009. № 4.

  4. Левский М.В. Об одном случае оптимального управления пространственной ориентацией космического аппарата // Изв. РАН. ТиСУ. 2012. № 4.

  5. Левский М.В. Квадратично оптимальное управление переориентацией космического аппарата за фиксированное время в динамической постановке // Изв. РАН. ТиСУ. 2018. № 1.

  6. Алексеев К.Б., Бебенин Г.Г. Управление космическими летательными аппаратами. М.: Машиностроение, 1974.

  7. Ваньков А.И. Адаптивное робастное управление угловым движением КА с использованием прогнозирующих моделей // Космич. исслед. 1994. Т. 32. Вып. 4–5.

  8. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Синтез алгоритмов переориентации космического аппарата на основе концепции обратной задачи динамики // Изв. РАН. ТиСУ. 2003. № 5.

  9. Алексеев К.Б., Малявин А.А., Шадян А.В. Экстенсивное управление ориентацией космического аппарата на основе нечеткой логики // Полет. 2009. № 1.

  10. Levskii M.V. About Method for Solving the Optimal Control Problems of Spacecraft Spatial Orientation // Problems of Nonlinear Analysis in Engineering Systems. 2015. V. 21. № 2.

  11. Раушенбах Б.В., Токарь Е.Н. Управление ориентацией космических аппаратов. М.: Наука, 1974.

  12. Молоденков A.В., Сапунков Я.Г. Особые режимы управления в задаче оптимального разворота сферически-симметричного космического аппарата // Изв. РАН. ТиСУ. 2009. № 6.

  13. Scrivener S., Thompson R. Survey of Time-optimal Attitude Maneuvers // Journal of Guidance, Control and Dynamics. 1994. V. 17. № 2.

  14. Shen H., Tsiotras P. Time-optimal Control of Axi-symmetric Rigid Spacecraft with Two Controls // AIAA J. Guidance, Control and Dynamics. 1999. V. 22. № 5.

  15. Молоденков A.В., Сапунков Я.Г. Решение задачи оптимального разворота осесимметричного космического аппарата с ограниченным и импульсным управлением при произвольных граничных условиях // Изв. РАН. ТиСУ. 2007. № 2.

  16. Бранец В.Н., Черток М.Б., Казначеев Ю.В. Оптимальный разворот твердого тела с одной осью симметрии // Космич. исслед. 1984. Т. 22. Вып. 3.

  17. Liu S., Singh T. Fuel/time Optimal Control of Spacecraft Maneuvers // J. Guidance. 1996. V. 20. № 2.

  18. Левский М.В. Задача оптимального по быстродействию управления переориентацией космического аппарата // ПММ. 2009. № 1.

  19. Левский М.В. Использование универсальных переменных в задачах оптимального управления ориентацией космических аппаратов // Мехатроника, автоматизация, управление. 2014. № 1.

  20. Левский М.В. Система управления пространственным разворотом космического аппарата. Патент на изобретение РФ № 2006431 // Бюллетень “Изобретения. Заявки и патенты”. 1994. № 2. Опубликован 20.01.1994.

  21. Левский М.В. Применение принципа максимума Л.С. Понтрягина к задачам оптимального управления ориентацией космического аппарата // Изв. РАН. ТиСУ. 2008. № 6.

  22. Левский М.В. К вопросу оптимального успокоения космического аппарата // Изв. РАН. ТиСУ. 2011. № 1.

  23. Маркеев А.П. Теоретическая механика. М.: Наука, 1999.

  24. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В. и др. Математическая теория оптимальных процессов. М.: Наука, 1983.

  25. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. М.: Мир, 1974.

  26. Левский М.В. Устройство формирования параметров регулярной прецессии твердого тела. Патент на изобретение РФ № 2146638 // Бюллетень “Изобретения. Заявки и патенты”. 2000. № 8. Опубликован 20.03.2000.

Дополнительные материалы отсутствуют.