Автоматика и телемеханика, № 2, 2020
© 2020 г. А.Ф. ШОРИКОВ, д-р физ.-мат. наук (afshorikov@mail.ru)
(Уральский федеральный университет, Екатеринбург),
В.И. КАЛЕВ (butahlecoq@gmail.com)
(АО “НПО автоматики”, Екатеринбург)
РЕШЕНИЕ ЗАДАЧИ МИНИМАКСНОГО ПРОГРАММНОГО
УПРАВЛЕНИЯ РАСХОДОМ ТОПЛИВА РАКЕТЫ-НОСИТЕЛЯ1
Предлагается математическая формализация и способ решения за-
дачи минимаксного программного терминального управления расходом
топлива двигательной установки ракеты-носителя. Исходная нелинейная
модель объекта управления линеаризуется вдоль опорной траектории
и аппроксимируется линейной дискретной динамической системой. Для
аппроксимирующей системы формулируется задача минимаксного про-
граммного терминального управления с учетом заданных геометрических
ограничений на векторы управления и возмущения. Предлагается новый
метод и численный алгоритм решения задачи, которые для построения
обобщенных областей достижимости линейной дискретной управляемой
системы используют модификацию общего рекуррентного алгебраическо-
го метода. Эффективность предлагаемого решения исследуемой задачи
демонстрируется на примере компьютерного моделирования.
Ключевые слова: адаптивное управление, минимаксный результат, гаран-
тированное управление, робастное управление, управление расходом топ-
лива, двигательная установка, ракета-носитель.
DOI: 10.31857/S0005231020020063
1. Введение
Задача терминального управления расходом топлива двигательной уста-
новки (ДУ) является одной из основных задач управления, решаемых для
жидкостных ракет-носителей (РН). Суть этой задачи заключается в рацио-
нализации использования рабочих запасов компонентов топлива, требуемых
для отработки программной траектории движения РН. Основная идея по-
добной рационализации может быть сведена к решению задачи синхронного
и полного опорожнения топливных баков окислителя и горючего к заданно-
му моменту времени. Другими словами, критерием качества в терминальной
постановке рассматриваемой задачи служит величина отклонения фазовых
координат объекта управления от их желаемых значений в финальный мо-
мент времени.
Известно (см., например, [1-3]), что при моделировании объектов управле-
ния ракетно-космической техники информация об априорно неопределенных
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных
исследований (проект № 18-01-00544).
76
параметрах системы (начальном фазовом состоянии, возможных реализаци-
ях возмущения) обычно представляется в виде ограниченных множеств воз-
можных значений этих параметров.
В данной статье рассматривается исходная нелинейная модель объекта
управления и ее линейная дискретная аппроксимация относительно заданно-
го опорного режима функционирования, в которой учитывается возмущение,
описывающее возникающую в процессе моделирования (аппроксимации) по-
грешность. Предполагается, что ограничения на априорно неопределенные
значения возмущения в рассматриваемом процессе управления являются вы-
пуклыми, замкнутыми и ограниченными многогранниками (с конечным чис-
лом вершин) в соответствующих конечномерных векторных пространствах
(далее, для краткости, будем писать просто “многогранник”, подразумевая
все указанные выше свойства), а множества значений управляющих воздей-
ствий являются конечными множествами. Для формализации рассматривае-
мой задачи оптимизации режимов расхода топлива жидкостной ДУ РН ис-
пользуется минимаксный подход [4-6], предполагающий нахождение такого
управляющего воздействия, которое минимизирует наихудшие (максималь-
ные) значения выбранного критерия качества, соответствующие возможным
наихудшим реализациям допустимых значений возмущения.
Для решения задачи минимаксного программного терминального управ-
ления расходом топлива жидкостной ДУ РН в статье применяется детерми-
нированный подход, основанный на результатах публикаций [6-12]. В этом
подходе предполагается, что априорно неопределенные параметры системы
принимают свои значения из некоторых известных множеств, имеющих вид
многогранников. В качестве исходной модели рассматривается нелинейная
модель функционирования ДУ РН. Сформированная модель динамики ДУ
РН линеаризуется относительно заданного опорного режима функциониро-
вания, а затем дискретизируется и приводится к линейному рекуррентному
виду [6, 11].
Для линейных дискретных управляемых динамических систем с геомет-
рическими ограничениями на векторы состояния и управления в виде много-
гранников в [6-9] Шориковым А.Ф. был разработан и описан эффективный
общий рекуррентный алгебраический метод построения областей достижи-
мости, который базируется на полугрупповом свойстве выпуклых многогран-
ных областей достижимости [6] и свойствах конечных систем линейных ал-
гебраических уравнений и неравенств. В методе используются возможности
симплекс-метода для решения задач линейного математического программи-
рования, а также способы преобразования описания многогранников с по-
мощью соответствующих систем линейных алгебраических неравенств в их
описание с помощью конечного числа вершин и наоборот.
Предлагаемое решение задачи минимаксного программного терминально-
го управления расходом топлива ДУ РН для сформированной линейной дис-
кретной управляемой динамической системы основывается на результатах
публикаций [6, 8, 9] и базируется на общем рекуррентном алгебраическом
методе построения областей достижимости для таких динамических систем
и на алгебраических операциях над выпуклыми многогранными множества-
ми [6, 13].
77
Для реализации этих методов Шориковым А.Ф. были разработаны соот-
ветствующие численные алгоритмы, которые послужили основой для созда-
ния Шориковым А.Ф. и Тюлюкиным В.А. компьютерного программного ком-
плекса, описание и применение которого представлено в [6-10].
Отметим, что общий рекуррентный алгебраический метод построения об-
ластей достижимости применим для линейных дискретных управляемых ди-
намических систем любой конечной размерности, а его компьютерная реали-
зация ограничена только ресурсами памяти и быстродействием используемой
компьютерной платформы. Поэтому для задач программного управления, ко-
торые решаются, как правило, задолго до непосредственного использования
управляемого объекта (т.е. время решения задачи не ограничено), использо-
вание данного метода оправдано.
В данной статье для разработки алгоритма решения рассматриваемой за-
дачи в части построения обобщенных областей достижимости использует-
ся модификация общего рекуррентного алгебраического метода построения
областей достижимости, описанная в [12]. В заключительной части данной
статьи представлены результаты компьютерного моделирования применения
предлагаемого метода и численного алгоритма для решения задачи мини-
максного программного терминального управления расходом топлива ДУ
РН на конкретном модельном примере. Моделирование осуществлялось с
использованием созданного авторами специализированного компьютерного
программного комплекса.
2. Формирование модели расхода топлива ДУ РН
На промежутке времени [τ0, τf ] рассматривается математическая модель
[11], описывающая режим работы жидкостной ДУ третьей ступени РН (здесь
τ0 — время выхода на режим и τf — время выключения ДУ). Управляю-
щее воздействие (далее — управление) в данной модели в силу конструк-
тивных особенностей тракта управления расходом топлива РН реализует-
ся в заданные дискретные моменты времени0, τ1, . . . , τT-1} ⊂ [τ0, τf ], где
τT = τf, в соответствие которым может быть поставлен целочисленный на-
бор 0, T - 1 = {0, 1, . . . , T - 1} (T ∈ N) (здесь T — количество заданных мо-
ментов времени, в которые планируется осуществлять реализацию управляю-
щего воздействия; здесь и далее N —- множество всех натуральных чисел).
С помощью управления u(t) на целочисленном промежутке времени 0, T - 1
регулирование угла поворота дросселя αth(t) может быть описано рекуррент-
ным соотношением
(1)
αth(t + 1) = αth(t) + c0u(t), t ∈ 0,T - 1, αth
(0) = 0,
где c0 — известный коэффициент привода дросселя. Отметим, что значение
угла поворота дросселя α(t) при t ∈ [τt, τt+1), t ∈ 0, T - 1, имеет фиксирован-
ное значение, т.е. не изменяется.
От угла поворота дросселя αth(τ) зависит значение коэффициента соотно-
шения расходов окислителя и горючего [14], вычисляемое по формуле
(2)
Km(τ) = K + ΔK + c1αth(τ), τ ∈ [τ0f
],
78
где K — проектное значение коэффициента соотношения расходов компо-
нентов топлива; ΔK — измеряемый в начальный момент времени параметр
выставки дросселя в исходное положение; c1 — известный коэффициент эф-
фективности дросселя.
Выражение для вычисления тяги ДУ третьей ступени РН в пустоте имеет
вид
(3)
Ps(τ) = P + c2(Km(τ) - K)2 + c3(Km(τ) - K), τ ∈ [τ0f
],
где P — проектное значение пустотной тяги ДУ; c2, c3 — известные коэффи-
циенты рабочего режима ДУ.
Удельный импульс тяги ДУ в пустоте вычисляется по формуле
(4)
Isp(τ) = I + c4(Km(τ) - K)2 + c5(Km(τ) - K), τ ∈ [τ0f
],
где I — проектное значение удельного импульса тяги ДУ; c4, c5 — известные
коэффициенты рабочего режима ДУ.
Значения массовых расходов окислителя и горючего из топливных баков
определяются соответственно так:
Ps(τ)Km(τ)
mo(τ) =
,
τ ∈ [τ0f],
Isp(τ)(1 + Km(τ))
(5)
Ps(τ)
mf(τ) =
,
τ ∈ [τ0f].
Isp(τ)(1 + Km(τ))
Текущие значения масс окислителя и горючего в топливных баках зависят
от значений их массовых расходов (5) и могут быть вычислены посредством
формул
τ
Mo(τ) = Mномo + ΔMo - mo(τ)dτ, τ ∈ [τ0f],
τ0
(6)
τ
Mf(τ) = Mномf + ΔMf - mf(τ)dτ, τ ∈ [τ0f ],
τ0
где Mномo, Mномf — номинальные массы рабочих запасов окислителя и горю-
чего; ΔMo, ΔMf — измеряемые в начальный момент времени параметры за-
правки топливных баков.
Уравнения (5), (6) исходной нелинейной модели для массовых расходов
окислителя mo(τ) и горючего mf (τ) и для масс окислителя Mo(τ) и горючего
Mf(τ), линеаризуются (разложением в ряд Тейлора) относительно опорной
траектории:
PK
PK
mrefo(τ) =
,
Mrefo(τ) = Mномo -
τ,
I+IK
I+IK
(7)
mreff(τ) =P
,
Mreff(τ) = Mномf -P
τ,
I+IK
I+IK
79
после чего линеаризованная модель приводится к дискретному виду, со-
ответствующему дискретным реализациям управления в моменты времени
0, τ1, . . . , τT-1}.
Рассмотрим на целочисленном промежутке времени 0, T поставленную
в соответствие исходной нелинейной непрерывной модели (1)-(6) линейную
дискретную динамическую модель.
Значения массовых расходов компонентов топлива из баков вычисляются
по рекуррентным дискретным соотношениям
mo(t + 1) = mo(t) + αu(t) + γ1w1(t), mo(0) = mномo + αΔK,
(8)
mf(t + 1) = mf (t) + βu(t) + γ2w2(t), mf (0) = mномf + βΔK,
где t ∈ 0, T - 1; α, β — полученные при линеаризации коэффициенты, равные
c0c1P
c0c1c3K
c0c1PK
c0c1c5PK
α=
+
-
-
,
I(1 + K)
I(1 + K)
I(1 + K)2
I2(1 + K)
c0c1P
c0c1c5P
c0c1c3
β =
+
-
;
I(1 + K)2
I2(1 + K)
1+K
u(t) — скалярное управление; mномo, mномf — номинальные значения массовых
расходов окислителя и горючего; w1(t), w2(t) — неконтролируемое возмуще-
ние (погрешность формирования модели); γ1, γ2 — коэффициенты, оценивае-
мые путем численного моделирования исходной и аппроксимирующей систем.
Дискретные рекуррентные уравнения, позволяющие определить значения
масс окислителя и горючего в топливных баках, имеют вид
Mo(t + 1) = Mo(t) - ΔT(t)mo(t), Mo(0) = Mномo + ΔMo,
(9)
Mf (t + 1) = Mf (t) - ΔT(t)mf(t), Mf(0) = Mномf + ΔMf, t ∈ 0,T - 1,
где ΔT (t) — расчетное значение времени между двумя соседними управле-
ниями.
Динамические уравнения объекта управления (8), (9) могут быть записа-
ны в рекуррентном векторно-матричном виде
(10)
x(t + 1) = A(t)x(t) + B(t)u(t) + D(t)w(t), x(0) = x0,
где x(t) R4 — фазовый вектор системы (здесь и далее, Rn n-мерное век-
торное пространство векторов-столбцов; n ∈ N, N — множество всех нату-
ральных чисел); A(t) R4×4, B(t) R4×1, D(t) R4×2 — соответственно мат-
рицы состояния, управления и возмущения системы, имеющие вид
1
0
0
0
α
1
0
-ΔT(t)
1
0
0
0
0
0
A(t) =
, B(t)=B =
, D(t)=D =
0
0
1
0
β
0
-1
0
0
-ΔT(t)
1
0
0
0
80
для t ∈ 0, T - 1; x(0) = x0 — заданное начальное значение фазового вектора,
равное
mномo + αΔK
Mномo + ΔMo
x(0) = x0 =
;
mномf + βΔK
Mномf + ΔMf
u(t) R1 — управление, стесненное заданным ограничением
(11)
u(t) U1(t) R1
,
t ∈ 0,T - 1;
w(t) R2 — возмущение (погрешность моделирования), значения которого
выбираются в зависимости от сформированного на этапе линеаризации огра-
ничения
(12)
w(t) W1(t) R2
,
t ∈ 0,T - 1.
Для ограничений (11) и (12) выполняются следующие условия.
Предположение 1. Множество U1(t) ∀t ∈ 0,T - 1 представляет собой
конечный набор векторов в R1, определяющий все возможные значения
управления в момент времени t.
Предположение 2. Множество W1(t) R2 ∀t ∈ 0,T - 1, ограничива-
ющее возмущение на шаге t, является многогранником в векторном простран-
стве R2.
Для промежутка времени 0, T и ограничения (11) введем в рассмот-
рение множество всех допустимых реализаций программных управлений
u(·) = {u(t)}t∈0,T-1, описываемое соотношением, которое является конечным
множеством,
{
}
U(0, T ) = u(·) | u(·) = {u(t)}t∈0,T-1 R1×T ∀t ∈ 0, T - 1, u(t) U1(t)
(13)
Аналогично для промежутка времени 0, T и ограничения (12) введем в
рассмотрение множество всех допустимых реализаций вектора возмущений
w(·) = {w(t)}t∈0,T-1:
{
}
(14)
W(0, T ) = w(·) | w(·) = {w(t)}t∈0,T-1 R2×T ∀t ∈ 0, T -1, w(t)W1(t) .
Рассматриваемый процесс управления будем оценивать терминальным
функционалом Φ : R4 × U(0, T ) × W(0, T ) R1, определенным на допусти-
мых в дискретной динамической системе (10)-(14) реализациях наборов
(x0, u(·), w(·)) R4 × U(0, T ) × W(0, T ) и значения которого в финальный
момент времени T определяются как
(15)
Φ(x0, u(·), w(·)) = ∥x(T ) - xd4
= F(x(T)),
где x(T ) = x(T ; 0, T , x0, u(·), w(·)) R4 — финальное фазовое состояние дви-
жения системы (10); xd R4 — вектор, определяющий расчетное (номиналь-
ное) финальное фазовое состояние системы (10); F : R4 R1 — выпуклый
функционал; ∥ · ∥4 — евклидова норма в пространстве R4.
81
3. Постановка задачи минимаксного программного терминального
управления расходом топлива ДУ РН
Сформулируем содержательно задачу минимаксного программного тер-
минального управления расходом топлива ДУ РН.
Для дискретной динамической системы
(10) с ограничениями
(11)-
(14) требуется найти такое допустимое программное управление u(e)(·) =
= {u(e)(t)}t∈0,T-1 U(0, T ), которое оптимизирует (минимизирует) гаранти-
рованный (наибольший) результат рассматриваемого процесса управления,
оцениваемый функционалом (15), по сравнению с результатами, возможными
при любых допустимых управлениях u(·) = {u(t)}t∈0,T-1 U(0, T ) и любых
реализациях возмущений w(·) = {w(t)}t∈0,T-1 W(0, T ), т.е. такое управле-
ние, при котором будет выполняться условие
(16)
Φ(x0, u(e)(·), w(·))
max Φ(x0
, u(·), w(·)).
w(·)W(0,T )
Условие (16) называется условием минимакса [4-6].
Тогда для линейной дискретной динамической системы (10) с ограниче-
ниями (11)-(14) можно сформулировать задачу минимаксного программного
терминального управления расходом топлива ДУ РН.
Задача. Для заданного целочисленного промежутка времени
0, T
и начального фазового вектора системы x(0) = x0 требуется най-
ти множество U(e)(0,T,x(0)) U(0,T) программных управлений u(e) =
= {u(e)(t)}t∈0,T-1 U(0, T ), удовлетворяющих условию минимакса
{
{
}
(17) U(e)(0, T , x(0)) = u(e)(·) | u(e)(·) = u(e)(t)
U(0, T ),
t∈0,T -1
Φ(e) = Φ(x0,u(e)(·),w(e)(·)) =
max Φ(x0, u(e)(·), w(·)) =
w(·)W(0,T )
}
= min
max Φ(x0, u(·), w(·))
,
u(·)U(0,T ) w(·)W(0,T )
которое будем называть множеством минимаксных программных управле-
ний для данной задачи, а число Φ(e) будем называть ее минимаксным ре-
зультатом.
Как было показано в [6, 9], из-за конечности множества допустимых про-
граммных управлений U(0, T ) и свойств, используемых общим рекуррентным
алгебраическим методом при построении областей достижимости линейных
дискретных управляемых систем, решение сформулированной многошаговой
задачи существует и сводится к реализации конечной последовательности
решения только одношаговых задач: поиска крайних опорных вершин мно-
гогранников (путем нахождения решений сформированных задач линейного
математического программирования), выполнения алгебраических операций
для преобразования их вершинного описания в описание соответствующими
конечными системами линейных алгебраических уравнений и неравенств и
выпуклого математического программирования.
82
4. Алгоритм решения задачи
Для решения сформулированной задачи используются результаты из
[6-12] и аппарат построения и анализа областей достижимости динамических
систем, который нашел широкое применение в теоретических и прикладных
задачах [3-6]. Введем в рассмотрение понятие обобщенной области достижи-
мости [4, 6].
Определение 1. Обобщенной областью достижимости фазовых со-
стояний линейной дискретной управляемой динамической системы (10)
с ограничениями (11)-(14) при фиксированном допустимом программном
управлении u(·) = {u(t)}t∈0,T-1 U(0, T ) на момент времени T , соответ-
ствующей набору (x0,u(·)), называется множество, определяемое соотно-
шением
(18) G(0, x0, u(·); T ) =
{
= x(T)|x(T) R4,x(t + 1) = A(t)x(t) + B(t)u(t) + D(t)w(t),
}
t ∈ 0,T - 1,x(0) = x0,w(t) W1(t)
В силу принятых предположений о том, что множества в ограничении (12)
относятся к классу многогранников, в [6] было показано, что множество, опи-
сывающее обобщенную область достижимости такой динамической системы,
будет также принадлежать к классу многогранников.
Известно (см., например, [6, 13, 15]), что любой многогранник может быть
представлен двумя способами: как выпуклая оболочка конечной системы век-
торов и как множество решений конечной системы линейных алгебраических
равенств и неравенств.
Определение 2. Множество из k ∈ N крайних точек, задаваемых на-
бором векторов vi Rn, i ∈ 1,k, выпуклая оболочка которых является мно-
гогранником P ∈ Rn, называется вершинным описанием этого многогранни-
ка:
(19)
P = convhull(v1,v2,...,vk), viRn,
i = 1,k.
Определение 3. Система из m ∈ N линейных неравенств и l ∈ N ли-
нейных уравнений, определяющая многогранник P ∈ Rn, называется фасет-
ным описанием этого многогранника:
(20)
P = {x ∈ Rn|Ax b,Aex = be}, A∈Rm×n, b∈ Rm, Ae Rl×n, be Rl.
Приведем описание общего рекуррентного алгебраического метода [6-8]
построения обобщенных областей достижимости линейных дискретных
управляемых систем вида (18).
Алгоритм (построение обобщенных областей достижимости).
0. Инициализация: X(0) = {x0}, u(·) = {u(t)}t∈0,T-1 U(0, T ).
83
1. Для всех t ∈ 0, T - 1 последовательно выполнить:
X(t + 1) = (A(t)X(t) + B(t)u(t)) ⊕ D(t)W1(t);
X(t + 1) = RemoveRedundancy(X(t + 1)).
2. Закончить.
В основе общего рекуррентного алгебраического метода построения об-
ластей достижимости
[6-9] лежит полугрупповое (эволюционное) свой-
ство областей достижимости G(t, X(t), u(·); t + 1) ∀t ∈ 1, T - 1. Операция
RemoveRedundancy в алгоритме обозначает решение задачи нахождения
крайних точек приведенного внутри скобок множества точек и решается как
задача линейного математического программирования способом, предложен-
ным в [7]. Операция суммирования множеств в данном алгоритме понимается
как сумма Минковского (геометрическая сумма) этих множеств и обозначена
с помощью символа.
Отметим, что согласно [6] в данной статье для линейных преобразований,
геометрической суммы множеств и нахождения их крайних точек при по-
строении областей достижимости используется вершинный способ описания
многогранников (19), а фасетное описание (20) области достижимости необ-
ходимо для формирования задачи поиска экстремума целевого функционала
на этом множестве и возможности использования методов математического
программирования для ее решения.
Учитывая изложенное и результаты из [6-12], решение задачи минимакс-
ного программного терминального управления расходом топлива ДУ РН
может быть сведено к решению подзадач в следующей последовательно-
сти:
1. Упорядочение по возрастанию натурального индекса j конечного мно-
жества U(0, T ), состоящего из N допустимых программных управлений
u(j)(·) = {u(j)(t)}t∈0,T-1 U(0,T), т.е. формирование множества U(0,T) =
= {u(j)(t)}j∈1,N ;
2. Построение обобщенных областей достижимости G(0, X(0), u(j)(·); T )
при фиксированных допустимых управлениях u(j)(·) = {u(j)(t)}t∈0,T-1
U(0, T ) для всех j ∈ 1, N , где X(0) = x0;
3. Формирование
двойственного
описания
многогранников
G(0, X(0), u(j)(·); T ), j = 1, N , т.е. нахождение фасетного описания
(20)
каждого многогранника по его вершинному описанию
(19) (операцию
формирования двойного описания множества достижимости предлагается
реализовывать, например, с использованием модификации метода двойного
описания [6, 13], представленной в статье [16]);
4. Оптимизация функционала (15) на множестве G(0, X(0), u(j)(·); T ) для
всех j ∈ 1, N методами выпуклого математического программирования, т.е.
нахождение значения функционала:
Φ(e) = Φ(x0, u(j)(·), w(e)(·)) =
max Φ(x0, u(j)(·), w(·)) =
w(·)W(0,T )
(21)
=
max
∥x(T ) - xd4 = ∥x(e)(T ) - xd4,
x(T )G(0,X(0),u(j) (·);T )
84
где x(T ) = x(T ; 0, T , x0, u(j)(·), w(·)); x(e)(T ) = x(T ; 0, T , x0, u(j)(·), w(e)(·)) (ре-
шается, например, с помощью метода Зойтендейка [17]).
5. Нахождение множества U(e)(0, T , x(0)) минимаксных программных
управлений и числа Φ(e) — гарантированного (минимаксного) результата ре-
шения рассматриваемой задачи путем решения задачи дискретной оптими-
зации
U(e)(0,T,x(0)) =
{
= u(e)(·)|u(e)(·) U(0,T), min
max Φ(x0, u(·), w(·)) =
u(·)U(0,T ) w(·)W(0,T )
}
= minΦ(j) = Φ(e)
j∈1,N
Из результатов [6-9] следует, что сформированное множество допустимых
программных управлений U(e)(0, T , x(0)) есть множество всех минимаксных
программных управлений, являющихся решением рассматриваемой задачи.
5. Численный пример решения задачи
Продемонстрируем эффективность предлагаемого метода решения задачи
на численном примере, в котором моделируется решение задачи минимакс-
ного программного терминального управления расходом топлива ДУ третьей
ступени РН [11, 12].
Исходная нелинейная система описывается на промежутке времени [τ0, τf ]
уравнениями (1)-(6), значения параметров которых приведены в табл. 1.
В соответствие исходной нелинейной модели поставлена сформирован-
ная линейная система, полученная посредством линеаризации вдоль опорной
траектории, описываемой уравнениями (7), и последующей дискретизации.
Предполагается, что допустимые моменты выбора (переключения) управ-
ляющего воздействия в исходной нелинейной системе (1)-(6) совпадают с
целочисленными значениями промежутка 0, T - 1. Таким образом, система
векторно-матричных линейных рекуррентных соотношений, описывающая
динамику системы, соответствует уравнениям (8), (9) и имеет вид
x(t + 1) = A(t)x(t) + B(t)u(t) + D(t)w(t), t ∈ 0, 3,
где x(t) = {x1(t), x2(t), x3(t), x4(t)} ∈ R4; x1(t) — массовый расход окислителя;
x2(t) — масса окислителя в баке; x3(t) — массовый расход горючего; x4(t) —
масса горючего в баке; x(0) = x0 = (1182,074; 119560; 459,832; 45260);
Таблица 1. Значения параметров нелинейной системы
I, с P, кгс
K Mномo, кг Mномf, кг ΔMo, кг ΔMf , кг ΔK
320
528000
8/3
120000
45000
-440
260
-12/125
c0
c1
c2
c3
c4
c5
τ0, с
τf , с
8
1/75
-6700
9000
-15
-12
0
100
85
86
u(t) R1 — скалярное управляющее воздействие, принимающее свои зна-
чения на конечном множестве U1(t) = {0,6; 0,3; 0; -0,3; -0,6} ∀t ∈ 0, 3 и
соответствующее дискретным положениям вала привода дросселя; w(t)
W1(t) R2 — погрешность формирования модели, причем элементы огра-
ничивающего множества W1(t) принимают значения согласно неравенствам
-0,1 - 0,1t w1(t) 0,1 + 0,1t,
-0,1 - 0,3t w2(t) 0,1 + 0,3t.
Матрицы A(t), B(t) и D(t) в аппроксимирующей системе принимают значе-
ния:
1
0
0
0
20,073
1
0
-25 1
0
0
0
0
0
A(t) =
, B(t)=
, D(t)=
∀t ∈ 0,3.
0
0
1
0
-10,473
0
-1
0
0
-25 1
0
0
0
Качество процесса управления в данной задаче оценивается значением вы-
пуклого терминального функционала в финальный момент времени T = 4:
F (x(T )) =
(x1(T ) - 1200)2 + (x2(T ))2 + (x3(T ) - 450)2 + (x4(T ))2,
обозначающее расстояние (евклидова норма) от финального состояния x(T )
до номинального (желаемого) финального состояния xd = (1200; 0; 450; 0).
В соответствии с описанным выше методом решения задачи для конечных
множеств U1(t), описывающих множества всех допустимых значений управ-
ляющего воздействия в моменты времени t, было сформировано упорядо-
ченное множество U(0, T ) = {u(j)(t)}j∈1,N , состоящее из N = 5T = 625 допу-
стимых программных управлений. Для каждого допустимого программного
управления {u(j)(t)}j∈1,625 были построены соответствующие обобщенные об-
ласти достижимости (18) посредством модификации общего рекуррентного
алгебраического метода построения областей достижимости [12] (см. рису-
нок), и каждая из сформированных областей достижимости после вычисле-
ния ее фасетного описания использовалась в качестве линейных ограничений
при решении задачи оптимизации (максимизации) вида (21). В результате ре-
шения этой задачи максимизации был сформирован конечный набор число-
вых значенийΦ(j) = Φ(x0, u(j)(·), w(e)(·)), j ∈ 1, 625, — наихудших значений
функционала качества, соответствующих множеству всех допустимых про-
граммных управлений {u(j)(t)}j∈1,625. В результате проделанных вычисле-
ний было найдено итоговое множество программных минимаксных управле-
ний U(e)(0, T , x(0)), которое состоит из единственного допустимого программ-
ного управления u(e)(·) = {u(e)(t)}t∈0,3 = {0,6; 0,6; -0,3; 0}, гарантирующего
результат решения задачи не хуже, чем Φ(e) = 67,12, т.е. выполнение усло-
вия (16).
На рисунке представлены проекции фазовых траекторий исходной систе-
мы (1)-(6) и аппроксимирующей линейной дискретной системы (10), порож-
денные найденным минимаксным программным управлением u(e)(·). При ис-
пользовании этого управления u(e)(·) в исходной нелинейной системе (1)-(6)
87
Таблица 2. Результаты решения задачи минимаксного программного управления
Управление x1(T ), x2(T ), x3(T ), x4(T ), F (x(T ))
кг/c
кг
кг/c
кг
Опорная траектория u(t) 0
1200
0
450
0
0
Исходная система
u(e)(·)
1200,14
-2,29
450,41
-16,25
14,05
Линейная система
u(e)(·)
1201,14
-27,29
452,61
-61,25
67,12
финальное фазовое состояние приняло значение x(τ1) = (1200,139; -2,294;
450,406; -16,254), в котором функционал (15), оценивающий качество
процесса управления в исходной нелинейной системе, принял значение
F (x(τ1)) = 14,048. Отрицательные значения масс окислителя и горючего
(вторая и четвертая компоненты вектора x(τ1)) не противоречат физиче-
скому смыслу и могут трактоваться как количества (массы) компонентов
топлива, которые потребуется взять из гарантийных запасов, которые всегда
резервируются в топливных баках любой РН для компенсации возмущений
и помех [1, 14].
В табл. 2 сведены результаты применения найденного управления к нели-
нейной системе и результаты для наихудшего случая в линейной аппрокси-
мирующей системе.
Численное моделирование решения модельной задачи проводилось в про-
граммной среде MATLAB R2014a на персональном компьютере с процес-
сором Intel ©Core i7-3770 CPU @ 3,4 GHz, с оперативной памятью 8 Gb и
с видеокартой NVIDIA GeForce GT 730. Время решения задачи состави-
ло 37 с. Из результатов компьютерного моделирования можно сделать вы-
вод, что сформированное множество минимаксных программных управлений
U(e)(0,T,x(0)) при его использовании для управления процессом расхода топ-
лива ДУ третьей ступени жидкостных РН на основе уравнения динамики ис-
ходной нелинейной системы обеспечивает гарантированный (минимаксный)
результат не хуже, чем результат управления в соответствующей аппрокси-
мирующей линейной дискретной системе при возможных наихудших реали-
зациях возмущений (погрешностей аппроксимации).
6. Заключение
В статье приведено описание нелинейной динамической системы, описы-
вающей динамику расхода топлива жидкостных ДУ РН. Задача оптимизации
управления расходом топлива ДУ РН сформулирована как задача минимакс-
ного программного терминального управления линейной дискретной дина-
мической системой с выпуклым функционалом качества, соответствующей
исходной нелинейной динамической системе. В статье подробно описан пред-
лагаемый метод решения задачи минимаксного программного терминального
управления расходом топлива ДУ РН.
Сформулированная многошаговая минимаксная задача решается путем
реализации конечной последовательности только одношаговых оптимизаци-
онных операций. На основе описанного метода решения рассматриваемой за-
дачи был разработан численный алгоритм и получены численные результаты
88
компьютерного моделирования решения задачи для математической модели
работы ДУ третьих ступеней РН.
Результаты компьютерного моделирования показывают эффективность
общего рекуррентного алгебраического метода [6-9] для решения рассмат-
риваемой задачи и позволяют сделать вывод о применимости алгоритмов
минимаксного программного терминального управления в задачах управле-
ния реальной ДУ РН.
СПИСОК ЛИТЕРАТУРЫ
1.
Петров Б.Н. Избранные труды. Т. 2. Управление авиационными и космически-
ми аппаратами. М.: Наука, 1983.
2.
Иванов Н.М., Лысенко Л.Н., Мартынов А.И. Методы теории систем в задачах
управления космическим аппаратом. М.: Наука, 1968.
3.
Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. М.: Мир,
1972.
4.
Красовский Н.Н. Теория управления движением. М.: Наука, 1968.
5.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры.
М.: Наука, 1974.
6.
Шориков А.Ф. Минимаксное оценивание и управление в дискретных динамиче-
ских системах. Екатеринбург: Изд-во Урал. ун-та, 1997.
7.
Тюлюкин В.А., Шориков А.Ф. Об одном алгоритме построения области дости-
жимости линейной управляемой системы / Негладкие задачи оптимизации и
управление. 1988. С. 55-61.
8.
Тюлюкин В.А., Шориков А.Ф. Алгоритм решения задачи терминального управ-
ления для линейной дискретной системы // АиТ. 1993. № 4. С. 115-127.
Tyulyukin V.A., Shorikov A.F. Algorithm for Solving Terminal Control Problems for
a Linear Discrete System // Autom. Remote Control. 1993. V. 54. No. 4. Part 2.
P. 632-643.
9.
Шориков А.Ф. Алгоритм решения задачи оптимального терминального управле-
ния в линейных дискретных динамических системах / Информационные техно-
логии в экономике: теория, модели и методы. Сб. научн. тр. Урал. гос. экон. ун-
та. 2005. С. 119-138.
10.
Шориков А.Ф., Тюлюкин В.А. Описание библиотеки компьютерных программ
для моделирования решения задачи апостериорного минимаксного оценива-
ния // Изв. Уральск. гос. экон. ун-та. 1999. № 2. С. 36-49.
11.
Шориков А.Ф., Калев В.И. Формирование линейной дискретной динамической
модели для решения задачи оптимального терминального управления расходом
топлива ракеты-носителя // Информационные технологии и системы. Тр. 5-й
Междунар. науч. конф. 2016. С. 61-66.
12.
Шориков А.Ф., Булаев В.В., Горанов А.Ю., Калев В.И. Аппроксимация об-
ластей достижимости нелинейных дискретных управляемых динамических си-
стем // Вестник Бурятского государственного университета. Математика, ин-
форматика. 2018. № 1. С. 52-65.
13.
Черников С.Н. Линейные неравенства. М.: Наука, 1968.
14.
Челомей В.Н. Пневмогидравлические системы двигательных установок с жид-
костными ракетными двигателями. М.: Машиностроение, 1978.
89
15. Бастраков С.И., Золотых Н.Ю. Использование идей алгоритма Quickhull в ме-
тоде двойного описания // Вычислительные методы и программирование. 2011.
Т. 12. С. 232-237.
16. Fukuda K., Prodon P. Double Description Method Revisited // Lect. Notes in
Comput. Sci. 1996. V. 1120. P. 91-111.
17. Зойтендейк Г. Методы возможных направлений. М.: Изд-во ин. лит., 1963.
Статья представлена к публикации членом редколлегии П.С. Щербаковым.
Поступила в редакцию 07.04.2019
После доработки 10.07.2019
Принята к публикации 18.07.2019
90