ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2023, том 59, № 8, с.1110-1122
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977.5
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
В ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧЕ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СИСТЕМОЙ
ДРОБНОГО ПОРЯДКА
© 2023 г. М. И. Гомоюнов, Н. Ю. Лукоянов
Рассматривается задача оптимального управления динамической системой, описываемой
линейным дифференциальным уравнением с дробной производной Капуто, на минимум
квадратичного терминально-интегрального показателя качества. Предлагается и обосно-
вывается конструкция оптимальной обратной связи (синтеза оптимальных управлений),
которая для любого начального состояния системы порождает соответствующее оптималь-
ное управление.
DOI: 10.31857/S0374064123080101, EDN: IQHXOO
Введение. В статье рассматривается задача оптимального управления на конечном про-
межутке времени, в которой движение динамической системы описывается линейным диффе-
ренциальным уравнением с дробной производной Капуто порядка α ∈ (1/2, 1) (см., например,
[1-3]), а целью управления является минимизация квадратичного терминально-интегрального
показателя качества. Отличительная особенность систем дробного порядка состоит в прису-
щем им эффекте памяти (определённого вида), обусловленном наследственным характером
дробных производных. Эта особенность выступает одной из основных причин для использова-
ния таких систем при математическом моделировании реальных процессов, обладающих по-
добными эффектами (см., например, обзорные статьи [4-7]). С другой стороны, она указывает
на то, что такие системы являются, по существу, бесконечномерными. Данное обстоятельство
осложняет анализ поведения систем дробного порядка, в том числе в части разработки схем
управления такими системами по принципу обратной связи.
Различные вопросы, связанные с линейно-квадратичными задачами оптимального управ-
ления системами дробного порядка, близкими к рассматриваемой в настоящей статье поста-
новке, изучались, например, в работах [8-18]. В [9, 12] были найдены необходимые условия
оптимальности программных управлений и даны некоторые их следствия. В [10, 14] исследо-
вание задачи проводилось в рамках частотного подхода. Статьи [8, 11, 13, 15, 17] посвящены
разработке численных методов решения. В [8, 13] аппроксимируется двухточечная краевая
задача, являющаяся выражением необходимых условий оптимальности. В [11] применяется
прямой метод, базирующийся на аппроксимации основных параметров задачи многочленами
Лежандра. В [15, 17] предлагаются методы, нацеленные непосредственно на приближённое
построение оптимальной обратной связи.
Отдельно отметим работу [16], в которой исследовалась линейно-квадратичная задача оп-
тимального управления для слабо сингулярного интегрального уравнения Вольтерры, более
общая по сравнению с задачей, рассматриваемой в настоящей статье. В частности, было пока-
зано, что оптимальное управление (в классе интегрируемых с квадратом функций) существует
и единственно. Для отыскания этого управления были применены и модифицированы кон-
струкции классического вариационного исчисления и принципа максимума Понтрягина. Кро-
ме того, было замечено, что ввиду специфических свойств динамики (которые присущи также
и системам дробного порядка) данные конструкции не позволяют напрямую извлечь из них
оптимальную обратную связь (синтез оптимальных управлений). Для того чтобы преодолеть
эту сложность, было предложено при построении управления дополнительно использовать
специальную вспомогательную траекторию.
1110
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
1111
С другой стороны, в статье [18] для нахождения оптимальных позиционных стратегий
управления в рассматриваемой задаче были развиты конструкции принципа динамическо-
го программирования и соответствующих уравнений Гамильтона-Якоби-Беллмана (см. так-
же [19]). В частности, с опорой на результаты работы [16] были разработаны процедуры управ-
ления по принципу обратной связи, которые позволяют для любого начального состояния
системы в дискретной по времени схеме формировать ε-оптимальные управления (в классе
существенно ограниченных функций) для всякого наперёд заданного числа ε > 0.
В настоящей статье, продолжающей исследования [16, 18], для рассматриваемой линейно-
квадратичной задачи оптимального управления системой дробного порядка в явном виде по-
строена оптимальная обратная связь, которая при непосредственной подстановке в уравнение
движения для любого начального состояния системы порождает соответствующее оптималь-
ное управление. Подчеркнём, что в каждый момент времени значение оптимальной обратной
связи, по существу, зависит от всей истории движения системы, сложившейся к этому моменту,
и, кроме того, данная зависимость является линейной.
1. Обозначения. Основные используемые в статье обозначения являются стандартными.
Для чисел n, m ∈ N через Rn обозначается линейное пространство n-мерных векторов со
скалярным произведением 〈 · , · 〉 и евклидовой нормой ∥ · ∥, а через Rn×m - линейное прост-
ранство n × m-матриц с соответствующей подчинённой (операторной) нормой, для которой
также используется обозначение ∥ · ∥.
Для числа T 0 рассматриваются следующие пространства функций, определённых на
отрезке [0, T ] и принимающих значения в Rn: банахово пространство C([0, T ], Rn) всех непре-
рывных функций x: [0, T ] Rn с равномерной нормой
∥x(·)C([0,T],Rn) = max ∥x(τ)∥, x(·) ∈ C([0, T ], Rn),
τ ∈[0,T ]
линейное пространство L2([0, T ], Rn) всех измеримых (отрезок [0, T ] рассматривается с мерой
Лебега) функций f : [0, T ] Rn, удовлетворяющих условию
(∫T
)1/2
∥f(·)L2([0,T ],Rn) =
∥f(τ)2
< ∞,
0
и линейное пространство L([0, T ], Rn) ⊂ L2([0, T ], Rn) всех измеримых и существенно огра-
ниченных функций f : [0, T ] Rn.
Далее пусть α ∈ (1/2, 1). Напомним, что для функции f(·) ∈ L2([0, T ], Rn) левосторон-
ним дробным интегралом Римана-Лиувилля порядка α называется следующая величина (см.,
например, [1, определение 2.1]):
τ
1
f (ξ)
(Iαf)(τ) =
dξ, τ ∈ [0, T ],
(1)
Γ(α)
(τ - ξ)1
0
где Γ - гамма-функция. Через ACα2([0, T ], Rn) обозначим линейное пространство всех функ-
ций x: [0, T ] Rn, каждая из которых для некоторой своей функции f(·) ∈ L2([0, T ], Rn)
представима в виде (см., например, [1, определение 2.3])
x(τ) = x(0) + (Iαf)(τ), τ ∈ [0, T ].
(2)
Учитывая, что ACα2([0, T ], Rn) ⊂ C([0, T ], Rn) (см., например, [1, теорема 3.6]), пространство
ACα2([0, T ], Rn) рассматривается с равномерной нормой ∥ · ∥C([0,T],Rn). Согласно, например,
[1, теорема 2.4; 2, леммы 2.21 и 2.22] для каждой функции x(·) ∈ ACα2([0, T ], Rn) при почти
всех (п.в.) τ ∈ [0, T ] существует левосторонняя дробная производная Капуто порядка α,
определяемая по правилу (см., например, [2, п. 2.4; 3, гл. 3])
τ
1
d
x(ξ) - x(0)
(CDαx)(τ) =
dξ.
(3)
Γ(1 - α)
(τ - ξ)α
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
1112
ГОМОЮНОВ, ЛУКОЯНОВ
Кроме того, если для некоторой функции f(·) ∈ L2([0, T ], Rn) выполнено соотношение (2), то
(CDαx)(τ) = f(τ) при п.в. τ ∈ [0,T]. В частности, имеет место равенство
τ
1
(CDαx)(ξ)
x(τ) = x(0) +
dξ, τ ∈ [0, T ].
(4)
Γ(α)
(τ - ξ)1
0
Рассмотрим множество
G2 =
({t} × ACα2([0, t], Rn)) = {(t, w(·)): t ∈ [0, T ], w(·) ∈ ACα2([0, t], Rn)},
t∈[0,T ]
на котором введём метрику
dist((t1, w1(·)), (t2, w2(·))) = |t1 - t2| + max ∥w1(min{τ, t1}) - w2(min{τ, t2})
(5)
τ ∈[0,T ]
для всех (t1, w1(·)), (t2, w2(·)) ∈ G2. Отметим, что если x(·) ∈ ACα2([0, T ], Rn) и t ∈ [0, T ], то
(t, xt(·)) ∈ G2, где xt(·) - сужение функции x(·) на отрезок [0, t], т.е.
xt(τ) = x(τ), τ ∈ [0,t].
(6)
Более того, следующее отображение непрерывно:
[0, T ] × ACα2([0, T ], Rn) (t, x(·)) (t, xt(·)) ∈ G2.
(7)
Наконец, через ACα∞([0, T ], Rn) ⊂ ACα2([0, T ], Rn) обозначим линейное пространство всех
функций x: [0, T ] Rn, каждая из которых представима в виде (2) для некоторой своей
функции f(·) ∈ L([0, T ], Rn), и положим
G = {(t, w(·)) ∈ G2 : w(·) ∈ AC([0, t], Rn)}, G = {(t, w(·)) ∈ G : t < T }.
(8)
2. Постановка задачи. Пусть зафиксированы числа n, m ∈ N, T > 0 и α ∈ (1/2, 1).
Рассмотрим задачу оптимального управления динамической системой, движение которой опи-
сывается линейным дифференциальным уравнением
(CDαx)(τ) = A(τ)x(τ) + B(τ)u(τ)
(9)
при начальном условии
x(0) = x0,
(10)
на минимум квадратичного терминально-интегрального показателя качества
T
J (x0, u(·)) = 〈x(T ), P x(T ) +
(〈x(τ), Q(τ)x(τ) + 〈u(τ), R(τ)u(τ)) dτ.
(11)
0
Здесь τ ∈ [0, T ] - время, x(τ) Rn и u(τ) Rm - состояние системы и управляющее
воздействие в момент времени τ соответственно, (CDαx)(τ) - левосторонняя дробная про-
изводная Капуто порядка α (см. (3)), x0 Rn - начальное состояние системы. Функции
A: [0,T] Rn×n, B: [0,T] Rn×m, Q: [0,T] Rn×n и R: [0,T] Rm×m непрерывны.
Матрицы P ∈ Rn×n и Q(τ) для всех τ ∈ [0, T ] симметричны и неотрицательно определены,
матрицы R(τ) для всех τ ∈ [0, T ] симметричны и положительно определены. Допустимы-
ми управлениями считаем функции u(·) ∈ L2([0, T ], Rm). Под движением системы (9) при
начальном условии (10), отвечающим управлению u(·) ∈ L2([0, T ], Rm), понимаем функцию
x(·) ∈ ACα2([0, T ], Rn), удовлетворяющую условию (10) и дифференциальному уравнению (9)
при п.в. τ ∈ [0, T ]. Согласно, например, [20, теорема 5.1] такое движение x(·) = x(· | x0, u(·))
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
1113
существует и единственно. Это движение x(·) есть единственное в пространстве C([0, T ], Rn)
решение линейного (слабо сингулярного) интегрального уравнения Вольтерры
τ
1
A(ξ)x(ξ) + B(ξ)u(ξ)
x(τ) = x0 +
dξ, τ ∈ [0, T ].
(12)
Γ(α)
(τ - ξ)1
0
Определим величину оптимального результата в задаче (9)-(11) равенством
ρ(x0) =
inf
J (x0, u(·)).
(13)
u(·)∈L2([0,T ],Rm)
Управление u(·) ∈ L2([0, T ], Rm), на котором достигается нижняя грань в данном выраже-
нии, назовём оптимальным (для начального значения x0). Из результатов работы [16] следует,
что оптимальное управление u(·) существует и единственно (с точностью до значений, при-
нимаемых на множестве нулевой меры Лебега). Целью настоящей статьи является построение
оптимальной обратной связи, которая при подстановке в уравнение движения для любого на-
чального значения x0 Rn порождает соответствующее оптимальное управление u(·).
3. Основной результат. Проведём необходимые для формулировки основного результата
построения, корректность которых установлена в статье [18].
Обозначим Ω = {(τ, ξ) [0, T ] × [0, T ]: τ ξ} и рассмотрим непрерывную функцию
Φ: Ω Rn×n, которая при каждом зафиксированном τ ∈ [0,T] удовлетворяет линейному
интегральному уравнению Вольтерры
τ
1
In×n
(τ - ξ)
Φ(τ, η)A(η)
Φ(τ, ξ) =
+
dη, ξ ∈ [0, τ],
Γ(α)
Γ(α)
(τ - η)1(η - ξ)1
ξ
где In×n Rn×n - единичная матрица. Функция Φ играет роль фундаментальной матрицы
решений однородного уравнения, соответствующего уравнению (9).
Определим непрерывную функцию K : [0, T ] × [0, T ] Rm×m равенством
K(τ, ξ) = B(τ)тΦ(T, τ)тP Φ(T, ξ)B(ξ) +
T
Φ(η, τ)тQ(η)Φ(η, ξ)
+ (T - τ)1(T - ξ)1B(τ)т
dηB(ξ)
(η - τ)1(η - ξ)1
max{τ,ξ}
для всех τ, ξ ∈ [0, T ]. Верхний индекст обозначает транспонирование.
Пусть Θ = {(τ, ξ, t) [0, T ] × [0, T ] × [0, T ]: τ t, ξ t}. Рассмотрим непрерывную
функцию Θ (τ, ξ, t) → M(τ, ξ | t) Rm×m, которая для любых фиксированных t ∈ [0, T ] и
ξ ∈ [t,T] удовлетворяет линейному интегральному уравнению Фредгольма
T
K(τ, η)M(η, ξ | t)
R(τ)M(τ, ξ | t) +
= -K(τ, ξ)R(ξ)-1, τ ∈ [t, T ],
(T - η)2-2α
t
где R(ξ)-1 - матрица, обратная к матрице R(ξ). Данное интегральное уравнение выступает
аналогом дифференциального уравнения Риккати.
Для каждой точки (t, w(·)) ∈ G0 (см. (8)) положим
w(τ),
если τ ∈ [0, t],
t
a(τ | t, w(·)) =
1
(CDαw)(ξ)
(14)
w(0) +
dξ, если τ ∈ (t, T ],
Γ(α)
(τ - ξ)1
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
1114
ГОМОЮНОВ, ЛУКОЯНОВ
и
w(τ),
если τ ∈ [0, t],
τ
b(τ | t, w(·)) =
Φ(τ, ξ)A(ξ)a(ξ | t, w(·))
a(τ | t, w(·)) +
dξ, если τ ∈ (t, T ].
(τ - ξ)1
t
С содержательной точки зрения функции a(·) = a( · | t, w(·)) и b(·) = b( · | t, w(·)) суть един-
ственные функции из пространства ACα∞([0, T ], Rn), которые удовлетворяют соответственно
начальным условиям a(τ) = w(τ) и b(τ) = w(τ) при всех τ ∈ [0, t] и дифференциальным
уравнениям (CDαa)(τ) = 0 и (CDαb)(τ) = A(τ)b(τ) при п.в. τ ∈ [t, T ].
Наконец, определим отображение U : G0 Rm по правилу
(
T
)
1
M (t, ξ | t)c(ξ | t, w(·))
U(t,w(·)) = -
R(t)-1c(t | t, w(·)) +
(15)
(T - t)1
(T - ξ)2-2α
t
для всех (t, w(·)) ∈ G0, где для каждого τ ∈ [t, T ] обозначено
T
Φ(ξ, τ)тQ(ξ)b(ξ | t, w(·))
c(τ | t, w(·)) = B(τ)тΦ(T, τ)тP b(T | t, w(·)) + (T - τ)1B(τ)т
dξ.
(ξ - τ)1
τ
Отметим, что отображение U непрерывно (напомним, что множество G0 снабжено метри-
кой dist из (5)), для каждого зафиксированного t ∈ [0, T ) отображение
ACα∞([0, t], Rn) ∋ w(·) → U(t, w(·)) Rm
(16)
линейно, и существует число μU 0 такое, что справедлива оценка
μU∥w(·)C([0,t],Rn)
∥U(t, w(·))
,
(t, w(·)) ∈ G0.
(17)
(T - t)1
Отображение U будем использовать для формирования управления в системе (9) по прин-
ципу обратной связи, при этом вместо аргумента w(·) будем подставлять историю xt(·) дви-
жения этой системы, сложившуюся к моменту времени t (см. (6)).
Рассмотрим систему (9), замкнутую обратной связью U:
(CDαx)(τ) = A(τ)x(τ) + B(τ)U(τ,xτ (·)),
(18)
где τ ∈ [0, T ]. В соответствии с п. 2 движение замкнутой системы (18), отвечающее начальному
значению x0 Rn, определим как функцию x(·) ∈ ACα2([0, T ], Rn), которая удовлетворяет
начальному условию (10) и дифференциальному уравнению (18) при п.в. τ ∈ [0, T ].
Основным результатом работы является следующая
Теорема. Для любого начального значения x0 Rn существует единственное движение
x(·) замкнутой системы (18). При этом реализующееся управление
u(τ) = U(τ,x◦τ(·)), τ ∈ [0,T)
(19)
является оптимальным в задаче (9)-(11).
Прежде чем переходить к доказательству теоремы, сделаем ряд замечаний.
1. Для произвольных функции x(·) ∈ ACα2([0, T ], Rn) и момента времени τ ∈ [0, T ) величи-
на U(τ, xτ (·)) в правой части уравнения (18) может быть не определена, поскольку сужение
xτ (·) этой функций на отрезок [0] может не принадлежать пространству ACα∞([0],Rn).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
1115
Тем не менее эту проблему удаётся обойти, например, следующим образом. Определим уже
на всём множестве G2 отображение
{
U(t,w(·)), если (t,w(·)) ∈ G0,
U(t,w(·)) =
(20)
0,
если (t, w(·)) ∈ G2 \ G0,
и рассмотрим систему (9), замкнутую обратной связью U:
(CDαx)(τ) = A(τ)x(τ) + B(τ)U(τ,xτ (·)),
(21)
где τ ∈ [0, T ]. Возьмём движение x(·) ∈ ACα2([0, T ], Rn) замкнутой системы (21), отвечающее
начальному значению x0 Rn. Тогда, вводя обозначения
μA = max
∥A(τ)∥, μB = max ∥B(τ)
(22)
τ ∈[0,T ]
τ ∈[0,T ]
и выбирая число μU согласно (17), выводим оценку
μU∥xτ (·)C([0],Rn)
(CDαx)(τ) μA∥x(τ) + μB
(T - τ)1
при п.в. τ ∈ [0, T ]. Стало быть, имеем xτ (·) ∈ ACα∞([0, τ], Rn) для любого τ ∈ [0, T ), а зна-
чит, U(τ, xτ (·)) = U(τ, xτ (·)) при всех τ ∈ [0, T ) в силу (20). Таким образом получаем, что
в действительности x(·) - движение замкнутой системы (18) с обратной связью U, отве-
чающее начальному значению x0. Подчеркнём, что сама функция x(·) при этом может не
принадлежать пространству ACα∞([0, T ], Rn). Отметим также, что величину U(t, w(·)) для
всех (t, w(·)) ∈ G2 \G0 при t < T можно было бы определить по исходной формуле (15), одна-
ко проверка необходимых свойств построенного таким образом отображения U потребовала
бы дополнительных усилий.
2. В определении (15) величины U(t, w(·)) для момента времени t ∈ [0, T ) и функции
w(·) ∈ ACα∞([0, t], Rn) участвуют значения дробной производной Капуто (CDαw)(τ) при п.в.
τ ∈ [0,t] (см. (14)), что не позволяет напрямую задать величину U(t,w(·)) для произвольной
функции w(·) ∈ C([0, t], Rn) с сохранением необходимых свойств отображения U. Это обсто-
ятельство препятствует тому, чтобы при изучении вопроса о существовании и единственности
решений дифференциального уравнения (18) стандартным образом перейти к эквивалентному
интегральному уравнению Вольтерры в пространстве C([0, T ], Rn) (см. (12)). С другой сторо-
ны, исследование разрешимости этого интегрального уравнения непосредственно в простран-
стве ACα∞([0, t], Rn) осложняется тем, что данное пространство не является полным. Чтобы
избежать указанных трудностей, уравнение (18) удобно рассматривать не как дифференци-
альное уравнение относительно функции x(·), а как функциональное уравнение относительно
её дробной производной Капуто f(·) = (CDαx)(·). Такой подход ранее применялся, например,
в работе [21].
3. Поскольку правая часть дифференциального уравнения (18) в момент времени τ ∈ [0, T ]
зависит от значений x(ξ) искомого решения при всех ξ ∈ [0, τ], это уравнение можно класси-
фицировать как дифференциальное уравнение с дробной производной Капуто и каузальным
оператором. Дифференциальные включения такого типа рассматривались, например, в [22].
4. Обоснование оптимальности управления u(·) (см. (19)) опирается на результаты, по-
лученные в работе [18], где в качестве пространства допустимых управлений было выбрано
пространство L([0, T ], Rm). В связи с этим подчеркнём, что оптимальное (в смысле прост-
ранства L2([0, T ], Rm)) управление в задаче (9)-(11) может неограниченно расти при при-
ближении к терминальному моменту времени T (см. (15) и (17)) и, как следствие, может не
принадлежать пространству L([0, T ], Rm). В частности, с целью обработки данного эффек-
та в доказательстве теоремы вводится малый параметр δ ∈ (0, T ) и уравнение (18) изучается
сначала на промежутке времени [0, T - δ].
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
1116
ГОМОЮНОВ, ЛУКОЯНОВ
4. Доказательство теоремы. Зафиксируем начальное значение x0 Rn. Рассмотрим
замкнутую систему (18) на промежутке времени [0, T - δ], где δ ∈ (0, T ).
Лемма 1. Каково бы ни было число δ ∈ (0, T ), существует единственная функция
y(δ)(·) ∈ ACα∞([0, T - δ], Rn), которая удовлетворяет начальному условию y(δ)(0) = x0 и
дифференциальному уравнению
(CDαy(δ))(τ) = A(τ)y(δ)(τ) + B(τ)U(τ,y(δ)τ(·))
при п.в. τ ∈ [0,T - δ].
Доказательство. Выберем число k > 0 из условия kα > μA + μBμU1, где чис-
ла μU и μA, μB определяются согласно (17) и (22). Рассмотрим линейное пространство
Ck([0,T -δ],Rn) всех непрерывных функций f : [0,T -δ] Rn со взвешенной нормой (также
называемой нормой Билецкого)
∥f(·)k = max
(∥f(τ)∥e-kτ ), f(·) ∈ Ck([0, T - δ], Rn).
τ ∈[0,T -δ]
Отметим, что норма ∥ · ∥k эквивалентна равномерной норме ∥ · ∥C([0,T-δ],Rn), а значит прост-
ранство Ck([0, T - δ], Rn) банахово.
Для каждой функции f(·) ∈ Ck([0, T - δ], Rn) определим функцию
(Mf)(τ) = x0 + (Iαf)(τ), τ ∈ [0, T - δ],
где (Iαf)(τ) - левосторонний дробный интеграл Римана-Лиувилля порядка α (см. (1)). Для
любых функций f1(·), f2(·) ∈ Ck([0, T - δ], Rn) при всех τ ∈ [0, T - δ] имеем неравенства
τ
1
∥f1(ξ) - f2(ξ)
(Mf1)(τ) - (Mf2)(τ)
Γ(α)
(τ - ξ)1
0
τ
∥f1(·) - f2(·)k
e
∥f1(·) - f2(·)ke
Γ(α)
(τ - ξ)1
kα
0
и, следовательно,
∥f1(·) - f2(·)ke
max
(Mf1)(ξ) - (Mf2)(ξ)
(23)
ξ∈[0]
kα
Рассмотрим теперь оператор N : Ck([0, T - δ], Rn) → Ck([0, T - δ], Rn), который каждой
функции f(·) ∈ Ck([0, T - δ], Rn) ставит в соответствие функцию
(Nf)(τ) = A(τ)(Mf)(τ) + B(τ)U(τ, (Mf)τ (·)), τ ∈ [0, T - δ],
где (Mf)τ (·) - сужение функции (Mf)(·) на отрезок [0, τ]. Отметим, что определение опе-
ратора N корректно, поскольку (Mf)(·) ∈ ACα∞([0, T - δ], Rn) по построению и отображения
A, B, U и (7) непрерывны.
Для любых функций f1(·), f2(·) ∈ Ck([0, T - δ], Rn), принимая во внимание линейность
отображения (16) и оценку (23), выводим оценку
(
μBμU
) ∥f1(·) - f2(·)ke
(Nf1)(τ) - (Nf2)(τ) μA +
,
τ ∈ [0,T - δ],
δ1
kα
а значит,
(
μBμU
) ∥f1(·) - f2(·)k
(Nf1)(·) - (Nf2)(·)k μA +
δ1
kα
Таким образом, учитывая выбор числа k, заключаем, что оператор N сжимающий и,
стало быть, имеет единственную неподвижную точку f(·) ∈ Ck([0, T - δ], Rn).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
1117
Положим y(τ) = (Mf)(τ) = x0 + (Iαf)(τ) для любого τ ∈ [0, T - δ]. Тогда получаем
y(·) ∈ ACα∞([0,T - δ],Rn), y(0) = x0, и при п.в. τ ∈ [0,T - δ]
(CDαy)(τ) = f(τ) = (Nf)(τ) = A(τ)y(τ) + B(τ)U(τ,y∗τ(·)).
Остаётся доказать единственность. Пусть функция y(·) ∈ ACα∞([0, T - δ], Rn) такова, что
y(0) = x0, и при п.в. τ ∈ [0, T - δ] имеет место равенство
(CDαy)(τ) = A(τ)y(τ) + B(τ)U(τ,yτ (·)).
Рассмотрим функцию f(τ) = A(τ)y(τ) + B(τ)U(τ, yτ (·)) для любого τ ∈ [0, T - δ]. Заметим,
что f(·) ∈ Ce([0, T - δ], Rn). Кроме того, так как (CDαy)(τ) = f(τ) при п.в. τ ∈ [0, T - δ],
то y(τ) = (Mf)(τ) при всех τ ∈ [0, T - δ] согласно (4). Следовательно, f(·) - неподвижная
точка оператора N, а значит, f(τ) = f(τ) для любого τ ∈ [0, T - δ]. Таким образом, имеем
y(τ) = (Mf)(τ) = (Mf)(τ) = y(τ), τ ∈ [0, T - δ],
что завершает доказательство леммы.
Для каждого числа δ ∈ (0, T ) возьмём функцию y(δ)(·) из леммы 1 и уже на всём проме-
жутке времени [0, T ] определим управление u(δ)(·) ∈ L([0, T ], Rm) по правилу
{
u(δ)(τ) =U(τ,yτδ)(·)),еслиτ∈[0,T-δ],
(24)
0,
если τ ∈ (T - δ, T ].
Через x(δ)(·) = x(· | x0, u(δ)(·)) обозначим соответствующее движение системы (9). Отметим,
что x(δ)(·) ∈ ACα∞([0, T ], Rn) и
x(δ)(τ) = y(δ)(τ), u(δ)(τ) = U(τ,x(δ)τ(·)), τ ∈ [0,T - δ].
(25)
Лемма 2. Существует число μx 0 такое, что
∥x(δ)(·)C([0,T],Rn) μx, δ ∈ (0, T ).
(26)
Доказательство. Определим числа μU и μA, μB в соответствии с (17) и (22), обозначим
μ = μAT1+μBμU и положим μx = ∥x0∥E2α-1(μΓ(2α-1)T2α-1/Γ(α)), где E2α-1 - функция
Миттаг-Лёффлера (см., например, [2, п. 1.8; 3, гл. 4]).
Зафиксируем число δ ∈ (0, T ). При п.в. τ ∈ [0, T - δ] имеем неравенства
μBμU∥xτδ)(·)C([0],Rn)
μ∥xτδ)(·)C([0],Rn)
(CDαx(δ))(τ) μA∥x(δ)(τ) +
(T - τ)1
(T - τ)1
и, аналогично, при п.в. τ ∈ [T - δ, T ] получаем
μ∥xτδ)(·)C([0],Rn)
(CDαx(δ))(τ) μA∥x(δ)(τ)
(T - τ)1
Тогда, учитывая (4), для любого τ ∈ [0, T ] выводим
τ
τ
μ
∥x(δ)ξ(·)C([0],Rn)
μ
∥x(δ)ξ(·)C([0],Rn)
∥x(δ)(τ) ∥x0 +
∥x0 +
dξ.
Γ(α)
(T - ξ)1(τ - ξ)1
Γ(α)
(τ - ξ)2-2α
0
0
Замечая, что последний интеграл в данном выражении есть неубывающая функция перемен-
ной τ (см., например, [23, утверждение 2]), приходим к оценке
τ
μ
∥x(δ)ξ(·)C([0],Rn)
∥x(δ)τ(·)C([0],Rn) ∥x0 +
dξ, τ ∈ [0, T ].
Γ(α)
(τ - ξ)2-2α
0
8
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
1118
ГОМОЮНОВ, ЛУКОЯНОВ
В итоге, после применения соответствующего аналога неравенства Гронуолла (см., например,
[3, лемма 6.19]), имеем
)
2α-1
(μΓ(2α - 1)τ
∥x(δ)
(·)C([0],Rn) ∥x0∥E2α-1
μx, τ ∈ [0,T].
τ
Γ(α)
Лемма доказана.
Отметим, что если δ1, δ2 (0, T ) и δ1 δ2, то по построению u(δ1)(τ) = u(δ2)(τ) при всех
τ ∈ [0,T - δ1]. Следовательно, можно определить функцию u: [0,T) Rm таким образом,
чтобы для каждого δ ∈ (0, T ) имело место равенство
u(τ) = u(δ)(τ), τ ∈ [0,T - δ].
(27)
Учитывая, что в силу (17) и (26) справедлива оценка
μUμx
∥u(δ)(τ)
,
τ ∈ [0,T - δ], δ ∈ (0,T),
(T - τ)1
выводим
μUμx
∥u(τ)
,
τ ∈ [0,T).
(28)
(T - τ)1
Тогда, принимая во внимание измеримость функции u(·) на промежутке [0, T ) и формально
полагая u(T ) = 0, получаем u(·) ∈ L2([0, T ], Rm), т.е. u(·) - допустимое управление в
задаче (9)-(11).
Рассмотрим соответствующее движение x(·) = x(· | x0, u(·)) системы (9). Для каждого
δ ∈ (0,T) имеем
x(τ) = x(δ)(τ), τ ∈ [0,T - δ],
и, далее,
u(τ) = u(δ)(τ) = U(τ,x(δ)τ(·)) = U(τ,x◦τ(·)), τ ∈ [0,T - δ].
Поскольку данное свойство выполняется для любого δ ∈ (0, T ), заключаем, что справедливо
равенство (19) и, стало быть, функция x(·) является движением замкнутой системы (18) при
начальном условии (10).
Возьмём теперь произвольное движение x(·) ∈ ACα2([0, T ], Rn) замкнутой системы (18) при
начальном условии (10). Зададим число δ ∈ (0, T ) и определим функцию y(τ) = x(τ) для
любого τ ∈ [0, T - δ]. Тогда y(·) ∈ ACα∞([0, T - δ], Rn) (см. замечание 1 после формулировки
теоремы), y(0) = x0, и при п.в. τ ∈ [0, T - δ]
(CDαy)(τ) = (CDαx)(τ) = A(τ)x(τ) + B(τ)U(τ,xτ (·)) = A(τ)y(τ) + B(τ)U(τ,yτ (·)).
Применяя лемму 1, получаем y(τ) = y(δ)(τ) при всех τ ∈ [0, T - δ]. Следовательно, имеем
x(τ) = x(δ)(τ) = x(τ) при всех τ ∈ [0, T - δ]. Так как это соотношение выполнено для
любого δ ∈ (0, T ) и функции x(·) и x(·) непрерывны, выводим x(τ) = x(τ) при всех τ ∈
[0, T ]. Итак, движение замкнутой системы (18) при начальном условии (10) существует и
единственно.
Докажем оптимальность управления u(·). С этой целью рассмотрим вспомогательную за-
дачу оптимального управления для динамической системы (9) при начальном условии (10) на
минимум показателя качества (11), но при выборе в качестве класса допустимых управлений
пространства L([0, T ], Rm). Определим величину оптимального результата в этой задаче
ρ(x0) =
inf
J (x0, u(·)).
(29)
u(·)∈L([0,T ],Rm)
В соответствии с результатами работы [18] (см. также [19]) существуют функционал ϕ:
G R и отображенияtϕ: G R иαϕ: G Rn со следующими свойствами:
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
1119
1) для любой точки (t, w(·)) ∈ G0 справедливо равенство
αtϕ(t,w(·)) + 〈∇αϕ(t,w(·)),A(t)w(t) + 〈w(t),Q(t)w(t)〉 -
1
-
〈B(t)тαϕ(t, w(·)), R(t)-1B(t)тαϕ(t, w(·)) = 0;
(30)
4
2) отображения U иαϕ связаны соотношением
1
U(t,w(·)) = -
R(t)-1B(t)тαϕ(t, w(·)), (t, w(·)) ∈ G0;
2
3) какова бы ни была функция x(·) ∈ ACα∞([0, T ], Rn), функция κ(τ) = ϕ(τ, xτ (·)), где
τ ∈ [0,T], удовлетворяет условию Липшица на отрезке [0,T -δ] для любого числа δ ∈ (0,T),
выполнены краевые условия
κ(0) = ρ(x(0)), κ(T ) = 〈x(T ), P x(T )〉,
и при п.в. τ ∈ [0, T ] имеет место равенство
(τ)
= αt ϕ(τ,xτ(·)) + 〈∇αϕ(τ,xτ(·)),(CDαx)(τ);
4) существует число μϕ 0 такое, что, каковы бы ни были функция x(·) ∈ ACα∞([0, T ], Rn)
и число δ ∈ (0, T ), справедлива оценка
(T, x(·)) - ϕ(T - δ, xT-δ(·))|
(
)
δ2α-1μϕ
∥x(·)C([0,T],Rn) + ess sup(CDαx)(τ)
∥x(·)C([0,T],Rn).
τ ∈[T -δ,T ]
С содержательной точки зрения ϕ есть функционал оптимального результата во вспо-
могательной задаче оптимального управления, отображенияαtϕ иαϕ суть его дробные
коинвариантные производные порядка α, а равенство (30) представляет собой отвечающее
этой задаче уравнение Гамильтона-Якоби-Беллмана.
С опорой на приведённые выше свойства покажем, что управление u(δ)(·) (см. (24) и (25))
является ε-оптимальным во вспомогательной задаче при достаточно малом значении пара-
метра δ ∈ (0, T ).
Лемма 3. Для любого числа ε > 0 существует число δ (0, T ) такое, что для всякого
числа δ ∈ (0, δ] выполнено неравенство
J (x0, u(δ)(·)) ρ(x0) + ε.
(31)
Доказательство. Пусть ε > 0. Выберем число δ (0, T ), исходя из условия
δ2α-1μϕ(1 + μA)μ2x + δμQμ2x ε,
где числа μϕ, μx и μA определяются согласно свойству 4), лемме 2 и соотношению (22) и
μQ = max ∥Q(τ)∥. Для числа δ ∈ (0] рассмотрим соответствующие управление u(δ)(·) и
τ ∈[0,T ]
движение x(δ)(·) = x(· | x0, u(δ)(·)) системы (9). Определим функцию
T
ω(τ) = ϕ(τ, x(δ)τ(·)) -
(〈x(δ)(ξ), Q(ξ)x(δ)(ξ) + 〈u(δ)(ξ), R(ξ)u(δ)(ξ)) dξ, τ ∈ [0, T ].
τ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
8
1120
ГОМОЮНОВ, ЛУКОЯНОВ
В силу свойства 3) функция ω(·) удовлетворяет условию Липшица на отрезке [0, T - δ] и
при п.в. τ ∈ [0, T ] справедливо равенство
(τ)
= αt ϕ(τ,x(δ)τ(·)) + 〈∇αϕ(τ,x(δ)τ(·)),A(τ)x(δ)(τ) + B(τ)u(δ)(τ) +
+ 〈x(δ)(τ), Q(τ)x(δ)(τ) + 〈u(δ)(τ), R(τ)u(δ)(τ)〉.
Для каждого τ ∈ [0, T - δ], принимая во внимание свойство 2), получаем
1
u(δ)(τ) = U(τ,x(δ)τ(·)) = -
R(τ)-1B(τ)тαϕ(τ, x(δ)τ(·))
2
и, следовательно,
〈∇αϕ(τ, x(δ)τ(·)), B(τ)u(δ)(τ) + 〈u(δ)(τ), R(τ)u(δ)(τ) =
= min
(〈∇αϕ(τ, x(δ)τ(·)), B(τ)u〉 + 〈u, R(τ)u〉) =
u∈Rm
1
=-
〈B(τ)тαϕ(τ, x(δ)τ(·)), R(τ)-1B(τ)тαϕ(τ, x(δ)τ(·))〉.
4
Таким образом, учитывая свойство 1), выводим(τ)/dτ = 0 при п.в. τ ∈ [0, T - δ], а
значит, ω(T - δ) = ω(0).
Далее, поскольку u(δ)(τ) = 0 при всех τ ∈ (T - δ, T ], имеем(CDαx(δ))(τ) μAμx при
п.в. τ ∈ [T - δ, T ]. Тогда ввиду свойства 4) имеем
T
(T ) - ω(T - δ)|(T, x(δ)(·)) - ϕ(T - δ, x(δ)T-δ(·))| +
〈x(δ)(ξ), Q(ξ)x(δ)(ξ)〉 dξ
T-δ
δ2α-1μϕ(μx + μAμx)μx + δμQμ2xε.
Стало быть, выполняется оценка ω(T ) ω(0) + ε, которая в силу краевых условий из свой-
ства 3) приводит к неравенству (31). Лемма доказана.
Подчеркнём, что предельное управление u(·) (см. (27)) может иметь особенность в терми-
нальный момент времени T и поэтому может не принадлежать пространству L([0, T ], Rm),
т.е. не быть допустимым во вспомогательной задаче.
Установим непрерывную зависимость значения показателя качества J(x0, u(·)) (см. (11))
от изменения управления u(·) ∈ L2([0, T ], Rm).
Лемма 4. Пусть {ui(·)}i∈N ⊂ L2([0, T ], Rm) и u(·) ∈ L2([0, T ], Rm). Предположим, что
∥ui(·) - u(·)L2([0,T ],Rm) 0 при i → ∞. Тогда J(x0, ui(·)) → J(x0, u(·)) при i → ∞.
Доказательство. Рассмотрим движения xi(·) = x(· | x0, ui(·)) для каждого i ∈ N и
x(·) = x(· | x0, u(·)) системы (9) при начальном условии (10). Учитывая (12), для каждого
i ∈ N при всех τ ∈ [0,T] выводим неравенства
τ
τ
μA
∥xi(ξ) - x(ξ)
μB
∥ui(ξ) - u(ξ)
∥xi(τ) - x(τ)
+
Γ(α)
(τ - ξ)1
Γ(α)
(τ - ξ)1
0
0
τ
μA
∥xi(ξ) - x(ξ)
μBTα-1/2∥ui(·) - u(·)L2([0,T],Rm)
+
,
Γ(α)
(τ - ξ)1
Γ(α)(2α - 1)1/2
0
где числа μA и μB определяются согласно (22). Тогда, применяя соответствующий аналог
неравенства Гронуолла (см., например, [3, лемма 6.19]), получаем
μBTα-1/2Eα(μATα)∥ui(·) - u(·)L2([0,T],Rm)
∥xi(τ) - x(τ)
,
τ ∈ [0,T], i ∈ N,
Γ(α)(2α - 1)1/2
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
ОБ ОПТИМАЛЬНОЙ ОБРАТНОЙ СВЯЗИ
1121
где Eα - функция Миттаг-Лёффлера (см., например, [2, п. 1.8; 3, гл. 4]). Поскольку по пред-
положению ∥ui(·) - u(·)L2([0,T ],Rm) 0 при i → ∞, имеем ∥xi(·) - x(·)C([0,T ],Rn) 0 при
i → ∞ и, далее, J(x0,ui(·)) → J(x0,u(·)) при i → ∞. Лемма доказана.
Так как для любой функции u(·) ∈ L2([0, T ], Rm) и любого числа ζ > 0 существует функ-
ция u(·) ∈ L([0, T ], Rm), для которой ∥u(·) - u(·)L2([0,T ],Rm) ζ, то по лемме 4 из опре-
делений (13) и (29) вытекает равенство ρ(x0) = ρ(x0). Тогда по лемме 3 для любого числа
ε > 0 найдётся число δ(0,T) такое, что
J (x0, u(δ)(·)) ρ(x0) + ε, δ ∈ (0, δ].
Замечая, что ∥u(δ)(·) - u(·)L2([0,T ],Rm) 0 при δ → +0 в силу соотношений (24), (27) и (28),
применяя лемму 4 и учитывая определение (13), приходим к равенству J(x0, u(·)) = ρ(x0).
Таким образом, управление u(·) является оптимальным в задаче (9)-(11). Теорема доказана.
Работа выполнена при поддержке Министерства науки и высшего образования Российской
Федерации в рамках государственного задания № 075-01483-23-00 (проект FEWS-2020-0010).
СПИСОК ЛИТЕРАТУРЫ
1. Самко С.Г., Килбас А.А., Маричев О.И. Интегралы и производные дробного порядка и некоторые
их приложения. Минск, 1987.
2. Kilbas A.A., Srivastava H.M., Trujillo J.J. Theory and Applications of Fractional Differential Equations.
Amsterdam, 2006.
3. Diethelm K. The Analysis of Fractional Differential Equations: an Application-Oriented Exposition Using
Differential Operators of Caputo Type. Berlin, 2010.
4. Бутковский А.Г., Постнов С.С., Постнова Е.А. Дробное интегро-дифференциальное исчисление и
его приложения в теории управления. I. Математические основы и проблема интерпретации // Ав-
томатика и телемеханика. 2013. № 4. С. 3-42.
5. Бутковский А.Г., Постнов С.С., Постнова Е.А. Дробное интегро-дифференциальное исчисление
и его приложения в теории управления. II. Дробные динамические системы: моделирование и ап-
паратная реализация // Автоматика и телемеханика. 2013. № 5. С. 3-34.
6. Sun H., Zhang Y., Baleanu D., Chen W., Chen Y. A new collection of real world applications of fractional
calculus in science and engineering // Commun. Nonlin. Sci. Numer. Simul. 2018. V. 64. P. 213-231.
7. Tarasov V.E. On history of mathematical economics: application of fractional calculus // Mathematics.
2019. V. 7. № 6. Art. 509.
8. Agrawal O.P. A quadratic numerical scheme for fractional optimal control problems // J. Dyn. Syst.
Meas. Contr. 2008. V. 130. № 1. Art. 011010.
9. Li Y., Chen Y. Fractional order linear quadratic regulator // Proc. of the 2008 IEEE/ASME Intern.
Conf. on Mechtronic and Embedded Systems and Applications. Beijing, 2008. P. 363-368.
10. Liang S., Wang S.-G., Wang Y. Representation and LQR of exact fractional order systems // Proc. of
the 53rd IEEE Conf. on Decision and Control. Los Angeles, 2014. P. 6908-6913.
11. Bhrawy A.H., Doha E.H., Machado J.A.T., Ezz-Eldien S.S. An efficient numerical scheme for solving
multi-dimensional fractional optimal control problems with a quadratic performance index // Asian J.
Control. 2015. V. 17. № 6. P. 2389-2402.
12. Idczak D., Walczak S. On a linear-quadratic problem with Caputo derivative // Opuscula Math. 2016.
V. 36. № 1. P. 49-68.
13. Baghani O. Solving state feedback control of fractional linear quadratic regulator systems using triangular
functions // Commun. Nonlin. Sci. Numer. Simulat. 2019. V. 73. P. 319-337.
14. Zhou B., Speyer J.L. Fractional linear quadratic regulators using Wiener-Hopf spectral factorization
// SIAM J. Control Optim. 2019. V. 57. № 6. P. 4011-4032.
15. Dabiri A., Chahrogh L.K., Machado J.A.T. Closed-form solution for the finite-horizon linear-quadratic
control problem of linear fractional-order systems // Proc. American Control Conf. New Orleans, 2021.
P. 3864-3869.
16. Han S., Lin P., Yong J. Causal state feedback representation for linear quadratic optimal control problems
of singular Volterra integral equations // Math. Control Relat. Fields. 2023. V. 13. № 4. P. 1282-1317.
17. Malmir I. Novel closed-loop controllers for fractional linear quadratic time-varying systems // Numer.
Algebra, Control. Optim. 2022. DOI: 10.3934/naco.2022032.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023
1122
ГОМОЮНОВ, ЛУКОЯНОВ
18. Gomoyunov M.I. Value functional and optimal feedback control in linear-quadratic optimal control
problem for fractional-order system // Math. Control Relat. Fields. 2023. DOI: 10.3934/mcrf.2023002.
19. Gomoyunov M.I. Dynamic programming principle and Hamilton-Jacobi-Bellman equations for fractio-
nal-order systems // SIAM J. Control Optim. 2020. V. 58. № 6. P. 3185-3211.
20. Bourdin L. Weighted Hölder continuity of Riemann-Liouville fractional integrals - application to
regularity of solutions to fractional Cauchy problems with Carathéodory dynamics // Fract. Calc. Appl.
Anal. 2019. V. 22. № 3. P. 722-749.
21. Idczak D., Kamocki R. On the existence and uniqueness and formula for the solution of R-L fractional
Cauchy problem in Rn // Fract. Calc. Appl. Anal. 2011. V. 14. № 4. P. 538-553.
22. Обуховский В.В., Кулманакова М.М., Боровикова М.М. Задача разрешимости для управляемой
системы с дробной производной и каузальным оператором // Таврический вестн. информатики и
математики. 2021. № 4. С. 85-105.
23. Gomoyunov M.I. Approximation of fractional order conflict-controlled systems // Progr. Fract. Differ.
Appl. 2019. V. 5. № 2. P. 143-155.
Институт математики и механики
Поступила в редакцию 16.02.2023 г.
имени Н.Н. Красовского УрО РАН, г. Екатеринбург,
После доработки 16.02.2023 г.
Удмуртский государственный университет,
Принята к публикации 14.06.2023 г.
г. Ижевск
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 59
№8
2023