Автоматика и телемеханика, № 3, 2019
Линейные системы
© 2019 г. Д.Н. ИБРАГИМОВ, канд. физ.-мат. наук (rikk.dan@gmail.com)
(Московский авиационный институт
(национальный исследовательский университет))
О ЗАДАЧЕ БЫСТРОДЕЙСТВИЯ ДЛЯ КЛАССА
ЛИНЕЙНЫХ АВТОНОМНЫХ БЕСКОНЕЧНОМЕРНЫХ СИСТЕМ
С ДИСКРЕТНЫМ ВРЕМЕНЕМ, ОГРАНИЧЕННЫМ УПРАВЛЕНИЕМ
И ВЫРОЖДЕННЫМ ОПЕРАТОРОМ1
Рассматривается решение задачи быстродействия для класса линейных
дискретных систем с бесконечномерным вектором состояния и вырожден-
ным оператором. Сформулированы и доказаны утверждения о свойствах
выпуклых множеств. Получены необходимые и достаточные условия раз-
решимости задачи быстродействия для случая, когда нуль принадлежит
границе множества достижимости. Условия оптимальности записаны как
дискретный принцип максимума. Для внутренней точки доказан вырож-
денный характер принципа максимума. Разработан алгоритм решения
задачи быстродействия для внутренней точки путем сведения ее к разре-
шенному случаю граничной точки. Приведены примеры.
Ключевые слова: линейные бесконечномерные дискретные системы, зада-
ча быстродействия, выпуклые множества, дискретный принцип максиму-
ма, вырожденный оператор.
DOI: 10.1134/S0005231019030012
1. Введение
Исторически развитие теории оптимального управления начиналось с ис-
следования систем с непрерывным временем. Среди основных подходов к
решению можно выделить принцип максимума Понтрягина [1-3] и метод ди-
намического программирования Беллмана [4]. Также существует подход, ос-
нованный на использовании множеств достижимости и управляемости [5-7].
На основе этих методов построено решение задачи быстродействия [1, 2, 8],
которая в случае непрерывного времени не обладает специфическими особен-
ностями, отличающими ее от прочих задач.
Основным препятствием при использовании аналогичных методов для си-
стем с дискретным временем является их существенное отличие от непрерыв-
ных систем. Тогда как задача оптимального управления для непрерывного
времени представляет собой задачу вариационного исчисления, в дискретном
случае она является задачей нелинейного программирования большой раз-
мерности, что определяет принципиально другой набор средств ее решения,
необходимых и достаточных условий оптимальности. В частности, известен
1 Результаты работы получены в рамках выполнения государственного задания Мин-
обрнауки № 2.2461.2017/4.6.
3
основанный на методе множителей Лагранжа дискретный принцип макси-
мума, который освящен в ряде публикаций [6, 9-12]. Тем не менее его при-
менение для решения задачи быстродействия оказывается затруднительным:
в методе множителей Лагранжа на оптимальном решении все множители
могут одновременно обращаться в нуль, что приводит к нерегулярности экс-
тремума. С другой стороны, дискретный характер критерия качества управ-
ления — минимального числа шагов, необходимого для достижения начала
координат — приводит к отсутствию непрерывности функции Лагранжа. По
этим причинам оказывается актуальным поиск альтернативных подходов к
решению поставленной задачи.
На данный момент известно сравнительно небольшое количество публика-
ций, посвященных разработке методов решения и качественным исследова-
ниям задачи быстродействия в дискретном времени [13-15]. Основным недо-
статком данных публикаций является узкий круг исследованных задач: рас-
сматриваются системы размерности не больше трех, управление предполага-
ется скалярным или принадлежащим некоторому многограннику.
Основная цель данной статьи — развитие и обобщение результатов [16].
Принципиальным ограничением методов, разработанных в [16], является
невозможность их применения для систем с произвольным линейным и огра-
ниченным оператором. Данный факт связан с тем, что полученное решение
базируется на использовании класса множеств управляемости, конструктив-
ное описание которых удается построить только в случае обратимого опера-
тора системы. В данной статье предложен метод, позволяющий расширить
класс рассматриваемых систем за счет использования в качестве аппарата
решения поставленной задачи множества достижимости, которые представ-
ляют собой ограниченные множества для произвольного линейного и огра-
ниченного оператора системы. Кроме того, класс множеств, из которых на
каждом шаге выбирается управление, удается расширить до класса строго
выпуклых ограниченных множеств, в то время как в [16] рассматривались
исключительно строго выпуклые ограниченные множества, в каждой гранич-
ной точке которых нормальный конус представляет собой одномерное мно-
жество.
В результате по аналогии с [16] на основе методов выпуклого анали-
за [17, 18], связанных с линейными преобразованиями и сложением множеств
по Минковскому, сформулированы и доказаны необходимые и достаточные
условия оптимальности управления в случае, когда нуль является граничной
точкой по отношению к множеству достижимости. Данный критерий удается
представить в виде дискретного принципа максимума. Напротив, для внут-
ренней точки продемонстрирован вырожденный характер принципа макси-
мума, согласно которому в этом случае оказывается невозможно вычислить
оптимальное управление. Тем не менее удается и для случая внутренней точ-
ки сформулировать достаточные условия оптимальности.
Структура статьи следующая. В разделе 2 приведены постановка задачи
и описание семейства множеств достижимости, сформулирован подход к ре-
шению задачи быстродействия. В разделе 3 рассмотрены свойства классов
выпуклых множеств U2 и U3, на основе которых конструируются множества
достижимости, и выполнены некоторые вспомогательные построения. В раз-
4
деле 4 сформулирован и доказан критерий оптимальности в задаче быст-
родействия для произвольного начального состояния, разработан конструк-
тивный метод построения оптимального управления, представленный в виде
дискретного принципа максимума. Для случая внутренней точки продемон-
стрирован вырожденный характер принципа максимума, а также разрабо-
тан альтернативный подход к построению оптимального по быстродействию
управления. В разделе 5 опробована эффективность полученных результатов
на примере различных систем управления.
2. Постановка задачи
Рассматривается бесконечномерная линейная система с дискретным вре-
менем и ограниченным множеством допустимых значений управления (A, U):
x(k + 1) = Ax(k) + u(k),
(1)
x(0) = x0, u(k) U, k ∈ N ∪ {0},
где x(k) L — вектор состояния системы, u(k) U L — управление, L
нормированное пространство, A: L L — линейный ограниченный оператор.
Предполагается, что множество допустимых значений управления U является
выпуклым и слабо компактным, 0 int U.
Для системы (A, U) решается задача быстродействия, т.е. требуется вы-
числить минимальное число шагов Nmin, за которое возможно перевести
систему из заданного начального состояния x0 L в начало координат и
, удовлетворяющий
=1
условию x(Nmin) = 0. Такой процесс будем называть оптимальным.
Определим семейство множеств достижимости {Y(x0, N)}∞N=0, где каждое
Y(x0, N) представляет собой множество состояний, в которые можно пере-
вести систему (A, U) за N шагов из начального состояния x0 посредством
выбора допустимых управляющих воздействий:
{
{x ∈ L: ∃u(0), . . . , u(N - 1) U: x(N) = x}, N ∈ N,
(2)
Y(x0, N) =
{x0},
N = 0.
В дальнейшем будем предполагать, что
0
Y(x0, N),
N=0
т.е. задача быстродействия разрешима для заданного начального состояния.
С помощью класса множеств достижимости возможно вычислить опти-
мальное значение критерия задачи управления:
(3)
Nmin = min{N ∈ N ∪ {0}: 0 Y(x0
,N)}.
Обозначив для любых X, U L через X + U сумму множеств по Минков-
скому, сформулируем в виде леммы 1 аналитическое представление множе-
ства достижимости за N шагов.
5
Лемма 1. Пусть система множеств {Y(x0,N)}∞N=0 определяется соот-
ношениями (2). Тогда для каждого N ∈ N справедливо представление
Y(x0, N) =
AkU + AN x0.
k=0
Доказательства леммы 1 и всех последующих утверждений приведены в
Приложении.
Также класс множеств достижимости можно описать рекуррентными со-
отношениями.
Следствие 1. Пусть система множеств {Y(x0,N)}∞N=0 определяется
соотношениями (2). Тогда для каждого N ∈ N справедливо представление
Y(x0, N) = AY(x0, N - 1) + U.
Лемма 2. Пусть система множеств {Y(x0,N)}∞N=0 определяется соот-
ношениями (2) и для некоторогоŃ ∈ N ∪ {0} выполнено включение
0 Y(x0, Ń).
Тогда для всех NŃ верно
0 Y(x0,N).
Замечание 1. Выбор в качестве аппарата решения рассматриваемой
задачи быстродействия именно множеств достижимости вместо множеств
0-управляемости, которые использовались в [16, 19, 20], обусловлен сложно-
стью построения множеств 0-управляемости в случае вырожденности опера-
тора системы. Множества 0-управляемости, как показано в [5], представляют
собой неограниченные цилиндры, аналитическое описание которых в общем
случае оказывается затруднительным. При этом представление, аналогичное
лемме 1, для таких множеств существует только в случае, когда оператор A
обратим.
3. Дополнительные построения
Для решения задачи быстродействия наложим ограничения на класс мно-
жеств допустимых значений управления U и рассмотрим некоторые его свой-
ства. Определим классы множеств U2 и U3 следующим образом:
U2 = {U L: U — слабо компактное и строго выпуклое,
0 int U},
U3 = {X L: X — слабо компактное и выпуклое,
0 X}.
В дальнейшем будем предполагать, что множество допустимых значений
управления U системы (1) является элементом класса U2:
UU2.
6
Обозначим через L пространство, сопряженное к L. Результат действия
линейного и ограниченного функционала p ∈ L на вектор x обозначим че-
рез (p, x). Функционал p ∈ L \ {0} называется опорным к множеству X U3
в точке x ∈ ∂X, если
X ⊂ {x ∈ L: (p, x) (p,x)}
или
(p, x) = max(p, x).
x∈X
Нормальным конусом N(x, X) множества X U3 в точке x ∈ ∂X называется
множество всех функционалов, опорных к X в x:
{
}
N(x, X) = p ∈ L \ {0}: max(p, x) = (p, x)
x∈X
Будем также полагать, что для произвольной внутренней точки x ∈ int X
нормальный конус представляет собой пустое множество:
N(x, X) = ∅.
Замечание 2. Согласно определению нормального конуса справедлив
критерий принадлежности некоторой точки x ∈ X внутренности множества
X U3: включение x ∈ int X верно тогда и только тогда, когда N(x,X) = .
Замечание 3. Класс множеств U2 является расширением класса U1, из
которого в [16] выбиралось множество U, где
{
U1 = U L: U — слабо компактное и строго выпуклое,
0 int U,
}
∀u ∈ ∂U dimN(u,U) = 1 .
Также справедливы включения
U1 U2 U3.
Сформулируем основные свойства классов U2 и U3 в виде следующих
лемм.
Лемма 3. Пусть U U2. Тогда для любых различных u1,u2U верно
N(u1, U) N(u2, U) = ∅.
Лемма 3 гарантирует для любого U U2 существование отображения
ρU : L \ {0} → ∂U, определяемого соотношением
ρU(p) = arg max(p,u).
u∈U
Таким образом, произвольная граничная точка u ∈ ∂U может быть однознач-
но определена посредством элемента своего нормального конуса N(u, U).
7
Лемма 4. Пусть X U3, A: L L — линейный и ограниченный опера-
тор. Тогда для каждого x ∈ X верно включение
(Ker A \ {0}) N(Ax, AX).
Лемма 5. Пусть X U3, A: L L — линейный и ограниченный опера-
тор, x ∈ X. Тогда
N(Ax, AX) = (A)-1(N(x, X)) (Ker A \ {0}).
Замечание 4. Поскольку в общем случае линейный и ограниченный
оператор A не является биективным, то нельзя говорить о существовании
обратного к нему оператора A-1. Здесь и далее для произвольного X L
с помощью A-1(X) будем обозначать полный прообраз множества X:
A-1(X) = {x ∈ L: Ax ∈ X}.
Лемма 6. Пусть X1,X2U3, x1X1, x2X2.
Тогда
(
)
(
)
N
x1 + x2,X1 + X2
=N
x1,X1
N(x2,X2).
Следствие 2. Пусть X U3, U U2.
Тогда для каждого y ∈ ∂(X + U) существует единственное разложение
вида y = x + u, где x ∈ X, u ∈ U.
Леммы 4, 5, 6 и следствие 2 определяют вид нормальных конусов суммы
двух множеств из класса U3, а также линейного преобразования элемента U3.
Структура нормального конуса в результате линейного преобразования во
многом определяется линейным и ограниченным оператором A, в частно-
сти его ядром и образом. Данный факт продемонстрируем на следующем
примере.
Пример 1. Рассмотрим нормированное пространство L = lr, r ∈ (1,+)
[21]. Согласно теореме Рисса каждый функционал p ∈ l∗r однозначно опреде-
ляется вектором p ∈ lq, где1r +1q = 1, в соответствии с соотношением:
( p, x) =
pixi.
i=1
В дальнейшем будем отождествлять функционал p ∈ l∗r и вектор p ∈ lq, его
порождающий. Также будем полагать, что оператор, сопряженный к линей-
ному и ограниченному оператору A: lr → lr, действует на пространстве lq:
A : lq → lq.
Рассмотрим два оператора
A1 : lr → lr, A2 : lr → lr,
A1x = (0,x1,x2,...),
A2x = (x2,x3,...).
8
Тогда A1
A2, A2
A1, где оператор
A1
A2 действуют в пространстве lq
аналогично A1 и A2 соответственно. Также верны равенства
Ker A1 = {0}, Ker A2 = Lin {(1, 0, 0, . . .)}.
Обозначим через BR(x) ⊂ lr шар радиуса R > 0 с центром в точке x ∈ lr:
BR(x) = {y ∈ lr : ∥y - x∥ R}.
Верно включение BR(x) U2.
Построим в произвольной точке x0 ∈ ∂BR(0) нормальный конус
N(x0, BR(0)). Рассмотрим отображение π : lr → lq, действующее по пра-
вилу:
(
)
π(x) =
sign(x1)|x1|r-1, sign(x2)|x2|r-1, . . .
Тогда с учетом неравенства Гельдера справедливы соотношения
(
)
(
)
max
π(x0), x
max
∥π(x0)lq · ∥x∥lr
= R∥π(x0)lq =
x∈BR(0)
x∈BR(0)
(
)1
(
)1
q
q
r
=R
|x0i|(r-1)q
=R
|x0i|r
= ∥x0r ,l
= R∥x0qlr=R∥x0
r
r
i=1
i=1
(
)
π(x0), x0
= x0i · sign(x0i)|x0i|r-1 =
|x0i|r = ∥x0rl
,
r
i=1
i=1
откуда по определению нормального конуса
π(x0) N(x0, BR(0)).
Так как любой p ∈ cone(x0)} является элементом нормального конуса в
точке x = x0, где
R
(
)
x=
sign(p1)|p1|q-1, sign(p2)|p2|q-1, . . .
∈ ∂BR(0),
∥p∥q-1
lq
то в силу леммы 3 p ∈ N(x0, BR(0)). Тогда
(
)
{
}
(4)
N
x0,BR(0)
= cone
π(x0)
\ {0}.
Построим нормальный конус к A1BR(0) в A1x0. Поскольку Ker A1 = {0},
то согласно лемме 4 для всех y ∈ A1BR(0)
(Ker A1 \ {0}) N(y, A1BR(0)),
∂A1BR(0) = A1BR(0).
С другой стороны,
(
)
(
)
(A1)-1
N(x0, BR(0))
= (A1)-1
cone(x0)} \ {0}
=
(
)
=
cone {A2π(x0)} + Lin {(1, 0, 0, . . .)}
\ {0},
9
т.е. нормальный конус в любом y ∈ A1BR(0) не пуст, даже если его прообраз
являлся внутренней точкой по отношению к BR(0).
Теперь построим N(A2x0, A2BR(0)). Справедливо равенство A2BR(0) =
= BR(0), откуда A2x0 ∈ ∂A2BR(0) тогда и только тогда, когда x01 = 0, т.е.
(
)
(
)
(A2)-1
N(x0, BR(0))
= (A2)-1
cone(x0)} \ {0}
=
{
∅,
x0
= 0,
1
=
cone {A1π(x0)} \ {0}, x01 = 0.
С учетом леммы 5
{
∅,
x0
= 0,
1
N(A2x0, A2BR(0)) =
cone {A1π(x0)} \ {0}, x01 = 0,
т.е. нормальный конус к A2BR(0) в y ∈ A2BR(0) может оказаться пустым
даже в том случае, когда единственный прообраз y являлся граничной точкой
по отношению к BR(0).
4. Критерий оптимальности в задаче быстродействия
Рассмотрим критерий оптимальности траектории и управления в задаче
быстродействия для различных случаев. На основе сформулированных тео-
рем разработаем метод построения оптимального управления в задаче быст-
родействия.
Принципиальные отличия имеют два возможных варианта включения
0 Y(x0,Nmin):
(5)
0 ∈ ∂Y(x0,Nmin
),
(6)
0 int Y(x0,Nmin
).
Специфика случая (5) обусловлена следствием 1 и леммами 3 и 6. В силу лем-
мы 3 оптимальное управление, лежащее на границе множества U, на каждом
шаге может быть однозначно определено посредством элементов нормально-
:
=0
ψ(k) = Aψ(k + 1), k = 0, Nmin - 1,
(7)
ψ(Nmin) = ψNmin .
Тем не менее рекуррентные соотношения (7) в случае вырожденного опера-
тора A в силу леммы 5 могут привести к ситуации, когда для некоторого
k0 = 1,Nmin оказывается выполнено включение ψ(k0) KerA. В результате
для всех k < k0 оказывается справедливым равенство ψ(k) = 0, что делает
невозможным определить оптимальное управление посредством сопряжен-
ной системы (7) и отображения ρU.
В виде следующей леммы 7 сформулируем достаточные условия, гаранти-
рующие невырожденный вид сопряженной системы в случае включения (5).
10
Лемма 7. Пусть семейство множеств {Y(x0,N)}∞N=0 определяется со-
отношениями (2) и справедливо включение 0 ∈ ∂Y(x0,Nmin).
Тогда для каждого p ∈ N(0, Y(x0, Nmin)) верно, что
p ∈ Ker(A)Nmin.
Случай (6) обладает рядом принципиальных отличий от (5). Вообще гово-
ря, для (6) принцип максимума как критерий оптимальности процесса управ-
ления приобретает вырожденный характер, т.е. не удается построить опти-
мальную траекторию и управление согласно соотношениям:
x(k + 1) = Ax(k) + u(k),
ψ(k) = Aψ(k + 1),
x(0) = x0,
(8)
ψ(Nmin) = ψNmin ,
u(k) = arg max(ψ(k + 1),u).
u∈U
Теорема 1. Пусть выполнено включение
(6) и процесс управления
определяется соотношениями (8).
=1
Тогда для любого ψNmin Ker (A)Nmin-1 справедливо x(Nmin) = 0.
Как следует из теоремы 1, в случае (6) оптимальный процесс системы (1)
удовлетворяет соотношениям принципа максимума (8) только тогда, когда
существует k0 1, Nmin такой, что для всех k = 0, k0
ψ(k) = 0.
Данный факт делает невозможным определить оптимальное управление из
условия
u(k) = arg max(ψ(k + 1), u), k = 0, k0 - 1.
u∈U
Рассмотрим способ, позволяющий свести случай (6) к случаю (5) и сфор-
мулировать критерий оптимальности процесса для произвольного начального
состояния. Обозначим:
(
)
(9)
α=μ
-ANminx0,Y(x0,Nmin) - ANminx0
,
где μ(x, X) — функционал Минковского [21]. Для вспомогательной систе-
мы (A, αU) определим семейство множеств достижимости {Yα(x0, N)}∞N=0.
Лемма 8. Пусть выполнено включение (6).
Тогда для системы (A, αU) верны соотношения:
i. Yα(x0,N) Y(x0,N), N ∈ N ∪ {0},
ii. 0 ∈ ∂Yα(x0,N).
Лемма 8 позволяет в вопросах построения критерия оптимальности фак-
тически ограничиться рассмотрением случая (5), перейдя от исходной систе-
мы (A, U) к системе (A, αU).
11
,
=0
{u(k)}Nmin-1k=0 L и функционалов
L \ {0} для каждого k =
=0
= 0, Nmin - 1 определяются соотношениями:
x(k + 1) = Ax(k) + u(k),
ψ(k) = Aψ(k + 1),
x(0) = x0,
ψ(Nmin) N(0, Yα(x0, Nmin)),
u(k) = arg max(ψ(k + 1),u).
u∈αU
Тогда
— оптимальный процесс системы (A,U) в за-
=1
даче быстродействия, причем если α = 1, то данный процесс единственный;
ii. x(k) ∈ ∂Yα(x0,k), k = 0,Nmin;
iii. ψ(k) N(x(k),Yα(x0,k)), k = 0,Nmin.
Для случая (5) теорема 2 является необходимым и достаточным усло-
вием оптимальности процесса управления. При этом рекуррентные со-
отношения теоремы 2 полностью совпадают с соотношениями принципа
максимума (8), где сопряженная система определяется согласно условию
ψNmin N(0,Y(x0,Nmin)).
5. Примеры
Продемонстрируем эффективность разработанных методов решения зада-
чи быстродействия на следующих примерах.
Пример 2. Рассмотрим систему управления (A1,U) c вектором состоя-
ния из пространства L = lr, r ∈ (1; +), где оператор A1 : lr → lr из приме-
ра 1, U = B1(0). Построим оптимальное управление для точки x0 ∈ lr такой,
что ∥x0∥ ∈ N.
Поскольку для любого x ∈ lr
∥A1x∥ = ∥x∥,
то для всех N ∈ N справедливы включения
AN1B1(0) ⊂ AN-11B1(0),
(10)
N · AN1 B1(0)
Ak1B1(0) ⊂ N · B1(0) = BN
(0).
k=0
Поскольку ∥ - A∥x01x0 = ∥x0, то -A∥x01x0 ∈ ∂B∥x0(0). Но в силу (10)
∥x0∥-1
-A∥x01x0 ∈ ∥x0∥ · A∥x01B1(0)
Ak1B1(0) B∥x0(0),
k=0
12
откуда получаем, что
∥x0∥-1
-A∥x01x0 ∈ ∂
Ak1B1(0),
k=0
а это выражение c учетом леммы 1 эквивалентно условию
0 ∈ ∂Y(x0,∥x0).
С другой стороны,
{
B
∥x0 2,
∥x0∥-1(0),
-A∥x0∥-11x0
{0},
∥x0 = 1,
откуда согласно (10)
∥x0∥-2
Ak1B1(0),
∥x0 2,
-A∥x0∥-11x0
k=0
{0},
∥x0 = 1,
что эквивалентно условию
0 Y(x0,∥x0∥ - 1).
Тогда в соответствии с (3)
Nmin = ∥x0∥.
Поскольку рассматриваемый случай удовлетворяет условиям теоремы 2
при α = 1, то ψ(Nmin) вычислим из условия
(
)
(
)
ψ(Nmin) N
0, Y(x0, Nmin)
=N
Ak1B1(0)
-ANmin1x0,
k=0
В силу (10) для любого p ∈ lq \ {0}
max
(p, x) max (p, x).
x∈BNmin (0)
x∈
Ak1B1(0)
k=0
Тогда с учетом (4)
(
)
(
{ (
)}
)
cone π
x0
\ {0}
N
Ak1B1(0)
,
-ANmin1
-ANmin1x0,
k=0
ψ(Nmin) =0, . . . , 0, -sign(x01)|x01|r-1, -sign(x02)|x02|r-1, . . . .
Nmin
13
cисте-
=1
имеют вид:
=1
ψ(k + 1) = π(-Ak+11x0) =0, . . . , 0, -sign(x01)|x01|r-1, -sign(x02)|x02|r-1, . . . ,
k+1
1
u(k) = arg max
(ψ(k + 1), u) = -
Ak+11x0,
u∈B1(0)
Nmin
Nmin - k
x(k) =
Ak1x0, k = 0,Nmin - 1,
Nmin
x(Nmin) = 0.
Задача быстродействия решена.
Пример 3. В рамках примера 2 рассмотрим случай ∥x0∥ > 0. Обозначим
через f : lr N отображение
f (x) = min{n ∈ N: ∥x∥ n}.
Тогда аналогично примеру 2 из (10) следует, что
f (x0)-2
Ak1B1(0),
∥x0∥ > 1,
-Af(x0)-11x0
k=0
{0},
∥x0 1,
(
)
f (x0)-1
-Af(x0)1x0 = -f(x0) · Af(x0)x0
∈ f(x0) · Af(x0)B1(0)
Ak1B1(0),
1
f (x0)
k=0
откуда
(
)
(
)
0Y
x0,f(x0)
\Y
x0,f(x0) - 1
,
что в силу (3) эквивалентно выражению
Nmin = f(x0),
причем если ∥x0∥ ∈ N, то
(
)
0 int Y
x0,f(x0)
Вычислим согласно (9) величину α. Из (10) следует, что включение
Ak1Bα(0) BN
-ANmin1x0 ∈ ∂
min·α(0)
k=0
14
будет выполнено только в том случае, когда
min
Nmin · α =
-AN
x0= ∥x0∥,
1
∥x0
∥x0
α=
=
Nmin
f (x0)
Тогда для построения оптимального процесса системы (A1, U) можно вос-
пользоваться теоремой 2.
Пример 4. В рамках предположений примера 2 рассмотрим систему
управления (A2, U), где оператор A2 : lr → lr взят из примера 1. Поскольку
справедливо равенство
A2U = U,
то в силу леммы 1 для каждого N ∈ N
Y(x0, N) = BN (AN x0).
Рассмотрим случай, когда 0 ∈ ∂BNmin (ANmin2 x0), что эквивалентно условию
min
AN
x0
=Nmin.
2
l2
Тогда согласно (4)
(
(
))
{
(
)}
N
0, Y
x0,Nmin
= cone
π
-ANminx0
\ {0},
откуда в соответствии с теоремой 2
(
)
ψ(Nmin) = π
-ANminx0
=
(
)
(
)
)
= -sign
x0N
x0N
r-1 ,-sign(x0N
x0N
r-1 ,
min+1
min+1
min+2
min+2
cисте-
=1
имеют вид:
=1
ψ(k + 1) = (A2)Nmin-k-1ψ(Nmin) =
(
)
)
=
0, . . . , 0 , -sign
x0N
x0N
r-1 ,-sign(x0N
x0N
r-1 ,...
,
min+1
min+1
min+2
min+2
Nmin-k-1
1
u(k) = arg max
(ψ(k + 1), u) =
0, . . . , 0
,-x0N
,-x0N
,...,
min+1
min
+2
u∈B1(0)
Nmin
Nmin-k-1
(
)
Nmin - k
Nmin - k
x(k) = x0k+1,... ,x0N
,
·x0N
,
·x0N
,...
,
min
min+1
min
+2
Nmin
Nmin
k = 0,Nmin - 1,
x(Nmin) = 0.
Задача быстродействия решена.
15
Замечание 5. Оптимальное управление на k-м шаге в примере 4 не ока-
зывает влияния на первые Nmin - k - 1 координат вектора состояния, что
обусловлено свойствами оператора A2. Более того, оптимальное управление
для двух начальных состояний x01, x02 ∈ lr, отличающихся только первы-
ми Nmin координатами, будет одинаково. Данный факт следует из того, что
для всех N ∈ N верно равенство
Y(x1, N) = Y(x2, N),
где x1, x2 ∈ lr такие, что x1i = x2i для всех натуральных i > N.
Пример 5. Рассмотрим процедуру построения ψ(Nmin) в случае, когда
множество U не является шаром. В рамках данного примера предположим,
что пространство L — гильбертово. Согласно теореме Рисса каждый функ-
ционал p ∈ L однозначно определяется вектором p ∈ L посредством скаляр-
ного произведения:
( p, x) =
pixi.
i=1
В дальнейшем будем отождествлять функционал p ∈ L и вектор p ∈ L, его
порождающий. Также будем полагать, что оператор, сопряженный к линей-
ному и ограниченному оператору A: L L, действует на пространстве L:
A : L L.
Пусть U = {u ∈ L: (x, Hx) 1}, где H : L L — положительно опреде-
ленный самосопряженный линейный и ограниченный оператор.
Как продемонстрировано в [16], справедливо включение U U1 U2, т.е.
для построения нормального конуса N(u, U) в некоторой u ∈ ∂U достаточно
найти единственный элемент p ∈ N(u, U):
N(u, U) = cone {p} \ {0}.
Поскольку (x, Hy) является скалярным произведением относительно
x,y ∈ L [22], то в силу неравенства Коши—Буняковского для любого ũ ∈ U
верно неравенство
(ũ, Hu)
(ũ,Hũ)(u,Hu) 1,
(u, Hu) = 1.
Тогда
u = arg max(Hu, ũ),
ũ∈U
Hu∈N(u,U),
(11)
H-1p
ρU(p) = arg max(p, ũ) =
·
ũ∈U
p,H-1p
16
Пусть для x0 L и системы (A, U) выполнено включение
0 ∈ ∂Y(x0,Nmin), NminN.
Тогда ψ(Nmin) в силу теоремы 2 можно определить из условия
(
)
ψ(Nmin) N(0, Y(x0, Nmin)) = N
-ANminx0,
AkU
,
k=0
-ANminx0 = arg
max
(ψ(Nmin), x) =
arg max(ψ(Nmin), Akx) =
x∈U
x∈
AkU
k=0
k=0
=
arg max((A)kψ(Nmin), x).
x∈U
k=0
Учитывая (11), получим условие
H-1(A)kψ(Nmin)
-ANminx0 =
,
((A)kψ(Nmin), H-1(A)kψ(Nmin))
k=0
из которого можно определить ψ(Nmin).
6. Заключение
В статье рассмотрен подход к решению задачи быстродействия для линей-
ных дискретных систем с бесконечномерным вектором состояния на основе
множеств достижимости.
Доказательство теоремы 2 во многом базируется на леммах 5 и 6, опре-
деляющих структуру нормального конуса при линейных преобразованиях и
сложении множеств по Минковскому. С помощью леммы 3 в случае гра-
ничной точки удается обосновать единственность оптимального управле-
ния, определяемого посредством элемента нормального конуса, а лемма 7
гарантирует невырожденность траектории сопряженной системы, что поз-
воляет обобщить дискретный принцип максимума на случай необратимого
оператора.
ПРИЛОЖЕНИЕ
Доказательство леммы 1. По определению множества достижимо-
сти условие y ∈ Y(x0, N) эквивалентно существованию u(0), . . . , u(N - 1) U
таких, что
y = x(N) = Ax(N - 1) + u(N - 1) =
... = ANx0 + AN-1u(0) + ... + Au(N - 2) + u(N - 1),
откуда согласно определению алгебраической суммы множеств следует утвер-
ждение леммы 1.
17
Доказательство леммы 2. Если N =Ń, то утверждение леммы 2
тривиально. Пусть N >Ń. В силу леммы 1 и включения 0 U справедливы
соотношения
Ń-1
0 = 0 + A0 + ...AN- Ń-10
AkU.
k=0
Тогда
Ń-1
0 = AN- Ń0 + 0 ∈ AN- ŃY(x0,N˜) +
AkU =
k=0
Ń-1
Ń-1+N-N˜
=AŃ+N-Ńx0 +
AkU +
AkU = Y(x0,N).
k=N-
Ń
k=0
Лемма 2 доказана.
Доказательство леммы 3. Если хотя бы одна из точек u1,u2
явля-
ется внутренней по отношению к U, то утверждение леммы 3 следует непо-
средственно из определения нормального конуса.
Рассмотрим случай u1, u2 ∈ ∂U. Предположим, что существует
p ∈ N(u1,U) N(u2,U).
Тогда
(
)
1
1
1
(
)
1
(
)
p,
u1 +
u2
=
p, u1
+
p, u2
=
2
2
2
2
1
1
=
max(p, u) +
max(p, u) = max (p, u) .
2
u∈U
2
u∈U
u∈U
По определению нормального конуса p ∈ N(12 u1 +12 u2, U). Но в силу строгой
выпуклости U
1
1
u1 +
u2 int U,
2
2
(
)
1
1
N
u1 +
u2,U
= ∅.
2
2
Получаем противоречие. Лемма 3 доказана.
Доказательство леммы 4. Если KerA = {0}, то утверждение лем-
мы 4 выполнено автоматически. Рассмотрим случай, когда существует
p ∈ (KerA \ {0}). Тогда для произвольной x ∈ X справедливы соотношения
max(p, y) = max(p, Ax) = max(Ap, x) = 0 = (Ap, x) = (p, Ax),
y∈AX
x∈X
x∈X
18
откуда согласно определению нормального конуса p ∈ N(Ax, AX). Лемма 4
доказана.
Доказательство леммы
5. В случае N(Ax, AX) = утверждение
леммы 5 очевидно.
Рассмотрим случай, когда существует p ∈ N(Ax, AX). Тогда справедлива
цепочка равенств
(Π.1)
(Ap, x) = (p, Ax) = max(p, y) = max(p, Ax) = max(A
p, x).
y∈AX
x∈X
x∈X
В случае когда x ∈ int X, N(x, X) =, соотношения (Π.1) возможны тогда
и только тогда, когда Ap = 0. Отсюда
p ∈ KerA \ {0},
N(Ax, AX) Ker A \ {0}.
С учетом леммы 4
N(Ax, AX) = Ker A \ {0}.
Если x ∈ ∂X, то соотношения (Π.1) возможны тогда и только тогда, когда
Ap = 0 или Ap ∈ N(x,X). Отсюда
p ∈ (A)-1(N(x,X)) (KerA \ {0}),
N(Ax, AX) (A)-1(N(x, X)) (Ker A \ {0}).
Если (A)-1(N(x, X)) =, то в силу леммы 4 утверждение леммы 5 доказано.
Рассмотрим случай, когда существует p ∈ (A)-1(N(x, X)). Тогда Ap ∈
N(x,X),
(p, Ax) = (Ap, x) = max(Ap, x) = max(p, Ax) = max(p, y),
x∈X
x∈X
y∈AX
p ∈ N(Ax,AX),
(A)-1(N(x, X)) N(Ax, AX).
С учетом леммы 4 утверждение леммы 5 полностью доказано.
Доказательство леммы
6. Предположим, что существует p ∈
N(x1 + x2,X1 + X2). Тогда
(p, x1) + (p, x2) = (p, x1 + x2) =
= max (p,y) = max(p, x1 + x2) = max (p, x1) + max (p, x2),
y∈X1+X2
x1X1
x1X1
x2X2
x2X2
откуда следует, что
(p, x1) = max (p, x1),
x1X1
(p, x2) = max (p, x2),
x2X2
p ∈ N(x1,X1) N(x2,X2),
(Π.2)
N(x1 + x2, X1 + X2) N(x1, X1) N(x2, X2
).
19
В случае если N(x1 + x2, X1 + X2) =, то включение (Π.2) выполнено три-
виальным образом.
Предположим теперь, что существует p ∈ N(x1, X1) N(x2, X2). Тогда
(p, x1 + x2) = (p, x1) + (p, x2) =
= max
(p, x1) + max (p, x2) = max
(p, x1 + x2) = max (p, y),
x1X1
x2X2
x1X1
y∈X1+X2
x2X2
откуда следует, что
p ∈ N(x1 + x2,X1 + X2),
(Π.3)
N(x1, X1) N(x2, X2) N(x1 + x2, X1 + X2
).
В случае если N(x1, X1) N(x2, X2) =, то включение (Π.3) выполнено
тривиальным образом.
Из (Π.2) и (Π.3) следует утверждение леммы 6.
Доказательство следствия 2. Следствие вытекает из лемм 6 и 3.
Лемма П.1. Пусть X U3, 0 int X, x ∈ ∂X.
Тогда для любого p ∈ N(x, X) верно неравенство
(p, x) > 0.
Доказательство леммы П.1. Поскольку p ∈ N(x,X), то p = 0. Тогда
существует y ∈ L \ {0} такой, что (p, y) = 0.
Так как 0 int X, то существует ε > 0, удовлетворяющий условию Bε(0)
X. Тогда
ε · sign ((p,y))
Bε(0) X,
∥y∥
(
)
ε · sign ((p,y))
ε
(p, x) = max(p, x) p, y ·
=
|(p, y)| > 0.
x∈X
∥y∥
∥y∥
Лемма П.1 доказана.
Доказательство леммы 7. В случае Nmin = 0 утверждение леммы 7
тривиально. Рассмотрим случай Nmin N.
В силу леммы 1 верно равенство
(
)
N(0, Y(x0, Nmin)) = N
-ANminx0,
AkU
k=0
Так как
AkU U3, 0 int U
AkU, то в силу леммы П.1 для
k=0
k=0
каждого p ∈ N(0, Y(x0, Nmin)) справедливы соотношения
(
)
(
)
(A)Nmin p, -x0
=
p,-ANmin x0
> 0.
20
Тогда по определению
p ∈ Ker(A)Nmin.
Лемма 7 доказана.
Доказательство теоремы 1. Предположим обратное: процесс управ-
оптимален в задаче быстродействия для систе-
=1
мы (1), но при этом ψNmin Ker (A)Nmin-1. Тогда для всех k = 0, Nmin - 1
AkψN
= 0,
min
(A)kψN
N(u(Nmin - k - 1),U),
min
(
)-1 (
)
ψNmin (A)k
N(u(Nmin - k - 1), U)
В силу леммы 5
(
)
ψNmin N Aku(Nmin - k - 1),AkU
Тогда согласно лемме 6
(N
)
ψNmin N
Aku(Nmin - k - 1),
AkU
,
k=0
k=0
откуда в соответствии с леммой 1
(
)
ψNmin N ANmin x0 +
Aku(Nmin - k - 1),Y(x0,Nmin)
k=0
Поскольку 0 int Y(x0, Nmin), то
N(0, Y(x0, Nmin)) = ∅,
0=ANminx0 +
Aku(Nmin - k - 1) = x(Nmin).
k=0
не является оптималь-
=1
ным в задаче быстродействия. Получаем противоречие. Теорема 1 доказана.
Доказательство леммы 8. В силу (6) и определения функционала
Минковского верно, что α < 1. Так как 0 ∈ AkU, k = 0, Nmin - 1, то
αAkU
AkU.
k=0
k=0
i. Тогда согласно лемме 1
Yα(x0,N) Y(x0,N), N ∈ N ∪ {0}.
21
ii. По определению функционала Минковского
(
)
N
(
)
-ANminx0 ∈ ∂
α(Y(x0, Nmin) - ANmin x0)
=
αAkU
,
k=0
(N
)
0∈∂
αAkU + AN
minx0
=Yα(x0,Nmin).
k=0
Лемма 8 доказана.
Доказательство теоремы 2. Поскольку согласно включению αU
U управление, допустимое для системы (A,αU), является также допусти-
мым и для (A, U), то с учетом леммы 8 достаточно доказать утверждения i-iii
теоремы 2 только для случая (5).
согласно рекуррентным соотноше-
=0
ниям:
y(Nmin) = 0,
{
y(k) Y(x0,k),
Ay(k) = y(k + 1) - u(k), k = 0, Nmin - 1.
Тогда в соответствии с предположениями:
y(Nmin) ∈ ∂Y(x0,Nmin),
ψ(Nmin) N(y(Nmin), Y(x0, Nmin)).
Предположим, что для некоторого k = 0, Nmin - 1 выполнены условия:
y(k + 1) ∈ ∂Y(x0,k + 1),
ψ(k + 1) N(y(k + 1), Y(x0, k + 1)).
В силу следствия 1 справедливо представление
Y(x0, k + 1) = AY(x0, k) + U.
Как продемонстрировано в [17], класс U3 замкнут относительно сложения
по Минковскому и линейных преобразований, откуда AY(x0, k) U3, U U2,
и согласно следствию 2 существует единственное разложение вида
(Π.4)
y(k + 1) = z(k) + u,
где z(k) ∈ ∂AY(x0, k), u ∈ ∂U. В соответствии с леммой 6
N(y(k + 1), Y(x0, k + 1)) = N(z(k), AY(x0, k)) N(u, U).
Тогда в силу леммы 3 вектор u однозначно опреляется соотношением
u = arg max(ψ(k + 1),u) = u(k).
u∈U
22
Поскольку z(k) ∈ ∂AY(x0, k), то существует y(k) Y(x0, k) такой, что
z(k) = Ay(k).
Согласно лемме 5
ψ(k + 1) (A)-1(N(y(k), Y(x0, k))) (Ker A \ {0}),
но поскольку в силу леммы 7
ψ(k + 1) = (A)Nmin-k-1ψ(Nmin) Ker A,
то
ψ(k + 1) (A)-1(N(y(k), Y(x0, k))).
Тогда
ψ(k) = Aψ(k + 1) = 0,
(Π.5)
ψ(k) N(y(k), Y(x0
,k)).
Поскольку N(y(k), Y(x0, k)) =, то
(Π.6)
y(k) ∈ ∂Y(x0
,k).
Согласно методу математической индукции для всех k = 0, Nmin верно
(Π.5) и (Π.6), причем в случае k = 0
y(0) Y(x0,0) = {x0}.
Также по построению верно равенство
y(k + 1) = Ay(k) + u(k), k = 0,Nmin - 1.
Тогда для всех k = 0, Nmin
x(k) = y(k).
— оп-
=1
тимальный процесс системы (1) в задаче быстродействия. Единственность
следует из разложения (Π.4) и следствия 2.
ii. В силу (Π.6) верно включение
x(k) ∈ ∂Y(x0,k), k = 0,Nmin.
iii. Согласно (Π.5) справедливо
ψ(k) N(x(k), Y(x0, k)), k = 0, Nmin.
Теорема 2 доказана.
23
СПИСОК ЛИТЕРАТУРЫ
1.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Б.Ф. Матема-
тическая теория оптимальных процессов. М.: Наука, 1969.
2.
Болтянский В.Г. Математические методы оптимального управления. М.: Наука,
1969.
3.
Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука, 1975.
4.
Беллман Р. Динамическое программирование. М.: ИИЛ, 1960.
5.
Сиротин А.Н., Формальский А.М. Достижимость и управляемость дискрет-
ных систем при ограниченных по величине и импульсу управляющих воздейст-
виях // АиТ. 2003. № 12. С. 17-32.
Sirotin A.N., Formal’skii A.M. Reachability and Controllability of Discrete-Time
Systems under Control Actions Bounded in Magnitude and Norm // Autom. Remote
Control. 2003. V. 64. No. 12. P. 1844-1857.
6.
Fisher M.E., Gayek J.E. Estimating Reachable Sets for Two-Dimensional Linear
Discrete Systems // J. Optim. Theory Appl. 1988. V. 56. No. 1. P. 67-88.
7.
Костоусова Е.К. О внешнем полиэдральном оценивании множеств достижимо-
сти в “расширенном” пространстве для линейных многошаговых систем с инте-
гральными ограничениями на управление // Вычислит. технологии. 2004. Т. 9.
№ 4. С. 54-72.
8.
Аграчев А.А., Сачков Ю.Л. Геометрическая теория управления. М.: Наука, 2005.
9.
Евтушенко Ю.Г. Методы решения экстремальных задач и их приложения в
системах оптимизации. М.: Наука, 1982.
10.
Болтянский В.Г. Оптимальное управление дискретными системами. М.: Наука,
1973.
11.
Пропой А.И. Элементы теории оптимальных дискретных процессов. М.: Наука,
1973.
12.
Holtzman J.M., Halkin H. Directional Convexity and the Maximum Principle for
Discrete Systems // J. SIAM Control. 1966. V. 4. No. 2. P. 263-275.
13.
Desoer C.A., Wing J. The Minimal Time Regulator Problem for Linear Sampled-
Data Systems: General Theory // J. Franklin Inst. 1961. V. 272. No. 3. P. 208-228.
14.
Lin W.-S. Time-Optimal Control Strategy for Saturating Linear Discrete Systems //
Int. J. Control. 1986. V. 43. No. 5. P. 1343-1351.
15.
Мороз А.И. Синтез оптимального по быстродействию управления для линейного
дискретного объекта третьего порядка // АиТ. 1965. № 2. С. 193-207.
Moroz A.I. Synthesis of Time-Optimal Control for Linear Discrete Objects of the
Third Order // Autom. Remote Control. 1965. V. 25. No. 9. P. 193-206.
16.
Ибрагимов Д.Н., Сиротин А.Н. О задаче быстродействия для класса линейных
автономных бесконечномерных систем с дискретным временем и ограниченным
управлением // АиТ. 2017. № 10. C. 3-32.
Ibragimov D.N., Sirotin A.N. On the Problem of Operation Speed for the Class of
Linear Infinite-Dimensional Discrete-Time Systems with Bounded Control // Autom.
Remote Control. 2017. V. 78. No. 10. P. 1731-1756.
17.
Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
18.
Берже М. Геометрия. Т. 2. М.: Мир, 1984.
19.
Ибрагимов Д.Н., Сиротин А.Н. О задаче оптимального быстродействия для ли-
нейной дискретной системы с ограниченным скалярным управлением на основе
множеств 0-управляемости // АиТ. 2015. № 9. С. 3-30.
24
Ibragimov D.N., Sirotin A.N. On the Problem of Optimal Speed for the Discrete
Linear System with Bounded Scalar Control on the Basis of 0-controllability Sets //
Autom. Remote Control. 2015. V. 76. No. 9. P. 1517-1540.
20. Ибрагимов Д.Н. Оптимальное по быстродействию управление движением
аэростата
// Электрон. журн. Тр. МАИ.
2015.
№ 83. Доступ в журн.
http://trudymai.ru/published.php
21. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального
анализа. М.: Физматлит, 2012.
22. Данфорд Н., Шварц Дж. Т. Линейные операторы. Т. 2. Спектральная теория.
Самосопряженные операторы в гильбертовом пространстве. М.: Мир, 1966.
Статья представлена к публикации членом редколлегии Е.Я. Рубиновичем.
Поступила в редакцию 14.05.2018
После доработки 16.09.2018
Принята к публикации 08.11.2018
25