ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2021, том 57, № 11, с. 1491-1502
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.977.55
О ГАРАНТИРОВАННОМ УПРАВЛЕНИИ
ЛИНЕЙНОЙ СИСТЕМОЙ ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ
О ФАЗОВЫХ КООРДИНАТАХ
© 2021 г. В. И. Максимов
Изучается задача управления в условиях неточного измерения части фазовых координат
системы линейных обыкновенных дифференциальных уравнений. Суть задачи состоит в
построении алгоритма формирования управления по принципу обратной связи, который
гарантировал бы отслеживание траекторией заданной системы траектории другой систе-
мы, подверженной влиянию неизвестного возмущения, которое является функцией време-
ни, суммируемой с квадратом евклидовой нормы. Рассмотрены случаи как непрерывного,
так и дискретного по времени измерения. Указан набор устойчивых к информационным
помехам и погрешностям вычислений алгоритмов решения задачи, основанных на кон-
струкциях теории гарантирующего управления. Каждый из алгоритмов ориентирован на
свои информационные условия относительно динамики системы и измеряемых координат.
DOI: 10.31857/S0374064121110078
Введение. Постановка задачи. Рассматривается линейная система дифференциальных
уравнений
x(t) = Ax(t) + By(t) + f1(t), t ∈ T = [0, ϑ],
y(t) = Cx(t) + Dy(t) + Eu(t) + f(t)
(1)
с начальным условием
x(0) = x0, y(0) = y0.
Здесь 0 < ϑ < +∞, x ∈ Rn, y ∈ RN , u ∈ Rr, f1(·) ∈ W1,∞(T ; Rn) = {p(·) ∈ L2(T ; Rn) : p(·)
∈ L(T;Rn)} и f(·) ∈ L(T;RN) - заданные функции, u - управление, A, B, C, D и E -
стационарные матрицы соответствующих размеров.
Наряду с системой (1) имеется ещё одна система того же вида
x1(t) = Ax1(t) + By1(t) + f1(t), t ∈ T,
y1(t) = Cx1(t) + Dy1(t) + Ev(t) + f(t)
(2)
с начальным условием
x1(0) = x10, y1(0) = y10.
Эта система подвержена воздействию некоторого возмущения v(·) ∈ L2(T ; Rr). Как само это
возмущение v(·), так и отвечающее ему решение системы (2)
z1(·;z10,v(·)) = {x1(·;z10,v(·)),y1(·;z10,v(·))},
где z10 = {x10, y10}, неизвестны.
В дискретные, достаточно частые, моменты времени τi Δ =i}mi=0 (τ0 = 0, τm =
= ϑ, τi+1 = τi + δ) измеряется часть фазовых состояний системы (2), а именно состояния
x1(τi) = x1(τi;z10,v(·)), а также состояния z(τi) = z(τi;z0,u(·)) = {x(τi;z0,u(·)),y(τi;z0,u(·))}
(z0 = {x0, y0}) системы (1). Состояния x1(τi) измеряются с ошибкой. Результаты измерений -
векторы ξhi Rn, i ∈ [0 : m - 1], - удовлетворяют неравенствам
|x1(τi) - ξhi|n h.
(3)
1491
4
1492
МАКСИМОВ
Здесь h ∈ (0, 1) - уровень погрешности измерения, через | · |n обозначена евклидова норма в
пространстве Rn. Будем предполагать, что
|x0 - x10|n h,
|y0 - y10|N h.
(4)
Необходимо сконструировать алгоритм формирования управления u = uh(·) в системе (1),
позволяющий осуществлять отслеживание решением z(·) = {x(·), y(·)} этой системы реше-
ние z1(·) = {x1(·), y1(·)} системы (2). Таким образом, рассматривается задача, состоящая
в построении алгоритма, который по текущим измерениям величин x1(τi) и z(τi) форми-
рует (по принципу обратной связи) управление u = uh(·) такое, что отклонение решения
zh(·) = z(·;z0,uh(·)) этой системы от решения системы (2) z1(·) = z1(·;z10,v(·)) в метрике
пространства C(T ; Rn+N ) мало при достаточной малости измерительной погрешности h.
Задача слежения - одна из классических задач теории управления. Она исследовалась
многими авторами (см., например, [1, гл. 4, § 4; 2, гл. 7, § 3.3]). В данной статье мы рассмотрим
случай неполной информации о фазовых координатах. При этом укажем четыре алгоритма
решения задачи, которые основаны на комбинации метода динамического обращения [3, гл. 1,
§ 4; 4, гл. 6, § 17, 19] с известным в теории позиционных дифференциальных игр методом
экстремального сдвига [5, гл. 3, § 13]. Другие алгоритмы решения задач слежения, основанные
на подходящих модификациях метода экстремального сдвига, приведены в работах [6-9].
В дальнейшем матрицы A, B и E, а также функцию f1(·) предполагаем известными.
Матрицы C и D, а также функцию f(·) предполагаем неизвестными, считая известным
лишь евклидову норму матрицы D. Неизвестен также вектор x10.
Пусть для каждого h ∈ (0, 1) фиксировано семейство Δh разбиений отрезка T контроль-
ными моментами времени τh,i :
,
τh,0 = 0, τh,mh = ϑ, τh,i+1 = τh,i + δ(h), δ(h) (0),
(5)
Δh =h,i}
=0
где δ = const (0, 1). Любую кусочно-постоянную функцию ξh(·) : T → Rn, ξh(t) = ξhi при
t ∈ [τh,ih,i+1), i ∈ [0 : mh - 1], удовлетворяющую ограничениям (3) (при τi = τh,i), будем
называть допустимым измерением точности h.
Наряду с системами (1) и (2) введём ещё одну управляемую систему, которая описывается
системой дифференциальных уравнений
wh(t) =hi + By10 + ũh(t) + f1(τi), wh(0) = ξh0, t ∈ δi = [τii+1),
(6)
где управление ũh(·) находится по правилу
ũh(t) = ũhi = U(ξhi,wh(τi)) при t ∈ δi, i ∈ [0 : mh - 1], τi = τh,i,
(7)
ξhi - результат измерения вектора x1(τi) (см. (3)). Отображение U конструируется таким
образом, что при соответствующем согласовании параметров h и δ(h) управление ũh(·) ап-
проксимирует в равномерной метрике ненаблюдаемую компоненту y1(·). Любые функции
U(·,·):Rn ×RnRN и V(·,·,·):T ×RN ×RNRr
будем называть допустимыми обратными связями (для системы (1)).
Решение z = zh(·) системы (1) наблюдается в дискретные моменты τh,i и изменяется под
воздействием некоторых обратных связей ũh(·) = U(ξh(·),wh(·)) и uh(·) = V (·, ũh(·),yh(·)).
Таким образом, решение zh(·) = {xh(·), yh(·)} системы (1) зависит от результатов ξh(·) изме-
рения компоненты x1(·) (т.е. допустимых измерений точности h) и удовлетворяет следующей
системе дифференциальных уравнений и начальному условию:
xh(t) = Axh(t) + Byh(t) + f1(t), t ∈ T,
yh(t) = Cxh(t) + Dyh(t) + Euh(t) + f(t), xh(0) = x0, yh(0) = y0,
(8)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
О ГАРАНТИРОВАННОМ УПРАВЛЕНИИ
1493
где
uh(t) = uhi = V (τi, ũhi,yh(τi)) при t ∈ δi = [τii+1), τi = τi,h, i ∈ [0 : mh - 1],
(9)
векторы ũhi определяются согласно (7).
Рассматриваемая задача состоит в построении таких допустимых обратных связей U( · , · )
и V (·,·,·), чтобы выполнялось неравенство
max |z(τh,i) - zh(τh,i)|n+N γ(h),
(10)
i∈[0:mh]
где γ(h) 0+ при h → 0.
Наряду с измерениями фазовых состояний x1 системы (2) в дискретные моменты времени
(см. (3)) рассмотрим также случай, когда измерения осуществляются “непрерывно”. Именно,
предполагается, что в каждый момент t ∈ T определяется вектор ξh(t) Rn со свойством
|x1(t) - ξh(t)|n h,
(11)
где функции ξh(·) измеримы по Лебегу. В этом случае вместо системы (6) будем рассматри-
вать систему
wh(t) =h(t) + By10 + ũh(t) + f1(t), wh(0) = ξh0, t ∈ T,
(12)
где управление ũh(·) находится по правилу
ũh(t) = U(ξh(t),wh(t)) при t ∈ T,
(13)
ξh(t) - результат измерения вектора x1(t) (см. (11)). Допустимая обратная связь U констру-
ируется таким образом, чтобы управление
ũh(·) аппроксимировало в равномерной метрике
компоненту y1(·). Решение zh(·) так же, как и в случае дискретного измерения, удовлетворя-
ет системе дифференциальных уравнений (6), в которой управления uh(·) определяются по
правилу
uh(t) = V (t, ũh(t),yh(t)) при t ∈ T.
(14)
Здесь векторы ũh(t) определяются согласно (13). Задача в данном случае состоит в построении
таких допустимых обратных связей U( · , · ) и V ( · , · , · ), чтобы выполнялось неравенство
sup|z1(t) - zh(t)|n+N γ1(h),
(15)
t∈T
где γ1(h) 0+ при h → 0.
В настоящей работе мы также исследуем задачу слежения в предположении, что изме-
ряются координаты y1 в дискретные моменты времени или непрерывно. В первом случае в
моменты τi определяются векторы ψhi RN , i ∈ [0 : mh - 1], со свойствами
hi - y1(τi)|N h,
а во втором случае в каждый момент t ∈ T становится известным вектор ψh(t) RN , для
которого
h(t) - y1(t)|N h,
(16)
где функции ψh(·) измеримы по Лебегу. Решение задачи слежения при измерении коорди-
нат y1 оказывается более простым (по сравнению со случаем измерения координат x1), так
как в этом случае отсутствует необходимость введения вспомогательной системы. Кроме того,
о структуре управляемой системы необходим минимум информации: достаточно знать толь-
ко матрицу E, а также норму матрицы D. Исследование обсуждаемой задачи начнём со
случая, когда измеряются координаты x1. В дальнейшем через c1, c2, . . . , c(1), c(1),
..., d(0, d(1), ... обозначаются положительные постоянные, выражения для которых могут
быть записаны явно.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
1494
МАКСИМОВ
1. Алгоритм решения при непрерывном измерении координат x и x1. Зададим
две функции α(h) : (0, 1) (0, 1) и α1(h) : (0, 1) (0.1).
Пусть X (t) и Y(t) - фундаментальные матрицы систем уравнений
x(t) = Ax(t) и
y(t) = Dy(t)
(17)
соответственно. Тогда справедливы неравенства
|X (t)| exp{ωt},
|Y(t)| exp{χt}, t 0,
где ω = |A|, χ = |D|. Через | · | обозначается евклидова норма матрицы.
До начала работы алгоритма фиксируем величину h ∈ (0, 1) и числа α = α(h), α1 =
= α1(h). Управления ũh(·) (в системе (12)) и uh(·) (в системе (8)) зададим по формулам (13)
и (14), в которых положим
U (ξh(t), wh(t)) = α-1(ξh(t) - wh(t)),
(18)
V (t, ũh(t), yh(t)) = α-11 exp{-2χt}E(B+ ũh(t) + y10 - yh(t)).
Здесь штрих означает транспонирование, символ B+ - псевдообратную к B матрицу. На вход
системы (8) при всех t ∈ T будем подавать управление uh(t) вида (14), (18), а на вход системы
(12) - управление ũh(t) вида (13), (18).
Покажем, что допустимые обратные связи U( · , · ) и V ( · , · , · ) вида (18) обеспечивают
выполнение неравенства (15).
Введём функционал
λ(t) = exp{-2ωt}|xh(t) - x1(t)|2n + exp{-2χt}|yh(t) - y1(t)|2N .
(19)
Теорема 1. Пусть N n и rank B = N. Тогда справедливо неравенство
supλ(t) d(α + h2 + α1 +-1 + (αα-11)2 + (h(αα1)-1)2),
t∈T
где d - положительная постоянная, не зависящая от h, α и α1.
Доказательство теоремы состоит из двух этапов. На первом этапе оценивается величина
sup|y1(t) - y10 - B+ũh(t)|N , а на втором - изменение величины λ(t).
t∈T Этап 1. Введём функцию Y (t) = y1(t) - y10. Тогда первая подсистема системы (2) запи-
шется в виде
x1(t) = Ax1(t) + BY (t) + By10 + f1(t).
В силу неравенства (11) справедлива оценка
|Ax1(t) + By10 + f1(t) - Aξh(t) - By10 - f1(t)|n
M0h.
Заметим, что Y (·) ∈ W1,∞(T ; RN ) и Y (0) = 0. Тогда в силу теоремы 1 [10] верно неравенство
suph(t) + B(y10 - y1(t))|n = suph(t) - BY (t)|n ν1(α,h),
t∈T
t∈T
где ν1(α, h) =
M1(α +-1),
M0 > 0 и
M1 > 0 - некоторые постоянные. Значит,
|B+ ũh(t) + y10 - y1(t)|N
M2ν1(α,h).
(20)
Этап 2. Рассмотрим функцию
t
ε(t) = λ(t) + α1
(|uh(τ)|2r - |v(τ)|2r) dτ,
(21)
0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
О ГАРАНТИРОВАННОМ УПРАВЛЕНИИ
1495
где α1 = α1(h). Продифференцировав λ(t) (см. (19)), будем иметь
λ(t) J1(t) + J2(t),
(22)
где J1(t) = 2 exp{-2ωt}(μh(t), μh(t)), J2(t) = 2 exp{-2χt}(νh(t), νh(t)), μh(t) = xh(t) - x1(t),
νh(t) = yh(t)- y1(t), через (·,·) обозначено скалярное произведение в конечномерном евкли-
довом пространстве. Нетрудно видеть, что справедливо неравенство
J1(t) + J2(t) c1λ(t) + J3(t),
(23)
где J3(t) = 2 exp{-2χt}(νh(t), E(uh(t) - v(t))). В свою очередь, в силу (20), верна оценка
J3(t) 2exp{-2χt}(yh(t) - y10 - B+ũh(t),E(uh(t) - v(t))) + c2ν1(α,h){|uh(t)|r + |v(t)|r}. (24)
Кроме того (см. (18), (13)),
|uh(t)|r c3α-11(ν1(α, h) + λ1/2(t)).
(25)
Поэтому при всех t ∈ T будем иметь
t
t
c2ν1(α,h)
|uh(s)|r ds c2c3ν1(α, h)α-1
(ν1(α, h) + λ1/2(s)) ds
1
0
0
t
1
c2c3ϑν21(α,h)α-11 + 1/2c22c23ϑν21(α,h)α-21 +
λ(s) ds.
(26)
2
0
В таком случае, учитывая оценки (24)-(26), а также включение v(·) ∈ L2(T ; Rr), заключаем,
что при всех t ∈ T справедливы неравенства
t
t
t
1
J3(s)ds + α1
(|uh(s)|2r - |v(s)|2r) ds π(h, α, α1) +
λ(s) ds,
(27)
2
0
0
0
где π(h, α, α1) = c4(ν21(α, h)α-11 + ν21(α, h)α-21 + ν1(α, h)).
Из (22), (23), (27) вытекает оценка
t
ε(t) λ(0) + π(h, α, α1) + c5 λ(s) ds.
0
Поэтому
t
λ(t) c6α1 + λ(0) + π(h, α, α2) + c5 λ(s) ds.
0
Воспользовавшись условием (4), а также леммой Гронуолла, получаем
λ(t) (c6α1 + h2 + π(h, α, α1)) exp{c5t}.
(28)
Отсюда следует утверждение теоремы. Теорема доказана.
Из теоремы 1 вытекает
Следствие 1. Пусть выполнены условия теоремы 1 и при при h → 0 имеют место схо-
димости α(h) 0, α1(h) 0, α(h) × α-11(h) 0, h(α(h)α1(h))-1 0. Тогда выполняется
неравенство (15), в котором γ1(h) = d(1)(α1(h) + h2 + α2(h)α-21(h) + h2(α(h)α1(h))-2).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
1496
МАКСИМОВ
2. Алгоритм решения при дискретном измерении координат x и x1. Зададим
две функции α(h) : (0, 1) (0, 1) и α1(h) : (0, 1) (0.1). В дальнейшем нам понадобится
Условие 1. Семейство разбиений Δh, h ∈ (0, 1), отрезка T и функции α(h), α1(h)
обладают следующими свойствами:
δ(h) = C0h, α1(h) 0, α(h) = C1h1/2, h1(h)α-21(h) C2 при h → 0+.
Здесь ε ∈ (0, 1/2), C0 (0, 1), C1 и C2 - положительные постоянные, не зависящие от h, δ,
α и α1.
Пусть, как и выше, X (t) и Y(t) - фундаментальные матрицы систем уравнений (17).
До начала работы алгоритма фиксируем величину h ∈ (0, 1), разбиение Δh =h,i}
=0
вида (5) с шагом δ = δ(h) и числа α = α(h), α1 = α1(h). Работу алгоритма разобьём
на конечное число однотипных шагов. В течение i-го шага, осуществляемого на промежутке
времени δi = [τi, τi+1), τi = τh,i, выполняются следующие операции. Сначала, в момент τi,
вычисляются векторы ũhi и uhi по формулам (7), (9), в которых
U (ξhi, wh(τi)) = α-1(ξhi - wh(τi)),
(29)
V (τi, ũhi , yh(τi)) = α-11 exp{-2χ(τi + δ)}E(B+ ũhi + y10 - yh(τi)).
Затем на вход системы (8) при всех t ∈ δi подаётся управление uh(t) вида (9), (29), а на вход
системы (6) - управление ũh(t) вида (7), (29). Под действием этих управлений система (8)
переходит из состояния zh(τi) в состояние zh(τi+1), а система (6) - из состояния wh(τi) в
состояние wh(τi+1). Работа алгоритма заканчивается в момент ϑ.
Покажем, что допустимые обратные связи U( · , · ) и V ( · , · , · ) вида (29) обеспечивают
выполнение неравенства (10).
В дальнейшем нам потребуется (см., например, [11, с. 312]) следующая
Лемма. (Дискретное неравенство Гронуолла). Пусть φj 0, fj 0 при j ∈ [0 : m] и
fj fj+1 при j ∈ [0 : m - 1]. Тогда неравенства
φj+1 c0δ
φi + fj, j ∈ [1 : m - 1],
i=1
влекут за собой неравенства
φj+1 fj exp{c0jδ}, j ∈ [0 : m - 1],
если c0 = const > 0, φ1 f0.
Приведём основной результат работы.
Теорема 2. Пусть выполнено условие 1 и N n, rank B = N. Тогда справедливо нера-
венство
max λ(τi+1) d0(α1(h) + hε),
(30)
i∈[0:mh-1]
в котором d0 = d0(ε) - положительная постоянная, не зависящая от h, δ, α и α1.
Доказательство теоремы 2, как и доказательство теоремы 1, состоит из двух этапов.
На первом этапе оценивается величина sup |y1(t) - y10 - B+ ũh(t)|N , а на втором - изменение
t∈T
величины λ(τi), где функция λ(·) задаётся равенством (19).
Этап 1. Введём функцию Y (t) = y1(t) - y10. Тогда первая подсистема системы (2) запи-
шется в виде
x1(t) = Ax1(t) + BY (t) + By10 + f1(t).
˙
В силу условия
f
1(·) ∈ L(T ; Rn) и неравенств (3) справедливо соотношение
|Ax1(t) + By10 + f1(t) - Aξhi - By10 - f1(τi)|n M0(h + δ)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
О ГАРАНТИРОВАННОМ УПРАВЛЕНИИ
1497
(при п.в. t ∈ δi и всех i ∈ [0 : m-1], m = mh). Заметим, что Y (·) ∈ W1,∞(T ; RN ) и Y (0) = 0.
Тогда в силу теоремы 2 [10] верно неравенство
suph(t) + B(y10 - y1(t))|n = suph(t) - BY (t)|n ν(α,h,δ),
t∈T
t∈T
где ν(α, h, δ) = M1(α + (h + δ)α-1), α = α(h), δ = δ(h), M0 > 0 и M1 > 0 - некоторые
постоянные. Значит,
|B+ ũh(t) + y10 - y1(t)|N M2ν(α, h, δ).
(31)
Этап 2. Оценим изменение величины ε(t), определяемой равенством (21). Нетрудно ви-
деть, что справедлива оценка
ε(τi+1) ε(τi) + λ1i + μ1i + λ2i + μ2i + α1
(|uh(τ)|2r - |v(τ)|2r) dτ,
(32)
τi
в которой
(
)
λ1i = 2exp{-2ωτi+1} X(δ)μh(τi),
X (τi+1 - τ)h(τ)
,
τi
μh(t) = xh(t) - x1(t), νh(t) = yh(t) - y1(t),
μ1i = δ exp{-2ωτi+1}
|X (τi+1 - τ)h(τ)|2n dτ,
τi
)
λ2i = 2
Shi,
Y(τi+1 - τ){Cμh(τ) + E(uh(τ) - v(τ))} dτ
,
τi
μ2i = δ exp{-2χτi+1}
|Y(τi+1 - τ){Cμh(τ) + E(uh(τ) - v(τ))}|2N dτ,
τi
Shi = exp{-2χτi+1}Y(δ)νhi, νhi = νh(τi).
Несложно видеть, что
λ1i c0h(τi)|n
h(τ)|N δ exp{-2ωτi}|μh(τi)|2n
+c(0)
h(s)|2N ds.
(33)
τi
τi
Заметим, что при t ∈ [0, δ], δ (0, 1), выполняется оценка |Y(t) - I|N ct, c = c(δ),
где I - единичная N × N -матрица. Поэтому справедливо неравенство
|Shi - exp{-2χτi+1hi|N δc exp{-2χτi+1}|νhi|N δchi|N ,
учитывая которое, получаем
|(Shi, Y(δ)Eu) - exp{-2χτi+1}(νhi, Eu)|
|Shi |N |Y(δ) - I|N |Eu|N + |(Shi , Eu) - exp{-2χτi+1}(νhi , Eu)| δc(1)hi |N |Eu|N .
(34)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
1498
МАКСИМОВ
Далее, в силу (34) имеем
(
)
λ2i 2exp{-2χτi+1} yh(τi) - y10 - B+ũhi,E (uhi - v(τ))
+ Iji.
j=1
τi
Здесь
I1i = c(2)
|B+ ũhi + y10 - y1(τi)|N |uhi - v(τ)|r dτ, I2i
=c(3)
h(τi)|Nh(τ)|n dτ,
τi
τi
I3i = c(4)δ|νh(τi)|N
|uhi - v(τ)|r dτ.
τi
Заметим, что (см. (31)) |B+ ũhi + y10 - y1(τi)|N M2ν(α, h, δ). Следовательно, при ε ∈ (0, 1)
имеет место оценка
I1i c(2)ν(α,h,δ)
(|uhi|r + |v(τ)|r) c(5)ν2(α, h, δ)δε + δ1
(|uhi|2r + |v(τ)|2r) dτ.
(35)
τi
τi
Нетрудно видеть, что справедливы неравенства
)1/2
1
I2i c(3)δ1/2h(τi)|N
h(s)|2n ds
δ exp{-2χτi}|νh(τi)|2N
+c(6)
h(s)|2n ds,
2
τi
τi
1
I3i
δ exp{-2χτi}|νh(τi)|2N + c(7)δ
(|uhi|2r + |v(s)|2r) ds.
2
τi
Учитывая оценку (35), последние два неравенства, а также правило выбора управления uh(·)
(см. (9), (29)), получаем
λ2i + α1
(|uh(s)|2r - |v(s)|2r) ds δ exp{-2χτi}|νh(τi)|2N + c(5)ν2(α, h, δ)δε +
τi
+c(6)
h(s)|2n
ds + c(8)δ1
(|uhi|2r + |v(s)|2r) ds.
(36)
τi
τi
Кроме того, верны оценки
μ1i δc(9)
h(τ)|2N и μ2i
δc(10)
(h(τ)|2n + |uhi|2r + |v(τ)|2r) dτ.
(37)
τi
τi
Вследствие неравенств (33), (36), (37) из оценки (32) вытекает, что
ε(τi+1) ε(τi) + δλ(τi) + δ1c(11)
(|uhi|2r + |v(τ)|2r) + c(5)ν2(α, h, δ)δε +
τi
+c(12)
(h(τ)|2n +h(τ)|2N ) dτ.
(38)
τi
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
О ГАРАНТИРОВАННОМ УПРАВЛЕНИИ
1499
При t ∈ [τi, τi+1] имеем
(
)
h(t)|2n +h(t)|2N c(13) λ(τi) + δ
(|uhi|2r + |v(τ)|2r)
τi
Поэтому из (38) следует неравенство
λ(τi+1) (1 + c(14)δ)λ(τi) + α1
|v(τ)|2r
+ c(15)δ1
(|v(τ)|2r + |uhi|2r) + c(5)ν2(α, h, δ)δε ,
τi
τi
учитывая которое, аналогично [5, с. 59-64] получаем
(
)
λ(τi+1) λ(0) + c(16) δε-1ν2(α, h, δ) + α1
|v(τ)|2r
+ δ1
{|uh(τ)|2r + |v(τ)|2r} dτ
0
0
Тогда с учётом условия (4), а также включения v(·) ∈ L2(T ; Rr) из последнего неравенства
выводим оценку
(
)
λ(τi+1) c(17) h2 + δ1 + δε-1ν2(α, h, δ) + α1
+δ2
|uhj|2
(39)
r
j=0
В свою очередь, в силу (31), (29) получаем
|uhi|2r α-21c(18)(|B+ ũhi + y10 - y1(τi)|2N + |yh(τi) - y1(τi)|2N ) α-21c(19)(λ(τi) + ν2(α, h, δ)).
Поэтому справедлива оценка
(
)
δ
|uhj|2r
c(20) δα-2
λ(τj) + α-21ν2(α, h, δ)
(40)
1
j=0
j=0
В таком случае вследствие (39), (40) имеем
(
)
λ(τi+1) c(21) α1 + δ1 + h2 + δ2α-2
λ(τj) + (α-21δ1 + δε-1)ν2(α, h, δ)
(41)
1
j=0
При δ(h) = C0h справедливо неравенство
δε-1ν2(α,h,δ) c(22)(α2δε-1 + (h2 + δ2)α-2δε-1) c(23)(α2hε-1 + h1+εα-2).
Отсюда при α(h) = C1h1/2 находим, что
δε-1ν2(α,h,δ) c(24)hε.
(42)
В свою очередь,
α-21δ1ν2(α,h,δ) c(25)α-21(α2h1 + h3α-2) c(26)α-21h2.
(43)
Из (41), учитывая (42) и (43), получаем в силу леммы 2 оценку
λ(τi+1) c(27)(α1(h) + hε + h1 + h2α-21(h)) exp{c(21)ϑδ1α-21(h)} c(28)(α1(h) + hε),
в силу которой верно неравенство (30). Теорема доказана.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
1500
МАКСИМОВ
Из теоремы 2 вытекает
Следствие 2. Пусть выполнено условие 1. Тогда справедливо неравенство (10), в котором
γ(h) = d(2)(h) + hε}.
Замечание. Описанные выше алгоритмы применимы также в случае, когда управляемая
система подвержена внешнему возмущению, т.е. когда система (1) имеет вид
x(t) = Ax(t) + By(t) + f1(t), t ∈ T = [0, ϑ],
y(t) = Cx(t) + Dy(t) + E(u(t) - v1(t)) + f(t),
где v1(·) ∈ L2(T ; Rr) - неизвестное возмущение. В этом случае система (8) записывается сле-
дующим образом:
xh(t) = Axh(t) + Byh(t) + f1(t), t ∈ T,
yh(t) = Cxh(t) + Dyh(t) + E(uh(t) - v1(t)) + f(t), xh(0) = x0, yh(0) = y0.
3. Алгоритм решения при непрерывном измерении координат y и y1. Зададим
функцию α1(h) : (0, 1) (0, 1).
До начала работы алгоритма фиксируем величину h ∈ (0, 1) и число α1 = α1(h). Управ-
ления uh(·) (в системе (8)) зададим по формуле
uh(t) = V (t,ψh(t),yh(t)) = α-11 exp{-2χt}E(ψh(t) - yh(t)).
(44)
Таким образом, на вход системы (8) при всех t ∈ T будем подавать управление uh(t), зада-
ваемое равенством (44).
Теорема 3. Справедливо неравенство
supλ(t) d1(α1 + h + h2α-21),
(45)
t∈T
где d1 - положительная постоянная, не зависящая от h и α1.
Доказательство теоремы аналогично доказательству теоремы 1. При этом оценивается
изменение величин λ(t) и ε(t) (см. определения (19) и (21)). С помощью неравенств (16)
доказывается, что вместо неравенства (24) имеет место неравенство
J3(t) 2exp{-2χt}(yh(t) - ψh(t),E(uh(t) - v(t))) + c2h(|uh(t)|r + |v(t)|r).
Далее, аналогично (28) устанавливается оценка λ(t) c3(α1 + h2α-11 + h2α-21 + h). Отсюда
следует неравенство (45).
Из теоремы 3 вытекает
Следствие 3. Пусть α1(h) 0, hα-11(h) 0 при h → 0. Тогда справедливо неравен-
ство (15), в котором γ1(h) = d(3)(α1(h) + h2α-21(h) + h).
4. Алгоритм решения при дискретном измерении координат y и y1. Зададим
функцию α1(h) : (0, 1) (0, 1). В дальнейшем нам понадобится
Условие 2. Имеют место равенства δ(h) = Ch, α1(h) = C∗∗h(1)/2, где C, C∗∗ -
положительные постоянные, ε = const (0, 1).
До начала работы алгоритма фиксируем величину h ∈ (0, 1), разбиение Δh =h,i}
=0
вида (5) и число α1 = α1(h). Работу алгоритма разобьём на конечное число однотипных
шагов. В течение i-го шага (i ∈ [0 : m - 1], m = mh), осуществляемого на промежутке
времени δi = [τi, τi+1), τi = τh,i, выполняются следующие операции. Сначала, в момент τi,
вычисляется вектор uhi по формуле
uhi = V (τihi,yh(τi)) = α-11 exp{-2χτi+1}E(ψhi - yh(τi)).
(46)
Затем на вход системы (8) при всех t ∈ δi подаётся управление uh(t) = uhi. Под действием
этого управления система (8) переходит из состояния zh(τi) в состояние zh(τi+1). Работа
алгоритма заканчивается в момент ϑ.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
О ГАРАНТИРОВАННОМ УПРАВЛЕНИИ
1501
Теорема 4. Пусть выполнено условие 2. Тогда справедливо неравенство
max λ(τi+1) d2h(1)/2,
(47)
i∈[0:mh-1]
где d2 - положительная постоянная, не зависящая от h, δ и α1.
Доказательство. Как и при доказательстве предыдущих теорем, оценим изменение ве-
личины (21). Нетрудно видеть, что справедливы неравенства (32) и (34). В силу (34) имеем
(
)
λ2i 2exp{-2χτi+1} yh(τi) - ψhi,
E{uhi - v(τ)} dτ
+ Iji.
j=1
τi
Здесь
I1i = c(2)h
hi - yh(τi)|N |uhi - v(τ)|r dτ,
τi
величины I2i и I3i - те же, что в доказательстве теоремы 2. Далее, справедливы оценки (37).
Следовательно, верно неравенство
ε(τi+1) ε(τi) + δλ(τi) + δ1c(11)
(|uhi|2r + |v(τ)|2r) +
τi
+c(5)h2δε + c(12)
(h(s)|2n +(s)|2N ) ds,
τi
из которого вытекает, что
λ(τi+1) (1 + c(14)δ)λ(τi) + α1
|v(τ)|2r
+ c(15)δ1
(|v(τ)|2r + |uhi|2r) + c(5)h2δε.
(48)
τi
τi
В свою очередь, применяя последовательно неравенства (48), получаем
(
)
λ(τi+1) λ(0) + c(16) δε-1h2
+α1
|v(τ)|2r
+ δ1
(|uh(τ)|2r + |v(τ)|2r)
0
0
В таком случае, учитывая условие (4), а также включение v(·) ∈ L2(T ; Rr), из последнего
неравенства выводим аналогичную (39) оценку
(
)
λ(τi+1) c(17) δ1 + δε-1h2 + α1
+δ2
|uhj|2
(49)
r
j=0
Воспользовавшись формулой (46), получаем |uhi|2r α-21c(19)(λ(τi)+h2). Поэтому справедлива
оценка
(
)
δ
|uhj|2r
c(20) δα-2
λ(τj ) + α-21h2
(50)
1
j=0
j=0
Следовательно, ввиду (49), (50) имеем неравенство
(
)
λ(τi+1) c(21) α1 + δ1 + δ2α-2
λ(τj ) + (α-21δ1 + δε-1)h2 ,
i ∈ [0 : m - 1],
1
j=0
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021
1502
МАКСИМОВ
из которого аналогично [5, с. 59-64] следует, что
λ(τi) c(21)(α1 + δ1 + h2(δε-1 + α-21δ1)) exp{c(21)δ2α-21i}.
Значит,
λ(τi) c(21)(α1 + δ1 + h2(δε-1 + δ1α-21)) exp{c(21)ϑδ1α-21}.
(51)
При выполнении условия 2 имеем δ1α-21 = c(22), h2δε-1 = c(23)h1+ε. Поэтому из (51) полу-
чаем оценку
λ(τi) c(24)h(1)/2, i ∈ [0 : m],
в силу которой верно неравенство (47). Теорема доказана.
Из теоремы 4 вытекает
Следствие 4. Пусть выполнено условие 2. Тогда справедливо неравенство (10), в котором
γ(h) = d(4)h(1)/2.
СПИСОК ЛИТЕРАТУРЫ
1. Айзерман М.А. Лекции по теории автоматического регулирования. М., 1958.
2. Егоров А.И. Основы теории управления. М., 2004.
3. Osipov Yu.S., Kryazhimskii A.V. Inverse Problems for Ordinary Differential Equations: Dynamical
Solutions. London, 1995.
4. Осипов Ю.С., Васильев Ф.П., Потапов М.М. Основы метода динамической регуляризации. М.,
1999.
5. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М., 1974.
6. Осипов Ю.C., Максимов В.И. Отслеживание решения нелинейного распределенного дифференци-
ального уравнения законами обратной связи // Сиб. журн. вычислит. математики. 2018. Т. 21. № 2.
C. 201-213.
7. Кряжимский А.В., Максимов В.И. Задача ресурсосберегающего слежения на бесконечном проме-
жутке времени // Дифференц. уравнения. 2011. Т. 47. № 7. C. 993-1002.
8. Близорукова М.С., Максимов В.И. О одном алгоритме отслеживания движения эталонной системы
с последействием при измерении части координат // Дифференц. уравнения. 2011. Т. 47. № 3.
С. 415-426.
9. Maksimov V.I. Regularized extremal shift in problems of stable control // System Modeling and
Optimization. CSMO 2011. IFIP Advances in Information and Communication Technology / Eds.
D. Homberg, F. Troltzsch. Berlin; Heidelberg, 2013. V. 391. P. 112-121.
10. Максимов В.И. Об одном алгоритме восстановления управлений в равномерной метрике // Прикл.
математика и механика. 2013. Т. 77. Вып. 2. С. 292-301.
11. Самарский А.А. Введение в теорию разностных схем. M., 1971.
Институт математики и механики
Поступила в редакцию 05.04.2021 г.
им. Н.Н. Красовского УрО РАН, г. Екатеринбург
После доработки 05.04.2021 г.
Принята к публикации 05.10.2021 г.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 57
№ 11
2021