Автоматика и телемеханика, № 9, 2021
Обзоры
© 2021 г. Б.Р. АНДРИЕВСКИЙ, д-р техн. наук (boris.andrievsky@gmail.com)
(Институт проблем машиноведения РАН, Санкт-Петербург,
Санкт-Петербургский государственный университет),
А.Л. ФРАДКОВ, д-р техн. наук (fradkov@mail.ru)
(Институт проблем машиноведения РАН, Санкт-Петербург,
Санкт-Петербургский государственный университет,
Университет ИТМО, Санкт-Петербург)
МЕТОД СКОРОСТНОГО ГРАДИЕНТА И ЕГО ПРИЛОЖЕНИЯ1
В обзоре рассматривается современное состояние метода скоростно-
го градиента, разработанного в 1970-80-х годах для синтеза алгоритмов
управления и адаптации в нелинейных системах, а также многочисленные
приложения метода к решению научных и инженерных задач. Приведе-
ны краткие сведения об алгоритмах скоростного градиента и условиях их
применимости, оптимальности и пассивности. Обсуждаются применения
метода к задачам адаптивного управления и идентификации, нелинейно-
го управления, управления энергией и нелинейными колебаниями, управ-
ления в сетевых и многоагентных, а также в распределенных системах.
Представлены приложения метода к управлению техническими система-
ми и к задачам физики, биологии, экологии. Приводятся современные
модификации и обобщения метода, в том числе неевклидовы алгоритмы
скоростного градиента на основе функций Ляпунова-Брэгмана.
Ключевые слова: управление, скоростной градиент, пассификация, адап-
тация, идентификация, нелинейные системы, управление энергией, нели-
нейные колебания, сети, распределенные системы, технические системы,
физика, биология, экология.
DOI: 10.31857/S0005231021090014
1. Введение
Бурное развитие кибернетики и теории управления в 1960-х годах привело
к появлению большого числа разнообразных алгоритмов управления, адап-
тации, распознавания, обучения, оценивания, фильтрации. Возникла потреб-
ность обобщения полученных результатов и унификации предложенных ал-
горитмов. По-видимому, первым эту потребность почувствовал Я.З. Цыпкин
[1, 2], предложивший рассматривать различные задачи распознавания, оцени-
вания, управления и т.д. как задачи минимизации среднего некоторой функ-
ции потерь. При этом большое число существовавших тогда алгоритмов ста-
ло возможным представить в виде вероятностных градиентных итеративных
процедур минимизации или оценивания параметров. Однако непрерывные во
1 Исследование выполнено при финансовой поддержке Российского фонда фундамен-
тальных исследований в рамках научного проекта № 19-18-50428.
3
времени алгоритмы адаптации (самонастройки) и управления в эту схему не
укладывались, и попытки систематизировать теорию непрерывных адаптив-
ных систем продолжались [3-6].
Оказалось, что унификация различных непрерывных алгоритмов адапта-
ции и управления возможна, если перейти от градиента целевой функции к
градиенту скорости ее изменения вдоль траекторий объекта управления. По-
видимому, наиболее общая схема построения алгоритмов была предложена
в [7]. Получаемые алгоритмы были названы алгоритмами скоростного гради-
ента (АСГ) и строились следующим образом. Пусть уравнение обобщенного
объекта управления (обобщенного настраиваемого объекта) имеет вид
(1.1)
x = F(x,u,t),
где x = x(t)∈ Rn - вектор состояния объекта, u = u(t)∈ Rm - вектор управ-
ляющих (или настраиваемых) переменных. Пусть цель управления задана в
виде
(1.2)
Q(x(t), t) → 0 при t → ∞,
где Q(x, t) ≥ 0 - скалярная целевая функция. Тогда для синтеза алго-
ритма АСГ нужно вычислить производную (скорость изменения) функции
Q(x, t) вдоль траекторий системы (1.1) при фиксированном u, имеющую вид
w(x, u, t) = ∂Q(x, t)/∂t + ∂Q(x, t)/ ∂xF (x, u, t), а затем вычислить градиент
от скорости w(x, u, t) по u. Алгоритм скоростного градиента в дифферен-
циальной форме имеет вид
(1.3)
u = -Γ∇uw(x, u, t),
а в конечной форме вид
(1.4)
u = -Γ∇uw(x, u, t),
где Γ = ΓT > 0 - матричный коэффициент усиления.
Первоначально этот метод был ориентирован в основном на решение задач
адаптивного управления и идентификации. Было показано [7, 8], как различ-
ные известные к тому времени алгоритмы прямого адаптивного управления,
идентификации и оценивания состояния можно классифицировать и систе-
матизировать в рамках данного метода, а также намечены пути получения
новых алгоритмов с новыми свойствами и более широкими возможностями.
В последующие годы метод получил развитие и применение как универсаль-
ный подход к решению различных задач синтеза непрерывных динамических
систем в математических, физических, инженерных, биологических и других
науках. Простота применения метода, а также доступность строгого матема-
тического обоснования полученных алгоритмов обусловили его признание в
качестве инструмента исследований как у нас в стране, так и за рубежом.
Число публикаций, где метод в том или ином виде применяется, постоянно
растет и достигает нескольких сот. В течение последнего десятилетия воз-
рос интерес к методу скоростного градиента и как к инструменту построения
4
законов эволюции, позволяющему лучше понять динамику физических, био-
логических и других систем. В такой интерпретации этот подход известен
как “принцип скоростного градиента”.
В обзоре обобщены результаты, полученные российскими и зарубежными
учеными в таких областях, как: адаптивное управление и идентификация;
управление механическими системами и нелинейными генераторами; управ-
ление электромеханическими устройствами, такими как асинхронные дви-
гатели и вибрационные машины; управление и синхронизация хаотических
систем; управление транспортными средствами, автомобильными двигателя-
ми, летательными аппаратами, воздушными и подводными транспортными
средствами, спутниками; управление энергией и применение к энергетиче-
ским системам; разработка систем управления нелинейными системами об-
щего вида; управление микроминиатюрными гироскопами; управление сетя-
ми; управление пространственно-распределенными системами; управление на
уровне микромира, управление квантовыми системами.
Первые публикации, связанные с алгоритмами типа скоростного гради-
ента, появились в 1978 г. Общие формулировки были предложены одновре-
менно и независимо Ю.И. Неймарком и А.Л. Фрадковым в январе 1978 г.
на 9-й Всесоюзной школе-семинаре по адаптивным системам [9, 10]. Неко-
торые близкие формулировки для задачи идентификации были предложены
А.А. Красовским [11].
Первые результаты по обоснованию устойчивости алгоритмов типа АСГ
были опубликованы в книге [12], где рассмотрена система адаптивной ста-
билизации коллектива автоматов, изменяющая настраиваемые параметры
вдоль вектора скорости уменьшения некоторой оценочной функции V . Мо-
дель объекта принимается в виде
(1.5)
x = f(x,u),
где x обозначает вектор состояния объекта, u - вектор адаптивно настраи-
ваемых параметров. Предполагается, что f(0, ·) = 0 и f(·, u) линейна по u.
(
)
Целевая функция V (x) определяется так, что V (x) ≥ ϕ
∥x∥
≥ 0, где ϕ(ρ) -
возрастающая по ρ функция, V (0) = 0. Также предполагается, что для неко-
торых u = u, σ > 0, M > 0 выполняется неравенство
(
)
∂V
V
(1.6)
x(t)
f (x, u
) < -min{σV (x),M}.
∂x
Показано, что если закон адаптации имеет вид
∂V
(1.7)
u = -α∇u
f (x, u), α > 0,
∂x
то для всех решений (1.5), (1.7) выполнено x(t) → 0, u(t) → u при t → ∞ для
некоторого u.
В [12] также обсуждается случай стохастических возмущений ξ(t), до-
бавленных в правую часть модели объекта (1.5). Во избежание возможной
5
неустойчивости системы в этом случае предлагается “огрубление” (регуляри-
зация) закона адаптации (1.7) путем введения штрафной функции.
Для частного случая аффинной инвариантной во времени управляе-
мой системы x = f(x) + g(x)u и положительно определенной целевой функ-
ции V (x) алгоритм скоростного градиента имеет вид u = -LgV (x), где
LgV = ∂V/∂xg - производная Ли вдоль векторного поля g. Он впервые был
предложен в [13] и его часто называют “алгоритм Джурджевича-Куинна”
(Jurdjevic-Quinn control). Результат исследования устойчивости в [13] охва-
V
тывает вырожденный случай
≤ 0 и требует некоторых условий обнару-
живаемости (так называемые условия “Джурджевича-Куинна”, см., напри-
мер, [14]).
Неаффинный и нестационарный случай был впервые изучен в [7] для диф-
ференциальной формы СГ-алгоритмов и в [15, 16] для конечной формы.
В процессе развития метода были предложены различные типы СГ-алго-
ритмов в виде набора схем проектирования и условий их применимости. Этот
метод нашел применение в работах многих исследователей по всему миру.
В [17] отмечено, что СГ-метод “обеспечивает прозрачный компромисс между
качеством управления и выбором параметров. Кроме того, в силу простоты
синтеза регулятора метод получил успешное применение в ряде других при-
ложений, преимущественно в физике и механике”. В [18] СГ-методология рас-
ширена на алгоритмы “скоростной разности”, что позволило ослабить условия
его применимости (условие достижимости).
В последнее десятилетие возрос интерес к СГ методу как эффективному
инструменту не только для решения инженерных задач, но и для понимания
законов природы, таких как динамика экологических систем или фундамен-
тальные законы физики. В этой интерпретации подход известен как принцип
скоростного градиента, см. [19-23].
2. Алгоритмы скоростного градиента и условия их применимости
2.1. Условия применимости АСГ
Теоретические основы метода скоростного градиента достаточно полно
представлены в [7, 8, 19, 24-30]. Основные сведения об условиях примени-
мости метода приводятся ниже в данном разделе.
Рассматривается модель объекта управления в виде
(2.1)
x(t) = f(x, θ, t),
где x(t)∈ Rn - вектор состояния объекта; θ(t)∈ Rm - вектор управления (век-
тор входа)2; f(·) - непрерывная по x, θ, t вектор-функция, непрерывно диф-
ференцируемая по θ.
2 Здесь использован некоторый ¾обобщенный¿ входной вектор θ. В дальнейшем θ имеет
различный смысл в зависимости от характера решаемой задачи, чем вызвано отступле-
ние от принятого ранее обозначения. Например, θ может быть собственно управляющим
воздействием (сигналом), поступающим на вход объекта, либо, например, вектором на-
страиваемых параметров регулятора. Во втором случае (2.1) есть уравнения обобщенного
настраиваемого объекта.
6
Рассматриваются допустимые законы (алгоритмы) управления в виде
({
}
{
})
(2.2)
θ(t) = Θ
x(s)ts=0
,
θ(s)ts=0
с некоторым оператором Θ таким, что решения системы (2.1), (2.2) существу-
ют и единственны на некотором интервале для любых начальных значений
x(0), θ(0).
Требуется, чтобы выполнялась цель управления, заданная в виде асимп-
тотического соотношения
(2.3)
Qt
→0
при t → ∞
или неравенства
(2.4)
Qt ≤ Δ для всех t ≥ t,
({
}
{
})
где Qt = Q
x(s)ts=0
,
θ(s)ts=0
- заданный целевой функционал (функцио-
нал качества), t ∈ R - некоторый момент времени, начиная с которого целе-
вое условие должно быть выполнено, Δ - определенное пороговое значение,
указывающее на требуемую точность выполнения целевого условия.
Рассматриваются два вида функционалов [25]:
1. локальный целевой функционал
(
)
Qt = Q
x(t), t
;
2. интегральный целевой функционал
t
(
)
Qt = q
x(s), θ(s), s
ds,
0
где Q(x, t), q(x, θ, t) - заданные целевые функции. В конкретных задачах цель
управления может содержать некоторые дополнительные условия. Например,
для интегрального целевого функционала обычно ставится цель (2.4) и до-
полнительная цель управления в виде
(
)
(2.5)
lim q
x(t), θ(t), t
= 0.
t→∞
Рассмотрим основные формы алгоритмов скоростного градиента и усло-
вия их применимости [8, 24, 25].
Пусть закон управления имеет вид3
d(θ + ψ(x,θ,t))
(2.6)
= -Γ∇θ
w(x, θ, t),
dt
3 Из вида закона управления (2.6) может создаться впечатление, что функция ψ(·)
должна быть дифференцируемой по t, что не дает возможность использовать разрывные
функции ψ(·). Однако решения (2.6) можно понимать как сумму “интегральной” и “сиг-
нальной” составляющих, где ψ(·) добавляется к результату интегрирования правой части
(2.6), т.е. ее производная по времени не вычисляется.
7
где Γ = ΓT > 0 - (m × m)-матрица; w(x, θ, t) - производная целевого функ-
ционала в силу системы (2.1) [31]4, ψ(x, θ, t) - некоторая вектор-функция,
удовлетворяющая условию псевдоградиентности [32]:
(2.7)
ψ(x, θ, t)Tθ
w(x, θ, t) ≥ 0.
Например, в качестве ψ(x, θ, t) можно брать
(2.8)
ψ(x, θ, t) = Γ1θ
w(x, θ, t),
(
)
(2.9)
ψ(x, θ, t) = Γ2sign
θw(x,θ,t)
,
где Γi = ΓTi > 0 - (m × m)-матрицы (i = 1, 2) и Γ2 - диагональная.
Алгоритмы вида (2.6) называются алгоритмами скоростного градиента
(АСГ ) в конечно-дифференциальной форме.
Известны следующие условия применимости этих алгоритмов к решению
задач управления с локальным целевым функционалом [25]. Пусть:
вектор-функция ψ(x, θ, t) удовлетворяет (2.7) и для любого v ∈ Rm име-
ется единственное решение θ = κ(x, v, t) уравнения θ + ψ(x, θ, t) = v;
функции f(x, θ, t), ∇xQ(x, t), ψ(x, θ, t), ∇θw(x, θ, t) непрерывны и ло-
кально ограничены равномерно по t ≥ 05;
скалярная функция Q(x, t) неотрицательна и удовлетворяет условию
роста: inft≥0 Q(x, t) → ∞ при ∥x∥ → ∞;
функция w(x, θ, t) выпукла по θ;
условие достижимости: существуют вектор θ ∈ Rm и функция ρ(Q)
(ρ(Q) > 0 при Q > 0) такие, что для всех x, t имеет место
(
)
(2.10)
w(x, θ, t) ≤ -ρ
Q(x, t)
Тогда все траектории системы (2.1), (2.6) с начальными условиями, при-
{
}
=
(x, θ) : (Im - ΓΓ)(θ0 - θ) = 0
, ограничены
(
)
иQ
x(t)
→ 0 при t → ∞, т.е. цель управления достигается для любого Δ > 0.
Здесь и далее через Γ обозначена матрица, псевдообратная к Γ по Муру-
Пенроузу, см. [33].
Для доказательства этого утверждения использована функция Ляпунова
вида [8]
1
(2.11)
V (x, θ, t) = Q(x, t) +
∥θ - θ + ψ(x, θ, t)∥ .
2
Вычисляя ее производную по времени в силу системы (2.1), (2.6), получим
(2.12)
Vt = w(x(t),θ(t),t) - vTtΓΓ∇θ
w(x(t), θ(t), t),
∂Q
(
)T
4 Для локального целевого функционала w(x, θ, t) =
+
xQ
f(x, θ, t), а для инте-
∂t
грального целевого функционала - w(x, θ, t) = q(x, θ, t).
{
}
5 Ограничены в любом ограниченном множестве
∥x∥+ ∥θ∥ ≤ β, t ≥ 0
8
где w(x, θ, t) определяется выражением (2.6), vt = θt(t) - θ + ψ(x(t), θ(t), t).
Согласно условию v0 ∈ L(Γ), где L(Γ) - линейная оболочка столбцов мат-
dvt
рицы Γ. По алгоритму (2.6)
∈ L(Γ). Следовательно, vt ∈ L(Γ) для всех
dt
t ≥ 0, так что ΓΓvt = vtΓ является проектором на множество L(Γ)). Та-
ким образом, (2.12) принимает вид
Vt = w(x(t),θ(t),t) + vTtθw(x(t),θ(t),t).
Применяя теперь условия выпуклости и достижимости
(2.10), получа-
(
)
ем
Vt ≤ -ρ
Q(x(t), t)
≤ 0. Следовательно, V (x(t),θ(t),t) ≤ V (x(0),θ(0),0),
что доказывает ограниченность траекторий системы
(2.1),
(2.6). Итак,
(
)
ρ
Q(x(t), t)
dt < ∞, откуда стандартным образом с помощью леммы Бар-
0
балата (см., например, [24, 28]) выводится, что limt→∞ Q(x(t), t) = 0, что и
требовалось доказать.
Для алгоритма (2.6) c интегральным целевым функционалом имеются
следующие условия применимости [8, 24, 25]. Пусть:
для всех v ∈ Rm имеется единственное решение θ = κ(x, v, t) уравнения
θ + ψ(x,θ,t) = v;
функции f(x, θ, t), ∇θw(x, θ, t), κ(x, θ, t) локально ограничены;
функция q(x, θ, t) равномерно непрерывна по x, t;
функция w(x, θ, t) выпукла по θ;
имеется вектор θ ∈ Rm такой, что
(2.13)
w(x, θ
,t) ≤ 0;
выполнено условие роста.
Тогда для любых x(0), θ(0) в системе (2.1), (2.6) достигается цель управ-
2
ления (2.4), а также цель (2.5) для Δ = Q0 + 0,5θ0 - θ - ψ(x00,0
Γ
Заметим, что для единственности решения уравнения θ + ψ(x, θ, t) = v до-
статочно выполнения для ψ(x, θ, t) условия Липшица по θ с константой Лип-
шица L < 1.
Условие роста можно ослабить, заменив на условие того, что ограничен-
ность Qt решений (2.1), (2.6) означает ограниченность x(t).
Основными из указанных выше условий являются условия разрешимости
(2.10), (2.13), которые показывают на принципиальную возможность решения
поставленной задачи.
Частным случаем (2.6) являются АСГ в дифференциальной форме
(2.14)
= -Γ∇θ
w(x, θ, t).
dt
Другой важный частный случай (2.6) АСГ в конечной форме, который
можно записать в виде
(2.15)
θ=θ0
− γψ(x,θ,t),
где γ > 0 - параметр алгоритма (множитель шага).
9
Условия применимости алгоритма (2.15) для функций ψ(x, θ, t), удовле-
творяющих условию сильной псевдоградиентности: существуют ρ > 0, δ ≥ 1
такие, что
δ
(2.16)
ψ(x, θ, t)∇θw(x, θ, t) ≥ ρ∇θω(x, θ, t)
имеют следующий вид [8, 25, 28].
Пусть имеется локальный целевой функционал и
уравнение (2.15) разрешимо относительно θ;
функция w(x, θ, t) выпукла по θ;
имеется вектор θ = θ(x, t), удовлетворяющий условию (2.10) и, при
некоторых ρ > 0, δ ≥ 1, условию
(2.17)
ργ(x, t)∇θw(x,θ,t)δ-1
θ0 - θ(x, t);
выполнено (2.16).
Тогда в системе (2.6), (2.15) обеспечивается выполнение цели управления
(2.4).
Пусть имеется интегральный целевой функционал и
уравнение (2.15) разрешимо относительно θ,
функция w(x, θ, t) выпукла по θ,
удовлетворяется условие (2.16),
тогда в системе (2.6), (2.15) обеспечивается выполнение цели управления
(2.5).
Негладкие обобщения АСГ предложены в [31, 34]. На основе понятия диф-
ференцирования по направлению по Адамару построены алгоритмы скорост-
ного субградиента6 в дифференциальной и конечной формах. Установлены
условия, обеспечивающие достижение цели управления (сходимость целевой
функции к нулю). Кроме того, получены условия, при которых цель управле-
ния достигается за конечное время с использованием негладких или разрыв-
ных алгоритмов СГ. Теоретические результаты проиллюстрированы в [31] на
примере негладкого энергетического управления для неаффинной по управ-
лению маятниковой системы. В [34] АСГ применен к почти глобальной стаби-
лизации интегратора Брокетта неголономной системы, ставшей популяр-
ным тестовым примером для негладких и разрывных алгоритмов. Доказа-
но, что разработанный закон управления стабилизирует интегратор Брокет-
та для любой начальной точки, не лежащей на оси x3. Кроме того, показа-
но, что алгоритм скоростного субградиента обеспечивает стабилизацию при
сколь угодно малом уровне управления. Важной особенностью предлагаемого
управления является то, что оно непрерывно на траекториях замкнутой си-
стемы. Негладкие обобщения АСГ в конечно-дифференциальной форме пред-
ложены в [35].
6 Вектор a ∈ Rn такой, что для выпуклой функции f(x), (x ∈ Rn) для всех y ∈ Rn выпол-
нено неравенство f(x + y) ≥ f(x) + aTy, называется субградиентом функции f(x) в точке x
и обозначается через ∂f(x) [32]. Для дифференцируемой в точке x функции имеет место
∇f(x) ≡ ∂f(x).
10
Идентифицирующие свойства алгоритмов скоростного градиента. Вектор
θ ∈ Rm в (2.10) можно считать некоторым ¾идеальным¿ входным вектором,
так как при θ = θ выполнены целевые условия. С прикладной точки зрения
представляет интерес вопрос о сходимости θ к θ, т.е. вопрос о достижении в
системе (2.1), (2.2) дополнительной цели управления
(2.18)
lim
θ(t) = θ.
t→∞
Этот вопрос возникает в первую очередь при решении задачи идентифика-
ции, когда θ является вектором ¾истинных¿ значений параметров объекта.
Обобщая, алгоритм (2.2) назовем идентифицирующим алгоритмом, если в
системе (2.1), (2.2) достигается цель управления (2.18) [24].
Как известно [3, 24, 36], идентифицируемость системы зависит и от вида
входного процесса. При достаточном ¾разнообразии¿ внешнего воздействия
цель (2.18) может быть достигнута. Для точных формулировок используется
следующее определение [8, 24].
Определение 1. Матричная функция Φ(t) размера m × N, ограничен-
ная для всех t > 0, называется интегрально-невырожденной, если суще-
ствуют t0 > 0, α0 > 0, L > 0 такие, что для всех t > t0 выполнено
(2.19)
Φ(s)Φ(s)Tds ≥ α0Im.
t
Это условие показывает, что столбцы матрицы Φ(t) не стремятся все при
t → ∞ ни к какой гиперплоскости пространства RN.
Для дифференциальной формы АСГ (2.14) известно следующее утвержде-
ние. Пусть:
функции f(x, θ, t), ∇xQ(x, t), ψ(x, θ, t), ∇θw(x, θ, t) локально ограниче-
ны; выполнено условие роста; функция w(x, θ, t) выпукла по θ; существуют
вектор θ ∈ Rm и функция ρ(Q) (ρ(Q) > 0 при Q > 0) такие, что для всех x, t
имеет место w(x, θ, t) ≤ -ρ(Q), и, кроме того,
infx Q(x, t) достигается в единственной точке x(t), где функция x(t)
удовлетворяет уравнению (2.1) x(t) = f(x, θ, t);
2f(x,θ,t)
функции∂f(x,θ,t)∂θ ,2f(x,θ,t)
,
, ∇xQ(x,t) непрерывны;
∂θ2
∂x∂θ
(
)
= ∂f∂θ
x,θ,t
- интегрально-невырожденная.
Тогда АСГ в дифференциальной форме (2.14) является идентифицирую-
щим алгоритмом для всех x(t0), θ(t0) и решение col{x(t), θ} системы (2.1),
(2.14) асимптотически устойчиво в целом равномерно по ограниченному мно-
жеству начальных условий x(t0), θ(t0) и моменту времени t0 [24].
Практически указанные условия сводятся к требованию, чтобы входной
(¾возбуждающий¿) сигнал содержал не менее n гармоник с различными ча-
стотами. Это требование называют также условием ¾неисчезающего возбуж-
дения¿ или ¾постоянного возбуждения¿, подробнее см. [25, 28].
11
Робастность алгоритмов скоростного градиента. Свойства грубости и ро-
бастности АСГ подробно исследованы в [25, 28]. В частности, показано [25,
теорема 2.10], что АСГ в конечной форме (2.15) робастны по отношению к
аддитивным возмущениям: при достаточно малом уровне последних сохра-
няется ограниченность траекторий системы, а целевое условие (2.4) оказыва-
ется возможным обеспечить при том же Δ за счет увеличения коэффициента
усиления γ в алгоритме управления (2.15). Базовые алгоритмы АСГ в диффе-
ренциальной форме (2.6) обладают робастностью только при существенных
дополнительных предположениях, одним из которых является асимптоти-
ческая устойчивость системы (2.1), (2.6), обеспечивающая устойчивость при
постоянно действующих возмущениях [25, теорема 2.12].
Для важных на практике ситуаций указанных условий недостаточно, по-
этому рекомендуется применять различные способы огрубления (обеспечения
грубости) АСГ. Среди них известно использование параметрической обрат-
ной связи в АСГ, т.е. переход от (2.6) к алгоритмам вида
(
d
(
)
(
))
(2.20)
θ + ψ(x,θ,t)
= -Γ κ∇θw(x,θ,t) + ζ
θ + ψ(x,θ,t)
,
dt
где функция ψ(·), как и выше, удовлетворяет условию псевдоградиентности
(2.7), ζ(·) : R → R - функция обратной связи, κ > 0 - числовой коэффициент.
Еще одним способом огрубления базовых АСГ служит введение в них зоны
нечувствительности по целевой функции переходом к алгоритмам вида
{
-Γ∇θw(x,θ,t) при Q(x,t) ≥ Δ,
θ=
(2.21)
0
при Q(x, t) < Δ.
Робастность адаптивных систем управления на основе АСГ изучается
также в [37], где для алгоритма адаптации предложен, совместно с зоной
нечувствителности, специальный “барьерный” вид параметрической обрат-
ной связи.
2.2. Оптимальность и пассивность алгоритмов скоростного градиента
АСГ обладают еще одним важным свойством, которое кратко можно сфор-
мулировать так: для всякого АСГ в конечной форме существует функционал,
по отношению к которому АСГ является оптимальным, т.е. АСГ является
решением обратной задачи оптимального управления (inverse optimal con-
trol) [38]. Впервые обратную задачу оптимального управления рассматри-
вал Р. Калман в линейно-квадратичном варианте [39]. Случай аффинных по
управлению систем был рассмотрен в ряде работ [14, 40-42], см. также дис-
куссию в [38]. Пусть модель управляемого объекта аффинна по управлению:
(2.22)
x = f(x) + g(x)u,
где f(x), G(x) - гладкие функции. Алгоритм скоростного градиента, синте-
зированный по некоторой целевой функции V (x) ≥ 0, можно представить в
12
виде
(2.23)
u = -γ(x)gT∇V (x) = -γ(x)(LgV )T,
где γ(x) = γ(x)T ≥ 0 - заданная матричная функция. Как известно, система
(2.22), (2.23) асимптотически устойчива, если при x = 0 выполняются нера-
венства V (x) > 0 и L(x) > 0, где
(
)
(2.24)
L(x) = -∇V (x)
F (x) - 0,5gγ(x)gT∇V (x)
=-V
Как отмечено в [14, 40-42], при этих условиях система (2.22), (2.23) оптималь-
на по отношению к функционалу потерь
(2.25)
J = (L(x) + uTγ(x)-1
u)dt.
0
При этом целевая функция V (x) оказывается функцией Беллмана для опти-
мизационной задачи, причем для ее нахождения нет необходимости в трудо-
емком решении уравнения Гамильтона-Якоби-Беллмана. Платой за простоту
является зависимость функционала потерь от искомого решения. В работах
А.А. Красовского [40, 41] рассмотрен также случай, когда слагаемое с управ-
лением в функционале потерь задается не квадратичной формой, а формой
порядка p > 1. В этом случае инверсно-оптимальное управление принимает
вид
(2.26)
u = -γ(x)|gT∇V (x)|1/(p-1)sign(gT
∇V (x)).
Имеются версии сформулированных результатов для адаптивного [43, 44] и
минимаксного [45] инверсно-оптимального управления, однако в них связь с
АСГ не упоминается.
С оптимальностью АСГ тесно связана его пассивность. Пусть y =
= gT∇V (x) выход объекта (2.22). Введем новый вход объекта u с помо-
щью обратной связи u = -γ(x)gT∇V (x)) + u. Тогда при выполнении условия
достижимости для АСГ в конечной форме справедливо неравенство
V
(2.27)
- γ(x)gT
∇V (x)u ≤ 0,
что как раз и означает пассивность объекта (2.22) от входа u к выходу y =
= gT∇V (x). Таким образом, АСГ решает задачу пассификации преобразо-
вание системы к пассивной при помощи обратной связи.
Локально-оптимальные алгоритмы непрерывного и дискретного времени.
Близким к методу СГ является принцип оптимального демпфирования пере-
ходных процессов В.И. Зубова [46], предписывающий выбирать управление
из условия
(2.28)
minV
,
u∈U
13
гдеV - производная в силу системы (2.22) от заданной функции V (x, t) ≥ 0,
а U ⊂Rm - заданное множество допустимых значений управления. Нетрудно
видеть, что для аффинного объекта (2.22) функция
∂V
V
=
+LfV +LgV u
∂t
линейна по управлению. Поэтому, если множество U выпукло и 0 ∈ U, то
оптимальная по демпфированию обратная связь имеет вид
(2.29)
u = -ΨU
(y),
где y = ∇uV , а вектор-функция ΨU (y) составляет острый угол со скорост-
ным градиентом: ΨU (y)Ty > 0 при y = 0. Оптимальное по демпфированию
управление является локально-оптимальным для задачи (2.22), (2.25), если в
качестве демпфируемой функции V (x, t) в (2.28) выбрана функция Беллмана
задачи.
Для систем дискретного времени близкий подход рассмотрен в [47, 48] в
рамках локально-оптимального управления. Многошаговый процесс управ-
ления динамической системой назван авторами локально-оптимальным в
смысле критерия V , если на каждом шаге или каждых τ шагах этого про-
цесса достигается наибольшее убывание величины V .
В [47] рассматривается задача управления линейным дискретным динами-
ческим объектом
(2.30)
xk+1 = Axk + Buk, yk = LTxk
,
k = 0,1,...,
где xk ∈ Rn - вектор состояния, uk ∈ Rm - управление, yk ∈ Rl - наблюдаемый
выход. Вводится (локальный) критерий оптимальности
(2.31)
V (x) = xTCx, C = CT
> 0.
По смыслу метода соответствующее локально-оптимальное управление u∗k
определяется выражением
(2.32)
u∗k = arg min ΔV (xk,uk
),
uk
где ΔV (xk, uk) = V (Axk + Buk) - V (xk). В предположении, что весь вектор
состояния xk непосредственно измеряется (L = diag {1, . . . , 1}), показано, что
при BTCB управление (2.32) в форме обратной связи имеет вид
(2.33)
u∗k = -(BTCB)BTCAxk
+ ũ,
где ũ удовлетворяет условию BTCBũ = 0. При таком управлении ΔV (xk,u∗k) =
= -xTkQxk, где матрица Q находится из выражения
(2.34)
Q = C - ATCA + ATCB(BTCB)BT
CA.
Если, кроме того, det BTCB = 0, управление (2.32) единственно:
(2.35)
u∗k = θT∗xk, θT∗ = -(BTCB)-1BTCA.
14
3. Адаптивное управление и идентификация на основе метода СГ
В [7, 49] рассматривается схема синтеза алгоритмов адаптивного управле-
ния, состоящая в организации движения в пространстве настраиваемых па-
раметров в направлении градиента от скорости изменения оценочного функ-
ционала. В эту схему укладывается ряд известных алгоритмов адаптации и
идентификации, синтезированных прямым методом Ляпунова [8, 25]. Полу-
чены общие условия устойчивости таких систем. Предлагаются способы регу-
ляризации алгоритмов, придающие системе свойства грубости по отношению
к действию на объект неконтролируемых возмущений и к дискретности ал-
горитма адаптации. Приводятся примеры применения рассмотренной схемы
для синтеза алгоритмов адаптации в ряде задач адаптивного управления ди-
намическими объектами.
3.1. Адаптивное управление с эталонными моделями
Беспоисковые самонастраивающиеся системы с эталонными моделями.
Беспоисковые самонастраивающиеся системы с эталонными моделями
(БСНС с ЭМ, англ. Model Reference Adaptive Control, MRAC) для реше-
ния задачи получены в серии фундаментальных работ по теории адаптивного
управления, см., например, [3, 24, 50-52], где объект и эталонная модель при-
няты в виде
x = Ax + Bu
- объект управления,
(3.1)
xM = AM xM + BM r(t) - эталонная модель.
В (3.1) матрицы A, B неизвестны, матрицы AM , BM эталонной модели зада-
ны.
Ставится задача обеспечения асимптотической сходимости вектора оши-
бок e(t) = x(t) - xM (t) к нулю. Для простоты изложения примем здесь, что
можно произвольно изменять матрицы уравнений состояния системы, добав-
ляя к неизвестным матрицам A и B модели объекта (3.1) матрицы тех же
размеров ΔA и ΔB соответственно. Уравнения обобщенного настраиваемого
объекта (ОНО) тогда принимают вид
(3.2)
x = (A + ΔA)x + (B + ΔB)r(t).
Таким образом, вектор настраиваемых параметров θ ∈ RN имеет вид θ =
= col (ΔA, ΔB), где N = n(n + m).
Для синтеза алгоритма адаптации СГ-методом выберем локальный квад-
ратичный функционал Qt = eTP e, где e(t) = x(t) - xM (t) - вектор ошибки,
P = PT > 0 - положительно определенная (n × n)-матрица, выбор которой
будет уточнен ниже, и вычислим функцию w(x, θ, t) =Qt. Находя производ-
ную по времени от Qt в силу системы (3.1), (3.2), получим
(
)
w(x, θ, t) = eTH
(A + ΔA)x + (B + ΔB)r(t) - AM xM - BM r(t)
15
Далее, дифференцированием по настраиваемым параметрам (с учетом
правил дифференцирования сложной функции и соотношения
∇f(z) =
(
)T
=
∂f/∂z
) получим
ΔAw(x,θ,t) = Pe(t)x(t)T,
(3.3)
ΔBw(x,θ,t) = Pe(t)r(t)T.
Выбирая, для простоты Γ = γIN (где γ > 0, IN - единичная матрица) по-
лучим алгоритм адаптации
dΔA
dΔB
(3.4)
= -γPe(t)x(t)T,
= -γPe(t)r(t).
dt
dt
Как следует из условия достижимости (2.10), матрица P = PT > 0 должна
удовлетворять уравнению Ляпунова P AM + ATM P = -G для некоторой мат-
рицы G = GT > 0 [8, 25].
Для предотвращения неограниченного роста коэффициентов регулятора
при действии возмущений рекомендуется использовать регуляризованные ал-
горитмы адаптации вида [8, 24, 25, 28]
(
d
(
))
ΔA(t) = -γ P e(t)x(t)T + α
ΔA(t) -
A
,
dt
(3.5)
(
d
(
))
ΔB(t) = -γ Pe(t)r(t)T + α
ΔB(t) - ΔB
,
dt
где
A,
B - некоторые априорные оценки настраиваемых параметров, ска-
лярные величины γ > 0 - коэффициент усиления алгоритма, α > 0 - коэффи-
циент параметрической обратной связи, значения которых выбираются при
синтезе.
Адаптивное управление с неявной эталонной моделью. Метод неявной эта-
лонной модели (НЭМ) был разработан в [53], применен для адаптивной на-
стройки ПИД-регуляторов в [54] и распространен на задачи синхронизации
в [55]. Законы адаптивного управления с НЭМ выводятся с помощью мето-
да СГ с локальным целевым функционалом Q =12 xTP x, где x∈ Rn обознача-
ет вектор состояния объекта, (n × n)-матрица P положительно определена,
P = PT > 0. Настраиваемый закон управления в “основном контуре” прини-
мается в виде u = K(t)y, где u - управляющее воздействие, y - измеряемый
выход объекта, K = K(t) - коэффициенты усиления регулятора, скорректи-
рованные с помощью алгоритма адаптации
K(t) = -γδ(t)y(t), δ(t) =
giyi(t), u(t) =
θi(t)yi(t),
i=1
i=1
в котором l обозначает число выходов объекта, используемых для формиро-
вания управления и настройки коэффициентов регулятора.
16
Адаптивная стабилизация линейных стационарных (инвариантных по вре-
мени) объектов с одним входом и выходом. Пусть линейный стационарный
объект с одним входом и выходом представлен в форме “входа-выход”
(3.6)
A(p)y(t) = B(p)u(t), t ≥ 0,
где u, y - скалярные входная и выходная переменные, A(p) = pn + an-1pn-1+
+··· + a0, B(p) = bmpm + ··· + b0 - многочлены от оператора дифференци-
рования по времени p ≡ d/dt. Определим k как относительную степень
системы (3.6), k = n - m > 0. Параметры объекта (3.6) ai, bj (i = 0, . . . ,
n - 1, j = 1,...,m) считаются неизвестными. Желаемая динамика системы
с обратной связью выражается в виде некоторого “эталонного” дифференци-
ального уравнения. В классических БСНС с ЭМ это уравнение явно реализо-
вано (интегрируется) в адаптивном регуляторе, см. [3, 50-52]. Чтобы описать
адаптивные регуляторы с НЭМ, вводится сигнал ошибки адаптации σ(t) как
(3.7)
σ(t) = G(p)y(t),
где G(p) = pl + gl-1pl-1 + · · · + g0 - заданный гурвицев (устойчивый) много-
член от оператора дифференцирования p ≡ d/dt. Коэффициенты gi - расчет-
ные параметры; они выбираются на основе желаемой динамики замкнутой
системы. Степень l полинома G(p) определяется ниже. Предполагая, что за-
кон адаптации обеспечивает стремление σ(t) к нулю, заметим, что при σ ≡ 0
выход y(t) удовлетворяет следующему “эталонному уравнению”:
(3.8)
G(p)y(t) = 0.
Это уравнение описывает эталонную модель, но эта модель не реализована
в адаптивном регуляторе в виде некой динамической подсистемы, а введена
неявно через свои параметры gi (i = 0,1,... ,l - 1). Следовательно, ее имеет
смысл назвать неявной эталонной моделью (НЭМ).
Выберем закон управления с обратной связью в следующем виде:
(
)
(3.9)
u(t) =
ki(t)
piy(t)
,
i=0
где ki(t), i = 0, . . . , l - настраиваемые параметры регулятора. Для рассмат-
риваемого случая свойство гиперминимальнофазовости [24, 25, 28, 53, 55, 56]
приводит к следующему закону адаптации, см. [53]:
(3.10)
ki(t) = -γσ(t)piy(t), ki(0) = k0i,
где γ > 0 - коэффициент адаптации, k0i задаются как начальные значе-
ния коэффициентов усиления регулятора, i = 0, . . . , l. Вводя вектор-строку
G = [g0,g1,...,1]∈ Rl+1 и функцию преобразования W(s) объекта W(s) из
[
]T
входа u в вектор выхода [y, y, . . . y(l)]T ∈ Rl+1 как W (s) =B(s)A(s)
1, s, . . . , sl
,
17
s ∈ C в силу теоремы пассификации [53] относительно передаточной функ-
ции GW (s), легко вывести следующие условия устойчивости адаптивного ре-
гулятора (3.9), (3.10):
1) полином B(s) гурвицев и b0 > 0;
2) l = k - 1, где k = n - m - относительная степень модели объекта (3.6).
Алгоритм (3.10) обычно обеспечивает затухание σ(t) существенно быстрее,
чем переходные процессы в замкнутом контуре. В результате изменение коэф-
фициента усиления (3.9) регулятора прекращается, и выход объекта (3.6) y(t)
подчиняется НЭМ (3.8).
Чтобы избежать неограниченного роста коэффициентов передачи регуля-
тора (3.9) при наличии внешних возмущений и ошибок измерения, можно
использовать следующую α-модификацию (3.10), см. [55, 57]:
(
)
(3.11)
ki(t) = -γσ(t)piy(t) - α
ki(t) - k0i
,
k0i = ki
(0),
где введен коэффициент параметрической обратной связи α > 0.
Адаптивные системы слежения с НЭМ. Адаптивный закон управления
(3.9), (3.11) непосредственно расширены до решения задачи слежения с же-
лаемой динамикой замкнутой системы, см. [54]. Для этого введем задающее
воздействие r(t) и определим сигнал ошибки адаптации σ(t) в виде
(3.12)
σ(t) = G(p)y(t) - D(p)r(t),
где многочлен G(p) определен выше, а операторный многочлен D(p) имеет
вид D(p) = dqpq + · · · + d1p + d0. Сигнал σ(t) можно трактовать как невязку
в уравнении
(3.13)
G(p)y(t) = D(p)r(t),
рассматривая (3.13) как НЭМ в задаче слежения.
По аналогии с (3.9) возьмем управляющее воздействие в виде
(
)
(
)
(3.14)
u(t) = kr(t)
D(p)r(t)
+ ki(t)
piy(t)
,
i=0
где kr(t), ki(t) (i = 0, . . . , l) - настраиваемые параметры. Закон адаптации
имеет вид
(
)
kr(t) = γσ(t)D(p)r(t) - α
kr(t) - k0r
,
k0r = kr(0),
(3.15)
(
)
ki(t) = -γσ(t)piy(t) - α
ki(t) - k0i
,
k0i = ki(0),
где γ > 0, α ≥ 0 - выбираемые при синтезе параметры; k0r, k0i - это “угадан-
ные” начальные значения коэффициентов передачи регулятора, i = 0, . . . , l.
Стоит отметить, что как степень q полинома D(p), так и его коэффициенты
могут быть выбраны разработчиком произвольно.
18
Сигнально-параметрические адаптивные регуляторы с НЭМ. Пусть по-
ставлена задача стабилизации limt→∞ x(t) = 0 для объекта
(3.16)
x(t) = Ax(t) + Bu(t), y(t) = Cx(t),
где x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rl, A, B - неизвестные матрицы соответст-
вующих размеров.
Следуя [55, 58], введем вспомогательную цель в виде обеспечения дви-
жения в скользящем режиме вдоль заданной поверхности, т.е. выполнения
σ(t) ≡ 0, где σ(t) = Gy, G - заданная (m × l)-матрица.
Воспользуемся следующим законом управления:
(3.17)
u = -γ signσ, σ = Gy,
где γ > 0 - параметр регулятора. Можно доказать, что для системы (3.16),
(3.17) поставленная цель управления может быть достигнута, если существу-
ют матрица P = PT > 0 и вектор K такие, что PA + AT∗P < 0, PB = GC,
A = A + BKTC. Как следует из теоремы о пассификации, указанные усло-
вия выполняются, если и только если: передаточная функция GW (s) - гипер-
(
минимальнофазовая (где W (s) = C
λIn - A)-1B); знак GCB известен (счи-
таем, что он положительный). При этих условиях цель limt→∞ x(t) = 0 до-
стигается при достаточно большом γ (относительно начальных условий и
фактических параметров объекта).
Чтобы избежать зависимости устойчивости замкнутой системы от на-
чальных условий и параметров объекта, вместо (3.17) можно использовать
следующий “сигнально-параметрический”, или “комбинированный”, закон
управления:
u = KT(t)y(t) - γ signσ(y), σ(y) = Gy(t),
(3.18)
K(t) = -σ(y)Γy(t),
где Γ = ΓT > 0, γ > 0 - матричный и скалярный коэффициенты передачи
алгоритма адаптации.
3.2. Идентификация параметров объекта
Пусть динамика объекта с неопределенными параметрами описывается
уравнением
(3.19)
x(t) = A x(t) + B
u(t)
с неизвестными постоянными матрицами A , B и измеряемыми векторами
состояния и входов x(t)∈ Rn, u∈ Rm. Для идентификации параметров вво-
дится следующая настраиваемая модель [59]:
(
(3.20)
xM (t) = GxM (t) +
A(t) - G)x(t) + B(t)u(t)
19
с вектором состояния xM (t)∈ Rn и матрицами A(t), B(t), которые служат
оценками матриц A , B . В этом случае вектор θ определяется как θ(t) =
= col (A, B). Вводятся сигнал ошибки e(t) = xM (t) - x(t) и целевая функция
(3.21)
Qt = 1/2e(t)TPe(t), где P = PT
> 0.
Следуя методу СГ, получим
(
)
(3.22)
ω =Qt = 1/2e(t)TP
Ge(t) + (A - A)x(t) + (B - B)u(t)
,
(3.23)
Aω = Pe(t)x(t)T,
Bω = Pe(t)u(t)T,
{
A(t) = -γP exT, γ > 0,
(3.24)
B(t) = -γP euT.
4. Общие методы нелинейного управления на основе СГ
Задачи стабилизации заданного подмножества пространства состояний
для пассивных нелинейных систем рассмотрены в [60]. Рассмотрим аффин-
ные по управлению системы вида
(4.1)
x(t) = f(x) + g(x)u,
где x ∈ X ∈ Rn, u ∈ U ∈ Rm - состояние и управляющий вход соответственно.
Отображения f, g - гладкие векторные функции подходящей размерности.
Введем вспомогательные выходы системы (4.1)
[
]
(4.2)
y = h1(x) =
LgV (x)
,
(4.3)
z=h2
(x),
где V (x) = 0,5∥h2(x)∥2, а h2 : X → Rk - гладкая вектор-функция.
Предположим, что желаемое аттрактивное множество можно описать
как прообраз нулевого значения некоторой гладкой неотрицательной функ-
ции V (x) и что эта функция не увеличивается вдоль решений свободной си-
стемы. Задача состоит в определении регулятора в обратной связи по состоя-
нию, обеспечивающего свойство
(
)
(
)
(4.4)
V
x(t)
→0
(или h2
x(t)
→ 0) при t → ∞,
где x = x(t, x0) является решением уравнения замкнутой системы с началь-
ными условиями x0, принадлежащими к некоторому предписанному множе-
ству D. Сделаны предположения, что:
(A1) функция V (x) - правильная на пространстве состояний X, т.е. для
любого c ≥ 0 множество {x ∈ X : V (x) ≤ c} компактно;
(A2) свободная система x = f(x) такова, что гладкая функция V (x) не
возрастает вдоль ее решений: Lf V (x) ≤ 0, ∀x ∈ X;
(A3) на множестве R = {x ∈ X : LgV (x) = 0} функция h2(x) инвариантна,
т.е. выполнено тождество Lf h2(x) ≡ 0, ∀x ∈ R.
20
Для решения задачи стабилизации (4.1), (4.3), (4.4) в [60] получены вы-
текающие из СГ-метода достаточные условия, гарантирующие асимптотиче-
скую стабилизацию целевого множества V0 = {x ∈ X : V (x) = 0} с помощью
управления с обратной связью по состоянию
(
)
(4.5)
u = -Ψ
V (x)
,
∂u
гдеV (x) - полная производная от V (x) вдоль решения (4.1), а Ψ(y): R → R -
произвольная гладкая вектор-функция, образующая острый угол с y, т.е.
Ψ(y)Ty > 0 для всех y = 0 и Ψ(0) = 0.
Подход к анализу и синтезу систем с обратной связью на базе моделей
нелинейных систем и непериодических сигналов, генерируемых нелинейны-
ми системами, представлен в [61]. Предлагаемый подход основан на показа-
теле возбудимости - нелинейном аналоге амплитудно-частотной характери-
стики линейной системы. Его можно использовать для анализа устойчивости
полностью нелинейных каскадных систем аналогично анализу абсолютной
устойчивости систем Лурье. Описаны СГ алгоритмы создания резонанса об-
ратной связи в нелинейных генераторах с несколькими степенями свободы.
Для строго диссипативных систем установлены границы изменения энергии
и возбудимости по обратной связи.
В [62] известные условия устойчивости сингулярно возмущенных систем
расширены, чтобы охватить случай систем управления энергией, синтезиро-
ванных на основе метода СГ. В частности, таким способом попучены решения
задач управления энергией на основе СГ сингулярно возмущенных гамиль-
тоновых систем. Приложение к управляемой синхронизации двух связанных
маятников представлено для двух случаев появления в системе малого па-
раметра: малой инерции динамического связующего звена и малой инерции
крутящего момента. В обоих случаях проводится сравнение оценок теорети-
ческой асимптотической точности с результатами компьютерного моделиро-
вания.
Метод управления неполноприводными (underactuated) нелинейными си-
стемами, основанный на введении искусственных инвариантов и использо-
вании СГ алгоритмов, предложен в [63]. В работе сформулировано и обос-
новано общее положение о достижении цели управления. Применение пред-
ложенного подхода проиллюстрировано на примере стабилизации колебаний
тележки-маятника вокруг верхнего положения равновесия.
В [64] рассмотрена задача управления нестационарной динамической си-
стемой с нефиксированным временем завершения и терминальным функцио-
налом при наличии неопределенных параметров. Предлагается алгоритм по-
строения управления, использующий элементы необходимых условий опти-
мальности и принцип СГ, обеспечивающий гарантированное значение функ-
ционала качества. Приведены результаты расчета управления и значений
функционала для тестовых параметров модели.
Возможности исследования нелинейных физических систем с помощью
малой обратной связи обсуждаются в [65]. Установлены аналитические грани-
21
цы возможного изменения энергии системы по обратной связи. Показано, что
для нелинейного осциллятора с одной степенью свободы изменение энергии
за счет обратной связи может достигать предела, достижимого для линей-
ного осциллятора за счет гармонического (без обратной связи) воздействия.
Такое явление называется резонансом с обратной связью (feedback resonance)
или авторезонансом. Описан метод создания резонанса с обратной связью в
нелинейных осцилляторах с несколькими степенями свободы на основе АСГ.
Пример выхода из потенциальной ямы иллюстрируется результатами ком-
пьютерного моделирования.
Задача стабилизации уровня энергии для гамильтоновых систем с одной
степенью свободы при наличии ограниченных входных возмущений рассмот-
рена в [66]. Показано, что для произвольных равномерно ограниченных воз-
мущений с достаточно малой границей СГ закон управления обеспечивает
предельную ограниченность энергетической погрешности. В качестве вспо-
могательного результата получены новые достаточные условия предельной
ограниченности функции Ляпунова вдоль траекторий нелинейной нестацио-
нарной динамической системы.
5. Управление энергией. Управление нелинейными колебаниями
В развитии метода скоростного градиента в 1990-х годах можно выде-
лить две важные вехи. Во-первых, удалось систематизировать на основе АСГ
[67] методы адаптивного управления механическими системами, в том числе
роботами-манипуляторами, в основе которых лежит пассивность [68-71].
Во-вторых, было предложено строить алгоритмы управления возбужде-
нием колебаний гамильтоновых систем на основе скоростного градиента с ис-
пользованием целевых функций, зависящих от гамильтониана (энергии) си-
стемы. В частности, для управляемой гамильтоновой системы с гамильтониа-
ном H(q, p) = H0(q, p) + H1(q, p)u, где q ∈ Rn - вектор обобщенных координат,
p∈ Rn - вектор обобщенных импульсов, u - скалярное управляющее воздей-
ствие, H0(q, p) - гамильтониан (энергия) свободной системы, H1(q, p)u - га-
мильтониан взаимодействия, ставится цель управления
(5.1)
H0(q(t),p(t)) → H
при t → ∞,
где H - желаемое значение энергии системы. Выбирая целевую функцию в
виде Q(x) = 1/2(H0(x) - H)2, получаем АСГ в виде
(5.2)
u = -γ(H0 - H
)p,
где γ > 0 - коэффициент усиления [72-75]. Полученные результаты были
подытожены в книгах [27, 28, 76] и стали основой для синтеза алгоритмов
управления в многочисленных задачах управления колебаниями в системах
и сетях. В [67, 74, 75] эти методы были распространены на системы более об-
щие, чем гамильтоновы. Были получены условия применимости метода СГ
для управления инвариантами широкого класса нелинейных систем.
22
Введено понятие “раскачивающего управления”, обеспечивающего дости-
жение произвольно большого уровня целевой функции при помощи произ-
вольно малого уровня управления. Установлено существование раскачиваю-
щего управления для гамильтоновых систем. Приведены результаты моде-
лирования для задачи раскачки маятника. Результаты развиты в [75], где
метод синтеза управления колебательными нелинейными системами распро-
странен на задачи с несколькими целевыми функционалами и с ограниче-
ниями. Впервые предложен подход на основе метода СГ к задаче управления
прохождением через резонансные зоны.
В [77] предложен способ использования метода СГ для управления синхро-
низацией двух осцилляторов на примере двух маятников, слабо связанных
пружиной. В этом случае уравнение управляемого объекта имеет вид
{
ϕ1 + ρϕ˙1 + ω2 sinϕ1 = k(ϕ2 - ϕ1) + u,
(5.3)
ϕ2 + ρϕ˙2 + ω2 sinϕ2 = k(ϕ1 - ϕ2),
где ϕi = ϕi(t) - углы поворота маятников (i = 1, 2); u = u(t) - внешний мо-
мент (управляющее воздействие), действующий на первый маятник; ω, k, ρ -
параметры системы: ω - частота собственных колебаний малой амплитуды,
k - коэффициент связи между маятниками (например, коэффициент упру-
гости пружины), ρ - коэффициент демпфирования.
В качестве целевой функции берется функция вида
(5.4)
Q(x) = αQϕ(ϕ˙1,ϕ˙2) + (1 - α)QH
(x),
[
]T
где x =
ϕ12,ϕ˙1,ϕ˙2
- вектор состояния объекта,
1
1
(
)2
(5.5)
Qϕ(ϕ˙1,ϕ˙2) =
δ, QH(x) =
H(x) - H
,
2
2
1
1
k
(5.6)
H(x) =
ϕ21 + ω2(1 - cosϕ1) +
ϕ22 + ω2(1 - cosϕ2) +
1 - ϕ2)2
2
2
2
- полная энергия системы, δϕ = ϕ˙1 + -ϕ˙2 - ошибка синхронизации, H - за-
данное целевое значение энергии, α > 0 - весовой коэффициент. Очевидно,
минимальное (нулевое) значение целевой функции соответствует синхронно-
му движению маятников при заданном уровне энергии колебаний всей систе-
мы.
Синтезированный по такой целевой функции АСГ в конечной форме имеет
вид
(
)
u(t) = -γ
αδϕ(t) + (1 - α)δH (t)ϕ˙1(t)
,
δϕ(t) =ϕ˙1(t) +ϕ˙2(t),
(
)
(5.7)
δH(t) = H
x(t)
-H,
где γ > 0 - коэффициент усиления.
Результаты моделирования показывают, что действительно АСГ (5.7)
создает в системе с двумя степенями свободы (два связанных маятника)
23
синхронный режим, причем при малом коэффициенте трения ρ > 0 энергия,
близкая к заданной H, может быть достигнута при малом коэффициенте
усиления γ > 0, т.е. в системе наблюдается эффект резонанса с обратной свя-
зью.
Сходная задача рассмотрена и в [78], где СГ методом с энергетическим це-
левым функционалом выполнен синтез закона управления. Произведен ана-
лиз системы по упрощенной модели ее динамики. Результаты как компью-
терного моделирования, так и экспериментов на лабораторном стенде проде-
монстрировали работоспособность принятого метода управления.
Задача подъема маятника Фуруты анализируется в [79] путем сравне-
ния результатов, полученных с помощью традиционной стратегии Острема-
Фуруты, основанной на модели размерности два, с новой стратегией, осно-
ванной на СГ-законе на многообразии размерности три. Приведен контрпри-
мер, когда новый закон работает хорошо, а старый нет. Задача приведения
маятника Фуруты в верхнее положение обычно решается гибридным регу-
лятором, в котором глобальная задача разбивается на два этапа. Сначала
накачка энергии приводит маятник в вертикальное положение. Затем маят-
ник стабилизируется в этом положении. В [80] различные стратегии управ-
ления для обеих задач анализируются как путем моделирования, так и с
использованием реального лабораторного маятника. Проблема подъема ма-
ятника Фуруты решается в [81] с применением метода СГ к модели системы
с размерностью четыре. Новый закон сравнивается с традиционной страте-
гией Острема-Фуруты, основанной на модели размерности два. Приведены
результаты сравнительного анализа, включающего моделирование и экспери-
менты, в которых показаны преимущества и эффективность предложенного
закона раскачки маятника.
Задача стабилизации вертикального положения сферического маятника
подробно рассмотрена в [82]. Эта задача сводится к стабилизации устойчиво-
го многообразия Ωst вертикального положения свободного сферического ма-
ятника. Показано, что для любого гладкого управления с обратной связью,
полученного с помощью СГ алгоритма с целью стабилизации Ωst, замкну-
тая система имеет предельный цикл Γ, который не принадлежит желаемому
аттрактору Ωst.
В [83] обобщены и расширены имеющиеся результаты по стабилизации
инвариантных множеств для нелинейных систем на основе метода СГ и по-
нятия V -обнаруживаемости. Представлены результаты по управлению коле-
баниями маятника, маятника на тележке, сферического маятника. Алгоритм,
обеспечивающий глобальную аттрактивность вертикального (неустойчивого)
положения равновесия маятника, основанный на разрывной версии энергети-
ческого СГ метода, получен в [84]. Показано, что глобальная аттрактивность
не может быть получена с помощью непрерывной статической обратной связи
по состоянию. Представлен подробный глобальный анализ переходного пове-
дения замкнутой системы. Кроме того, показано, что глобальная аттрактив-
ность вертикального положения равновесия может быть достигнута путем
применения управления сколь угодно малой величины.
24
В [85] рассмотрена задача численного определения показателя возбудимо-
сти колебательных систем. Показано, что возбуждение по методу СГ обес-
печивает точное решение задачи достижения максимальной энергии для ли-
нейного осциллятора второго порядка на бесконечном интервале времени.
Оценены верхняя и нижняя границы полной энергии системы в режиме уста-
новившихся колебаний и показатель возбудимости. Найдено точное значение
доступной энергии системы для случая гармонического возбуждения.
АСГ управления нелинейными колебаниями динамической системы для
задач регулирования и слежения представлен в [86]. Осциллятор Колпит-
ца [87], имеющий хаотическое поведение, рассматривается в качестве приме-
ра. Алгоритм использует только структурную информацию о динамической
модели для построения закона управления и может глобально асимптотиче-
ски сходиться к заданным регулярным орбитам или фиксированным точкам.
В [88] рассмотрены задачи возбуждения и синхронизации колебаний в
двухсвязанной двойной маятниковой мехатронной системе. Описаны аппа-
ратные средства, интерфейс обмена данными и программное обеспечение для
лабораторных экспериментов и управления. Импульсно-модулированный за-
кон управления для возбуждения/синхронизации колебаний получен мето-
дом СГ. Лабораторные эксперименты выполнены для проверки и оценки па-
раметров принятой математической модели. Приведены результаты сравне-
ния моделирования и лабораторных экспериментов для анализа возбуждения
и синхронизации.
В [89] использована адаптивная настройка усиления в обратной свя-
зи с запаздыванием для улучшения процесса управления. Предложенный
в [89] адаптивный регулятор применяется для стабилизации неустойчи-
вой неподвижной точки и неустойчивой периодической орбиты, встроенной
в хаотический аттрактор. Алгоритм адаптации построен с использованием
СГ метода. Представленные в [89] результаты компьютерного моделирова-
ния показали, что алгоритм адаптации может найти подходящее значение
усиления обратной связи для одиночных и множественных задержек. Кро-
ме того, показано, что метод [89] устойчив к шуму и отличиям в начальных
условиях.
Задача адаптивной синхронизации двух связанных неидентичных моделей
нейронов Хиндмарша-Роуза (Hindmarsh-Rose) рассмотрена в [90]. Показано,
что использование разработанного регулятора, основанного на методе СГ,
обеспечивает достижение синхронного поведения исследуемых систем. Полу-
ченные результаты математически обоснованы и проиллюстрированы моде-
лированием.
Проблема управления маятниковыми механизмами рассматривается в [91].
Для описания динамики маятников используется гамильтонов формализм.
Предложен алгоритм достижения равных значений энергии колеблющихся
маятников посредством управления с обратной связью на основе СГ метода.
Получены условия достижимости цели управления. Установлена связь меж-
ду синхронизацией энергии и частотой колебаний. Представлены результаты
25
компьютерного моделирования, демонстрирующие достижение цели управ-
ления и демонстрирующие динамические свойства замкнутой системы.
В [92] рассмотрена задача управления энергией маятника при наличии
нерегулярного входного возмущения. Закон управления с обратной связью
выбирается на основе метода СГ. Основным результатом являются точные
оценки для начального множества и конечного множества (аттрактора), а
также условия, гарантирующие, что все решения, начинающиеся в начальном
множестве, попадут в аттрактор за конечное время.
На примере управления энергией маятника, в [93] рассмотрена задача
управления нелинейной системой на инвариантном многообразии с помощью
квантованной обратной связи по состоянию. Выбран основанный на АСГ за-
кон управления с обратной связью. Основной результат заключается в точ-
ном описании границ допустимой ошибки квантования и результирующих
границ отклонения энергии.
В [94] ставятся задачи управления энергией для модели Френкеля-Кон-
торовой и обсуждается их связь с управлением маятниковыми цепочками.
Предложен и проанализирован алгоритм управления энергией на основе ме-
тода СГ. Приведены результаты моделирования, иллюстрирующие сходи-
мость предложенного алгоритма.
В [95, 96] метод СГ распространен на синхронизацию осцилляторов с ком-
плексными переменными. Существующие результаты о частичной устойчи-
вости дифференциальной формы АСГ для сингулярно возмущенных систем
распространены в [97] на случай СГ управления в конечной форме. Результа-
ты проиллюстрированы на примере управления энергией и синхронизацией
двух связанных маятников с учетом инерции двигателя. Показано, что возму-
щения, вызванные инерцией соединительного звена, и возмущения, обуслов-
ленные инерцией двигателя, влияют по-разному на поведение возмущенной
системы.
6. АСГ в сетевых и многоагентных системах
АСГ находят применение в современных исследованиях по управлению и
оцениванию в сетевых и многоагентных системах. При этом метод СГ может
использоваться для синтеза алгоритмов управления или адаптации как для
локальной динамики агентов, так и для изменения связей между агентами,
в том числе для изменения топологии сети. Опишем основные подходы к
этим задачам. С середины 2000-х годов исследования велись в рамках общей
модели сетевой системы управления, имеющей вид [98]
(6.1)
xi(t) = f(xi(t),ui(t),t) + c
Gij x(t)Γφ(xj (t) - xi(t)),
j=1
где xi - вектор состояния i-го агента, ui - вектор входов (управления)
i-го агента, Γ(x), φ(x) - функции фиксированных связей между агентами,
26
Gij (t) - функции изменяемых коэффициентов связи, c - общий коэффици-
ент интенсивности взаимодействия агентов, i, j = 1, . . . , N. Искомые моде-
ли управления могут быть децентрализованными (локальными, ui = Ui(xi)),
частично децентрализованными, когда ui зависит от нескольких агентов-
соседей, или кооперативными в более общих случаях. В разных работах зада-
ются различные цели управления. Например, в задачах синхронизации или
достижения консенсуса агентов цель управления имеет вид
(6.2)
lim
||xj (t) - xi
(t)|| = 0, i, j, = 1, . . . , N.
t→∞
Рассмотрим задачу слежения за лидером, где целью управления являет-
ся синхронизация движений агентов с движением лидера (эталонной моде-
ли), который может быть реальным или виртуальным. Предположим, что
управлениями являются изменения коэффициентов Gij (при этом ui = 0) и
выберем целевую функцию
1
(6.3)
Q(x, t) =
(eTiP ei
),
2
i=1
где P = PT > 0 - положительно определенная матрица, а ei = xi - x(t), где
x(t) - состояние лидера (желаемая траектория движения агентов). Тогда
вычисляя скорость изменения целевой функции вдоль решений (6.1), а за-
тем градиент скорости по управляющим переменным, получим СГ-алгоритм
управления в дифференциальной форме
(6.4)
Ġij (t) = -γijc(ei)TP (ej - ei),
где γij > 0 - коэффициенты усиления. Условия достижимости цели выводят-
ся из общих условий применимости АСГ, см. раздел 2.1.
Алгоритмы, близкие к (6.4), рассматривались в [99], где роль лидера иг-
N
рает “усредненный” агент x(t) =1
xi(t).
N i=1
В [100] метод СГ используется для синтеза децентрализованного алгорит-
ма адаптации локальных регуляторов для сетей в случае, когда локальная
динамика агентов имеет вид F (xi, ui, t) = Axi + Bui + ϕ0(xi), уравнение ли-
дера имеет вид x∗i = Ax∗i + Bu∗i + ϕ0(x∗i), y∗i = Cx∗i, а локальные адаптив-
ные регуляторы имеют вид
(
)T
(6.5)
ui = θTi(yi - y(t)), yi = Cxi,
θi = -γigT
yi - y(t)
P (xj - xi
).
В [101] рассматривались задачи управления кластерной синхронизацией в
сетях из осцилляторов Стюарта-Ландау с запаздыванием в связях, описы-
ваемых уравнениями
(
)
(
)
(6.6)
Żj(t) =
λ + iω - |zj|2
zj + K Gjn(t)
zn(t - τ) - zj(t)
,
n=1
27
где zj - комплексные числа, i2 = -1, K = ρe - комплексный параметр, опре-
деляющий интенсивность и фазовый сдвиг функций связей, τ - запаздыва-
ние, λ, ω - параметры динамики агентов. Известно, что при изменении вели-
чины K в сети могут возникать различные колебательные режимы, в кото-
рых фазы колебаний агентов могут все совпадать, или быть все различными,
отличающимися на 2π/N, или, в промежуточном случае, агенты могут груп-
пироваться в M < N кластеров, в каждом из которых агенты имеют одну и
ту же фазу. Целевая функция выбрана в виде
2
N
(6.7)
Q = 1 - fd(ϕ) +
fp
(ϕ),
2
p|d,1≤p<d
где
1
j
(6.8)
fp(ϕ) =
epiϕ
e-piϕk ,
N2
j=1
k=1
а символ p | d означает, что d делится на p. Построен АСГ в дифференци-
альной форме для настройки параметра β и в частном случае сети из шести
осцилляторов путем моделирования показано, что в системе можно создать
режим синхронизации с любым допустимым числом кластеров: 1, 2, 3 или 6.
В [101] аналогичные результаты получены при настройке параметров Gjn,
определяющих топологию сети.
7. Управление техническими системами
7.1. Управление вибрационными машинами
В [102, 103] исследуется задача управляемого прохождения через зону ре-
зонанса для механических систем с несколькими степенями свободы. В [102]
разработан алгоритм управления, основанный на методе СГ и оценке часто-
ты замедленного движения вблизи резонанса (частота Блехмана). Приведе-
ны результаты моделирования двухроторных гибких виброустановок, демон-
стрирующие эффективность предложенных алгоритмов и фрактальную за-
висимость времени прохождения от начальных условий. Особенностью иссле-
дования, приведенного в [103], является изучение работы замкнутой системы
с учетом динамики электропривода. Получено, что время прохождения зо-
ны резонанса может оказаться меньшим, чем для упрощенной модели без
учета динамики электропривода. Исследования продолжены в [104]. Отмече-
но, что существующие алгоритмы управления на основе метода СГ требуют
измерения полного вектора состояния системы. Для устранения этого недо-
статка разработан алгоритм управления на основе частичного наблюдателя
для оценки вертикальной скорости опорного тела. Предлагаемый наблюда-
тель основан на упрощенной нелинейной модели двухмассовой колебательной
системы. Эффективность управляемого прохождения через зону резонанса с
28
алгоритмом управления на основе предложенного наблюдателя проанализи-
рована с помощью компьютерного моделирования для полной модели меха-
нической системы.
Работа [105] посвящена управлению колебаниями механических систем
при пуске и прохождении через резонансные режимы. В обоих случаях ал-
горитм управления основан на методе СГ с целевыми функциями на основе
энергии. Показано, что для гамильтоновых систем с одной степенью свободы
в общем случае возможно переместить систему из любого начального состоя-
ния в любое конечное состояние с помощью управляющей силы сколь угодно
малой интенсивности. Исследуется управляемое прохождение через резонанс
на вибрационной машине с пятью степенями свободы с присутствием сил тре-
ния. Моделированием показано, что применение управления с обратной свя-
зью делает возможным прохождение через более низкий резонанс с меньшей
интенсивностью управления по сравнению с прохождением через резонанс
при постоянном управляющем моменте. Особенностью данной статьи явля-
ется рассмотрение случая, когда постоянные управляющие моменты не поз-
воляют роторам даже начать вращение. Применение управления с обратной
связью позволяет роторам преодолевать силу тяжести и начинать вращение.
В [105] приведено сравнение результатов моделирования с экспериментальны-
ми результатами, полученными на двухроторном лабораторном мехатронном
стенде СВ-2М ИПМаш РАН. Большинство результатов качественно совпада-
ют, что подтверждает адекватность принятой модели.
Результаты экспериментального исследования явления самосинхрониза-
ции и эффекта Зоммерфельда как в разомкнутом, так и в замкнутом контуре
управления представлены в [106]. Эксперименты выполнены на мультире-
зонансной мехатронной лабораторной установке (Multiresonance Mechatronic
Laboratory Setup, MMLS) СВ-2М ИПМаш РАН, в которую входят неуравно-
вешенные вибровозбудители, установленные на подпружиненной платформе,
датчики, электродвигатели, управляющий компьютер, интерфейс для обмена
данными. Показано, что управление с обратной связью на основе метода СГ
позволяет точнее стабилизировать скорость вращения, чем обычно исполь-
зуемое в вибрационной технике управление двигателями без обратной связи.
Некоторые дополнительные эффекты, такие как низкочастотные автоколеба-
ния, могут появиться из-за интегральной (И) составляющей сигнала управ-
ления с обратной связью.
В [107] изучена синхронизация управляемого неуравновешенного ротора с
вязкоупругим основанием и силовым возбуждением. Методом прямого разде-
ления движения выводятся условия существования и устойчивости синхрон-
ного режима движения для общего закона управления. Затем с помощью ме-
тода СГ разработан закон управления, чтобы передать максимальную энер-
гию от возбуждения к ротору. Свободные параметры закона управления вы-
водятся таким образом, чтобы управляемая синхронизация была устойчивой
на пределе ее существования.
В [108, 109] рассмотрена задача об управлении числом проскальзываний
циклов ротора электрической машины с помощью воздействия внешнего мо-
29
мента на примере одной простой математической модели. Для решения зада-
чи применен метод СГ с целевой функцией, определяемой функцией энергии
колебаний. Особенностью данного подхода является возможность использо-
вания достаточно малого управления, что способствует сбережению энергии.
Строится алгоритм управления колебаниями ротора электрической машины,
при использовании которого совершается заданное число проскальзываний
циклов. В [109] проведено сравнение использования алгоритмов СГ и релей-
ного. При моделировании ставится задача выполнить желаемое количество
проскальзываний цикла в его начале, а затем возбудить колебания ротора
с постоянной амплитудой. Результаты моделирования показали эффектив-
ность предложенных алгоритмов.
В [110] рассматривается адаптивное оценивание неизвестных параметров и
состояний сферического робота с маятниковым приводом. С этой целью рас-
сматривается следующая обобщенная задача: для модели нелинейного объек-
та в виде x = f(x, p, u), где x∈ Rn, p∈ Rk, найти оценку˙x = f(x, p, u) обеспе-
чения выполнения цели limt→∞ |p - p(t)| = 0. Для использования метода СГ
вводится следующий целевой функционал:
1
J (x, x) =
wie2i,
2
i=1
где ei = xi - xi, wi - весовые коэффициенты, выбранные разработчиком;
i = 1,...,n.
Метод синтеза СГ приводит к следующим выражениям:
(
)
∂J
˙
J
=
+fˆ(x, p, u)TxJ = wiei
ėi
fi(x, p,u)
=
∂t
i=1
(
)
= wiei
fi(x, p,u) - fi(x,p,u)
i=1
В итоге получается следующее правило оценивания на основе СГ:
(
)
(7.1)
p = -Γ∇p
wieii(x, p,u)
i=1
Алгоритм (7.1), используется в [110] для оценки в реальном времени со-
стояний и неизвестных параметров сферического робота для различных зна-
чений длины шага и начальных условий. Для адаптивной регулировки этого
усиления используется эвристический нечетко-логический регулятор. Пред-
ставленные в [110] результаты моделирования показывают, что предложен-
ный подход является достаточно обнадеживающим для идентификации этой
нелинейной по параметрам хаотической системы, даже если начальные усло-
вия меняются и уровень неопределенности возрастает.
30
7.2. Управление летательными аппаратами
7.2.1. Управление летательными аппаратами в атмосфере
Управление нежесткими летательными аппаратами. В [111] разработан ро-
бастный автопилот для управления угловым положением летательного аппа-
рата (ЛА) с нежесткостью в конструкции при параметрической неопределен-
ности. Используется следующая модель бокового движения ЛА как твердого
тела [112-114]:
β(t) = r(t) + az β(t) + aδzδ(t),
(7.2)
ωy(t) = amβ(t) + aωmr(t) + aδmδ(t),
 ψ(t) = r(t),
где ψ(t), r(t) - угол и скорость рыскания соответственно, β(t) - угол сколь-
жения, δ(t) - угол поворота руля направления, aji - параметры модели ди-
намики ЛА. Значения aji зависят от условий полета (таких как высота, чис-
ло Маха и т.д.) и могут изменяться в широком диапазоне во время полета.
Учитывается первый тон изгибных колебаний корпуса ЛА, который в месте
расположения датчиков моделируется передаточной функцией
Δψ(s)
kbend
(7.3)
Wbend(s) =
=
,
δr(s)
T2bends2 + 2ξbendTbends + 1
где kbend - коэффициент передачи от отклонения руля направления к изгибу;
Tbend - постоянная времени первого тона упругих колебаний, Tbend = ω-1bend,
где ωbend - собственная частота первого тона упругих колебаний; ξbend - ко-
эффициент естественного демпфирования (ξbend ≈0). Сигнал ψg, измеренный
гироскопом, представляет собой сумму углов рыскания и изгиба:
(7.4)
ψg
(t) = ψ(t) + Δψ(t).
Сервопривод руля направления моделируется как фильтр нижних частот вто-
рого порядка. На основе СГ-метода в [111] разработан регулятор с высоким
коэффициентом усиления с принудительно организованными скользящими
режимами. Шунт (параллельный компенсатор в прямой связи) [54, 115-119]
используется для обеспечения устойчивости замкнутой системы в условиях
недостатка информации о переменных состоянии ЛА. Последовательная эта-
лонная модель используется для определения желаемой динамики системы
с обратной связью. Исследована устойчивость системы в широкой области
значений параметров ЛА. Результаты моделирования продемонстрировали
эффективность и высокую робастность предложенного метода управления.
Адаптивное кодирование при управлении группой дронов. В [120] пред-
ставлена и численно исследована процедура адаптивного кодирования для
передачи данных между квадрокоптерами, движущимися в формации. Пара-
метры квадрокоптера определены с использованием экспериментальных дан-
ных по цифровому каналу связи с ограниченной полосой пропускания. При-
ведено сравнение полученных результатов с теоретическими положениями и
проиллюстрирована эффективность процедуры адаптивного кодирования.
31
Робастное управление боковым движением самолета. Синтез робастного
управления с обратной связью по выходу для линейных объектов с непре-
рывным временем в условиях параметрических неопределенностей и внеш-
них ограниченных возмущений рассматривается в [121]. Предлагаемый ал-
горитм обеспечивает отслеживание выходом эталонного процесса с необхо-
димой точностью. Представлено применение алгоритма для управления бо-
ковым движением самолета при параметрических и внешних возмущениях
и дано сравнение предложенного алгоритма с H и управлением по мето-
ду СГ. Результаты моделирования демонстрируют эффективность и робаст-
ность предлагаемой системы управления.
Подавление автоколебаний ЛА по крену (wing rock). Явление “wing rock”
известно как самовозбуждающееся движение крена при больших углах атаки.
Когда возникает это явление, угол крена ЛА испытывает колебания нарас-
тающей амплитуды, которые асимптотически сходятся к устойчивому пре-
дельному циклу [122-125]. Динамика автоколебаний по крену описывается
существенно нелинейной моделью, параметры которой меняются в широком
диапазоне в зависимости от условий полета (высоты, числа Маха, массы на-
грузки и др.), а также от угла атаки.
В [126] предлагается адаптивный АСГ в конечной (интегрально-алгебраи-
ческой) форме для управления ЛА по крену с подавлением автоколебаний.
Используется следующая модель динамики движения ЛА:
(7.5)
ϕ+a0ϕ+a1ϕ˙+a2
ϕ|ϕ˙ + a3ϕ3 + a4ϕ2
ϕ = bu,
где ϕ обозначает угол крена, u - управляющее воздействие (отклонение эле-
ронов), ai = ai(α), b = b(α) > 0 - неизвестные параметры модели самолета,
зависящие от угла атаки α. Рассмотрена задача отслеживания углом кре-
на ϕ задающего воздействия ϕ, что означает приведение состояния системы
к целевому многообразию ψ(ϕ, t) ≡ ė + λe = 0, где e = ϕ - ϕ(t). В [126] пред-
ставлены сравнительные результаты моделирования для закона управления
СГ и закона, полученного с помощью метода “погружения и инвариантности”
(Immersion &Invariance, I&I) I&I, см. [127-129]. Оба закона адаптации вклю-
чают в себя интегральный закон обновления и алгебраическую векторную
функцию, зависящую от состояния ЛА. Результаты моделирования показа-
ли, что обе адаптивные системы способны подавлять автоколебания по кре-
ну, несмотря на неопределенности параметров модели при различных углах
атаки.
Аналогичная задача управления рассмотрена и в [130] для модели ЛА вида
(7.5). Для адаптивного подавления автоколебаний крена используется метод
неявной эталонной модели (НЭМ) [8, 25, 28, 30, 54, 55]. Законы адаптивно-
го управления с НЭМ выводятся на основе метода СГ, если использовать
локальный целевой функционал Q =12 xTP x, где x ∈ Rn обозначает вектор
состояния объекта, (n×n)-матрица P положительно определена, P = PT > 0.
Настраиваемый закон управления в “основном контуре” принимается в виде
u = K(t)y, где u - управляющее воздействие, y - измеряемый выход объекта,
K = K(t) - коэффициенты передачи регулятора, скорректированные с помо-
32
щью алгоритма адаптации. На основе этого подхода получается следующий
адаптивный закон управления креном:
˙
(7.6)
e(t) = ϕ(t) - ϕ(t),
ξ
(t) = e(t), ξ(0) = 0
– ошибка слежения и ее интеграл,
(7.7)
σ(t) = τϕ(t) + e(t) - ошибка адаптации,
(
)
(7.8)
u(t) = -
kiξ(t) + kp(t)e(t) + kd(t)ϕ(t)
– сигнал управления,
(
)
(7.9)
kp(t) = γσ(t)e(t) - λ
kp(t) - k0p
, kp(0) = k0p
– адаптивная настройка коэффициента регулятора
для пропорциональной составляющей,
(
)
(7.10)
kd(t) = γσ(t)ϕ(t) - λ
kd(t) - k0d
, kd(0) = k0d
– адаптивная настройка коэффициента регулятора
для дифференциальной составляющей,
где ϕ(t) - задающее воздействие по крену, τ > 0 - постоянная времени НЭМ
(выбираемый при синтезе параметр), γ > 0 - коэффициент адаптации (вы-
бираемый при синтезе параметр), λ > 0 - коэффициент усиления парамет-
рической обратной связи адаптации (выбираемый при синтезе параметр),
k0p, k0d - начальные значения настраиваемого пропорционального и производ-
ного коэффициентов усиления, найденные на основе априорно доступной ин-
формации о параметрах объекта (выбираются при синтезе). Если априорные
данные не дают возможности для обоснованного выбора k0p, k0d, то разум-
но выбрать k0p = 0, k0d = 0. Следует отметить, что интегральный коэффици-
ент усиления ki в (7.8) не подвергается настройке. Результаты, полученные
с помощью моделирования, показывают, что адаптивный регулятор с НЭМ
подавляет колебания предельного цикла колебаний по крену и обеспечивает
приемлемые характеристики слежения при различных углах атаки.
Исследования в этом направлении продолжены в [131], где использова-
на более реалистичная, чем (7.5), модель динамики движения ЛА по кре-
ну [132-134], в которой учитывается взаимное влияние углов крена и сколь-
жения. В отличие от [132, 135, 136], кроме того, ограничения на угол отклоне-
ния элеронов явно учитываются в [131] при синтезе регулятора. С этой целью
в [131] предложена и численно исследована для характерных режимов полета
модификация схемы адаптивного управления с НЭМ.
Реализация закона адаптивного управления (7.8)-(7.10), как и других ти-
пов “простых адаптивных регуляторов” [53, 137-139], требует низких вы-
числительных затрат. В частности, (7.6), (7.8) соответствуют традиционно-
му ПИД-регулированию с возможным добавлением “релейной” компонен-
ты sign σ. Для усиления адаптивной настройки kp(t), kd(t) должны быть
включены два интегратора (7.9), (7.10). Адаптивный закон управления приве-
ден в [131] и в дискретной форме, выполнены численные исследования влия-
ния интервала квантования на качество управления.
33
Приведенные в [131] результаты моделирования также демонстрируют
очень важное и характерное свойство адаптивных систем управления НЭМ:
в процессе адаптации коэффициенты усиления регулятора не стремятся к
фиксированным значениям, определяемым параметрами объекта. Это не тре-
буется и, более того, невозможно, поскольку не выполняется условие Эрц-
бергера [24, 52], которое является естественным для обычных БСНС с ЭМ.
Коэффициенты регулятора изменяются в зависимости от, например, задаю-
щего воздействия или действующих возмущений, обеспечивая выполнение
“эталонного уравнения” для замкнутой системы.
Адаптивное управление лабораторным стендом “Вертолет”. В [140, 141]
метод СГ и концепция НЭМ используются для разработки двух законов
адаптивного управления углом тангажа лабораторного стенда “Вертолет”
QuanserTM-LAAS.
Для адаптивной настройки стандартных ПИ и ПИД-регуляторов в реаль-
ном времени используется метод СГ с НЭМ [8, 54, 55]. Адаптивное управле-
ние с пропорционально-интегрально-дифференцирующим (ПИД) регулято-
ром выглядит следующим образом:
t
(7.11)
u(t) = kP (t)e(t) + kI (t) e(τ)dτ - kD
(t) y(t),
0
где θ(t) - угол тангажа, ε(t) - угол места, а λ(t) - угол перемещения (разво-
рота штанги стенда). Через e(t) = r(t)-y(t) обозначена “обобщенная” ошибка
слежения (по соответствующим координатам), kP (t), kI (t), kD(t) - настраи-
ваемые коэффициенты усиления регулятора. Методом СГ получен следую-
щий алгоритм адаптации:
(
)
kP (t) = -γP σ(t)e(t) - αP
kP (t) - k0P
, kP(0) = k0P,
t
(
)
kI(t) = -γIσ(t) e(τ)dτ - αI
kI(t) - k0I
, kI(0) = k0I,
0
(
)
(7.12)
kD(t) = γDσ(t) y(t) - αD
kD(t) - k0D
, kD(0) = k0D,
где γi > 0, αi ≥ 0, k0i - выбираемые при синтезе параметры, i ∈ {P, I, D}.
Ошибка адаптации σ(t) имеет вид
t
(7.13)
σ(t) = T2 y(t) + 2ξT y(t) -
e(τ)dτ ,
0
где T , ξ - выбираемые при синтезе параметры, описывающие желаемую
динамику замкнутой системы. Уравнения (7.11)-(7.13) задают адаптивный
ПИД-регулятор с НЭМ второго порядка. Если выбрана НЭМ первого поряд-
ка, то сигнал ошибки адаптации следует брать в виде
(7.14)
σ(t) = T y(t) - e(t),
34
где e(t) = r(t) - y(t). Параметр T задает желаемую постоянную времени за-
мкнутой системы.
Программные среды MATLAB / Simulink и WinCon использованы для
реализации законов адаптивного управления при проведении экспериментов.
Результаты экспериментов показали достижение требуемого поведения систе-
мы и устойчивость предложенных законов управления по отношению к пара-
метрической неопределенности и неучтенной при синтезе динамике объекта.
Подавление изгибно-упругого флаттера крыла адаптивным регулятором с
НЭМ. В [142] предложена простая схема адаптивного управления, основан-
ная на НЭМ и СГ-методе для активного подавления флаттера крыла. Рас-
смотрено двумерное крыло, которое колеблется по тангажу и прогибу. Угол
тангажа α - наклон крыла относительно оси упругости. Матрично-векторное
уравнение изгибно-упругого флаттера крыла взято в виде [143, 144]:
[
][
]
[
][
]
Iα
mwxαb
¨
cα
0
α
+
+
h
h
mwxαb mt
0
ch
[
][
]
[
]
k
α)
0
α
M
(7.15)
+ α(
=
,
0
kh(h) h
−L
где mt - общая масса основного крыла и опорной конструкции, mw - масса
основного крыла, xα - безразмерное расстояние между центром масс и осью
изгиба, Iα - момент инерции крыла относительно оси вращения, b - средняя
хорда крыла, cα, ch - коэффициенты демпфирования за счет прогиба и тан-
гажа соответственно, kh(h) и kα(α) - коэффициенты жесткости пружины для
прогиба и тангажа соответственно, так что αkα(α) - нелинейное слагаемое,
αkα(α) = k1α + k2α2.
В [142] получен и исследован следующий ПД закон адаптивного управле-
ния с НЭМ для системы активного подавления флаттера:
u(t) = kp(t)α(t) + kd(t) α(t),
σ(t) = α(t) + g0α(t),
(
)
kp(t) = γσ(t)α(t) - λ
kp(t) - k0p
,
kp(0) = k0p,
(
)
kd(t) = γσ(t) α(t) - λ
kd(t) - k0d
,
kd(0) = k0d.
7.2.2. Управление космическими аппаратами. В [145] рассматриваются две
задачи управления нелинейными колебаниями космических систем: задача
стабилизации угловой скорости вращающегося спутника и задача возбужде-
ния колебаний с заданной амплитудой для буксируемого спутника-зонда.
Стабилизация угловой скорости вращающегося спутника. Предполагается,
что спутник снабжен пассивным инерционным диссипатором энергии в виде
пружинно-массового демпфера и малых реактивных двигателей. Движение
спутника подвергается воздействию комбинации изменяющегося во времени
момента возбуждения и управляющего момента.
35
Демпфер центрирован на неподвижной оси X тела и имеет точечную мас-
су m. Эта масса движется по оси, перпендикулярной оси X, на некотором
расстоянии от главной оси Z. Используется следующая модель углового дви-
жения спутника, приведенная в [146]:
{
(I + m(1 - µ)y2) ω + 2m(1 - µ)y yω - mbÿ = M(t),
(7.16)
(
)
m(1 - µ)ÿ + c y +
k - (1 - µ)ω2
y - bω = 0,
где ω, y
- угловая скорость спутника и смещение массы демпфера;
I,m,k,c обозначают момент инерции спутника относительно оси Z, мас-
сы демпфера, жесткости пружины и усиления вязкого сопротивления; µ =
= m/mT , где mT обозначает полную массу системы. Внешний крутящий
момент M(t) представляет собой сумму крутящего момента возбуждения и
управляющего крутящего момента, т.е. M(t) = ME(t) + MC (t). Предполага-
ется, что |MC (t)| ≤
M,
M> 0.
Применение энергетического варианта СГ-метода синтеза управления дает
следующие “пропорциональный” и “релейный” законы управления:
(
)(
)
(7.17)
MC
Href - H(y, y,ω)
ω+˙y
I + y2 - 1)-1
,
(
)
(
)
(7.18)
MC =γ sign
Href - H(y, y,ω)
sign
ω+˙y
I + y2 - 1)-1
,
где введены y = (1 - µ)b-1y
I = (1 - µ)m-1b-2I. Закон управления (7.18) мо-
жет быть непосредственно реализован с помощью двухпозиционных управ-
ляющих реактивных двигателей.
В [145] приведены результаты численного моделирования для спутника
Intelsat-II, демонстрирующие эффективность стратегии управления по мето-
ду СГ с энергетическим целевым функционалом для подавления возможных
хаотических колебаний спутника.
Возбуждение колебаний буксируемого зонда-спутника. Метод управления
СГ применяется для возбуждения колебаний заданной амплитуды буксируе-
мого спутника-зонда. Рассмотрено относительное движение зондирующего
спутника, соединенного с космическим кораблем гибким нерастянутым безы-
нерционным кабелем [147, 148]. Обозначим фиксированную длину кабеля че-
рез L, массу спутника через m, а массу космического корабля будем счи-
тать намного большей массы спутника. Представим космический аппарат и
спутник материальными точками. Принята следующая модель нелинейных
колебаний [147]:
(
)
(7.19)
γ + ω2eδsinγ - 3ω0 cosγ
sin γ = 0.
Пусть изменение длины кабеля после развертывания привязной системы
является регулирующей величиной. Используя метод СГ, в [145] выводится
следующий алгоритм:
u′k = -α(γmax - γ)γ sin γ,
{
(7.20)
u′k
если |u′k| ≤ u,
uk =
usign u
иначе,
36
где u - максимальное изменение длины кабеля, γ > 0 - коэффициент усиле-
ния.
Устойчивость системы к изменениям модели спутника и амплитуды мо-
мента возбуждения установлена с помощью компьютерного моделирования.
7.3. Управление автомобилями
Регулирование скорости большегрузных автомобилей. В [149] рассмотрена
задача управления продольной скоростью большегрузных автомобилей, обо-
рудованных регулируемым компрессионным тормозом. Разработаны нели-
нейные регуляторы, которые выполняют как некритические, так и критиче-
ские маневры. Техника проектирования основана на СГ-методе. Номинальная
целевая функция выбирается для решения задачи регулирования скорости,
а затем она соответствующим образом модифицируется барьерными функ-
циями для выполнения критических требований маневра. Чтобы выполнять
более активные (критические) маневры торможения или управлять скоро-
стью автомобиля при больших изменениях уклона, компрессионный тормоз
должен согласовываться с регулировкой передаточного числа и фрикцион-
ными тормозами. Обсуждаются два способа управления неопределенностью
уклона дороги: за счет использования интегрального действия регулятора СГ
для постоянных (но неизвестных) уклонов и за счет использования дополни-
тельного дифференциального действия для различных уклонов.
Управление работой бензиновых двигателей с прямым впрыском и стра-
тифицированным наддувом. Метод СГ используется в [150] для разработ-
ки закона управления скоординированным соотношением воздух-топливо и
управления крутящим моментом в бензиновых двигателях с прямым впрыс-
ком и стратифицированным наддувом (direct injection stratified charge gaso-
line engines DISCE). Метод основан на динамической минимизации целевой
функции.
Используется следующая модель процесса:
(7.21)
x = f(x) + g(x)u,
где вектор состояния x = [pm, Wf , δ]T и вектор управления u = [uth, uf , uδ]T
складываются из давления во впускном коллекторе pm, эффективного про-
ходного сечения дроссельной заслонки uth, расхода через дроссель Wf , вре-
мени зажигания δ. Для введения интегрального воздействия в закон управ-
ления предполагается, что Wf и δ управляются следующими уравнениями:
Wf = uf,δ = uδ.
Для синтеза регулятора используется целевая функция Q = Qp + Qb, где
Qp - это штраф за переходный процесс квадраты отклонений момента
торможения мотора, потока через цилиндры и времени зажигания от их
уставок;
Qb - это штраф за нарушение ограничения λ ∈ [λminmax], λ(t) - соот-
ношение воздух-топливо внутри цилиндра.
37
Цель управления - стабилизировать желаемое состояние равновесия x = xd
(
)
так, чтобы f(xd) + g(xd)ud = 0, минимизируя Q
x(t)
→ 0.
Для выбранной целевой функции Q скоростной градиент равен ω(x) ≡
(
)T
(
)T
(
)
∂Qp
∂Qb
≡∇u
x(t), u
=
g(x)
+
g(x)
. Тогда для рассматриваемой це-
∂x
∂x
левой функции метод СГ приводит к следующему закону управления:
(7.22)
u=ud
− Γω(x).
В [150] предлагается численная процедура, которая может использоваться
на практике для проверки условий устойчивости рассматриваемой системы
с обратной связью.
7.4. Управление автономными подводными роботами
Адаптивное управление автономным подводным манипуляционным робо-
том. Работы [17, 86, 151] посвящены адаптивному управлению автономным
подводным аппаратом (АПА, autonomous underwater vehicle, AUV) с мани-
пулятором. В этих статьях разработана основанная на методе СГ нелиней-
ная адаптивная система управления АПА с шестью степенями свободы. При
адаптивном подходе проблемы позиционирования и кинематического слеже-
ния решаются совместно. Для разработки алгоритма управления не требует-
ся предварительных знаний о параметрах динамики и гидродинамики АПА,
кроме динамики двигателя. Адаптация проводилась с помощью нелинейного
адаптивного закона управления СГ. При проектировании учитывается дина-
мика двигателей с использованием метода обратной динамики и наблюдения
за состоянием/возмущением.
В [17] рассматривается класс полноуправляемых АПА с двумя плоскостя-
ми симметрии и шестью степенями свободы. Модель динамики АПА основана
на результатах [152, 153] и имеет следующий вид:
(7.23)
M ˙v = -C(v)v - D(|v|)v + Fb(η) + Fc + Ft,
(7.24)
η = J(η)v
с системными матрицами M(t) = Mb(t) + Ma(t), C(t, v) = Cb(t, v) + Ca(t, v),
где Mb - матрица инерции тела; Ma - матрица добавленных масс (масса окру-
жающей жидкости); Cb(t, v), Ca(t, v) - кориолисова и центростремительная
матрицы, D(|v|) = Dl +Dq diag (|v|). В (7.23), (7.24) введены следующие обоб-
щенные координаты и скорости: η = [x, y, z, ϕ, θ, ψ]T - обобщенное положение
в системе отсчета, закрепленной с Землей, v = [u, v, w, p, q, r]T - вектор обоб-
щенной скорости на траектории полета АПА в системе отсчета, закрепленной
с телом аппарата; J(η) - матрица поворотов с углами Эйлера (ϕ, θ, ψ); Fb -
чистая выталкивающая сила, Fc - сила реакции троса, Ft - обобщенная тяга.
Из (7.24) следует, что v = J(η)-1 η. С подстановкой этого отношения в
(7.23) модель АПА принимает вид
1
(7.25)
Mη(η)η +
Mη(η) η + Dη(v,η)η˙ + gη(η) = τη,
2
38
где τη - обобщенный управляющий момент. Введением ошибок ориентации
и скорости как η(t) = η(t) - η(t), v(t) = v(t) - v(t) в [17] ставится сле-
дующая задача слежения: обеспечить предельные отношения limt→∞ η(t) = 0,
limt→∞ v(t) = 0.
Для решения этой задачи в [17] используется энергетический оценочный
функционал Q(η, v) =12 ηT η +12 vTM v и выбирается следующая цель управ-
ления: Q(η, v) → 0 при t → ∞. Процедура синтеза по методу СГ состоит из
следующих шагов:Q(η, v), следовательно, ∇τ Q˙ (η, v) и, наконец, закон управ-
ления СГ имеет вид τ(η, v, η, v).
Из-за неопределенности параметров модели АПА использован СГ-адап-
тивный закон управления
∂Q˙(Ui)
(7.26)
Ui = -Γi
,
i = 1,...,6,
∂Ui
где Ui - матричные параметры регулятора, Γi = ΓTi > 0 - коэффициенты уси-
ления.
В [17, 151] приведены результаты моделирования, отражающие особенно-
сти предлагаемого подхода.
В [154] представлен подход к прямому адаптивному управлению и разра-
ботке быстрой навигационной системы для трехмерного отслеживания пу-
ти полноприводных дистанционно управляемых транспортных средств, соче-
тающих алгоритм СГ с оптимальным по времени алгоритмом отслеживания
пути.
Нейросетевая система управления подводным роботом. Работы [155-157]
посвящены проектированию систем управления подводным роботом на ос-
нове интеллектуальной нейронной сети. Получен новый алгоритм обучения
интеллектуального регулятора с использованием метода СГ. Предлагаемые
системы обеспечивают динамику робота, близкую к желаемой.
Изложим подробнее результаты [157]. В качестве исходной модели под-
водного робота (ПР) в [157] используется его стандартное описание в виде
совокупности кинематических и динамических уравнений [158]
(7.27)
˙q1 = J(q1)q2,
(7.28)
D(q1)
) = U,
где J - кинематическая матрица; q1, q2 - векторы обобщенных координат
и скоростей ПР в связанной системе координат; U - вектор управляющих
сил и моментов; D - матрица инерции с учетом присоединенной массы во-
ды; B - матрица кориолисовых и центробежных сил; G - вектор обобщен-
ных сил и моментов тяготения, плавучести и нелинейного демпфирования.
В [157] предлагается преодолеть имеющуюся неполноту априорной инфор-
мации о параметрах модели ПР на основе интеллектуального нейросетевого
(НС) управления.
Ставится задача отслеживания ПР заданной траектории q∗1(t), q∗2(t). Сна-
чала рассматривается отслеживание скоростей q∗2(t). Вводится ошибка слеже-
39
ния e2(t) = q∗2(t) - q2(t), относительно которой строится локальный целевой
функционал
1
(7.29)
Q=
eT2De2
2
с некоторой матрицей D(t) = D(t)T > 0. Следуя СГ-методу, вычисляется про-
изводная
Qв силу системы:
1
(7.30)
Q=eT
2 +
eT2D˙ e2,
2
2
откуда после подстановок получаем
(
)
Q=eT
(7.31)
D(q1)
˙q∗2 + B(q1,q2)q∗2 + G(q1,q2) - U
2
Закон управления ПР предлагается реализовать с помощью двухслойной
НС [159], т.е. в виде
(7.32)
U = Wf(w,x),
где W - матрица коэффициентов передачи от нейронов внутреннего (скрыто-
го) слоя к выходным нейронам, f(·) - функции активации нейронов скрытого
слоя, w - матрица коэффициентов передачи от входных нейронов к нейронам
скрытого слоя.
Выражения (7.31), (7.32) приводят к следующей формуле для производной
по коэффициентам матрицы W от скорости изменения целевой функции:
∂Q˙
(7.33)
= -e2fT
(w, x).
∂W
Функции активации нейронов взяты в экспоненциальной форме f(w, x) =
= 1/(1 + e-τwx) с некоторым τ > 0.
Работа [157] иллюстрируется результатами компьютерного моделирова-
ния.
7.5. Управление энергосистемами
Задача управляемой синхронизации многомашинной энергосистемы с по-
терями рассмотрена в [160], где получены условия существования инвариан-
тов в системе и разработан алгоритм синхронизации на основе метода СГ для
целевой функции, штрафующей за отклонение от имеющегося инварианта.
Оценка качества замкнутой системы выполнена по результатам моделирова-
ния.
В [161, 162] представлен инверсный оптимальный нейронный регулятор
по методу СГ для нелинейных систем с дискретным временем при наличии
внешних возмущений и неопределенностей параметров для энергосистемы с
различными типами неисправностей в линиях передачи, включая колебания
нагрузки. Регулятор основан на дискретной рекуррентной нейронной сети
40
высокого порядка (discrete-time recurrent high order neural network, RHONN),
обученной с помощью алгоритма на основе расширенного фильтра Калмана
(extended Kalman filter, EKF). В [162] предлагается упрощенная нейронная
модель синхронной машины для стабилизации системы из девяти шин при
наличии неисправности в трех различных случаях на линиях передачи.
Проблема повышения устойчивости и качества работы электрических се-
тей с помощью управления рассмотрена в [163]. Расширен подход, основан-
ный на использовании инвариантной функции, зависящей от системных пе-
ременных, и метода СГ для синтеза управления, предложенный в [160], а
именно, в алгоритм этой работы внесены изменения для большей гибкости
при разработке системы управления. Исследованы устойчивость и работоспо-
собность замкнутой системы для сети, состоящей из трех генераторов. При-
ведены результаты моделирования, иллюстрирующие динамику системы.
7.6. Управление гироскопическими устройствами
Работы [164, 165] посвящены управлению нелинейными колебаниями коль-
цевого вибрационного микрогироскопа, резонатор которого представляет со-
бой тонкое упругое кольцо толщины h, связанное с основанием при помощи
восьми полукруглых спиц [166, 167]. Oceвая линия резонатора в недефор-
мированном состоянии имеет вид окружности радиуса R. Его колебания воз-
буждаются и регистрируются системой управляющих и измерительных элек-
тродов. В [164, 165] исследованы погрешности вибрационного микрогироско-
па, возникающие из-за нелинейных упругих свойств материала кольцевого
резонатора. Целью работы является синтез закона управления колебаниями
резонатора для снижения влияния нелинейной упругости материала кольца
на ошибки гироскопа. С использованием СГ-метода построено управление
потенциалами электродов, позволяющее поддерживать заданную амплитуду
нормального прогиба резонатора и парировать погрешности гироскопа из-за
нелинейных упругих свойств материала.
При описании динамики резонатора вводятся величины v, w - упругие
смещения элемента кольца резонатора в окружном и радиальном направ-
лении соответственно. Для упрощения решения используется одномодовое
приближение, т.е. считается, что w = f sin(nϕ) + g cos(nϕ), где n - номер мо-
ды колебаний резонатора; f = f(τ), g = g(τ) - функции безразмерного вре-
мени τ = ωnt, определяемые системой двух нелинейных дифференциальных
уравнений второго порядка, полученных из уравнения нормального проги-
ба с применением процедуры Бубнова-Галеркина. Правые части уравнений
для f(τ), g(τ) содержат управляющие напряженияŨ1 (для f) иŨ2 (для g),
которые выбраны в виде
(7.34)
Ũ1 = u1 sin τ + u2
cos τ,
(7.35)
Ũ2 = u3 sin τ + u4
cos τ,
где u1, . . . , u4 - медленно изменяющиеся управляющие воздействия.
41
Для исследования системы методом усреднения Крылова-Боголюбова
[168] выполнена следующая замена переменных:
(7.36)
f = p1 sinτ + q1 cosτ, g = p2 sinτ + q2
cos τ,
где введены медленно изменяющиеся переменные p1, q1, p2, q2.
Далее уравнения системы представляются в гамильтоновой форме:
)
)
(∂H
1
(∂H
1
(7.37)
qi = ε
-
γqi
,
pi = ε
-
γpi
,
i = 1,2
∂pi
2
∂qi
2
с функцией Гамильтона
H = - 1/2ν(p2q1 - p1q2) - 1/8ξ(p2q1 - p1q2)2+
(
)2
(7.38)
+ 3/32ξ
q21 + p21 + q22 + p22
+ 1/2(p2u1 + q1u2 + p2u3 + q2u4
).
Коэффициент γ в (7.37) соответствует демпфированию системы (дисси-
пации энергии). В [164, 165] показано, что при отсутствии демпфирования
(γ = 0) функции
(7.39)
G1 = q21 + p21 + q22 + p22, G2 = p2q1 - p1q2
являются первыми интегралами системы (7.37), что дает возможность сведе-
ния задачи о нелинейных колебаниях кольцевого резонатора к квадратурам.
Рассматриваемая задача возбуждения и стабилизации колебаний кольце-
вого резонатора формализована в [164, 165] при помощи скалярных целевых
функций G1, G2, при этом цель управления задается как достижение пре-
дельного равенства
(7.40)
lim
Gi = Gi,
i = 1,2,
t→∞
где
G∗1 = r2∞, G∗2 = 0.
Для возбуждения и поддержания заданной амплитуды колебаний резона-
тора в форме стоячей волны вводится квадратичная целевая функция
(
)
(7.41)
V = 0,5
ζ(G1 - G∗1)2 + (1 - ζ)G22
,
где 0 ≤ ζ ≤ 1 - выбранный при синтезе весовой коэффициент.
Алгоритм управления выводится на основе метода СГ. Для этого вычис-
ляется производная по времени функции (7.41)
V
(7.42)
=ζ(G1 -G∗1
G1 + (1 - ζ)G22,
где производные функций Gi в силу (7.37) имеют вид
(
)
Ġi = ε
-γGi + uT{H,Gi}
,
i = 1,2,
(7.43)
H=1/2(p1,q1,p2,q2)T, u = (u1,u2,u3,u4)T,
где u - вектор управления, {H, Gi} - вектор-столбец скобок Пуассона [169].
42
Для целевой функции (7.41) выводится следующий АСГ в конечной форме
(
})
(7.44)
u = -η
ζ(G1 - G∗1){H, G1} + (1 - ζ)G2
{H,G
,
2
где η > 0 - коэффициент усиления алгоритма управления.
Далее в [164, 165] выполнен анализ свойств замкнутой системы с АСГ, ис-
следовано влияние коэффициента усиления η на вид фазовых траекторий и
на расположение особых точек в пространстве (G1, G2), а также приведены
соотношения для выбора весового коэффициента ζ в (7.41), обеспечивающе-
го наибольшую степень затухания колебаний в зависимости от параметров
модели.
7.7. Управление асинхронными электродвигателями
Пуск асинхронного электродвигателя с короткозамкнутым ротором. Ста-
тья [170] посвящена задаче плавного пуска асинхронного электродвигателя
(АД) с короткозамкнутым ротором. Отмечена неудовлетворительная дина-
мика пусковых процессов АД, которая особенно сильно проявляется у элек-
троприводов с частыми пусками или работающих в повторно-кратковремен-
ном режиме. Для улучшения пусковых процессов АД можно использовать
устройство плавного пуска специальный пускатель на основе силовых по-
лупроводниковых приборов. В [170] предлагается закон управления плавным
пуском АД на основе метода СГ исходя из предположения, что при неизмен-
ной частоте питающего напряжения пусковое устройство способно изменять
его амплитуду с неограниченно большой скоростью.
Для описания процесса пуска в [170] используется следующая модель обоб-
щенной двухфазной электрической машины, записанная для системы коор-
динат x-y, вращающихся синхронно с вектором напряжения статора:
(7.45)
x = A(x) + B(x)u,
где
R
1
-
ψ1x +
R1 k2ψ2x + ω0ψ1y
L1
L1
R1
ψ1y +
R1 k2ψ2y + ω0ψ1x
1
L1
L
1
0
R2
(7.46)
A(x) =
,
B=
0
,
ψ2x +
R2 k1ψ1x + (ω0 - pω)ψ2y
L2
L2
0
R2
0
ψ2y +
R2 k1ψ1y - (ω0 - pω)ψ2x
L2
L2
1
(M - Mc)
J
[
]T
u=Um, x=
ψ1x ψ1y ψ2x ψ2y ω
- составляющие потокосцеплений статора
(индекс 1) и ротора (индекс 2); R1, R2, L1, L2 - соответственно активные со-
43
противления и полные индуктивности статора и ротора; ω0, ω - соответствен-
но частота вращения поля и частота вращения ротора; p - число пар полю-
сов; M = c(ψ1y ψ2x - ψ1xψ2y) - электромагнитный момент, развиваемый дви-
гателем; Mc - момент сопротивления; J - момент инерции электропривода;
k1 = Lm/L1; k2 = Lm/L2; Lm - индуктивность цепи намагничивания.
Поставлены две цели управления: стабилизация момента и стабилизация
модуля вектора потокосцепления. Первая цель направлена на минимизацию
пульсаций электромагнитного момента, а вторая - для исключения насыще-
ния магнитной системы. Эти цели управления выражены через локальный
целевой функционал
1(
)T
(
)
(7.47)
Q(x, t) =
y-y
H
y-y
,
2
[
]T
[
]T
где y =
21
- вектор регулируемых величин; y =
M ψ1∗2
- вектор
задающих воздействий; H - единичная матрица порядка 2; ψ21 = ψ21x + ψ21y -
квадрат модуля вектора потокосцепления статора; M, ψ1∗2 - соответственно
заданные значения электромагнитного момента и квадрата модуля вектора
потокосцепления статора.
Объект управления (7.46) аффинный по входу, поэтому АСГ в интеграль-
ной форме имеет вид
(
)
(7.48)
u=
-ΓB(x)TCTH(y - y)
dt,
где Γ = ΓT > 0, C =∂y(x)∂x - матрица Якоби для вектора регулируемых вели-
чин. С учетом (7.45), (7.47) выводится алгоритм управления
(
)
(7.49)
Um = -γ
1x21 - ψ∗21) - ψ2y(M - M)
dt,
в котором γ > 0 - выбранный коэффициент усиления.
В [170] проведено моделирование полученного алгоритма управления для
двигателя 4А80А4У3, результаты которого показали, что при использова-
нии алгоритма (7.49) временные зависимости электромагнитного момента и
модуля потокосцепления имеют гораздо меньшие пульсации, чем при пуске
прямым включением в сеть.
Приводится вывод алгоритма управления пусковым устройством и резуль-
таты компьютерного моделирования.
Управление многодвигательным электроприводом. Задача управления
многодвигательным асинхронным электроприводом рассматривается в [171].
При ее решении необходимо обеспечить согласование значений электромаг-
нитного момента, развиваемого каждым из n асинхронных двигателей (АД),
поддерживая на требуемом уровне величину суммарного момента MΣ. Кроме
того, требуется поддерживать значения каждого АД на заданном уровне.
44
В [171] используется следующая математическая модель АД, работающих
на один вал:
(7.50)
x = A(x,t) + B(x,t)u,
где x = col {x1, . . . , xi, . . . , xn} - вектор-столбец, составленный из векторов
[
]T
состояния каждого двигателя xi =
ψ1α,i1β,i2α,i2β,i
, i = 1,...,n,
ψ· - составляющие векторов потокосцепления статора и ротора, ω - угло-
[
]T
вая скорость ротора; ui =
u1,α,u1,β
- составляющие вектора напряжения,
подводимого к статору АД в неподвижной системе координат α-β (вектор
управления). Матрица A имеет блочную форму.
[
]
Вводится вектор рассогласования регулируемых величин
y(t) - y(t)
, от-
дельные компоненты которого определяются следующим образом:
[[
]]
[
]
piσiL12,i1β,iψ2α,i - ψ1α,iψ2β,i) - M∗i(t)
(7.51)
y(t) - y(t)
=
,
21α,i + ψ21β,i - ψ∗2 ]
1,i
где L1 = L12 + Lσ1, L2 = L12 + L2 - полные индуктивности статора и ротора
соответственно; σ = 1/(L1L2 - L212) - коэффициент рассеяния двигателя; p -
число пар полюсов; M - заданный электромагнитный момент двигателя.
Для синтеза алгоритма управления вводится локальный целевой функци-
онал
(
)T
(
)
(7.52)
Q(x, t) = 0,5
y(t) - y(t)
H
y(t) - y(t)
В результате применения СГ метода для целевого функционала (7.52) най-
дены выражения составляющих вектора напряжения на выходе преобразова-
теля частоты, необходимые для достижения поставленной цели управления.
Отмечено, что полученные выражения трудоемки в вычислительном отно-
шении, а также требуют информацию о составляющих векторов потокосцеп-
ления ротора каждого АД в режиме реального времени, поэтому применять
полученный АСГ на практике затруднительно. Чтобы избежать указанных
недостатков, в [171], следуя [172], принят ряд допущений, с учетом которых
закон управления моментом многодвигательного асинхронного электропри-
вода принимает вид:
(
(
)))
∫ (n
-Mi - M∗i
1,i|2 - ψ∗21,i
u = -γ
hi
ψ1β,i +
ψ1α,i
dt,
MHi
ψ2
i=1
1H,i
(
(
)))
∫ (n
-Mi - M∗i
1,i|2 - ψ∗21,i
(7.53)
u = -γ
hi
ψ1α,i +
ψ1β,i
dt.
MHi
ψ2
i=1
1H,i
Проверка работоспособности предложенного закона управления выпол-
нена компьютерным моделированием для взрывозащищенных асинхронных
электродвигателей ДКВ355L4, работающих на один вал и управляемых при
45
помощи одного преобразователя частоты. В результате исследований пока-
зано, что с применением закона (7.53) для многодвигательных асинхронных
электроприводов с групповым подключением двигателей к преобразователю
частоты можно добиться высокого качества управления суммарным момен-
том привода при разбросе параметров АД в широком диапазоне.
8. АСГ в задачах физики, биологии, экологии
В ряде задач управления природными системами возникает необходимость
изменить интенсивность колебательных процессов с целью создать или пода-
вить резонансные режимы. Цель управления при этом часто удобно перефор-
мулировать как управление энергией физической системы или, в более общем
случае, управление инвариантом ее свободного движения. АСГ с успехом при-
меняются в подобных ситуациях. В [173] исследуется возможность использо-
вания управления с обратной связью для изменения условий индуцированно-
го шумом перехода в модели из двух нелинейных уравнений, описывающих
работу преобразователя изображения “полупроводник-газоразрядный проме-
жуток” в переменных E - напряженность электрического поля в разрядном
промежутке устройства и N - плотность свободных носителей заряда в за-
зоре. Управление пропорционально напряжению источника питания. В ка-
честве целевой функции берется квадратичная форма отклонения состояния
системы от неустойчивого равновесия, а для управления используется АСГ
в конечной форме. Путем компьютерного моделирования установлено, что
достаточно слабое управление позволяет существенно снизить возможность
индуцированного шумом перехода , выводящего систему из области нормаль-
ного функционирования.
Аналогичные задачи возникают при управлении экологическими систе-
мами, где требуется отдалить осциллирующую траекторию от области, где
возможно вырождение популяции за счет исчезновения одного или несколь-
ких видов. Решение подобных задач облегчается, если у свободной системы
(при отсутствии управления) имеется инвариант - функция состояния систе-
мы, остающаяся постоянной вдоль движений свободной системы. Достаточно
широкий класс моделей таких систем может быть сведен к многовидовой си-
стеме Лотки-Вольтерра, управление которой СГ-методом рассматривалось
в [174]. Система описывается уравнениями
xi = xi(t)Si +
Mijxj(t), i = 1,... ,l,
j=1
(8.1)
xl = xl(t)Sl +
Mljxj(t) + ul(t), l = l,... ,m,
 ˙
j=1
где xi - переменные состояния, ui - управляющие воздействия, Si, Mij - па-
раметры системы (считается, что имеется m - l управляющих воздействий
и они прилагаются к последним m - l уравнениям системы. Известно, что
46
если у системы (8.1) при ui = 0 существует равновесие x = (x∗1, . . . , x∗m)T в
положительном ортанте:
(8.2)
x∗i = ni
> 0, i = 1, . . . , m,
то при выполнении условий
(8.3)
Mii = 0, Mij = -Mji
,
i, j = 1, . . . , m
функция
)
(xi
xi
(8.4)
Vqp(x) =
ni
- log
ni
ni
i=1
является инвариантом системы (8.1) при ul = 0, l = l + 1, . . . , m, l ≥ 1.
В [174] предложено брать в качестве цели управления достижение задан-
ной величины V∗qp, т.е.
(8.5)
Vqp(x(t)) → V∗qp
при t → ∞.
Задавая V∗qp, можно увеличивать или уменьшать желаемый размах колеба-
ний. Выбираем целевую функцию Q(x):
1
(
)2
(8.6)
Q(x) =
Vqp(x) - V∗qp
2
Получаем АСГ в конечной форме
(
)
(8.7)
ul(t) = -γl
Vqp(x) - V∗qp
(xl(t) - nl
),
где γl > 0, l = l, . . . , m, l ≥ 1 - коэффициенты усиления. В [174] показано,
что такой АСГ обеспечивает достижение цели.
В [175] метод СГ применен к назначению лечения синдрома поликистоз-
ных яичников (СПКЯ) (синдром Штейна-Левенталя) - одной из типичных
причин бесплодия, которым страдают около 10% женщин репродуктивно-
го возраста. Назначение лечения основано на использовании математической
модели, предложенной в [176] и представляющей собой систему из 13 нелиней-
ных дифференциальных уравнений первого порядка. Переменными состоя-
ния являются концентрации гормонов в гипофизе, в крови, массы фоллику-
лярной ткани в фазе роста, масса лютеинизирующих фолликулов, масса лю-
теиновой ткани, обусловленной фазой роста, концентрации эстрадиола, про-
гестерона и ингибина. Для определения нужного количества лекарства в [175]
применен АСГ в интегральной форме на основе локального целевого функ-
ционала в виде квадрата нормы разности переменных состояния пациентки
и здоровой женщины. Поскольку не все нужные переменные измеряются,
строится наблюдатель состояния, использующий операцию приближенного
дифференцирования.
47
Управление энергией на микроуровне при помощи АСГ было предложено
в качестве способа управления диссоциацией и изомеризацией молекулярных
систем [177-179]. В [177] изучается проблема управления изомеризацией в
классических ансамблях малых многоатомных нежестких молекул на приме-
ре системы LiNC/LiCN. Описаны и численно проанализированы два метода
управления изомеризацией в классическом ансамбле молекулярной системы
LiNC/LiCN, основанные на управлении полной энергией и изменении профи-
ля минимальной энергии для определенной “репрезентативной” молекулы.
Оба алгоритма управления разработаны с использованием принципа СГ. По-
казано, что разработанные алгоритмы управления достаточно эффективны
(примерно в два раза эффективнее, чем интенсивный равновесный нагрев).
В [180] метод скоростного градиента применен к синтезу управления на-
блюдаемыми в конечно-уровневых квантово-механических системах. Пока-
зано, что при выполнении условий типа невырожденности цель управления
достигается, если между начальным и целевым значениями наблюдаемой нет
ее собственных чисел. Показано, что погрешность достижения цели управле-
ния пропорциональна погрешности задания начального состояния системы и
погрешности реализации управляющего воздействия. Представлены числен-
ные результаты для задачи управления предиссоциацией молекулы фторво-
дорода (HF). В [181] предложена версия АСГ в комплексном пространстве с
ограничениями, которая была применена к синтезу алгоритмов селективно-
го управления наблюдаемыми квантово-механических систем. Показана воз-
можность достижения заданных значений энергии системы при ограничениях
на энергию подсистем и показано, что погрешность достижения цели управ-
ления пропорциональна погрешности задания начального состояния системы
и погрешности реализации управляющего воздействия. Представлены чис-
ленные результаты для задачи селективного управления энергией молекул
водорода (H2) с разными изотопами.
Алгоритм расчета классического внешнего поля для эффективного управ-
ления состоянием кубита с обратной связью получен в [182]. Подход ил-
люстрируется двухуровневой атомной системой (с распадом), управляемой
классическим оптическим полем. Аналитически и с помощью моделирова-
ния показано, что предложенный метод позволяет достичь желаемого состоя-
ния, выраженного как разность диагональных элементов матрицы плотности.
В [183] продемонстрирована возможность применения этого подхода к защи-
те запутанности (entaglement) от декогеренции в системе из двух кубитов при
наличии шума в квантовом канале связи. АСГ для перевода энергии в двух-
уровневой квантовой системе на заданный уровень с использованием в каче-
стве управления спектральной плотности некогерентных фотонов предложен
в [184]. В [185] дается общая формулировка метода скоростного градиента для
задачи генерации унитарных процессов в n-уровневых квантовых системах,
изолированных от окружения, и анализируется условие стабилизируемости
для АСГ в дифференциальной форме. Показано, что условие достижимости
в дифференциальной форме в этой задаче не выполняется, и делается вывод
о целесообразности исследования возможности применения АСГ в конечной
48
форме. Отметим, что аналогичная ситуация имеет место и в задаче управле-
ния энергией в классических гамильтоновых системах.
9. Метод СГ в задачах управления распределенными системами
В цикле работ [186-191] СГ метод применен для задач управления вол-
новыми процессами в системах с распределенными параметрами. Целевые
функции взяты как меры отклонения движений системы от локализованных
волн постоянной формы и скорости, которые поддерживают заданный уро-
вень энергии системы и соответствуют ее динамическому равновесному со-
стоянию. Разработаны АСГ распределенного управления с обратной связью
для локализации решений уравнения синус-Гордона в виде бризера и волны
огибающей. Во всех случаях достигнуто решение требуемой формы и скоро-
сти. Показано, что АСГ могут также обеспечить распространение требуемых
волн только в одном направлении. Исследовано поведение АСГ для разных
значений параметров начальных условий и показано, что алгоритм при этом
работает устойчиво.
9.1. АСГ локализации нелинейных волновых процессов
Более подробно приведем результаты [188] по построению АСГ для лока-
лизации нелинейных волновых процессов.
В [188] рассматривается одномерная цепочка, описываемая уравнением
синус-Гордона
(9.1)
xtt(r,t) - xrr
(r, t) + sin x(r, t) + u(r, t) = 0,
которое модифицировано введением распределенного управления u(r, t).
В цепочке (9.1) требуется получить желаемую бегущую волну x(r, t) в
виде “антикинка”, заданную уравнением
(
(
))
(
)
x(r,t) = π
1 - tanh
k(r - W t)
+ A sech2
k(r - W t - r1)
-
(
)
(9.2)
− B sech2
k(r - W t - r2)
,
где k, r1, r2, r1, r2 - начальные фазы, W - фазовая скорость. В отсутствие
управления (т.е. при u ≡ 0) процесс (9.2) не соответствует никакому аналити-
ческому решению уравнения (9.1).
Начальные условия в (9.1) взяты в виде
( (
))
1
x(r, 0) = 4 arctan exp
-√
(r - r0)
,
1-V2
(
)
r-r
0
2V sech
1-V2
(9.3)
xt(r,0) =
1-V2
49
Вводится следующая цель управления:
(9.4)
e(r, t) = x(r, t) - x
(r, t) → 0 при t → ∞.
Для применения СГ-метода в [188] используется локальный целевой функ-
ционал
1(
)2
(9.5)
Q(u) =
τet(r,t) + e(r,t)
,
2
в котором параметр τ > 0 служит для задания желаемой скорости убывания
рассогласования e(r, t) во времени. Действуя далее по схеме СГ, запишем:
(
)
(9.6)
Qt = (τet + e)
τ (xrr - sin x - u) + . . .
,
где . . . обозначает не зависящие от u слагаемые. Вычисляя согласно СГ ме-
тоду функцию w(r, t) =∂Qt(u)∂u , получим АСГ вида
(
)
(9.7)
u(r, t) = γ
τet(r,t) + e(r,t)
,
в котором параметр γ > 0 - коэффициент усиления алгоритма.
Численные исследования в [188] выполнены при V = 0,95, k = 0,5, A = 3,
B = 1,5, r0 = 0, r1 = -1, r2 = 2, W = 1,1, γ = 40, τ = 1,25. Как показывают
результаты моделирования, по истечении некоторого времени, цель управле-
ния (9.2) выполняется, а управляющее воздействие затухает.
9.2. Управление энергией одномерной распределенной цепочки
с помощью АСГ в скользящем режиме
Применение метода СГ для управления энергией и оценивания состоя-
ния распределенных одномерных цепочек показано в [192-195] (управление и
оценивание через граничные условия) и [196-198] (управление, распределен-
ное по пространственной координате). В отличие от большинства имеющихся
публикаций в этих работах ставится цель управления, направленная не толь-
ко на снижение, но и на увеличение энергии объекта управления, что име-
ет важное значение для вибрационных технологий, генерирования волновых
колебаний в радиолокационных и лазерных системах и в других приложени-
ях [74, 145, 199]. Рассмотрим некоторые результаты подробнее.
Управление и оценивание через граничные условия. Задача граничного
управления энергией для класса полулинейных гиперболических дифферен-
циальных уравнений в частных производных изучается в [193], где приводит-
ся ее решение на основе гладкого и разрывного АСГ для нелинейной системы
Клейна-Гордона.
Рассмотрена одномерная цепочка, описываемая нелинейным уравнением
Клейна-Гордона с указанными начальными и граничными условиями
(
)
(9.8)
xtt(t,r) - kxrr(t,r) + Π
x(t, r)
= 0, t ≥ 0, r ∈ [0, 1],
(9.9)
x(0, r) = x0(r), xt(0, r) = x1
(r),
(9.10)
x(t, 0) = 0, xr
(t, 1) = u(t),
(
(
))
y(t) =
xt(t,1),H
x(t)
,
50
где Π ∈ C1(R) - неотрицательная функция, k > 0 - заданный параметр, u(t) -
управляющий вход, y(t) - выход, x0, x1 : [0, 1] → R - заданные функции и
1
)
(x2t
x2
r
(9.11)
H(x) =
+k
+ Π(x)
dr
2
2
0
- гамильтониан уравнения (9.8), который рассматривается как энергия си-
стемы (9.8) в момент времени t.
Ставится задача нахождения закона управления u(t), обеспечивающего
выполнение цели управления
(
)
(9.12)
H
x(t)
→H,
где x(t) - решение (9.8)-(9.10), H ≥ 0 - заданное значение.
Синтез управления выполняется по методу СГ. Для этого вводится целевая
функция
(
)2
(
)
1
(
)
Q1
x(t)
=
H
x(t)
-H
2
как мера разности между текущим и заданным значениями энергии. Диф-
(
)
ференцируя Q1
x(t)
по времени вдоль решений (9.8)-(9.10), получим
(
d
(
)
(
)
(
)
Q1
x(t)
= H
x(t)
-H
xtxtt + kxrxrt + Π(x)xt
dr.
dt
0
(
)
Подстановкой xtt = kxrr(t, r) - Π
x(t, r)
(согласно (9.8)), интегрированием
слагаемого xrxrt по частям и с учетом того, что из (9.9) следует xt(t, 0) = 0,
получим
(
)
d
(
)
(
)
w(t, u) ≡
Q1
x(t)
= H
x(t)
- H ku(t)xt(t,1).
dt
Метод СГ приводит к закону управления
(
)
(
)
(9.13)
u(t) = -γψ H
x(t)
-H xt
(t, 1),
где γ > 0 - скалярный коэффициент усиления, ψ : R → R - функция, удовле-
творяющая условию псевдоградиентности ψ(s)s > 0 для всех s = 0 и ψ(0) = 0
(см. (2.7)). При ψ(s) = sign(s) получается разрывный (“релейный”) закон
управления
(
)
(
)
(9.14)
u(t) = -γ sign H
x(t)
-H xt
(t, 1),
(
)
(
)
который соответствует целевой функции Q2
x(t)
= |H
x(t)
- H|.
51
В [193] показано, что при H(0) > 0 разрывный АСГ (9.14) приводит си-
стему к любому заранее заданному ненулевому уровню энергии за конеч-
ное время, в то время как гладкий (непрерывный) АСГ обеспечивает толь-
ко асимптотическую сходимость. В статье приводятся результаты модели-
рования системы (9.8)-(9.10), (9.13) c ψ(s) = s, Π(x) = βx, β = 0,2, κ = 2,
(
k = 0,12, γ = 0,25, x0(r) = µ
1 - cos(2πr)), x1(r) ≡ 0 для µ = 0,05 и µ = 2,5,
H = 5 и H = 20, согласующиеся с теоретическими выводами.
Исследование наблюдателя типа Луенбергера (Luenberger) для распреде-
ленной одномерной цепочки синус-Гордона выполнено в [195], где получены
явные ограничения на параметры системы, обеспечивающие экспоненциаль-
ное затухание ошибки оценивания. В основу синтеза наблюдателя положен
метод СГ.
Рассматривается следующее уравнение синус-Гордона:
(9.15)
xtt(t,r) - kxrr
(t, r) + β sin x(t, r) = 0, t ≥ 0, r ∈ [0, 1],
(9.16)
x(0, r) = x0(r), xt(0, r) = x1
(r),
(9.17)
x(t, 0) = 0, xr
(t, 1) = u(t),
(9.18)
y(t) = xt
(t, 1),
где k > 0, β - заданные параметры; u(t) - управляющий вход; y(t) - изме-
ряемый выход; x0, x1 : [0, 1] → R - заданные функции.
Синтез наблюдателя состояния для системы (9.15)-(9.18) выполняется в
[195] при предположении, что измеряется только переменная y(t) = xt(t, 1)
(а также известен сигнал управления u(t), который вырабатывается регуля-
тором). По аналогии с [200, 201] вводится следующий наблюдатель состояния
луенбергерского типа:
(9.19)
xtt(t, r) - kxrr
(t, r) + β sin x(t, r) = 0, t ≥ 0, r ∈ [0, 1],
(9.20)
x(0, r) = x0(r),
xt(0, r) = x1(r),
(
)
(9.21)
x(t, 0) = 0,
xr(t, 1) = u(t) + α
y(t) - xt(t, 1)
,
где x(t, r) служит оценкой состояния x(t, r) системы (9.15), α > 0 - выбирае-
мый при синтезе коэффициент усиления.
Обоснование сходимости процесса наблюдения выполнено в [195] с ис-
пользованием СГ метода. Для этого вводится ошибка оценивания e(t, r) =
= x(t,r) - x(t,r) и квадратичный (“энергетический”) целевой функционал
1
(
)
E(t) =1
e2t + ke2r
dr. Решена задача нахождения параметров k, β, α на-
2
0
блюдателя (9.19)-(9.21), гарантирующих экспоненциальное убывание E(t).
С использованием наблюдателя (9.19)-(9.21) для управления энергией си-
стемы синус-Гордона по измеряемому выходу цепочки методом СГ находится
обратная связь, имеющая вид
(
)
(
)
(9.22)
u(t) = -γψ H
x(t)
-H
y(t).
52
В [195] показано, что время переходного процесса по энергии близко к
времени процесса по ошибке наблюдения, тем самым основную роль в пе-
реходном режиме играет процесс оцеивания состояния. Также показано, что
условия, налагаемые на коэффициент усиления наблюдателя, достаточные
для сходимости ошибки оценки состояния, “почти” необходимы в том смыс-
ле, что нарушение этих условий делает переходные процессы ошибки оценки
состояния слишком затянутыми.
Управление, распределенное по пространственной координате. Следуя
[202], рассмотрим задачу управления энергией цепочки, заданной волновым
уравнением
(9.23)
xtt(r,t) = xrr(r,t) - ρxt
(r, t) + u(r, t),
где x = x(r, t) - состояние объекта; t - время; r ∈ (0, 1) - пространственная пе-
ременная; u(r, t) - распределенное по пространству управление; ρ ≥ 0 - пара-
метр диссипации. Заданы следующие граничные условия Дирихле: x(0, t) =
= 0, x(1, t) = 0.
Полная энергия цепочки находится из выражения
1
(
)
1
(9.24)
E(xr, xt) =
(xt)2 + (xr)2
dr.
2
0
Ставится задача управления энергией - обеспечение предельного соотно-
шения
(9.25)
lim
E(xr(t), xt(t)) = E
t→∞
при заданном постоянном значении энергии E ≥ 0.
Выведем АСГ, решающий поставленную задачу. Введем целевую функцию
(согласно СГ-методу - “локальный целевой функционал”)
1(
)2
(9.26)
V (t) =
E(xr, xt) - E
2
Вычислим производную от целевой функции (9.26) по времени в силу си-
стемы. Получим
1
(
)
(9.27)
w(x, u) ≡V =
E(xr, xt) - E (uγ - ρxt)xt
du.
0
Выберем функцию ψ(x, u), удовлетворяющую условию псевдоградиентно-
сти ψ(x, u)Tuw(x, u) ≥ 0 в виде (2.9), т.е. примем ψ(x, u) = γxt sign(x, u).
Отсюда следует АСГ в релейной форме
(
)
(9.28)
u(xr, xt) = -γxt sign
E(xr, xt) - E
53
Проверим выполнение условия достижимости (2.10). Поскольку
1
V
≤ -(γ - ρ) ×
E(xr(t),xt(t)) - E
xt2 dr ≤ 0,
0
то при γ > ρ энергия E(xr(t), xt(t)) под управлением предложенного алгорит-
ма стремится к E и, следовательно, цель управления достигается.
В [202] проведено моделирование процесса управления энергией при зна-
чениях параметров ρ = 1, γ = 10, E = 10 и начальном состоянии x(r, 0) =
(
)7
=A
1 - cos(2πr)
, xt(r,0) = 0, демонстрирующее достижение поставленной
цели как для случая A = 10-3 (начальная энергия меньше заданной), так и
для A = 0,02 (начальная энергия больше заданной).
Работа [197] посвящена численной оценке эффективности алгоритмов СГ,
разработанных в [196, 202] для управления энергией пространственно-распре-
деленных систем синус-Гордона с несколькими внутренними параметрами и
доменными приводами. Влияние квантования по уровню сигнала управле-
ния с обратной связью по состоянию (возможно, связанного с временной дис-
кретизацией) на установившуюся ошибку энергии и устойчивость замкнутой
системы исследуются путем моделирования. Учитываются следующие типы
квантования: квантование сигнала управления по времени дискретизации,
квантование уровня для управления, непрерывное во времени; квантование
сигнала управления по уровню совместно с временной дискретизацией; пере-
дача управляющего сигнала по двоичному каналу связи с инвариантным во
времени кодером первого порядка; передача сигнала управления по двоично-
му каналу связи с кодером первого порядка и масштабированием по времени;
передача управляющего сигнала по двоичному каналу связи с адаптивным
кодером первого порядка.
10. Принцип скоростного градиента в динамике физических процессов
В монографии [25] предложено использовать метод СГ для вывода зако-
нов динамики физических систем. Оказывается, известные и новые уравне-
ния движения ряда физических систем могут быть выведены как АСГ при
соответствующем выборе структуры уравнения объекта и целевой функции.
В физике подобные постановки рассматриваются на основе вариационных
принципов построения моделей систем. По аналогии можно сформулировать
“Вариационный принцип скоростного градиента” (ВПСГ): среди всех возмож-
ных движений в системе реализуются лишь те, для которых входные пере-
менные изменяются пропорционально скоростному градиенту от некоторого
“целевого” функционала Qt.
Как показано в [25], применяя ВПСГ, можно получить ряд классических
уравнений механики и физики. Кроме того, принцип позволяет получить за-
коны динамики для новых задач, некоторые из которых перечислены ниже.
В [203] предложено применять ВПСГ для построения моделей и предсказания
54
переходных процессов в системах, установившееся движение которых подчи-
няется принципу максимума энтропии (принципу Гиббса-Джейнса). Вычис-
лительный эксперимент по проверке ВПСГ на примере прогнозирования с
его помощью динамики процессов в методе частиц описан в [204].
Новая концепция высокоскоростных процессов в твердых телах разрабо-
тана в [205, 206] c использованием нелокальной теории неравновесного пе-
реноса и метода скоростного градиента. В разработанной теории общая ин-
тегральная зависимость напряжения от деформации в зависимости от ско-
рости деформации и длительности внешнего импульса описывает как реак-
цию упругой среды на внешнюю нагрузку, так и переход к пластическому
течению. Модель показывает разницу между ударным нагружением и непре-
рывным, которая растет с увеличением скорости нагружения. Построенная
на интегральном соотношении модель упруго-пластической ударной волны,
изменяющей свою форму при распространении вдоль материала, способна
описать весь комплекс экспериментально наблюдаемых закономерностей, ко-
торые не могут быть объяснены в рамках традиционной механики сплошных
сред.
В [207-209] предложены новые уравнения, описывающие динамику неста-
ционарных процессов максимизации и минимизации различных энтропийных
функционалов: энтропий Шеннона, Цаллиса, Реньи, относительной энтропии
Кульбака-Лейблера (Kullback-Liebler), Бурга (Burg), энтропии Кресси-Рида
(Cressie-Read) и других. Исследуются единственность и устойчивость пре-
дельного распределения вероятностей при ограничениях сохранения массы и
энергии. Предлагаемые уравнения позволяют просто прогнозировать дина-
мику сложных неравновесных систем.
Применение СГ принципа к неравновесным распределенным системам
вдали от термодинамического равновесия исследовано в [21]. Обсуждаются
варианты применения принципа СГ для описания процессов неравновесного
переноса в реальных средах. Исследование эволюции неравновесной систе-
мы на различных масштабных уровнях с помощью принципа СГ позволяет
по-новому взглянуть на проблемы термодинамики, связанные с поведени-
ем энтропии системы. Предлагаются обобщенные динамические уравнения
для конечного и бесконечного числа ограничений. Показано, что стационар-
ное решение уравнений, вытекающее из принципа СГ, полностью совпадает
с локально равновесной функцией распределения, полученной Д.Н. Зубаре-
вым [210]. Предлагается новый подход к описанию временной эволюции си-
стем, далеких от равновесия, основанный на применении принципа СГ на про-
межуточном масштабном уровне внутренней структуры системы. Обсужда-
ется проблема высокоскоростного сдвигового течения вязкой жидкости вбли-
зи жесткой плоской пластины. Показано, что принцип СГ позволяет строить
замкнутые математические модели неравновесных процессов.
В [211] исследуется взаимосвязь между структурой GENERIC (общее
уравнение для неравновесной обратимо-необратимой связи, англ. - general
equation for the quilibrium reversible-irreversible coupling), возникшей в нерав-
новесной термодинамике, и принципом СГ. GENERIC известен как общая
55
структура для различных уравнений эволюции во времени для неравновес-
ных систем. Рассмотрены несколько примеров применения СГ-принципа и по-
казано его соответствие рамкам GENERIC. Результат [211] также может быть
использован для демонстрации того, как соотносятся уравнения Фоккера-
Планка и принцип СГ. Развитый подход распространен на квантовомехани-
ческие системы применительно к задаче максимизации энтропии фон Ней-
мана [212].
11. Модификации и обобщения АСГ
11.1. Модификации АСГ
За полвека существования АСГ подвергались различным модификациям
и обобщениям. В [213] предложена версия АСГ для систем с запаздывани-
ем. Для постановки задачи и для доказательства используются функцио-
налы Ляпунова-Красовского. Например, в задаче адаптивной стабилизации
линейного объекта с запаздыванием по состоянию для синтеза алгоритма
адаптации используется функционал
t
(
)
J
xt(s)
= 0,5xTHx + xT(s)Kx(s) ds ,
t-τ
где xt(s) = {x(t + s)}, s ∈ [t - τ, t], τ - запаздывание, H, K - положительно
определенные матрицы. При этом алгоритм адаптации имеет тот же вид, что
и для систем без запаздывания.
В [18] предложены алгоритмы, названные “алгоритмами скоростной раз-
ности” (АСР), позволяющие ослабить обычное для АСГ условие выпуклости.
В [18] доказан следующий результат.
Пусть объект управления описывается уравнениями
(11.1)
x = F(x,v,t),
(11.2)
v = Φ(x,v,t),
где x∈ RN , u, v - скаляры, t ≥ 0. Пусть для нее выполнены стандартные усло-
вия применимости АСГ, см. раздел 2.1 и [18, 25]. Тогда алгоритм управления
(11.3)
u = u(x,v,t) =
(
))
0Q(x,v,t) - ∂0Q(x,U,t)
Ψ
x,v,-γ0(v - U(x,t)
1
+ ∂0U(x,v,t)
v-U
при v = U,
=
(
))
(
)
Ψ
x,v,-γ0(v - U(x,t)
1
0Q(x,U,t)
+ ∂0U(x,v,t)
∂v
при v = U,
(
)
(
)
где ∂0U(x, v, t) = ∂/∂t
U(x,t)
+∂/∂x
U(x,t)
F (x, v, t), γ0 > 0, γ1 > 0, обес-
печивает ограниченность траекторий системы (11.1), (11.2) и достижение це-
(
)
(
)
лей управления Q
x(t), t
→ 0, v(t) - U
x(t), t
→ 0.
56
Предложены также схемы итеративного синтеза алгоритмов управления,
для АСГ и для АСР, аналогичные известным схемам бэкстеппинга [14]. В кни-
ге [25] представлены обобщения АСГ на объекты управления, описываемые
неявно заданными уравнениями F (x, x, θ, t), объекты, заданные дифференци-
ально-алгебраическими уравнениями, а также стохастические объекты, опи-
сываемые стохастическими дифференциальными уравнениями Ито. Рассмот-
рены АСГ с коэффициентом усиления, зависящим от времени и от состояния
объекта, в частности АСГ с Γ(t), изменяющимся по алгоритмам, аналогич-
ным алгоритму фильтра Калмана.
11.2. Дискретизация АСГ
Цифровая (компьютерная) реализация алгоритмов управления ставит во-
прос о сохранении свойств непрерывной динамической системы при дискрет-
ном (sampled data) алгоритме управления. Вопросы дискретизации линейных
и нелинейных систем рассматривались во многих работах. Применительно к
алгоритмам скоростного градиента сошлемся на результат, сформулирован-
ный в [25, теорема 5.5]. Пусть объект
(11.4)
x = F(x,θ,t) + f(t),
где f(t) - ограниченное возмущение, управляется дискретизованным регуля-
ризованным АСГ
θ(t) = θ(tk) при θ(tk) ≤ θ(t) < θ(tk+1),
(
(
)
(
))
(11.5)
θ(tk+1) = θ(tk) - γk γ∇θw
x(tk), θ(tk)
θ(tk) -θ
Если система (11.4), управляемая непрерывным алгоритмом скоростного
градиента
(
)
(
)
(11.6)
θ(t) = γ∇θw
x(t), θ(t)
θ(t) -θ
экспоненциально диссипативна, то при дискретизации алгоритма управления
с достаточно малыми шагами γk система сохраняет предельную диссипатив-
ность при γk → 0 и оценка предельного множества приближается к оцен-
ке предельного множества для непрерывной системы. В [25] предложена и
дискретизованная версия АСГ с зоной нечувствительности [25, теорема 5.6].
В этом случае условие экспоненциальной диссипативности не выполняется,
применимость АСГ обеспечивается введением в алгоритм “памяти”, предот-
вращающей возникновение нежелательных скользящих режимов.
11.3. Неевклидовы алгоритмы скоростного градиента
Идея связать переменность матрицы коэффициентов усиления в АСГ с пе-
ременностью метрики в пространстве состояний объекта или в пространстве
57
настраиваемых параметров (управлений) имеет далеко идущее развитие. По-
видимому, впервые она возникла в [25, Приложение 4], где введена функция
Ляпунова
(11.7)
V (x, θ, t) = Q(x, t) + 0,5(θ - θ)TR(x, t)(θ - θ
).
Метрическая матрица R(x, t) в (11.7) симметрична, положительно опреде-
лена и определяет вид расширенного “неевклидова” АСГ
(11.8)
R(x, t)θ = -∇Q -R(θ - θ
),
R=∂R(x,t)/∂t+∂R(x,t)/∂xF(x,θ,t).
где
В работе Н. Боффи и Ж.Ж. Слотина [214] получен целый ряд новых
“неевклидовых” алгоритмов управления, оценивания, адаптации, обучения на
основе функций Ляпунова, в которых используется так называемая дивер-
генция Брэгмана [215], введенная Л.М. Брэгманом в 1967 г. и получившая в
последние годы многочисленные применения в различных областях приклад-
ной математики. По заданной гладкой функции ϕ(θ) дивергенция Брегмана
dϕ|θ) определяется следующим образом:
(
(11.9)
dϕ|θ) = ϕ(θ) - ϕ(θ) -
∇ϕ(θ))T
− θ).
Для строго выпуклых функций ϕ(θ) дивергенция dϕ|θ) также строго вы-
пукла и dϕ|θ) > 0 при θ = θ. Дивергенция от положительно определенной
квадратичной формы совпадает с ней самой.
В [214] новые алгоритмы типа АСГ строятся на основе замены стандартной
функции Ляпунова
(11.10)
V (x, θ, t) = Q(x, t) + 0,5(θ - θ)TΓ-1(θ - θ
),
используемой для обоснования АСГ в дифференциальной форме (2.14), на
функцию
(11.11)
V (x, θ, t) = Q(x, t) + dϕ
|θ).
Стандартные вычисления приводят к алгоритму управления/адаптации вида
(
)-1
(11.12)
θ=-
2ϕ
θ
Выбор неквадратичных функций φ(θ) открывает новые возможности для
модификаций и обобщения АСГ, соответствующие введению в пространстве
управлений или настраиваемых параметров неевклидовой (римановой) мет-
рики. Например, функцию ϕ(θ) можно рассматривать как барьерную функ-
цию, ограничивающую траектории в пространстве настраиваемых парамет-
ров, и выбирать ее по заданному множеству Θ допустимых значений θ, чтобы
исключить сложнореализуемое проектирование на Θ.
58
Новый класс алгоритмов это конечно-дифференциальные неевклидовы
АСГ
d
(
)
(
)-1
(11.13)
θ + ψ(x,t)
=-
2ϕ(θ)
θ
dt
для заданной ограниченной вектор-функции ψ(x, t). Для их обоснования ис-
пользуется функция Ляпунова
(11.14)
V (x, θ, t) = Q(x, t) + dϕ
|θ - ψ(x, t)).
Новый, расширенный класс функций Ляпунова можно назвать функциями
Ляпунова-Брэгмана. В [214] рассмотрены расширения АСГ, получающиеся
при включении в функцию Ляпунова дивергенций от различных функций,
приводящие к новым классам алгоритмов, в том числе высших порядков.
11.4. АСГ для нелинейно параметризованных систем
Начиная с самых первых результатов [7, 24] условия применимости АСГ
допускали нелинейную параметризацию объекта управления, иногда встре-
чающуюся в приложениях. При этом требовалась выпуклость по θ скорости
изменения целевой функции w(x, θ, t). В дальнейшем эти результаты были
расширены [216-218] для различных классов нелинейно параметризованных
систем адаптивного управлении. Были разработаны различные модифика-
ции для случаев выпуклой и вогнутой параметризации. В работах [127, 129]
и др. развит метод “погружения и инвариантности” (Immersion &Invariance,
I&I), в рамках которого глобальная сходимость устанавливается при выпол-
нении некоторого условия типа монотонности. В [219] на основе аналогичного
подхода решается задача идентификации системы. В [220] вводится условие
монотонности, которое по существу идентично условиям, необходимым для
обучения обобщенных линейных моделей в машинном обучении и статисти-
ке, и позволяет разработать устойчивые алгоритмы адаптивного управления
для нелинейно параметризованных систем в этих условиях. Эти результаты
можно обобщить и далее на основе функций Ляпунова-Брэгмана. Подобные
обобщения подробно рассмотрены в [214, 221, 222], где получаемые алгорит-
мы названы “естественными” (natural) алгоритмами адаптации.
12. Заключение
В статье представлены основные положения и результаты применения ме-
тода скоростного градиента. Показано, что это полезный и эффективный ин-
струмент для решения широкого спектра инженерных задач, подтвержда-
ющий, что он ¾обеспечивает прозрачный компромисс между характеристи-
ками управления и проектными параметрами¿ [17]. На протяжении более
чем 40 лет существования СГ-метод используется многими авторами, кото-
рые применяют его для решения широкого круга задач в различных обла-
стях. В течение последнего десятилетия возрос интерес к методу скорост-
ного градиента и как к эффективному инструменту для понимания законов
59
природы, таких как динамика экологических систем или фундаментальные
законы физики. Недавние исследования [214] показывают, что метод может
служить мостиком между теорией управления и областью машинного обуче-
ния, вскрывающим общность многих подходов в этих областях. Однако есть
и недостаточно изученные вопросы, такие как сходимость АСГ при наличии
ограничений и при вырождении условия достижимости.
СПИСОК ЛИТЕРАТУРЫ
1.
Цыпкин Я.З. Адаптация, обучение и самообучение в автоматических систе-
мах // АиТ. 1966. № 1. С. 23-61.
2.
Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука,
1968.
3.
Петров Б.Н., Рутковский В.Ю., Крутова И.Н., Земляков С.Д. Принципы по-
строения и проектирования самонастраивающихся систем. М.: Машинострое-
ние, 1972.
4.
Lindorff D.P., Carroll R.L. Survey of Adaptive Control Using Liapunov Design //
Int. J. Control. 1973. No. 5. P. 897-914.
5.
Landau I.D. A Survey of Model Reference Adaptive Techniques - Theory and Ap-
plications // Automatica. 1974. Jan. Vol. 10. No. 4. P. 353-379.
6.
Asher R., Andrisani D., Dorato P. Bibliography on Adaptive Control Systems //
Proc. IEEE. 1976. Aug. Vol. 64. No. 8. P. 1226-1240.
7.
Фрадков А.Л. Схема скоростного градиента и ее применение в задачах адап-
тивного управления // АиТ. 1979. № 9. С. 90-101.
Fradkov A.L. A Scheme of Speed Gradient and its Application in Problems of
Adaptive Control // Autom. Remote Control. 1980. Vol. 40. No. 9. P. 1333-1342.
8.
Андриевский Б.Р., Стоцкий А.А., Фрадков А.Л. Алгоритмы скоростного гра-
диента в задачах управления и адаптации // АиТ. 1988. № 12. С. 3-39.
Andriievskii B.R., Stotskii A.A. Fradkov A.L. Velocity Gradient Algorithms in Con-
trol and Adaptation // Autom. Remote Control. 1988. Vol. 49. No. 12. P. 1533-1564.
9.
Фрадков А.Л. Схема скоростного градиента в задачах адаптивного управле-
ния // Сб. тр. 9-й Всесоюзной школы-семинара по адаптивным системам.
Алма-Ата: КазПТИ, 1979. С. 139-143.
10.
Неймарк Ю.И. Автоматные модели управления и адаптации // Сб. тр. 9-й
Всесоюзной школы-семинара по адаптивным систмам. Алма-Ата: КазПТИ,
1979. С. 107-110.
11.
Красовский А.А. Оптимальные алгоритмы в задаче идентификации с адаптив-
ной моделью // АиТ. 1976. № 12. С. 75-82.
Krasovskii A.A. Optimal Algorithms in the Problem of Identification with an Adap-
tive Model // Autom. Remote Control. 1976. Vol. 37. No. 12. P. 1851-1857.
12.
Неймарк Ю.И. Динамические системы и управляемые процессы. M.: Наука,
1978.
13.
Jurdjevic V., Quinn J.P. Controllability and Stability // J. Different. Equat. 1978.
June. Vol. 28. No. 3. P. 381-389.
14.
Sepulchre R., Janković M., Kokotović P.V. Constructive Nonlinear Control. New
York: Springer-Verlag, 1997.
60
15.
Фрадков А.Л. Методы адаптивного управления в системных исследованиях //
Всесоюзная школа “Прикладные проблемы управления макросистемами”. Те-
зисы докладов (Всесоюзная школа “Прикладные задачи управления макроси-
стемами”. Тезисы докладов). M.: ВНИИСИ, 1985.
16.
Фрадков А.Л. Интегродифференцирующие алгоритмы скоростного градиен-
та // Докл. АН СССР. 1986. Т. 286. № 4. С. 832-835.
17.
Jordán M., Bustamante J. A Speed-Gradient Adaptive Control With State/Dis-
turbance Observer for Autonomous Subaquatic Vehicles // Proc. 45th IEEE Conf.
Decision Control, CDC 2006. 2006. P. 2008-2013.
18.
Дружинина М.В., Фрадков А.Л. Алгоритмы скоростного градиента и скорост-
ной разности в задаче нелинейного управления: Пошаговый синтез // Диффе-
ренциальные уравнения. 1994. Т. 30. № 11. С. 1861-1867.
19.
Fradkov A.L. Cybernetical Physics: From Control of Chaos to Quantum Control.
Berlin-Heiderlberg: Springer-Verlag, 2007.
20.
Селиванов А.А. Динамика процессов максимизации квантовой энтропии в ко-
нечноуровневых системах // Вестник СПбГУ. Математика. Механика. Астро-
номия. 2011. Т. 44. № 4. С. 71-79.
21.
Khantuleva T., Shalymov D. Modelling Non-Equilibrium Thermodynamic Systems
from the Speed-Gradient Principle // Philosophical Transactions of the Royal Soci-
ety A: Mathematical, Physical and Engineering Sciences. 2017. Vol. 375. No. 2088.
22.
Khantuleva T., Shalymov D. Evolution of Complex Equilibrium Systems Based on
Extensive Statistical Mechanics // IFAC-PapersOnLine.
2018. Vol. 51. No. 33.
P. 175-179.
23.
Plotnikov S.A., Lehnert J., Fradkov A.L., Schöll E. Adaptive Control of Synchro-
nization in Delay-Coupled Heterogeneous Networks of Fitzhugh-Nagumo Nodes //
Int. J. Bifurcation and Chaos. 2016. Vol. 26. No. 04.
24.
Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамиче-
скими объектами. М.: Наука, Гл. ред. физ-мат лит-ры, 1981.
25.
Фрадков А.Л. Адаптивное управление в сложных системах: беспоисковые ме-
тоды. М.: Наука, Гл. ред. физ-мат лит-ры, 1990.
26.
Fradkov A.L., Pogromsky A.Y. Speed-Gradient Control of Chaotic Continuous-
Time Systems // IEEE Trans. Circuits Syst. I. 1996. Vol. 43. No. 11. P. 907-913.
27.
Fradkov A.L., Pogromsky A.Y. Introduction to Control of Oscillations and Chaos.
Singapore: World Scientific Publishers, 1998. 391 p.
28.
Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное
управление сложными динамическими системами. СПб.: Наука, 2000.
29.
Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического
управления с примерами на языке Matlab. СПб.: Наука, 1999. 467 с.
30.
Андриевский Б.Р., Бобцов А.А., Фрадков А.Л. Методы анализа и синтеза нели-
нейных систем управления. М., Ижевск: Ин-т компьютерных исследований,
2018.
31.
Dolgopolik M., Fradkov A.L. Nonsmooth and Discontinuous Speed-Gradient Algo-
rithms // Nonlinear Analysis: Hybrid Systems. 2017. Vol. 25. P. 99-113.
32.
Поляк Б.Т. Введение в оптимизацию. М.: Наука, Гл. ред. физ-мат лит-ры, 1983.
33.
Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука,
1977.
34.
Dolgopolik M., Fradkov A.L. Speed-Gradient Control of the Brockett Integrator //
SIAM J. Control Optim.
2016. Vol. 54. No. 4. P. 2116-2131.
61
35.
Dolgopolik M.V., Fradkov A.L. Finite-Differential Nonsmooth Speed-Gradient Con-
trol: Stability, Passivity, Robustness // SIAM J. Control Optim. 2021. (in press).
36.
Льюнг Л. Идентификация систем. Теория для пользователя / Под. ред.
Я.З. Цыпкина. М.: Наука. Гл. ред. физ.-мат. лит., 1999.
37.
Peaucelle D., Fradkov A.L. Robust Adaptive L2-Gain Control of Polytopic MIMO
LTI Systems - LMI results // Syst. Control. Lett. 2008. Vol. 57. P. 881-887.
38.
Полушин И.Г., Фрадков А.Л., Хилл Д. Пассивность и пассификация нелиней-
ных систем (обзор) // АиТ. 2000. № 3. С. 3-37.
Polushin I.G., Fradkov A.L., Khill D.D. Passivity and Passification of Nonlinear
Systems // Autom. Remote Control. 2000. Vol. 61. No. 3. P. 355-388.
39.
Kalman R.E. When is a Linear Control System Optimal? // Trans. ASME Ser. D:
J. Basic Eng. 1964. Vol. 86. P. 1-10.
40.
Красовский А.А. Задачи аналитического конструирования регуляторов при за-
данной работе управлений и управляющих сигналов // АиТ. 1969. № 7. С. 7-17.
Krasovsky A.A. Generalization of Problem of Constructing Regulators at Set Func-
tioning of Controls and Controlling Signals // Autom. Remote Control. 1970.
Vol. 30. No. 7. P. 1023-1031.
41.
Krasovski A.A. A New Solution to the Problem of a Control System Analytical
Design // Automatica. 1971. Vol. 7. P. 45-50.
42.
Moylan P.J., Anderson B.D.O. Nonlinear Regulator Theory and an Inverse Optimal
Control Problem // IEEE Trans. Automat. Contr. 1973. Vol. 18. P. 460-465.
43.
Luo W., Chu Y.-C., Ling K.-V. Inverse Optimal Adaptive Control for Attitude
Tracking of Spacecraft // IEEE Trans. Automat. Contr. 2005. Vol. 50. No. 11.
P. 1639-1654.
44.
Krstic M. Inverse Optimal Adaptive Control - The Interplay Between Update Laws,
Control Laws, and Lyapunov Functions // Proc. American Control Conf.
2009.
P. 1250-1255.
45.
Коган М.М. Решение некоторых обратных вариационных задач минимаксного
управления нелинейными системами // АиТ. 1999. № 1. С. 9-19.
Kogan M.M. Solution of Some Inverse Variational Problems of the Minimax Control
of Nonlinear Systems // Autom. Remote Control. 1999. Vol. 60. No. 1. P. 6-14.
46.
Зубов В.И. Теория оптимального управления. Л.: Судостроение, 1966.
47.
Коган М.М., Неймарк Ю.И. Адаптивное локально-оптимальное управление //
АиТ. 1987. № 8. С. 126-136.
48.
Коган М.М. Локально-минимаксное и минимаксное управления линейными
дискретными системами // АиТ. 1997. № 11. С. 33-44.
Kogan M.M. Local Minimax and Minimax Control of Linear Discrete System//
Autom. Remote Control. 1997. Vol. 58. No. 11. P. 1732-1741.
49.
Фрадков А.Л. Квадратичные функции Ляпунова в задаче адаптивной стаби-
лизации линейного динамического объекта // Сиб. мат. журн.
1976.
№ 2.
С. 436-446.
50.
Земляков С.Д., Рутковский В.Ю. О синтезе самонастраивающейся системы
управления с эталонной моделью // АиТ. 1966. № 3. С. 70-77.
51.
Земляков С.Д., Рутковский В.Ю. Обобщенные алгоритмы адаптации одного
класса беспоисковых самонастраивающихся систем с моделью // АиТ.
1967.
Т. 28. № 6. С. 88-94.
52.
Landau Y.D. Adaptive Control: The Model Reference Approach. New York: Marcel
Dekker, 1979.
62
53.
Фрадков А.Л. Синтез адаптивной системы стабилизации линейного динамиче-
ского объекта // АиТ. 1974. № 12. С. 96-103.
Fradkov A.L. Synthesis of Adaptive System of Stabilization of Linear Dynamic
Plants // Autom. Remote Control. 1974. Vol. 35. No. 12. P. 1960-1966.
54.
Andrievsky B., Fradkov A.L. Implicit Model Reference Adaptive Controller Based
On Feedback Kalman-Yakubovich Lemma // Proc. IEEE Intern. Conf. on Control
and Applications (CCA’94), Glasgow, UK, 24-26 Aug. 1994. Vol. 2. IEEE, 1994.
P. 1171-1174.
55.
Андриевский Б.Р., Фрадков А.Л. Метод пассификации в задачах адаптивного
управления, оценивания и синхронизации // АиТ. 2006. № 11. С. 3-37.
Andrievskii B.R., Fradkov A.L. Method of Passification in Adaptive Control, Es-
timation, and Synchronization // Autom. Remote Control. 2006. Vol. 67. No. 11.
P. 1699-1731.
56.
Андриевский Б.Р., Селиванов А.А. Новые результаты по применению метода
пассификации. Обзор // АиТ. 2018. № 6. С. 3-48.
Andrievskii B.R., Selivanov A.A. New Results on the Application of the Passifica-
tion Method. A Survey //Autom. Remote Control. 2018. Vol. 79. No. 6. P. 957-995.
57.
Ioannou P., Kokotovic P. Instability Analysis And Improvement of Robustness of
Adaptive Control // Automatica. 1984. Vol. 20. No. 5. P. 583-594.
58.
Hsu L., Costa R. Variable Structure Model Reference Adaptive Control Using Only
Input and Output Measurements: Part 1 // Int. J. Control. 1989. Vol. 49. No. 2.
P. 399-416.
59.
Narendra K.S., Kudva P. Stable Adaptive Schemes for System Identification and
Control - Part I // IEEE Trans. Syst., Man, Cybern. 1974. Vol. SMC-4. No. Nov.
P. 542-551.
60.
Shiriaev A., Fradkov A.L. Stabilization of Invariant Sets for Nonlinear Non-Affine
Systems // Automatica. 2000. Vol. 36. No. 11. P. 1709-1715.
61.
Fradkov A.L. A Nonlinear Philosophy for Nonlinear Systems // Proc. IEEE Conf.
Decision and Control, CDC 2000. Vol. 5. 2000. P. 4397-4402.
62.
Fradkov A.L., Andrievsky B. Singular Perturbation Analysis of Energy Control
Systems // J. Vibration and Control. 2006. Vol. 12. No. 4. P. 331-353.
63.
Aracil J., Fradkov A.L., Gordillo F. Speed-Gradient Algorithms for Underactuat-
ed Nonlinear Systems // IFAC Proceedings Volumes (IFAC-PapersOnline). 2005.
Vol. 16. P. 842-847.
64.
Григоренко Н.Л. Задача управления с доминирующей неопределенностью //
Тр. ИММ УрО РАН. 2013. Т. 19. № 4. С. 64-72.
65.
Fradkov A.L. Feedback Resonance in Nonlinear Oscillators // Proc. European Con-
trol Conf., ECC 1999. 2015. P. 3599-3604.
66.
Polushin I., Fradkov A.L., Putov V., Rogov K. Energy Control of One-Degree-Of-
Freedom Oscillators in Presence of Bounded Force Disturbances // Proc. European
Control Conf., ECC 1999. 2015. P. 3440-3445.
67.
Fradkov A.L., Stotsky A. Speed Gradient Adaptive Control Algorithms for Mechan-
ical Systems // Int. J. Adaptive Control Signal Processing. 1992. Vol. 6. No. 3.
P. 211-220.
68.
Дунская Н.В., Пятницкий Е.С. Стабилизация управляемых механических и
электромеханических систем // АиТ. 1988. № 12. С. 40-51.
Dunskaya N.V., Pyatnitskii E.S. Stabilization of mechanical and electromechanical
systems // Autom. Remote Control. 1988. Vol. 49. No.12. P. 1565-1574.
63
69.
Ortega R., Spong M.W. Adaptive Motion Control of Rigid Robots: A Tutorial //
Automatica. 1989. Vol. 25. P. 877-888.
70.
Slotine J., Li W. On The Adaptive Control of Robot Manipulators // Int. J. Robot.
Res. 1987. Vol. 6. No. 3. P. 49-59.
71.
Slotine J., Li W. Applied Nonlinear Control. Englewood Cliffs, NJ: Prentice-Hall,
1990.
72.
Fradkov A.L. Nonlinear Adaptive Control: Regulation-Tracking-Oscillations //
IFAC Proceedings Volumes.
1994. Vol. 27. No. 11. P. 385-390. IFAC Work-
shop on New Trends in Design of Control Systems. Smolenice, Slovak Repub-
lic, 7-10 September. URL: https://www.sciencedirect.com/science/article/
pii/S1474667017476804.
73.
Fradkov A.L. Swinging Control of Nonlinear Oscillations // Int. J. Control. 1996.
Vol. 64. No. 6. P. 1189-1202.
74.
Андриевский Б.Р., Гузенко П.Ю, Фрадков А.Л. Управление нелинейными ко-
лебаниями механических систем методом скоростного градиента // АиТ. 1996.
№ 4. С. 4-17.
Andrievskii B.R., Guzenko P.Yu., Fradkov A.L. Control of Nonlinear Oscillation in
Mechanic Systems by the Steepest Gradient Method // Autom. Remote Control
1996. Vol.57. No. 4. P. 456-467.
75.
Fradkov A.L., Makarov I.A., Shiriaev A.S., Tomchina O. P. Control of Oscillations
in Hamiltonian Systems // Proc. European Control Conf., ECC’97. 1997. P. 1243-
1248.
76.
Fradkov A.L., Miroshnik I., Nikiforov V. Nonlinear and Adaptive Control of Com-
plex Systems. Dordrecht: Kluwer, 1999.
77.
Andrievsky B., Fradkov A.L. Feedback Resonance in Single and Coupled 1-DOF
Oscillators // Int. J. Bifurcation and Chaos in Applied Sciences and Engineering.
1999. Vol. 9. No. 10. P. 2047-2057.
78.
Kumon M., Washizaki R., Sato J., et al. Controlled Synchronization of Two 1-DOF
Coupled Oscillators // IFAC Proceedings Volumes (IFAC-PapersOnline).
2002.
Vol. 15. No. 1. P. 109-114.
79.
Acosta J., Gordillo F., Aracil J. Swinging Up the Furuta Pendulum By the Speed
Gradient Method // Proc. European Control Conf., ECC 2001. 2001. P. 469-474.
80.
Acosta J., Aracil J., Gordillo F. Nonlinear Control Strategies for the Furuta Pen-
dulum // Control and Intelligent Systems. 2001. Vol. 29. No. 3. P. 101-107.
81.
Gordillo F., Acosta J., Aracil J. A New Swing-Up Law for the Furuta Pendulum //
Int. J. Control. 2003. Vol. 76. No. 8. P. 836-844.
82.
Ludvigsen H., Shiriaev A., Egeland O. Stabilization of Stable Manifold of Upright
Position of the Spherical Pendulum // Modeling, Identification and Control. 2001.
Vol. 22. No. 1. P. 3-14.
83.
Shiriaev A., Fradkov A.L. Stabilization of Invariant Sets for Nonlinear Systems with
Applications to Control of Oscillations // Int. J. Robust and Nonlinear Control.
2001. Vol. 11. No. 3. P. 215-240.
84.
Shiriaev A., Egeland O., Ludvigsen H., Fradkov A.L. VSS-Version of Energy-Based
Control for Swinging Up a Pendulum // Syst. Control Lett.
2001. Vol. 44. No. 1.
P. 45-56.
85.
Andrievsky B. Computation of The Excitability Index For Linear Oscillators //
Proc. 44th IEEE Conf. Decision and Control, and the European Control Conf.,
CDC-ECC ’05. Vol. 2005. 2005. P. 3537-3540.
64
86.
Jordän M., Bonitatibus J. Speed-Gradient Control With Non-Linearity in The Pa-
rameters For A Chaotic Colpitts Oscillator // Proc. Int. Conf. on Physics and
Control, PhysCon 2005. Vol. 2005. 2005. P. 266-271.
87.
Kennedy M. Chaos in the Colpitt’s Oscillator // IEEE Trans. Circuits Syst. I.
1994. Vol. 41. No. 11. P. 771-774.
88.
Fradkov A., Andrievsky B., Boykov K. Control of the Coupled Double Pendulums
System // Mechatronics. 2005. Vol. 15. No. 10. P. 1289-1303.
89.
Lehnert J., Hövel P., Flunkert V., et al. Adaptive Tuning of Feedback Gain in
Time-Delayed Feedback Control // Chaos. 2011. Vol. 21. No. 4.
90.
Semenov D., Fradkov A.L. Adaptive Synchronization of Two Coupled Non-Identical
Hindmarsh-Rose Systems by the Speed Gradient Method // IFAC-PapersOnLine.
2018. Vol. 51. No. 33. P. 12-14.
91.
Fradkov A.L., Lashkov S., Andrievsky B. Energy Synchronization of Pendulum
Mechanisms // Proc. 5th Int. Conf. on Control, Automation, Robotics and Vision,
ICARCV 2018. 2018. P. 1257-1262.
92.
Seifullaev R., Plotnikov S. Attractor Estimates for an Energy-Controlled Pendu-
lum in Presence of Irregular Bounded Disturbance // IFAC-PapersOnLine. 2018.
Vol. 51. No. 33. P. 132-137.
93.
Seifullaev R., Fradkov A., Liberzon D. Energy Control of a Pendulum With Quan-
tized Feedback // Automatica. 2016. Vol. 67. P. 171-177.
94.
Fradkov A.L., Usik E., Andrievsky B. Simple Energy Control in Frenkel-Kontorova
Model // Advanced Structured Materials. Switzerland: Springer Nature, 2019.
Vol. 103. P. 209-222.
95.
Zhang F.-F., Liu S.-T., Yu W.-Y. Modified Projective Synchronization With Com-
plex Scaling Factors of Uncertain Real Chaos and Complex Chaos // Chinese
Physics B. 2013. Vol. 22. No. 12.
96.
Zhang F., Liu S. Adaptive Complex Function Projective Synchronization of Uncer-
tain Complex Chaotic Systems // J. Comput. Nonlinear Dynam.. 2016. Vol. 11.
No. 1.
97.
Fradkov A., Andrievsky B. Singular Perturbations of Systems Controlled by Energy-
Speed-Gradient Method // Proc. IEEE Conf. Decision and Control, CDC 2004.
Vol. 4. 2004. P. 3441-3446.
98.
Yao J., Guan Z.-H., Hill D.J., Wang H.O. On Passivity and Impulsive Control
of Complex Dynamical Networks with Coupling Delays // Proc. 44th IEEE Conf.
Decision and Control and the European Control Conf. 2005. P. 1595-1600.
99.
Yu W., DeLellis P., Chen G., et al. Distributed Adaptive Control of Synchronization
in Complex Networks // IEEE Trans. Automat. Contr.
2012. Vol. 57. No. 8.
P. 2153-2158.
100.
Джунусов И.А., Фрадков А.Л. Адаптивная синхронизация сети взаимосвязан-
ных нелинейных систем Лурье // АиТ. 2009. № 7. С. 111-126.
Dzhunusov I.A., Fradkov A.L. Adaptive Synchronization of a Network of Intercon-
nected Nonlinear Lur’e Systems // Autom. Remote Control. 2009. Vol. 70. No. 7.
P. 1190-1205.
101.
Selivanov A., Lehnert J., Dahms T., et al. Adaptive Synchronization in Delay-
Coupled Networks of Stuart-Landau Oscillators // Physical Review E - Statistical,
Nonlinear, and Soft Matter Physics. 2012. Vol. 85. No. 1.
102.
Tomchin D., Tomchina O., Fradkov A.L. Controlled Passage Through Resonance
for Flexible Vibration Units // Mathematical Problems in Engineering.
2015.
Vol. 2015. 8 p.
65
103.
Gorlatov D., A.Tomchin D., Tomchina O. Controlled Passage through Resonance
for Two-Rotor Vibration Unit: Influence of Drive Dynamics // IFAC-PapersOnLine.
2015. Vol. 48. No. 11. P. 313-318.
104.
Fradkov A.L., Tomchina O., Tomchin D., Gorlatov D. Time-Varying Observer of
The Supporting Body Velocity for Vibration Units // IFAC-PapersOnLine. 2016.
Vol. 49. No. 14. P. 18-23.
105.
Fradkov A.L., Gorlatov D., Tomchina O., Tomchin D. Control of Oscillations in
Vibration Machines: Start Up and Passage Through Resonance // Chaos.
2016.
Vol. 26. No. 11.
106.
Boikov V., Andrievsky B., Shiegin V. Experimental Study of Unbalanced Rotors
Synchronization of the Mechatronic Vibration Setup // Cybernetics and Physics.
2016. Vol. 5. No. 1. P. 5-11.
107.
Bartkowiak R. Controlled Synchronization at The Existence Limit for an Excited
Unbalanced Rotor // Int. J. Non-Linear Mechanics. 2017. Vol. 91. P. 95-102.
108.
Плотников С.А., Фрадков А.Л., Шепелявый А.И. Метод скоростного градиента
в обратной задаче Стокера для синхронной электрической машины // Вестник
СПбГУ. Математика. Механика. Астрономия. 2018. Т. 5 (63). № 1. С. 111-118.
109.
Plotnikov S., Shepeljavyi A. Energy Control of Electric Machine: Inverse Stoker
Problem // IFAC-PapersOnLine. 2018. Vol. 51. No. 33. P. 22-26.
110.
Roozegar M., Mahjoob M., Ayati M. Adaptive Estimation of Nonlinear Parameters
of a Nonholonomic Spherical Robot Using a Modified Fuzzy-based Speed Gradient
Algorithm // Regular and Chaotic Dynamics. 2017. Vol. 22. No. 3. P. 226-238.
111.
Fradkov A.L., Andrievsky B. Passification-Based Robust Flight Control Design //
Automatica. 2011. Vol. 47. No. 12. P. 2743-2748.
112.
Боднер В.А. Системы управления летательными аппаратами. М.: Машино-
строение, 1973. 698 с.
113.
Буков В.Н. Адаптивные прогнозирующие системы управления полетом. М.:
Наука, 1987. 230 с.
114.
Ефремов А.В., Захарченко В.Ф., Овчаренко В.Н., Суханов В.Л. Динамика по-
лета: учебник для студентов высших учебных заведений / Под. ред. Г.С. Бюш-
генса. М.: Машиностроение, 2011.
115.
Andrievsky B.R., Churilov A., Fradkov A. Feedback KAlman-YAkubovich LEmma
and its Applications to Adaptive Control // Proc. 35th IEEE Conf. Dec. Contr.
Kobe, Japan: 1996. P. 4537-4542.
116.
Fradkov A.L. Adaptive Stabilization for Minimum-Phase Multi-Input Plants With-
out Output Derivatives Measurement // Physics-Doklady. 1994. Vol. 39. No. 8.
P. 550-552.
117.
Iwai Z., Mizumoto I. Robust and Simple Adaptive Control Systems // Int. J. Con-
trol. 1992. Vol. 55. P. 1453-1470.
118.
Kaufman H., Bar-Kana I., Sobel K. Direct Adaptive Control Algorithms. New
York: Springer Verlag, 1994.
119.
Bar-Kana I. Adaptive Control Can Robustify Uncertain Control systems // Proc.
American Control Conf., ACC 1994. Baltimore, Maryland: 1994. June. P. 63-67.
120.
Amelin K., Andrievsky B., Tomashevich S., Fradkov A.L. Data Exchange with
Adaptive Coding between Quadrotors in a Formation // Autom. Remote Control.
2019. Vol. 80. No. 1. P. 150-163.
121.
Furtat I., Fradkov A.L., Peaucelle D. Robust Control of Aircraft Lateral Move-
ment // IFAC Proceedings Volumes (IFAC-PapersOnline). 2014. Vol. 19. P. 5199-
5204.
66
122.
Hsu C., Lan E. Theory of Wing Rock // J. Aircraft. 1985. Vol. 22. P. 920-924.
123.
Ng T., Malcolm G., Lewis L. Experimental Study of Vortex Flows Over Delta Wings
in Wing-Rock Motion // AIAA paper 89-2187-CP. 1989.
124.
Ng T., Ong L., Suarez J., Malcolm G. Wing Rock Suppression Using Forebody
Vortex Control // Proc. 9th Applied Aerodynamics Conf. Baltimore, MD, USA.
AIAA, 1991. 23-25 September. art. No. A91-53745.
125.
Katz J. Wing/Vortex Interactions and Wing Rock // Progress in Aerospace Sci-
ences. 1999. Vol. 35. P. 727-750.
126.
Lee K., Ghorawat P., Singh S. Wing Rock Control by Finite-Form Adaptation //
J. Vibration and Control. 2016. Vol. 22. No. 11. P. 2687-2703.
127.
Astolfi A., Ortega R. Immersion And Invariance: A New Tool for Stabilization and
Adaptive Control of Nonlinear Systems // IEEE Trans. Automat. Contr.
2003.
Vol. 48. No. 4. P. 590-606.
128.
Lee K., Singh S. Noncertainty-Equivalent Adaptive Wing-Rock Control via Cheby-
shev Neural Network // J. Guidance, Control, and Dynamics. 2014. Vol. 37. No. 1.
P. 123-133.
129.
Liu X., Ortega R., Su H., Chu J. Immersion and Invariance Adaptive Control of
Nonlinearly Parameterized Nonlinear Systems // IEEE Trans. Automat. Contr.
2010. Vol. 55. No. 9. P. 2209-2214.
130.
Andrievsky B., Kudryashova E., Kuznetsov N., et al. Suppression of Nonlinear
Wing-Rock Oscillations by Adaptive Control with the Implicit Reference Model //
AIP Conf. Proc. 2018. Vol. 2046.
131.
Andrievsky B., Kudryashova E., Kuznetsov N., Kuznetsova O. Aircraft Wing Rock
Oscillations Suppression by Simple Adaptive Control // Aerospace Sci. Technology.
2020. Oct. Vol. 105.
132.
Zribi M., Alshamali S., Al-Kendari M. Suppression of the Wing-Rock Phenomenon
Using Nonlinear Controllers // Nonlinear Dynamics.
2013. Vol. 71. No. 1-2.
P. 313-322.
133.
Kori D., Kolhe J., Talole S. Extended State Observer Based Robust Control of
Wing Rock Motion // Aerospace Sci. Technology. 2014. Vol. 33. No. 1. P. 107-117.
134.
Tewari A. Nonlinear Optimal Control of Wing Rock Including Yawing Motion //
Proc. AlAA Guidance, Navigation, and Controls Conf. Denver, U.S.A.: 2000.
Aug. 14-17. Paper No. AIAA-2000-4251.
135.
Malekzadeh M., Khosravi A., Rasouli H., Noei A. Wing Rock Suppression via Back-
stepping Controller // Proc. 2015 2nd Int. Conf. Knowledge-Based Engineering and
Innovation (KBEI-2015), Tehran, Iran. IEEE, 2016. P. 792-796.
136.
Andrievsky B., Kudryashova E., Kuznetsov N. et al. Simple Adaptive Control of
Aircraft Roll Angle, Suppressing the Wing Rock Oscillations // Mathem. Engineer.
Sci. Aerospace. 2019. Vol. 10. No. 3. P. 373-386.
137.
Sobel K., Kaufman H., Mabius I. Implicit Adaptive Control for a Class of MIMO
Systems // IEEE Trans. Aerosp. Electron. Syst. 1982. Vol. 18. P. 576-589.
138.
Iwai Z., Mizumoto I. Robust and Simple Adaptive Control Systems // Int. J. Con-
trol. 1992. Vol. 55. P. 1453-1470.
139.
Barkana I. Adaptive Control? But is so Simple!: A Tribute to the Efficiency, Simplic-
ity and Beauty of Adaptive Control // J. Intelligent and Robotic Systems: Theory
and Applications. 2016. Vol. 83. No. 1. P. 3-34.
140.
Andrievsky B., Fradkov A., Peaucelle D. Adaptive Control Experiments for LAAS
“ Helicopter” Benchmark // Proc. Int. Conf. on Physics and Control, PhysCon 2005.
2005. P. 760-765.
67
141.
Andrievsky B., Peaucelle D., Fradkov A.L. Adaptive Control of 3DOF Motion for
LAAS Helicopter Benchmark: Design and Experiments // Proc. American Control
Conf., ACC 2007. 2007. P. 3312-3317.
142.
Andrievsky B., Kudryashova E., Kuznetsov N., et al. Simple Adaptive Control for
Airfoil Flutter Suppression // Mathem. Engineer. Sci. Aerospace.
2018. Vol. 9.
No. 1. P. 5-20.
143.
Chen C.-L., Peng C.C., Yau H.-T. High-Order Sliding Mode Controller With Back-
stepping Design for Aeroelastic Systems // Commun. Nonlinear Sci. Numerical Sim-
ulation. 2012. Vol. 17. No. 4. P. 1813 - 1823. URL: http://www.sciencedirect.
com/science/article/pii/S1007570411005028.
144.
Abdelkefi A., Vasconcellos R., Nayfeh A., Hajj M. An Analytical and Experimental
Investigation into Limit-Cycle Oscillations of an Aeroelastic System // Nonlinear
Dynamics. 2013. Vol. 71. No. 1-2. P. 159-173.
145.
Andrievsky B., Guzenko P.Y. Energy Speed-Gradient Control of Nonlinear Satellite
Oscillations // Cybernetics and Physics.
2014. Vol. 3. No. 1. P. 9-15. URL:
http://lib.physcon.ru/doc?id=e7ac7c9cefa5.
146.
Meehan P.A., Asokanthan S.F. Analysis of Chaotic Instabilities in a Rotating Body
With Internal Energy Dissipation // Int. J. Bifurc. Chaos. 2006. Jan. Vol. 16. No. 1.
P. 1-19.
147.
Shahov E.M. Oscillations of Probe Satellite Towed by Non-Stretched Thread in
Heterogeneous Atmosphere // Appl. Math. and Mech. 1988. Vol. 52. No. 4. P. 567-
572.
148.
Beletsky V.V., Levin E.M. Dynamics of Space Tethered Systems. San Diego: Am.
Astronautical Soc., 1993.
149.
Druzhinina M., Stefanopoulou A., Moklegaard L. Speed Gradient Approach to Lon-
gitudinal Control of Heavy-Duty Vehicles Equipped With Variable Compression
Brake // IEEE Trans. Contr. Syst. Technol. 2002. Vol. 10. No. 2. P. 209-220.
150.
Kolmanovsky I., Druzhinina M., Sun J. Speed-Gradient Approach to Torque and
Air-To-Fuel Ratio Control in DISC Engines // IEEE Trans. Contr. Syst. Technol.
2002. Vol. 10. No. 5. P. 671-678.
151.
Jordán M., Bustamante J. A Totally Stable Adaptive Control for Path Tracking
of Time-Varying Autonomous Underwater Vehicles // IFAC Proceedings Volumes
(IFAC-PapersOnline). 2008. Vol. 41. No. 2. P. 15985-15990.
152.
Fossen T. Guidance and Control of Ocean Vehicles. Chichester, UK: John Wiley
& Sons, 1994.
153.
Kreuzer E., Pinto F. Controlling the Position of a Remotely Operated Underwater
Vehicle // App. Math. Comp. 1996. Vol. 78. P. 175-185.
154.
Jordán M., Bustamante J. An Adaptive Control System for Perturbed Rovs in
Discrete Sampling Missions with Optimal-Time Characteristics // Proc. IEEE Conf.
Decision and Control, CDC 2007. 2007. P. 1300-1305.
155.
Dyda A., Os’kin D. Underwater Robot Intelligent Control Based on Multilayer
Neural Network // IFAC Proceedings Volumes (IFAC-PapersOnline). 2010. Vol. 43.
No. 20. P. 179-183.
156.
Oskin D., Dyda A. Underwater Robot Intelligent Control Based on Multilayer Neu-
ral Network // Proc. 2013 IEEE 7th Int. Conf. on Intelligent Data Acquisition and
Advanced Computing Systems, IDAACS 2013. Vol. 2. 2013. P. 921-924.
157.
Dyda A., Oskin D., Dyda P. An Application of Speed Gradient Method to Neural
Network Control for Underwater Robot // CEUR Workshop Proc. Vol. 1623. 2016.
P. 689-700.
68
158.
Fossen T.I. Marine Control Systems: Guidance, Navigation and Control of Ships,
Rigs and Underwater Vehicles. Trondheim, Norway: Marine Cybernetics, 2002.
ISBN: 82-92356-00-2.
159.
Дыда А.А. Адаптивное и нейросетевое управление сложными динамическими
объектами. Владивосток: Дальнаука, 2007. ISBN: 9785804408115.
160.
Pchelkina I., Fradkov A.L. Combined Speed-Gradient Controlled Synchronization of
Multimachine Power Systems // IFAC Proceedings Volumes (IFAC-PapersOnline).
2013. Vol. 46. No. 12. P. 59-63.
161.
Lastire E., Alanis A., Sanchez E. Inverse Optimal Neural Control with Speed Gra-
dient for a Power Electric System With Changes in Loads // Proc. 9th Int. Conf.
on Electrical Engineering, Computing Science and Automatic Control, CCE 2012.
2012.
162.
Alanis A., Lastire E., Arana-Daniel N., Lopez-Franco C. Inverse Optimal Control
with Speed Gradient for A Power Electric System Using a Neural Reduced Model //
Mathematical Problems in Engineering. 2014. Vol. 2014.
163.
Furtat I., Tergoev N., Tomchina O., et al. Speed-Gradient-Based Control of Power
Network: Case Study // Cybernetics and Physics. 2016. Vol. 5. No. 3. P. 85-90.
164.
Gavrilenko A., Merkuryev I., Podalkov V. Algorithms for the Control of Oscillations
of the Wave Solid-State Gyroscope Resonator // Proc. 15th Saint Petersburg Int.
Conf. on Integrated Navigation Systems, ICINS 2008. 2008. P. 34-36.
165.
Мартыненко Ю.Г., Меркурьев И.В., Подалков В.В. Управление нелинейными
колебаниями вибрационного кольцевого микрогироскопа // Изв. РАН. МТТ.
2008. № 3. С. 77-89.
166.
Putty M., Najafi K. A Micromachined Vibrating Ring Gyroscope // Proc. Digest,
Solid-State Sensors and Actuators Workshop, Hilton Head, SC. 1994. P. 213-220.
167.
Ayazi F., Najafi K. A HARPSS Polysilicon Vibrating Ring Gyroscope // J. Micro-
electromechanical System. 2001. Vol. 10. No. 2. P. 169-179.
168.
Боголюбов Н.Н., Митропольский Ю.А. Асимптотические методы в теории
нелинейных колебаний. М.: Наука. Гл. ред. физ.-мат. лит., 1974.
169.
Ландау Л.Д., Лифшиц Е.М. Теоретическая физика: Учеб. пособие. В 10-ти т.
4-е изд., испр. М.: Наука. Гл. ред. физ.-мат. лит., 1988. Т. I. Механика.
170.
Каширских В.Г., Завьялов В.М., Переверзев С.С. Формирование алгоритма
управления плавным пуском асинхронного электродвигателя на основе метода
скоростного градиента // Вестник КузГТУ. 2005. № 2. С. 7-9.
171.
Семыкина И.Ю., Завьялов В.М., Глазко М.А. Градиентное управление мно-
годвигательным асинхронным электроприводом // Изв. Томского политехн.
ун-та. 2009. Т. 315. № 4. С. 65-69.
172.
Завьялов В.М. Снижение динамических нагрузок в трансмиссиях горных ма-
шин. Кемерово: КузГТУ, 2008.
173.
Astrov Y., Fradkov A.L., Guzenko P. Control of a Noise-Induced Transition in a
Nonlinear Dynamical System // Physical Review E - Statistical, Nonlinear, and
Soft Matter Physics. 2008. Vol. 77. No. 2.
174.
Pchelkina I., Fradkov A.L. Control of Oscillatory Behavior of Multispecies Popula-
tions // Ecological Modelling. 2012. Vol. 227. P. 1-6.
175.
Saito H., Ohmori H. Control of an Abnormal Human Menstrual Cycle in PCOS
by Speed Gradient Algorithm // SICE Annual Conf. 2011, Tokyo, Japan.
2011.
Sep. 13-18. P. 1436-1441.
69
176.
Selgrade J. F. Bifurcation Analysis of a Model for Hormonal Regulation of The Men-
strual Cycle // Mathematical Biosciences. 2010. Vol. 225. No. 2. P. 108-114. URL:
https://www.sciencedirect.com/science/article/pii/S0025556410000350.
177.
Efimov A., Ananyevskiy M., Borondo F., et al. Control of Isomerization In Ensem-
bles of Nonrigid Molecules Based on Classical and Quantum-Mechanical Models,
LiCN // Proc. 20th European Conf. Modelling and Simulation: Modelling Method-
ologies and Simulation Key Technologies in Academia and Industry, ECMS 2006.
2006. P. 495-500.
178.
Efimov A., Borondo F., Benito R. Control of Isomerization in Classical Ensembles
of Nonrigid Molecular Systems, LiCN // Proc. Int. Conf. on Physics and Control,
PhysCon 2005. Vol. 2005. 2005. P. 933-938.
179.
Ananjevsky M.S., Vetchinkin A., Sarkisov O., et al. Quantum Control of Dissocia-
tion of an Iodine Molecule by One and Two Femtosecond Laser Pulses Excitation //
Proc. 2005 International Conf. Physics and Control, 2005., St. Petersburg, Russia.
IEEE, 2005. P. 636-641.
180.
Ананьевский М.С., Фрадков А.Л. Управление наблюдаемыми в конечноуров-
невых квантовомеханических системах // АиТ. 2005. № 5. С. 63-75.
Anan’evskii M.S., Fradkov A.L. Control of the Observables in the Finite-Level
Quantum Systems // Autom. Remote Control. 2005. Vol. 66. No. 5. P. 734-745.
181.
Ананьевский М.С. Селективное управление наблюдаемыми в ансамбле кванто-
вомеханических молекулярных систем // АиТ. 2007. № 8. С. 32-43.
Anan’evskii M. Selective Control of the Observables in the Ensemble of Quantum
Mechanical Molecular Systems // Autom. Remote Control. 2007. Vol. 68. No. 8.
P. 1322-1332.
182.
Borisenok S., Fradkov A.L., Proskurnikov A. Speed Gradient Control of Qubit
State // IFAC Proceedings Volumes (IFAC-PapersOnline).
2010.
Vol.
4.
No. PART 1. P. 81-85.
183.
Alaubaidy M.N. Quantum Entanglement Recovery Using Speed Gradient over Noisy
Quantum Channels // Journal of Critical Reviews. 2020. Vol. 7. No. 6. P. 1012-
1020. http://www.jcreview.com/?mno=104261. URL: http://www.jcreview.
com/?mno=104261.
184.
Pechen A., Borisenok S. Energy Transfer in Two-Level Quantum Systems via
Speed Gradient-Based Algorithm // IFAC-PapersOnLine. 2015. Vol. 48. No. 11.
P. 446-450.
185.
Печень А.Н. О методе скоростного градиента для генерации унитарных кван-
товых операций в замкнутых квантовых системах // УМН. 2016. Т. 71. № 3
(429). С. 205-206.
186.
Porubov A., Fradkov A.L., Andrievsky B. Feedback Control for Some Solutions
of the Sine-Gordon Equation // Applied Mathematics and Computation.
2015.
Vol. 269. P. 17-22.
187.
Porubov A., Fradkov A.L., Andrievsky B., Bondarenkov R. Feedback Control of the
Sine-Gordon Antikink // Wave Motion. 2016. Vol. 65. P. 147-155.
188.
Porubov A., Andrievsky B. Control Methods for Localization of Nonlinear Waves //
Philosophical Transactions of the Royal Society A: Mathematical, Physical and
Engineering Sciences. 2017. Vol. 375. No. 2088.
189.
Porubov A., Bondarenkov R., Bouche D., Fradkov A. Two-Step Shock Waves Prop-
agation for Isothermal Euler Equations // Appl. Math. Comput. 2018. Vol. 332.
P. 160-166.
70
190.
Porubov A., Antonov I., Indeitsev D., Fradkov A.L. Mechanical System Allowing
Distributive Control with Feedback // Mechanics Research Communications. 2018.
Vol. 93. P. 124-127.
191.
Porubov A., Antonov I., Fradkov A.L. Boundary Control of Nonlinear Strain Waves
in Di-Atomic Crystal Layer // Wave Motion. 2019. Vol. 91.
192.
Dolgopolik M., Fradkov A.L., Andrievsky B. Boundary Energy Control of the Sine-
Gordon Equation // IFAC-PapersOnLine. 2016. Vol. 49. No. 14. P. 148-153.
193.
Dolgopolik M., Fradkov A.L., Andrievsky B. Boundary Energy Control of a System
Governed by The Nonlinear Klein-Gordon Equation // Mathematics of Control,
Signals, and Systems. 2018. Vol. 30. No. 1.
194.
Dolgopolik M., Fradkov A.L. Energy Tracking for the Sine-Gordon Equation with
Dissipation via Boundary Control // Proc. European Control Conf., ECC 2018.
2018. P. 3025-3030.
195.
Dolgopolik M., Fradkov A., Andrievsky B. Observer-Based Boundary Control of the
Sine-Gordon Model Energy // Automatica. 2020. Vol. 113.
196.
Orlov Y., Fradkov A.L., Andrievsky B. Energy Control of Distributed Parameter
Systems via Speed-Gradient Method: Case Study of String and Sine-Gordon Bench-
mark Models // Int. J. Control. 2017. Vol. 90. No. 11. P. 2554-2566.
197.
Andrievsky B., Orlov Y. Numerical Evaluation of Sine-GOrdon Chain Energy Con-
trol via Subdomains State Feedback under Quantization and Time Sampling //
Cybernetics and Physics. 2019. Vol. 8. No. 1. P. 18-28.
198.
Orlov Y., Fradkov A., Andrievsky B. Output Feedback Energy Control of the Sine-
Gordon PDE Model Using Collocated Spatially Sampled Sensing and Actuation //
IEEE Transactions on Automatic Control. 2020. Vol. 65. No. 4. P. 1484-1498. cited
By 3.
199.
Андриевский Б.Р., Блехман И.И., Борцов Ю.А., и др. Управление мехатрон-
ными вибрационными установками / Под. ред. Блехмана И.И., Фрадкова А.Л.
Сер.: Анализ и синтез нелинейных систем. СПб: Наука, 2001.
200.
Fridman E. Observers and Initial State Recovering for a Class of Hyperbolic Systems
via Lyapunov Method // Autom. 2013. Vol. 49. P. 2250-2260.
201.
Fridman E., Terushkin M. New Stability and Exact Observability Conditions for
Semilinear Wave Equations // Automatica. 2016. Vol. 63. P. 1-10.
202.
Orlov Y., Fradkov A.L., Andrievsky B. Sliding Mode-based Speed-gradient Control
of the String Energy // IFAC-PapersOnLine. 2017. Vol. 50. No. 1. P. 8484-8489.
203.
Fradkov A.L. Speed-gradient Entropy Principle for Nonstationary Processes // En-
tropy. 2008. Vol. 10. No. 4. P. 757-764.
204.
Fradkov A., Krivtsov A. Speed-Gradient Principle for Description of Transient Dy-
namics in Systems Obeying Maximum Entropy Principle // AIP Conf. Proc. 2010.
Vol. 1305. P. 399-406.
205.
Fradkov A.L., Khantuleva T. Cybernetic Model of The Shock Induced Wave Evo-
lution in Solids // Procedia Structural Integrity. 2016. Vol. 2. P. 994-1001.
206.
Khantuleva T. Thermodynamic Evolution Far From Equilibrium // AIP Conf.
Proc.
2018. Vol. 1959. URL: https://aip.scitation.org/doi/abs/10.1063/
1.5034750.
207.
Fradkov A.L., Shalymov D. Speed Gradient and MaxEnt Principles for Shannon
and Tsallis Entropies // Entropy. 2015. Vol. 17. No. 3. P. 1090-1102.
208.
Shalymov D., Fradkov A.L. Dynamics of the F-Divergence Minimization Processes
Based on the Speed-Gradient Principle // Proc. IEEE Conf. Norbert Wiener in the
21st Century, 21CW 2016. 2016. P. 7-11.
71
209.
Shalymov D., Fradkov A., Liubchich S., Sokolov B. Dynamics of the Relative En-
tropy Minimization Processes // Cybernetics and Physics.
2017. Vol. 6. No. 2.
P. 80-87.
210.
Зубарев Д.Н. Неравновесная статистическая термодинамика. М.: Наука, 1971.
211.
Shalymov D., Fradkov A.L. GENERIC and Speed-Gradient Principle // IFAC-
PapersOnLine. 2018. Vol. 51. No. 33. P. 121-126.
212.
Селиванов А.А. Динамика процессов максимизации квантовой энтропии в ко-
нечноуровневых системах // Вестник Санкт-Петербургского университета. Ма-
тематика. Механика. Астрономия. 2011. № 4. С. 71-79.
213.
Цыкунов А.М. Алгоритмы скоростного градиента для систем с запаздывани-
ем // АиТ. 1987. № 3. С. 97-106.
214.
Boffi N., Slotine J. Implicit Regularization and Momentum Algorithms in Non-
linearly Parameterized Adaptive Control and Prediction // Neural Computation.
2021. Vol. 33. P. 590-673.
215.
Брэгман Л.М. Релаксационный метод нахождения общей точки выпуклых мно-
жеств и его применение для решения задач выпуклого программирования //
Журн. вычисл. матем. и матем. физ. 1967. Т. 7. № 3. С. 620-631.
216.
Ai-Poh Loh, Annaswamy A., Skantze F. Adaptation in the Presence of a General
Nonlinear Parameterization: An Error Model Approach // IEEE Trans. Automat.
Contr. 1999. Vol. 44. No. 9. P. 1634-1652.
217.
Fradkov A.L., Ortega R., Bastin G. Semi-Adaptive Control of Convexly Para-
metrized Systems with Application to Temperature Regulation of Chemical Reac-
tors // Int. J. Adaptive Control Signal Processing. 2001. Vol. 15. No. 4. P. 415-426.
218.
Tyukin I., Prokhorov D., Terekhov V. Adaptive Control with Nonconvex Parame-
terization // IEEE Trans. Automat. Contr. 2003. Vol. 48. No. 4. P. 554-567.
219.
Ortega R., Gromov V., Nuño E., et al. Parameter Estimation of Nonlinearly Param-
eterized Regressions without Overparameterization: Application to adaptive con-
trol // Automatica. 2021. Vol. 127. P. 109544.
220.
Tyukin I., Prokhorov D., van Leeuwen C. Adaptation and Parameter Estimation in
Systems with Unstable Target Dynamics and Nonlinear Parametrization // IEEE
Trans. Automat. Contr. 2007. Vol. 52. No. 9. P. 1543-1559.
221.
Lee T., Kwon J., Park F. A Natural Adaptive Control Law for Robot Manipula-
tors // Proc. 2018 IEEE/RSJ Int. Conf. Intelligent Robots and Systems. Piscat-
away, NJ: IEEE, 2018. P. 1-9.
222.
Wensing P., Slotine J.-J. Beyond Convexity - Contraction and Global Convergence
of Gradient Descent // PLoS ONE. 2020. Vol. 15. No. 8. e0236661.
Статья представлена к публикации членом редколлегии Б.Т. Поляком.
Поступила в редакцию 31.08.2020
После доработки 12.04.2021
Принята к публикации 29.04.2021
72