Автоматика и телемеханика, № 10, 2020
Нелинейные системы
© 2020 г. Б.Р. АНДРИЕВСКИЙ, д-р техн. наук (boris.andrievsky@gmail.com)
(Институт проблем машиноведения РАН,
Санкт-Петербургский государственный университет,
Балтийский государственный технический университет,
Санкт-Петербург),
И.Б. ФУРТАТ, д-р техн. наук (cainenash@mail.ru)
(Институт проблем машиноведения РАН,
Университет ИТМО, Санкт-Петербург)
НАБЛЮДАТЕЛИ ВОЗМУЩЕНИЙ: МЕТОДЫ И ПРИЛОЖЕНИЯ.
ЧАСТЬ 2. ПРИЛОЖЕНИЯ1
Статья является второй частью обзора, посвященного наблюдателям
возмущений, появление которых в теории и практике автоматического
управления восходит к середине 60-х гг. XX в. Первая часть обзора посвя-
щена теоретическим результатам. Данная часть обзора посвящена прак-
тическому применению наблюдателей возмущений. Рассмотрены такие
приложения, как управление судами и подводными аппаратами, управле-
ние летательными аппаратами и роботами-манипуляторами, подавление
узкополосных вибрационных колебаний, оценивание и подавление возму-
щений в электротехнических системах, управление автомобилями и их
узлами и ряд других приложений.
Ключевые слова: возмущения, оценивание, наблюдатель.
DOI: 10.31857/S0005231020100025
1. Введение
История появления наблюдателей возмущений в теории и практике управ-
ления восходит к середине 60-х гг. XX века и связана с расширением ал-
гебраических методов синтеза регуляторов, появлением компьютерно-ориен-
тированных процедур синтеза, усложнением круга решаемых задач и стрем-
лением оптимизировать процесс управления. В первой части обзора, см. [1],
внимание сосредоточено на общих теоретических подходах и результатах.
В ней представлены методы оценки возмущений с использованием наблю-
дателей состояния, вспомогательных фильтров в форме передаточных функ-
ций, основанные на динамической инверсии модели объекта, наблюдатели
входных и выходных возмущений, описывается метод внутренней модели и
приведены результаты по наблюдателям гармонических возмущений. Данная
часть обзора посвящена практическим применениям представленных резуль-
татов. При выборе статей для обзора учитывалась их цитируемость (в системе
1 Результаты разделов 1-7 получены при финансовой поддержке гранта РФФИ (кон-
тракт № 18-38-20037). Результаты раздела 8 получены в ИПМаш РАН в рамках госзадания
Минобрнауки РФ (Рег. № НИОКТР АААА-А19-119120290136-9).
35
Scopus) и наличие аппаратной реализации. Авторы понимают, не все публи-
кации оказались в фокусе данного обзора и заранее приносят свои извинения
коллегам, чьи работы в нем не рассмотрены.
Как отмечено в [2], метод управления, основанный на оценивании возму-
щений, в отличие от многих других современных методов, нашел широкое
применение в промышленно выпускаемых устройствах. Большой интерес к
этому методу как в академических, так и в промышленных кругах связан с
его простотой как альтернативы классическим ПИД-регуляторам.
Обзор недавних экспериментальных исследований и промышленных раз-
работок по активному подавлению возмущений, основанному на оценивании
внешних и внутренних воздействий, представлен в [3], где приведены приме-
ры успешного применения в системах управления движением; в реабилита-
ционной робототехнике для помощи пациентам в физических тренировках; в
системах электропитания с топливными элементами, использующих электро-
химическую реакцию между кислородом и водородом; для управления двух-
массовой системой с демпфером; для управления элементами производствен-
ных линий (электродвигателями, сервоприводами, температурой для экстру-
зии шлангов, систем регенерации энергии). Некоторые результаты описаны
далее в соответствующих разделах.
Применение наблюдателей возмущений к управлению судами и подводны-
ми аппаратами рассмотрено в разделе 2. Задачи управления летательными
аппаратами рассмотрены в разделе 3. Применению наблюдателей возмуще-
ния к управлению роботами-манипуляторами посвящен раздел 4. Подавление
узкополосных вибрационных колебаний рассмотрено в разделе 5. Раздел 6 по-
священ применению наблюдателей возмущений к электротехническим систе-
мам. Управление автомобилями и их подсистемами рассматривается в разде-
ле 7. Прочие применения, не вошедшие в приведенный список, рассмотрены
в разделе 8. Заключительные замечания даны в разделе 9.
2. Применение к задачам управления судами
и подводными аппаратами
Алгоритм адаптивного управления для подводных аппаратов с мани-
пулятором, служащий для обеспечения программного движения по задан-
ной траектории, представлен в [4]. Алгоритм основан на методе скоростно-
го градиента А.Л. Фрадкова [5-9] и на использовании наблюдателя состоя-
ния/возмущения. Рассмотрено кусочно-постоянное изменение массы аппара-
та в процессе работы манипулятора. Адаптивный закон управления обеспе-
чивает требуемое движение аппарата при неопределенности изменяющейся
массы аппарата. Для улучшения качества процесса управления при синтезе
регулятора в [4] учтена динамика двигателя. Чтобы использовать обратную
динамику двигателя в законе управления, производится оценка состояния и
входа двигателей. Для синтеза наблюдателя использованы результаты [10].
В [11] рассматривается задача перевалки грузов в открытом море по рам-
пе от крупнотоннажного судна к меньшему промежуточному судну (типа
T-Craft). Из-за сложности взаимодействия волн и судов эта задача представ-
ляет значительные проблемы для разработчиков кораблей и систем управ-
36
ления. Для уменьшения колебаний соединяющей суда рампы предлагает-
ся алгоритм адаптивного подавления колебаний от волнения, управляющий
воздушным потоком. Когда корабли ориентированы бок о бок, возмущение
T-Craft от волн в вертикальной плоскости оценивается и подавляется вен-
тиляторами, управляющими давлением расположенной под судном воздуш-
ной подушки. Для конфигурации нос-корма предполагается двухкамерная
воздушная подушка, с помощью которой волновое возмущение по тангажу
оценивается и устраняется путем создания момента через перепад давления
между камерами. При описании динамики судов на волнении используется
модель из работы [12]. Для рассматриваемой задачи подавления колебаний
от волнения через обратную связь используется моногармоническая модель
волны, в которой ее частота, амплитуда и фаза отслеживаются алгоритмом
идентификации. Следуя [13, 14], неизвестное гармоническое волнение пред-
ставляется произведением неизвестного постоянного вектора на известный
регрессор. В [11] рассматриваются случаи как известных, так и неизвест-
ных параметров судна, для которых используются соответственно методы [13]
или [14].
Задача перевалки грузов в открытом море по рампе от большого сред-
нескоростного судна с накатом/спуском к меньшему соединительному судну
рассмотрена и в [15]. Целью управления является уменьшение перемещения
рампы между судами, чтобы обеспечить более безопасные условия для пе-
ревалки грузов. Как и в [11], здесь принята моногармоническая модель вол-
нения. Разработан регулятор для воздушной подушки, который выполняет
оценку и подавление действия волнового возмущения меньшего судна с по-
мощью обратной связи по ускорению вертикальных колебаний для случая,
когда гидродинамические и другие параметры судна априори не известны,
а динамика давления воздушной подушки содержит нелинейно параметри-
зованные неизвестные слагаемые. Для демонстрации приведены результаты
моделирования программой AEGIR.
Нелинейное управление динамическим позиционированием судов при дей-
ствии неизвестных нестационарных помех и насыщении управляющего воз-
действия развивается в [16]. Для решения задачи используются наблюда-
тель возмущения и вспомогательная динамическая система. Применяется ме-
тод динамического контроля поверхности (англ. - dynamic surface control,
DSC) [17]. Наблюдатель служит для оценки неизвестных нестационарных
возмущений, вспомогательная динамическая система используется для отра-
ботки влияния входного насыщения, а метод динамического контроля поверх-
ности дает возможность разработать простой и легко реализуемый на прак-
тике закон динамического позиционирования. Доказано, что разработанный
робастный нелинейный закон позиционирования может поддерживать желае-
мые значения положения и курса судна, гарантируя при этом ограниченность
всех сигналов в замкнутой системе управления. Для описания динамики суд-
на используется модель из [18]
(2.1)
η = J(ψ)v
(2.2)
M ν = -Dν + τ(t) + d(t),
37
где вектор η = [x, y, ψ]T образован координатами центра масс судна: x - про-
дольным перемещением, y - боковым перемещением в земной системе ко-
ординат, и ψ ∈ [0, 2π] - курсовым угол судна; вектор ν = [u, v, r]T состоит
из продольной и боковой скоростей судна u, v в связнной системе кор-
cos ψ
-sin ψ
0
динат и скорости изменения угла рыскания r; J(ψ) =sin ψ cos ψ
0 -
0
0
1
матрица перехода от связанной к земной системе координат; M - матри-
ца инерции, учитывающая присоединенные массы; τ = [τ1, τ2, τ3]T - вектор
управляющих сил и момента, компоненты которого имеют заданные ограни-
чения; d = [d1, d2, d3]T - вектор, образованный неизвестными внешними воз-
мущающими силами в продольном и поперечном направлениях и моментом
возмущения по рысканию. Для оценивания d(t) предлагается наблюдатель
возмущений
(2.3)
d(t) = q(t) + K0
Mν,
(2.4)
˙q(t) = -K0q(t) - K0(-Dν + τ + K0
Mν),
где
d(t) ∈ R3 - оценка d(t), q(t) ∈ R3 - вектор состояния наблюдателя,
K0 = KT0 > 0 - определяемая при синтезе квадратная матрица параметров,
у которой наименьшее собственное число λmin должно превосходить 1/2.
Близкая задача рассматривается в [19], где для динамического позициони-
рования судов при наличии изменяющихся во времени неизвестных внешних
возмущений предложена робастная по отношению к ошибкам позиционирова-
ния адаптивная схема управления. Возмущения представляются как выходы
линейной экзосистемы с неизвестными параметрами, у которой собственные
значения матрицы системы лежат на мнимой оси. Такое представление позво-
ляет построить наблюдатель для оценки неизмеряемого вектора состояния и,
следовательно, привести задачу компенсации возмущений при позициониро-
вании судов к задаче адаптивного управления. По результатам моделирова-
ния для судна Northern Clipper проведен сравнительный анализ с существую-
щим методом позиционирования, показывающий большую эффективность и
меньшую консервативность предложенной в [19] схемы управления.
3. Применение к задачам управления летательными аппаратами
Для задачи управления формацией из двух спутников (по схеме ведущий-
ведомый) в [20] рассмотрены различные методы применения непрерывного
управления на скользящих режимах, в том числе алгоритмы скользящих ре-
жимов второго порядка [21], например, - алгоритм супер-твистинга, непре-
рывное управление на скользящем режиме и с наблюдателем возмущений
в скользящем режиме (sliding mode disturbance observer, SMDO) [22-25], ал-
горитмы с интегральной поверхностью скольжения (integral sliding surface,
ISS) [26]. Широтно-импульсная модуляция (ШИМ) используется для преоб-
разования непрерывных сигналов управления в последовательность импуль-
сов, которые могут быть реализованы с помощью реактивных двигателей
спутника. Рассматривается числовой пример, в котором положение ведомого
38
спутника относительно ведущего описывается в соответствующем масштабе
времени уравнениями
x-2y-3x=ux + dx,
(3.1)
ÿ+ 2y - 3x = uy + dy,
z+z=uz +dz,
где x, y, z - координаты ведомого спутника относительно ведущего, ux, uy,
uz - управляющие силы, действующие на ведомый спутник, dx, dy, dz вклю-
чают в себя различные возмущения, действующие на двухспутниковую си-
стему, вызванные, например, нецентральностью поля тяготения, солнечным
давлением, лунно-солнечными приливами, вращательно-колебательным дви-
жением Земли в пространстве, колебаниями земного полюса и неравномер-
ностью вращения Земли, и погрешность линеаризации отклонения по по-
ложению. Желаемое взаимное положение спутников задается переменны-
ми xc, yc, zc. Формируются соответствующие скользящие переменные, вклю-
чающие интегральное слагаемое для компенсации постоянных возмущений,
см. [23, с. 147-153]:
ex = xc - x, ey = yc - y, ez = zc - z,
(3.2)
σi = ėi + ci,0ei + ci,-1 ei
(τ)dτ
с некоторыми параметрами желаемого движения в скользящем режиме ci,0,
ci,-1, где i ∈ {x,y,z}. Для численного анализа приняты значения ci,0 = 1,8,
ci,-1 = 1,0. Рассматриваются следующие алгоритмы управления формацией:
1. Регулятор со скользящим режимом и наблюдателем возмущений в
скользящем режиме
(
)
ui = 10σi + vieq,
vieq = 20
- vieq + 2sign(si)
,
(
)
(3.3)
si = σi +
ui - 2sign(si)
dτ, i ∈ {x,y,z}.
Здесь vieq - “эквивалентное управление”, результат пропускания сигналов
vi = (Li + ρi)σ(si), где ρi > 0, через фильтры нижних частот2. Как отмечено
в [20], сигналы vieq после переходного процесса за конечное время являют-
ся точной оценкой согласованных приведенных возмущений ψ0i(·) (линейных
комбинаций выхода объекта и ошибки слежения ei, см. детали в [20, 26]).
2. Супер-твистинг алгоритм скользящих режимов второго порядка, обес-
печивающий сходимость переменных на поверхности скольжения и их про-
изводных к нулю за конечное время, имеет вид
1
(3.4)
ui = 3|σi|2 sign(σi) + sign(σi
)dτ, i ∈ {x,y,z};
2 По мнению авторов обзора, vi eq не является в точности эквивалентным управлением,
как оно определено в [22, 23], так как в отличие от указанных работ, в (3.3) фильтрация
происходит внутри замкнутого контура управления, а не является внешней по отношению
к нему.
39
3. Непрерывный алгоритм скользящих режимов с интегральной поверхно-
стью скольжения. Этот алгоритм, основанный на методе Ляпунова и реали-
зующий непрерывное управление в скользящем режиме, обеспечивает робаст-
ную стабилизацию σi по отношению к согласованным возмущениям. В алго-
ритме используются два вида скользящих переменных: σi и дополнительные
интегральные скользящие переменные ηi [26]. В общем виде алгоритм запи-
сывается как
(3.5)
ηi = σi +k0isi,
si = sign(σi
),
(3.6)
ũi = ψ0i(·) + (ρi/2ai )|ηi|2ai-1 sign(ηi
),
где константы ρi > 0,k0i > 0, 0,5 < ai < 1,0, ũ = E(x)u, где E(x) - неособая
матрица преобразования к новому базису, в котором исходная система приво-
дится к m независимым подсистемам. После того как ũ найдено, управление u
получается обратным преобразованием u = E-1(x)ũ. Для рассматриваемой
задачи управления системой (3.1) алгоритм (3.5), (3.6) принимает вид
(
)
2ai-1
ρi
(3.7)
ui =
· σi + k0i
sign(σi) dτ
sign σi +k0i
sign(σi) dτ
,
2ai
где ai = 0,9,k0i = 0,5, ρi = 10, i ∈ {x, y, z}. Сигналы управления ui в (3.3)-
(3.7) непрерывны, так как разрывные высокочастотные компоненты филь-
труются или интегрируются. В [20] приводятся сравнительные результаты
применения предложенных алгоритмов управления.
Авторы [27] рассматривают задачу управления автономными летательны-
ми аппаратами с вертикальным взлетом и посадкой (Vertical Take-Off and
Landing, VTOL), применение которых вызвало в последнее десятилетие зна-
чительный интерес со стороны промышленности, научных кругов и государ-
ственных органов. В [27] используются результаты из [20, 26] по управлению
со скользящим режимом и наблюдателем возмущений на скользящем режи-
ме, а также представленная в [28] робастная система управления полетом
малого квадрокоптера. Этот подход позволяет сформировать непрерывное
управление, устойчивое к внешним возмущениям и неопределенности моде-
ли, не требующее большого коэффициента усиления или значительного объе-
ма вычислений. Робастность предложенного управления продемонстрирова-
на интенсивным моделированием системы с шестью степенями свободы при
действии возмущений, включающих порывы ветра, неисправность привода и
неопределенность модели.
Для управления ракетой-носителем многоразового использования в [29]
представлен подход к управлению на скользящем режиме, с наблюдателя-
ми возмущений на скользящем режиме и с адаптивным изменением коэф-
фициента усиления. Кроме повышения качества управления при действии
возмущений, по утверждению авторов [29], предлагаемая структура систе-
мы управления полетом может снизить затраты на цикл проектирования
и предполетный анализ. В качестве примера в [29] представлены резуль-
таты моделирования системы управления ракетой-носителем многоразового
использования X-33 , проект которой был разработан корпорацией Lockheed
40
Martin3. Функция наведения X-33 мало отличается от предложенной для воз-
вращения космического челнока Space Shuttle, и система управления подобна
системе управления шаттлом. Базовый регулятор имеет три канала: крен,
тангаж и рыскание. В каждом из них команды наведения сглажены и при-
ведены к виду, требуемому для формирования команды управления угло-
вой скоростью. Затем для получения виртуальных команд отклонения рулей
используется ПИ-закон управления. Полученные таким образом командные
сигналы сочетаются с командами триммирования аэродинамических управ-
ляющих поверхностей, полученными путем табличной интерполяции, и с ко-
мандой гашения скорости. Каждый канал имеет перекрестные связи с дру-
гими для координированных разворотов по крену. Коэффициенты усиления
вычисляются как функции от числа Маха. Для ослабления эффектов упруго-
сти корпуса используются режекторные фильтры. Многоконтурная система
управления включает в себя наблюдатели возмущения низкого порядка, при
синтезе которых используется информация только о границах возмущений.
Алгоритм оценивания возмущений включает в себя адаптивную настройку
коэффициента усиления наблюдателя, обеспечивающий наименьшее значе-
ние усиления, необходимое для наличия скользящего режима. Разработан-
ный алгоритм многоразовой системы управления полетом ракеты-носителя
был программно реализован и численно исследован в среде моделирования
X-33 MAVERIC.
Для продольного движения высокоманевренной ракеты в [30] предлагается
улучшенный регулятор со скользящим режимом, основанный на нелинейном
наблюдателе возмущений. Цель работы - получить управление, робастное
к внешнему возмущению и неопределенности аэродинамических коэффици-
ентов без использования большого коэффициента усиления и значительных
вычислительных затрат. Для оптимизации параметров выбранной структуры
регулятора используется генетический алгоритм [31]4. Динамика продоль-
ного движения ракеты описывается приведенной в [33] моделью5
(
)
=KαM
Cn(α,M) + dnδn
cos α + q,
α
(
)
(3.8)
˙q=KqM2Cm(α,M) + dmδ
,
)
η = KηM2(Cη(α,M) + dηδ
,
где α - угол атаки, q - угловая скорость тангажа, η - нормальная перегрузка
(управляемая переменная), управляющее воздействие - отклонение хвосто-
вого оперения. Автопилот должен обеспечить отслеживание поступающего
3 Lockheed Martin X-33 проектировался как непилотируемый суборбитальный космиче-
ский самолет для демонстрации технологий, разработанных в 1990-х гг. в рамках финанси-
руемой правительством США “Инициативы по запуску космического корабля”. X-33 являл-
ся технологическим демонстратором для орбитального космического самолета VentureStar,
который планировалось создать как коммерческую многоразовую ракету-носитель следую-
щего поколения.
4 Фактически, это разновидность известных алгоритмов случайного поиска с обучением
[32].
5 Заметим, что используемая в [30, 33] и в других зарубежных публикациях система
обозначений международного стандарта по динамике полета ISO 1151 [34] отличается от
отечественного ГОСТ 20058-80 [35].
41
от алгоритма наведения задающего воздействия по перегрузке ηc, M - зна-
чение числа Маха, остальные символы обозначают параметры модели, ве-
личины Kα, Kα, Kα считаются постоянными. Привод рулей высоты моде-
лируется уравнениями второго порядка. (Заметим, что по уравнениям си-
стемы этого не видно; привод представляется безынерционным.) Далее, для
получения относительного порядка [25, 36] модели равного двум, и после-
дующего выполнения линеаризации вход-выход, подъемная сила рулей счи-
тается несущественной и уравнение для перегрузки в (3.8) записывается в
виде η = KηM2Cη(α, M). При синтезе регулятора со скользящим режимом
поверхность скольжения задается через переменную
t
(3.9)
s = ė + 2ce + c2 e(τ)dτ, e = η - ηc,
0
где c > 0 - выбираемый при синтезе параметр, см. [25, § 4.3; 37]. Для сни-
жения колебаний “дребезга” (chattering), релейная характеристика в законе
управления заменяется насыщением (по мнению авторов обзора, такая замена
снижает частоту колебаний, но приводит к увеличению их амплитуды). Авто-
рами [30] отмечено, что робастность по отношению к вариациям параметров
объекта и устойчивость системы обеспечиваются, однако это достигается за
счет высокого коэффициента регулятора, а также снижения качества пере-
ходных процессов. Поэтому в [30] разрабатывается “улучшенный” регулятор
со скользящими режимами с использованием нелинейного наблюдателя для
оценки неизвестных возмущений. С этой целью модель объекта представля-
ется в виде аффинной по управлению системы
(3.10)
x = f(x) + g(x)u + h(x)d,
где
x = [α,q]T, d = [dα,dq]T.
Для поиска наилучших значений параметров регулятора и наблюдателя
при синтезе алгоритма управления используется генетический алгоритм. Из-
ложение иллюстрируется примером моделирования с 25 % отклонением па-
раметров от номинальных, из которого следует, что вид процесса управления
с наблюдателем возмущений лучше, чем у традиционной системы со сколь-
зящим режимом. Использование в законах управления (как в исходном, так
и в модифицированном) второй производной от задающего воздействия по
перегрузке ηc может привести к сложности в реализации, если, как принято
в задачах слежения, задающее воздействие заранее не известно.
Публикация [38] посвящена задаче робастного управления продольным
движением гиперзвуковых транспортных средств с воздушно-реактивным
двигателем (airbreathing hypersonic vehicle, AHV) при несогласованных воз-
мущениях с помощью метода управления на основе нелинейного наблюда-
теля возмущений (nonlinear-disturbance-observer-based control, NDOBC). По
мнению авторов [38], в сравнении с другими робастными методами управле-
ния полетом предлагаемому методу свойственны не только многообещающие
42
характеристики устойчивости и подавления возмущений, но и свойство вос-
становления номинальных характеристик. Для теоретического анализа ис-
пользуется достаточно общая нелинейная модель аффинного по управлению
объекта
(3.11)
x = f(x) + g(x)u + p(x)w, y = h(x),
где x(t) ∈ Rn, u(t) ∈ Rm, w(t) ∈ Rn, y(t) ∈ Rm - векторы состояния, управ-
ления, возмущений и выхода соответственно f(x), g(x), p(x), h(x) - гладкие
векторные и матричные поля в Rn.
В [38] используется стандартная модель движения центра масс ЛА в про-
дольной плоскости, см., например [39], с линейной моделью второго порядка
двигателя и безынерционной моделью привода руля высоты. Аэродинами-
ческие коэффициенты взяты из [37]. Неизвестные возмущения входят адди-
тивно в каждое из уравнений системы, а параметрическая неопределенность
вводится в аэродинамические коэффициенты в процентах от номинального
значения (до 25 % по каждому коэффициенту). Полная нелинейная модель
седьмого порядка разбивается на две подсистемы вида (3.11), описывающие
изменение скорости (третьего порядка) и динамику углового движения ЛА
(порядка 4). Отмечается, что возмущения для данной модели несогласован-
ные [40], что приводит к необходимости разработки специальных подходов.
Дальнейшее изложение строится на предположении о том, что приведенные
к аддитивной форме возмущения дважды дифференцируемы. Используя ре-
зультаты [41-43], в работе [38] строится нелинейный наблюдатель с конечным
временем переходного процесса для оценивания состояния системы и возму-
щений. Далее полученные оценки используются в законе слежения за задаю-
щими воздействиями yr1, yr2 по скорости и угловому положению, компен-
сирующем несогласованные возмущения w(t). Результаты иллюстрируются
моделированием.
Подход к адаптивному управления по выходу классом нелинейных систем
с векторными входами и выходами (Multiple-Input, Multiple-Output, MIMO)
описан и проиллюстрирован на примере квадрокоптера в [44]. Предлагае-
мый подход основан на принципе высокого коэффициента усиления (англ. -
high-gain principle) и использует так называемый “метод последовательного
компенсатора” [25, 45, 46]. Регулятор строится на основе декомпозиции мате-
матической модели объекта управления (ОУ). В применении к квадрокопте-
ру это соответствует рассмотрению уравнений динамики MIMO системы с
шестью степенями свободы для координат центра масс и углов Эйлера и век-
торным тяговым усилием четырех управляемых пропеллеров6. Далее в эти
уравнения вводятся так называемые “виртуальные управления”, связанные с
управляющими силами через тригонометрические функции от углов Эйлера.
Принято, что внешние ветровые возмущения изменяются медленно и поэтому
могут рассматриваться (и компенсироваться) как неопределенные парамет-
ры. В результате преобразования MIMO система разбивается на шесть неза-
висимых подсистем со скалярными входами и выходами (англ. - Single-Input,
6 В [44] использованы стандартные уравнения динамики квадрокоптера с невысказан-
ными при описании углового движения предположениями о малости углов крена, тангажа,
а также угловых скоростей относительно осей связанной системы координат.
43
Single-Output, SISO), для которых формируются виртуальные управления,
которые затем обратным преобразованием пересчитываются в управляющие
силы.
Авторы [47] используют наблюдатель возмущений для снижения влия-
ния нагрузок от порывов ветра для упругого высотного самолета большой
выносливости (high-altitude long-endurance aircraft, HALE aircraft). Исполь-
зуется нелинейная модель динамики аппарата с исходным линейным зако-
ном управления, разработанным методом обращения нелинейной динамики.
Локальные фильтры оценки возмущений (disturbance estimating filters, DEF)
предназначены для оценки и смягчения воздействия возмущений с использо-
ванием пар датчиков - исполнительных устройств самолета (например, дат-
чик скорости рыскания - руль направления ). Отдельные фильтры являются
наблюдателями возмущений с одним входом и одним выходом для сниже-
ния нагрузки от от порывов ветра (disturbance observers for gust-load allevia-
tion, DOGLA), и объединяются затем в развязанную многосвязную систему
(decoupled multi-input multi-output, D-MIMO) DOGLA. D-MIMO DOGLA со-
держит SISO DOGLA, предназначенные для устранения влияния порывов
ветра на скорости углов крена, тангажа и рыскания самолета, а также на
упругие колебания крыльев. Результаты моделирования системы с нелиней-
ной упругой моделью самолета HALE демонстрируют, что D-MIMO DOGLA
успешно снижает влияние на самолет порывов ветра для различных режимов
полета. Структура основного контура управления с фильтрами оценки воз-
мущений DEF аналогична описанной в [48, 49]; в качестве Q(s) используется
фильтр нижних частот (апериодическое звено первого порядка) с частотой
среза 1000 рад/c, на вход которого поступает сумма сигнала управления и
сигнала измерений, пропущенного через инверсную передаточную функцию
(ПФ) объекта управления, см. описание в [1, раздел 3]. Как и в [48], фильтр,
оценивающий возмущения, содержит нулевой полюс для точной компенса-
ции постоянных возмущений (другими словами - для обеспечения астатизма
первого порядка по возмущениям, [50]). Заметим, что столь широкая поло-
са пропускания фильтра, выходящая за область частот, в которой принятая
модель может считаться адекватной, вызывает сомнение в практической зна-
чимости рассмотренного примера.
Авторами [51] выполнен синтез адаптивного регулятора положением и вы-
сотой беспилотного летательного аппарата (БПЛА) типа “квадротор”, кото-
рый подвергается воздействию ветра. При синтезе регулятора предполагает-
ся, что общая масса, тензор инерции, длина плеч квадротора и коэффици-
енты тяги и сопротивления гребных винтов, прикрепленных к квадротору,
неизвестны. Как обычно, ветровые возмущения представляются суммой n
синусоидальных функций vi(t), i = 1, . . . n, с неизвестными частотами, ам-
плитудами и фазами. Составляющие возмущения представляются выходами
линейных экзосистем вида
(3.12)
Ż(t) = Sz(t), d(t) = vTz(t), z(0) = z0,
где z(t) ∈ R2n+1, матрица S зависит от неизвестных частот ветровых воз-
мущений d(t), а их амплитуды и фазы определяются через неизвестные на-
чальные условия z0. Согласно [13] ветровые возмущения параметризуются
44
следующим образом:
(3.13)
χ(t) = Gχ(t) + Lv(t),
(3.14)
v(t) = βT
χ(t),
где G - гурвицева матрица порядка (2n - 1), матрица L образует с G управ-
ляемую пару, а новые переменные χ связаны с z невырожденным преобразо-
ванием χ = Mz, где матрицы M порядка (2n - 1) удовлетворяют уравнению
Сильвестра MS - GM = LhT, а βT = hTM-1 ∈ R2n+1. Таким образом, как
следует из (3.14), неизвестные возмущения vi(t) получаются произведением
неизвестного постоянного вектора βT и неизвестной вектор-функции χ(t),
для оценки которых в [51] используется наблюдатель, встроенный в закон
управления.
4. Применение к задачам управления роботами-манипуляторами
В [52, 53] излагается и экспериментально демонстрируется в примене-
нии к манипуляционным роботам метод синтеза сервоприводов, основанный
на использовании так называемых регуляторов с двумя степенями свободы
(two degrees of freedom, TDOF). Особенностью таких систем является возмож-
ность независимо задавать реакцию на задающее воздействие и характери-
стики замкнутого контура с помощью двух параметров (двух передаточных
функций), принадлежащих к кольцу устойчивых и правильных7 рациональ-
ных функций. Такой регулятор представляет собой классическую структуру
с последовательным корректирующим звеном в цепи главной обратной связи
с ПФ W1(s) и местной обратной связью по выходу объекта с ПФ W2(s), см.
[1, раздел 5; 50, 54]. Сигнал управления u на выходе регулятора формируется
в виде
(4.1)
u = W1(s)e - W2
(s)v,
где v = y + ζ - сигнал измерений выхода ОУ; y(t) - выход ОУ, подлежащий
управлению; ζ(t) - шум (погрешнсть) измерения: e(t) = r(t) - v(t) - сигнал
рассогласования; r(t) - задающее (командное) воздействие. Если исходить из
структуры с оценкой возмущений инверсией ПФ объекта и их последующей
компенсацией (см., например, [49, 55, 56], а также [1, раздел 3]), то эквива-
лентные ПФ в (4.1) получаются в виде
Φr(s)
1
W1(s) =
(
),
1 - Φr(s) Pn(s)
1 - Q(s)
(4.2)
Q(s)
W2(s) =
(
),
Pn(s)
1 - Q(s)
где Φr(s) - желаемая ПФ замкнутой системы по задающему воздействию,
Q(s) - подлежащая нахождению при синтезе ПФ корректирующего звена
7 Proper - “правильная”, что часто неточно переводится как “собственная”.
45
(фильтра)8. Таким образом, синтез регулятора (4.1), согласно [52, 53], состоит
в выборе желаемой ПФ Φr(s) и определению, исходя из требований устойчи-
вости замкнутой системы, строго-правильной устойчивой ПФ Q(s). В [52, 53]
приведены условия разрешимости задачи и процедура синтеза.
В [53] данный метод применен и экспериментально исследован для управ-
ления двигателем постоянного тока в электроприводе и пространственными
траекториями движения робота-манипулятора с шестью сочленениями.
В [57] управление со скользящим режимом рассмотрено в применении
к нелинейным системам управления общего вида. Отмечено, что обычный
метод скользящих режимов требует знания верхних границ возмущений и
неопределенностей модели системы для обеспечения устойчивости, что не
всегда доступно. Предлагается использовать процесс оценки для этих ди-
намических возмущений совместно с использованием скользящих режимов -
“управление со скользящим режимом с оценкой возмущения” (sliding mode
control with perturbation estimation, SMCPE). Авторы [57] утверждают, что в
статье предлагается метод робастного управления с обратной связью, обла-
дающий, при медленно меняющихся возмущениях, гораздо более низкими ко-
эффициентами усиления по сравнению с обычными системами в скользящем
режиме. В качесте примера в [57] на результатах моделирования продемон-
стрировано применение предложенного метода управления для двухзвенного
плоского манипулятора.
В [58] предлагается метод оценки силы для управления силовым воздей-
ствием при отсутствии датчика силы. С этой целью для каждого сустава
манипулятора, имеющего n степеней свободы, вводится наблюдатель возму-
щения. Это дает возможность использовать простую эквивалентную модель
динамики робота (simple equivalent robot dynamics, SERD) в виде системы
независимых двойных интеграторов.
В качестве исходной модели робота-манипулятора в [58] используются
стандартные уравнения динамики
(4.3)
M (q)q + c(q,
q) + q(q) + f(˙q) = τ,
где M(q) - матрица инерции порядка n, c(q,
q), q(q), f(˙q) - соответственно
n-мерные векторы кориолисовых и центробежных сил, сил тяжести и трения;
τ = [τl ...τn]T ∈ Rn - вектор крутящих моментов, приложенных к суставам
робота-манипулятора; q,
˙q, q - n-мерные векторы угловых положений, скоро-
стей и ускорений соответственно. Уравнения динамики (4.3) записываются в
виде
(4.4)
M (q)q + τd
(q,
˙q, q) = τ,
{
}
Mnn
где
M≡ diag
M11 ...
- диагональная матрица порядка n, у которой
Mii
- постоянные номинальные инерционные члены относительно i-й оси,
которые могут быть приблизительно оценены в результате активного экс-
перимента (например, по частотным характеристикам) с фиксацией всех
8 ПФ W1(s) вида (4.2) отл(чается от)приведенной в [1, раздел 3, уравнение (3.2)] нали-
чием в ней множителя Φyr(s)/
1 - Φyr(s)
, который в [1] представлен последовательной ПФ
регулятора R(s).
46
приводов за исключением i-го и в работе предполагаются известными;
τd(q,
˙q, q) ≡ [τ1d ... τ1d]T ∈ Rn - вектор “эквивалентных возмущений”, опреде-
ленный через (4.3), (4.4) в виде
(
)
(4.5)
τd(q,
˙q, q) =
M (q) -M(q)
q+c(q,
q) + q(q) + f(q).
Если τd(q,
˙q, q) получено, то движения по каждой оси можно раз-
вязать (рассматривать независимо), устраняя эквивалентное возмущение.
Это возмущение можно получить с помощью наблюдателя возмущений,
см.
[52, 59]. Полученная оценка эквивалетных возмущений по стандартной
схеме (см. [1, рис. 1]) подается аддитивно к сигналу управления. Применение
этого приема к каждому суставу манипулятора дает возможность рассмат-
ривать робот как простую эквивалентную динамическую систему вида
(4.6)
M
q=τ.
Для оценки выхода наблюдателя возмущений, вызванных внутренним
крутящим моментом, разработан оцениватель выхода наблюдателя возмуще-
ний (disturbance observer output estimator, DOOE), в котором неопределенные
параметры робота-манипулятора настраиваются градиентным методом, ми-
нимизирующим значение заданного показателя качества в виде квадратич-
ной формы от ошибки между выходом наблюдателя возмущения и DOOE.
В отсутствие внешней силы выход наблюдателя возмущений можно запи-
сать в виде
(4.7)
τd
=W(q,
˙q, q)ϕ + ν,
где ϕ ∈ Rr - вектор неизвестных параметров, W (q,
˙q, q) и ν - соответственно
матрица размера n × r и n-мерный вектор, зависящие от параметров суставов
робота [60]. Внешняя сила, если присутствует, оценивается по разности меж-
ду выходом наблюдателя возмущения и наблюдателя DOOE, так как выход
наблюдателя возмущения включает в себя величину внешнего вращающего
момента, а также и внутреннего вращающего момента, который оценивается
по выходу DOOE.
Выход DODE может быть представлен как
(
)
(
)
M
(4.8)
τd =
q(q)
-M¯
q+ĉ(q,
˙q) + ĝ(q) f(q) = W(q,
q, q
ϕ+ν,
где
ϕ - оценка вектора неизвестных параметров. Для их настройки использу-
ется сигнал ошибки τd = τd - τd между выходами наблюдателя возмущений
и наблюдателя DOOE, который используется в локальном целевом функ-
ционале J = 1/2∥τd2. Процедура метода скоростного градиента, описанная
в [5-8, 25], для такого функцонала приводит к алгоритму идентификации
(4.9)
ϕ=-ΓW(q,
˙q, q)Tτd
с некоторой положительно определенной матрицей коэффициентов усиления
Γ = ΓT > 0 порядка r (в [58] считается, что матрица Γ диагональная; как
47
следует из метода скоростного градиента [5-8, 25], это требование можно не
учитывать).
При контакте манипулятора с окружением выход наблюдателя возмуще-
ний включает вектор τe ∈ Rn момента внешних воздействий:
(
)
(
)
M
(4.10)
τd =
q(q)
-M¯
q+ĉ(q,
q) + ĝ(q)
f (q) + τe.
Оценка τe внешнего момента получается как разность τe = τd - τd, на ос-
нове чего с использованием матрицы Якоби J(q) строится оценк
fe внешней
силы fe:
(
)-1
(4.11)
fe =
J (q)T
τe.
Эта оценки используется в гибридном регуляторе обратной связи с управле-
нием положением и усилием.
Для демонстрации эффективности предложенного метода в [58] приведены
примеры моделирования и результаты экспериментальных исследований на
двухстепенном роботе-манипуляторе с прямым приводом SCARA.
Модификация наблюдателей возмущений для управления манипулятора-
ми с n степенями свободы рассматривается в [61], где предложен так называе-
мый “наблюдатель возмущения с обратной связью по моменту” (momentum
feedback disturbance observer, MFDOB). В [61] используется модель последо-
вательного (serial) манипулятора, действующего в m-мерном пространстве
декартовых координат,
(4.12)
τ =H(q)q+C(q,
q)˙q + g(q) + τd,
где τ ∈ T ⊂ Rm - обобщенный вектор моментов в сочленениях, H(q) ∈ Rn×n,
H(q) = H(q)T > 0 - матрица инерции, слагаемое C(q,
q)˙q ∈ Rn соответству-
ет кориолисовым и центробежным моментам, g(q) ∈ Rn - вектор гравитаци-
онных моментов, τd - обобщенный возмущающий момент, который, кроме
собственно возмущений, и моментов сил трения в сочленениях, учитывает и
отклонения параметров манипулятора от принятых в расчетной модели (4.12)
“номинальных” значений. Этот момент подлежит оцениванию и компенсации.
Основываясь на [62] (см. также [1, раздел 2]), вводится модель возмущений
(4.13)
w = Aw, τd
=Fw,
где A ∈ Rd×d, F ∈ Rn×d - матрицы, выбираемые при синтезе. Определени-
ем новой переменной p = H(q)
˙q и вектора состояния расширенной системы
z = col{p,w} уравнения (4.12), (4.13) приводятся к виду
{
Ż1 = -Fz2 + τ, p = z1,
(4.14)
Ż2 = Az2,
где τ = τ + CT(q,
q) - g(q). В [61] принято, что переменные q,
˙q измеряются,
поэтому сигнал p может быть вычислен и принимается за измеряемый выход
48
системы (4.14), для которой стандартным образом получается наблюдатель
состояния пониженного порядка для оценки возмущения τd
(4.15)
ν = (A - LF)ν - (A - LF)Lp + Lτ,
τd
= F(ν + Lp),
где ν ∈ Rd - вектор состояния, а L ∈ Rd×n - матрица коэффициентов усиле-
ния наблюдателя.
Работоспособность предлагаемого закона управления экспериментально
продемонстрирована в [61] на трехзвенном планарном манипуляторе с пря-
мым приводом. Каждый двигатель манипулятора приводится в действие уси-
лителем, который использует внутреннюю обратную связь по току. Взаимное
положение измеряется кодером высокого разрешения, скорость вычисляется
путем численного дифференцирования с фильтрацией. В качестве управляю-
щего компьютера использован Pentium MMX-200 MHz PC, частота кванто-
вания составила 1 кГц. Эксперименты показали определенное превосходство
в качестве процессов управления по сравнению с системой, в которой наблю-
датель возмущений не используется.
В [63] предлагается наблюдатель нелинейных возмущений для робо-
тизированных манипуляторов. Гарантируется глобальная экспоненциальная
устойчивость наблюдателя возмущения за счет выбора параметров, завися-
щих от максимальной скорости перемещения и физических характеристик
манипулятора. Предлагается применение наблюдателя для различных целей,
таких как компенсация трения, независимое управление суставами, контроль
вращающего момента в отсутствие датчиков и диагностика неисправностей.
Приведена иллюстрация оценки трения и его компенсации в двухзвенном ро-
ботизированном манипуляторе.
Для простоты изложения в [63] рассматривается стандартная модель двух-
звенного манипулятора
(4.16)
J (θ)θ(t) + G(θ,θ) = T(t) + d,
где θ(t) ∈ R2,θ(t) ∈ R2 и T (t) ∈ R2 - перемещение, скорость и вектор управле-
ния соответственно, d(t) ∈ R2 - вектор возмущающих сил или моментов. Ста-
вится задача синтеза наблюдателя, вырабатывающего оценк
d(t) возмуще-
ния d(t), асимптотически стремящуюся к d(t) при всех θ(t),˙θ(t) и t ∈ [t0, ∞).
Относительно физического смысла переменных в правой части (4.16), в [63]
отмечено, что: “Когда в модели рассматривается только динамика звеньев
[манипулятора], то управляющим входом T является или момент, или сила,
а d ∈ R2 есть векторный возмущающий момент или сила ... Когда уравне-
ния динамики первого порядка двигателя постоянного тока включены в ука-
занную модель, T является векторным напряжением, приложенным к дви-
гателям, а не вектором моментов. В результате момент возмущений также
эквивалентен возмущению напряжений, приложенных к двигателям. Соот-
ветственно в этом случае d есть возмущающее напряжение.” Таким образом,
физическая природа возмущения d может быть различной, кроме того, это
возмущение может считаться следствием влияния “немоделируемой динами-
ки” (англ. - unmodeled dynamics) - невозможности описания поведения ре-
49
альной системы на основе принятой математической модели с достаточной
точностью.
В качестве исходного в [63] предлагается наблюдатель возмущения вида
(
)
ˆ
(4.17)
d = -L(θ, θ
d + L(θ, θ)
J (θ)θ + G(θ,˙θ) - T
с некоторой выбираемой при синтезе матрицей L(θ,˙θ). Далее в [63] указа-
но: “Поскольку нет априорной информации о производной от возмущения d,
естественно предположить, чт
d = 0.” (С точки зрения авторов обзора, есте-
ственность этого предположения сомнительна.) На основе этого в [63] пока-
зан очевидный факт, что если взять L(θ,θ) = diag {c, c}, где c > 0, то ошиб-
ка оценивания e(t)
d(t) - d ∈ R2 асимптотически затухает. Действительно,
при указанных условиях каждая компонента ошибки оценивания e(t) ∈ R2
описывается импульсной характеристикой апериодического звена первого по-
рядка [50]. Далее, в [63] отмечено, что поскольку ускорениеθ(t) в большин-
стве манипуляционных роботов не измеряется, то практическая реализация
наблюдателя (4.17) затруднена, но он используется в работе в качестве ис-
ходного для построения нелинейного наблюдателя. С этой целью вводится
вспомогательная вектор-функция
(4.18)
z
d - p(θ,θ˙),
где p(θ,θ) ∈ R2 подлежит определению при синтезе. Далее принято, что
функция L(θ,θ) в (4.17) удовлетворяет нелинейному уравнению
]
[
][˙
θ
∂p(θ
θ)
∂p(θ
θ)
(4.19)
L(θ,θ)J(θ)θ =
,
∂θ
θ
θ
откуда с учетом (4.18) следует, что
(
)
(
)
(4.20)
Ż = -L(θ, θ)
z+p(θ
θ)
+ L(θ, θ)
G(θ,˙θ) - T
В итоге, нелинейный наблюдатель возмущений описывается уравнениями
(4.19), (4.20) и
(4.21)
d = z + p(θ,θ˙).
Для затухания ошибки оценивания e(t) требуется выбором L(θ,θ) обеспе-
чить устойчивость уравнения ė(t) = -L(θ,θ)e(t), что в свою очередь налагает
требования к выбору p(θ,˙θ). Эта, в общем случае сложная, задача может быть
решена с учетом специфики уравнений двухзвенных манипуляторов. В [63]
доказано, что функция p(θ,θ) вида
[
]
θ
1
(4.22)
p(θ,θ) = c
θ1
θ2
50
при c >
X˙θ2m обеспечивает глобальную асимптотическую устойчивость на-
блюдателя (4.19)-(4.21). Здесь˙θ2m - максимальная скорость движения вто-
рого звена, X - параметр инерции манипулятора. При таком выборе имеет
место равенство
[
]
1
0
(4.23)
L(θ,θ) = c
J (θ)-1.
1
1
Работа [63] иллюстрируется разнообразными результатами моделирования
и экспериментальных исследований, показывающих применимость предло-
женного подхода.
В [64] представлен алгоритм адаптивного управления с итеративым обу-
чением, основанный на процедуре оценивания возмущений с использовани-
ем фильтра Калмана и оптимизации квадратичного критерия. Управление
с итеративным обучением (УИО, англ. - Iterative Learning Control, ILC) яв-
ляется хорошо разработанным методом управления повторяющимися про-
цессами [65-67]. Отмечено, что цель управления с итеративым обучением
состоит в том, чтобы итеративно найти входной сигнал системы, миними-
зирующий некоторую целевую функцию. В формулировке подавления воз-
мущения d(t) требуется минимизировать модуль вызванной им ошибки. Если
система известна и обратима, а возмущение приложено аддитивно к выходу
объекта и тоже известно, то очевидным подходом будет фильтрация d(t) че-
рез инверсную систему и использование результирующего сигнала в качестве
управления u(t). Для описания системы в [64] используется номер итерации
k = 0,1,..., который обозначается нижним индексом у переменных, а аргу-
ментом в круглых скобках указывается (целочисленное) дискретное время
t ∈ [0,...,n]. Вводится модель ОУ в матричной форме
(4.24)
zk = G0uk + dk, yk = zk + nk,
(4.25)
dk+1 = dk + Δdk ,
где zk, uk, dk, yk, nk, Δdk ∈ Rn, G0 [ Rn×n. Вектор сост]яния ОУ (с учетом
возмущения dk) определен как zk =
zk(0) ... zk(n - 1)
. Принято, что воз-
мущение dk и “шум измерений” nk - случайные процессы с ковариационными
матрицами для Δdk и nk, равными RΔd,k и Rn,k соответственно. Учитывая
(4.25) и представив модель ОУ с матрицей системы G0 = G(I + ΔG), где ΔG -
матрица относительной ошибки модели, (4.24) можно записать в виде
(4.26)
zk+1 = zk + G(uk+1 - uk) + GΔG (uk+1 - uk) + Δdk , yk = zk + nk.
Последние два слагаемых в первом уравнении (4.26) можно рассматривать
как возмущения, так как они оба неизвестны. Однако видно, что первое сла-
гаемое зависит от разницы между двумя последовательными управляющи-
ми сигналами. Если неопределенность модели мала или процесс обновления
управляющего сигнала медленный, то это слагаемое будет иметь небольшое
влияние на поведение системы.
Для системы (4.26), в предположении отсутствия корреляции между Δdk
и nk, стандартным образом строится фильтр Калмана [68]. Далее решается
51
оптимизационная задача для УИО системы (4.24) с использованием квадра-
тичного критерия Jk = zTkWzzk + uTkWuuk. После некоторых преобразований
и упрощающих предположений в [64] выведен алгоритм управления
(
)
(
)-1
uk+1 = I -
I+W-1uGTWzG
Kk uk -
(
)-1
−W-1uGTWz
I + GW-1uGTWz
Kkyk.
Далее в [64] дается адаптивное расширение алгоритма калмановской филь-
трации, при котором значение Kk зависит от меры изменчивости возмуще-
ния, полученной через матрицу Pk. Показано, что с учетом возмущений в
измерениях результирующие фильтры итеративного управления обучением
изменяются в процессе итераций.
В [64] приводятся результаты экспериментов, выполненных на промыш-
ленном роботе IRB1400. Робот имеет в шесть степеней свободы, но для трех
суставов итеративное обучение не применялось. Каждый из суставов модели-
руется как оператор передачи от управляющего входа УИО к измеряемому
положению двигателя робота, то есть в виде G0 в (4.24). Отмечено, что G0
фактически является замкнутой системой благодаря регулятору в обратной
связи, который работает параллельно с УИО. Благодаря этому замкнутая
система между задающим воздействием и измеренным угловым положением
может быть описана с использованием дискретной линейной модели невысо-
кого порядка (в [64] использована модель первого порядка). Точность повто-
рения одной и той же задачи для IRB1400 очень высока, поэтому считается,
что исходная ошибка одинакова на каждой итерации. Выполненные экспери-
менты продемонстрировали успешное применение предложенного алгоритма.
Блочная процедура синтеза обратной связи для управления положением
конечной точки манипулятора с электроприводом представлена в [69, 70]. Ис-
пользована модель жесткого манипулятора
(
)
(4.27)
q= H-1(q)
v-C(q,
q)˙q - G(q) + η(t),
(4.28)
v=-Av-D˙q + Bu,
где q ∈ Q ⊂ RN - вектор обобщенных координат манипулятора; H(q) ∈ Rn×n -
матрица инерции (det H = 0 для всех q ∈ Q); C(q,
˙q) ∈ Rn×n - матрица цен-
тростремитель{ых и кориоли}овых сил; G(q) ∈ Rn - вектор гравитационных
сил; η(t) = col
η1(t),... ,ηt(t)
- вектор неизвестных возмущений, которые
считаются ограниченными кусочно-гладкими функциями от времени с огра-
ниченными производными; v ∈ Rn - вектор моментов, развиваемых испол-
нительными механизмами. Подсистема (4.28) описывает динамику исполни-
тельных электроприводов постоянного тока, где A, D, B - диагональные
матрицы с известными положительными постоянными элементами; u ∈ Rn -
управляющие напряжения, приложенные к якорным обмоткам двигателей.
Измеряются обобщенные координаты q(t) и якорные токи двигателей, пре-
образованные в моменты v(t). Рассматривается задача синтеза разрывно-
го управления u, обеспечивающего отслеживание задающего воздействия
g(t) ∈ Rn выходными координатами y = h(q) ∈ Rn с заданной точностью с
52
учетом заданных ограничений на обобщенные моменты v(t) и скорости их из-
менения. Диффеоморфной заменой локальных переменных выполняется пе-
реход к синтезу управления непосредственно относительно переменной y(t) и
ее производных. При синтезе используется изложенный в [71, 72] каскадный
метод. П(и форми)ровании управления используются сигмоидные функции
σ(x) = 2/
1+e-kx
- 1, которые при достаточно большом k приближаются
к разрывной функции sign(x). Функции такого вида используются в [69, 70]
и в наблюдателе пониженного порядка, служащего для оценки используемых
для управления неизмеряемых переменных.
В [73] представлен подход к слежению рабочим органом робота-манипу-
лятора за задающим воздействием. Используется общая модель динамики
механической системы
(4.29)
q
f (q,
˙q,t) Bu(t) + Δf(q,
˙q,t) + ΔBu(t) + d(t),
где q = [q1, . . . , qn]T ∈ Rn - вектор обобщенных координат; d(t) ∈ Rn - век-
тор ограниченных внешних возмущений; u(t) ∈ Rm - вектор управлений;
f (q,
q,t), Δf(q,q,t) - известная и неизвестная вектор-функции, описываю-
щие собственную динамику системы;
B(q, t), ΔB(q, t) - известная и неиз-
вестная матричные функции размера n × m, причем считается, что матрица
B(q, t) =B(q, t) + ΔB(q, t), соответствующая “точной” динамике системы, -
обратимая и ограниченная положительно определенная во всем простран-
стве состояний нелинейная функция. Аналогичное предположение делает-
ся и относительно
B(q, t). Условия согласованности предполагаются выпол-
ненными, поэтому все неопределенные элементы объединяются выражением
F = Δf + ΔBu(t) + d(t) и (4.29) представляется в виде
(4.30)
q
f + Bu(t) +F
В итоге, модель обратной динамики системы имеет вид
(4.31)
u(t) =B-1 q -B-1fˆ-B-1F
В [73] предлагается закон управления
(
)
(4.32)
u(t) =B-1
q
f -KS
Fest
Он включает в себя: выход приблизительно известной обратной дина-
мики системы
q
f в качестве базовой части; оценку неопределенного
слагаемого
Fest, чтобы компенсировать немоделируемую динамику, внеш-
ние возмущения и изменяющиеся во ∫ремени параметры; ПИД-регулятор
uPID = -B-1KS, где S = ė + 2Λe + Λ2
edt, используемый в качестве ком-
поненты обратной связи для повышения устойчивости замкнутого контура и
учета ошибки оценки неопределенностей. Здесь K - диагональная положи-
тельно определенная матрица коэффициентов усиления, выбираемая разра-
ботчиком, e = q - qd - векторная ошибка слежения за задающим воздействи-
ем qd(t). Оценка
Fest вырабатывается градиентной процедурой идентифика-
ци
Fest = ΓS, Γ = ΓT > 0 - параметр алгоритма.
53
Робастность и возможности предложенного подхода исследуются в [73]
моделированием на примере робота с двумя степенями свободы.
В [74] предлагается метод управления со скользящим режимом на ос-
нове “множественной модели”, в котором снижение коэффициентов усиле-
ния наблюдателя и регулятора достигается уменьшением уровня парамет-
рической неопределенности. Для этого компактный набор неизвестных па-
раметров равномерно разбивается на конечное число меньших компактных
подмножеств. Затем синтезируется система-кандидат со скользящим режи-
мом, соответствующая каждому из этих меньших подмножеств. Производ-
ная функции Ляпунова-кандидата используется в качестве критерия пере-
установки для идентификации модели-кандидата, которая в каждый момент
времени приближается к модели ОУ. Ключевая идея заключается в том,
чтобы дать возможность оценкой параметров традиционной схемы управле-
ния с адаптивным скользящим режимом установить модель, которая наилуч-
шим образом оценивает объект среди конечного набора моделей-кандидатов.
Предлагаемый метод исследуется моделированием на двухстепенном роботе-
манипуляторе.
В [75] рассматривается задача робастного отслеживания траектории для
робота-манипулятора при наличии неопределенности и помехи. Предлагается
использовать нейросетевое адаптивное управление со скользящим режимом
(neural network-based sliding mode adaptive control, NNSMAC), представляю-
щее собой комбинацию метода скользящего режима, аппроксимации нейрон-
ной сетью и адаптивного метода. В [75] отмечено, что предположение о до-
ступности модели динамики робота-манипулятора не всегда выполнимо на
практике, поэтому в алгоритм управления включается адаптивный нейросе-
тевой наблюдатель, предназначенный для оценки скоростей звеньев.
Используется стандартное описание динамики n-звенного робота-манипу-
лятора
(4.33)
M (q)q + Vm(q,
q)q+
q+fc(˙q) + G(q) + τd
= τ,
в которое входят: M(q) ∈ Rn×n - симметричная положительно определен-
ная матрица инерции; матрица центростремительных и кориолисовых сил
Vm(q,
q); коэффициент вязкого трения F ; сухое трение fc(˙q); векторы грави-
тационных сил G(q), ограниченных неизвестных возмущений τd и входного
вращающего момента τ (соответственно).
Цель управления траекторией - на основе данных о q(t) и желаемом
процессе qd(t) разработать регулятор для мобильного робота (4.33), та-
кой что для любого q(0) ∈ Rn и заданной функции qd(t) было выполне-
но q(t) - qd(t) ≡ e(t) → 0 при t → ∞. Для этого вводится вспомогательная
переменная
qr(t) =
˙qd(t) - Λe с некоторой выбранной постоянной матрицей
Λ = ΛT > 0 и определяется скользящая переменная
(4.34)
s=
q-
qr
≡ ė + Λe.
Видно, что на скользящем режиме, когда s(t) ≡ 0, динамика ошибки слеже-
ния e(t) определяется однородным уравнением ė + Λe = 0.
54
Уравнения (4.33), (4.34) можно записать относительно s в виде
(4.35)
M (q) s = -Vmsq + f(X) - τd
+ τ,
где X - вектор-столбец X = col {qd,
qd,qd,
˙q,q} ∈ R5n. Функция f(X) в (4.35)
заменяется ее оценкой
f (X), полученной аппроксимацией с помощью ней-
ронной сети (НС)
f (X) =ŴTϕ(X), гдеŴ - настраиваемая по адаптивному
алгоритму весовая матрица НС, ϕ(·) - набор радиальных базисных функ-
ций [76].
Поскольку желательно обойтись измерением только положений, а не ско-
ростей звеньев, уравнение (4.33) приводится к виду
{
˙q = p,
(4.36)
p = H(q,p) - M-1(q)τd + M-1(q)τ,
где
(
)
H(q, p) = -M-1(q)
Vm(q,p)p + Fp + fc(p) + G(q)
Функция H(q, p) аппроксимируется настраиваемой НС в виде
Ĥ(q, p) =
= ŴT0ϕ0(q, p), и для полученной модели строится наблюдатель полного по-
рядка. Этот наблюдатель входит в состав адаптивного закона управления
с обратной связью по выходу со скользящим режимом на основе нейрон-
ной сети (neural network-based sliding mode adaptive output feedback control,
NNSMAOFC). Методом Ляпунова показано, что ошибки отслеживания тра-
ектории и ошибки оценивания наблюдателя асимптотически стремятся к ну-
лю. Эффективность разработанного NNSMAC, адаптивного наблюдателя на
основе НС и NNSMAOFC иллюстрируется путем моделирования системы
управления двухзвенным манипулятором.
Экспериментальному исследованию применимости активного подавления
возмущения (active disturbance rejection control, ADRC) для управления мани-
пуляционными роботами посвящена работа [77], в которой регулятор указан-
ного типа используется для управления реалистичным устройством трениро-
вок для реабилитации конечностей. Экспериментальные исследования прове-
дены на лабораторной модели манипулятора, поведение которой напоминает
реальную робототехническую реабилитационную установку [78]. Механиче-
ская часть установки “Манипулятор с изменяемой жесткостью” (Changeable
Stiffness Manipulator, CSM) - манипулятор с одной степенью свободы, имею-
щий жесткое звено и гибкое сочленение. Возможность изменения жесткости
полезна, например, чтобы лучше адаптировать роботов на ножках к различ-
ным и неизвестным условиям местности. В данной конструкции приводной
ремень растягивается пружинами и нелинейно соединяет главный вал, имею-
щий угол поворота qm, с антагонистической парой шкивов исполнительных
механизмов с углами поворота q1, q2, жестко соединенных с управляемыми
двигателями постоянного тока со способностью к восстановлению исходного
положения. Пружины на холостых шкивах гарантируют правильное натяже-
ние ремня на холостом ходу.
55
В [77] принята модель динамики рассматриваемой системы, см. [78],
q1 = ϕ1,2 - ϕL,1 + τ1,
R q1 + ξR
I
(4.37)
IRq2 + ξR
q2 = ϕ2,L - ϕ1,2 + τ2,
ILqL + ξL
q1 = ϕL,1 - ϕ2,L - τext,
где индексы R и L соответствуют элементам, связанным с рулевым приводом
и звеном манипулятора соответственно; IR, IL - моменты инерции; ξR, ξL -
коэффициенты вязкого трения; τext - момент внешних сил, приложенных к
установке; ϕL,1 - момент, действующий на шкив, прикрепленный к звену (qL),
вызванный пружиной с коэффициентом жесткости KL,1; τ1, τ2 - моменты,
развиваемые двигателями постоянного тока.
Вводятся переменная τs = (τ1 - τ2)/2, представляющая собой момент,
ответственный за изменение жесткости системы, и переменная τp =
= (τ1 - τ2)/2 момент, определяющий движение звена манипулятора. Эти
моменты определяются по модели динамики двигателей постоянного тока
(4.38)
τp = ki(up - ke
qp)/R, τs = ki(us - keqs)/R,
в которой up, us - управляющие напряжения, R, ki, ke - параметры двигате-
лей.
С управленческой точки зрения, манипулятор с изменяемой жесткостью
может выполнять две следующие задачи: изменение углового положения qL,
полученное одновременным движением обоих двигателей, которое приводит к
изменению среднего положения валов двигателей qp = (q1 + q2)/2; изменение
относительного углового положения между валами для увеличения значения
qs = (q1 - q2)/2, что приводит к возрастанию жесткости системы.
Для применения метода активного подавления возмущений в [77] выпол-
нена декомпозиция модели (4.37). Уравнения (4.37), (4.38) представляются в
виде
(4.39)
qs = fs(˙qss) + bsus,
где
-(ξRR + kike)qs + ϕsR
ki
fs(·) =
,
bi =
RIR
RIR
Далее функция fs(·) ∈ R считается неизвестным результирующим возмуще-
нием, подлежащим оцениванию. Как и во многих других работах, это воз-
мущение вводится как третья (“виртуальная”) компонента вектора состояния
расширенного объекта, для которого строится наблюдатель состояния. По-
лученные с его помощью оценки используются при формировании компенси-
рующих возмущение сигналов управления.
В [77] представлены результаты различных экспериментальных исследо-
ваний на лабораторном стенде CSM для проведения изометрических и изо-
тонических тренировок.
56
5. Применение к задачам подавления узкополосных
вибрационных колебаний
В [79] предлагается робастный метод управления с “составной нелинейной
обратной связью” (composite nonlinear feedback, CNF), восходящий к публика-
ции [80], для обеспечения быстрого и точного слежения для линейных систем,
подверженных насыщению управляющего сигнала и возмущениям. Основ-
ная идея состоит в том, чтобы включить оценку и компенсацию возмущений
в структуру исходного управления CNF, чтобы устранить установившуюся
ошибку от возмущений и сохранить быстрые переходные характеристики ис-
ходного управления CNF. Показано применение метода для разработки зако-
на управления для системы позиционирования серводвигателя постоянного
тока. Результаты моделирования и эксперимента показывают, что метод [79]
может обеспечить лучшие переходные характеристики и точность в устано-
вившемся режиме при отслеживании заданных воздействий и является более
устойчивым к изменениям амплитуды возмущения и заданного значения по
сравнению с управлением на основе интеграла в контуре управления.
Подавлению резонансных явлений в системах управления движением по-
священа публикация [81]. Рассмативается модель, представленная двумя
взаимосвязанными инерционными системами, которая часто используется в
задачах управления движением для описания взаимодействия между двига-
телем и нагрузкой. Существенным при описании системы является наличие
в пределах ее полосы пропускания неизвестной резонансной частоты. В [81]
используется подход, при котором неточность в описании динамики системы
рассматривается совместно с внешними возмущениями как некоторое общее
возмущение, для оценки которого служит расширенный наблюдатель состоя-
ния (extended state observer, ESO) [82]. В [81] используется следующая модель
двигателя, связанного упругим соединением с инерционной нагрузкой:
(5.1)
ym + a1ÿm + a2 ym = b0ü + b1 u + b2
u+w,
где ym - скорость вращения ротора двигателя, u - приложенный к нему
управляющий момент, w(t) - общее возмущение, включающее как сигналь-
ную составляющую, так и неточности в описании динамики системы, в том
числе ее резонансные свойства с неопределенной частотой собственных коле-
баний. Путем повторного интегрирования по времени модель (5.1) приводит-
ся к уравнению первого порядка ym = b0u + f, в котором функция f(·) вклю-
чает как внешние возмущения, так и внутреннюю динамику и предполагается
ограниченной. Это “полное возмущение” представляется как компонента x2
вектора состояния системы второго порядка
{
x1 = x2 + b0u, ym = x1,
(5.2)
˙
x2 =
f
,
для которой строится стандартный наблюдатель состояния второго порядка.
Со ссылкой на [83, 84] указано, что ошибка оценивания ограничена при огра-
˙
ниченности производной от возмущения
f
и величина ошибки обратно про-
порциональна ширине полосы пропускания наблюдателя. Полученная оценка
57
возмущений используется для введения компенсирующего воздействия в ста-
тический закон управления. В качестве достоинства метода отмечается воз-
можность использования простого описания объекта управления без знания
его параметров (таких как момент инерции двигателя и резонансная частота).
Очевидна недостаточная обоснованность подхода, вытекающая из указанно-
˙
го предположения об ограниченности
f
, поскольку это “возмущение” зависит
от переменных состояния системы, на которые, в свою очередь, влияет полу-
ченная оценка возмущения.
В [81] рассматривается также управление скоростью движения нагрузки.
С этой целью вводится модель (и наблюдатель состояния) третьего порядка
с ПД-регулятором в обратной связи. Приводятся многочисленные результа-
ты моделирования и экспериментов по управлению скоростью через обрат-
ную связь двигателя на торсионном аппарате Model 205 от Education Control
Products (Bell Canyon, CA, USA). Алгоритм управления реализован с исполь-
зованием пакета реального времени системы MATLAB (Real-Time toolbox),
см. также [85].
Авторами [86] представлен прямой адаптивный алгоритм для подавления
неизвестных нестационарных узкополосных помех, применяемый к установке
для тестирования адаптивных регуляторов [87]. Задача состоит в том, что-
бы минимизировать остаточную силу путем подачи соответствующего управ-
ляющего сигнала на инерционный привод при наличии множественных и/или
неизвестных нестационарных возмущений. Алгоритм прямого адаптивного
управления основан на принципе внутренней модели [88] и использует па-
раметризацию Юлы-Кучеры (Youla-Kučera) [89]. В [86] предложено прямое
адаптивное управление с обратной связью, эффективность которого оценена
как моделированием, так и экспериментально. Для повышения робастности
системы вводятся полосовые фильтры, формирующие функции чувствитель-
ности системы.
Как отмечено в [86], параметризация Юлы-Кучеры позволяет ввести
в регулятор, реализующий прямое адаптивное управление (см., например
[87, 90-94]), настраиваемую внутреннюю модель возмущений. Настройка про-
исходит через изменение коэффициентов фильтра в контуре управления без
пересчета параметров регулятора в “основном контуре” (central controller).
Число настраиваемых параметров приблизительно равно порядку уравнения
модели возмущений, следовательно размерность алгоритма адаптации зави-
сит от сложности (порядка) модели возмущений, а не объекта управления.
Основные проблемы, которые возникают при таком подходе, связаны с син-
тезом регулятора основного контура такого, чтобы для всех возможных ам-
плитуд и частот возмущений в рассматриваемом диапазоне обеспечивалась
достаточная робастность системы (в терминах запасов устойчивости по уси-
лению и фазе, малости амплитудно-частотной характеристики вне области
подавления входного сигнала). Проблема становится еще более сложной, ко-
гда есть несколько узкополосных возмущений, которые должны быть ком-
пенсированы одновременно, что характерно для используемой тестовой уста-
новки. Даже линейная модель установки с постоянными параметрами ха-
рактеризуется двумя парами слабо-демпфированных нулей, расположенных
весьма близко к области частот, в которой должно выполняться подавление
58
возмущений. В [86] изложена методология разработки регулятора основного
контура для указанных условий.
Для установки, описанной в [87], представленной моделью в дискретном
времени, в [95] разработан компенсатор подавления вибраций, выход которо-
го имеет вид взвешенной суммы выходных сигналов устойчивых фильтров.
Предложена идентификационная процедура для адаптивной настройки ко-
эффициентов при неизвестном возмущении, а также инвариантный по вре-
мени компенсатор, обеспечивающий идеальное ослабление возмущения для
случая, когда ошибка идентификации модели достаточно мала и частоты воз-
мущения известны. Моделированием и экспериментально показано успешное
подавление возмущения, представленного суммой до трех синусоидальных
сигналов с неизвестными / изменяющимися во времени частотами.
6. Применение к задачам управления электротехническими и
энергетическими системами
Применение наблюдателя возмущений для управления электрическим
двигателем постоянного тока рассмотрено в публикации [96], в которой дей-
ствующий на серводвигатель неизвестный и неизмеряемый момент нагрузки,
возникающий, например, благодаря кулоновскому трению или действию си-
лы тяжести, вводится в модель расширенного объекта управления и оценива-
ется наблюдателем состояния. Синтез наблюдателя, как и всего регулятора,
выполнен в дискретной области для реализации на 16-ти разрядном мик-
ропроцессоре. Приведены результаты численного анализа и экспериментов,
выполнено сравнение с поведением системы со стандартным П-регулятором.
В [97] предложен подход к управлению с цифровой обратной связью инвер-
тора с широтно-импульсной модуляцией, в котором достигается управление
выходом за конечное число шагов [98] в сочетании с наблюдателем возмуще-
ния. В предложенной схеме расположения полюсов наблюдателя состояния и
наблюдателя возмущения выбираются отдельно. Замечено, что когда в обоих
наблюдателях использовано одинаковое расположение полюсов, эксперимен-
тальная установка имела тенденцию становиться неустойчивой из-за ошиб-
ки обнаружения. Посредством выбора различных положений полюсов уда-
ется построить наблюдатель возмущения, быстро оценивающий возмущение
и обеспечивающий подавление возмущения через прямую связь. Затем на-
блюдатель состояния оценивает переменные состояния в следующий момент
выборки, и к номинальной системе применяется закон управления выходом
за конечное число шагов. В [97] с помощью моделирования и экспериментов
оцениваются преимущества и недостатки предложенного подхода с точки зре-
ния применения в бесперебойных источниках питания (uninterruptible power
supply, UPS).
Публикации [99, 100] посвящены синтезу и реализации регулятора следя-
щей системы с дискретным временем для стола точного позиционирования,
приводимого в действие двигателями с прямым приводом. Стол использу-
ется, например, для упаковки полупроводниковых элементов. Он может пе-
ремещаться с ускорением свыше 5 g и точностью позиционирования на мик-
ронном уровне. В отличие от системы с шариковой винтовой передачей регу-
59
лятор в системе с прямым приводом должен обеспечивать высокий уровень
подавления помех, избегая проблем из-за относительно медленной динами-
ки электрической цепи двигателя и усилителя мощности. Предлагаемый в
[99, 100] регулятор использует наблюдатель возмущения и пропорционально-
дифференциальный (ПД) регулятор в канале обратной связи, а также регуля-
тор слежения ошибок нулевой фазы и фильтр нижних частот нулевой фазы
в прямой связи. В [100] рассматриваются два вида задач управления: слеже-
ние за задающим воздействием как некоторой функции времени и контурное
управление (contouring control), задача которого - минимизировать разницу
между пространственной траекторией, отслеживаемой задающими воздей-
ствиями, и пространственной траекторией, отслеживаемой выходом управ-
ляемой установки. Во многих случаях выбор между слежением и контурным
управлением продиктован проблемами реализации. В регуляторе общего кон-
тура требуется связь в реальном времени между сервоприводами оси и, кро-
ме того, коэффициенты усиления системы изменяются во времени, посколь-
ку они зависят от пространственной траектории. За исключением некоторых
высокопроизводительных регуляторов станков и роботов, требуемый уровень
вычислительной мощности и связи редко доступен.
Для синтеза регулятора и исследования свойств системы в [100] использу-
ется номинальная модель объекта в дискретном времени, заданная переда-
точной функцией
(
)
-1
z-4b0
1+z
(6.1)
Gn(z-1) =
,
1 - 2z-1 + z-2
где z ∈ C - аргумент дискретного преобразования Лапласа, во временной
области соответствующий оператору упреждения [50], b0 - параметр модели.
При моделировании используется модель более высокого порядка.
Для обеспечения точности системы в [100] используется наблюдатель ад-
дитивных управлению возмущений. При синтезе наблюдателя используется
подход [52, 56, 101]. По мнению авторов [100], по сравнению с интегральным
законом управления наблюдатели возмущений обеспечивают большую гиб-
кость благодаря выбору порядка, относительной степени и полосы пропуска-
ния фильтров нижних частот. Авторы отмечают что, хотя техника введения
состояния модели возмущения к традиционному наблюдателю состояния хо-
рошо известна, см. например, [102], использование структуры наблюдателя
возмущения из работ [52, 56] позволяет осуществлять простую и интуитивно
ясную настройку усиления контура наблюдения возмущения и не зависит от
коэффициентов обратной связи по состоянию. Предложенный закон управ-
ления экспериментально исследован с помощью процессора цифровой обра-
ботки сигналов (DSP-процессор) с частотой квантования 10 кГц при общей
массе стола и полезной нагрузки 7,5 кг и ускорениями до 3 g.
В [103] представлен синтез расширенного комплексного фильтра Калмана
для измерения частоты энергосистемы. Теоретические результаты примене-
ны к стандартным тестовым сигналам, представляющим измерения наихуд-
шего случая и условия сети в типичной энергосистеме. Предложенный ал-
горитм направлен на приложения реального времени, где шум измерений и
60
другие возмущения высоки. Приводятся результаты сравнения предлагаемо-
го метода с результатами, полученными на реальном расширенном фильтре
Калмана.
В [104] предлагается наблюдатель нелинейных возмущений для многопа-
раметрических минимально-фазовых систем с произвольными относительны-
ми степенями. Рассматриваются модели вида
(6.2)
A(p)y(t) = B(p)u(t) + K(p)v(t),
[
]T
[
]T
где u(t) =
u1(t) ... ur(t)
∈ Rr, y(t) =
y1(t) ... yq(t)
∈Rq - векторы
[
]T
управлений и выходов ОУ; v(t) =
v1(t) ... vm(t)
∈ Rm - вектор неизвест-
ных и неизмеряемых возмущений (включающих также неточность модели и
свойственные ОУ нелинейности); A(p), B(p), K(p) - полиномиальные матри-
цы от оператора дифференцирования p = d/dt соответствующих размеров.
Принято, что m = q, а также считается, что компоненты vi(t) - ограничены
и кусочно-дифференцируемы, а их первые производные ограничены. Кроме
того, считается, что многочлен k(λ) = det K(λ) = k0λl + k1λl-1 + · · · + kl
гурвицев (l = deg k(λ), k0 = 0, λ ∈ C). Последнее предположение означает
минимально-фазовость ОУ (6.2) по отношению возмущение/выход (см., на-
пример, [6, 8]).
Неопределенности модели и нелинейности системы рассматриваются как
возмущения. Оценки отдельных возмущений не зависит друг от друга, и про-
изводные от возмущений могут оцениваться независимо. Предлагаемая фор-
мулировка основана на методе управления c переменной структурой и адап-
тивных алгоритмах, в которых не требуется априорная информация относи-
тельно верхних границ возмущений и их производных. Наблюдатель нели-
нейных возмущений устойчив к различным типам возмущений. Проведен-
ный в [104] анализ устойчивости показывает, что ошибка оценки экспонен-
циально уменьшается до установившегося значения, которое определяется
выбранными при синтезе параметрами. Для иллюстрации метода, предло-
женная структура применяется к вертикальному валу системы магнитного
подшипника. Дисбаланс в массе ротора вызовет вибрацию во вращающихся
машинах. Балансировка ротора очень трудна, и часто возникает остаточный
дисбаланс. Проблему дисбаланса можно решить с помощью управления с
обратной связью. Одним из методов является компенсация сил дисбаланса
путем генерации электромагнитных сил подавления. Парирование сил дис-
баланса подразумевает прежде всего, что эти силы должны быть оценены.
Однако оценка сил дисбаланса является нетривиальной задачей. В [104] вра-
щательные возмущения и их производные оцениваются на основе линеари-
зованной модели вращательного движения. Приведенные в [104] результаты
моделирования показывают эффективность предложенного способа.
Метод цифрового управления для инверторного каскада источника беспе-
ребойного питания на основе интеллектуального регулятора выходного на-
пряжения и тока индуктора предложен в [105]. Ставится задача обеспечения
конечного времени переходного процесса дискретного времени для управляе-
мых переменных (выходное напряжение и ток инвертора). Помимо линейной
обратной связи по состоянию, которая обеспечивает расположение полюсов
61
ПФ замкнутой системы в начале координат (и тем самым конечного времени
переходного процесса [24, 50]), используется дискретный наблюдатель Луен-
бергера [24, 106, 107] для оценки тока нагрузки, а также других возможных
возмущений (например, параметров принятой модели и ее несоответствия
реальной системе). Предлагаемое решение способно гарантировать быстрый
динамический отклик, а также точную компенсацию непредсказуемых возму-
щений. Алгоритм управления требует только измерения выходного напряже-
ния и тока индуктора. Приведены результаты экспериментов на однофазном
2-кВА прототипе, показывающие эффективность предложенного подхода.
В [69, 108] в качестве иллюстрации применения предложенных там ал-
горитмов, реализующих процедуру синтеза наблюдателей состояний и воз-
мущений для нелинейных квазиканонических систем на основе декомпози-
ции, рассмотрена задача управления асинхронным электродвигателем, под-
верженного действию возмущений при неполноте измерений. Динамика элек-
тродвигателя в неподвижной системе координат (α, β) описывается уравне-
ниями [109, 110]
(
)
x1 = d1
d2P(x3)x2 - d5x1 + u
,
x2 = -P(x3)x2 + d4x4,
x3 = J-1(d2xT2STx1 - x4),
x4 = f(t),
где x1 = col {x, x} ∈ R2 - вектор токов статора, x2 = col {x, x } ∈ R2 -
вектор потокосцепления ротора, x3 - скорость вращения ротора, x4 - неиз-
вестный (неизмеряемый) момент нагрузки, u = col {uα, uβ } ∈ R2 - вектор
[
]
[
]
d3
x3
0
-1
управляющих воздействий, P (x3) =
> 0, S =
. Измеряемы-
−x3
d3
1
0
ми величинами считаются только токи статора x1(t) и скорость вращения ро-
тора x3(t). Ставится задача отслеживания заданной скорости вращения вала
двигателя при некоторой величине потока. Эта задача решается использова-
нием разрывного (релейного) векторного управления. Требуемые для форми-
рования управления потокосцепление ротора и возмущение (момент нагруз-
ки) оцениваются по данным измерений с помощью наблюдателя
(
)
Ż1 = d1
d2P(x3)z2 - d5x1 + u
1,
Ż2 = -P(x3)z2 + d4x4 + ν2
Ż3 = J-1(d2zT2STx1 - z4) + ν3,
Ż4 = ν4
с вектором состояния z ∈ R4 и вектором ν ∈ R4 сигналов коррекции. Эти сиг-
налы определяются в виде сигмоидных функций (см. [70] и выше, с. 52) от
ошибок оценивания по выходам εi = xi - zi, i = 1, 3. Аналитическое обосно-
вание алгоритма управления дано в основной части статьи [108], см. так-
же [69, 111]. Для рассматриваемого примера при конкретных значениях па-
раметров в [108] приведены результаты моделирования.
62
В [112] представлена робастная схема управления током синхронного
двигателя с постоянным магнитом (permanent-magnet synchronous motor
(PMSM)) и простым адаптивным наблюдателем возмущений. Робастный ре-
гулятор реализуется путем включения адаптивного элемента на этапе гене-
рации опорного напряжения с использованием управления в прямой связи.
Из-за изменяющейся во времени динамики и высокочастотной пропускной
способности неопределенностей в практических системах PMSM-приводов
адаптивный элемент выбирается просто как функция оценки неопределен-
ности, которая адаптивно меняется в зависимости от условий эксплуатации.
Затем частотные режимы функции неопределенности вносятся в управляю-
щее воздействие, на основе чего выполняется робастное управление силой
тока. В [112] используется модель динамики двигателя в связанных с рото-
ром координатах
diq
(6.3)
vq = Roiq + Lqo
+Ldoωrid + ωrψfo + fq,
dt
diq
(6.4)
vd = Roid + Ldo
-Lqoωrid + fd,
dt
3P
(
)
(6.5)
Te =
ψfoiq - idiq(Lqo - Ldo)
+fTe,
2
где ωr - угловая скорость вращения электрического поля; vd и vq - напряже-
ния статорной обмотки по d- и q-осям, соответственно; id и iq - токи статорной
обмотки по d- и q-осям; Ld и Lq - индуктивности статорной обмотки по d-
и q-осям; ψfo - потокосцепление, вызванное постоянным магнитом; R - сопро-
тивление на фазу; P - число пар полюсов, Te - электромагнитный момент; ин-
декс “o” означает номинальный режим; fq, fd, fTe представляют набор неопре-
деленностей вызванных соответственно вариациями параметров, побочными
гармониками потока и другими неучтенными неопределенностями. При син-
тезе адаптивного наблюдателя принято во внимание, что гармонические со-
ставляющие, которые входят в выход инвертора, не коррелируют с дискре-
тизованными задающими токами, поэтому широтно-импульсно модулирован-
ный (ШИМ) инвертор источника напряжения можно рассматривать как экс-
траполятор нулевого порядка с передаточной функцией H(s) =1-e-sTs,где
T - интервал квантования (дискретизации по времени), s ∈ C - аргумент
преобразования Лапласа [50]. Для синтеза алгоритма управления и наблюда-
теля возмущений уравнения (6.3), (6.4) представляются в дискретизованном
виде, наблюдатель состояния копирует разностные уравнения модели объ-
екта, а входящая в них оценка возмущений рекуррентно идентифицирует-
ся с использованием градиентного метода [102, 113] по квадрату отклонения
оценок токов статорной обмотки от их измеренных значений iq(kT ), id(kT ).
В [112] проведен анализ сходимости процедуры идентификации и приведены
результаты разнообразных экспериментальных исследований на лаборатор-
ной установке.
В [114] представлена робастная схема управления током с дискретным
временем, обладающая высокой пропускной способностью для преобразова-
телей с широтно-импульсной модуляцией (voltage-source pulsewidth-modulated
(VS-PWM) converter). Используется модель преобразователя в уравнениях
63
состояния
(6.6)
x=Ac0x+Bc0u+Gc0
f,
где
[
]T
[
x=
iq id
,
u=
vq - ωL0id vd + ωL0iq
]T, f =[fq fd]T;
vd, vq, id, iq - напряжения и токи преобразователя по d- и q-осям; L - ин-
дуктивность нагрузки; R -активное сопротивление нагрузки на фазу; vsd,
vsq - компоненты противоэдс по d- и q-осям; матрицы номинальной системы
следующие:
Ac0 = -R0 L-10I2, Bc0 = L-10I2, Gc0 = -1/L-10I2.
Здесь I2 - единичная матрица порядка 2. В модели (6.6), u - эквивалентное
управляющее воздействие, а вектор f представляет совокупность неопреде-
ленностей, вызванных изменениями параметров, возмущением от противо-
эдс, и других неструктурированных неопределенностей. Далее в [114] рас-
сматривается дискретная по времени модель преобразователя
(6.7)
x(k + 1) = A0x(k) + B0u(k) + G0
f (k),
в которой номинальные матрицы уравнений состояния рассчитываются ап-
проксимацией Эйлера с заданным интервалом выборки (дискретизации T ).
При известном обобщенном возмущении f(k), традиционный предсказываю-
щий закон управления имел бы вид [115]
(
)
(6.8)
u(k) = B-10
x(k + 1) - A0x(k) - G0f(k)
,
где знаком “ * ” отмечены задающие сигналы. Закон управления (6.8) не учи-
тывает запаздывания в системе, что допустимо, если период квантования
существенно превосходит время вычислений управления по (6.8). Пропуск-
ная способность регулятора обычно уменьшается, чтобы учесть имеющееся
в системе практическое запаздывание. Это приводит к снижению точности
управления и неспособности регулятора отслеживать переходный процесс.
Компенсация запаздывания значительно увеличивает текущую пропускную
способность регулятора без увеличения частоты переключения инвертора.
В [114] для компенсации используется наблюдатель текущего состояния с
адаптивной внутренней моделью для неопределенностей системы. Предло-
женный наблюдатель имеет стандартный вид “расширенного фильтра Кал-
мана” с оцениванием на скользящих режимах и градиентным алгоритмом
идентификации (см., например, [22, 25]):
(6.9)
x=Ac0x + Bc0u + Gc0fˆ+ Ksm,
ˆ
(6.10)
f =γGc0
e,
в котором e = [eiq eid]T ≡ x - x, Ksm = [Ksiq sign(eiq) Ksid sign(eid)]T - век-
тор разрывных (“скользящих”) сигналов, sign(·) ∈ [-1, 1] - функция знака,
64
γ > 0 - выбранный разработчиком коэффициент усиления алгоритма иден-
тификации.
Чтобы продемонстрировать обоснованность и эффективность предложен-
ной схемы управления при различных условиях эксплуатации, в [114] бы-
ли проведены сравнительные оценочные испытания на подключенном к сети
преобразователем с широтно-импульсной модуляцией и к системе привода с
синхронным электродвигателем с постоянным магнитом с прямым приводом.
В [116] представлен подход для получения в реальном времени частоты,
фазового угла и симметричных составляющих процесса в энергосистеме, что
имеет большое значение для многих применений, таких как обеспечение ка-
чества электроэнергии и защита. Предлагаемый способ основан на концепции
адаптивного режекторного фильтра, который обеспечивает быструю и точ-
ную оценку симметричных составляющих при наличии вариаций частоты и
амплитуды. Кроме того, система обеспечивает высокую степень невоспри-
имчивости и нечувствительности к помехам энергосистемы, гармоникам и
другим типам искажений, которые существуют в сетевом сигнале. В [116]
представлены математические выводы для описания принципов работы и
результаты экспериментов, подтверждающие обоснованность аналитических
исследований.
Принимая во внимание изменение инерции в реальных системах, в [117]
предложена адаптивная схема управления для системы регулирования скоро-
сти синхронного двигателя с постоянным магнитом поверхностной установки
(surface-mounted permanent-magnet synchronous motors). Работа ориентирует-
ся на распространенный полеориентированный векторный подход к управле-
нию синхронным двигателем с постоянными магнитами (СДПМ) [118, 119].
По этой схеме вызывающие крутящий момент и магнитный поток компонен-
ты тока статора развязаны так, чтобы получить, насколько это возможно
в двигателях постоянного тока, независимое управление крутящим момен-
том и потоком. Обычно задающее значение i∗d тока по оси d устанавливается
нулевым, i∗d = 0, чтобы приблизительно устранить связь между угловой ско-
ростью и токами. Если регуляторы для двух токовых контуров работают
хорошо, то можно считать, что id ≡ 0, на основании чего в [117] используется
упрощенная модель СДПМ
R npψ
 uq
f
]
[iq]
-
[iq
d
L L
L
(6.11)
=
+
,
dt ω
Kt
B
 ω
TL
-
-
-
J
J
J
где iq - ток статора по оси q, uq - напряжение статора по оси q, np - число пар
полюсов, R - активное сопротивление статора, L - индуктивность статора,
ψf - потокосцепление магнитного потока ротора, Kt - постоянная крутящего
момента, ω - угловая скорость, B - коэффициент вязкого трения, J - момент
инерции, TL - нагрузочный момент.
Для обеспечения требований к качеству работы системы с обратной свя-
зью используется комбинированный способ управления, основанный на на-
блюдателе состояния расширенной системы с одновременным оцениванием
65
как собственно состояния объекта, так и возмущения. Предлагаемый в [117]
наблюдатель описывается системой
{
Ż1 = z2 - 2p(z1 - ω) + b0i∗q,
(6.12)
Ż2 = -p2(z1 - ω),
где (-p) - желаемое значение корня характеристического многочлена на-
блюдателя (кратности два), i = satiqmax (u) - функция насыщения задающей
величины тока iq с ограничением по модулю на уровне iqmax. Переменная
z1 является оценкой угловой скорости ротора ω, а z2 - оцен(ой приведен-
ных к угловому ускорению ω = a(t) + b0i∗q возмущений a(t) =
- Bω - TL+
)
+Kt(iq - i∗q) + Kti∗q
J-1 - b0iq, где коэффициент b0 = KtJ-1 и зависит от па-
раметров системы, в частности от момента инерции J.
Предлагаемый комбинированный способ управления в контуре скорости
имеет вид
(
)
z2
(6.13)
u0 = k(ω - z1), i∗q = satiqmax u0 -
,
b0
в котором k - коэффициент пропорциональной составляющей управления,
ω - задающее воздействие по угловой скорости.
Адаптивное управление вызвано целью парировать изменение инерцион-
ности нагрузки J. С этой целью в [117] разработана адаптивная схема управ-
ления путем анализа взаимосвязи характеристик управления по коэффици-
енту передачи в прямой связи и инерционностью системы. Идентификация
инерции J осуществляется подачей периодического с периодом T командно-
го воздействия по скорости ω(t + T ) = ω(t)s с последующим применением
градиентного метода идентификации.
В [116] разработана подсистема принятия решений, действующая на осно-
ве нечеткого логического вывода, предназначенная для автоматической на-
стройки коэффициента компенсации в прямой связи в соответствии с иден-
тифицированным значением инерции. В [117] приведены результаты моде-
лирования и экспериментальных исследований на специально разработанной
лабораторной установке, показывающие высокую скорость реакции предло-
женного метода управления на изменение инерции.
В [120] разработано семейство наблюдателей со скользящим режимом без
датчика скорости для приводов асинхронных двигателей. Три структуры ис-
следуются с целью определения их реализуемости, чувствительности пара-
метров и практической применимости. Наиболее существенной особенностью
всех схем является то, что они не требуют адаптации скорости вращения ро-
тора, то есть они по своей природе являются наблюдателями без датчиков.
Наиболее универсальным и робастным оказался наблюдатель потока полного
порядка с двойной системой отсчета. Две другие схемы были наблюдателя-
ми потока, реализованными в раме статора и раме ротора соответственно.
Они проще, чем первый, и используют инвариантность скользящего режи-
ма в заданном диапазоне неопределенностей и возмущений моделирования.
Для каждого наблюдателя в [120] приведены основные теоретические аспек-
ты, результаты анализа чувствительности параметров и детали реализации.
66
Представлены и обсуждены экспериментальные результаты с наблюдателем
с двойной системой отсчета, который считается авторами [120] наиболее под-
ходящими для практического применения. Продемонстрирована работа без
датчика с приводом с прямым вращающим моментом в скользящем режиме
на очень низких скоростях. Сделан вывод, что предложенные наблюдатели
представляют собой реальную альтернативу классическим адаптивным на-
блюдателям скорости потока.
Cтатья [121] посвящена высокоточному управлению позиционированием
двухступенчатого привода подачи. Конструкция системы управления ос-
нована на подходе эквивалентных входных возмущений (equivalent input-
disturbance, EID) для улучшения характеристик подавления помех. Проце-
дура проектирования иллюстрируется числовым примером. Результаты мо-
делирования показывают, что система управления EID не только парирует
возмущения, но также подавляет неопределенности и нелинейности в уста-
новке. Для сравнения предложенного метода с методом наблюдателя возму-
щения в [121] приведены результаты синтеза, моделирования и анализа для
числового примера привода подачи.
В [122] рассматривается применение алгоритмов оценки оптимального со-
стояния и оптимальной обратной связи по состоянию для управления актив-
ным магнитным подвесом в реальном времени. Реализован линейный квад-
ратичный гауссовский регулятор, состоящий из расширенного фильтра Кал-
мана и оптимального регулятора обратной связи по состоянию. Показано,
что этот регулятор обеспечивает улучшенную точность позиционирования
ротора, лучшую динамику системы, более высокую жесткость подшипника и
пониженное усилие управления по сравнению с обычно используемыми под-
ходами ПИД-управления. Кроме того, представлен способ компенсации вы-
званных дисбалансом сил и колебаний ротора с магнитым подвесом, основан-
ный на оценке неизвестных сил возмущения. Приведенные в [122] результаты
проверены экспериментально на испытательной установке, состоящей из вен-
тилятора, полностью находящегося на магнитном подвесе с массой ротора
250 кг и привода с односторонним магнитным подвесом, имеющего массу ро-
тора 25 кг. Алгоритм фильтрации реализован на плате контроллера dSpace
DS1103 PowerPC (время расчета для одной оси подшипника составило около
20 мкс).
Публикация [123] развивает подход управления со скользящим режимом
для систем с несогласованными (mismatched) неопределенностями с помощью
нелинейного наблюдателя возмущения. Рассматриваются нелинейные объек-
ты второго порядка
x1 = x2 + d(t),
(6.14)
x2 = a(x) + b(x)u,
y=x1,
где x1(t), x2(t) - переменные состояния, u - управляющее воздействие,
y(t) - выход, d(t) - возмущение, которое ограничено некоторым значением
d = supt>0 |d(t)|. В векторной форме (6.14) имеет вид
(6.15)
x = f(x) + g1(x)u + g2d(t), y = x1,
67
где
x = [x1,x2]T, f(x) = [x2,a(x)]T, g2 = [1,0]T.
Для системы (6.15) предлагается использовать нелинейный наблюдатель воз-
мущений [40, 124-126]
{
(
)
p = -lg2p - l
g2lx + f(x) + g1(x)u
,
(6.16)
d = p + lx,
гд
d, p и l - оценка возмущения, состояние наблюдателя и вектор коэффи-
циентов усиления наблюдателя (параметр проектирования) соответственно.
При разработке скользящей поверхности на основе оценки возмущения
в [123] разработан метод управления в скользящем режиме на основе на-
блюдателя возмущений для противодействия несогласованному возмущению.
Вводится выражение для поверхности скольжения
(6.17)
σ = x2 + cx1 + d
,
в котором c > 0 - параметр проектирования. Для обеспечения скользящего
режима по поверхности разрыва σ ≡ 0 предложен алгоритм управления
(
)
(6.18)
u=-b-1(x) a(x)+c(x2
d) + k sign(σ)
,
где k > 0 - параметр алгоритма (величина “полки реле”). Доказана теоре-
ма, согласно которой при выполнении дополнительных (к ограниченности
возмущения) предположений, что производная от возмущения d(t) ограниче-
на и затухает, limt→∞ d˙(t) = 0, а также что ошибка оценивания возмущений
ed(t) = d(t)
d(t) ограничена, e∗d = supt>0 |ed(t)|, замкнутая система (6.14),
(6.16), (6.17), (6.18) асимптотически устойчива если k > (c + lg2)e∗d и lg2 > 0.
Предложенный метод имеет следующие особенности. Во-первых, переклю-
чение коэффициента усиления требуется только для того, чтобы преодолеть
границы ошибки оценки возмущения, а не сами возмущения, что существенно
облегчает проблему “дребезга” (chattering) в скользящем режиме. Во-вторых,
предлагаемый способ сохраняет номинальные характеристики, то есть в от-
сутствие неопределенностей действует так же, как базовый регулятор со
скользящим режимом.
Моделированием в [123] проведен сравнительный анализ предложенного
алгоритма с “традиционным” алгоритмом управления со скользящим режи-
мом
(6.19)
σ = x2 + cx1, u = -b-1(x)(a(x) + cx2
+ ksign(σ)),
и с “интегральным” алгоритмом управления со скользящим режимом [127,
128]
t
σ = x2 + c1x1 + c2 x1(τ)dτ,
(6.20)
0
u = -b-1(x)(a(x) + c1x2 + c2x1 + k sign(σ)).
68
В качестве прикладного примера рассмотрена система магнитной левита-
ции (англ. - magnetic levitation, MAGLEV) - транспортной системы, в кото-
рой транспортное средство подвешено на направляющей рейке по принципу
электромагнитной подвески [129]. Результаты моделирования как на число-
вом, так и на прикладном примерах показывают, что предлагаемый метод
демонстрирует гораздо лучшую эффективность управления, чем базовые и
интегральные методы управления со скользящим режимом в отношении сни-
жения дребезга и обеспечения номинальных характеристик.
В [130] дается обзор методов оценки возмущения, неопределенности моде-
ли и путей ослабления их влияния в приводах с синхронным двигателем и по-
стоянными магнитами (СДПМ-приводы). Сначала рассматриваются различ-
ные помехи и неопределенности в СДПМ-приводах и в других приводах пере-
менного тока. Результаты показывают, что эти возмущения по-разному и про-
являются в разных контурах управления системы. Обсуждаются и обобща-
ются широко используемые в СДПМ-приводах существующие методы оценки
и парирования возмущений, как и другие соответствующие методы управле-
ния при обращении с помехами и неопределенностями. Статья заканчивается
обсуждением перспективных направлений в этой области.
7. Применение к задачам управления автомобилями
и их подсистемами
Публикация [131] посвящена применению стохастических оценок состоя-
ния в управлении динамикой автомобиля. Поскольку не все переменные со-
стояния транспортного средства и действующие на него возмущения могут
быть измерены, то для их оценки естественно использовать фильтр Кал-
мана. В [131] приведено три примера применения этого подхода к управ-
лению автомобилями. Первый из них - адаптивный круиз-контроль (Adap-
tive Cruise Control, ACC) - включает в себя продольное (дроссельное и тор-
мозное) управление автомобилем. В него входит управление скоростью ав-
томобиля в зависимости от дороги, курса и расстояния до предшествующих
транспортных средств и препятствий. Предполагается наличие датчиков для
обнаружения объектов в потенциальной возможности столкновения с автомо-
билем, например радиолокационных или лазерных зондов. Рассматривается
следующий пример, в котором продольная динамика окружающих объектов
и адаптивный круиз-контроль автомобиля сосредоточены в одном фильтре
Калмана. Предполагается наличие одной цели (автомобиля) на расстоянии d1
и с азимутом ϕ1 перед автомобилем. Для описания динамики системы из двух
автомобилей используется модель
v0x = a0x + u,
a0x = w1,
(7.1)
˙
1
d
= -v0x + v1x,
x
v1x = a1x,
 ˙a1x = w2,
69
в которой d1x, v1x, a1x - продольное положение, скорость и ускорение цели
по отношению к транспортному средству c круиз-контролем. Переменная u
обозначает ускорение (или замедление) транспортного средства c круиз-
контролем, которое считается известным. Кроме того, в ускорения автомо-
билей входят интегралы от белошумовых возмущений w. Считаются извест-
ными (измеряемыми) расстояние d1x, скорость v0x и азимут ϕ1. Учитываются
погрешности датчиков, которые моделируются аддитивными процессами бе-
лого шума. Для дискретизованной модели системы (7.1) строится стандарт-
ный фильтр Калмана.
Другим примером является удержание полосы движения (Lane Keeping).
Для бокового управления транспортным средством важно знать, какие воз-
мущения (например, боковые ветровое и возвышение дорожного полотна)
действуют на кузов автомобиля сбоку. Оценка возмущений может быть полу-
чена с помощью фильтра Калмана, который включает в себя простую модель
транспортного средства и требует разумного набора измерений. Самая про-
стая концепция оценки боковых возмущений заключается в сравнении угла
поворота рулевого колеса со скоростью рыскания. Например, при движении
по прямой дороге с боковым ветром скорость рыскания будет нулевой, но
угол поворота рулевого колеса не будет равен нулю, потому что водитель
будет противодействовать возмущению со стороны ветра. Эти данные могут
быть полезны для оценки возмущения. Основой фильтра Калмана является
модель транспортного средства, которая описывает всю интересующую ди-
намику, но при этом проста, насколько это возможно. Для оценки бокового
возмущения достаточно рассмотреть две степени свободы, связанные со ско-
ростью скольжения v и скоростью рыскания r. В [131] излагается следующая
модель. При известной скорости рыскания r и угле поворота рулевого ко-
леса δ можно оценить только одно боковое возмущение Fd1 (боковую силу),
действующее на транспортное средство. Точку приложения этого возмуще-
ния на кузов автомобиля выбирает инженер-конструктор. Второй датчик в
дополнение к скорости рыскания необходим, если должны быть определены
как возмущающая сила, так и возмущающий момент рыскания, действующие
на автомобиль. Соответствующие уравнения движения для модели с двумя
степенями свободы имеют вид
{
mv (v + U r) = Fy1 + Fd1 + Fy2,
(7.2)
Iz r = (Fy1 + Fd1) · a - Fy2b.
Неизвестные силы шин Fy1 и Fy2 можно смоделировать, используя коэф-
фициент жесткости при установившемся режиме разворота транспортного
средства. Далее для оценки боковых возмущений предлагается использовать
стандартный фильтр Калмана.
С точки зрения авторов [131], большинство фильтров Калмана можно рас-
сматривать как виртуальные датчики, потому что с помощью математиче-
ской модели и определенных измеряемых сигналов они дают возможность
оценить неизмеряемые переменные, которые либо слишком сложно непосред-
ственно измерить (потому что нет доступного датчика для этого), либо необ-
ходимые датчики слишком дороги. Затраты можно значительно снизить, ис-
70
пользуя существующие датчики в комбинации с фильтром Калмана. Напри-
мер, антиблокировочные тормозные датчики скорости вращения колес под-
ходят, чтобы определить скорость рыскания автомобиля и поперечное уско-
рение при определенных условиях работы. В качестве примера рассмотрено,
как сигнал частоты вращения колеса антиблокировочной системы (anti lock
braking system, ABS) может использоваться для определения скорости рыс-
кания автомобиля и угла скольжения шины на основе двухколейной модели
автомобиля.
В [69] для задачи управления топливоподачей в двигатель внутреннего
сгорания (ДВС) применен метод каскадного синтеза. В качестве объекта
управления рассматривается ДВС с искровым зажиганием, укомплектован-
ный топливными форсунками с центральной или распределительной (поци-
линдровой) системой впрыска и трехкомпонентовым нейтрализатором вы-
хлопных газов с λ-зондом непрерывного или релейного типа. Модель топ-
ливоподачи включает в себя динамику подачи топлива в цилиндр с учетом
выпадения части топлива в виде пленки с последующим его испарением, опи-
сываемую уравнениями (модель Акино) [132]
Tff = -mf + bfuf , mfc = (1 - X)uf + mf,
где mf - масса топлива, выпадающая в виде пленки на стенках впускного
воздуховода, mfc - масса топлива, подаваемая в цилиндр, uf - масса впрыс-
киваемого топлива (входной сигнал), bf , Tf - числа, характеризующие дина-
мику контура топливоподачи.
Динамика сгорания топливо-воздушной смеси в цилиндре описывается
уравнением
Tc λex = -λex + bcλin,
где Tc, bc - числа, характеризующие динамику сгорания.
Предполагается, что кислород и топливо сгорают в стехиометрической
пропорции 14,7. Несгоревший кислород
x(t) = mc(t) - 14,7m˙fc(t),
в случае его наличия, проходит через двигатель, выпускной коллектор и уча-
сток выхлопной трубы.
Решена задача управления выработки задания на впрыск топлива uf
с обеспечением заданного соотношения воздух-топливо, в частности сте-
хиометрического соотношения (x(t) = 0) при использовании трехкомпонент-
ных нейтрализаторов. Для синтеза закона управления используются методы
каскадного синтеза с использованием наблюдателя состояния [69], см. так-
же [1, раздел 4]. При наличии запаздывания в канале управления дополни-
тельно используется упредитель Смита [133].
В [134] рассмотрено применение наблюдателя и компенсатора синусои-
дальных возмущений для подавления вибраций в подвеске автомобиля, кото-
рые возникают из-за соприкосновения с неровной поверхностью. Динамика
движения автомобиля описывается следующей дифференциальных уравне-
71
ний
(
)
(
)
(7.3)
mbzb(t) = -cs
Żb(t) - Żw(t)
-k1
zb(t) - zw(t)
+ u(t),
(
)
(
)
(7.4)
mw zw(t) = -k2
Żw(t) - r(t)
-k1
zb(t) - zw(t)
− u(t),
где mb и mw - массы корпуса автомобиля и колеса соответственно; k1, k2 -
коэффициенты жесткости пружин, cs - коэффициент демпфирования; r(t) -
возмущение, действующее со стороны дорожного полотна; zb и zw - верти-
кальные координаты корпуса и колеса (точнее, их отклонения от равновесных
состояний, полученных при u(t) ≡ 0, r(t) ≡ 0) соответственно, u(t) - управ-
ляющая сила.
Рассматривается гармоническое внешнее возмущение r(t) = µ sin(ωt + ϕ1)
с неизвестными амплитудой µ, фазой ϕ1 и частотой ω, для описания которого
используется стандартное представление вида
(7.5)
r(t) + ω2
r(t) = 0.
Считается, что параметры системы известны, и также известна нижняя
граница частоты возмущений. На первом шаге выполняется оценка неизвест-
ной частоты возмущений, для чего на основе изложенного в [135, 136] подхода
строится адаптивный алгоритм идентификации, использующий, во избежа-
ние двукратного дифференцирования входного сигнала, введение фильтра
состояния третьего порядка (см. также [137-142], [25, § 4.8.5]). Далее полу-
ченная оценки частоты возмущений используется для синтеза регулятора,
подавляющего их влияние, [134, теорема 7].
В [143] предлагается адаптивное управление c активным подавлением воз-
мущения (active disturbance rejection control, ADRC), основанное на адаптив-
ном расширенном наблюдателе (adaptive extended state observer, AESO), для
устранения неопределенностей как в установке, так и в датчиках. Усиление
расширенного наблюдателя состояния (extended state observer, ESO) автома-
тически настраивается, чтобы уменьшить ошибки оценки обоих состояний и
“общего возмущения” по отношению к шуму измерения. Кроме того, удовле-
творительная работа системы с обратной связью достигается компенсацией
неопределенностей. В [143] показано применение регулятора такой структуры
для управления воздушно-топливным отношением (air-fuel ratio, AFR) бензи-
нового двигателя, которому свойственны значительные нелинейности харак-
теристик и параметрические неопределенности из-за неизвестного изменения
скорости, динамики топливного слоя и др. Кроме того, измерение искажает-
ся шумом датчика. Результаты эксперимента показывают, что предлагаемый
регулятор может обеспечить высокую точность воздушно-топливного отно-
шения несмотря на неопределенность динамики модели и шум измерений.
Кроме того, экспериментальное сравнение подтверждает эффективность вве-
дения усиления AESO, с помощью которого можно улучшить работу ADRC
по снижению влияния неопределенностей.
Задача синтеза закона управления для подавления вибраций в подвеске
автомобиля рассмотрена и в [144]. Возмущение со стороны дорожного полот-
на моделируется конечной суммой синусоидальных функций с неизвестными
72
частотами, амплитудами и фазами. Для описания вертикального движения
кузова используется следующая модель системы с двумя степенями свободы:
(
)
(
)
(7.6)
mbzb(t) = -cb
Żb(t) - Żu(t)
-kb
zb(t) - zu(t)
+ u(t),
(
)
(
)
mw zw(t) = -cb
Żw(t) - Żb(t)
-kb
zw(t) - zb(t)
-
(
)
(
)
(7.7)
−kt
zw(t) - r(t)
-ct
Żw(t) - r(t)
− u(t),
отличающаяся от (7.3), (7.4) тем, что она учитывает и демпфирование в
шине. Принято, что измеряются относительное положение кузова и колеса,
(zb - zw), смещение колеса относительно поверхности, (zw - r), а также ско-
рости Żb, Żw. Считается, что возмущения со стороны дороги можно описать
суммой гармонических составляющих
r(t) =
gi sin(ωit + ϕi)
i=1
с неизвестными амплитудами gi, частотами ωi и фазами ϕi. Целью управле-
ния является обеспечение близости к нулю значения вертикального ускорения
zb(t) кузова автомобиля. Как и в [134], параметры системы (7.7) считаются
известными.
В [144] отмечено, что так как (zw - r) измеряется, основным действующим
на систему возмущением является процесс
ct
ct
r(t) ≡
ωigi cos(ωit + ϕi),
mw
mw
i=1
который, как обычно [1], представляется через выход внешней линейной си-
стемы
(7.8)
w(t) = Sw(t),
r(t) = hT
w(t)
с w(t) ∈ R2q и матрицей S, зависящей от неизвестных частот возмущений.
Далее, аналогично описанной выше публикации [51] с использованием подхо-
да из [13] происходит параметризация источника возмущений и применяется
метод бэкстеппинга [145] для синтеза регулятора, стабилизирующего систему.
8. Прочие применения
Согласно [146] робастность систем управления движением можно пред-
ставить как функцию “жесткости”, которая вводится следующим образом.
Предположим, что x - положение управляемого объекта и f - полная при-
ложенная к объекту сила. Из уравнений движения следует что
(8.1)
f = g(x, x,x).
Жесткость κ определяется через частную производную:
∂f
(8.2)
κ=
∂x
73
Идеальное управление положением предотвращает любое отклонение поло-
жения от заданного при любом отклонении силы. При таком управлении κ
будет бесконечно большим. Естественно, интегратор в прямой цепи компенси-
рует постоянную ошибку и асимптотически δx будет стремиться со временем
к нулю. Однако такая функция не отражается в (8.2). С другой стороны, иде-
альное управление силой предотвращает отклонение силы при любом откло-
нения положения. Тем самым при идеальном управлении силой κ = 0. При
согласованном (compliance) управлении должно иметься соотношение меж-
ду положением и силой. Например, виртуальное согласованное управление
будет использовать механический импеданс, который вычисляется в регуля-
торе в соответствии с указанной динамикой. Поэтому жесткость может слу-
жить удобным показателем, представляющим цель движения. Робастность
системы управления движением всегда требует очень высокой жесткости в
регуляторе. В [146] показано, что управление ускорением осуществляет за-
данное движение одновременно с сохранением очень высокой устойчивости.
Ускорение является мостом между робастностью и жесткостью.
Для рассмотрения робастного управления движением с электродвигате-
лем в [146] определяется эквивалентное возмущение и рассматривается внеш-
нее неизмеряемое возмущение, действующее аддитивно с сигналом управле-
ния. Используется модель линейной SISO системы (с одним входом и од-
ним выходом), в которой уравнения состояния представлены в канонической
форме управляемости (каноническая форма фазовой переменной, см., напри-
мер, [24, 107, 147])
(8.3)
x=A0x+b0u+ed,
y = cx,
где A0, b0 обозначают “номинальные” матрицы уравнений состояния систе-
мы
d - эквивалентное возмущение, имеющее размерность силы или момента,
в котором учитывается как “сигнальная” составляющая внешнего возмуще-
ния d(t), приложенная аддитивно управлению на входе системы, так и откло-
нения матриц A, b уравнений состояния от их номинальных значений A0, b0.
В соответствии с принятой в [146] канонической формой уравнений состояния
[
]T
[
]T
e=
0, . . . , 0, 1
,b=
0, . . . , 0, K
и с аддитивным характером внешнего воз-
мущения все перечисленные возмущения можно эквивалентно представить
в виде аддитивного к управлению скалярного возмущени
d(t). Для этого
расширенного возмущения делается предположение, что оно является мно-
гочленом от времени с известной (заданной разработчиком) степенью p - 1,
т.е. может быть описано решением однородного дифференциального уравне-
d(t) = 0. Далее уравнения исходной системы объединяются с моделью
нияdpdt
возмущений и стандартным образом для полученной расширенной системы
строится наблюдатель состояния (см. [1, раздел 6]). С точки зрения авторов
обзора, такая модель возмущений может привести к существенным ошибкам,
поскольку вариации матриц уравнений состояния умножаются при пересчете
в возмущения на x(t) и на сигнал управления u(t), которые могут менять-
ся весьма разнообразным образом. Можно сделать вывод, что, хотя в [146]
об этом прямо не говорится, авторов [146] интересует только установившая-
ся (например, статическая) ошибка. Как отмечено в и [1, раздел 6], такой
подход к подавлению возмущений может быть осуществлен в рамках клас-
74
сического подхода с введением интегральной составляющей в закон управле-
ния для повышения порядка астатизма по возмущению [50, 54]. Заметим, что
возможность потери устойчивости замкнутой системы вследствие вариаций
параметров в [146] не рассматривается.
Далее в [146] приводится пример применения этого подхода к систе-
ме управления скоростью ω электродвигателя, моделируемой уравнением
J ω = KtIrefa - Tl, в котором Tl - момент нагрузки. Для оценивания эквива-
лентного возмущения, включающего кроме Tl вариации момента инерции и
крутящего момента двигателя, используются измерения угла поворота вала
двигателя.
Для практических применений введена методика оценки возмущения, что-
бы система управления движением была бы регулятором. Рассмотрено также
управление движением упругой структуры и идентификация механических
параметров.
Подавление мультигармонических возмущений в маятниковой системе с
инерционным маховиком в качестве движителя (маятник Шмида, [148-150]),
расположенной на подвижной платформе, рассмотрено в [151]. Как и в ря-
де других работ, в [152] возмущение δ(t) представляется суммой гармоник с
неизвестными параметрами и смещением. Принята линейная модель объек-
та с известными коэффициентами замкнутого через известную нелинейную
функцию от скалярного выходного сигнала, с учетом запаздывания по управ-
лению u(t) на время τ = const > 0:
(
)
(8.4)
a(p)y(t) = b(p)u(t - τ) + g(p)f
y(t)
+ e(p)δ(t), p = d/dt.
Считается, что измеряется только выход y, относительный порядок ОУ про-
изволен, а коэффициенты операторных многочленов в (8.4) известны. Для
идентификации возмущений модель (8.4) приводится к виду
(8.5)
y(t) = u(t)
f (t) +δ(t)σ(t) +
δi
(t),
i=1
где
δ(t) = σ(t) +
δi(t),
i=1
сигналыδi(t), u(t)
f (t) - выходы соответствующих фильтров состояния. Пре-
образованый процесс возмущенийδ(t) подлежит идентификации и последую-
щей компенсации. Для этого он описывается моделью
(8.6)
p2k+1δ(t) =θ1p2k-1δ(t) + ··· +θk-1p3δ(t) +θkδ(t),
в которую входят неизвестные параметры θ1, . . . , θk, соответствующие значе-
ниям неизвестных частот составляющих возмущение гармоник. Для оценки
этих параметров используется стандартная процедура идентификации гра-
диентного типа с введением фильтров состояния порядка 2k, чтобы исклю-
чить дифференцирование результатов измерений. Теоретические положения
75
доведены до экспериментальных результатов для маятника с маховичным
движителем, расположенным на тележке. Проведено сравнение с поведением
разомкнутой системы (с точки зрения авторов обзора, более показательным
было бы сравнение использования предложенного и типового регуляторов).
В [153] описывается фильтр Калмана для оценки ориентации сегментов
человеческого тела путем объединения сигналов гироскопа, акселерометра и
магнитометра от миниатюрных датчиков. Ферромагнитные материалы или
другие магнитные поля вблизи модуля датчика нарушают локальное магнит-
ное поле Земли и, следовательно, оценку ориентации, которая препятствует
многим (амбулаторным) применениям. В фильтре оцениваются ошибка сме-
щения гироскопа, ошибка ориентации и ошибка от магнитного возмущения.
Приведенные в [153] результаты показывают точные и бездрейфовые оценки
ориентации.
Подавление возмущений в микроэлектромеханическом (МЭМС, Micro-
Electro-Mechanical Systems, MEMS) гироскопе, связанных с влиянием неиз-
вестных перекрестных связей при управлении положением подвешенной мас-
сы в двух направлениях, рассмотрено в [154]. Принятый подход основан на
стратегии управления с активным подавлением возмущений (active distur-
bance rejection control, ADRC), при которой в реальном времени оцениваются
и компенсируются внутренние динамические процессы и внешние возмуще-
ния.
В качестве исходной модели движения подвижного груза взяты известные
уравнения
k
(8.7)
x + 2ξωn x + ω2nx + ωxyy - 2Ωy =
ud
(t),
m
k
(8.8)
ÿ+ 2ξyωy y + ω2yy + ωxyy + 2Ωx =
us
(t),
m
где x - перемещение груза вдоль оси привода OX; y - перемещение вдоль
оси чувствительности OY ; ωn, ωy - парциальные частоты собственных коле-
баний груза по соответствующим осям; ud(t), us(t) - управляющие сигналы по
осям привода и чувствительности; m - масса подвижного груза; параметр k -
общий коэффициент передачи чувствительного элемента, исполнительного
устройства и усилителя. Слагаемые 2Ω x и 2Ω x - кориолисовы ускорения, где
Ω - неизвестная (и подлежащая определению) изменяющаяся скорость угло-
вого вращения основания относительно оси OZ. Перекрестные связи между
осями представлены слагаемыми ωxyy и ωxyx.
Уравнение (8.7) записывается в виде x = fd + km-1ud, где функция fd
включает как слагаемые, представляющие внутреннюю динамику, так и
внешние возмущения w (которые, заметим, в (8.7) не учтены). Далее строит-
ся расширенная модель объекта, в которой “обобщенное возмущение” fd счи-
˙
тается постоянным,
f
d = 0. Для полученной модели третьего порядка стан-
дартным образом строится наблюдатель состояния. Закон управления с по-
давлением возмущения имеет вид ud = (u0
fd)mk-1, гд
f выработанная
наблюдателем оценка f(t), u0 выход ПД-регулятора с прямой связью по
второй производной (ускорению) от задающего воздействия r(t) и оценкам x,
76
x положения и скорости перемещения груза:
u0 = kp(r - x) + kd(r -ˆx) + r.
Сигнал управления по оси чувствительности us вырабатывается анало-
гичным алгоритмом вида us = (u0
fs)mk-1 с выходом u0 соответствую-
щего ПД-регулятора и оценко
fs возмущения по переменной y, имеющего
вид fs = -2ξyωy y - ω2yy - ωxyx - 2Ω x. Для нахождения скорости вращения Ω
сначала производится калибровка гироскопа в неподвижном состоянии. По-
лученный при этом калибровочный сигнал управления uscal используется вне
интервалов на которых x ≈ 0 для оценки угловой скорости
Ω=(us-uscal)k
(8.9)
2 xm
Результативность предлагаемого метода продемонстрирована путем моде-
лирования.
Cтратегия управления с активным подавлением возмущений использова-
на и в [155] для приведения движения по приводной оси МЭМС гироскопа в
резонанс и управления выходной амплитудой колебаний вдоль приводной оси
до фиксированного уровня. Уравнения наблюдателя и регулятора идентичны
приведенным в [154] уравнениям для приводной оси OX. В [155] выполнен
анализ устойчивости системы, который показывает, что и ошибка оценива-
ния, и ошибка отслеживания выходного сигнала по оси привода ограничены
и что верхние границы ошибок монотонно уменьшаются с увеличением шири-
ны полосы пропускания регулятора. Система управления промоделирована
и экспериментально тестирована на вибрационно-лучевом гироскопе с пьезо-
электрическим приводом, который является альтернативой МЭМС гироско-
пу для экспериментального исследования. Результаты исследования показа-
ли, что предлагаемый регулятор не только заставляет ось привода вибриро-
вать вдоль желаемой траектории, но и робастно компенсирует погрешности
изготовления, что делает характеристики гироскопа нечувствительными к
изменениям параметров и возмущениям.
Практическому применению наблюдателя для совместной оценки состоя-
ния объекта и возмущений с целью подавления колебаний прилипания-
скольжения в буровых установках посвящена публикация [156]. Синтез си-
стемы управления основан на распределенной модели буровой установки, ко-
торая преобразуется в систему обыкновенных дифференциальных уравнений
совместно с дифференциальными уравнениями в частных производных. Син-
тезируется наблюдатель, применение которого позволяет использовать толь-
ко измерения на поверхности. Задача управления формулируется как задача
стабилизации линейной системы с постоянными параметрами, на которую
действует постоянное неизвестное возмущение, вызванное силами кулонов-
ского трения, с учетом временных задержек в приводе и датчике. Для реше-
ния задачи использованы теоретические результаты из [157, 158].
Статья [159] посвящена задаче синтеза наблюдателей для политопных ли-
нейных систем с переменными параметрами (linear-parameter-varying, LPV)
77
и с неопределенными измерениями управляемых переменных. Неопределен-
ности в измерениях учитываются через весовые коэффициенты. Система с
переменными параметрами и с неопределенными весовыми коэффициента-
ми преобразуется к системе с переменными параметрами с неопределенно-
стью. Чтобы справиться с неопределенностями и неизвестными возмущения-
ми в процессе синтеза наблюдателя, авторы [159] предлагают использовать
наблюдатель скользящего режима с изменяемым по программе коэффици-
ентом усиления. Метод расчета наблюдателя на скользящем режиме разра-
ботан на основе результатов анализа установленной системы оценки ошибок.
Предложенный метод синтеза наблюдателя затем применяется к электри-
ческому наземному транспортному средству (electric ground vehicle, EGV),
в котором измерение продольной скорости считается неопределенным. При-
водятся сравнительные результаты экспериментальных испытаний, показы-
вающие преимущества предложенного метода синтеза системы управления и
наблюдателя.
Процесс управления уровнем жидкости в баке рассматривается и исследу-
ется как моделированем, так и экспериментально на лабораторной установке
в [160]. Для описания объекта используется типичная для промышленных
систем модель апериодического звена первого порядка и транспортного за-
паздывания
(8.10)
ARH(t) + H(t) = RQi(t - θ) + RHd
(t),
где H - уровень жидкости в баке; Qi - входной поток жидкости в бак (управ-
ление); Hd - неизмеряемое возмущение потока жидкости; A - площадь по-
перечного сечения бака; θ - временное запаздывание. Поскольку действие
значительных возмущений и помех обычно приводит к существенному сни-
жению качества системы управления промышленным процессом, в [160] пред-
лагается улучшенное каскадное управление, включающее управление с про-
гнозирующей моделью, ПИД-управление и оценивание возмущений. Наблю-
датель возмущений используется для их компенсации через прямую связь.
При синтезе наблюдателя используется инверсия модели объекта с введе-
нием дополнительного фильтра нижних частот, имеющего статический ко-
эффициент передачи, равный единице. Более подробно: сигнал управления
u(t) имеет вид u = v - w, где v(t) - управление, формируемое через глав-
ную обратную связь регулятора во внешнем контуре, реализующего управ-
ление с прогнозирующей моделью, а вспомогательный сигнал w(t) получает-
ся в виде w = -Q(s)e-θsu + Q(s)P (s)-1H, где H(t) - управляемая величина.
Возмущение d(t) считается приложенным аддитивно к выходу, т.е. приня-
то, что H = P (s)e-θs(+ d. Тогда п)осле преобразований нетрудно получить,
что H = P (s)e-θsv +
1 - Q(s)e-θs
d. В результате видно, что при выборе
Q(0) = 1 в установившемся режиме происходит полная компенсация постоян-
ного возмущения и величина H получается в виде H = P (s)e-θsv, т.е. от воз-
мущения не зависит. Передаточная функция фильтра выбирается из условия
обеспечения правильной функции Q(s)P (s)-1. Для рассматриваемой ПФ объ-
екта (8.10) в [160] принято Q(s) = (T s + 1)-1, T > 0. Представленные в [160]
результаты исследований показывают, что предлагаемый комбинированный
78
метод управления значительно улучшает возможность парирования возму-
щений по сравнению с алгоритмом управления без их оценки.
В работе [161] рассматривается сверхскоростной центробежный компрес-
сор, используемый для подачи сжатого воздуха в топливный элемент. В каче-
стве исходной модели, связывающей массу воздуха m в коллекторе компрес-
сора с давлением p в нем приняты уравнения (см. например, [162, 163])
(8.11)
m=qcp -qout,
γ RT
(8.12)
p=
(qcp - qout
),
MairV
где qcp и qout - массовые потоки воздуха, выходящего из компрессора и кол-
лектора соответственно, T - температура газа в коллекторе; Mair - молярная
масса атмосферного воздуха; γ - показатель адиабаты воздуха, R - универ-
сальная газовая постоянная, V - объем полости коллектора. Значение qout
зависит от ряда переменных, в том числе от управляющей величины θ - по-
ложения клапана [163]. После преобразований и упрощающих предположений
(8.12) приводится к виду
(8.13)
p=f1 +b1
θ,
где
γRT
f1 =
qcp,
Mair
а b1 - нелинейная функция от p.
В центробежных компрессорах зависимость массового расхода qc от уг-
ловой скорости вращения ротора ω и давления p выражается нелинейной
функцией qc = h(ω, p), вид и параметры которой весьма сложно получить.
В [161] используется упрощенная модель
∂h(ω, p)
∂h(ω, p)
(8.14)
qcp =
p+
ω,
∂p
∂p
а для описания динамики угловой скорости берется апериодическое звено
первого порядка
(8.15)
Tm ω + ω = ω
с некоторой постоянной времени Tm (получаемой экспериментально) и задан-
ным значением угловой скорости ω. Поэтому (8.14) записывается в виде
(8.16)
˙qcp = f2 + b2ω,
где
∂h(ω, p)
∂h(ω, p) ω
f2 =
p+
,
∂p
∂p Tm
1
∂h(ω, p)
b2 =
Tm
∂ω
79
Для оценивания в реальном времени поведения объекта и внешних возму-
щений в [161] используется расширенный наблюдатель состояния. С этой це-
лью вводятся переменные y1 = p, y2 = qcp, u1 = θ, u2 = ω, x1,i = yi, x2,i = fi,
hi
fi, i = 1,2. С учетом введенных обозначений уравнения (8.13), (8.16) за-
писываются в виде
{
x1,i = x2,i + biui, y = x1,i,
(8.17)
x2,i = hi, i = 1,2.
Для системы (8.17) строится наблюдатель состояния
{˙ˆx
1,i = x2,i + l1,i(x1,i - x1,i) + biui,
(8.18)
x2,i = l2,i(x1,i - x1,i),
коэффициенты усиления li,j которого выбираются стандартным образом на
основе желаемого расположения полюсов наблюдателя.
Полученные оценки используются в пропорционально-дифференциальном
алгоритме управления
(
)
(8.19)
ui = b-1i
ki(ri - x1,i) - x2,i + ri
,
где ki - коэффициент усиления регулятора, ri - задающее воздействие по
соответствующей переменной. Параметры b1, b2 определяются линеаризацией
относительно рабочей точки на основе экспериментальных данных.
В [161] приводятся результаты экспериментальной проверки предложен-
ного метода управления на лабораторной установке, включающей центро-
бежный компрессор, коллекторы, клапаны, контроллер реального времени,
датчики, воздушный фильтр и т.д., которые показали работоспособность
предложенной схемы управления. Выполнено экспериментальное сравне-
ние работы предложенного и стандартного пропорционально-интегрального
регуляторов.
Робастный синтез системы управления парогенератора, подверженного
внешним возмущениям, опирающийся на теорию систем с разделяемыми дви-
жениями с использованием глубоких обратных связей и разрывных управ-
лений [164-166], представлен в [167]. В качестве исходной, принята модель
третьего порядка
CnT = ks
PD - PT - kµPT q,
CbD = kmDQ - ks
PD - PT ,
TbQ = -DQ + u,
в которой PT - давление пара перед управляющим клапаном, PD - давле-
ние пара на выходе из котла, DQ - тепловой поток печи, q - угол открытия
клапана подачи пара на турбину, u - управляющее воздействие, меняющее
расход топлива в топке, Cn, ks, kµ, km, Cb, Tb - постоянные параметры, ко-
торые считаются неизвестными. Неизвестной считается также величина q,
80
которая рассматривается как неизмеряемое внешнее возмущение. Ставится
задача обеспечения, с некоторого момента времени t, заданного ограничения
на ошибку слежения e = PT - PTd , где PTd - требуемая величина давления,
причем только рассогласование e(t) может быть измерено.
После ряда преобразований исходная задача слежения сводится к стаби-
лизации системы
ė=-k1e
PD,
¯
P
D =-k
PD +DQ,
¯
D
Q = -k3 DQ + z,
(8.20)
z
= v + η(t),
гд
PD,DQ, z - новые переменные, введенные при преобразовании, v - (фик-
тивное) управляющее воздействие, η - неизмеряемое ограниченное возмуще-
ние.
Стабилизирующее управление v выбрано в релейной форме v = -M signz,
что обеспечивает возникновение скользящего режима на поверхности z ≡ 0.
Поскольку z непосредственно не измеряется, используется ее оценка, полу-
ченная наблюдателем пониженного (третьего) порядка для системы (8.20).
В [167] выполнено аналитическое исследование системы с предложенным
алгоритмом управления и приведены результаты моделирования для кон-
кретных параметров парогенератора и вида возмущений.
9. Заключение
В данной статье представленные в [1] теоретические результаты и методы
синтеза наблюдателей возмущений дополняются обзором их применений при
решении прикладных задач управления. Рассмотрены такие приложения, как
управление судами и подводными аппаратами, управление летательными ап-
паратами, роботами-манипуляторами, подавление узкополосных вибрацион-
ных колебаний, оценивание и подавление возмущений в электротехнических
системах, управление автомобилями и их узлами, а также некоторые прило-
жения к промышленным и медицинским системам.
Следует заметить, что многие из представленных в настоящей статье пуб-
ликаций содержат в себе не только применение известных теоретических ре-
зультатов к прикладным задачам, но и предлагают новые, достаточно широ-
кие подходы и методы синтеза. Поэтому далеко не всегда удается аттрибу-
тировать статью как “теоретическую” или “прикладную”, что, конечно, проя-
вилось при делении обзора на части 1 и 2, которое, в известной степени,
условно.
Заметим также большой интерес исследователей к публикациям, имею-
щим прикладную направленность. Так, статья [82] к моменту написания об-
зора получила 2396 цитирований в системе Scopus (в среднем - более 200 ци-
тирований в год), статья [146] - 1454 цитирования, статья [63] - 886 цитиро-
ваний, статья [37] - 760 цитирований, работа [2] - 653 цитирования в течение
81
четырех лет с момента выхода, статьи [123] - 606, [117] - 398 цитирований,
что выводит публикации по практическому применению наблюдателей воз-
мущений в число наиболее востребованных среди работ по автоматическому
управлению. Несомненно, интерес к данной тематике со стороны теоретиков
и разработчиков систем управления будет возрастать и в дальнейшем.
СПИСОК ЛИТЕРАТУРЫ
1.
Андриевский Б.Р., Фуртат И.Б. Наблюдатели возмущений. Методы и прило-
жения. Часть 1. Методы // АиТ. 2020. № 9. C. 3-61.
Andrievsky B.R., Furtat I.B. Disturbance Observers: Methods and Applications. I.
Methods. 2020. Vol. 81. No. 9. P. 1563-1610.
2.
Chen W.-H., Yang J., Guo L., Li S. Disturbance-Observer-Based Control and
Related Methods - An Overview // IEEE T. Ind. Electron. 2016. V. 63. No. 2.
P. 1083-1095.
3.
Zheng Q., Gao Z. Active Disturbance Rejection Control: Some Recent Experimental
and Industrial Case Studies // Control Theory and Technology. 2018. V. 16. No. 4.
P. 301-313.
4.
Jordán M.A., Bustamante J.L. A Speed-Gradient Adaptive Control with
State/Disturbance Observer for Autonomous Subaquatic Vehicles // Proc. 45th
IEEE Conf. on Decision and Control (CDC 2006), San Diego, CA, USA. Piscat-
away, NJ, USA: IEEE, 2006. 13-15 Dec. P. 2008-2013.
5.
Фрадков А.Л. Схема скоростного градиента и ее применения в задачах адап-
тивного управления // АиТ. 1979. № 9. С. 90-101.
Fradkov A.L. A Scheme of Speed Gradient and Its Application in Problems of
Adaptive Control // Autom. Remote Control. 1979. V. 40. No. 9. P. 1333-1342.
6.
Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамиче-
скими объектами. М.: Наука, 1981.
7.
Андриевский Б.Р., Стоцкий А.А., Фрадков А.Л. Алгоритмы скоростного гра-
диента в задачах управления и адаптации. Обзор // АиТ. 1988. № 12. С. 3-39.
Andrievsky B.R., Stotsky A.A., Fradkov A.L. Velocity Gradient Algorithms in Con-
trol and Adaptation. A Survey. // Autom. Remote Control. 1988. V. 49. No. 12.
P. 1533-1564.
8.
Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное
управление сложными динамическими системами. СПб.: Наука, 2000.
9.
Andrievsky B. Speed-Gradient Method in Control Problems for Mobile Mechanical
Systems // Mathematics in Engineering, Science and Aerospace. 2019. V. 10. No. 4.
P. 617-641.
10.
Jordán M.A., Bustamante J.L., Pinna-Cortinas J.M. Design of Adaptive Con-
trol Systems for ROVs Using Inverse Dynamics and State/Disturbance Observa-
tion // Proc. 6th Argentine Symp. Computing Technology (ASSE 2005) Rosario,
Argentina. SADIO, 2005. Aug. 29-31.
11.
Basturk H.I., Doblack J., Krstic M. Air Cushion Adaptive Disturbance Cancellation
for the Reduction of Wave Induced Motion of Ramp-Connected Ships // Proc. 11th
Int. Conf. Fast Sea Transportation (FAST 2011). Amer. Soc. Naval Engineers, 2011.
P. 114-121.
12.
Sorensen A.J., Egeland O. Design of Ride Control System for Surface Effect Ships
Using Dissipative Control // Automatica. 1995. Feb. V. 31. No. 2. P. 183-199.
82
13.
Никифоров В.О. Наблюдатели внешних детерминированных возмущений I.
Объекты с известными параметрами // АиТ. 2004. № 10. С. 13-24. URL:
http://mi.mathnet.ru/at1642.
Nikiforov V.O. Observers of External Deterministic Disturbances. I. Objects with
Known Parameters // Autom. Remote Control. 2004. V. 65. No. 10. P. 1531-1541.
14.
Никифоров В.О. Наблюдатели внешних детерминированных возмущений II.
Объекты с неизвестными параметрами // АиТ. 2004. № 11. С. 40-48. URL:
http://mi.mathnet.ru/at1658.
Nikiforov V.O. Observers of External Deterministic Disturbances. II. Objects With
Unknown Parameters // Autom. Remote Control. 2004. V. 65. No. 11. P. 1724-
1732.
15.
Basturk H.I., Krstic M. Adaptive Wave Cancelation by Acceleration Feedback for
Ramp-Connected Air Cushion-Actuated Surface Effect Ships // Automatica. 2013.
V. 49. P. 2591-2602.
16.
Du J., Hu X., Krstić M., Sun Y. Robust Dynamic Positioning of Ships with Dis-
turbances Under Input Saturation // Automatica. 2016. V. 73. P. 207-214.
17.
Swaroop D., Hedrick J.K., Yip P.P., Gerdes J.C. Dynamic Surface Control for
a Class of Nonlinear Systems // IEEE T. Automat. Contr. 2000. V. 45. No. 10.
P. 1893-1899.
18.
Fossen T.I., Strand J.P. Passive Nonlinear Observer Design for Ships Using Lya-
punov Methods: Full-Scale Experiments with a Supply Vessel // Automatica. 1999.
Jan. V. 35. No. 1. P. 3-16.
19.
Hu X., Du J., Sun Y. Robust Adaptive Control for Dynamic Positioning of Ships //
IEEE J. Oceanic Eng. 2017. Oct. V. 42. No. 4. P. 826-835.
20.
Massey T., Shtessel Y. Continuous Traditional and High-Order Sliding Modes for
Satellite Formation Control // J. Guid. Control Dynam. 2005. July-Aug. V. 28.
No. 4. P. 826-831.
21.
Levant A. Universal SISO Sliding-Mode Controllers with Finite-Time Conver-
gence // IEEE T. Automat. Contr. 2001. Sep. V. 49. No. 9. P. 1447-1451.
22.
Уткин В.И. Скользящие режимы и их применения в системах с переменной
структурой. Наука: М., 1974.
23.
Utkin V., Guldner J., Shi J. Sliding Mode Control in Electromechanical Systems.
London: Taylor & Francis, 1999.
24.
Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического
управления с примерами на языке MATLAB. СПб: Наука, 1999.
25.
Андриевский Б.Р., Бобцов А.А., Фрадков А.Л. Методы анализа и синтеза нели-
нейных систем управления. М.-Ижевск: ИКИ, 2018.
26.
Brown M., Shtessel Y.B. Disturbance Rejection Techniques for Finite Reaching
Time Continuous Sliding Mode Control // Proc. American Control Conf. (ACC
2001), Arlington, Virginia, USA. V. 6. Piscataway, NJ: IEEE Publications, 2001.
June, 24. P. 4998-5003.
27.
Besnard L., Shtessel Y.B., Landrum B. Quadrotor Vehicle Control Via Sliding Mode
Controller Driven By Sliding Mode Disturbance Observer // J. Franklin I. 2012.
Vol. 349. No. 2. P. 658-684.
28.
Besnard L., Shtessel Y.B., Landrum B. Control of a Quadrotor Vehicle Using Slid-
ing Mode Disturbance Observer // Proc. AIAA Conf. Guidance, Navigation and
Control. 2007. Aug. P. Paper AIAA-2007-6316.
83
29.
Hall C.E., Shtessel Y.B. Sliding Mode Disturbance Observer-Based Control for a
Reusable Launch Vehicle // J. Guid. Control Dynam. 2006. Nov.-Dec. V. 29. No. 6.
P. 1315-1328.
30.
Lee H., Huang X., Yin H. Enhanced Sliding Mode Control for Missile Autopilot
Based on Nonlinear Disturbance Observer // Proc. Int. Joint Conf. Computational
Sciences and Optimization (CSO 2009), Sanya, Hainan, China. Piscataway, NJ,
USA: IEEE, 2009. 24-26 Apr. P. 210-213.
31.
Goldberg D.E. Genetic Algorithms in Search, Optimization and Machine Learning.
Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 1989.
32.
Растригин Л.А. Статистические методы поиска. М.: Наука, 1968.
33.
Nichols R.A., Reichert R.T., Rugh W.J. Gain Scheduling for H-Infinity Controllers:
A Flight Control Example // IEEE T. Contr. Syst. Technol. 1993. Jun. V. 1. No. 2.
P. 69-79.
34.
TC ISO/TC 20/SC 8. Flight Dynamics - Concepts, Quantities and Symbols -
Part 1: Aircraft Motion Relative to the Air. 1988. Apr.
URL: https://www.iso.org/ru/standard/5699.html.
35.
ГОСТ 20058-80. Динамика летательных аппаратов в атмосфере: Термины,
определения и обозначения. М.: Изд-во стандартов, 1981.
36.
Халил Х.К. Нелинейные системы / Под. ред. А.Л. Фрадкова. М.-Ижевск: Ре-
гулярная и хаотическая динамика: Ин-т компьютерных исследований, 2009.
37.
Xu H., Mirmirani M.D., Ioannou P.A. Adaptive Sliding Mode Control Design for
a Hypersonic Flight Vehicle // J. Guid. Control Dynam. 2004. Sep.-Oct. V. 27.
No. 5. P. 829-838.
38.
Yang J., Li S., Sun C., Guo L. Nonlinear-Disturbance-Observer-Based Robust
Flight Control for Airbreathing Hypersonic Vehicles // IEEE T. Aerosp. Electron.
Syst. 2013. V. 49. No. 2. P. 1263-1275.
39.
Буков В.Н. Вложение систем. Аналитический подход к анализу и синтезу мат-
ричных систем. Калуга: Изд-во научной литературы Н.Ф. Бочкаревой, 2006.
40.
Yang J., Chen W.-H., Li S. Non-Linear Disturbance Observer-Based Robust Con-
trol for Systems with Mismatched Disturbances/Uncertainties // IET Control The-
ory A. 2011. V. 5. No. 18. P. 2053-2062.
41.
Levant A. High-Order Sliding Models, Differentiation and Output-Feedback Con-
trol // Int. J. Control. 2003. June-July. V. 9. No. 10. P. 924-941.
42.
Levant A. Quasi-Continuous High-Order Sliding-Mode Controllers // IEEE T. Au-
tomat. Contr. 2005. Nov. V. 50. No. 11. P. 1812-1816.
43.
Shtessel Y.B., Shkolnikov I.A., Levant A. Guidance and Control of Missile Inter-
ceptor Using Second-Order Sliding Modes // IEEE T. Aerosp. Electron. Syst. 2009.
V. 45. No. 1. P. 110-124.
44.
Pyrkin A.A., Bobtsov A.A., Kolyubin S.A., et al. Output Controller for Quad-
copters with Wind Disturbance Cancellation // Proc. 2014 IEEE Conf. on Control
Applications (CCA 2014), Antibes, France. IEEE, 2014. P. 166-170.
45.
Бобцов А.А. Робастное управление по выходу линейной системой с неопреде-
ленными коэффициентами // АиТ. 2002. № 11. С. 108-117.
URL: http://mi.mathnet.ru/at2180.
Bobtsov A.A. Robust Output-Control for a Linear System with Uncertain Coeffi-
cients // Autom. Remote Control. 2002. V. 63. No. 11. P. 1794-1802.
84
46.
Бобцов А.А., Капитонов А.А., Николаев Н.А. Управление по выходу нелиней-
ными системами с неучтенной динамикой // АиТ. 2010. № 12. С. 3-10.
Bobtsov A.A., Kapitonov A.A., Nikolaev N.A. Control Over the Output of Nonlin-
ear Systems with Unaccounted-Dynamics //Autom. Remote Control. 2010. V. 71.
No. 12. P. 2497-2504.
47.
Caverly R., Forbes J.R., Danowsky B., Suh P.M. Gust-Load Alleviation of a Flex-
ible Aircraft using a Disturbance Observer // Proc. AIAA Guidance, Navigation,
and Control Conf., AIAA SciTech Forum, (AIAA 2017-1718). Grapevine, Texas,
USA: AIAA, 2017. P. 1-15.
48.
Schrijver E., van Dijk J. Disturbance Observers for Rigid Mechanical Systems:
Equivalence, Stability, and Design // J. Dyn. Sys., Meas., Control. 2002. Dec.
Vol. 124. No. 4. P. 539-548.
49.
Sun J., Wang C., Xin R. Anti-Disturbance Study of Position Servo System Based
on Disturbance Observer // IFAC-PapersOnLine. 2018. V. 51. No. 4. P. 202-207.
50.
Бесекерский В.А., Попов Е.П. Теория систем автоматического регулирования.
Изд. 4-е, перераб. и дополн. СПб: “Профессия”, 2003. 752 С.
51.
Demircioglu H., Basturk H.I. Adaptive Attitude and Altitude Control of a Quadro-
tor Despite Unknown Wind Disturbances // Proc. 56th Annual Conf. Decision and
Control (CDC 2017), Melbourne, Australia. V. 2018-January. 2018. P. 274-279.
52.
Umeno T., Hori Y. Robust Speed Control of DC Servomotors Using Modern Two
Degrees-of-Freedom Controller Design // IEEE T. Ind. Electron. 1991. Oct. V. 38.
No. 5. P. 363-368.
53.
Umeno T., Kaneko T., Hori Y. Robust Servosystem Design with Two Degrees of
Freedom and Its Application to Novel Motion Control of Robot Manipulators //
IEEE T. Ind. Electron. 1993. Oct. V. 40. No. 5. P. 473-485.
54.
Попов Е.П. Теория линейных систем автоматического регулирования и управ-
ления: Учебное пособие для втузов. - Второе издание, пероработанное и до-
полненное. М.: Наука, Главная редакция физико-математической литературы,
1989.
55.
Ohishi K., Ohnishi K., Miyachi K. Torque-Speed Regulation of DC Motor Based
on Load Torque Estimation Method // Proc. Int. Power Electronics Conf. (IPEC-
Tokyo ’83) Tokyo, Japan / Ed. by D. Gakkai. Inst. Electrical Engineers of Japan,
1983. March 27-31. V. 2. P. 1209-1218.
56.
Ohnishi K. New Development of Servo Technology in Mechatronics // IEEE T. Ind.
Applicat. 1987. Vol. 107. No. 1. P. 83-86.
57.
Elmali H., Olgac N. Sliding Mode Control With Perturbation Estimation (SMCPE):
A New Approach // Int. J. Control. 1992. V. 56. No. 4. P. 923-941.
58.
Eom K., Suh I., Chung W., Oh S.-R. Disturbance Observer Based Force Control
of Robot Manipulator Without Force Sensor // Proc. IEEE Int. Conf. on Robotics
and Automation. V. 4. 1998. P. 3012-3017.
59.
Hacksel P., Salcudean S. Estimation Of Environment Forces and Rigid-Body Ve-
locities Using Observers // Proc. IEEE Int. Conf. on Robotics and Automation.
V. 2. 1994. P. 931-936.
60.
Lewis F., Abdallah C., Dawson D. Control of Robot Manipulators. Macmillan Pub-
lishing Company, 1993.
61.
Oh H., Chung W. Disturbance-Observer-Based Motion Control of Redundant Ma-
nipulators Using Inertially Decoupled Dynamics // IEEE/ASME T. Mechatronics.
1999. V. 4. No. 2. P. 133-146.
85
62.
Johnson C. Accommodation Of Disturbances in Optimal Control Problems // Int.
J. Control. 1972. V. 15. No. 2. P. 209-231.
63.
Chen W.-H., Ballance D.J., Gawthrop P.J., O’Reilly J. A Nonlinear Disturbance
Observer for Robotic Manipulators // IEEE T. Ind. Electron. 2000. Aug. V. 47.
No. 4. P. 932-938.
64.
Norrlöf M. An Adaptive Iterative Learning Control Algorithm with Experiments on
An Industrial Robot // IEEE T. Robot. Automat. 2002. V. 18. No. 2. P. 245-251.
65.
Moore K. Iterative Learning Control - An Expository Overview // Applied and
Computational Controls, Signal Processing and Circuits. 1998. V. 1.
66.
Bien Z., Xu J.-X. Iterative Learning Control: Analysis, Design, Integration and
Application. Kluwer Academic Publishers, 1998.
67.
Emelianova J., Pakshin P., Galkowski K., Rogers E. Stability of Nonlinear Discrete
Repetitive Processes with Markovian Switching // Syst. Control Lett. 2015. V. 75.
P. 108-116.
68.
Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. М.:
Мир, 1986.
69.
Краснова С.А., Уткин В.А. Каскадный синтез наблюдателей состояния дина-
мических систем. М.: Наука, 2006.
70.
Kochetkov S.A., Krasnova S.A., Utkin V.A. Block Design of Robust Electrome-
chanical Systems // Proc. IEEE Int. Workshop on Variable Structure Systems.
V. 2016-July. 2016. P. 86-91.
71.
Краснова С.А. Каскадный синтез системы управления манипулятором с учетом
динамики электроприводов // АиТ. 2001. № 11. С. 51-72.
Krasnova S.A. Cascade Design of a Manipulator Control System with Consideration
for Dynamics of Electric Drives // Autom. Remote Control. 2001. V. 62. No. 11.
P. 1803-1824.
72.
Krasnova S.A., Utkin V.A., Utkin A.V. Direct Method of Manipulator Endpoint
Control Synthesis // IFAC Proc. Volumes. 2008. V. 41. No. 2. P. 2388-2393.
73.
Zeinali M., Notash L. Adaptive Sliding Mode Control With Uncertainty Estimator
for Robot Manipulators // Mech. Mach. Theory. 2010. V. 45. No. 1. P. 80-90.
74.
Islam S., Liu X. Robust Sliding Mode Control for Robot Manipulators // IEEE
Trans. Ind. Electron. 2011. V. 58. No. 6. P. 2444-2453.
75.
Sun T., Pei H., Pan Y., et al. Neural Network-Based Sliding Mode Adaptive Con-
trol for Robot Manipulators // Neurocomputing. 2011. V. 74. No. 14-15. P. 2377-
2384.
76.
Broomhead D.H., Lowe D. Multivariable Functional Interpolation and Adaptive
Networks // Complex Systems. 1988. V. 2. P. 321-355.
77.
Madonski R., Kordasz M., Sauer P. Application Of a Disturbance-Rejection Con-
troller for Robotic-Enhanced Limb Rehabilitation Trainings // ISA Trans. 2014.
V. 53. No. 4. P. 899-908.
78.
Tonietti G., Schiavi R., Bicchi A. Design and Control of a Variable Stiffness Ac-
tuator for Safe and Fast Physical Human/Robot Interaction // Proc. IEEE Int.
Conf. Robotics and Automation (ICRA 2005), Barcelona, Spain. V. 2005. 2005.
P. 526-531.
79.
Cheng G., Peng K. Robust Composite Nonlinear Feedback Control with Application
to a Servo Positioning System // IEEE Trans. Ind. Electron. 2007. V. 54. No. 2.
P. 1132-1140.
86
80.
Lin Z., Pachter M., Banda S. Toward Improvement of Tracking Performance-
Nonlinear Feedback for Linear System // Int. J. Control. 1998. May. V. 70. No. 1.
P. 1-11.
81.
Zhao S., Gao Z. An Active Disturbance Rejection Based Approach to Vibra-
tion Suppression in Two-Inertia Systems // Asian J. Control. 2013. V. 15. No. 2.
P. 350-362.
82.
Han J. From PID to Active Disturbance Rejection Control // IEEE Trans. Ind.
Electron. 2009. V. 56. No. 3. P. 900-906.
83.
Zheng Q., Chen Z., Gao Z. A Practical Approach to Disturbance Decoupling Con-
trol // Control Eng. Pract. 2009. V. 17. No. 9. P. 1016-1025.
84.
Zheng Q., Gao L.Q., Gao Z. On Validation of Extended State Observer Through
Analysis and Experimentation // J. Dyn. Syst., Meas., Control. 2012. Jan. Vol. 134.
No. 2.
85.
Miklosovic R., Radke A., Gao Z. Discrete Implementation and Generalization of the
Extended State Observer // Proc. American Control Conf. (ACC 2006). V. 2006.
2006. P. 2209-2214.
86.
Silva A.C., Landau I.D., Airimitoaie T.-B. Direct Adaptive Rejection of Unknown
Time-Varying Narrow Band Disturbances Applied to a Benchmark Problem //
Europ. J. Control. 2013. July. V. 19. No. 4. P. 326-336.
87.
Landau I.D., Silva A.C., Airimitoaie T.-B., et al. Benchmark on Adaptive
Regulation-Rejection of Unknown/Time-Varying Multiple Narrow Band Distur-
bances // Europ. J. Control. 2013. July. V. 19. No. 4. P. 237-252.
88.
Francis B.A., Wonham W.M. The Internal Model Principle of Control Theory //
Automatica. 1976. V. 12. No. 5. P. 457-465.
89.
Anderson B.D.O. From Youla-Kucera to Identification, Adaptive and Nonlinear
Control // Automatica. 1998. Dec. V. 34. No. 12. P. 1485-1506.
90.
Landau I.D., Alma M., Constantinescu A., et al. Adaptive Regulation - Rejection
Of Unknown Multiple Narrow Band Disturbances (A Review on Algorithms and
Applications) // Control Eng. Pract. 2011. V. 19. No. 10. P. 1168-1181.
91.
Landau I.D., Alma M., Martinez J.J., Buche G. Adaptive Suppression of Multi-
ple Time-Varying Unknown Vibrations Using an Inertial Actuator // IEEE Trans.
Control Syst. Technol. 2010. Nov. V. 19. No. 6. P. 1327-1338.
92.
Landau I.D., Constantinescu A., Rey D. Adaptive Narrow Band Disturbance Re-
jection Applied to an Active Suspension - An Internal Model Principle Approach //
Automatica. 2005. Apr. V. 41. No. 4. P. 563-574.
93.
Landau I.D., Constantinescu A., Alma M. Adaptive Regulation - Rejection of Un-
known Multiple Narrow Band Disturbances // Proc. 17th Mediterran. Conf. Con-
trol and Automation (MED’09), Thessaloniki, Greece. IEEE, 2009. 24-26 June.
P. 1056-1065.
94.
Airimitoaie T.-B., Landau I.D. Robust and Adaptive Active Vibration Control Us-
ing an Inertial Actuator // IEEE Trans. Ind. Electron. 2016. Oct. V. 63. No. 10.
P. 6482-6489.
95.
Aranovskiy S., Freidovich L.B. Adaptive Compensation of Disturbances Formed
As Sums of Sinusoidal Signals with Application to an Active Vibration Control
Benchmark // Europ. J. Control. 2013. July. V. 19. No. 4. P. 253-265.
96.
Ohishi K., Nakao M., Ohnishi K., Miyachi K. Microprocessor-Controlled DC Motor
for Load-Insensitive Position Servo System // IEEE Trans. Ind. Electron. 1987.
Vol. IE-34. No. 1. P. 44-49.
87
97.
Yokoyama T., Kawamura A. Disturbance Observer Based Fully Digital Controlled
PWM Inverter for CVCF Operation // IEEE Trans. Power Electron. 1994. V. 9.
No. 5. P. 473-480.
98.
Gokhale K., Kawamura A., Hoft R. Dead Beat Microprocessor Control of PWM
Inverter for Sinusoidal Output Waveform Synthesis // IEEE Trans. Ind. Appl. 1987.
Vol. IA-23. No. 5. P. 901-910.
99.
Kempf C.J., Kobayashi S. Discrete-Time Disturbance Observer Design for Sys-
tems with Time Delay // Proc. 4th Int. Workshop on Advanced Motion Control
(AMC’96-MIE), Tsu, Mie, Japan. Piscataway, NJ, USA: IEEE, 1996. 18-21 March.
P. 332-337.
100.
Kempf C.J., Kobayashi S. Disturbance Observer and Feedforward Design for a
High-Speed Direct-Drive Positioning Table // IEEE Trans. Control Syst. Technol.
1999. Sep. V. 7. No. 5. P. 513-526.
101.
Lee H.S., Tomizuka M. Robust Motion Controller Design for High-Accuracy Posi-
tioning Systems // IEEE Trans. Ind. Electron. 1996. V. 43. No. 1. P. 48-55.
102.
Goodwin G.C., Sin K.S. Adaptive Filtering Prediction and Control. Englewood
Cliffs: Prentice-Hall, 1984.
103.
Dash P., Jena R., Panda G., Routray A. An Extended Complex KAlman Filter for
Frequency Measurement of Distorted Signals // IEEE Trans. Instrum. Meas. 2000.
V. 49. No. 4. P. 746-753.
104.
Chen X., Su C.-Y., Fukuda T. A Nonlinear Disturbance Observer For Multivariable
Systems and Its Application to Magnetic Bearing Systems // IEEE Trans. Control
Syst. Technol. 2004. V. 12. No. 4. P. 569-577.
105.
Mattavelli P. An Improved Deadbeat Control for UPS Using Disturbance Ob-
servers // IEEE Trans. Ind. Electron. 2005. Feb. V. 52. No. 1. P. 206-212.
106.
Luenberger D.G. An Introduction to Observers // IEEE Trans. Automat. Control.
1971. Dec. V. 16. P. 596-602.
107.
Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука,
1976.
108.
Krasnova S.A., Utkin V.A. Prelimit Implementation of States and Disturbances
Observer on Sliding Modes // Proc. 2015 Int. Workshop on Recent Advances in
Sliding Modes, RASM 2015. Piscataway, NJ, USA: IEEE, 2015. 9-11 Apr.
109.
Чиликин М.Г., Ключев В.И., Сандлер А.С. Теория автоматизированного элек-
тропривода. М.: Энергия, 1979.
110.
Уткин В.А. Задачи управления асинхронным электроприводом // АиТ. 1993.
№ 12. С. 53-65.
Utkin V.A. Problems of the Control of Asynchronous Electric Drive // Autom.
Remote Control. 1993. V. 54. No. 12. P. 1769-1779.
111.
Краснова С.А., Мысик Н.С. Каскадный синтез наблюдателя состояния с нели-
нейными корректирующими воздействиями // АиТ. 2014. № 2. С. 106-128.
Krasnova S.A., Mysik N.S. Cascade Synthesis of a State Observer with Nonlinear
Correcting Influences // Autom. Remote Control. 2014. V. 75. No. 2. P. 263-280.
112.
Mohamed Y.A.-R.I. Design and Implementation of a Robust Current-Control
Scheme for a PMSM Vector Drive With a Simple Adaptive Disturbance Observer //
IEEE Trans. Ind. Electron. 2007. Aug. V. 54. No. 4. P. 1981-1988.
113.
Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных
систем управления. М.: Наука, 1981.
88
114.
Mohamed Y.-R., El-Saadany E. Robust High Bandwidth Discrete-Time Predic-
tive Current Control with Predictive Internal Model - A Unified Approach For
Voltage-Source PWM Converters // IEEE Trans. Power Electron. 2008. V. 23.
No. 1. P. 126-136.
115.
Habetler T.G. A Space Vector-Based Rectifier Regulator for AC/DC/AC Convert-
ers // IEEE Trans. Power Electron. 1993. V. 8. No. 1. P. 30-36.
116.
Yazdani D., Mojiri M., Bakhshai A., Joós G. A Fast and Accurate Synchroniza-
tion Technique for Extraction of Symmetrical Components // IEEE Trans. Power
Electron. 2009. V. 24. No. 3. P. 674-684.
117.
Li S., Liu Z. Adaptive Speed Control for Permanent-Magnet Synchronous Motor
System with Variations of Load Inertia // IEEE Trans. Ind. Electron. 2009. V. 56.
No. 8. P. 3050-3059.
118.
Blaschke F. Principle Of Field Orientation as Used in the New Transvektor Control
System for Induction Machines, (Das Prinzip der Feldorientierung, die Grundlage
fuer die TRANSVEKTOR- Regelung von Drehfeldmaschinen) // Siemens-Z. 1971.
V. 45. No. 10. P. 757-760.
119.
Волков Н.И., Миловзоров В.П.. Электромашинные устройства автоматики:
Учебник для вузов. М.: Высш. шк., 1986.
120.
Lascu C., Boldea I., Blaabjerg F. A Class of Speed-Sensorless Sliding-Mode Ob-
servers for High-Performance Induction Motor Drives // IEEE Trans. Ind. Electron.
2009. V. 56. No. 9. P. 3394-3403.
121.
She J.-H., Xin X., Pan Y. Equivalent-Input-Disturbance Approachanalysis and
Application to Disturbance Rejection in Dual-Stage Feed Drive Control System //
IEEE/ASME Trans. Mechatron. 2011. V. 16. No. 2. P. 330-340.
122.
Schuhmann T., Hofmann W., Werner R. Improving Operational Performance Of
Active Magnetic Bearings Using Kalman Filter and State Feedback Control // IEEE
Trans. Ind. Electron. 2012. V. 59. No. 2. P. 821-829.
123.
Yang J., Li S., Yu X. Sliding-Mode Control for Systems with Mismatched Uncer-
tainties via a Disturbance Observer // IEEE Trans. Ind. Electron. 2013. V. 60.
No. 1. P. 160-169.
124.
Chen W.-H. Nonlinear Disturbance Observer Based Control for Nonlinear Systems
with Harmonic Disturbances // IFAC Proc. Volumes. 2001. V. 34. No. 6. P. 329-
334. (Proc. 5th IFAC Sympos. on Nonlinear Control Systems 2001, St. Petersburg,
Russia, 4-6 July 2001).
125.
Chen W.-H. Disturbance Observer Based Control for Nonlinear Systems //
IEEE/ASME Trans. Mechatron. 2004. Dec. V. 9. No. 4. P. 706-710.
126.
Chen W.-H., Yang J., Guo L., Li S. Disturbance-Observer-Based Control and Re-
lated Methods - An Overview // IEEE Trans. Ind. Electron. 2016. Feb. V. 63.
No. 2. P. 1083-1095.
127.
Matthews G., DeCarlo R. Decentralized Tracking for a Class of Interconnected
Nonlinear Systems Using Variable Structure Control // Automatica. 1988. V. 24.
No. 2. P. 187-193.
128.
Utkin V., Shi J. Integral Sliding Mode in Systems Operating Under Uncertainty
Condition // Proc. Conf. Decision Control (CDC’96) Koba, Japan. 1996. Dec.
P. 4591-4596.
129.
Michail K., Zolotas A., Goodall R. Optimised Sensor Selection for Control and
Fault Tolerance Of Electromagnetic Suspension Systems: A Robust Loop Shaping
Approach // ISA Trans. 2014. V. 53. No. 1. P. 97-109.
89
130.
Yang J., Chen W.-H., Li S. et al. Disturbance/Uncertainty Estimation and Atten-
uation Techniques in PMSM Drives - A Survey // IEEE Trans. Ind. Electron. 2017.
V. 64. No. 4. P. 3273-3285.
131.
Venhovens P., Naab K. Vehicle Dynamics Estimation Using Kalman Filters //
Vehicle Syst. Dyn. 1999. V. 32. No. 2. P. 171-184.
132.
Dobner D.J. Dynamic Engine Models for Control Development. Part 1: Nonlinear
and Linear Model Formulation // Application of Control Theory in the Automotve
Industry / Ed. by M. A. Dorgham. 1983. V. SP4 of Proc. Int. Association for Vehicle
Design. P. 54-74.
133.
Smith J.M. Closer Control of Loops with Dead Time // Chem. Eng. Prog. 1957.
V. 53. No. 5. P. 217-219.
134.
Titov A.V., Pyrkin A.A., Bobtsov A.A., et al. Output Adaptive Control for Active
Suspension Rejecting Road Disturbance // Proc. Int. Conf. Control Applications
(CCA 2011), Denver, CO, USA. Piscataway, NJ, USA: IEEE, 2011. Sept. 28-30.
P. 527-531.
135.
Бобцов А.А., Пыркин А.А. Компенсация гармонического возмущения в услови-
ях запаздывания по управлению // Изв. РАН. Теория и системы управления.
2008. № 4. С. 19-23.
136.
Бобцов А.А., Пыркин А.А. Компенсация неизвестного синусоидального возму-
щения для линейного объекта любой относительной степени // АиТ. 2009. № 3.
С. 114-122. URL: http://mi.mathnet.ru/at436.
Bobtsov A.A., Pyrkin A.A. Compensation of Unknown Sinusoidal Disturbances in
Linear Plants of Arbitrary Relative Degree // Autom. Remote Control. 2009. V. 70.
No. 3. P. 449-456.
137.
Lion P.M. Rapid Identification of Linear and Nonlinear Systems // AIAA J. 1967.
V. 18. No. 5. P. 1835-1842.
138.
Lindorff D.P., Carrol R.L. Survey of Adaptive Control Using Lyapunov Design //
Int. J. Contr. 1973. V. 18. No. 5. P. 897-914.
139.
Narendra K.S., Kudva P. Stable Adaptive Schemes for System Identification and
Control. Part I, II, // IEEE Trans. Automat. Control. 1974. Vol. SMS-4. No. 6.
P. 542-560.
140.
Gawthrop P.J. Continuous-Time Self-Tuning Control. Letchworth, U.K.: Research
Studies Press, 1987.
141.
Demircioglu H., Karasu E. Generalized Predictive Control: A Practical Application
and Comparison of Discrete and Continuous-Time Versions // IEEE Contr. Syst.
Mag. 2000. V. 20. No. 5. P. 36-47.
142.
Fradkov A.L., Andrievsky B. Combined Adaptive Controller for UAV Guidance //
Europ. J. Contr. 2005. V. 11. No. 1. P. 71-79.
143.
Xue W., Bai W., Yang S., et al. ADRC With Adaptive Extended State Observer
and Its Application to Air-Fuel Ratio Control in Gasoline Engines // IEEE Trans.
Ind. Electron. 2015. V. 62. No. 9. P. 5847-5857.
144.
Basturk H.I. A Backstepping Approach for an Active Suspension System // Proc.
American Control Conf. (ACC 2016), Boston, MA, USA. AACC, 2016. July 6-8.
P. 7579-7583.
145.
Krstic M., Kanellakopoulos I., Kokotovic P. Nonlinear and Adaptive Control De-
sign. Wiley, 1995.
146.
Ohnishi K., Shibata M., Murakami T. Motion Control for Advanced Mechatron-
ics // IEEE/ASME Trans. Mechatron. 1996. V. 1. No. 1. P. 56-67.
90
147.
Luenberger D.G. Canonical Forms for Linear Multivariable Systems // IEEE Trans.
Automat. Control. 1967. June. V. 12. No. 3. P. 290-293.
148.
Spong M.W., Corke P., Lozano R. Nonlinear Control of the Reaction Wheel Pen-
dulum // Automatica. 2001. V. 37. P. 1845-1851.
149.
Безнос А.В., Гришин А.А., Ленский А.В., Охоцимский Д.Е., Формальский А.М.
Управление при помощи маховика маятником с неподвижной точкой подвеса //
Изв. РАН. Теория и системы управления. 2004. № 1. С. 27-38.
150.
Андриевский Б.Р. Глобальная стабилизация неустойчивого маятника с махо-
вичным управлением // Сб. Управление большими системами. 2009. Т. Вып. 24.
С. 258-280.
151.
Pyrkin A.A., Bobtsov A.A., Kapitanyuk Y.A., et al. Adaptive Cancellation of Un-
known Multiharmonic Disturbance Ffor Nonlinear Plant With Input Delay // Proc.
19th Mediterranean Conf. Control Automation (MED 2011), Corfu, Greece. Piscat-
away, NJ, USA: IEEE, 2011. 20-23 June.
152.
Pyrkin A.A., Smyshlyaev A., Bekiaris-Liberis N., Krstic M. Rejection of Sinusoidal
Disturbance of Unknown Frequency for Linear System with Input Delay // Proc.
American Control Conf. (ACC 2010), Baltimore, USA. IEEE, 2010. 30 June-2 July.
P. 5688-5693.
153.
Roetenberg D., Luinge H., Baten C., Veltink P. Compensation of Magnetic Distur-
bances Improves Inertial and Magnetic Sensing of Human Body Segment Orienta-
tion // IEEE Trans. Neural Syst. Rehab. Eng. 2005. V. 13. No. 3. P. 395-405.
154.
Fast B., Miklosovic R., Radke A. Active Disturbance Rejection Control of a MEMS
Gyroscope // Proc. American Control Conf. (ACC 2008). 2008. P. 3746-3750.
155.
Zheng Q., Dong L., Lee D., Gao Z. Active Disturbance Rejection Control for MEMS
Gyroscopes // IEEE Trans. Control Syst. Technol. 2009. V. 17. No. 6. P. 1432-1438.
156.
Basturk H.I. Observer-Based Boundary Control Design for the Suppression of Stick-
Slip Oscillations in Drilling Systems With Only Surface Measurements // J. Dy-
namic Systems, Measurement, and Control. 2017. Oct. Vol. 139. P. 104501-7.
157.
Krstic M. Delay Compensation for Nonlinear, Adaptive and PDE Systems. Basel,
Switzerland: Birkhäuser, 2012.
158.
Krstic M., Smyshlyaev A. Backstepping Boundary Control for First-Order Hyper-
bolic PDEs and Application to Systems With Actuator and Sensor Delays // Syst.
Control Lett. 2008. V. 57. No. 9. P. 750-758.
159.
Zhang H., Zhang G., Wang J. H Observer Design for LPV Systems with Un-
certain Measurements on Scheduling Variables: Application to an Electric Ground
Vehicle // IEEE/ASME Trans. Mechatron. 2016. V. 21. No. 3. P. 1659-1670.
160.
Chen X., Li J., Yang J., Li S. A Disturbance Observer Enhanced Composite Cas-
cade Control with Experimental Studies // Int. J. Control, Automation and Sys-
tems. 2013. V. 11. No. 3. P. 555-562.
161.
Zhao D., Zheng Q., Gao F., et al. Disturbance Decoupling Control of an Ultra-High
Speed Centrifugal Compressor for the Air Management of Fuel Cell Systems // Int.
J. Hydrogen Energ. 2014. V. 39. No. 4. P. 1788-1798.
162.
Vahidi A., Kolmanovsky I., Stefanopoulou A. Constraint Management in Fuel Cells:
A Fast Reference Governor Approach // Proc. 2005, American Control Conf. (ACC
2005), Portland, OR, USA. 2005. V. 6. P. 3865-3870.
163.
Zhao D., Dou M., Blunier B., Miraoui A. Control of an Ultra High Speed Centrifu-
gal Compressor for the Air Management of Fuel Cell Systems // Conf. Record -
IAS Annual Meeting (IEEE Industry Applications Society). 2012.
91
164. Уткин В.А. Метод разделения движений в задачах наблюдения // АиТ. 1990.
№ 3. С. 27-37.
Utkin V.A. Method of Separation of Motions in Observation Problems// Autom.
Remote Control. 1990. V. 51. No. 3. P. 300-308.
165. Уткин В.А. Инвариантность и автономность в системах с разделяемыми дви-
жениями // АиТ. 2001. № 11. С. 73-94.
Utkin V.A. Invariance and Independence in Systems with Separable Motion //
Autom. Remote Control. 2001. V. 62. No. 11. P. 1825-1843.
166. Краснова С.А., Уткин В.А., Уткин А.В. Блочный подход к анализу и синтезу
инвариантных нелинейных систем слежения // АиТ. 2017. № 12. С. 26-53.
Krasnova S.A., Utkin V.A., Utkin A.V. Block Approach to Analysis and Design of
the Invariant Nonlinear Tracking Systems // Autom Remote Control. 2017. V. 78.
No. 12. P. 2120-2140.
167. Уткин А.В., Уткин В.А. Робастный синтез системы управления парогенера-
тором при воздействии внешних возмущений// Сб. тр. XIV Междунар. на-
уч. конф. “Устойчивость и колебания нелинейных систем управления (Кон-
ференция Пятницкого)”, 30 мая-01 июня 2018 г. Изд.-во: ИПУ РАН, Москва.
С. 445-448.
Utkin A.V., Utkin V.A. Robust Synthesis of the Control System of a Steam Gen-
erator Under the Action of External Disturbances // Proc. 2018 14th Int. Conf.
Stability and Oscillations of Nonlinear Control Systems (Pyatnitskiys Conf.), STAB
2018. 2018. P. 1-4.
Статья представлена к публикации членом редколлегии М.В. Хлебниковым.
Поступила в редакцию 22.10.2019
После доработки 16.03.2020
Принята к публикации 25.05.2020
92