Автоматика и телемеханика, № 9, 2020
Нелинейные системы
© 2020 г. Б.Р. АНДРИЕВСКИЙ, д-р техн. наук (boris.andrievsky@gmail.com)
(Институт проблем машиноведения РАН;
Санкт-Петербургский государственный университет;
Балтийский государственный технический университет,
Санкт-Петербург, Россия),
И.Б. ФУРТАТ, д-р техн. наук (cainenash@mail.ru)
(Институт проблем машиноведения РАН;
Университет ИТМО, Санкт-Петербург, Россия)
НАБЛЮДАТЕЛИ ВОЗМУЩЕНИЙ:
МЕТОДЫ И ПРИЛОЖЕНИЯ. ЧАСТЬ 1. МЕТОДЫ1
Обзор посвящен изложению истории развития и современного состоя-
ния теоретических методов построения наблюдателей возмущений, по-
явление которых в теории и практике управления восходит к середине
60-х гг. прошлого века и связано с расширением алгебраических методов
синтеза регуляторов, появлением компьютерно-ориентированных проце-
дур синтеза и усложнением круга решаемых задач и стремлением опти-
мизировать процесс управления. В обзоре описываются наблюдатели гар-
монических возмущений, излагается метод внутренней модели, рассмат-
риваются наблюдатели ограниченных возмущений и описываются мето-
ды оценки возмущений с использованием вспомогательных фильтров в
форме передаточных функций и наблюдателей состояния.
Ключевые слова: возмущения, оценивание, наблюдатель.
DOI: 10.31857/S0005231020090019
1. Введение
История появления наблюдателей возмущений в теории и практике управ-
ления восходит к середине 60-х гг. XX в. и связана с расширением ал-
гебраических методов синтеза регуляторов, появлению компьютерно-ориен-
тированных процедур синтеза, с усложнением круга решаемых задач и стрем-
лением оптимизировать процесс управления. В теории оптимального управ-
ления стало уделяться все большее внимание решению таких сложных задач,
как управление нелинейными и многосвязными (MIMO) системами, а исполь-
зуемые в то время методы управления часто оказывались более чувствитель-
ными к возущениям и помехам, чем классические [1]. В начале 1970-х гг.
появились многие публикации о неудаче в применении имеющихся методов
1 Результаты разделов 1-4 получены при финансовой поддержке Российского фонда
фундаментальных исследований (проект № 18-38-20037). Результаты раздела 5 получе-
ны в ИПМаш РАН в рамках госзадания Минобрнауки РФ (Рег. № НИОКТР АААА-А19-
119120290136-9).
3
оптимального управления из-за отсутствия робастности синтезированных ре-
гуляторов [2-4]. Решением явилось понимание важности учета при синтезе
регуляторов существенных возмущений, что в 1970-х гг. инициировало раз-
работку методов робастного управления [2, 5-7]. Для снижения чувствитель-
ности к возмущениям обычных наблюдателей состояния (Калмана, Луенбер-
гера) в то время были предложены робастные варианты наблюдателей, учи-
тывающие внешние неизмеряемые возмущения. Сюда же можно отнести и
наблюдателей неизвестных входных сигналов [1, 8-15]. В настоящее время
робастность по отношению к возмущениям и помехам, как и выполнение тре-
бований устойчивости и качества работы системы, стали ключевой задачей
синтеза регуляторов в обратной связи [1]. Как хорошо известно и из класси-
ческой теории управления, робастность по отношению к возмущениям может
достигаться подавлением влияния возмущений обратной связью или их ком-
пенсацией в разомкнутом контуре [16-18]. Возможно также комбинированное
управление, сочетающее оба метода [19, гл. 9].
Поскольку в рассматриваемых в данном обзоре публикациях принято, что
возмущения непосредственно не измеряются, то компенсация в разомкнутом
контуре становится подавлением возмущений по измерениям выхода, т.е. так-
же с помощью обратной связи. В обзорах [20, 21] аннотированы появившиеся
за период 1980-1998 гг. публикации по оцениванию изменяющихся во вре-
мени входных сигналов (в том числе и возмущений) для различных классов
динамических систем.
К публикациям по проблеме идентификации (восстановления) нестацио-
нарного входного сигнала, действующего на динамический объект относятся
публикации по аппроксимационным методам идентификации с использова-
нием глобальной аппроксимации [22-25], локальной аппроксимации [26-29],
по методам на основе теории инвариантных наблюдателей [30, 31], теории об-
ращения и смежных подходов [32-35] и некоторые другие публикации [36-39].
Чтобы преодолеть проблему, возникающую при невозможности непосред-
ственного измерения возмущений для их компенсации в разомкнутом конту-
ре, разработаны наблюдатели, позволяющие оценивать возмущения на основе
доступных измерению переменных состояния объекта и модели его динами-
ки. Робастность регулятора достигается использованием оценок возмущений
вместо их истинных значений. Тем самым неявно синтезируется регулятор
в обратной связи. Поэтому для задач подавления неизмеряемых возмуще-
ний разница между указанными двумя подходами имеет методический ха-
рактер, относящийся больше к способу синтеза регулятора, а не к свойствам
полученной системы. Поскольку для синтеза наблюдателя возмущений ис-
пользуется их представление как процесс на выходе некоторой динамической
системы, которая дополняет модель самого объекта управления, то в боль-
шом числе публикаций такая структура трактуется в качестве реализации
“принципа внутренней модели” (англ. Internal Model Principle), см., на-
пример, [1, 6, 13, 17, 40-52].
Методы синтеза наблюдателей возмущений получили дальнейшее разви-
тие в направлениях применения адаптивного подхода [48, 51, 53-64], скользя-
щих режимов [65-69], нелинейных наблюдателей [70, 71], наблюдателей для
объектов с запаздыванием [57, 59, 60, 63, 72-79] и других. Следует отметить,
4
что задача оценивания и подавления возмущений может иметь более широ-
кое применение, чем просто парирование влияния внешней среды: под воз-
мущениями можно также понимать неопределенность параметров объекта,
несоответствие принятой модели динамики объекта его поведению и действие
других факторов. Подавление таких возмущений позволяет повысить робаст-
ность системы управления по отношению к данным условиям [80].
В данной части обзора приводятся сведения о теоретических результатах
по наблюдателям возмущений. Оценка возмущений с использованием наблю-
дателей состояния описывается в разделе 2. Оценке возмущений с использо-
ванием вспомогательных фильтров в форме передаточных функций посвя-
щен раздел 3. Наблюдателям ограниченных возмущений посвящен раздел 4.
В разделе 5 описываются наблюдатели гармонических возмущений и связан-
ный с ними метод внутренней модели.
Практическому применению наблюдателей возмущений будет посвящена
следующая часть обзора [81].
В статье используются следующие обозначения и аббревиатуры: R мно-
жество вещественных чисел, C множество комплексных чисел, ОУ объ-
ект управления, ПФ передаточная функция, ИПВ инвариантные по вре-
мени (системы) системы с постоянными параметрами. Для таких систем в
литературе используется также термин “стационарные системы”. ЛМН ли-
нейное матричное неравенство (англ. Linear Matrix Inequality, LMI), SISO
системы системы со скалярными входами и выходами (англ. Single-Input,
Single-Output), MIMO системы системы с векторными входами и выходами
(англ. Multiple-Input, Multiple-Output). Для SISO и MIMO систем в отече-
ственной литературе часто используются термины “одноканальные” (“одно-
связные”) или соответсвенно “многоканальные” (“многосвязные”) системы.
2. Оценка возмущений с использованием наблюдателей состояния
Для решения поставленной задачи оценивания и компенсации адди-
тивных возущений в течение более 60-ти лет известен подход, связанный с
применением наблюдателей состояния (а в стохастической постановке оп-
тимальных фильтров Калмана-Бьюси), см., например, [82-88]. Приведем
краткие сведения.
В реальных условиях измерение вектора состояния ОУ, как правило,
неосуществимо из-за необходимости установки датчиков в труднодоступных
местах, измерения производных высоких порядков и т.д. Еще более сложной
задачей является измерение возмущений. Преодолеть (или уменьшить) эти
трудности можно, если наиболее полно использовать имеющуюся априорную
информацию о модели объекта и текущие измерения его входов и выходов.
С этой целью в систему управления вводится подсистема (алгоритм) оцени-
вания состояния объекта и возмущений. Рассматриваемая задача оценивания
состояния системы по доступной текущей информации о ее входах и выходах
принципиально разрешима, если имеется взаимно однозначное соответствие
между переменными вход-выход и состоянием объекта. Это соответствие име-
ется для полностью наблюдаемых объектов [84-87, 89, 90]. При этом предпо-
лагается, что имеется достаточно полная априорная информация об объекте
5
в виде его математической модели и значений параметров. Задачи оценива-
ния при неполной априорной информации относятся к робастным [9, 91-93]
или к адаптивным [64, 85, 89, 91, 94, 95].
Рассмотрим модель ОУ в виде уравнений состояния
x(t) = A(t)x(t) + B(t)u(t) + d(t),
(2.1)
y(t) = C(t)x(t) + v(t), x(t0) = x0, t ≥ t0.
Здесь x(t)∈ Rn вектор состояния объекта; u(t)∈ Rm, y(t)∈ Rl входной и
выходной векторы; A(t), B(t), C(t) известные матричные функции. Объ-
ект подвержен действию возмущений d(t) и шума (погрешности) измере-
ний v(t). Во время работы системы датчиками измеряются переменные u(t),
y(t), а переменные x(t), d(t), v(t)
не измеряются. Рассматривается зада-
ча получения оценки состояния объекта x(t), в некотором смысле близкой
к x(t). Для полностью наблюдаемого ИПВ объекта при отсутствии возму-
щений и шумов измерения можно получить асимптотически точную оценку
состояния с любым заданным временем переходного процесса. Более того,
полная наблюдаемость теоретически позволяет построить алгоритм оценива-
ния, обладающий конечным временем сходимости оценок состояния. Влияние
возмущений и шумов измерения приводит к появлению ошибок оценивания.
Наблюдатель состояния (идентификатор состояния, наблюдающее
устройство, наблюдатель) можно представить в виде модели объекта управ-
ления, на вход которой поступает то же управляющее воздействие, что и на
объект управления, и дополнительный сигнал коррекции (обратной связи),
который получается из невязки между выходами объекта и модели. Для ли-
нейных систем наблюдатель описывается уравнением [82-88]
x(t) = A(t)x(t) + B(t)u(t) + L(t)(y(t) - ŷ(t)),
(2.2)
ŷ(t) = C(t)x(t),
x(t0) = x0, t ≥ t0.
Здесь x(t)∈ Rn вектор состояния наблюдателя, служащий оценкой состоя-
ния объекта; ŷ(t)∈ Rl вектор выхода; L(t) подлежащая выбору при син-
тезе (n × l)-матрица коэффициентов обратной связи.
У наблюдателя (2.2) размерность вектора состояния x(t) такая же, как и
у объекта управления (так называемый наблюдатель полного порядка, или
наблюдатель Калмана), и равна n. Порядок наблюдателя можно понизить,
используя непосредственно содержащуюся в выходных переменных информа-
цию о состоянии объекта. Это дает возможность построить алгоритм оценива-
ния порядка n - p, где p = rank C. Такие наблюдатели пониженного порядка
часто называются наблюдателями Луенбергера [82-85]. Известны и наблюда-
тели повышенного порядка адаптивные наблюдатели [64, 85, 89, 94, 95].
Рассмотрим теперь ошибку оценивания ε(t) = x(t) - x(t). Вычитая из (2.1)
уравнение (2.2), получим
(2.3)
ε(t) = (A(t) - L(t)C(t)) ε(t) + d(t) - L(t)v(t), ε(t0) = ε0, t ≥ t0.
Как видно из (2.3), источниками ошибки ε(t) являются начальное рассогла-
сование ε0 = x0 - x0, возмущение d(t) и помеха измерений v(t). Динамика
переходного процесса ε(t) определяется матрицей Aobs(t) = A(t) - L(t)C(t).
6
Если матрица Aobs постоянна (не меняется со временем), то динамика ε(t)
определяется ее собственными числами. Если эти собственные числа имеют
отрицательные вещественные части, а возмущения d(t) и шумы v(t) отсут-
ствуют, то limt→∞ ε(t) = 0 для любых начальных значений x0, x0. Матри-
ца Aobs зависит от A, C и от выбираемой при синтезе матрицы L. Как из-
вестно [84-87, 90], для полностью наблюдаемого объекта всегда имеется такая
матрица L, что собственные числа матрицы Aobs будут заданными. Матри-
ца L влияет и на точность процесса оценивания при внешних воздействиях.
Как видно из (2.3), это влияние оказывается разным по отношению к возму-
щениям d(t), с одной стороны, и помехам измерений v(t) с другой. Поэтому
при определении L следует учитывать характеристики внешних воздейст-
вий, обеспечивая компромисс между требованиями быстродействия и точ-
ности системы. Обычно повышение быстродействия связано с увеличением
элементов матрицы L и, следовательно, с подавлением влияния возмущений
и усилением действия помех измерения. Для более детального анализа мож-
но использовать передаточные функции по ошибке от возмущений Wεd(s) и
помех Wεv(s), определяемые формулами:
(2.4)
Wεd(s) = (sIn - A + LC)-1 , Wεv(s) = - (sIn - A + LC)-1
L.
Оптимальный в стохастическом смысле выбор матрицы L(t) приводит к оп-
тимальному фильтру Калмана-Бьюси [86].
Перейдем к задаче оценивания возмущений и помех. Как видно из (2.3),
неизмеряемые внешние воздействия (возмущения и помехи) приводят к по-
явлению дополнительных составляющих ошибки оценивания переменных со-
стояния и снижают точность системы управления. Уменьшить их влияние
можно путем совместного оценивания состояния ОУ и неизмеряемых внеш-
них воздействий.
Основная идея использования наблюдателей для оценивания возмущений
и помех измерения состоит в следующем [84, 85, 96]. Для внешних воздейс-
твий строится некоторая математическая модель (“модель внешней среды”,
англ. “internal model of disturbances”) [6, 13, 17, 41-44]. В этой модели воз-
мущения обычно представлются как решения системы однородных диффе-
ренциальных (или разностных) уравнений с известными коэффициентами и
неизвестными начальными условиями, в которых и содержится вся неопреде-
ленность относительно внешних воздействий2. Затем модель внешних воздей-
ствий объединяется с моделью объекта управления, и для полученной расши-
ренной системы строится наблюдатель. Полученные с помощью наблюдате-
ля оценки содержат как собственно оценки состояния объекта, так и оценки
внешних воздействий. Естественно, что для этого требуется полная наблю-
даемость расширенной системы.
Подход к синтезу систем управления на основе постулирования динами-
ческих моделей для отдельных подсистем и сигналов нашел широкое приме-
нение и называется “принципом внутренних моделей” (“internal model prin-
ciple”). Для построения эффективных алгоритмов проектирования, оценива-
2 Случай неизвестных параметров модели среды рассматривается в рамках теории
адаптивного оценивания [56, 58, 64, 85, 87-89, 95, 97].
7
ния, управления системами модели в виде уравнений состояния могут зада-
ваться не только для возмущающих воздействий, но и для помех измерений,
командных сигналов (“эталонные модели”), динамики изменения параметров
объекта и т.д.
Процедура синтеза выглядит достаточно просто, если внешние процессы
N
можно представить как квазимногочлены выражения вида
eλitPi(t),
i=1
где λi ∈ C известные постоянные, Pi(t)
многочлены с заданными ко-
эффициентами [85, 98, 99]. Сюда относятся степенные функции, гармоники
с заданной частотой, экспоненты с заданным показателем затухания, про-
изведения гармоник на экспоненты и их линейные комбинации. Рассмотрим
процедуру оценивания для этого случая более подробно.
Пусть внешние воздействия d(t), v(t) можно представить в виде процессов
на выходе линейной системы, заданной уравнениями
(2.5)
x
˙
s(t) = As(t)xs(t), ys(t) = Csxs(t), xs(t0) = xs0 , t ≥ t0.
Здесь xs(t) ∈ Rns
вектор состояния “среды”, ys(t)∈ Rn+l
выход мо-
дели источника возмущений вектор внешних по отношению к объекту
[Cd]
воздействий, ys(t) = col {d(t), v(t)}; As, Cs известные матрицы; Cs =
;
Cv
Cd, Cv - подматрицы размеров n × ns, l × ns, определяющие связь между
состоянием xs(t) модели внешних воздействий, возмущениями d(t) и поме-
хами v(t) в (2.1). Начальное состояние xs0 системы (2.5) неизвестно. Вве-
дем расширенный вектор состояния, включающий состояние объекта и сре-
ды: x(t) = col {x(t), xs(t)}∈ Rn+ns . Объединяя уравнения (2.1), (2.5), полу-
чим уравнения расширенной системы в виде
(2.6)
x(t)=A¯x(t)+ Bu(t),y(t)=
Cx(t),
x(t0) = x0, t ≥ t0,
в которых матриц
A,B
C имеют следующую блочную структуру:
[
]
[
]
A Cd
B
B=
(2.7)
A=
,
,
C = [C, Cv
].
0ns×n As
0ns×m
Расширенная система (2.6) рассматривается как некоторый новый объект по-
рядка n = n + ns, для которого строится наблюдатель (2.2).
Рассмотрим возможность приведения системы с компенсацией возмуще-
ния с помощью наблюдателя (2.2) для расширенной системы (2.6) с “внут-
ренней моделью” возмущений [6, 13, 17, 41-44] к традиционному виду с кор-
ректирующими звеньями в прямой цепи и местной корректирующей обратной
связью [19, 100-102], аналогичным (3.2). Для определенности будем считать,
что возмущение d(t) скалярная переменная, действующая аддитивно со
скалярным управлением u(t). Структурная схема системы представлена на
рис. 1.
Здесь через ur(t) обозначено воздействие, вырабатываемое регулятором с
ПФ R(s) в главной обратной связи, через u(t) сигнал управления, посту-
пающий на объект с передаточной функцией (ПФ) P (s), на который действу-
8
d
+
r
+
e
ur
+
u
+
y
R(s)
P(s)
-
-
d
Q(s)
+
z
+
+
-
Q(s)
----
Pn(s)
d^
Рис. 1. Структура системы управления с компенсацией возмущений по [103].
ет аддитивное возмущение d(t), которое считается низкочастотным и описы-
вает как воздействие со стороны среды, так и нелинейность и неопределен-
ность модели ОУ. (Стоит заметить, что при неопределенности и нелинейности
ОУ d(t) зависит от его состояния, что следует учитывать при анализе.) Вы-
ход объекта y(t) измеряется вместе с аддитивным “шумом измерения” ζ(t),
который предполагается высокочастотным. Чере
d(t) обозначена оценка воз-
мущения, вырабатываемая как разность между фильтрованным сигналом
управления δ = Q(s)u и выходом фильтра сигнала измерений с передаточ-
ной функцией Q(s)Pn(s)-1. Передаточная функция Pn(s) соответствует “но-
минальной” модели объекта. Управление u(t) получается как разность между
сигналом ur(t) и оценкой возмущени
d(t).
Найдем связь между сигналами ur(t) (выходом регулятора в цепи глав-
ной обратной связи, v(t) = y(t) + ζ(t) (сигналом измерений выхода), с одной
стороны, и управлением u(t) с другой. В качестве примера, используем
следующие приведеные в [103] выражения для передаточных функций:
k0
kDs2 + kP s + kI
1
Pn(s) =
,
R(s) =
,
Q(s) =
(T s + 1)s
s
τs2 + 2τs + 1
При синтезе наблюдателя для расширенной системы (2.6) возмущение d(t)
считаем неизвестной постоянной величиной
d(t) = 0, а модель шума измере-
ний ζ(t) в процесс оценивания включать не будем.
, запишем следующие уравнения
Для ОУ, имеющего ПФ Pn(s)
Ts+1)s
состояния в канонической форме фазовой переменной [84, 85]:
{
x1(t) = x2(t),
y(t) = x1(t),
(2.8)
(
(
))
x2(t) = T-1
-x2(t) + k0
u(t) + d(t)
Введем матрицу (вектор-строку)
Cd ∈ R1×ns так, что для расширенного
наблюдателя имеет мест
d(t)
C[dx(t). (] рассмотренном выше примере, так
ка
d(t) = x3(t), выполнен
Cd =
0
0
1
.) По уравнениям состояния наблю-
дателя расширенной системы с матрицами (2.7)
Cd получим его передаточ-
d
ные функции
(s)
от сигнала управления u к оценке возмущени
d и
u
9
d
(s)
от сигнала измерений v = y + ζ
d. Получим
v
d
d
(2.9)
(s)
Cd(sI - Aobs)-1 B,
(s)
Cd(sI - Aobs)-1
L.
u
v
(
)
d
d
Учитывая что u(t) = ur(t)
d(t), запишем
1+
(s) u = ur -
(s)v, от-
u
v
куда следует что
d
1
Wv
(s)
(2.10)
W1(s) =
,
W2(s) =
,
d
d
1+
(s)
1+
(s)
u
u
d
d
где
(s),
(s) приведены в (2.9).
u
v
В [104] рассмотрен синтез линейных регуляторов для линейных с постоян-
ными параметрами (ИПВ, англ. - linear time-invariant, LTI ) ОУ с векторными
входом и выходом, обеспечивающих заданное расположение корней характе-
ристического многочлена замкнутой системы, и асимптотическое подавление
постоянных возмущений. Рассматриваются ОУ, заданные уравнениями со-
стояния
x(t) = Ax(t) + Bu(t) + d(t),
(2.11)
y(t) = Cx(t), x(t0) = x0, t ≥ t0,
где x(t)∈ Rn вектор состояния; u(t)∈ Rm (m ≤ n), y(t)∈ Rl входной и вы-
ходной векторы; A, B, C матрицы соответствующих размеров. Принято,
что rank C = l. Неизвестное и неизмеряемое возмущение d(t)∈ Rn представля-
ет собой сумму импульсных (δ-Дирака) или ступенчатых (единичная функция
Хевисайда 1(t)) вектор-функций, возникающих на ограниченном временном
интервале, а именно: считается, что для некоторых натуральных p1, p2 и по-
ложительных T1, T2 < ∞ выполнено
d(t) =
d1i(t) · 1(t - t∗i) +
d2j · δ(t - t∗j),
i=1
j=1
0 ≤ t∗i ≤ T1 < ∞, i = 1,...,p1,
(2.12)
0 ≤ t∗j ≤ T2 < ∞, j = 1,...,pj,
причем для вектор-функций d1i(t)∈ Rn выполнено
(2.13)
lim
d1i(t)
d1i,
d1i
∥ < ∞.
t→∞
Требуется найти минимальный реализуемый динамический ИПВ регуля-
тор в обратной связи, решающий задачу модального управления [84-86, 89,
105], т.е. обеспечивающий заданное, с отрицательными вещественными ча-
стями расположение полюсов замкнутой системы (при естественных усло-
виях комплексной сопряженности невещественных полюсов и полной управ-
ляемости ОУ) и асимптотическое стремление выхода y(t) к нулю для всех
возмущений d(t) указанного класса.
10
Замечание 1. С нашей точки зрения, в обобщенном представлении воз-
мущений (2.12) нет необходимости, и оно только усложняет восприятие ос-
новной идеи. Действительно, в силу свойств суперпозиции и инвариантности
во времени ИПВ систем достаточно рассмотреть только случай p1 = p2 = 1 и
совместить моменты времени t0, t∗1, t∗2, полагая t0 = t∗1 = t∗2 = 0. Кроме того,
естественным образом (см., например, [85]) δ-образное воздействие d21 · δ(t)
пересчитывается в начальные условия: x(0+) ≡ limt→0
x(t) = x0 + d21, и зату-
t>0
хание реакции y(t) на такое возмущение тривиально следует из асимптотиче-
ской устойчивости замкнутой системы. Следовательно, δ-образную компонен-
ту возмущений можно не включать. Что касается компоненты d11(t) · 1(t - t∗1),
то при t0 = t∗1 = 0 выполнено 1(t - t∗1) ≡ 1, поэтому этот сомножитель мож-
но не записывать. Таким образом, возмущение имеет смысл представить в
виде d(t) ≡ d11(t) с условием (2.13). В силу этого условия d11(t) можно пред-
ставить как сумму ограниченного затухающего сигнала и постоянной состав-
ляюще
d1i. Поскольку реакция асимптотически устойчивой линейной систе-
мы на ограниченный затухающий сигнал тоже стремится к нулю, то указан-
ное выше требование компенсации возмущений обеспечивается известным в
классической теории управления свойством астатизма по возмущению, ко-
торое может быть обеспечено введением интегральной составляющей (И-,
ПИ-, ПИД-регулятор) в закон управления [19, 102]. К такому управлению
приводит и работа [104]. Некоторая специфика заключается в рассмотрении
многосвязных (MIMO) систем.
Основной результат работы [104] заключается в том, что искомый закон
управления минимального порядка (равного l) имеет вид пропорциональной
обратной связи по состоянию и интегральной по выходу:
t
(2.14)
u(t) = K1x(t) + K2 y(τ) dτ + u0,
0
где K1 ∈ Rm×n, K2 ∈ Rm×l матричные коэффициенты регулятора, значе-
ние вектора u0 ∈ Rm несуществененное (например, им могут быть начальные
состояния интеграторов или приведенные ко входу системы δ-образные ком-
поненты возмущения, см. замечание 1). Обратная связь по состоянию слу-
жит для получения желаемого расположения полюсов замкнутой системы, а
интегральная составляющая от выхода y(t) для обеспечения астатизма
первого порядка [19] по возмущению.
Коэффициенты K1, K2 должны быть выбраны на основе заданного спек-
тра матрицы уравнений состояния расширенной (включающей интеграторы
выхода) замкнутой системы
]
[A + BK
1
BK2
(2.15)
A =
C
0l×l
Матрица A уравнений состояния замкнутой системы вида (2.15) получает-
ся из (2.11), (2.14), если ввести для интеграторов в (2.14) вектор состояния
11
v(t)∈ Rl. Этот вектор подчиняется уравнению v(t) = y(t). Введением расши-
ренного вектора состояния x = col {x, v} и после подстановки (2.14) в (2.11)
получим указанную матрицу A уравнений состояния расширенной системы.
Показано [104, теорема 2], что задача разрешима, если выполнены следую-
щие условия: пара (A, B) - управляема, и
]
[A B
(2.16)
rank
=n+l.
C 0l×l
Как отмечено в [104], результат не изменится при отклонении параметров
ОУ и регулятора, не нарушающего условий асимптотической устойчивости
матрицы A. Показано, что при отсутствии вариаций матрицы C выполняет-
ся и условие (2.16). Свойство подавления постоянных возмущений независимо
от параметров объекта типично для систем со скалярными входом и выходом
(односвязные системы, англ. single-input single-output, SISO) и с интегра-
лом в контуре управления, так как оно является структурным (не завися-
щим от параметров) [19, 102]. От системы требуется только асимптотическая
устойчивость.
Отметим, что при выполнении (2.16) возможна полная компенсация по-
стоянного возмущения d ∈ Rn управлением u ∈ Rm меньшей размерности.
В выполнении условия согласованности (которое имеет место при возмуще-
нии, действующем аддитивно управлению) тоже нет необходимости. В каче-
стве примера рассмотрим систему
{
x1(t) = x2(t) + d1,
x1(t) = -a2x1(t) - a2x1(t) + u(t) + d2,
(2.17)
y(t) = c1x1(t) + c2x2
(t),
t
(2.18)
u(t) = -k1x1(t) - k2x2(t) - kI
y(τ) dτ .
0
Легко получить, что выход замкнутой системы (2.17), (2.18) отвечает урав-
нению
(2.19)
α(p)y(t) = β1(p)d1(t) + β2(p)d2
(t),
где α(p), β1(p), β2(p)
многочлены от оператора дифференцирования
p = d/dt:
α(p) = p3 + (a1 + k2)p2 + (a2 + k1 + c2kI )p + c1kI ,
β1(p) = c1s2 + (a1c1 - a2c2 + c1k2 - c2k1)p,
β1(p) = (c1p + a1c1 - a2c2 + c1k2 - c2k1)p,
β1(p) = (c2p + c1)p.
Условием разрешимости задачи в данном случае будет c1 = 0, и поскольку
β1(0) = β2(0) = 0, то вынужденная составляющая ошибки от постоянных воз-
мущений d1, d2 будет равна нулю. Если известны оценк
d1,
d2 постоянных
12
возмущений d1, d2, то эффекта их компенсации можно добиться заменой (или
дополнением) интегральной составляющей в законе управления (2.18) ком-
пенсирующим сигналом
uc =
d1(a1c1 - a2c2 + c1k2 - c2k1)c-11
d2
(c1 = 0).
Заметим, что закон управления с компенсацией возмущений через uc, в отли-
чие от интегрального (2.18), чувствителен к отклонению параметров от рас-
четных. Кроме того, могут появиться проблемы с оценкой возмущений, так
как ОУ (2.17), расширенный уравнениями внутренней модел
d1 = 0
d2 = 0,
при a1c1 = a2c2 не полностью наблюдаем по компоненте d1. Далее, при та-
ком сочетании параметров возникает сложность в использовании наблюда-
теля при оценке состояния x(t) для перехода от управления по состоянию
(2.18) к управлению по выходу. Эти трудности устраняются использованием
t
вместо (2.18) стандартного ПИ-регулятора u(t) = -kP y(t) - kI
y(τ) dτ (см.,
0
например, [19, 102]). ПИ-регулятор, в отличие от (2.18), не дает возможно-
сти обеспечить здесь заданное расположение полюсов замкнутой системы, но
это требование имеет скорее академическое, чем практическое, значение при
разработке систем управления.
В [40] получены необходимые и достаточные условия управления систе-
мой (2.11) линейным динамическим регулятором при действии неизмеряемых
возмущений d1(t), . . . , dn(t), которые можно представить в виде решений сле-
дующего однородного линейного дифференциального уравнения r-го порядка
(2.20)
d(r)k(t) + αrd(r-1)k(t) + ··· + α2k(t) + α1dk
(t) = 0, k = 1, . . . , n,
с заданными коэффициентами α1, . . . αr и неизвестными начальными усло-
виями d(r-1)k(0), . . .
dk(0),dk(0), у которого все корни λi, i = 1,... ,r, характе-
ристического многочлена λr + αrλ(r-1) + · · · + α2λ + α1 имеют неотрицатель-
ные вещественные части, Re λi ≥ 0. Требуется, чтобы независимо от дейст-
вующих на систему возмущений, ее выход y(t) ∈ Rl асимптотически при-
ближался к вектор-функции y(t) ∈ Rl, компоненты yk(t) которой известны
заранее и удовлетворяют однородному линейному дифференциальному урав-
нению
(2.21)
y(r)k(t) + αry(r-1)k(t) + ··· + α2 yk(t) + α1yk
(t) = 0, k = 1, . . . , l,
с известными начальными условиями y(r-1)k(0), . . . , yk(0), yk(0). Заметим, что
характеристические многочлены “генераторов” возмущений (2.20) и задающе-
го воздействия (2.21) совпадают, поэтому процессы dk(t) и yk(t) отличаются
только начальными условиями.
Синтез регулятора выполняется так, чтобы либо оптимизировать задан-
ный интегральный квадратичный функционал [86, 87, 95, 101], либо получить
требуемое расположение полюсов замкнутой системы. Кроме того, обеспе-
чивается ее полная управляемость. Как и в [104], закон управления в [40]
содержит интегральную составляющую.
13
Условиями разрешимости задачи являются полная управляемость пары
(A, B) и аналогичный публикации [104] ранговый критерий. Критерии, при-
веденные в [104], где рассмотрены постоянные возмущения, и в [12, 13], в
которых принято что rank C = n, получаются из критерия [40] как частные
случаи. Показано, что, как и в [40], полученная система робастна по отно-
шению к вариациям параметров. Отметим, что, хотя описание возмущений
в виде квазимногочленов (решения (2.20)) оправдано и часто используется
на практике, представление программного воздействия y(t) в форме (2.21)
является довольно специфичным. В частности, указанный вид y(t) не поз-
воляет воспользоваться результатами [40] для задачи слежения, в которой
поведение задающего воздействия заранее не известно [19].
Принцип внутренней модели работы [40] нашел применение в статье [106],
которая посвящена классу гибридных систем, образованных семейством
ИПВ подсистем (называемых модами), с дискретными событиями переклю-
чения из одной моды на другую. Рассматриваются переключающиеся (англ.
switching) системы, в которых переключение наступает в зависимости от те-
кущего состояния системы. Ставится задача обеспечения асимптотического
отслеживания периодических траекторий такими системами при условии, что
динамика каждой моды линейна. В [106] показано, как обеспечить робаст-
ность асимптотического слежения по отношению в вариациям параметров у
этого класса гибридных систем.
Задача построения робастных следящих систем (сервомеханизмов) рас-
сматривается в [6, 107]. Получены необходимые и достаточные условия, а
также дана характеристика всех робастных регуляторов, позволяющих осу-
ществлять асимптотическое слежение, независимо от действующих на ОУ
возмущений, погрешности измерения и изменения параметров объекта и ре-
гулятора.
Линейный объект управления с постоянными параметрами в [6] описыва-
ется следующими уравнениями состояния
x(t) = Ax(t) + Bu(t) + Ed(t),
(2.22)
y(t) = C(t)x(t) + Du(t) + F d(t),
где x(t)∈ Rn вектор состояния; u(t)∈ Rm вектор управления, y(t)∈ Rl
вектор выхода (подлежащая управлению переменная); A, B, C, D, E, F
матрицы соответствующих размеров; d(t)∈ Rnd вектор возмущений, содер-
жащий как измеряемые, так и неизмеряемые компоненты. Вводится ошибка
слежения e(t) = y(t) - y(t)∈ Rl, где y(t)∈ Rl задающее (командное) воз-
действие. Предполагается, что вектор возмущений удовлетворяет однородно-
му линейному дифференциальному уравнению
(2.23)
xs(t) = As(t)xs(t), d(t) = Csxs(t), xs(t0) = xs0 , t ≥ t0.
Здесь xs(t)∈ Rns
вектор состояния модели возмущений (см. также
(2.5)-(2.7)). Пара (As, Cs) считается полностью наблюдаемой.
Замечание 2. Наблюдаемость пары (As,Cs) с первого взгляда кажется
естественным требованием, но заметим, что ее отсутствие говорит о том, что
14
d
y*
-
e
Серво-
x
+
u
ym
y
K
ОУ
(Ir, 0)T
компенсатор
+
+
K0
^
Стабилизирующий
компенсатор
Рис. 2. Обобщенная структурная схема робастного серворегулятора по [6].
некоторые компоненты xs или их комбинации не участвуют в формировании
возмущения. Следовательно, такая модель была бы избыточной. Выбор же
этой модели определяется не физическими свойствами среды источника
возмущений, а возлагается на разработчика системы управления.
Предполагается, кроме того, что задающее воздействие y(t)∈ Rl также
подчиняется аналогичному однородному уравнению состояния порядка ny с
матрицами Ay, Cy соответствующих размеров. Пара (Ay, Cy) считается на-
блюдаемой, а начальное значение вектора состояния генератора задающего
воздействия известным (тем самым заранее известно и y(t)). Принято,
что измеряется только сигнал ym(t) = Cm(t)x(t) + Dmu(t) + Fmd(t). При этом
требуется с помощью регулятора обеспечить асимптотическое стремление к
нулю ошибки e(t) при всех начальных значениях состояния объекта и “гене-
раторов” возмущающего и задающего воздействий.
Далее в [6] вводится новый тип компенсатора, называемый сервоком-
пенсатором, который соответствует интегральному регулятору в класси-
ческой теории управления и в обобщенном виде описывается уравнением
ξ = Sξ + Be, e = y - y, где S, B матрицы соответствующих размеров, опре-
деляемые при синтезе, ξ выход сервокомпенсатора. Второй структурой,
входящей в серворегулятор, является стабилизирующий компенсатор ди-
намический регулятор, обеспечивающий устойчивость замкнутой стистемы.
Его выход оценка x состояния ОУ, полученная с помощью наблюдате-
ля по входным сигналам ym, u, ξ. Окончательно управление u имеет вид
u = K0x + Kξ с некоторыми выбираемыми при синтезе матрицами K0, K.
Обобщенная структурная схема робастного серворегулятора по [6] представ-
лена на рис. 2. Эта структура объединяет идею введения в закон управления
интеграла от ошибки (развивая результаты [40, 104]) и метод внутренней мо-
дели в сочетании с наблюдателем для оценивания состояния ОУ и источников
входных сигналов.
Замечание 3. Заметим, что в [6] предполагается, что y(t) известно за-
ранее. Это допустимо для систем программного регулирования [19], но не
для следящих систем, у которых y(t) известно только для моментов времени
s ≤ t. Кроме того, в [6, 40, 107] и ряде следующих работ рассматривается весь-
ма узкий класс функций y(t) (“квазимногочлены” [98, 99]), в то время как
для сервоприводов y(t) может иметь сложный, в том числе случайный харак-
15
тер. Исходя из принципа суперпозиции можно заметить, что рассмотренные
в этих работах регуляторы обеспечивают инвариантность (стремление ошиб-
ки регулирования к нулю) только частично, а именно для тех составляющих
внешних воздействий, которые описываются принятыми моделями.
Работа [108] посвящена наблюдателю возмущений, названному “оцени-
вающий возмущения фильтр” (англ. Disturbance Estimating Filter, DEO).
В [108] отмечено, что преимуществом наблюдателя возмущений является то,
что он компенсирует влияние возмущений в системе обычным регулятором
в обратной связи без влияния на качество процессов в системе. Это свой-
ство разделения обеспечивает два независимых этапа синтеза всего регуля-
тора: один этап обеспечение качества системы, а другой для подавления
помех. Через несколько лет после введения наблюдателя возмущения этот
подход привел к концепции регулятора с “двумя степенями свободы” (2-dof ),
см., например, [109-111]. В [108] показано, что свойства подавления возму-
щений 2-dof-регулятора для линейных объектов и некоторых методологий
проектирования эквивалентны давно известному наблюдателю возмущений
Джонсона (Johnson), названному “наблюдателем неизвестных входных воз-
мущений” (англ. Unknown Input Disturbance Observer, UIDO) [14]. Авто-
ры [108] отмечают, что в силу эквивалентности результатов термины UIDO
и DEO относятся только к методикам синтеза, а не к наблюдятелям как та-
ковым. В [108] показана также эквивалентность регуляторов, основанных на
наблюдателях возмущений и на обеспечении пассивности. С этой целью пока-
зано, как наблюдатель возмущений может быть преобразован к классической
структуре систем с обратной связью, откуда следует, что любой метод проек-
тирования регуляторов с обратной связью можно использовать для синтеза
наблюдателей возмущений.
Структура наблюдателя возмущений в [108] идентична внутреннему кон-
туру системы управления с компенсацией возмущений работы [103], показан-
ной на рис. 13. В [108, 112] приведена эквивалентная система наблюдателя
возмущений, соответствующая введению в контур управления последователь-
ного корректирующего звена и местной обратной связи объекта управления,
идентичная представленной уравнениями (3.2) (в [108] сигнал местной обрат-
ной связи поступает на вход последовательного корректирующего звена, что
приводит к ПФ обратной связи W′2(s) = Q(s)Pn(s)-1, не такой, как в (3.2).
Принципиального значения это не имеет). В [108] обсуждается выбор филь-
тра Q(s), при котором обеспечивается подавление возмущений, которые мо-
гут быть представлены решениями однородного уравнения pnj d(t) = 0 (где
p = d/dt), т.е. многочленов от t степени nj - 1. Со ссылкой на метод внутрен-
ней модели в изложении [43] указано, что тогда ПФ фильтра должна иметь
вид
1+
αmsm
m=1
(2.24)
Q(s) =
,
1+ αmsm
m=1
3 Точнее говоря, структура [103] идентична структуре [108] как хронологически более
ранней.
16
где ρq
относительная степень Q(s), выбор которой определяется тре-
бованием неотрицательности относительной степени Q(s)P-1n(s). Коэффи-
циенты αm, m = 1, . . . , nq, должны обеспечивать гурвицевость многочлена
nq
1+
αmsm. Кажущаяся разница c [103] при определении Q(s) состоит в
m=1
том, что в последней работе используется ПИ-регулятор в основном контуре
обратной связи, что и обеспечивает астатизм по возмущению. В [108] этого
регулятора нет и астатизм достигается выбором Q(s). При таком виде Q(s)
выполнено
1+
amsm
1
m=1
(2.25)
=
(
),
1 - Q(s)
snj anj +
anj
+msm
m=1
где выполнено nj = nq - ρq + 1. Как видно из (2.25), для компенсации сте-
пенных возмущений, последовательное корректирующее звено в регуляторе
должно содержать nj “чистых” интеграторов, что полностью согласуется с
классическим методом обеспечения астатизма системы по отношению к воз-
мущениям [19, гл. 9]. Авторы [108] отмечают, что структура (2.24) была из-
ложена ранее в [109, 110, 113], а в своей работе они предлагают новую (по
отношению к (2.24)) структуру, преимуществом которой является возмож-
ность ее применения к неминимально-фазовым объектам (см. замечание 4).
С этой целью в [108] производится сепарация ПФ объекта управления, т.е.
представление ее числителя произведением устойчивого Ns(s) степени ns и
неустойчивого Nu(s) степени nu = n - ns многочленов:
N (s)
Nu(s)Ns(s)
(2.26)
Pn(s) =
=
D(s)
D(s)
Тогда Q(s) формируется в виде
1+ αmsm + gmsnj+m-1
m=1
m=1
(2.27)
Q(s) =
1+ αmsm
m=1
В этой структуре коэффициенты g1, . . . , gn выбираются так, чтобы чис-
литель(Q(s) для некоторых r0, .). , rn-1 можно было представить в виде
Nu(s) ·
rnj-1snj-1 + ··· + r1s + r0
. Далее в [108] излагается пошаговая про-
цедура синтеза наблюдателя возмущений с фильтром (2.27), продемонстри-
ровано преобразование наблюдателя возмущений к форме системы с обрат-
ной связью, показана эквивалентность структур с DEF-наблюдателем и с
UIDO-наблюдателем работы [14], обсуждается использование общих моделей
возмущений, попадающих под определение “квазимногочленов” (т.е. решений
(2.20) ), в том числе гармонических процессов. Рассмотрено применение из-
ложенных методов к синтезу систем управления роботами-манипуляторами
с n степенями свободы и систем слежения.
17
3. Оценка возмущений с использованием вспомогательных фильтров
в форме передаточных функций
В [103], основываясь на предложенном в [114, 115] подходе, рассматрива-
ется система с компенсацией возмущений, структурная схема которой пред-
ставлена на рис. 1. Скорректированная система замыкается обратной свя-
зью по ошибке от задающего воздействия r(t) через регулятор с ПФ R(s).
Заметим, что если шумы измерения отсутствуют, ζ ≡ 0, а Pn(s) ≡ P (s), то
при устойчивости замкнутой системы по окончании переходных процессов
сигнал управления u(t) содержит слагаемое -Q(s)d, которое частично (в по-
лосе пропускания частот фильтра D(s)) компенсирует возмущение d(t). Вы-
бор D(s) производится таким образом, чтобы обеспечить реализуемость (от-
сутствие упреждения, т.е. “идеального дифференцирования”) у звена с ПФ
Q(s)Pn(s)-1, что достигается, если относительная степень (разность между
порядками знаменателя и числителя) ПФ Q(s) превосходит или равна отно-
сительной степени ПФ Pn(s).
Нетрудно получить, что для номинальных значений параметров, при
Pn(s) ≡ P(s), выходной сигнал y(t) ОУ определяется через входы выраже-
нием
(
)
(3.1)
y = P(s)ur + P(s)
1 - Q(s)
d + P(s)Q(s)ζ.
С учетом замыкания системы главной обратной связью с регулятором R(s)
по окончании переходных процессов выход y(t) выражается через внешние
воздействия как
(
)
y = D(s)-1
(P (s)(1 - Q(s))d + (R(s) + Q(s))ζ + R(s)r
,
где
D(s) = 1 + R(s)P (s).
Отсюда видно, что в области частот ω, для которых |Q(iω)| ≪ 1, происходит
подавление шума измерений, а при |Q(iω)| ≈ 1 подавляется внешнее воз-
мущение. Близкие соотношения (но с дополнительными искажениями) име-
ют место и при некотором отличии между ПФ P(s) и Pn(s). Изложенный
подход, связанный с формированием полосы пропускания системы с подав-
лением возмущений и шумов в характерных для них областях частот, весьма
распространен в инженерной практике (см., например, [19, 100-102]) и вряд
ли представляет собой что-то принципиально новое. Очевидно, что рассмат-
риваемую систему можно представить в виде, типичном для традиционных
систем автоматического управления с последовательным корректируюим зве-
ном и местной отрицательной обратной связью, охватывающей ОУ [19, 102],
представив сигнал управления в виде u = W1(s)ur - W2(s)v, где v = y + ζ
сигнал измерений выхода ОУ. Для рассматриваемой структуры выполнены
выражения
1
Q(s)
(3.2)
W1(s) =
,
W2(s) =
(
)
1 - Q(s)
1 - Q(s)
Pn(s)
18
Замечание 4. Подход работы [103] можно рассматривать в качестве
некоторой регулярной процедуры синтеза корректирующих звеньев систем
управления. Надо, однако, учесть, что он непригоден (приводит к неустой-
чивости) для неминимально-фазовых ОУ (числитель ПФ Pn(s) должен быть
гурвицевым многочленом). Действительно, при P (s) ≡ Pn(s) ПФ представ-
ленной на рис. 1 замкнутой системы от r к y содержит в качестве общих
множителей числитель ПФ объекта Pn(s), что говорит о неполной управляе-
мости данной системы, а если этот множитель не гурвицев, то о ее нестаби-
лизируемости [84-86, 89, 90] (при любом выборе регулятора R(s) замкнутая
система будет неустойчивой).
4. Наблюдатели и оценка ограниченных возмущений
Для компенсации ограниченных возмущений в [116] предложен метод
вспомогательного контура. Рассмотрим линейный ОУ
(4.1)
Q(p)y(t) = R(p)u(t) + f(t),
где f(t)
ограниченная функция, операторы Q(p) и R(p) порядков n и m
содержат неизвестные коэффициенты. Для получения информации о возму-
щении вводится вспомогательный контур (параллельная эталонная модель)
в виде
(4.2)
Q0(p)y0(t) = R0
(p)u(t),
где Q0(p) и R0(p) известные операторы порядков n и m. В силу уравнений
(4.1) и (4.2) разность e(t) = y(t) - y0(t) можно переписать в виде
(4.3)
Q0(p)e(t) = R0
(p)u(t) + ϕ(t),
откуда будет определено новое возмущение
ϕ(t) = ΔR(p)u(t) - ΔQ(p)y(t) + f(t),
которое включает в себя параметрическую неопределенность и сигнал f(t).
Если производные y(t) измеряемы, то закон управления u(t) = -Q0(s)Re(t)
0(s)
обеспечит полную компенсацию параметрических и внешних возмущений.
Если же производные y(t) не измеряются, то используется закон управле-
ния u(t) = -Q0(s)Rê(t), где ê(t)
оценка сигнала e(t), полученная с помощью
0(s)
наблюдателя с большим коэффициентом усиления [117]
ˆ
ξ(t) =
ξ(t) + B (ê(t) - e(t)) ,
(4.4)
ê(t) =
ξ(t).
Здесь ξ ∈ Rρ, ρ = deg Q(s) - deg R(s) относительная степень ОУ,
[
]
]T
0
I
[d1
dρ
G=
,
B=
, ...
,
,
0
0
µ
µρ
19
d1,... ,dρ выбираются из условия гурвицевости матрицы G - [d1,... ,dρ]TL,
L = [1,0,...,0]. По сути, наблюдатель (4.4) является наблюдателем возмуще-
ний, поскольку сигнал ξ(t) содержит информацию о новом возмущении ϕ(t).
В [118] результат [116] обобщен для управления объектами с неизвестными
параметрами, возмущениями и неизвестным переменным порядком ОУ. На
базе [118] в [76-78] рассмотрена компенсация возмущений в динамических
сетях, в том числе и сетях с коммуникационным запаздыванием.
В [72] рассмотрено применение метода [116] для компенсации возмущений
в линейных объектах с запаздыванием в канале управления. В [119] пред-
ложена компенсация ограниченных возмущений вместе с заданным количе-
ством производных в линейных объектах, которые могут быть неустойчивы-
ми. Показано, что интегральный предиктор [120] на практике не может быть
реализован точно, вследствие чего есть возможность компенсации возмуще-
ний в неустойчивых объектах только определенного класса.
В [121] предложен новый метод компенсации возмущений, основанный на
схеме [116] и применении процедуры многошагового прогнозирования векто-
ра состояния и возмущения (суб-предикторы состояния и возмущения). По-
казано, что такая схема позволяет управлять объектом с большей величиной
возмущения, чем при использовании численной реализации интегрального
предиктора [120]. Итак, рассматривается объект управления
x(t) = Ax(t) + Bu(t - h) + Bf(t),
(4.5)
t ≥ 0, u(τ) = 0 при τ < 0,
где x(t) ∈ Rn измеряемый вектор состояния, u(t) ∈ Rm сигнал управле-
ния, f(t) ∈ Rm внешнее возмущение с ограниченными r + 3 производны-
ми, r ≥ 0 параметр, который будет использоваться при синтезе алгоритма
управления, h > 0 известное время запаздывания, A и B известные мат-
рицы соответствующих размеров, пара (A, B) управляема и выполнено усло-
вие B+B = I, B+ - псевдообратная матрица для матрицы B. Схема управ-
ления состоит из:
1) субпредиктора вектора состояния
(
)
xi(t) = Axi(t) + Di
xi+1(t) - xi(t -h)
+ Bu1(t - (i - 1)h),
(4.6)
i = 1,...,M - 1,
(
)
xM (t) = AxM (t) + DM
x(t) - xM (t -h)
+ Bu1(t - (M - 1)h),
где xi(t) ∈ Rn,h =hM . Число M задается разработчиком, а матрицы Di вы-
бираются из условия устойчивости субпредиктора;
2) вспомогательного контура
(4.7)
ėa(t) = Aea(t) - Dea(t - h) + Bu2
(t - h),
где ea(t) ∈ Rn;
20
3) субпредиктора возмущения
f (t +ĥ) =
(-1)j-1Cjr+1fˆ(t -ĥ(j - 1)),
j=1
f (t + lĥ) =
(-1)j-1Cjr+1f˜(t -ĥ(j - l)) +
(-1)j-1Cjr+1×
j=1
j=l
(4.8)
×fˆ(t -ĥ(j - l)), l = 2, . . . , r + 1
(или l = 2, . . . , N, если N < r + 2),
f (t + kĥ) =
(-1)j-1Cjr+1f˜(t -ĥ(j - k)), k = r + 2, . . . , N
j=1
(если N ≥ r + 2);
4) закона управления
u(t) = u1(t) + u2(t),
u1(t) = -Kx1(t),
(4.9)
p
u2(t) =
f (t + h),
ξi(t) =
ξi(t), i = 1,... ,n,
µp + 1
где матрица K задается из условия гурвицевости матрицы A - BK, µ > 0
достаточно малое число.
В [122] решена задача компенсации возмущений в условиях ограничений
на сигнал управления. Идея решения состоит в следующем. С одной стороны,
выделяется информация о возмущении в виде некоторой доступной измере-
нию функции (или ее оценки с помощью наблюдателя возмущений). Сигнал
управления противоположен значению новой функции возмущения. С другой
стороны, по условию задачи на сигнал управления наложены ограничения в
виде насыщения. Следовательно, для решения задачи на функцию возмуще-
ния накладываются соответствующие ограничения.
Совершенно другой подход к компенсации возмущений рассморен в [123].
Здесь параметрические и внешние возмущения выделяются в виде новой
функции. Для компенсации возмущений требуется существование правого
делителя нуля матрицы управления, с помощью которого реализуется управ-
ление, инвариантное к возмущениям. Более общие условия существования
инвариантного управления получены в [124] в виде так называемого “универ-
сального регулятора”.
В [125] предложены методы каскадного синтеза наблюдателей состоя-
ний линейных и нелинейных динамических систем. При синтезе алгорит-
мов управления исходная динамическая система представляется в блочно-
наблюдаемой форме. Затем используются алгоритмы с большим коэффици-
ентом усиления в обратной связи и/или с разрывными управлениями. В от-
личие от других существующих схем управления здесь предлагается деком-
позиция многомерной задачи синтеза корректирующих воздействий наблю-
дателя на независимые подсистемы меньшей размерности по сравнению с
21
исходной системой. Решена задача инвариантного управления по отношению
к параметрической неопределенности и внешним возмущениям. В [66, 71, 125]
также предложены наблюдатели возмущений. Остановимся более подробно
на некоторых результатах по компенсации возмущений с использованием на-
блюдателей возмущений.
В [71, 125] предложен наблюдатель возмущений в нелинейных системах
вида
(4.10)
x = f(x,u) + Q(x)η,
где x ∈ X ⊂ Rn
вектор состояния, u ∈ U ⊂ Rr
вектор управления,
η ∈ H ⊂ Rp вектор неконтролируемых внешних возмущений, f(x,u)
вектор-функция, Q(x)
нелинейная матрица соответствующих размеров.
Если в системе доступна оценка вектора состояния
x(t) ∈ Rn, то возмуще-
ние можно оценить в виде
(
)
(
)
Q(x(t))η(t) =
x(t) - f
x(t), u(t)
В более общем виде в [71, 125] наблюдатель возмущений формируется в
виде
(
)(
)
η(t) =Q-1
x(t)
τ (t)
,
где µi
˙τi = -τi + vi, i = 1,... ,n, µi > 0, v вектор разрывных корректирую-
щих воздействий, полученный с помощью соотношений
z = f(z,u) + v,
ε = f(x,u) - f(z,u) + Q(x)η - v,
v = Msignε, M > 0.
В [66, 125] рассмотрен синтез наблюдателя возмущений для системы вто-
рого порядка
x1 = x2,
x2 = f(x,t) + b(x1)u,
где x ∈ X ⊂ R2, u ∈ R вектор управления, b(x1) = 0 известная функция,
f (x, u) - неизвестная ограниченная функция, которая зависит от внешних
возмущений, приче
f также ограниченная функция. Для решения задачи
используется наблюдатель на скользящих режимах
Ż1 = z2 + v1,
Ż2 = b(x1)u + v2,
где µ2
˙τ2 = -τ2 + v2, v1 = M1σ(k1ε1), v2 = M2σ(k2v1), µ2, M1, M2, k1 и k2
положительные константы, σ(kx) = 2/(1 + e-kx) - 1, k > 0.
Достоинства алгоритмов компенсации ограниченных возмущений по срав-
нению с алгоритмами компенсации гармонических возмущений состоят в воз-
можности рассмотрения более общих возмущений, что расширяет класс рас-
сматриваемых задач, а также независимость структуры алгоритма от источ-
ника возмущений.
22
4.1. Динамическое восстановление входов
Работа [21], посвященная в основном идентификации нестацинарных и
нелинейных объектов, содержит раздел, относящийся к идентификации вход-
ных воздействий. Указано, что в [126] обсуждается история вопроса и приво-
дятся результаты теоретических исследований по восстановлению нестацио-
нарных сигналов, проходящих через линейную стационарную систему. Со-
гласно [126] в обшей постановке эта задача сводится к обратной
реше-
нию интегрального уравнения Вольтерра. В [126] рассматриваются различ-
ные (аппроксимационные, итерационные и алгебраические) методы решения
основного интегрального уравнения и проблема борьбы с шумами в кана-
ле измерения (некорректностью). Обсуждаются регуляризационные методы
решения задачи и вопросы их численной реализации.
Суть этой теории состоит в том, что алгоритм восстановления представ-
ляется в виде алгоритма управления по принципу обратной связи некоторой
подходящим образом сконструированной вспомогательной динамической си-
стемы моделью. Такой алгоритм, выходом которого служит, в частности,
реализация управления в модели, по своему определению является динамиче-
ским. Управление в модели адаптируется к результатам текущих наблюдений
таким образом, что его реализация во времени обеспечивает малое возраста-
ние некоторого специальным образом выбранного функционала типа Ляпу-
нова. При этом обратная связь в цитированных выше работах строится на
основе известного в теории позиционных дифференциальных игр принци-
па экстремального сдвига, локально регуляризованного с помощью широко
применяемых в теории некорректных задач методов сглаживающего функ-
ционала или невязки.
В [127] рассматривается нелинейная система с запаздыванием по состоя-
нию
(
)
(4.11)
x(t) = f
t,x(t),x(t - ν)
+ Bu(t), x(s) = x0
(s), s ∈ [-ν, 0],
t ∈ [0,T], x(t)∈ Rq; f : R × Rq × Rq → ×Rq; B (q × n)-мерная матрица. u(t) ∈
(
)
∈ Rn возмущение (управление) неизвестно, u(·) ∈ P(·) = L
[0, T ]; Rn
принадлежит множеству допустимых возмущений P (·).
Цель: реконструкция u(·) с некоторой точностью µ построить алгоритм
вычисления v(·) такой, что
∥u(·) - v(·)∥L2([0,T ];Rn) < µ.
Входные данные результат измерения состояния x(t). Динамический
алгоритм реконструкции: а) вычисление v(τ), 0 ≤ τ ≤ t, на основе измерения
состояния x(τ) при τ < t; б) только после вычисления v(τ) на промежутке
0 ≤ τ ≤ t возможно использование новой информации о состоянии x(t) для
вычисления v(τ) при τ > t.
Следуя подходу [26, 128-130], вводится вспомогательная система
“мо-
дель”:
(
)
(4.12)
wn(t) = f
τk,n, ξk,n, ξk-rk,n
+ Bvn(t), wn(0) = x0
(0)
23
при почти всех t ∈ δk,n = [τk,n, τk+1,n), где входное воздействие (управление)
аппроксимирует u(·), а τk-rk,n
единственная точка наблюдения, принад-
лежащая интервалу [τk,n - ν, τk,n - ν + δ). С другими результатами данного
направления можно ознакомиться в [131-139].
В статье [140] для некоторых классов систем, описываемых обыкновен-
ными дифференциальными уравнениями, дается обзор алгоритмов дина-
мического восстановления входов. Предлагаемые алгоритмы, устойчивые
к помехам измерений и погрешностям вычислений, основаны на методах
теории некорректных задач и на подходящих модификациях известного в
теории гарантированного управления метода экстремального прицеливания
Н.Н. Красовского. Траектория системы зависит от меняющегося во времени
входного воздействия (управления). Заранее как вход, так и траектория не за-
даны. Однако известно множество, ограничивающее допустимую реализацию
входа. Требуется сконструировать алгоритм приближенного восстановления
ненаблюдаемой “части” координат, а также входа, обладающий свойствами
динамичности (текущие значения приближения соответствующих координат
и входа вырабатываются в реальном времени) и устойчивости (приближения
сколь угодно точны при достаточной точности наблюдения).
Рассматриваются динамические системы, функционирующие на конечном
интервале времени T = [t0, ϑ], ϑ < +∞, заданные системой обыкновенных
дифференциальных уравнений вида
(
)
(
)
(4.13)
x(t) = f
t,x(t)
+B
t,x(t)
u(t) + F (t), y(t) = Cx(t),
где t ∈ T , x(t)∈ Rn, x(t0) = x0, u(t)∈ RN , F (·) ∈ L2(T ; Rn) заданная функ-
ция, суммируемая с квадратом нормы, y(t(∈ Rr
вы)ход системы, C
матрица размера r × n. Траектория x(t) = x
t;t0,x0,u(·)
∈ Rn, t ∈ T, систе-
мы (4.13) зависит от начального состояния x0 и изменяющегося во времени
неизвестного входного воздействия u(·) ∈ P (·) ⊂ L2(T ; Rn), где P некоторое
заданное “множество допустимых управлений”.
Измерения y(t) происходят в некоторые дискретные моменты времени
τi = δi, τm = ϑ, δ
интервал дискретности, полученный равномерным раз-
биением промежутка T на m подынтервалов, i = 0, 1, . . . , m. Выход измеря-
ется некоторой ошибкой, так что результатом являются неточные измерения
ξi ∈ Rr, удовлетворяющие неравенствам ∥ξi - y(τi)∥ ≤ h, где 0 < h < 1 уро-
вень ошибки измерений. Требуется построить алгоритм, позволяющий син-
хронно с развитием процесса по результатам неточных измерений y(·) восста-
навливать как весь фазовый вектор x(·), так и управление u(·), порождаю-
щее выход y(·). При C = In задача трансформируется к оценке входа u(t) по
неточным измерениям состояния x(τi).
Метод решения задачи базируется на одном из известных принципов по-
зиционного управления принципе вспомогательных моделей, восходящем к
работам Н.Н. Красовского [141, 142]. Согласно этому принципу после разбие-
ния отрезка T на полуинтервалы [τi, τi+1) выбирается система M (называеая
моделью), движение которой w(t), t ∈ T , описывается некоторым дифферен-
циальным уравнением
(
)
(4.14)
w(t) = ϕ
t,w(t),ξi, û(t), v(t)
,
t ∈ [τii+1
),
24
где i = 0, 1, . . . , m - 1, w(t0) = w0, û(t), v(t)
два входных сигнала (управ-
ления). (азмерность в)ктора w(t) априори не оговаривается. Обозначение
w(t) = w
t;w0, û(·), v(·)
используется для решения системы (4.14).
После того как задано уравнение (4.14), алгоритм решения задачи отож-
дествляется с законом формирования управлений в модели по принци-
пу обратной связи. При этом процедуре управления моделью предшеству-
ет выбор ее начального состояния w0. Законы формирования управлений
{û(·), v(·)} в модели, называемые по терминологии, принятой в теории га-
рантированного управления [141, 142], стратегиями, отождествляются с па-
рами S = (Δ, U), где Δ = {τi}mi=0, U
функция, ставящая в соответствие
(
)
позиции q(i)(·) вектор U
q(i)(·)
= {ûi, vi}. Позицией, например, может яв-
{
}
ляться тройка q(i)(·) =
τii, ŵ(τi)
или вектор, содержащий предысторию,
{
}
как q(i)(·) =
τiii-1 ŵ(τi)
, и т.д.
4.2. Наблюдатели входных и выходных возмущений
В отличие от вышеприведенных результатов, в настоящем разделе будет
рассмотрена задача оценки и компенсации возмущений при наличии помех
измерения (выходного возмущения). Рассмотрим объект управления
x(t) = Ax(t) + Bu(t) + Df(t),
(4.15)
z(t) = x(t) + ξ(t).
Здесь все обозначения несут тот же смысл, что и раньше, x ∈ Rn, f(t)
ограниченное возмущение, ξ(t) - ограниченная помеха измерения (выходное
возмущение).
В [143] на базе метода вспомогательного контура [116] предложен метод
компенсации входных и выходных возмущений, когда хотя бы одно урав-
нение (4.15) содержит нулевую компоненту вектора выходного возмущения.
В [119] предложено обобщение результата [143] на случай, когда вектор ξ(t)
может не содержать нулевых компонент. Синтез алгоритма осуществляется
по следующей схеме: 1) выделяется произвольная j-я строка во втором урав-
нении (4.15) и синтезируется алгоритм оценки помехи измерения без j-й ком-
поненты; 2) выделяется информация о возмущении f из первого уравнения
(4.15) с учетом восстановленной информации о помехе измерения. Такая схе-
ма позволяет свести к нулю ошибку регулирования в установившемся режи-
ме, зависящей от максимального значения f и j-й компоненты ξ.
Алгоритм [119] представлен следующими уравнениями:
алгоритм оценки вектора выходных возмущения без i-й компоненты
ξ = [ξ1,... ,ξi-1i+1,... ,ξn]T)
t
(
)
(4.16)
ξ=
ξ(s)
A1z(s)
ds + z,
0
гд
ξ
вектор оценки сигнал
ξ,
z
Iz,
A
I
IT,
A1
IA
I
матри-
ца размера (n - 1) × n, полученная из единичной матрицы порядка n путем
вычеркивания i-й строки;
25
алгоритм оценки вектора состояния
(4.17)
x=z
ITξˆ
;
алгоритм компенсации входных возмущений
t
1
(
)
(4.18)
u=-
ETiB
−1 xi - ETiA
x(s)ds .
µ
0
Как отмечалось ранее, качество работы алгоритма (4.16)-(4.18) зависит
от величины ξi и f. Если ξi = 0, то уменьшением значения µ можно сколь
угодно уменьшить величину limt→∞ sup |x(t)|, которая будет зависеть только
от sup |f(t)|.
4.3. Робастное обращение систем
Во многих работах, см., например, [26, 115, 127-139, 144-152], задача оце-
нивания неизвестного внешнего воздействия (в том числе возмущения) по
результатам измерения выхода трактуется как задача обращения (инверсии)
динамической системы, в качестве которой выступает объект управления.
Налагается естественное для задач управления требование получения оцен-
ки в реальном времени, т.е. в темпе с управляемым процессом. В качестве
дополнительных условий также выступают обеспечение наименьшего поряд-
ка уравнений динамики инвертора, робастности системы оценивания по от-
ношению к параметрам модели объекта и снижение влияния погрешностей
измерения выхода [146-149, 153].
Ранние работы, см., например, [144], приводят к алгоритмам инверсии,
которые непригодны для решения задач реального времени, а подход [115]
связан с построением нереализуемой инверсной системы (с порядком числи-
теля ПФ большим порядка знаменателя). В последующих работах эти недо-
статки устранены, а метод инверсии был развит и распространен на дис-
кретные, нелинейные и нестационарные системы, системы с запаздыванием
и пространственно-распределенные системы [24, 33, 35, 127, 131, 134, 135].
Для иллюстрации, следуя [150, гл. 1], рассмотрим применение этого под-
хода для обращения линейных стационарных скалярных (SISO) систем.
Рассматривается линейная динамическая система вида4
(4.19)
x(t) = Ax(t) + Bd(t), y(t) = Cx(t),
где x(t)∈ Rn вектор состояния, y(t)∈ R1 измеряемый выход, d(t)∈ R1
неизвестное неизмеряемое входное воздействие (возмущение), A, B, C мат-
рицы соответствующих размеров с постоянными вещественными коэффи-
циентами. Пара (A, B) считается полностью управляемой, а пара (A, C)
полностью наблюдаемой. Необходимо по известному выходу y(t) построить
(в темпе с процессом) оценку неизвестного входного сигнала d(t). Известные
4 Использованы обозначения, принятые в данном обзоре.
26
внешние воздействия (например, управляющее) в модель (4.19) не входят, так
как их оценивать не требуется, и в силу свойства суперпозиции линейных си-
стем реакции на эти воздействия и d(t) можно рассматривать независимо.
В силу управляемости системы (4.19) можно считать, что матрицы A, B,
C записаны в следующей канонической форме управляемости [84, 85]:
0
1
0
0
0
0
0
0
]
(4.20)
A=
,
B=
, C =
[c1 c2
... cn
0
0
1
0
−a1
-a2
-an
1
Передаточная функция системы (4.19) от входа d к выходу y имеет вид
B(s)
(4.21)
W (s) = C(sI - A)-1 =
,
s ∈ C,
A(s)
с многочленами A(s), B(s) вида
(4.22)
A(s) = sn + ansn-1 + · · · + a1, B(s) = cnsn-1 + · · · + c1.
Рассмотрим сначала строго-минимально-фазовую систему (4.19), т.е. та-
кую, у которой многочлен B(s) - гурвицев (устойчивый) многочлен с поло-
жительными коэффициентами. (При cn = 0 говорят, что система (4.19) имеет
относительный порядок r = deg A(s) - deg B(s) = 1.)
Для решения поставленной задачи оценивания возмущения d(t) вводится
(согласно терминологии работ [146, 148, 153]) следующая управляемая мо-
дель:
(4.23)
x(t) = Ax(t) + Bv(t),
y(t) = C x(t),
где x(t)∈ Rn
вектор состояния модели, v(t)∈ R1
подлежащее выбо-
ру управляющее воздействие. Введя отклонение e(t) = x(t) - x(t) и вычитая
(4.19) из (4.23), получим уравнение в отклонениях
(
)
(4.24)
e(t) = Ae(t) + B
v(t) - d(t)
,
ε(t) = y(t) - y(t) ≡ Ce(t).
Для нахождения сигнала v(t), стабилизирующего систему (4.24), использу-
ются стандартные методы теории управления. Рассмотрим это подробнее.
Выполним в (4.24) невырожденное преобразование координат
e = Pe,
det P = 0, чтобы получить новый вектор состояния e = col {e, ε}, где компо-
ненты вектора e ∈ Rn-1 совпадают с соответствующими компонентами исход-
ного вектора e, e′i = ei, i = 1, . . . , n - 1. Учитывая уравнение выхода ε = Ce,
получим, что матрица преобразования P должна иметь вид
1
0
0
0
0
1
0
0
(4.25)
P =
.
0
0
1
0
c1
c2
... cn-1
cn
27
Так как CB = 0, то нормировкой можно привести уравнения системы к
виду, в котором CB = 1. В результате система (4.24) приводится к форме
{˙e(t) = A1e(t) + B1ε(t),
(4.26)
(
)
ε(t) = A2e(t) + B2ε(t) +
v(t) - d(t)
с соответствующими матрицами A1 ∈ R(n-1)×(n-1), A2 ∈ R1×(n-1), B(n-1)×1 и
скаляром B2 (подробные выражения приведены в [150]).
Далее в [150] рассматриваются два способа стабилизации системы (4.26):
линейное управление с “глубокой обратной связью” с большим коэффициен-
том v ≡ vµ = -µε; и с наблюдателем состояния и разрывной обратной связью
v = -A2e - (B2 + α)ε + Fsignε с некоторыми выбираемыми разработчиком
константами α, F > 0. В случае разрывного управления, начиная с некоторо-
го момента времени t, в системе возникает скользящий режим на плоскости
ε = Ce = 0.
При использовании линейного управления в качестве оценк
d(t) процесса
d(t) берется сигнал управления vµ(t) в предположении, что µ достаточно ве-
лико
d(t) = v(t) ≡ limµ→∞ uµ(t). При разрывном управлении аналогичная
оценка выполняется на основе метода эквивалентного управления [154, 155]
фильтрацией разрывного процесса v(t) по методу скользящего среднего, т.е.
t
d(t) = 1/T
v(τ) dτ .
t-T
Заметим, что преобразование координат для приведения уравнений со-
стояния к виду (4.26) и последующий синтез наблюдателя со скользящим
режимом аналогичны приведенным в [155, гл. 13], см также [64].
Обратимся теперь к инвертированию систем с максимальным относитель-
ным порядком, полагая r = n в (4.21) [150]. Тогда многочлен B(s) в (4.22)
будет константой, B(s) = cn. Для решения задачи обращения используется
следующая вспомогательная система
(4.27)
x(t) = Ax(t) + Lv(t),
y(t) = C x(t),
где L∈ Rn подлежащий выбору вектор параметров. Уравнение относитель-
но отклонения e(t) = x(t) - x(t) имеет вид
(4.28)
ė(t) = Ae(t) + Lv(t) - Bd(t), ε(t) = Ce(t).
Выбором v(t) = -ε(t) получаем замкнутую систему
(4.29)
ė(t) = AL
e(t) - Bd(t), ε(t) = Ce(t),
где AL = A - LC. В силу наблюдаемости пары (A, C) подходящим выбором L
можно получить любой заданный спектр матрицы AL. В [150] предлагается
следующая процедура: вводятся вещественные значенияλi, i = 1, . . . , n, та-
кие чтоλ1 = -1,λi+1 < λi. Затем находятся желаемые собственные числа λi
матрицы AL как λi = µλi, где µ > 0 выбираемый при синтезе параметр (по
смыслу он должен быть взят достаточно большим). Стандартными процеду-
рами синтеза наблюдателя находится вектор L, обеспечивающий требуемый
спектр {λ1, . . . , λn} матрицы AL.
28
Искомая оценка входного процесса получается по формуле
ε(t)
(4.30)
d(t) =
CA-1LB
Далее в [148] рассматривается инвертирование системы с произвольным
относительным порядком 1 ≤ r ≤ n. Для такой системы выполнены усло-
вия cm+2 = cm+3 = · · · = cn = 0, cm+1 = CAr-1B = 0. По-прежнему считает-
ся, что система (4.24) минимально-фазовая (числитель B(s) ее ПФ (4.21)
гурвицев многочлен). Как и выше, здесь используется невырожденная заме-
на переменных состояния уравнения ошибки (4.24), при которой первые m
переменных состояния в новом базисе (считается что исходная система (4.24)
уже приведена к канонической форме управляемости) совпадают с исход-
ными, а остальные n - m переменные пересчитываются с коэффициентами
c1,... ,cm. Уравнения полученной в результате преобразования первой подси-
стемы копируются в алгоритм оценивания, а для второй подсистемы строит-
ся наблюдатель состояния порядка n - m. Затем по сигналу обратной связи
наблюдателя пересчитывается оценка входного сигнал
d(t) (подробное изло-
жение можно найти в [148]).
Для неминимально-фазовых систем, у которых многочлен B(s) не гур-
вицев, данный метод непосредственно неприменим в силу неустойчивости
нуль-динамики уравнения ошибки оценивания. Эта задача также исследу-
ется в [148]. Выполняется сепарация системы на подсистемы с устойчивой и
неустойчивой нуль-динамикой. Для первой из них задача обращения реша-
ется описанным выше методом. Для оценки неизвестного сигнала d(t) вы-
полняется вычисление интеграла свертки на некотором временном интерва-
ле Δ > 0, соответствующим выбором которого при заданном µ и заданной
скорости изменения d(t) можно обеспечить требуемую точность оценивания.
Как отмечено авторами [148], “Главным недостатком предложенной схемы
обращения является тот факт, что для восстановления сигнала d в момент
времени t необходимо знать значение y(t) (а значит, и y(t)) на промежутке
[t, t + Δ], причем для увеличения точности оценки необходимо увеличивать
промежуток наблюдения Δ, т.е. оценивание происходит с запаздыванием по
времени на величину Δ.”
В [148] описывается также ситуация, когда имеется дополнительная ин-
формация о процессе d(t) например, если известна (по терминологии ав-
торов) его волновая модель, для которой d(t) описывается однородным диф-
ференциальным уравнением с известными параметрами и неизвестными на-
чальными условиями. Это предположение позволяет свести задачу обраще-
ния системы к задаче восстановления вектора состояния расширенной систе-
мы, что, в частности, дает возможность избежать неустойчивости процесса
оценивания для неминимально-фазовых объектов. Такой подход достаточно
стандартен для публикаций по оцениванию возмущений и достаточно подроб-
но представлен в разделе 2 настоящего обзора.
Проиллюстрируем подход работы [148] для приведенного в разделе 2 при-
. На его
мера из [103]. Объект задан передаточной функцией P (s)
Ts+1)s
вход поступает неизвестное возмущение d(t), а измерения выхода y(t) содер-
29
жат аддитивную погрешность (шум) ζ(t). Матрицы (4.20) уравнений состоя-
ния системы в канонической форме (см. (2.8)) имеют вид
]
[0
1
[0]
[
]
(4.31)
A=
B=
C =
k0T-1
0
0
-T-1
1
]T
Введем вектор-столбец L =
[l1 l2
с подлежащими выбору при синтезе
элементами l1, l2. Характеристический многочлен D(s) матрицы AL = A - LC
имеет вид
D(s) = det(sI - A) = s2 + (1 + k0l1)T-1s + (k0l1 + T k0l2)T-2.
Согласно методике [148] зададим значенияλ1 = -1,λ2 = -2 и запишем же-
лаемые собственные числа матрицы AL в виде λi = µλi, i = 1, 2, где µ > 0
выбранное (большое) значение. Получим желаемый характеристический мно-
гочлен D(s) в виде
D(s) = (s - λ1)(s - λ2) = s2 + 3µs + 2µ2.
Приравнивая выражения для коэффициентов желаемого и располагаемого
многочленов, получим
l1 = (3Tµ - 1)k-10, l2 = (2T2µ2 - 3Tµ + 1) · (Tk0)-1.
Для исследования точности оценивания выпишем уравнение для ошибки
e(t) = x(t) - x(t), принимая также во внимание действие погрешностей изме-
рения ζ(t). Для этого будем считать, что на вход системы оценивания посту-
пает сигнал y(t) = Cx(t) + ζ(t). Уравнение (4.29) в отклонениях относительно
e(t) тогда принимает вид
(4.32)
ė(t) = AL
e(t) - Bd(t) + Lζ(t), ε(t) = Ce(t) - ζ(t).
Формула (4.30) с учетом погрешности измерений ζ(t) приводит к следую-
щему выражению
ε(t)
(
)
(4.33)
d(t) =
= -2Tµ2k-10ε(t) = -2Tµ2k-10
Ce(t) - ζ(t)
CA-1LB
Исходя из выражений (4.32), (4.33) получаются следующие формулы для
передаточных функций к ошибке оценивания Δd(t) = d(t)
d(t) от входных
сигналов d(t) и ζ(t):
}
{Δd
s(s + 3µ)
(4.34)
Wd(s) =
=
,
d
s2 + 3µs + 2µ2
}
{Δd
2s(T s + 1)
(4.35)
Wζ(s) =
=-
ζ
k0(s2 + 3µs + 2µ2)
30
Как видно из (4.34), (4.35), частотные характеристики системы по ошибке от
возмущения и шума измерений имеют сходную асимптотику: нулевой коэф-
фициент передачи для постоянного сигнала и пропускание сигналов верхних
частот.
Обратимся теперь к использованию описанного в разделе 2 подхода, осно-
ванного на представлении процесса d(t) как неизвестного постоянного сигна-
ла и включении его модел
d(t) = 0 в уравнения состояния системы, с после-
дующим использованием наблюдающего устройства для оценивания. Следуя
этому подходу, введем расширенную систему вида (2.6) и сформируем мат-
рицы (2.7) ее уравнений состояния как
0
1
0
0
[
]
B=1
(4.36)
A=
0 -T-1
1,
,
C =
k0T-1
0
0
0
0
0
0
]T
Введем вектор конструктивных параметров наблюдателя L =
[l1 l2
l3
,
которые вычислим, исходя из заданного расположения корней харак-
теристического многочлена
D(s) = det(sI
AL),
AL
A-
C. Получим
D(s) = s3 + (1 + k0l1)T-1s2 + k0(l1 + T l2)T-2s + k0l3T-1. Для удобства срав-
нения, как и выше, зададимся вещественными корнями характеристического
многочлена в формеλ1 = -1,λ2 = -2,λ3 = -3 и запишем желаемые корни
многочлена
D(s) в виде λi = µλi, i = 1, 2, 3, для выбранного µ > 0. Отсюда
получаем следующий вектор L:
6T µ - 1
(4.37)
L = k-10(11T2µ2 - 6Tµ + 1)T-1.
6T µ3
Передаточные функции по ошибке оценивания от входного сигнала и по-
грешностей измерения получаются для этой системы в виде:
}
(
{Δd
s
s2 + 6µs + 11µ2)
(4.38)
Wd(s) =
=
,
d
s3 + 6µs2 + 11µ2s + 6µ3
{
}
(
)
Δd
3s
Ts+1
s
(4.39)
Wζ(s) =
=
ζ
s3 + 6µs2 + 11µ2s + 6µ3
Из сравнения ПФ (4.35) и (4.39) видно, что за счет повышения порядка
наблюдатель для расширенной системы позволяет отфильтровать высокоча-
стотные погрешности измерений.
5. Метод внутренней модели. Наблюдатели гармонических возмущений
В [17, 41-44] систематически излагается принцип внутренней модели
(англ. Internal Model Principle) в теории автоматического управления. Со-
гласно этому принципу для устранения ошибок, вызванных внешними воз-
действиями (задающими, возмущающими), в систему должна быть введена
31
“внутренняя модель” автономная система, которая порождает эти сигналы.
Например, с этой точки зрения, интегрирование сигнала рассогласования в
регуляторе, обеспечивающее астатизм системы, есть воплощение такой моде-
ли, поскольку постоянное воздействие можно представить выходом интегри-
рующего звена (при нулевом входе) [44, §8.2]. Введение внутренней модели
дает возможность представить замкнутую систему однородными уравнения-
ми, и тогда решение задачи асимптотической стабилизации такой автономной
системы влечет стремление к нулю ошибок регулирования по задающему и
возмущающему воздействиям. Более того, это свойство робастно по отно-
шению к параметрическим возмущениям в силу непрерывной зависимости
корней многочлена от параметров, см. также [6].
В [41-43] рассматриваются подверженные возмущениям объекты, для
управления которыми вводится компенсатор, обрабатывающий результаты
измерений, задающее (опорное) воздействие r(t), и, возможно, некоторые воз-
мущения. Компенсатор служит для обеспечения устойчивости замкнутого
контура, а также управления переменной z(t), которая представляет собой
функцию от выхода ОУ y(t) и r(t). Обычно в качестве z(t) выступает ошиб-
ка слежения e(t) = e(t) - y(t). Замкнутая система с этими двумя свойствами
(“синтез” по [43]) называется структурно устойчивой, если эти два свойства
сохраняются при некоторых возмущениях параметров системы.
Рассматриваются ИПВ системы, заданные следующими обобщенными
уравнениями
(5.1)
x1(t) = A1x1(t) + A3x2(t) + B1
u(t),
(5.2)
x2(t) = A2x2
(t),
(5.3)
z(t) = D1x1(t) + D2x2
(t),
(5.4)
y1(t) = C1x1(t) + C2x2
(t),
(5.5)
xc(t) = Acxc(t) + Bc
y(t),
(5.6)
u(t) = Fcxc
(t) + F y(t).
Здесь введены
векторы состояния: x1 объекта, x2 модели источника возмущений и
задающего воздействия (тем самым характер этих сигналов задан, и они под-
чиняются однородному линейному дифференциальному уравнению (5.2), см.
также (2.5)), xc вектор состояния динамического компенсатора (5.5), (5.6);
переменные: z выходная переменная, относительно которой формули-
руется цель управления (далее
“управляемая переменная”), y выходная
переменная, измеряемая датчиками, u управление, вырабатываемое ком-
пенсатором (5.5), (5.6). Считается, что переменные x, y, z принадлежат ко-
нечномерным вещественным линейным пространствам X , Y , Z (в порядке
перечисления).
Вводится совокупный вектор состояния xL = col (x1, xc), относительно ко-
торого из (5.1)-(5.6) следуют уравнения замкнутой системы
(5.7)
xL(t) = ALxL(t) + BLx2(t), zl(t) = DLxL(t) + D2x2
(t),
32
где
]
[A1 + B1FC1 B1Fc
[A3 + B1FC2]
]
AL =
,
B=
,
DL =
[D1
0
BcC1
Ac
BcC2
Назначение компенсатора, таким образом, заключается в обеспечении гур-
вицевости матрицы AL, а регулирование выхода в выполнении требования
limt→∞ z(t) = 0. Для определения регулятора, обеспечивающего указанную
структурную устойчивость, вводятся понятия читабельности (англ. read-
ability) и внутренней модели.
Определение 1
[43]. Считается, что z читабельно (readable) из y,
если имеется отображение Q : Y → Z такое, что z = Qy. Это значит,
что D1 = QC1, D2 = QC2.
Определение 2
[43]. Считается, что отображение A : X → X
включает в себя внутреннюю модель A2, если минимальный многочлен
матрицы A2 есть делитель не менее d(Z) инвариантных сомножителей
матрицы A.
Таким образом, внутренняя модель представляет собой l-кратную реду-
пликацию в A максимальной циклической компоненты A2, где l ≥ d(Z) =
числу независимых выходов, которые подлежат управлению.
В [41, 43] сформулирована следующая теорема о необходимости читабель-
ности для структурной устойчивости.
Теорема 1
[41, 43, теорема 1]. Необходимым условием структурной
устойчивости синтеза при (A3, Bc|Z ) является читабельность z по y.
Для получения основного результата о необходимости внутренней модели
в [41, 43] делается следующее предположение.
Предположение 1. Имеет место соотношение
(5.8)
ImBcw ⊂ 〈Ac|BcwE1Ker D1
〉.
Предположение 1 говорит о том, что информация, отправленная от w и
обработанная компенсатором, относится только к объекту управления и недо-
ступна из z. В [41] показана необходимось выполнения (5.8) для структурной
устойчивости. На основе этого сформулирована следующая теорема.
Теорема 2
[41, 43, теорема 2]. Пусть z читабельно из y и выполне-
но (5.8). Тогда синтез структурно устойчив в A3, только если компенсатор
включает внутреннюю модель A2, которая управляема по z и наблюдаема
по u.
В заключение авторы [43] справедливо отмечают: “Задача регулирования,
которую мы рассмотрели, несколько идеализирована: например, мы потре-
бовали точного асимптотического подавления возмущений. На практике эта
задача ставится в нечетких терминах; таким образом, может потребовать-
ся ослабление возмущений только в определенной степени”. Далее авторы
указывают, что использованная в работе идеализация позволила дать точ-
ную постановку задачи, в результате чего получен рациональный базис и
33
качественное понимание для практического синтеза многосвязных регулято-
ров. Заметим, что реальные задачи проектирования отличаются не столько
ослабленными и нечеткими требованиями к характеристикам разработанной
системы, сколько наличием ряда спецификаций, которые естественнее пред-
ставить в виде системы ограничений, а не одного критерия.
Компенсация внешних возмущений в дискретных по времени системах
на базе метода внутренней модели и принципа поглощения рассмотрена в
[46, 50]. Рассматриваются объекты, в которых частотные характеристики из-
вестны не полностью, а внешнее возмущение описывается линейным разност-
ным уравнением. Предложена структура управления в форме обратной свя-
зи, гарантирующего робастную устойчивость и устраняющего влияние внеш-
них возмущений за минимальное число шагов. Результат [46, 50] обобщен
в [156] для непрерывных по времени объектов. Предложены полиномиаль-
ные соотношения многочленов объекта и алгоритма управления, выполнение
которых обеспечивает робастную устойчивость замкнутой системы.
В [96] предложены наблюдатели возмущений для стабилизации линейных
ОУ в окрестности точки равновесия. Модель ОУ задана уравнениями
(5.9)
x(t) = Ax(t) + Bu(t) + Df(t), x(t) ∈ Rn
с известными матрицами A, B и D. По сравнению с (5.68), здесь динамика
возмущений описывается внутренней моделью вида
(5.10)
w(t) = Rw(t) + lf(t), f(t) = Nw(t),
где w ∈ Rq. Показано [96], что модель возмущения f(t) может быть перепи-
сана в виде
f (t) = NT
ζ(t) + εf (t),
(5.11)
ζ(t) = η(t) + T x(t),
η(t) = Rη(t) + (RT - T A)x(t) - T Bu(t).
Здесь εf (t) экспоненциально затухающая функция, матрица T удовлетво-
ряет равенству T D = l. Если же параметры ОУ неизвестны, то наблюдатель
возмущений описывается следующими уравнениями [56]:
η0(t) = η0 + (RT - TA0)x(t),
(5.12)
ηi(t) = Rηi(t) + Ta0xi(t),
1 ≤ i ≤ n,
ηu(t) = Rηu(t) - Tb0u(t).
Здесь матрицы A0, a0 и b0 полагаются известными и находятся из условий
структурных согласований: A = A0 + a0τT и b = βb0, τ и β неизвестные
вектор и число.
В отличие от [96] в статье [48] решена задача слежения за эталонным сиг-
налом линейным ОУ с неизвестными постоянными параметрами при измере-
нии только его выхода. Модель неизвестного эталонного сигнала описывается
34
внутренней моделью с неизвестными параметрами. Разработан адаптивный
наблюдатель для оценок производных по времени эталонного сигнала и по-
лучена адаптивная система управления с неявной эталонной моделью.
В работах [48, 96] рассмотрено управление линейными и нелинейными объ-
ектами. В отличие от [48, 96] в [49] предложена компенсация возмущений
в нелинейных SISO системах с неизвестными постоянными параметрами и
неизвестным входным возмущением. Доступны измерению только скалярные
входные и выходные сигналы ОУ. Модель ОУ задана в следующей форме
metric-strict-feedback
xj = xj+1 + θTϕ(x1,... ,xj),
1 ≤ j ≤ n - 1,
xn = β(x) + θTϕn(x) + γ(x)(u + f),
y=x1.
Закон управления u задается в виде u = uy + uf , где сигнал uy необхо-
дим для управления объектом с целью слежения за эталонным сигналом ym,
сигнал uf необходим для компенсации возмущений. Возмущение f описы-
вается внутренней моделью вида (5.68). Вначале строится наблюдатель воз-
мущений, подобный наблюдателю (5.11). Затем с использованием процедуры
бэкстеппинга синтезируется первая компонента закона управления uy. Из-за
громоздкости структуры алгоритма для uy он в обзоре не приводится. Ре-
зультаты [48, 49, 96] более подробно описаны в монографии [157].
В результате основное достоинство описанных выше алгоритмов состоит
в улучшении качества регулирования, по крайней мере в установившемся ре-
жиме, за счет предположения о том, что возмущение описывается суммой
синусоидальных сигналов. Однако данные алгоритмы зачастую сложны в
расчете и реализации при увеличении числа синусоид. Поэтому в описанных
выше источниках численные примеры работы алгоритмов в основном тести-
руются на сумме двух или трех синусоид. Кроме того, качество регулирова-
ния таких алгоритмов существенно зависит от величины несинусоидальной
составляющей. Если данная составляющая принимает большие значения, то
рекомендуется использовать алгоритмы подавления или компенсации огра-
ниченных возмущений, которые будут приведены далее.
5.1. Нелинейные наблюдатели гармонических возмущений
В [70] рассматривается задача стабилизации подверженной гармоническим
возмущениям нелинейной системы на основе наблюдателя возмущений.
Модель ОУ со скалярными входом и выходом описывается нелинейными
аффинными по управлению и возмущению уравнениями
(5.13)
x(t) = f(x) + g1(x)u + g2
(x)d(t), y = h(x),
где x = x(t)∈ Rn вектор состояния ОУ; y(t), u(t), g(t) выход, управле-
ние и неизмеряемое возмущение (соответственно) скалярные переменные.
Внешние гармонические возмущения d(t) с известной частотой ω0 моделиру-
ются гармоническим осциллятором
(5.14)
ξ
(t) = Aξ(t), d(t) = Cξ(t)
35
с состоянием ξ(t)∈ R2, неопределенными начальными условиями xs(0) и мат-
рицами
[
]
0
ω0
]
(5.15)
A=
,
C =
[1
0
−ω0
0
Предложен следующий нелинейный наблюдатель возмущения d(t)
(
)
Ż=
A - L(x)g2(x)C
z + Ap(x) - L(x)f(x)-
−L(x)g1(x)u - L(x)g2(x)Cp(x),
(5.16)
ξ = z + p(x),
d=Cξ,
где ξ вектор состояния наблюдателя возмущений
d оценка возмущений;
p(x)∈ R2, L(x)∈ R2×n подлежащие определению при синтезе вспомогатель-
ная функция и матричный коэффициент усиления наблюдателя, связанные
соотношением
∂p(x)
(5.17)
L(x) =
∂x
Для асимптотического затухания ошибки оценивания e(t) = ξ(t)
ξ(t) тре-
буется существование L(x), обеспечивающей асимп(отическую усто)йчивость
с желаемой скоростью затухания ошибки ė(t) =
A - L(x)g2(x)C
e(t) для
всех x, принадлежащих рабочей области. Если g2 не зависит от x, то за-
дача решается выбором L(x) = Lx. В общем случае можно задаться одной из
функций p(x) или L(x) и найти другую из (5.17).
В [70] разработана следующая регулярная процедура синтеза, использую-
щая предположение, что относительный порядок ρ [47, 158] объекта (5.13)
вполне определен во всей рабочей области. Для синтеза устойчивого наблю-
дателя используется концепция пассивности [64, 159, 160]. Коэффициент уси-
ления ищется в виде
]
[k
∂Lρ-1fh(x)
1
(5.18)
L(x) =
,
k2
∂x
где k1, k2
постоянные, подлежащие определению при синтезе. Тогда из
(5.17) следует, что
]
[k
1
(5.19)
p(x) =
Lρ-1f
h(x).
k2
Вводится в рассмотрение функция
ρ-1
∂L
h(x)
f
(5.20)
n(x) =
g2
(x),
∂x
36
[k1]
так что L(x)g2(x) =
n(x). В предположении, что n(x) > 0 во всей рабочей
k2
области, вводится величина n0 > 0, такая что 0 < n0 < n(x). Доказано, что
если имеются постоянные k1 и k2, такие что передаточная функция
k1s + k2ω0
(5.21)
H(s) =
s2 + k1n0s + ω00 + k2n0)
асимптотически устойчива и положительно вещественна (см. [64, 159, 160]),
то при сделанном предположении об относительном порядке выхо
d(t) нели-
нейного наблюдателя (5.16) асимптотически отслеживает гармоническое воз-
мущение d(t), действующее на ОУ (5.13).
В [70] обсуждается вопрос использования наблюдателя (5.16) совместно с
регулятором, который стабилизирует нелинейную систему без возмущений,
для стабилизации подверженного гармоническим возмущениям ОУ. На пер-
вом этапе синтеза разрабатывается закон управления для объекта, не подвер-
женного влиянию возмущений, после чего в замкнутую систему добавляется
наблюдатель возмущений (5.16). Исследована задача управления нелинейны-
ми системами в условиях гармонических помех неизвестной частоты. Основ-
ной результат работы сформулирован в следующей теореме.
Теорема 3
[70, теорема 3]. Рассмотрим нелинейную систему (5.13),
подверженную влиянию гармонических возмущений (5.14). Замкнутая си-
стема, включающая традиционный (линейный или нелинейный) регулятор,
нелинейный наблюдатель (5.16) и ОУ (5.13), является L2-устойчивой если:
нелинейный коэффициент усиления L(x) и дополнительная переменная
p(x) выбраны согласно (5.18), (5.19), и выполнены условия [70, теорема 2]:
коэффициенты k1, k2 удовлетворяют неравенствам k2 > 0, k1 >
k2ω0 .n
0
В [161] рассматривается класс систем, модели которых имеют “номиналь-
ную” линейную часть и неопределенную, нелинейную и, возможно, изменяю-
щуюся во времени часть в виде аддитивного воздействия, зависящего от со-
стояния и времени, а именно:
(5.22)
x(t) = Ax(t) + Bf(t, x), y(t) = C(t)x(t),
где x(t)∈ Rn вектор состояния, y(t)∈ Rq измеряемый в каждый момент
времени t вектор выхода, A, B, C известные матрицы соответствующих
размеров. Неизвестная непрерывная функция f(t, x)∈ Rm моделирует имею-
щиеся в системе неопределенность и нестационарность. Рассматривается за-
дача построения наблюдателя состояния x и неизмеряемого “входного воз-
действия” f.
Сделаны следующие предположения.
Предположение 2.
1) rank CB = rank B;
2) для любого λ ∈ C, такого что Reλ ≥ 0, выполнено
[A - λI B]
(5.23)
rank
= n + rankB.
C
0
37
Как отмечено в [161], нарушение предположения 2.2 для некоторого λ
может повлечь неотличимость по измерениям выхода процессов x(t) ≡ 0 и
f (t, x) ≡ 0, с одной стороны, от процессов x(t) = eλtx0, f(t, x) = eλtv при неко-
торых x0 = 0 и v = 0 с другой, поэтому оно является естественным с точки
зрения принципиальной возможности решения поставленной задачи оценива-
ния. При выполнении предположений о том, что rank B = m, rank C = p, сде-
ланных в [162] для аналогичной задачи, выполняются и предположения 1, 2.
В [161, лемма 3] устанавливается следующее условие, эквивалентное вы-
полнению предположений 1, 2:
Условие 1. Имеются (n×p)-матрица L, (m×p)-матрица G и
(n × n)-матрица P , P = PT > 0, такие что:
(5.24)
P (A + LC) + (A + LC)T
P < 0,
(5.25)
BT
P = GC.
Замечание 5. Указанное условие встречается в работах по адаптивно-
му управлению под названием гиперминимально-фазовости по отношению к
выходу σ = Gy [163-166].
Для нахождения матриц P , L, G, в [161] предлагается процедура, осно-
ванная на решении ЛМН [167-169]. Отмечено, что выполнение условия 1 эк-
вивалентно тому, что следующая задача минимизации
Задача.
(5.26)
P >I,
(5.27)
PA + KC + (PA + KC)T
< 0,
[δI BTP - GC]
(5.28)
≥0
δI
имеет минимум при δ = 0. Матричный коэффициент наблюдателя L нахо-
дится при этом из соотношения
(5.29)
L=P-1
K.
Далее, после некоторых дополнительных предположений, таких как
rank B = m, существование известной (“номинальной”) функции f0 и извест-
ных неотрицательных констант β1 и κ1 таких, что для всех t∈ R, x, x∈ Rn вы-
полнено ∥f(t, x) - f0(t, x)∥ ≤ β1 + κ∥x - x∥, а также ограниченности по нор-
ме производных функций f, f0 (см. подробнее в [161]), несмотря на то что
асимптотически точное оценивание в рамках данной схемы не может быть
обеспечено, наблюдатель
(
)
(5.30)
x(t) = Ax(t) +
f (t, x) + L
C x(t) - y(t)
,
x(t0) = x0,
(
(5.31)
f (t) = f0(t, x) - γG
Cx(t) - y(t))
при достаточно большом коэффициенте усиления γ > 0 вырабатывает, асимп-
тотически, оценки переменных x, f в виде x,
f (соответственно) с любой
заданной точностью, см. [161, теорема 1].
38
Основываясь на подходе [161], в [170] рассматриваются линейные системы
вида
(5.32)
x(t) = Ax(t) + Bu(t) + Gd(t), y(t) = C(t)x(t),
подверженные действию измеряемого u(t)∈ Rm и неизмеряемого d(t)∈ Rq
входов. Переменная d(t) может моделировать как внешние возмущения, так и
присущие системе нелинейность, неопределенность описания и нестационар-
ность параметров. G известная (n × q)-матрица. Остальные обозначения
совпадают с принятыми в (5.22). Предполагается, что матрицы C, G имеют
полный ранг.
В [170] предлагается использовать близкую к (5.30), (5.31) структуру на-
блюдателя, но, основываясь на [54], с интегрированием оценки
d возмуще-
ния d:
(
)
(5.33)
x(t) = Ax(t) + Bu(t) +
d(t) + L
y(t) - C x(t)
,
(
ˆ
(5.34)
d(t) = ρK
y(t) - C x(t)),
где ρ > 0
коэффициент усиления (названный в [170] “скоростью обуче-
ния”)5. В работе утверждается, что если условия [161, теорема 1] выполнены,
т.е. если существуют матрицы P = PT > 0, Q = QT > 0 такие, что
(5.35)
P (A - LC) + (A - LC)TP = -Q, GT
P =KC,
то точное асимптотическое оценивание может быть достигнуто как для со-
стояния, так и для входа, но при этом наблюдатель (5.33), (5.34) “может опе-
рировать только с медленно меняющимися входами” [170].
В [170] ставится задача перехода от наблюдателей полного порядка (5.30),
(5.31) и (5.33), (5.34) к наблюдателям пониженного порядка. Первый из пред-
ложенных наблюдателей описывается уравнениями
(5.36)
Ż(t) = F z(t) + Ly(t) + T Bu(t) + T
d(t), z(t0) = z0,
(
)
(5.37)
d(t) = γ
Wy(t) - Nz(t)
,
где z(t)
d(t) оценки T x(t) и d(t) соответственно, γ > 0 коэффициент уси-
ления, F , T , L, N, W - матрицы, подлежащие выбору при синтезе. В [170,
теорема 2]) найдены достаточные условия предельной ограниченности норм
ошибок оценивания ∥z(t) - T x(t)∥,
d(t) - d(t)∥ произвольными положитель-
ными константами ε1, ε2. В условия теоремы входят как матричные соотно-
шения, так и ограничения на ∥d(t)∥ и
d(t)∥.
Второй, “адаптивный”, наблюдатель пониженного порядка имеет вид
(5.38)
Ż(t) = F z(t) + Ly(t) + T Bu(t) + T
d(t), z(t0) = z0,
(
)
ˆ
(5.39)
d(t) = ρ
Wy(t) - Nz(t)
,
5 Неясно, почему в [170] наблюдатель (5.33), (5.34) называется “адаптивным”
это
обычная линейная система с интегралом от ошибки оценивания по выходу.
39
ρ > 0. Для постоянного возмущения, d = const, в [170, теорема 3] получено,
что при выполнении условий [170, теорема 2] на матрицы наблюдателя (5.38),
(5.39) имеет место асимптотическое стремление к нулю ошибок z(t) - T x(t)
и
d(t) - d.
Далее, в [170] излагаются алгоритмы синтеза (выбора матриц F , T , L, N,
W) наблюдателей. В частности, показано [170, теорема 4], что для существо-
вания матриц, удовлетворяющих [170, теорема 2], необходимо и достаточно,
чтобы: 1) rank (CG) = rank G и 2) все неустойчивые полюса системы (A, G, C)
соответствовали ненаблюдаемым модам пары (A, C). Тем самым оказыва-
ется, что возможна оценка входа и для некоторых неминимально-фазовых
объектов, а для состояния x(t) ненаблюдаемых объектов возможна оценка
значений линейной функции T x(t).
По мнению авторов, наблюдатель (5.38), (5.39) не отличается от наблю-
дателя Луенбергера [82-85], построенного для расширенной системы (2.6) с
матрицей As = 0q.
Для класса нелинейных систем вида x(t) = F (x) + D(x)u(t) + Dd(t) в [51]
синтезируется наблюдатель возмущений, благодаря использованию которого
задача компенсации возмущений переводится в задачу адаптивного управле-
ния. В [51] используется метод внутренней модели, в рамках которого воз-
мущения рассматриваются как выход d(t) линейной системы xs(t) = Asxs(t),
d(t) = Csxs(t), xs(t)∈ Rns . Для решения задачи адаптивного управления ис-
пользуется метод бэкстеппинга (“обратного шага”) [64, 158, 171-174]. По-
рядок ns модели возмущений известен, пара (As, Cs) считается полностью
наблюдаемой, но матрицы As, Cs
неизвестны. На основе результатов
[96, лемма 1], [48, 49] возмущение d(t) представляется как выход системы
Ż(t) = Gz(t) + l d(t), d(t) = θTz(t), где z ∈ Rns , θT = Cs M-1, G гурвицева
матрица порядка n с попарно различными собственными значениями, l
матрица размера (ns × n) и пара (G, l) полностью управляема. Матрица M
порядка ns удовлетворяет уравнению Сильвестра MS - GM = l C. Нетруд-
но заметить, что z = Mxs. Используя результаты [96], неопределенность па-
раметров модели возмущений (матрицы As) трансформируется в неопреде-
ленность коэффициентов матрицы θ. Для устранения этой неопределенности
в [51] используется метод бэкстеппинга [158, 172]. В качестве иллюстрации
рассматривается задача управления беспилотным гидросамолетом при раз-
личных волнениях.
В [73] рассматривается задача граничной стабилизации гиперболических
дифференциальных уравнений первого порядка в частных производных с
помощью обратной связи. Для синтеза регулятора используется метод бэкс-
теппинга [158, 172]. В работе показано, что предложенный метод может быть
использован и для граничного управления распределенными системами тре-
тьего порядка типа Кортевега-де Фриза. Для систем с временным запазды-
ванием исполнительного устройства авторами [73] предложен наблюдатель
состояния. Рассматривается следующая система с постоянным запаздывани-
ем τ > 0:
(5.40)
X
(t) = AX(t),
(5.41)
Y (t) = CX(t - τ),
40
пара (A, C) считается полностью наблюдаемой. Уравнение выхода (5.41) пре-
образуется к следующему гиперболическому уравнению первого порядка в
частных производных:
(5.42)
ut(x,t) = ux
(x, t),
(5.43)
u(x, τ) = CX(t),
(5.44)
Y (t) = u(0, t),
где обозначено: ut = ∂u(x, t)/∂t, ux = ∂u(x, t)/∂x. Для системы (5.40), (5.42)-
(5.44) строится наблюдатель [73, теорема 5]
(
)
ˆ
(5.45)
X(t) = AX
(t)e L
Y (t) - û(0, t)
,
(
)
(5.46)
ût(x,t) = ûx(x,t) + CeAxL
Y (t) - û(0, t)
,
(5.47)
û(x, τ) = CX
(t),
где ût(x, t), ûx(x, t)
оценки переменных ut(x, t), ux(x, t) (соответственно).
Матрица L выбирается так, чтобы обеспечить гурвицевость матрицы A-LC.
Результаты получили развитие в [175].
Адаптивное подавление несогласованных (англ. unmatched) неизмеряе-
мых гармонических возмущений с неизвестными параметрами, действующих
на линейную инвариантную по времени систему (система, имеющая постоян-
ные параметры, англ. LTI ) методом бэкстеппинга на основе обратной связи
по производной от состояния объекта, рассматривается в [61]. Исследование
мотивируется задачей стабилизации судна при морском волнении, см. [176],
для которой характерна возможность измерения ускорений, и вычисления
скоростей движения, но не координат. Синтез состоит из следующих шагов:
1) параметризация синусоидальных возмущений в виде выхода известной с
неизвестным выходом, который зависит от неизвестных параметров возмуще-
ний; 2) синтез адаптивного наблюдателя возмущений как для самого возму-
щения, так и его производной; 3) синтез адаптивного регулятора с виртуаль-
ным управлением; 4) окончательный синтез регулятора введением уравнения
ошибки на основе процедуры бэкстеппинга [158, 172].
В [61] рассматривается следующая инвариантная по времени линейная си-
стема со скалярным управлением и многочастотным гармоническим возму-
щением:
(
)
(5.48)
x(t) = Ax(t) + B
p(t) + v(t)
,
(5.49)
p(t) = aTx(t) + bpp(t) + bu
u(t),
где x(t)∈ Rn, p(t)∈ R, u(t)∈ R, v(t)∈ R синусоидальное возмущение вида
(5.50)
v(t) =
gi sin(ωit + ϕi
),
i=1
где ωi, gi, ϕi
неизвестные вещественные параметры, причем частоты ωi
попарно различны (ωi = ωj при i = j), а сам процесс возмущений v(t) не из-
меряется датчиками. Возмущение v(t) представляется как выход линейной
41
экзосистемы (см. также (2.5)-(2.7) и (5.68))
(5.51)
w(t) = Sw(t), v(t) = hT
w(t),
где (2q × 2q)-матрица S и вектор-столбец h∈ R2q выбраны соответствующим
образом (см., например, (5.15)).
Делаются следующие предположения.
Предположение 3.
3.1. Матрица A обратима.
3.2. Пара (A, B) управляема.
3.3. bu = 0.
3.4. Переменные x(t) и v(t) неизмеряемые, а x(t) и p(t) измеряемые.
3.5. Пара (S, hT) наблюдаема.
3.6. Собственные числа матрицы S мнимые, различные и рациональные.
3.7. натуральное число q известно.
3.8. S и h неизвестны.
3.9. gi = 0 для всех i ∈ {1, . . . , q}.
В рамках указанных предположений для системы (5.48)-(5.51) в [61] стро-
ится следующий адаптивный регулятор с наблюдателем возмущений:
1
)
(( ˙θTl-(1+KB)(b
u=
p -aTA-1B)
p-
(1 + KB)bu
)
-
θTN + (θTN + K)A + (1 + KB)aTA-1 - (A-1B)TP
x+
+ (1 + KB)(aTA-1B)θTξ - (KB +θTl
βTξ -˙θTη - θT η -
)
(
)
(5.52)
-
(KB +θTl)2 + c
e ,
где c >12 и
(5.53)
e = p + K ˙x + θTξ.
Алгоритмы настройки параметров регулятораθ(t)
β(t) имеют вид
(
)
ˆ
(5.54)
θ = -γtξ A-1BTP ˙x + (1 + KB)(aTA-1B)e ,
(
)
ˆ
(5.55)
β=γbξ KB+θ
Tl ,
где γt, γb > 0 выбранные разработчиком коэффициенты усиления алгорит-
ма, а матрица P = PT удовлетворяет матричному уравнению
(
(5.56)
A-1 + A-1BK
)T P + P(A-1 + A-1BK)
= -2I.
Используется следующий наблюдатель возмущений
(
)
(5.57)
η=G
η + N(x - Bp)
− NA˙x,
42
(5.58)
ξ
= η + N(˙x - Bp),
где G
(2q × 2q)-гурвицева матрица с попарно различными собственными
числами, образующая управляемую пару с выбранным вектором l ∈ R2q, а
N матрица размера 2q × n, которая отвечает уравнению NB = l, одним из
решений которого является
1
(5.59)
N =
lBT.
BTB
В [61] приводится иллюстративный пример для системы с матрицами
]
[0
1
[0]
[
]
A=
,
B=
,
aT =
12
,
bu = bp = 1,
1
3
1
v(t) = 1,2 sin(0,8t + π/4) - 0,5 sin(t + π/2), c = 0,8, γt = γb = 2.
Результаты моделирования показывают асимптотическую стабилизацию си-
стемы и сходимость оценки возмущенияθTξ к самому процессу v(t).
Адаптивный регулятор, построенный методом бэкстеппинга предлагается
в [62] для подавления синусоидальных возмущений, действующих на линей-
ную инвариантную во времени скалярную систему с одним входом и неиз-
вестными параметрами, имеющую каноническое управляемое представление
[84, 85, 177], на входе которой имеется линейная подсистема, параметры кото-
рой тоже неизвестны. Рассматриваемая система, таким образом, описывается
уравнениями
(5.60)
x=A0x+B(γT1x+v+bp
p),
(5.61)
p=γT2x+b1p+b2
u,
где
]
[0
In-1
[0n-1]
(5.62)
A0 =n-1
,
B=
,
0
0Tn-1
1
(5.63)
γ1 = [a11,a12,... ,a1n]T,
γ2 = [a21,a22,... ,a2n]T,
0n-1 = [0,... ,0]T ∈ Rn-1, x(t)∈ Rn
вектор состояния системы, p(t)∈ R
“ виртуальный вход” системы (5.60), u(t)∈ R управление,b1,b2,bp, γ1, γ2
неизвестные постоянные, v(t)∈ R синусоидальное возмущение вида (5.50).
Как обычно, возмущение v(t) представляется в форме решения однородного
уравнения (5.51). По (5.60)-(5.62) видно, что возмущение v не согласовано с
управлением u. Принято, что сигнал управления должен вырабатываться с
использованием только измерений производных по времени от переменных
состояния основной системы и состояния входной подсистемы (прикладной
смысл такого представления поясняется в [61], см. выше). Регулятор пред-
назначен для подавления синусоидальных возмущений, действующих на си-
стему. Синтез регулятора состоит из следующих этапов: 1) параметризация
возмущения в форме выхода известной системы с обратной связью с неизвест-
ным выходом, зависящим от неизвестных параметров возмущения; 2) синтез
43
адаптивного наблюдателя возмущения для оценки самого возмущения и его
производной по времени; 3) синтез адаптивного регулятора для виртуально-
го управления; 4) синтез окончательного адаптивного регулятора на основе
процедуры бэкстеппинга [158, 172].
В [62] для параметризации возмущений используются результаты [56, 96].
С этой целью выполняется преобразование координат модели возмущений
(5.51), при котором возмущения представляются скалярным произведением
неизвестного постоянного вектора и производной от вектора состояния преоб-
разованной модели. Для оценки этой производной вводится наблюдатель спе-
циального вида, включающий набор фильтров и использующий избыточную
параметризацию. В [62] доказано, что состояние равновесия замкнутой адап-
тивной системы устойчиво и обеспечивается точная асимптотическая оценка
возмущения. Эффективность предложенного регулятора иллюстрируется ре-
зультатами моделирования системы третьего порядка.
В последующей статье [63] этих авторов рассмотрена задача подавления
гармонических возмущений одновременно с компенсацией задержек входного
сигнала. В статье отмечено, что задача синтеза регулятора для подавления
неизвестных синусоидальных возмущений с запаздыванием по управлению
рассмотрена в [57, 59, 74, 75], но в этих работах алгоритмы подавления воз-
мущений получены для систем, параметры которых известны. Целью рабо-
ты [63] является разработка метода, для которого не требуется знания фак-
тических значений параметров системы, что имеет важное прикладное зна-
чение. В [63] адаптивный регулятор предназначен для оценки и подавления
неизвестных синусоидальных возмущений, действующих на линейную инва-
риантную во времени систему в управляемой канонической форме с неиз-
вестными параметрами и запаздыванием по входу через обратную связь по
состоянию объекта. Возмущение представляется в параметризованной форме
на основе методики работы [56]. Суть подхода для компенсации запаздыва-
ния заключается в использовании обратной связи предиктора, предложенной
в [73] в качестве вида граничного управления на основе бэкстеппинга для си-
стем в частных производных [178]. Результаты работ [56, 73] и позволяют
переформулировать рассматриваемую задачу как задачу адаптивного управ-
ления для неопределенной системы, описываемой уравнениями в частных
производных и обыкновенными дифференциальными уравнениями. Анало-
гично подходу работы [179], законы уточнения оценок неизвестных парамет-
ров основаны на методе Ляпунова.
Синтез регулятора состоит из трех этапов: 1) параметризация синусои-
дального возмущения; 2) представление запаздывания в качестве транспорт-
ного уравнения с распределенными параметрами; 3) разработка адаптивного
управления граничными условиями системы с распределенными параметра-
ми на основе метода бэкстеппинга для распределенных систем. В [63] дока-
зано, что состояние равновесия замкнутой адаптивной системы устойчиво и
обеспечивается точная асимптотическая оценка возмущения. Эффективность
предложенного регулятора иллюстрируется результатами моделирования си-
стемы второго порядка.
В [180] приведена улучшенная версия так называемого “расширенного
наблюдателя”. Улучшение достигается распространением леммы Даяванса
44
(Dayawansa) [181] на случай систем, нормальная форма которых включает
изменяющиеся во времени (и измеряемые) коэффициенты передачи в систе-
ме, моделируемой цепочкой интеграторов между входом и выходом. Именно:
рассматриваются линейные системы с изменяющимися параметрами
(5.64)
x = A(t)x + Bu, y = C(t)x,
где x(t)∈ Rn, матрицы A(t), B, C(t) имеют вид
0
-an-1g1(t) g2(t)
0
0
0
0
−an-2g1(t)
0
g3(t) ...
0
0
(5.65)
A(t) =
·
·
·
·
·
,
B=
,
 -a1g1(t)
0
0
0
gn(t)
0
−a0g1(t)
0
0
0
0
1
[
]
C =
a0g1(t)
0
0
0
0
с зависящими от времени непрерывными функциями gi(t) такими, что для
некоторых фиксированных gmin, gmax для всех t ≥ 0 и i = 1, 2, . . . , n выпол-
нено 0 < gmin ≤ gi(t) ≤ gmax. Доказано [180, лемма 2], что для любого γ > 1
имеется набор параметров a0, . . . , an-1 и некоторое λ > 0, таких что вдоль
траекторий системы (5.64) может быть обеспечено выполнение неравенства
диссипации вида
(5.66)
D+(5.64)
V + ≤ -λV (x) + γ|u| - |y|,
(
)
где D+(5.64)V
x(t)
производная Дини (Dini) [182] в силу системы (5.64):
(
)
1(
)
D+(5.64)V
x(t)
= lim sup
V (x(h + t)) - V (x(t))
,
h→0+ h
где x(t) подчиняется (5.64). В качестве примера в [183] рассматривается за-
дача удержания положения квадротора без измерения углов тангажа и крена
(см. [81]).
5.2. Наблюдатели синусоидальных возмущений
Огромный пласт работ посвящен синтезу наблюдателей синусоидальных
возмущений, где сами возмущения представлены выражением
(5.67)
f (t) = A0 +
Ai sin(ωit + ϕi
).
i=1
Здесь A0 определяет смещение синусоидального сигнала, Ai, ωi и ϕi задают
амплитуду, частоту и фазу i-й составляющей синусоидального сигнала. В за-
висимости от решаемой задачи сигнал f(t) либо измеряется, либо оценивает-
ся. Однако в обоих случаях необходимо восстановить оценку сигнала f(t), для
45
чего восстанавливается информация о величинах A0, Ai, ωi и ϕi, i = 1, . . . , n.
Предполагается, что частоты ωi различны.
Представление возмущений в виде суммы синусоидальных сигналов обу-
словлено несколькими факторами:
1) существует ряд периодических процессов, которые могут описываться
синусоидальными функциями: вращение пропеллера в вентиляционных си-
стемах, гашение колебаний в некоторых типах вибрационных систем и т.п.;
2) возможность представления возмущений в виде синусоидальных сиг-
налов позволяет синтезировать алгоритмы управления, которые могут улуч-
шить качество регулирования по сравнению с алгоритмами, разработанными
в предположении только ограниченности возмущений;
3) возможность представления синусоидальных возмущений в виде си-
стемы дифференциальных уравнений порядка 2n, что позволяет применять
большинство алгоритмов управления и идентификации, разработанных в тео-
рии автоматического управления динамическими объектами.
Перепишем сигнал (5.67) в виде следующего дифференциального уравне-
ния
(5.68)
w(t) = Rw(t), f(t) = Nw(t),
где w(t) ∈ R2n, матрицы R и N получены при переходе от (5.67) к (5.68).
В литературе представление возмущений в виде некоторого генератора воз-
мущений, в частности в виде (5.68), называется внутренней моделью [44, 47].
С использованием градиентного алгоритма в [55] при A0 = 0 получен сле-
дующий простой адаптивный идентификатор возмущения
(5.69)
Θ(t) = α(f
- f)W(t),
где α > 0 коэффициент, от значения которого зависит скорость идентифи-
n
n
кации частоты
f =
λ2ih2i +
ϕi-1h2i-1, h = [h1, . . . , h2n], λi коэф-
i=1
i=1
фициенты гурвицевого полинома γ(s) = s2n + λ2ns2n-1 + · · · + λ2s + λ1, s
комплексная переменная,
0
1
0
0
0
0
1
0
h=Λh+bf,b=[0,...,0,1]T,Λ=
,
0
0
0
1
−λ1
2
3
2n
ϕi = λ2i+1n-i, Θ = [θ1, . . . ,θn]T, W (t) = col {h1(t), h3(t), . . . , h2n-1(t)}.
Сигналы
θ1,... ,θn являются репараметризованными оценками исходных
неизвестных частот ω1, . . . , ωn.
Алгоритмы, подобные [55], рассматривались в [184, 185]. В [186] решена за-
дача идентификации сигнала (5.67) с неизвестным значением n. Достоинства
данных алгоритмов состоят в простоте их вывода и реализации. Моделирова-
ние показывает, что не всегда можно получить удовлетворительное качество
46
переходных процессов в смысле малого значения перерегулирования и вре-
мени переходного процесса. При этом сложность и динамический порядок
алгоритмов существенно возрастает при увеличении числа синусоидальных
сигналов. Кроме того, качество идентификации значительно зависит от на-
личия несинусоидальных составляющих.
В [187] приведен алгоритм оценки возмущения (5.67) (при n = 1) с наличи-
ем несинусоидальной аддитивной ограниченной составляющей Δf(t). В дан-
ном случае идентификатор возмущения описывается уравнениями
{
}
ω(t) = max ω,
1(t)| ,
σ(t) = ω(t)-2 θ2(t),
θ(t) = χ(t) +
k˙ξ(t)ϕ(t),
(5.70)
χ(t) = -kϕ(t)ϕ(t)T θ(t) -
k˙ξ(t)ϕ˙(t),
ζ1(t) = ζ2(t),
˙ζ2(t) = -2λζ2(t) - λ2ζ1(t) + λ2f(t),
где ϕ(t) = [-ζ1(t) 1]T,θ(t) = [θ1(t)θ2(t)]T, λ > 0 и k > 0. Однако для реа-
лизации алгоритма (5.70) нижние оценки ω ≤ ω, A0 ≤ A0 и A1 ≤ A1 должны
быть известны.
В отечественной литературе также предложено много оригинальных работ
по построению наблюдателей и идентификаторов синусоидальных сигналов
с дальнейшей компенсацией возмущений. Подавляющая часть работ в дан-
ном направлении опубликована сотрудниками Университета ИТМО с целью
уменьшения времени идентификации и уменьшения величины перерегулиро-
вания. В отличие от [55, 184-186] далее будут представлены работы по оценке
и компенсации возмущений, которые действуют на объект управления и не
подлежат прямому измерению. В работе [188] рассматривается компенсация
синусоидальных возмущений для минимально-фазовых SISO ОУ с измеряе-
мым выходным сигналом, представленных в виде
(5.71)
a(p)y(t) = b(p)u(t) + c(p)f(t),
где возмущение f определено выражением (5.67) при n = 1, p = d/dt опе-
ратор дифференцирования, a(p), b(p) и c(p) линейные дифференциальные
операторы с постоянными неизвестными коэффициентами, y и u скалярные
сигналы. Центральным моментом в [188] является представление гармониче-
ского сигнала со смещением как линейного выхода линейной канонической
системы с неизвестным параметром θ
x1 = x2,
x2 = x3,
x3 = -θx2,
f =k1x1 +k2x2 +k3x3,
47
где k1 = α3, k2 = 3α2, k3 = 3α, α > 0, параметр θ подлежит оценке. Для ре-
шения задачи закон управления представляется в виде суммы
(5.72)
u(t) = u1(t) + u2
(t),
где сигнал u1 необходим для стабилизации ОУ, а сигнал u2 - для компенсации
возмущений. Для оценки синусоидального возмущения и его компенсации
строится следующий наблюдатель и закон управления u2:
˙ξ(t) = A0 x(t) - dθx2(t) + dµy(t),
(5.73)
x(t) = ξ(t) + dµy(t),
u2(t) = -k1x1(t) - k2x2(t) - k3x3(t).
0
1
0
Здесь A0 =0
0
1,d=[001]T,x=[x1, x2, x3]T, µ можно выбирать как
0
0
0
t
положительное число или настраивать согласно алгоритму µ(t) =
r(g)dg,
0
где r(t) = r0 > 0 при |y(t)| > ε или r(t) = 0 при |y(t)| ≤ ε, ε > 0 точность
регулирования в установившемся режиме. Стабилизирующая составляющая
задается в виде u1 = -γy с алгоритмом настройки γ = γ0y2. Алгоритм (5.73)
по сравнению с [55, 184-186] позволяет оценить и скомпенсировать синусои-
дальные возмущения по косвенным измерениям, т.е. по измерениям только
выходного сигнала ОУ. При этом условия согласования для ОУ могут быть
не выполнены, что не позволит реализовать непосредственную компенсацию
возмущений.
В работе [189] рассматривается компенсация синусоидальных возмущений
для SISO ОУ вида
x(t) = Ax(t) + Bu(t) + Bf(t),
(5.74)
y(t) = Cx(t),
где f = A sin(ωt + ϕ). Модель ОУ преобразуем к виду
a(p)y(t) = b(p)(u(t) + f(t)),
где полином a(s) гурвицев и коэффициенты полиномов a(s) и b(s) извест-
ны. Поскольку ОУ устойчивый с известными постоянными параметрами, то
ресурс управления тратится только на компенсацию возмущения. Для ком-
пенсации синусоидального возмущения используется следующий алгоритм
1
u(t) = -
w(t + R
T ),
L
2
1
w=
ζ(t) + ζ(t) +
θ(t)ζ(t),
α
α2
ϕ
R=
,
ŵ
48
T =
при
ω = 0,
ω
b(jω)
L=
,
 a(j ω)
b(j ω)
ϕ = arg
,
a(j ω)
ŵ(t) =
|θ(t)|,
θ(t) = kα2ζ(t)(y(t) - u(t) - ω(t)),
(p + α)2ζ(t) = α2(y(t) - u(t)),
a(p)u(t) = b(p)u(t),
где j =
√-1
мнимая единица. По сравнению с [190] в [189] алгоритм управ-
ления позволяет сократить время оценивания параметров возмущения. Одна-
ко данный факт можно проиллюстрировать только на численных примерах
моделирования.
В [58] рассматривается компенсация возмущения (5.67) при A0 = 0 и
n = 1, которое аддитивно действует только на выходе ОУ (5.74) в виде
y(t) = Cx(t) + f(t). Строится следующий наблюдатель
δ(t) = σ sin(ωt),
pγ(p)σ(t) = βa(p)sin(ωt)(w(t) - ŵ(t)),
ˆ
θ(t) = kς(t)(z(t) - z(t)),
ω(t) =
|θ(t)|,
z(t) = w(t) - 2ς˙(t) - ς(t),
(5.75)
˙ς1(t) = ς2(t),
˙ς2(t) = -2ς2(t) - ς1(t) + w(t),
ς(t) = ς1(t),
γ(p)w(t) = γ(p)y(t) - a1(p)y(t) - b(p)u(t).
Здесь β > 0, γ(s)
произвольный гурвицев полином степени n, a1(p) =
= γ(p) - a1(p).
В работах [189, 190] результаты из [57, 59, 60] используются для решения
задачи адаптивной компенсации возмущений в линейных и нелинейных ОУ
с известным запаздыванием в канале управления. Модель нелинейного ОУ
представлена в виде дифференциального уравнения
x(t) = Ax(t) + Bu(t - τ) + Gϕ(y(t)) + Ef(t),
y(t) = Cx(t),
где x ∈ Rn вектор состояния, u скалярное управление, y скалярный
выходной сигнал, ϕ неизвестная нелинейность. Матрицы ОУ и запаздыва-
49
ние известны. Предполагается, что модель x(t) = Ax(t) + Gϕ(y(t)) экспо-
ненциально устойчивая. Возмущение описывается функцией вида (5.67). Для
компенсации возмущений используется сигнал управления
(
)
1
1
ϕi
u(t) = -
σ-
fi t + τ -
,
L0
Li
ωi
i=1
(0)
(j ωi)
где L0 =
b
, Li =
b
,
ϕi = argb(jωi)a(jˆω
оценка фазы возмущения ϕi,
a(0)
a(j ωi)
i)
ωi
оценка частоты возмущения ωi, которая получена с помощью алгорит-
ма, аналогичного (5.75). Теоретические результаты работ [189, 190] экспери-
ментально исследованы на маятнике на тележке в [60].
В [79] результаты [57, 59, 60] обобщены на решение задачи управления объ-
ектом при наличии неизвестного запаздывания в канале управления. В дан-
ном случае с учетом того что возмущение периодическое, оно оценивалось
вместе с неизвестным запаздыванием и строился прогноз возмущения на вре-
мя запаздывания.
6. Заключение
Наблюдатели возмущений находят все более широкое применение в тео-
рии и практике построения систем управления, и им посвящена обширная
литература. Так, по состоянию на сентябрь 2019 г. в системе Scopus по клю-
чевым словам “disturbance”&“observer” имеется более 16 тысяч цитирований.
В частности, статья [18] в течение 10 лет после опубликования получила 2122
цитирования, статья [107]
750 цитирований, обзор [80] за три года получил
525 цитирований. Это говорит о высокой востребованности данного направ-
ления для современной теории и практики построения автоматических си-
стем. В настоящем обзоре авторами сделана попытка представить основные
теоретические результаты и направления исследований по синтезу и приме-
нению наблюдателей возмущений. Практическим приложениям будет посвя-
щена следующая часть обзора.
СПИСОК ЛИТЕРАТУРЫ
1. Sariyildiz E., Oboe R., Ohnishi K. Disturbance Observer-Based Robust Control and
Its Applications: 35th Anniversary Overview // IEEE Trans. Ind. Electron. 2020.
V. 67. No. 3. P. 2042-2053.
2. Athans M. On the LQG Problem // IEEE Trans. Automat. Control. 1971. Dec.
V. 16. No. 6. P. 528-528.
3. Rosenbrock H., McMorran P. Good, Bad, or Optimal? // IEEE Trans. Automat.
Control. 1971. Dec. V. 16. No. 6. P. 552-554.
4. Doyle J. Guaranteed Margins for LQG Regulators // IEEE Trans. Automat. Con-
trol. 1971. Aug. V. 23. No. 4. P. 756-757.
5. Pearson J., Staats P. Robust Controllers for Linear Regulators // IEEE Trans.
Automat. Control. 1974. Jun. V. 19. No. 3. P. 231-234.
6. Davison E.J., Goldenberg A. Robust Control of a General Servomechanism Problem:
The Servo Compensator // Automatica. 1975. V. 11. No. 5. P. 461-471.
50
7.
Davison E. the Robust Control of a Servomechanism Problem for Linear Time-
Invariant Multivariable Systems // IEEE Trans. Automat. Control. 1976. Feb.
V. 21. No. 1. P. 25-34.
8.
Schweppe F. Recursive State Estimation: Unknown But Bounded Errors and System
Inputs // IEEE Trans. Automat. Control. 1968. V. 13. No. 1. P. 22-28.
9.
Bhattacharyya S. the Structure of Robust Observers // IEEE Trans. Automat.
Control. 1976. August. V. 21. No. 4. P. 581-588.
10.
Bhattacharyya S. Observer Design for Linear Systems with Unknown Inputs //
IEEE Trans. Automat. Control. 1978. V. 23. No. 3. P. 483-484.
11.
Meditch J., Hostetter G. Observers for Systems with Unknown And Inaccessible
Inputs // Int. J. Control. 1974. V. 19. No. 3. P. 473-480.
12.
Johnson C.D. Optimal Control of the Linear Regulator with Constant Distur-
bances // IEEE Trans. Automat. Control. 1968. V. 13. No. 4. P. 416-421.
13.
Johnson C.D. Further Study of the Linear Regulator with Disturbances the Case
of Vector Disturbances Satisfying a Linear Differential Equation // IEEE Trans.
Automat. Control. 1970. V. AC-15. No. 2. P. 222-228.
14.
Johnson C. Accommodation of External Disturbances in Linear Regulator and Ser-
vomechanism Problems // IEEE Trans. Automatic Control. 1971. V. 16. No. 6.
P. 635-644.
15.
Johnson C. Accommodation of Disturbances in Optimal Control Problems // Int.
J. Control. 1972. V. 15. No. 2. P. 209-231.
16.
Doyle J.C. Structured Uncertainty in Control System Design // Proc. Conf. Deci-
sion and Control (CDC’85), Fort Lauderdale, USA. Piscataway, NJ, USA: IEEE,
1985. P. 260-265.
17.
Francis B.A., Wonham W.M. The Internal Model Principle of Linear Control The-
ory // IFAC Proc. Volumes. 1975. V. 8. No. 1, Part 1. P. 331-336. (6th IFAC
World Congress (IFAC 1975) - Part 1: Theory, Boston/Cambridge, MA, USA,
August
24-30,
1975). URL: http://www.sciencedirect.com/science/article/pii/
S1474667017677565.
18.
Han J. From PID to Active Disturbance Rejection Control // IEEE Trans. Ind.
Electron. 2009. V. 56. No. 3. P. 900-906.
19.
Бесекерский В.А., Попов Е.П. Теория систем автоматического регулирования.
Изд. 4-е, перераб. и дополн. СПб: “Профессия”, 2003.
20.
Клейман Е.Г., Мочалов И.А. Идентификация нестационарных объектов //
АиТ. 1994. № 2. C. 3-22.
Kleˇıman E.G., Mochalov I.A. Identification of Time-Dependent Plants // Autom.
Remote Control. 1994. V. 55. No. 2. P. 149-163.
21.
Клейман Е.Г. Идентификация входных сигналов в динамических системах //
АиТ. 1999. № 12. C. 3-15.
Kleˇıman E.G. Identification of Input Signals in Dynamical Systems // Autom.
Remote Control. 1999. V. 60. No. 12. P. 1675-1685.
22.
Sunahara Y. Identification of Distributed-Parameter Systems // Distrib. param.
control syst. Theory and appl. 1982. P. 57-86.
23.
Ohnaka K., Uosaki K. Identification of the External Input of Distributed-Parameter
Systems by the Boundary-Element Approach // Int. J. Control. 1986. V. 43. No. 4.
P. 1125-1133.
24.
Ohnaka K., Uosaki K. Simultaneous Identification of the External Input and Pa-
rameters of Diffusion Type Distributed Parameter Systems // Int. J. Control. 1989.
V. 46. No. 3. P. 889-895.
51
25.
Ohnaka K., Uosaki K. Boundary Element Approach for Identification of Point
Forces of Distributed Parameter Systems // Int. J. Control. 1989. V. 49. No. 1.
P. 119-127.
26.
Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамиче-
ской системе // Изв. АН СССР. Технич. кибернетика. 1983. № 2. C. 29-41.
27.
Ким А.В., Короткий A.M. Динамическое моделирование возмущения в пара-
болических системах // Изв. АН СССР. Техн. кибернетика. 1989. № 6. C. 78-84.
28.
Короткий А.И., Осипов Ю.С. Динамическое моделирование параметров в ги-
перболических системах // Изв. АН СССР. Техн. кибернетика. 1991. № 2.
C. 154-164.
29.
Богуславский И.А., Пятенко Т.В. Идентификация возмущений динамической
системы // Докл. АН СССР. 1990. T. 310. № 3. C. 549-553.
30.
Kurek J. Observation of the State Vector of Linear Multivariable Systems with
Unknown Inputs // Int. J. Control. 1982. V. 36. No. 3. P. 511-515.
31.
Любчик Л.М., Толстопятова С.В. Оптимальное оценивание входных сигна-
лов дискретных стохастических систем // Вестн. Харьков. ун-та. 1988. № 252.
C. 5-7.
32.
Херманис Э.Х. Сведение задачи восстановления сигнала к задаче идентифи-
кации системы // Аналого-дискретное преобразование сигналов. 1981. № 5.
C. 103-111.
33.
Борухов В.Г., Колесников П.М. Идентификация входных воздействий систем
с распределенными параметрами // Изв. АН СССР. Техн. кибернетика. 1983.
№ 3. C. 168-174.
34.
Корноушенко Е.К. Восстановление скалярного сигнала на входе дискретной
линейной нестационарной системы // АиТ. 1991. № 6. C. 84-94.
Kornoushenko E.K. Reconstruction of Scalar Input Signals for Discrete Linear Non-
stationary Systems // Autom. Remote Control. 1991. V. 52. No. 6. P. 815-824.
35.
Корноушенко Е.К. Восстановление входных сигналов в дискретных линей-
ных нестационарных системах по накопленным данным // АиТ. 1992. № 12.
C. 40-51.
Kornoushenko E.K. Reconstruction of Input Signals in Discrete Linear Time-
Dependent Systems on the Basis of Accumulated Data // Autom. Remote Control.
1992. V. 53. No. 12. P. 1852-1862.
36.
Fhirin M. ARMАХ Lattice Algorithm for Identification and Prediction of Dynamic
Systems // Int. J. Syst. Sci. 1990. V. 21. No. 4. P. 771-781.
37.
Murio D., Hinestroza D. Numerical Identification of Forcing Terms by Discrete
Mollification // Computers & Mathematics with Applications 1988. V. 17. No. 11.
P. 1441-1447.
38.
Kobayashi T. Discrete-Time Observers and Parameter Determination for Dis-
tributed Parameter Systems with Discrete-Time Input-Output Data // SIAM J.
Contr. Optim. 1983. V. 21. No. 3. P. 331-351.
39.
Ahlén A. Identifiability of the Deconvolution Problem // Automatica. 1990. V. 26.
No. 1. P. 177-181.
40.
Davison E.J. the Output Control of Linear Time-Invariant Multivariable Systems
with Unmeasurable Arbitrary Disturbances // IEEE Trans. Automat. Control.
1972. Oct. V. 17. No. 5. P. 621-630.
41.
Francis B.A., Wonham W.M. The Internal Model Principle for Linear Multivariable
Regulators // Appl. Math. Opt. 1975. V. 2. No. 2. P. 170-194.
52
42.
Francis B.A., Wonham W.M. The Role of Transmission Zeros in Linear Multivari-
able Regulators // Int. J. Control. 1975. V. 22. No. 5. P. 657-681.
43.
Francis B.A., Wonham W.M. The Internal Model Principle of Control Theory //
Automatica. 1976. V. 12. No. 5. P. 457-465.
44.
Wonham W.M. Linear Multivariable Control: a Geometric Approach (3rd Ed.) /
Ed. A.V. Balakrishnan, I. Karatzas, M. Yor. N.Y.: Springer-Verlag, 1985. V. 10 of
Applications of Mathematics.
45.
Gorez R., Galardini D., Zhu K.Y. Internal Model Control and Disturbance Ob-
servers // Proc. 30th IEEE Conf. Decision and Control (CDC’91), Brighton, UK.
V. 1. Piscataway, NJ, USA: IEEE, 1991. P. 229-234.
46.
Цыпкин Я.З. Адаптивно-инвариантные дискретные модели управления //
АиТ. 1991. № 5. C. 96-121.
Tsypkin Ya.Z. Adaptively Invariant Discrete Control System // Autom. Remote
Control. 1991. V. 52. No. 5. P. 673-696.
47.
Isidori A. Nonlinear Control Systems (3rd edn). N.Y.: Springer, 1995.
48.
Nikiforov V.O. Adaptive Servomechanism Controller with an Implicit Reference
Model // Int. J. Control. 1997. V. 68. No. 2. P. 277-286.
49.
Nikiforov V.O. Adaptive Non-Linear Tracking with Complete Compensation of Un-
known Disturbances // Europ. J. Control. 1998. V. 4. No. 2. P. 132-139.
50.
Цыпкин Я.З. Робастно оптимальные дискретные системы управления // АиТ.
1999. № 3. C. 25-37.
Tsypkin Ya.Z. Robustly Optimal Discrete Control Systems // Autom. Remote Con-
trol. 1991. V. 60. No. 3. P. 315-324.
51.
Du H., Fan G., Yi J., et al. Disturbance Compensated Adaptive Backstepping
Control for an Unmanned Seaplane // Proc. 2014 IEEE Int. Conf. on Robotics and
Biomimetics (ROBIO 2014), Bali, Indonesia. Piscataway, NJ, USA: IEEE, 2014.
Dec. 5-10. P. 1725-1730.
52.
Sariyildiz E., Ohnishi K. A Guide to Design Disturbance Observer // J. Dyn. Sys.
Meas. Control. 2014. V. 136. No. 2.
53.
Johnson C. Adaptive Controller Design Using Disturbance-Accommodation Tech-
niques // Int. J. Control. 1985. V. 42. No. 1. P. 193-210.
54.
Wang H., Daley S. Actuator Fault Diagnosis: an Adaptive Observer-Based Tech-
nique // IEEE Trans. Automat. Control. 1996. V. 41. P. 1073-1078.
55.
Xia X. Global Frequency Estimation Using Adaptive Identifiers // IEEE Trans.
Automat. Control. 2002. V. 47. No. 7. P. 1188-1193.
56.
Никифоров В.О. Наблюдатели внешних детерминированных возмущений II.
Объекты с неизвестными параметрами // АиТ. 2004. № 11. C. 40-48. URL:
http://mi.mathnet.ru/at1658.
Nikiforov V.O. Observers of External Deterministic Disturbances. II. Objects With
Unknown Parameters // Autom. Remote Control. 2004. V. 65. No. 11. P. 1724-
1732.
57.
Бобцов А.А., Пыркин А.А. Компенсация гармонического возмущения в услови-
ях запаздывания по управлению // Изв. РАН. Теория и системы управления.
2008. № 4. C. 19-23.
58.
Арановский С.В., Бобцов А.А., Пыркин А.А. Адаптивный наблюдатель неиз-
вестного синусоидального выходного возмущения для линейного объекта //
АиТ. 2009. № 11. C. 108-116. URL: http://mi.mathnet.ru/at558.
53
Aranovskii S.V., Bobtsov A.A., Pyrkin A.A. Adaptive Observer of an Unknown
Sinusoidal Output Disturbance for Linear Plants // Autom. Remote Control. 2009.
V. 70. No. 11. P. 1862-1870.
59.
Pyrkin A.A., Smyshlyaev A., Bekiaris-Liberis N., Krstic M. Rejection of Sinusoidal
Disturbance of Unknown Frequency for Linear System with Input Delay // Proc.
American Control Conf. (ACC 2010), Baltimore, USA. IEEE, 2010. 30 June-2 July.
P. 5688-5693.
60.
Pyrkin A.A., Bobtsov A.A., Kapitanyuk Y.A., et al. Adaptive Cancellation of Un-
known Multiharmonic Disturbance for Nonlinear Plant with Input Delay // Proc.
19th Mediterranean Conf. Control Automation (MED 2011), Corfu, Greece. Pis-
cataway, NJ, USA: IEEE, 2011. 20-23 June.
61.
Bastürk H.
I., Krstic M. Adaptive Backstepping Cancelation of Unmatched Un-
known Sinusoidal Disturbances for Unknown LTI Systems by State Derivative Feed-
back // Proc. ASME 5th Annual Dynamic Systems and Control Conf. joint with
the JSME 11th Motion and Vibration Conf. (DSCC2012-MOVIC2012). Fort Laud-
erdale, Florida, USA: 2012. Oct. 17-19. P. 6054-6059.
62.
Basturk H.I., Krstic M. State Derivative Feedback for Adaptive Cancellation of
Unmatched Disturbances in Unknown Strict-Feedback LTI Systems // Automatica.
2014. V. 50. P. 2539-2545.
63.
Basturk H.I., Krstic M. Adaptive Sinusoidal Disturbance Cancellation for Unknown
LTI Systems Despite Input Delay // Automatica. 2015. V. 58. P. 131-138.
64.
Андриевский Б.Р., Бобцов А.А., Фрадков А.Л. Методы анализа и синтеза нели-
нейных систем управления. М.-Ижевск: ИКИ, 2018.
65.
Utkin V., Guldner J., Shi J. Sliding Mode Control In Electromechanical Systems.
Boka Raton, London, N.Y.: Taylor & Francis, 1999.
66.
Krasnova S.A., Utkin V.A. Prelimit Implementation of States and Disturbances
Observer on Sliding Modes // Proc. 2015 Int. Workshop on Recent Advances in
Sliding Modes, RASM 2015. Piscataway, NJ, USA: IEEE, 2015. 9-11 Apr.
67.
Brown M., Shtessel Y.B. Disturbance Rejection Techniques for Finite Reaching
Time Continuous Sliding Mode Control // Proc. American Control Conference
(ACC 2001), Arlington, Virginia, USA. V. 6. Piscataway, NJ: IEEE Publications,
2001. June, 24. P. 4998-5003.
68.
Massey T., Shtessel Y. Continuous Traditional and High-Order Sliding Modes for
Satellite Formation Control // J. Guid., Contr. Dynam. 2005. July-Aug. V. 28.
No. 4. P. 826-831.
69.
Besnard L., Shtessel Y.B., Landrum B. Quadrotor Vehicle Control Via Sliding Mode
Controller Driven by Sliding Mode Disturbance Observer // J. Franklin I. 2012.
V. 349. No. 2. P. 658-684.
70.
Chen W.-H. Nonlinear Disturbance Observer Based Control for Nonlinear Systems
with Harmonic Disturbances // IFAC Proc. Volumes. 2001. V. 34. No. 6. P. 329-
334. (Proc. 5th IFAC Sympos. on Nonlinear Control Systems 2001, St. Petersburg,
Russia, 4-6 July 2001.)
71.
Краснова С.А., Кузнецов С.И. Оценивание на скользящих режимах неконтро-
лируемых возмущений в нелинейных динамических системах // АиТ. 2005.
№ 10. C. 54-69. URL: http://mi.mathnet.ru/at1443.
Krasnova S.A., Kyznetsov S.I. Uncontrollable Perturbations of Nonlinear Dynamic
Systems: Estimation on Moving Modes // Autom. Remote Control. 2005. V. 66.
No. 10. P. 1580-1593.
54
72.
Цыкунов А.М. Алгоритм робастного управления линейными динамическими
объектами по выходу // Мехатроника, автоматизация, управление. 2008. № 8.
C. 7-12.
73.
Krstic M., Smyshlyaev A. Backstepping Boundary Control for First-Order Hyper-
bolic PDEs and Application to Systems with Actuator and Sensor Delays // Syst.
Control Lett. 2008. V. 57. No. 9. P. 750-758.
74.
Бобцов А.А., Колюбин С.А., Пыркин А.А. Компенсация неизвестного муль-
тигармонического возмущения для нелинейного объекта с запаздыванием по
управлению // АиТ. 2010. № 11. C. 136-148.
Bobtsov A.A, Kolyubin S.A., Pyrkin A.A. Compensation of Unknown Multi-
Harmonic Disturbances in Nonlinear Plants with Delayed Control // Autom. Re-
mote Control. 2010. V. 71. No. 11. P. 2383-2394.
75.
Pyrkin A., Smyshlyaev A., Bekiaris-Liberis N., Krstic M. Output Control Algo-
rithm for Unstable Plant with Input Delay and Cancellation of Unknown Biased
Harmonic Disturbance // IFAC Proc. Volumes. 2010. V. 43. No. 2. P. 39-44.
76.
Зайцева М.В., Паршева Е.А. Компенсация возмущений и помех при управ-
лении линейным объектом // АиТ. 2011. № 10. C. 28-38. URL: http://
mi.mathnet.ru/ at2287.
Zaitseva M.V., Parsheva E.A. Compensating for Noise And Perturbances in Linear
Object Control // Autom. Remote Control. 2011. V. 72. No. 10. P. 2031-2040.
77.
Фуртат И.Б. Робастная синхронизация динамической сети с компенсацией
возмущений // АиТ. 2011. № 12. C. 104-114.
Furtat I.B. Robust Synchronization of Dynamical Networks With Compensation of
Disturbances // Autom. Remote Control. 2011. V. 72. No. 12. P. 2516-2526.
78.
Фуртат И.Б. Робастное управление определенным классом неминимально-
фазовых динамических сетей // Изв. РАН. Теория и системы управления. 2014.
№ 1. C. 35-48.
79.
Borisov O.I., Gromov V.S., Pyrkin A.A., Bobtsov A.A. Stabilization of Linear
Plants with Unknown Delay and Sinusoidal Disturbance Compensation // Proc.
24th Mediterranean Conf. Control and Automation (MED 2016). Piscataway, NJ,
USA: IEEE, 2016. June 21-24. P. 426-430.
80.
Chen W.-H., Yang J., Guo L., Li S. Disturbance-Observer-Based Control and Re-
lated Methods
an Overview // IEEE Trans. Ind. Electron. 2016. Feb. V. 63.
No. 2. P. 1083-1095.
81.
Андриевский Б.Р., Фуртат И.Б. Наблюдатели возмущений. Методы и прило-
жения. Часть 2. Приложения // АиТ. 2020.
82.
Luenberger D.G. Observing the State of a Linear System // IEEE Trans. Mil.
Electron. 1964. April. V. 8. No. 2. P. 74-80.
83.
Luenberger D.G. an Introduction To Observers // IEEE Trans. Automat. Control.
1971. Dec. V. 16. P. 596-602.
84.
Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука,
1976.
85.
Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического
управления с примерами на языке MATLAB. СПб: Наука, 1999.
86.
Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. М.:
Мир, 1986.
87.
Первозванский А.А. Курс теории автоматического управления: Уч. пос. М.:
Наука, 1986.
55
88.
Справочник по теории автоматического управления / Под ред. А.А. Красов-
ского. М.: Физматлит, 1987.
89.
Кузовков Н.Т. Модальное управление и наблюдающие устройства. М.: Маши-
ностроение, 1976.
90.
Гелиг А.Х., Леонов Г.А., Якубович В.А. Устойчивость нелинейных систем с
неединственным состоянием равновесия. М.: Наука, 1978.
91.
Chen Y.H. Adaptive Robust Observers for Non-Linear Uncertain Systems // Int.
J. Syst. Sci. 1990. V. 21. No. 5. P. 803-814.
92.
Wang Z., Huang B., Unbehauen H. Robust H Observer Design of Linear Time-
Delay Systems with Parametric Uncertainty // Syst. Control Lett. 2001. V. 42.
No. 4. P. 303-312.
93.
Lin H., Zhai G., Antsaklis P.J. Set-Valued Observer Design for A Class of Uncer-
tain Linear Systems with Persistent Disturbance and Measurement Noise // Int. J.
Control. 2003. V. 76. No. 16. P. 1644-1653.
94.
Lüders G., Narendra K. an Adaptive Observer and Identifier for A Linear System //
IEEE Trans. Automat. Control. 1973. October. V. 18. No. 5. P. 496-499.
95.
Александров А.Г. Оптимальные и адаптивные системы. Учебное пособие. М.:
Высш. шк., 1989.
96.
Никифоров В.О. Наблюдатели внешних детерминированных возмущений I.
Объекты с известными параметрами // АиТ. 2004. № 10. C. 13-24. URL: http://
mi.mathnet.ru/at1642.
Nikiforov V.O. Observers of External Deterministic Disturbances. I. Objects With
Known Parameters // Autom. Remote Control. 2004. V. 65. No. 10. P. 1531-1541.
97.
Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамиче-
скими объектами. М.: Наука, 1981.
98.
Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука,
1974.
99.
Тихонов А.Н., Васильева А.Б., Свешников А.Г. Дифференциальные уравне-
ния. 2-е изд. М.: Наука, 1998.
100.
Воронов А.А. Основы теории автоматического управления. Автоматическое ре-
гулирование непрерывных линейных систем. М.: Энергия, 1980.
101.
Красовский А.А., Поспелов Г.С. Основы автоматики и технической кибернети-
ки. М.: Госэнергоиздат, 1982.
102.
Попов Е.П. Теория линейных систем автоматического регулирования и управ-
ления: Учебное пособие для втузов. Второе издание, пероработанное и до-
полненное. М.: Наука, Главная редакция физико-математической литературы,
1989.
103.
Sun J., Wang C., Xin R. Anti-Disturbance Study of Position Servo System Based
on Disturbance Observer // IFAC-PapersOnLine. 2018. V. 51. No. 4. P. 202-207.
104.
Davison E.J., Smith H.W. Pole Assignment in Linear Time-Invariant Multivariable
Systems with Constant Disturbances // Automatica. 1971. V. 7. No. 4. P. 489-498.
105.
Simon J.D., Mitter S.K. a Theory of Modal Control // Inform. Control. 1968. V. 13.
No. 4. P. 316-353.
106.
Galeani S., Menini L., Potini A. Robust Trajectory Tracking for A Class of Hybrid
Systems: an Internal Model Principle Approach // IEEE Trans. Automat. Control.
2012. V. 57. No. 2. P. 344-359.
107.
Davison E.J. the Robust Control of a Servomechanism Problem for Linear Time-
Invariant Multivariable Systems // IEEE Trans. Automat. Control. 1976. Feb.
V. 21. No. 1. P. 25-34.
56
108.
Schrijver E., van Dijk J. Disturbance Observers for Rigid Mechanical Systems:
Equivalence, Stability, and Design // J. Dyn. Sys. Meas. Control. 2002. Dec. V. 124.
No. 4. P. 539-548.
109.
Lee H.S., Tomizuka M. Robust Motion Controller Design for High-Accuracy Posi-
tioning Systems // IEEE Trans. Ind. Electron. 1996. V. 43. No. 1. P. 48-55.
110.
Mita T., Hirata M., Murata K., Zhang H. H-infinity Control Versus Disturbance-
Observer-Based Control // IEEE Trans. Ind. Electron. 1998. Jun. V. 45. No. 3.
P. 488-495.
111.
Bickel R., Tomizuka M. Passivity-Based Versus Disturbance Observer Based Robot
Control: Equivalence and Stability // J. Dyn. Sys. Meas. Control. 1999. V. 121.
No. 1. P. 41-47.
112.
Umeno T., Kaneko T., Hori Y. Robust Servosystem Design with Two Degrees of
Freedom and Its Application To Novel Motion Control of Robot Manipulators //
IEEE Trans. Ind. Electron. 1993. Oct. V. 40. No. 5. P. 473-485.
113.
Umeno T., Hori Y. Robust Speed Control of DC Servomotors Using Modern Two
Degrees-of-Freedom Controller Design // IEEE Trans. Ind. Electron. 1991. Oct.
V. 38. No. 5. P. 363-368.
114.
Ohishi K., Ohnishi K., Miyachi K. Torque-Speed Regulation of DC Motor Based
On Load Torque Estimation Method // Proc. Int. Power Electronics Conf. (IPEC-
Tokyo ’83) Tokyo, Japan / Ed. D. Gakkai. Inst. Electrical Engineers of Japan, 1983.
March 27-31. V. 2. P. 1209-1218.
115.
Ohnishi K. New Development of Servo Technology in Mechatronics // IEEE Trans.
Ind. Applicat. 1987. V. 107. No. 1. P. 83-86.
116.
Цыкунов А.М. Алгоритмы робастного управления с компенсацией ограничен-
ных возмущений // АиТ. 2007. № 7. C. 103-115.
Tsykunov A.M. Robust Control Algorithms With Compensation of Bounded Per-
turbations // Autom. Remote Control. 2007. V. 68. No. 7. P. 1213-1224.
117.
Atassi A.N., Khalil H.K. a Separation Principle for The Stabilization of a Class
of Nonlinear Systems // IEEE Trans. Automat. Control. 1999. Sep. V. 44. No. 9.
P. 1672-1687.
118.
Фуртат И.Б., Цыкунов А.М. Робастное управление нестационарными нели-
нейными структурно неопределенными объектами // Пробл. управления. 2008.
№ 5. C. 2-7.
119.
Furtat I., Fridman E., Fradkov A.L. Disturbance Compensation With Finite Spec-
trum Assignment for Plants with Input Delay // IEEE Trans. Automat. Control.
2018. V. 63. No. 1. P. 298-305.
120.
Manitius A.Z., Olbrot A.W. Finite Spectrum Assignment Problem for Systems with
Delays // IEEE Trans. Automat. Control. 1979. V. AC-24. No. 4. P. 541-553.
121.
Фуртат И.Б., Гущин П.А. Алгоритм управления объектами с запаздывающим
входным сигналом на базе субпредикторов регулируемой величины и возмуще-
ния // АиТ. 2019. № 2. C. 3-21.
Furtat I.B., Gushchin P.A. A Control Algorithm for an Object with Delayed In-
put Signal Based on Subpredictors of the Controlled Variable and Disturbance //
Autom. Remote Control. 2019. V. 80. No. 2. P. 201-216.
122.
Фуртат И.Б. Алгоритм робастного управления линейными объектами с век-
торными входами-выходами в условии насыщения сигнала управления // Ме-
хатроника, автоматизация, управление. 2016. № 9. C. 579-587.
123.
Буков В.Н. Вложение систем. Аналитический подход к анализу и синтезу мат-
ричных систем. Калуга: Изд-во научной литературы Н.Ф. Бочкаревой, 2006.
57
124.
Проскурников А.В., Якубович В.А. Универсальные регуляторы в задачах оп-
тимального управления с эталонной моделью при неизвестных внешних сигна-
лах // Изв. РАН. Теория и системы управления. 2012. № 2. C. 49-62.
125.
Краснова С.А., Уткин В.А. Каскадный синтез наблюдателей состояния дина-
мических систем. М.: Наука, 2006.
126.
Василенко Г.И. Теория восстановления сигналов. M.: Сов. радио, 1979.
127.
Близорукова М.С., Максимов В.И., Пандолфи Л. Динамическая реконструкция
входа в нелинейной системе с запаздыванием // АиТ. 2002. № 2. C. 3-13.
Blizorukova M.S., Maksimov V.I., Pandolfi L. Dynamic Input Reconstruction for a
Nonlinear Time-Delay System // Autom. Remote Control. V. 63. No. 2. P. 171-180.
128.
Osipov Y., Kryazhimskii A. Inverse Problems for Ordinary Differential Equations:
Dynamical Solutions. London: Gordon and Breach, 1995. ISBN: 2-88124-944-2.
129.
Maksimov V.I. On the Reconstruction of a Control Through Results of Observa-
tions // Proc. 3rd Europ. Control Conf. (ECC’95). Rome, Italy. 1995. P. 3766-3771.
130.
Кряжимский А.В., Максимов В.И., Осипов Ю.С. О позиционном моделирова-
нии в динамических системах // Прикл. математика и механика. 1983. T. 47.
№ 6. C. 815-825.
131.
Максимов В.И. О реконструкции граничных возмущений: случай краевых
условий Неймана // Тр. ИММ УрО РАН. 2005. T. 11. № 1. C. 160-176.
132.
Близорукова М.С., Максимов В.И. Об одном алгоритме динамической рекон-
струкции входных воздействий при измерении части координат // Журн. вы-
числ. матем. и матем. физ. 2011. T. 51. № 6. C. 1007-1017.
133.
Близорукова М.С., Максимов В.И. Об одном алгоритме динамического восста-
новления входного воздействия // Дифференц. уравнения. 2013. T. 49. № 1.
C. 88-100.
134.
Максимов В.И. О применении конечномерных управляемых моделей к задаче
реконструкции входа в линейной системе с запаздыванием // Тр. ИММ УрО
РАН. 2013. T. 19. № 1. C. 196-204.
135.
Максимов В.И. К проблеме реконструкции входа нелинейной системы с посто-
янным запаздыванием // Тр. ИММ УрО РАН. 2018. T. 24. № 1. C. 121-130.
136.
Максимов В.И. О динамической реконструкции возмущений системы по неточ-
ным дискретным измерениям фазовых координат // Изв. РАН. Теория и си-
стемы управления. 2018. № 3. C. 15-32.
137.
Максимов В.И. Реконструкция входного воздействия динамической системы
при измерении части координат фазового вектора // Журн. вычисл. матем. и
матем. физ. 2019. T. 59. № 5. C. 752-761.
138.
Максимов В.И. Реконструкция возмущения нелинейной системы при измере-
нии части координат фазового вектора // Журн. вычисл. матем. и матем. физ.
2019. T. 59. № 11. C. 1836-1845.
139.
Kryazhimskii A., Maksimov V. On Identification of Nonobservable Contamination
Inputs // Environ. Modell. Software. 2005. V. 20. P. 1057-1061.
140.
Осипов Ю.С., Кряжимский А.В., Максимов В.И. Некоторые алгоритмы ди-
намического восстановления входов // Тр. ИММ УрО РАН. 2011. T. 17. № 1.
C. 129-161.
141.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.:
Наука, 1974.
142.
Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 520 с.
58
143.
Цыкунов А.М. Компенсация возмущений при управлении линейным объектом
по косвенным измерениям // АиТ. 2010. № 4. C. 120-129.
Tsykunov A.M. Indirect Measurements-Based Compensation of Disturbances At
Control of A Linear Plant // Autom. Remote Control. 2010. V. 71. No. 4. P. 654-
662.
144.
Silverman L.D.M. Inversion of Multivariable Linear Systems // IEEE Trans. Au-
tomat. Control. 1969. V. 14. No. 3. P. 270-276.
145.
Ильин А.В., Коровин С.К., Фомичев В.В. Алгоритмы обращения линейных
управляемых систем // Диффеpенц. уравнения. 1997. T. 34. № 6. C. 744-750.
146.
Коровин С.К., Ильин А.В., Фомичев В.В. Метод управляемой модели в зада-
чах обращения динамических систем // Докл. РАН. Теория управления. 1997.
T. 354. № 2. C. 171-173.
147.
Ильин А.В., Коровин С.К., Фомичев В.В. Робастное обращение векторных си-
стем // Дифференц. уравнения. 1998. T. 34. № 11. C. 1478-1486.
148.
Коровин С.К., Фомичев В.В. Наблюдатели состояния для линейных систем с
неопределенностью. М.: Физматлит, 2007.
149.
Ильин А.В., Емельянов С.В., Фомичев В.В. Синтез робастных инверторов ми-
нимального порядка // Дифференц. уравнения. 2009. T. 45. № 4. C. 575-585.
150.
Ильин А.В., Коровин С.К., Фомичев В.В. Методы робастного обращения ди-
намических систем. М.: Физматлит, 2009.
151.
Ильин А.В., Коровин С.К., Фомичев В.В. Обращение линейных динамических
систем с запаздыванием // Дифференц. уравнения. 2012. T. 48. № 3. C. 405-413.
152.
Атамась Е.И., Ильин А.В., Фомичев В.В. Обращение векторных систем с за-
паздыванием // Дифференц. уравнения. 2013. T. 49. № 11. C. 1363-1369.
153.
Ильин А.В., Коровин С.К., Фомичев В.В. Алгоритмы обращения линейных
скалярных динамических систем: метод управляемой модели // Диффеpенц.
уравнения. 1997. T. 33. № 3. C. 329-339.
154.
Уткин В.И. Скользящие режимы и их применения в системах с переменной
структурой. М.: Наука, 1974.
155.
Уткин В.И. Скользящие режимы в задачах оптимизации и управления. М.:
Наука, 1981.
156.
Цыкунов А.М. Робастное управление с компенсацией возмущений. М.: Физмат-
лит, 2012.
157.
Никифоров В.О. Адаптивное и робастное управление с компенсацией возмуще-
ний. СПб.: Наука, 2003.
158.
Халил Х.К. Нелинейные системы / Под ред. А.Л. Фрадкова. М.; Ижевск:
Регулярная и хаотическая динамика: Ин-т компьютерных исследований, 2009.
159.
Дезоер Ч., Видьясагар М. Системы с обратной связью. Вход-выходные соотно-
шения / Под ред. Ю.С. Попкова. М.: Наука, 1983.
160.
Полушин И.Г., Фрадков А.Л., Хилл Д.Д. Пассивность и пассификация нели-
нейных систем // АиТ. 2000. T. 3. C. 3-37.
Polushin I.G., Fradkov A.L., Hill D.D. Passivity And Passification of Nonlinear
Systems // Autom. Remote Control. 2000. V. 61. No. 3. P. 355-388.
161.
Corless M., Tu J. State and Input Estimation for a Class of Uncertain Systems //
Automatica. 1998. June. V. 34. No. 6. P. 757-764.
162.
Kudva P., Viswanadham N., Ramakrishna A. Observers for Linear Systems with
Unknown Inputs // IEEE Trans. Automat. Control. 1980. V. AC-25. P. 113-115.
59
163.
Fradkov A.L. Passification of Non-square Linear Systems and Feedback
Yakubovich-Kalman-Popov Lemma // Eur. J. Control. 2003. No. 6. P. 573-582.
164.
Efimov D.V., Fradkov A.L. Adaptive Tuning To Bifurcation for Time-Varying Non-
linear Systems // Automatica. 2006. V. 42. P. 417-425.
165.
Андриевский Б.Р., Фрадков А.Л. Метод пассификации в задачах адаптивного
управления, оценивания и синхронизации // АиТ. 2006. № 11. C. 3-37.
166.
Андриевский Б.Р., Селиванов А.А. Новые результаты по применению метода
пассификации. Обзор // АиТ. 2018. № 6. C. 3-48.
Andrievskii B.R., Selivanov A.A. New Results on the Application of the Passifica-
tion Method. A Survey // Autom. Remote Control. 2018. V. 79. No. 6. P. 957-995.
167.
Boyd S., Ghaoui L.E., Feron E., Balakrishnan V. Linear Matrix Inequalities in
System and Control Theory. SIAM, 1994.
168.
Чурилов А.Н., Гессен А.В. Исследование линейных матричных неравенств. Пу-
теводитель по программным пакетам. СПб.: Изд.-во СПбГУ, 2004.
169.
Баландин Д.В., Коган М.М. Использование LMI toolbox пакета Matlab в синте-
зе законов управления. Нижний Новгород: ННГУ им. Н.И. Лобаческого, 2006.
170.
Xiong Y., Saif M. Unknown Disturbance Inputs Estimation Based On A State
Functional Observer Design // Automatica. 2003. V. 39. P. 1389-1398.
171.
Kanellakopoulos I., Kokotovic P.V., Morse A.S. Systematic design of adaptive con-
trollers for feedback linearizable systems // IEEE Trans. Automat. Control. 1991.
Nov. V. 36. No. 11. P. 1241-1253.
172.
Krstic M., Kanellakopoulos I., Kokotovic P. Nonlinear and Adaptive Control De-
sign. Wiley, 1995.
173.
Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное
управление сложными динамическими системами. СПб.: Наука, 2000.
174.
Фуртат И.Б., Нехороших А.Н. Метод бэкстеппинга для структурно неопре-
деленных объектов // Научно-технический вестник информационных техноло-
гий, механики и оптики. 2016. T. 16. № 1. C. 61-67.
175.
Bekiaris-Liberis N., Krstic M. Compensation of Transport Actuator Dynamics with
Input-Dependent Moving Controlled Boundary // IEEE Trans. Automat. Control.
2018. Nov. V. 63. No. 11. P. 3889-3896.
176.
Sorensen A.J., Egeland O. Design of Ride Control System for Surface Effect Ships
Using Dissipative Control // Automatica. 1995. Feb. V. 31. No. 2. P. 183-199.
177.
Luenberger D.G. Canonical Forms for Linear Multivariable Systems // IEEE Trans.
Automat. Control. 1967. June. V. 12. No. 3. P. 290-293.
178.
Krstic M., Smyshlyaev A. Boundary Control of PDEs: A Course On Backstepping
Designs. SIAM, 2008.
179.
Bresch-Pietri D., Krstic M. Adaptive Trajectory Tracking Despite Unknown Input
Delay and Plant Parameters // Automatica. 2009. Sep. V. 45. No. 9. P. 2074-2081.
180.
Isidori A., Pyrkin A., Borisov O. an Extension of a Lemma of Dayawansa and
Its Application in the Design of Extended Observers for Nonlinear Systems //
Automatica. 2019. Aug. V. 106. P. 178-183.
181.
Gauthier J.-P., Kupka I. Solutions to Part I Exercises // Deterministic Observa-
tion Theory and Applications. Cambridge, UK: Cambridge University Press, 2001.
P. 195-216.
182.
Демьянов В.Ф., Рубинов А.М. Основы негладкого анализа и квазидифферен-
циальное исчисление. М.: Наука, 1990.
60
183.
Borisov O.I., Pyrkin A.A., Isidori A. Application of Enhanced Extended Observer
in Station-Keeping of a Quadrotor with Unmeasurable Pitch and Roll Angles //
Proc. Joint 8th IFAC Symp. Mechatronic Systems and 11th IFAC Symp. Nonlinear
Control Systems (MECHATRONICS & NOLCOS 2019), Vienna, Austria. IFAC,
2019. Sept. 4-6.
184.
Bodson M., Douglas S.C. Adaptive Algorithms for the Rejection of Sinusoidal Dis-
turbances with Unknown Frequency // IFAC Proc. Volumes. 1996. June-July. V. 29.
No. 1. P. 5168-5173.
185.
Bodson M., Douglas S.C. Adaptive Algorithms for the Rejection of Sinusoidal Dis-
turbances with Unknown Frequency // Automatica. 1997. Dec. V. 33. No. 12.
P. 2213-2221.
186.
Marino R., Tomei P. Global Estimation of n Unknown Frequencies // IEEE Trans.
Automat. Control. 2002. Aug. V. 47. No. 8. P. 1324-1328.
187.
Bobtsov A.A., Efimov D., Pyrkin A.A., Zolghadri A. Switched Algorithm for Fre-
quency Estimation with Noise Rejection // IEEE Trans. Automat. Control. 2012.
Sept. V. 57. No. 9. P. 2400-2404.
188.
Бобцов А.А. Алгоритм управления по выходу с компенсацией гармоническо-
го возмущения со смещением // АиТ. 2008. № 8. C. 25-32. URL: http://
mi.mathnet.ru/at701.
Bobtsov A.A. Output Control Algorithm With The Compensation of Biased Har-
monic Disturbances // Autom. Remote Control. 2008. V. 69. No. 8. 1289-1296.
189.
Бобцов А.А., Пыркин А.А. Компенсация неизвестного синусоидального возму-
щения для линейного объекта любой относительной степени // АиТ. 2009. № 3.
C. 114-122. URL: http://mi.mathnet.ru/at436.
Bobtsov A.A., Pyrkin A.A. Compensation of Unknown Sinusoidal Disturbances in
Linear Plants of Arbitrary Relative Degree // Autom. Remote Control. 2009. V. 70.
No. 3. P. 449-456.
190.
Бобцов А.А. Робастное управление по выходу линейной системой с неопре-
деленными коэффициентами // АиТ. 2002. № 11. C. 108-117. URL: http://
mi.mathnet.ru/at2180.
Bobtsov A.A. Robust Output-Control for a Linear System with Uncertain Coeffi-
cients // Autom. Remote Control. 2002. V. 63. No. 11. P. 1794-1802.
Статья представлена к публикации членом редколлегии М.В. Хлебниковым.
Поступила в редакцию 20.09.2019
После доработки 10.05.2020
Принята к публикации 25.05.2020
61