Автоматика и телемеханика, № 8, 2023
Нелинейные системы
© 2023 г. А.М. ЦИРЛИН, д-р техн. наук (tsirlin@sarc.botik.ru)
(Институт программных систем им. А.К. Айламазяна РАН,
Переславль-Залесский)
ОБОБЩЕНИЕ ТЕОРЕМЫ КАРАТЕОДОРИ
И ПРИНЦИП МАКСИМУМА В УСРЕДНЕННЫХ ЗАДАЧАХ
НЕЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ1
Рассмотрена связь между усреднением функций по времени и ее усред-
нением по множеству значений искомых переменных. Исследованы зада-
чи оптимизации, критерий и ограничения которых содержат усреднение
функций или функции от средних значений переменных. Показано, что
условия оптимальности этих задач имеют форму принципа максимума,
а их оптимальное решение во временной области — кусочно-постоянная
функция. Доказано обобщение теоремы Каратеодори о выпуклых оболоч-
ках функции. Получены условия оптимальности для задач нелинейного
программирования с усреднением по части переменных и функциями, за-
висящими от средних значений переменных.
Ключевые слова: усредненные ограничения, скользящие режимы, выпук-
лые оболочки функций, функция достижимости, принцип максимума в
усредненных задачах.
DOI: 10.31857/S0005231023080044, EDN: HBDMDH
1. Введение
Для широкого класса задач критерий оптимальности и все или часть огра-
ничений усредненно зависят от всех или от части переменных. Такие задачи
возникают, когда в технологических процессах некоторые подлежащие выбо-
ру переменные должны быть неизменны (конструктивные параметры), а дру-
гие могут изменяться во времени, причем наличие устройств, сглаживающих
колебания, например емкостей, приводит к усредненному влиянию этих изме-
нений [1]. Такие задачи возникают при оптимальном управлении макросисте-
мами (системами, состоящими из множества индивидуально не управляемых
элементов), в которых можно управлять только средними по множеству этих
элементов показателями. Все подобные задачи называют задачами усреднен-
ной оптимизации.
В системах, у которых множество допустимых управлений невыпукло,
в частности в релейных системах, оптимальным решением часто оказывается
1 Работа выполнена при финансовой поддержке Российского научного фонда (проект
20-61-46013).
61
скользящий режим, в котором изменение состояния объекта усредненно за-
висит от сколь угодно часто переключающегося управления [2-5]. Усреднен-
ные задачи возникают также как вспомогательные оценочные при оптимиза-
ции циклических режимов, когда введение усреднения расширяет множество
допустимых решений и упрощает решение, позволяя получить оценку эф-
фективности циклического режима, не находя формы оптимальных циклов.
Значение такой оценочной задачи заведомо «не хуже», чем значение исход-
ной, а ее оптимальное решение содержит полезную информацию о характере
оптимального решения исходной. Для определенности будем рассматривать
задачи на максимум критерия оптимальности.
В первом разделе данной работы обсудим связь между усреднением функ-
ций, аргумент которых изменяется во времени, по множеству значений этого
аргумента и по времени и определим, что является искомым решением усред-
ненной задачи и как это решение может быть реализовано.
Во втором разделе сформулируем теорему об условиях оптимальности за-
дачи нелинейного программирования с усреднением критерия оптимальности
и ограничений и дадим ее доказательство, базирующееся на теореме Кара-
теодори о выпуклых оболочках функций.
В третьем разделе рассмотрим возможные обобщения доказанной тео-
ремы.
2. О связи между усреднением по времени
и усреднением по множеству
Среднее значение непрерывной скалярной функции f(x(t)), t ∈ [0, τ],
x ∈ V ⊂ Rn может быть вычислено по времени как
τ
∫
1
(1)
ft(x) =
f (x(t))dt
τ
0
либо по множеству как
∫
(2)
fp(x) =
f (x)p(x)dx.
V
Функцию p(x) называют плотностью распределения. В том случае, когда
x(t) — случайная функция, p(x) — плотность распределения случайной вели-
чины. Она неотрицательна, и ее интеграл на V равен единице. В частности,
множество V может быть паралелепипедом в Rn. В нашем случае x(t) —
детерминированная функция, поэтому остановимся подробнее на свойствах
p(x) такой, чтобы результаты усреднения по формулам (1) и (2) были одина-
ковы.
Будем считать переменную x скалярной, множество V здесь и ниже огра-
ниченным и замкнутым и введем функцию θ(x0), x0 ∈ V , равную суммар-
ной продолжительности тех интервалов времени t, для которых x(t) ≤ x0.
62
Очевидно, что эта функция не превосходит τ. Через P (x0) обозначим отно-
шениеθ(x0)τ , т.е. долю интервала [0, τ], для которой x(t) ≤ x0. Эта функция
монотонно растет с ростом x0, изменяясь от нуля до единицы. Она аналогич-
на функции распределения случайной величины.
Плотность распределения равна
dP (x0)
1 dθ(x0)
1
1
(3)
p(x0) =
=
=
∑
dx0
τ dx0
τ
dxν
dt
xν=x0
ν
Интервал θ увеличивается с ростом x0 при любом знаке производной при тех
значениях xν функции x(t), в которых она равна x0.
Если при некотором значении x0 функция x(t) постоянна в течение до-
ли γ от интервала [0, τ], то функция P (x0) испытывает в этой точке скачок
величиной γ, а плотность распределения в ней равна γδ(x - x0).
Примеры
1. Линейные функции. Пусть x(t) =htτ . Тогда по формуле (3) получим
p(x) =1h = const. Та же плотность распределения соответствует и всем тре-
угольникам с основанием [0, τ] и высотой h.
2. Кусочно-постоянные функции. Эти функции принимают дискретные
значения xi, каждое в течение доли γi от интервала [0, τ]. Любой такой функ-
ции по формуле (3) соответствует плотность распределения
∑
∑
(4)
p(x0) =
γiδ(x - xi), γi > 0,
γi
= 1.
i
i
Порядок, в котором кусочно-постоянная функция принимает то или иное из
возможных значений, роли не играет.
Из этих примеров видно, что каждой функции x(t) соответствует плот-
ность распределения ее значений p(x), определенная на V , а каждой плот-
ности распределения соответствует сколь угодно много функций x(t), для
которых fp(x) = ft(x). Исключением является плотность распределения ви-
да p(x) = δ(x - x1). В этом случае соответствующая ей функция равна
x(t) = x1 = const на всем интервале [0, τ], и она единственна.
Рассмотрим случай, когда функция f зависит от нескольких, для простоты
от двух, переменных x1(t) и x2(t). В этом случае функция P (x0) распределе-
ния значений вектора x представляет собой долю интервала [0, τ], для кото-
рой выполнено два неравенства: x1(t) ≤ x01 и x2(t) ≤ x02. Эта функция моно-
тонно растет с ростом каждого из аргументов, когда первая из составляющих
вектора x0 максимальна (p1(x1) = 1), она равна P (x02), а ее производная рав-
на плотности распределения p(xmax1, x2) = p2(x2), аналогично в случае, когда
x2 = xmax2, p(xmax2,x1) = p1(x1). Функции x1(t) и x2(t) не зависимы друг от
друга, так что p(x1, x2) = p1(x1)p2(x2).
63
Искомым решением задачи усредненной оптимизации является плотность
распределения p∗(x) вектора x на множестве V его допустимых значений.
Для реализации этого решения во времени нужно найти одну из возмож-
ных функций x(t), имеющих распределение p∗(x). Решение этой последней
задачи существенно облегчается особенностями оптимальных решений p∗(x),
доказанными в следующем разделе.
3. Об оптимальном решении задач усредненной оптимизации
Будем обозначать операцию усреднения чертой, прoведенной над усред-
няемой функцией или вектором. Так,
∫
∫
x = xp(x)dx, f(x) = f(x)p(x)dx.
V
V
Простейшей задачей усредненной оптимизации является задача о макси-
муме среднего значения скалярной функции f(x) при заданном среднем зна-
чении ее аргумента:
∕
(5)
f (x) → max x = x0, x ∈ V ⊂ Rn.
Или в более подробной записи
∫
∕∫
∫
(6)
f (x)p(x)dx → max
xp(x)dx = x0, p(x) ≥ 0,
p(x)dx = 1.
V
V
V
Искомой в этой задаче является p(x) (плотность распределения вектора ис-
комых переменных). Эта функция неотрицательна, и интеграл от нее на мно-
жестве V равен единице.
4. Теорема Каратеодори о выпуклых оболочках функций
Теорема Каратеодори [3, 4, 6] о выпуклых оболочках множеств утвержда-
ет, что любой элемент выпуклой оболочки CoD компактного множества D
в евклидовом пространстве размерности n может быть представлен как эле-
мент симплекса, имеющего не более чем n + 1 вершину (базовые точки), каж-
дая их которых принадлежит D.
В частности, множеством D может быть подграфик фунции f(x). Выпук-
лой оболочкой функции называют выпуклую оболочку подграфика. Функ-
ция, зависящая от n переменных, представляет собой границу множества в
пространстве Rn+1, имеющую размерность n. Базовые точки заведомо ле-
жат на этой границе, а значит, их число не превышает n + 1. Ниже будем
называть теорему Каратеодори теоремой о выпуклых оболочках функций.
Ордината выпуклой оболочки функции f0(x) в точке x0, принадлежащей
выпуклой оболочке множества определения фунции, является значением за-
64
дачи
∕ xi = xi0, i = 1,n,
(7)
f0(x) → max
p(x)
x∈V ⊂Rn,
где V -компакт.
Согласно теореме Каратеодори оптимальное решение этой задачи имеет
вид
∑
∑
p∗(x) =
γjδ(x - xj), γj ≥ 0,
γj = 1.
j=0
i=0
То есть оптимальное распределение сосредоточено не более чем в (n + 1)-й
базовых точках.
Этот факт позволяет переписать задачу (7) как задачу нелинейного про-
граммирования (НП)
∑
γjxj = x0,
∑
(8)
γjf0(xj) → maxj=0
∑
j=0
xj ∈ V ⊂ Rm,
γj = 1, γj ≥ 0,
j=0
переменными в которой являются базовые векторы xj и вектор весовых коэф-
фициентов γ, и воспользоваться для ее решения теоремой Куна-Таккера [7]:
Если y∗ является решением задачи нелинейного программирования
∕
(9)
f (y) → max ϕi(y) ≤ 0, yj
≥ 0, i = 1, . . . , m, j = 1, . . . , n,
то найдется такой ненулевой вектор множителей
λ = λ0,...,λm (λ0 равно нулю или единице, λi ≤ 0 при i > 0),
что для функции Лагранжа
∑
R = λ0f(y) + λiϕi(y)
i=1
справедливы условия:
(∂R)
(∂R)
(10)
= 0, если y∗j > 0;
≤ 0, если y∗j
= 0;
∂yjy=y∗
∂yjy=y∗
(11)
λi = 0, если ϕi(y∗) < 0; λi ≤ 0, если ϕi(y∗
) = 0.
Для задачи (8) функция Лагранжа имеет вид
[
]
∑
∑
(12)
R = γj f0(xj) + λixji - Λ
,
j=0
i=1
где Λ — множитель Лагранжа, соответствующий условию равенства суммы
весовых коэффициентов единице.
65
Условия Куна-Таккера по весовым коэффициентам приводят к требова-
ниям:
∑
(13)
R0(xj,λ) = f0(xj) +
λixji < Λ, если γj
= 0,
i=1
∑
R0(xj,λ) = f0(xj) +
λixji = Λ, если γj > 0, j = 0,... ,n + 1.
i=1
Здесь R0 - функция Лагранжа задачи (8) при отсутствии в ней усреднения.
Далее такую задачу будем называть исходной.
Таким образом: Для всех базовых значений x, входящих в оптимальное
решение задачи о выпуклой оболочке функции f0 с ненулевым весом, функция
Лагранжа исходной задачи максимальна. Число таких точек не превышает
n + 1.
5. Задача с усреднением связей, обобщение теоремы Каратеодори
В задаче НП с усреднением функций, определяющих связи между пере-
менными, требуется достичь максимума среднего значения функции f0(x)
на множестве V допустимых значений x при условии, что среднее значение
вектор-функции f(x) = (f1(x), . . . , fi(x), . . . , fm(x)) равно нулю. Формально
∕
(14)
f0(x) → max fi(x) = 0, i = 1,... ,m, x ∈ V ∈ Rn.
Теорема 1.
1. Оптимальная плотность распределения в задаче (14) имеет вид
∑
∑
(15)
p∗(x) =
γjδ(x - xj), γj ≥ 0,
γj
= 1.
j=0
j=0
2. Найдется такой ненулевой вектор
λ = λ0,...,λi,...,λm, λ0 = (0;1),
что в каждой базовой точке xj функция Лагранжа исходной задачи
∑
(16)
R= λifi(x)
i=0
максимальна по x ∈ V .
Доказательство. Для доказательства этого утверждения введем по-
нятие функции достижимости задачи (14):
∕
(17)
f∗0(C) = maxf0(x) fk(x) = Ck
,
k = 1,...,m, x ∈ V.
66
Эта функция задана алгоритмически на множестве
Vc = {C ∈ Rm : f(x) = C,x ∈ V ⊂ Rn} .
Она может быть негладкой и полунепрерывной сверху.
Справедливо
Утверждение. Для тех значений x, для которых f(x) = C, p∗(x) за-
ведомо равна нулю, если f0(x) = f∗0(C).
Таким образом, в решение усредненной задачи могут входить с ненулевым
весом только те значения x = x∗(C), для которых величина f0(x) совпадает
с ординатой функции достижимости. Если бы это утверждение было не вер-
но, можно было бы изменить плотность распределения так, чтобы среднее
значение f0(x) увеличилось.
Так как для каждого C величина f0 совпадает с ординатой функции до-
стижимости, задачу (14) можно переписать в форме
∕
(18)
f∗0(C) → max Ck = 0, k = 1,... ,m, C ∈ Vc ⊂ Rm.
Это задача об ординате выпуклой оболочки функции достижимости в нуле.
В соответствии с теоремой Каратеодори ее оптимальное решение равно
∑
∑
(19)
p∗(C) =
γjδ(C - Cj), γj ≥ 0,
γj
= 1.
j=0
j=0
Так как каждому базовому значению Cj соответствует значение xj∗(Cj ), то
оптимальная плотность распределения в задаче (14) имеет вид (15). Первое
утверждение теоремы 1 доказано.
Доказательство второго утверждения полностью повторяет аналогичное
доказательство для задачи об ординате выпуклой оболочки функции с той
разницей, что функция Лагранжа неусредненной задачи имеет форму (16).
Подчеркнем, что число базовых точек не зависит от размерности вектора x,
а определяется размерностью m вектор-функции f.
Отметим, что здесь и ниже условия в форме принципа максимума не тре-
буют от функций, определяющих усредненную задачу, гладкости по x, мно-
жество V может быть неодносвязным [8-10].
Пример 1. Рассмотрим систему, состоящую из электродвигателя, вра-
щаемого им насоса и емкости, на рис. 1,а. Двигатель потребляет мощность n,
от которой зависит производительность насоса g. Зависимость g(n) показа-
на на рис. 1,б . Требуется найти режим, для которого при заданной сред-
ней затрачиваемой мощности n средняя производительность g максимальна.
Это задача об ординате выпуклой оболочки функции g(n) в точке n. Число
базовых точек равно двум, одна из них — начало координат, а вторая, n1,
определена условием, что функция Лагранжа R = g(n) + λn в ней достигает
67
a
б
g
g(n)
g
G
n
g
~
0
n
n1
n
Рис. 1. Система, состоящая из насоса и сглаживающей емкости (а);
зависимость расхода от затрачиваемой мощности (б).
максимума (такого же, как при n = 0). Исключая λ из условий максимума
функции Лагранжа и требования, чтобы этот максимум был равен нулю,
приходим к уравнению для n1:
g(n)
dg(n)
=
n
dn
Оптимальных реализаций этого решения во времени сколь угодно много, для
каждого из них мощность насоса принимает значение ноль и n1, причем доля
от интервала τ, для которой n = n1, равна 1 -nn1 . Максимальное значение
интервала τ определяется величиной емкости G, оно равно
2G
τmax =
g(n1)
Значение задачи равно
(
)
n
g∗ = g(n1)
1-
n1
Оно от G не зависит, и при стремлении емкости к нулю оптимальным реше-
нием становится скользящий режим.
6. Обобщения усредненной задачи НП
6.1. Усредненная задача с детерминированными переменными
Как указывалось во введении, в усредненных задачах может быть два типа
переменных — рандомизированные и детерминированные. По переменным
второго вида усреднение отсутствует. Рассмотрим задачу НП, в которой по
части переменных усреднение отсутствует.
Задача с усреднением по части переменных примет форму:
∕
(20)
f0(x,y) → max fj(x,y) = 0, x ∈ V ⊂ Rn, y ∈ Vy ⊂ RK
, j = 1,...,m,
68
функции f0, . . . , fm непрерывны и непрерывно дифференцируемы по сово-
купности аргументов, черта соответствует усреднению по x ∈ V , множества
V и Vy замкнуты и ограниченны.
Для любого y эта задача является усредненной задачей нелинейного про-
граммирования (14), а следовательно, в силу теоремы оптимальная плотность
распределения x сосредоточена не более, чем в (m + 1)-й базовых точках, так
∑m
что p∗(x) =
γjδ(x - xj) и найдется такой ненулевой вектор λ, что в каж-
0
дой из этих точек функция Лагранжа исходной задачи
∑
(21)
R = λjfj(x,y), x ∈ V ⊂ Rn, y ∈ Vy ⊂ RK
j=0
максимальна по x.
Функция Лагранжа задачи (20), в которой плотность распределения x рав-
на p∗(x), имеет вид
∑
(22)
R∗ = λj γifj(xi,y), xi ∈ V ⊂ Rn, y ∈ Vy ⊂ RK.
j=0
i=0
Для любой плотности распределения p(x) рандомизированных перемен-
ных задача (20) представляет собой задачу нелинейного программирования и
согласно теореме Куна-Таккера найдется такой ненулевой вектор λ с соcтав-
ляющими λ0 = (0; 1), λj , j = 1, . . . , m, что для функции (21) на оптимальном
решении выполнены условия локальной неулучшаемости по y
∂R∗
(23)
δyl
≤ 0, l = 1, . . . , K.
∂yl
Здесь δyl - допустимая вариация yl.
Задача нелинейного программирования с усреднением по части перемен-
ных имеет много общего с задачей оптимального управления со связями в
форме дифференциальных уравнений. Там управляющие воздействия вхо-
дят в задачу так, что их сколь угодно быстрые изменения усредняются в
окрестности каждого момента времени, чего нельзя сказать о фазовых коор-
динатах. Именно поэтому условия в форме принципа максимума Понтрягина
справедливы для управляющих воздействий.
6.2. Задача, содержащая функции от средних значений переменных
Эта задача имеет вид
∕
(24)
f0(x,xl) → max fj(x,xl) = 0, x ∈ V ⊂ Rn, l = 1,..., K ≤ n.
Введем обозначение: yl = xl. Переменная yl принадлежит выпуклой обо-
лочке CoVxl множества допустимых значений xl. С учетом введенных обо-
значений задачу (24) можно переписать в форме
∕
f0(x,y) → max fj(x,y) = 0, xl -yl = 0, x∈ V ⊂ Rn, yl ∈ CoVx
(25)
⊂RK.
l
69
При записи в такой форме задача (25) отличается от задачи (20) только до-
полнительными усредненными условиями xl - yl = 0. Функция Лагранжа ис-
ходной задачи примет форму
∑
∑
(26)
R = λjfj(x,y) + λl(xl - yl), x ∈ V ⊂ Rn, yl ∈ CoVx
l
j=0
l=1
Из условий оптимальности (21), (23) следует, что максимальное число ба-
зовых значений x в задаче (24) равно m + K + 1 и что найдется такой нену-
левой вектор λ, что в каждой из базовых точек функция R, фигурирующая
в (26), достигает на оптимальном решении максимума по x, а по y функ-
ция (22) локально неулучшаема.
При решении усредненных задач выражают множители Лагранжа через
базовые значения xj и y из условия максимума функции Лагранжа по x и ра-
венства этих максимумов друг другу и записывают условия неулучшаемости
по y. После этого из усредненных условий находят весовые коэффициенты
для каждой из базовых точек с учетом того, что сумма этих весовых коэф-
фициентов равна единице.
Пример 2. В качестве иллюстративного примера рассмотрим задачу
)
∕(
1
(27)
(x - x)2 → min
= 1, x = -1; 0; 1.
x+x
Функция Лагранжа для этой задачи равна
(
)
1
(28)
L = (x - y)2 + λ
+ μ(y - x).
x+y-1
Число усредненных условий равно двум, значит, все три допустимых значе-
ния x являются базовыми, и неопределенные множители надо выбрать так,
чтобы максимум функции L∗ был в этих точках одинаков, что приводит к
условиям:
(
)
(
)
1
1
(29)
L∗ = (1 + y)2 + λ
-1
- μ(1 + y) = y2 + λ
-1
− μy =
y-1
y
(
)
1
= (1 - y)2 + λ
-1
+ μ(1 - y).
y+1
Откуда
2y
y(2y - 1)
(30)
λ=
(1 - y - 2y2), μ =
2+y
2+y
После подстановки этих выражений в L∗ и дифференцирования получивше-
гося выражения по y приходим к уравнению
(31)
3y3 + 17y2
+ 20y - 10 = 0.
70
С точностью до второго знака после запятой, y = 0,37. Весовые множите-
ли γ1, γ2, γ3 для x = -1, x = 0, x = 1 соответственно можно теперь найти из
условий
∑
∑
∑
1
(32)
γi = 1,
γixi = 0,37,
= 1.
γi xi + 0,37
i=1
i=1
i=1
Получим γ1 = 0,155, γ2 = 0,320, γ3 = 0,525.
7. Заключение
Рассмотрены различные постановки задач НП с усреднением. Показано,
что с введением понятия о функции достижимости задачи НП задачи, содер-
жащие усреднение функций от вектора рандомизированных переменных x,
могут быть сведены к экстремальным задачам о выпуклых оболочках мно-
жеств и функций. Оптимальное распределение во всех этих задачах сосредо-
точено в дискретных «базовых» точках компактного множества V допусти-
мых значений x. Доказан принцип максимума для таких задач. Показано,
что число базовых точек не превышает числа усредненных условий в задаче
более чем на единицу. Критерий и ограничения усредненных задач нелиней-
ного программирования могут зависеть от времени. Если эти зависимости
непрерывны, то приведенные выше условия оптимальности справедливы для
каждого момента времени и определяют изменение во времени координат ба-
зовых точек и их весов. Вектор неопределенных множителей Лагранжа, соот-
ветствующий оптимальному решению, доставляет минимум максимальному
по искомым переменным значению максимизируемой функции, что служит
основой для вычислительных алгоритмов.
СПИСОК ЛИТЕРАТУРЫ
1. Цирлин А.М. Оптимальные циклы и циклические режимы. М.: Энергоатомиз-
дат, 1983.
2. Розоноэр Л.И. Принцип максимума Л.С. Понтрягина в теории оптимальных
процессов // АиТ. 1959. № 10-12.
3. Юдин Д.Б. Математические методы управления в условиях неполной информа-
ции. М.: Советское радио, 1974.
4. Янг Л. Лекции по вариационному исчислению и теории оптимального управле-
ния. М.: Мир, 1977.
5. Цирлин А.М. Оптимизация в среднем и скользящие режимы в задачах оп-
тимального управления // Изв. АН СССР. Техн. кибернетика. 1974. № 2.
С. 143-151.
6. Половинкин Е.С., Балашов М.В. Элементы выпуклого и сильно выпуклого ана-
лиза. М.: Физматлит, 2004. 416 с. ISBN 5-9221-0499-3
7. Химмельблау Д. Прикладное нелинейное программирование. М.: Мир 1975.
71
8. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.А. Необходимое
условие в оптимальном управлении. М.: Наука, 1990.
9. Дубовицкий А.Я., Милютин А.А. Теория принципа максимума. Методы теории
экстремальных задач в экономике. М.: Наука, 1981.
10. Цирлин А.М. Условия оптимальности скользящих режимов и принцип макси-
мума для задачи со скалярным аргументом // АиТ. 2009. № 5. С. 106-121.
Статья представлена к публикации членом редколлегии П.С. Щербаковым.
Поступила в редакцию 09.06.2022
После доработки 07.03.2023
Принята к публикации 09.06.2023
72