ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ, 2022, том 58, № 6, с.795-812
ТЕОРИЯ УПРАВЛЕНИЯ
УДК 517.9
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ
ПРИНЦИПА ЛАГРАНЖА В ВЫПУКЛЫХ
ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
РАСПРЕДЕЛЁННЫМИ СИСТЕМАМИ ВОЛЬТЕРРОВА
ТИПА С ОПЕРАТОРНЫМИ ОГРАНИЧЕНИЯМИ
© 2022 г. В. И. Сумин, М. И. Сумин
Рассматривается итеративная регуляризация классических условий оптимальности - прин-
ципа Лагранжа и принципа максимума Понтрягина в выпуклой задаче оптимального уп-
равления с операторным (т.е. задаваемым оператором с бесконечномерным образом) огра-
ничением-равенством и функциональными ограничениями-неравенствами. Управляемая
система задаётся линейным функционально-операторным уравнением второго рода обще-
го вида в пространстве Lm2, основной оператор правой части уравнения предполагается
квазинильпотентным. Целевой минимизируемый функционал задачи сильно выпуклый.
Получение регуляризованных условий оптимальности основано на использовании метода
итеративной двойственной регуляризации. Основное их предназначение - устойчивое ге-
нерирование в рассматриваемой оптимизационной задаче обобщённых минимизирующих
последовательностей из минималей регулярного функционала Лагранжа, двойственные
переменные для которого генерируются в соответствии с процедурой итеративной регу-
ляризации градиентного подъема в двойственной задаче. Как иллюстрирующий пример
рассматривается задача оптимизации для системы уравнений гиперболического типа, част-
ным случаем этой задачи является конкретная обратная задача финального наблюдения.
DOI: 10.31857/S0374064122060073, EDN: CDFMUX
Введение. Статья посвящена итеративной регуляризации принципа Лагранжа в выпук-
лых задачах оптимального управления распределенными системами вольтеррова типа с опе-
раторными ограничениями. Главное назначение предлагаемой регуляризации - “преодоление”
связанных с некорректностью классических условий оптимальности (КУО) проблем и устойчи-
вое генерирование обобщённых минимизирующих последовательностей (ОМП), состоящих из
минималей регулярного функционала Лагранжа в рассматриваемой оптимизационной задаче,
двойственные переменные для которого генерируются в соответствии с процедурой итератив-
ной регуляризации градиентного подъема в двойственной задаче. В работе показано, что “внут-
ренний потенциал” КУО такой, что при соответствующей конструктивной трансформации-
регуляризации они эффективно преобразуются в удобные средства решения некорректных
оптимизационных задач.
Потребность в регуляризации КУО объясняется свойствами их некорректности, под кото-
рыми понимаются их возможные невыполнимость и неустойчивость по возмущению исходных
данных. Эти свойства некорректности обусловлены самой природой задач условной оптимиза-
ции [1, 2]. Заметим, что о невыполнимости КУО естественно говорить как в случае, когда этот
факт строго доказывается (см. пример в [3, с. 260], а также соответствующие примеры в [1, 2]),
так и в случае, когда мы не знаем так это или нет (см. ниже обсуждение задачи (P )). Можно
утверждать, что проверка на корректность конкретных задач условной оптимизации и опти-
мального управления, их систем оптимальности представляет собою, как правило, сложную
самостоятельную математическую задачу. Поэтому, если мы хотим привлечь КУО непосред-
ственно к решению сложных задач оптимизации, то и “относиться” к ним необходимо как
к математическим объектам с заведомо возможными свойствами некорректности (см. работы
[4, 5]). Необходимость такого подхода к задачам условной оптимизации и оптимального управ-
ления связана ещё и с тем, что сама физическая суть подобных задач, часто возникающих в
современном естествознании, обуславливает приближённое задание исходных данных.
795
796
СУМИН В.И., СУМИН М.И.
Идея регуляризации КУО в задачах условной оптимизации на основе теории двойственно-
сти как в неитеративном, так и в итеративном вариантах была относительно недавно пред-
ложена в статье [6] (см. также работы [1, 2]), аналогичные вопросы для задач оптимального
управления распределёнными системами рассматривались, в частности, в работах [2, 7] (см.
также библиографию в них). Отметим, что впервые принцип итеративной регуляризации был
предложен для решения монотонных вариационных неравенств в работе [8] (см. также кни-
гу [9] и библиографию в ней), его применение для обоснования процедуры регуляризации
метода проекции градиента для задачи математического программирования подробно изло-
жено в [5, гл. 9, § 8]. Об итеративной двойственной регуляризации [6] (см. также [2]) мы
говорим тогда, когда принцип итеративной регуляризации применяется для решения задачи,
двойственной по отношению к исходной задаче выпуклого программирования.
Данная статья продолжает линию исследований по регуляризации КУО в задачах опти-
мального управления линейными распределёнными системами работ [10, 11], в которых изуча-
лись оптимизационные задачи с функциональными ограничениями. В статье [10] рассматрива-
лась итеративная регуляризация КУО, в [11] - неитеративная. С общей точки зрения рассмат-
риваемая в статье задача оптимального управления представляет собою каноническую задачу
выпуклого программирования [3, п. 3.3.1] в гильбертовом пространстве с операторным ограни-
чением-равенством, также в гильбертовом пространстве, и функциональными ограничениями-
неравенствами (см. задачу (3) ниже). Главную трудность при работе с такими ограничениями
представляет, как известно, операторное равенство. Для пояснения содержательного смысла
результатов данной статьи вкратце рассмотрим классическую некорректную задачу поиска
нормального решения операторного уравнения первого рода [4, 5, 9], частным случаем кото-
рой становится наша базовая задача (3), если в ней отбросить функциональные ограничения
и упростить целевой функционал. Речь идет о задаче на условный экстремум
(P )
∥u∥2 inf, G[u] = h, u ∈ D ⊆ Z,
где G : Z → H - линейный ограниченный оператор, Z, H - гильбертовы пространства,
h ∈ H - заданный элемент, D - выпуклое замкнутое множество в Z.
Прежде чем говорить о регуляризации принципа Лагранжа (ПЛ) для более специальных
задач типа базовой задачи (3) данной статьи, естественно сначала выяснить как этот принцип
может быть записан в задаче (P ). Случай конечномерного ограничения-равенства, как из-
вестно, не вызывает затруднений. В общем случае на пути вывода для задачи (P ) принципа
Лагранжа возникают существенные трудности, связанные как раз с операторным ограниче-
нием-равенством. Так, например, известные подходы к выводу принципа Лагранжа (см. [3,
12]) требуют замкнутости образа оператора G). Это требование не выполняется, например, в
случае вполне непрерывного оператора G (см. [14, с. 225, теорема 1]), часто встречающемся в
распределённых задачах оптимизации. Подход к выводу для задачи (P ) принципа Лагранжа
с помощью метода возмущений (см., например, [3, п. 3.3.2]), использующий включение этой
задачи в семейство аналогичных задач, зависящих от параметра p ∈ H, вида
(Pp)
∥u∥2 inf, G[u] = h + p, u ∈ D ⊆ Z,
предполагает жёсткую связь соотношений принципа Лагранжа с субдифференциальными
свойствами функции значений задачи (Pp). Именно, как показано в [1, теорема 2.1; 14, теоре-
ма 1.1], этот подход позволяет формально получить невырожденный (регулярный или нере-
гулярный) принцип Лагранжа в задаче (P ) = (P0) тогда и только тогда, когда имеет место
хотя бы одно из двух соотношений: ∂β(0) = илиβ(0) = {0}, где ∂β(0) иβ(0) - суб-
дифференциал и асимптотический субдифференциал (в смысле выпуклого анализа) выпуклой
полунепрерывной снизу функции значений β(p) min
∥u∥2, p ∈ H, в нуле. Однако, к со-
u∈D
G[u]=h+p
жалению, проверка выполнимости нужных субдифференциальных свойств функции значений
представляет собою трудную самостоятельную математическую задачу.
) Как отмечено в книге [3, п. 3.2.4, с. 260], невыполнение этого условия замкнутости может приводить к
тому, что ПЛ вовсе не выполняется, см. также соответствующие примеры в [1, 2].
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
797
Наконец, если задача (P ) такова, что в ней все же “можно записать” принцип Лагранжа,
то “практическое” использование этого принципа (например, при нахождении приближений к
решению задачи) неизбежно наталкивается на проблему его неустойчивости [1, 2].
Сказанное выше означает, что регуляризация КУО в задачах условной оптимизации с опе-
раторными ограничениями, в известном смысле, гораздо более актуальна по сравнению с ре-
гуляризацией в случае функциональных ограничений. Заметим, что задачи с операторными
ограничениями-равенствами, например в форме задачи (P ), естественным образом возника-
ют при рассмотрении широкого класса представляющих большой интерес обратных задач для
распределённых систем (например, обратных задач наблюдения [2]). В то же время, как пока-
зано в данной статье, схема регуляризации КУО при операторных ограничениях может быть
аналогична схеме регуляризации при функциональных ограничениях.
Как и в [10, 11], в работе используется хорошо известное понятие ОМП - минимизирующего
приближённого решения (МПР) [15, гл. III], т.е. последовательности допустимых управлений,
значения функционала качества на которых стремятся к нижней грани задачи, а ограничения
при этом выполняются лишь “в пределе” (определение МПР см. ниже в пункте 1.3 и в пункте
2.2, определение 2). Центральным в работе и неразрывно связанным с понятием МПР явля-
ется введённое в [16] понятие МПР-образующего (регуляризирующего) алгоритма для задачи
условной оптимизации. Его можно квалифицировать как занимающее промежуточное положе-
ние между применяемыми в [5, гл. 9] понятиями регуляризирующих алгоритмов первого типа
(сходимость нижних граней [5, гл. 9, § 2, определение 1]) и второго типа (сходимость по аргу-
менту [5, гл. 9, § 6, определение 1]). Это понятие направлено прежде всего на устойчивое по-
строение МПР в задаче условной оптимизации и “жёстко привязано” именно к понятию МПР,
органично учитывающему как запросы строгой математической оптимизационной теории [15,
гл. IV-VIII], так и потребности инженерной практики [15, гл. III]. Понятие МПР-образующего
алгоритма в совокупности с двойственным подходом позволяет получать регуляризованные
КУО при весьма общих предположениях об исходных данных задачи. Одновременно с этим
оно естественным образом “встраивается” в формулировки регуляризованных КУО.
Выделим основные свойства получаемых в статье результатов. Регуляризованные КУО:
1) формулируются как теоремы существования в исходной задаче МПР, состоящего из
минималей функционала Лагранжа, двойственные переменные для которого генерируются в
соответствии с процедурой итеративной регуляризации градиентного подъема в двойственной
задаче;
2) формулируются для любой задачи рассматриваемого в статье класса задач вне зави-
симости от свойств задающих ограничения операторов с бесконечномерными образами и суб-
дифференциальных свойств функций значений;
3) могут трактоваться как условия оптимальности, выраженные в секвенциальной форме;
4) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона-
Понтрягина;
5) являются секвенциальными обобщениями классических аналогов - своих предельных
вариантов, сохраняя общую структуру последних;
6) “преодолевают” свойства некорректности КУО и представляют собою удобные регуля-
ризирующие алгоритмы решения задач оптимизации.
Отличительная черта рассматриваемых в статье линейных функциональных уравнений
второго рода - квазинильпотентность основного линейного оператора правой части. Подоб-
ным свойством обладают, прежде всего, различного рода вольтерровы операторы). Поэто-
му рассматриваемые уравнения можно назвать функциональными уравнениями вольтеррова
) Начиная с известных работ L. Tonelli (1929) и А.Н. Тихонова (1938), название “вольтерровы операторы”
(операторы типа Вольтерры) присваивалось разными авторами различным классам операторов со сходны-
ми свойствами (используются также названия: причинные операторы, наследственные операторы и др.); см.,
например, краткий обзор определений вольтерровых операторов [17, дополнение], а также [11, 18]. В случае
линейных операторов эти определения так или иначе связаны со свойством квазинильпотентности: либо это
свойство включено в само определение вольтеррова оператора (см., например, [19, с. 10]), либо при естественных
условиях следует из этого определения (см., например, определение функционального оператора, “вольтеррова
на системе множеств” [20], являющееся многомерным обобщением определения А.Н.Тихонова, и опирающийся
на это определение цепочечный признак квазинильпотентности [18, теорема 2]).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
798
СУМИН В.И., СУМИН М.И.
типа. К ним естественным образом (обращением главной части) сводятся самые разнообраз-
ные начально-краевые задачи для различных уравнений с частными производными (гипербо-
лических, параболических, интегро-дифференциальных систем таких уравнений уравнений с
запаздываниями разного рода и др., см., например, разнообразные конкретные примеры в [17,
гл. 2], обзоры в [17, 18]). Это позволило в данной статье получить регуляризованные принцип
Лагранжа и принцип максимума Понтрягина (ПМП) в итерационной форме единообразно для
широкого класса распределённых задач оптимизации. Как иллюстрирующий пример рассмат-
ривается задача оптимизации для гиперболической системы; частным случаем этой задачи
является конкретная обратная задача финального наблюдения. В работе существенным об-
разом используется предложенное нами ранее понятие равностепенной квазинильпотентности
семейства операторов (историю вопроса см. в [21]).
Примем следующие обозначения и соглашения: Rn - пространство n-векторов-столбцов;
〈·,·〉n и |·|n - евклидовы скалярное произведение и норма в Rn;
0n - нуль в Rn; век-
торы, если не оговорено противное, считаются столбцами; col {a, . . . , b} - вектор-столбец с
последовательными частями a, . . . , b;
- знак сопряжения и транспонирования; Π Rn -
ограниченное и измеримое по Лебегу множество изменения независимых переменных, элемен-
ты которого обозначаем через t ≡ {t1, . . . , tn}; Lp(Π) - лебегово пространство со стандартной
нормой
(1
p); Lmp ≡ Lmp(Π) (Lp(Π))m
(1
p);
∥ ·∥p,m - стандартная
норма прямого произведения в Lmp;
〈·,·〉2,m - стандартное скалярное произведение в Lm2;
Lm×lp ≡ Lm×lp(Π) - пространство (m × l)-матриц-функций с элементами из Lp(Π); ∥·∥p,m×l -
стандартная норма прямого произведения в Lm×lp; H - некоторое гильбертово пространство
со скалярным произведением 〈· , ·〉H и нормой ∥ · ∥H ; χ[α,β](ξ) ≡ {1, ξ ∈ [α, β]; 0, ξ ∈ [α, β]},
ξ ∈ R, - характеристическая функция отрезка [α,β] действительной прямой.
1. Постановка задачи оптимального управления.
1.1. Базовая оптимизационная задача. Пусть заданы: натуральные числа m, s; c(t),
t ∈ Π, - функция класса Lm2; A : Lm2 → Lm2 - линейный ограниченный оператор (ЛОО) с
нулевым спектральным радиусом; ЛОО B : Ls2 → Lm2. Рассмотрим функциональное уравнение
z(t) = A[z](t) + B[u](t) + c(t), t ∈ Π, z ∈ Lm2, u ∈ Ls2,
(1)
где u - управление. Ввиду квазинильпотентности оператора A уравнение (1) имеет для каж-
дого u(·) ∈ Ls2 единственное в классе Lm2 решение z(t), t ∈ Π, и
z(t) = S[B[u] + c](t), t ∈ Π, u ∈ Ls2,
(2)
где S : Lm2 → Lm2 - ЛОО - сумма ряда Неймана:
S[y]
Ai[y], y ∈ Lm2.
i=0
Отвечающее управлению u(·) ∈ Ls2 решение z(·) уравнения (1) обозначим через zu(·).
Будем считать, что заданы ЛОО A : Lm2 → H, ЛОО B : Ls2 → H и элемент C ∈ H, а
на прямом произведении Lm2 × Ls2 определены некоторые функционалы J0, J1, . . . , Jk со
свойствами: J0[z, u] ≡ K[z]+M[u], z ∈ Lm2, u ∈ Ls2, где K : Lm2 R - выпуклый функционал,
а M : Ls2R - сильно выпуклый функционал с постоянной сильной выпуклостью κ; Ji[·, ·] :
Lm2 × Ls2 R - выпуклый функционал (i = 1,k). Использовав (2) как формулу подстановки,
зададим на Ls2 функционалы J0[u] ≡ J0[zu, u] ≡ K[zu] + M[u], Ji[u] ≡ Ji[zu, u] (i = 1, k)
и оператор G[u] ≡ A[zu] + B[u], u ∈ Ls2. Функционалы Ji[ · ] (i = 1, k) - выпуклые, J0[ · ] -
сильно выпуклый. Пусть D ⊂ Ls2 - непустое, выпуклое, ограниченное и замкнутое множество.
Будем рассматривать задачи оптимизации системы (1) вида
J0[u] min, G[u] = C, J1[u] 0,... ,Jk[u] 0, u ∈ D,
(3)
c операторным ограничением G[u] = C, функциональными ограничениями Ji[u] 0 (i = 1, k),
минимизируемым функционалом J0[u], множеством допустимых управлений D.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
799
1.2. Точная и приближённые оптимизационные задачи. Задача (3) полностью опре-
деляется набором исходных данных f ≡ {A, B, c, A, B, C, K, M, Ji(i = 1, k)}. Предположим,
что точные данные f0 ≡ {A0, B0, c0, A0, B0, C0, K0, M0, J0i(i = 1, k)} не известны, но мож-
но оперировать с приближёнными данными fδ ≡ {Aδ, Bδ, cδ, Aδ, Bδ, Cδ, Kδ, Mδ, Jδi(i = 1, k)},
где δ ∈ (0, δ0] - числовой параметр (δ0 - фиксированное число), характеризующий близость
приближённых данных fδ к точным f0 в указанном ниже условиями A1) и A2) смысле.
Итак, при каждом δ ∈ [0, δ0] существуют квазинильпотентный ЛОО Aδ : Lm2 → Lm2; ЛОО
Bδ : Ls2 → Lm2; cδ(·) ∈ Lm2; ЛОО Aδ : Lm2 → H, ЛОО Bδ : Ls2 → H, Cδ ∈ H; выпуклый
функционал Kδ[z] : Lm2 R; сильно выпуклый функционал Mδ[u] : Ls2 R с постоянной
сильной выпуклостью κ; выпуклые функционалы Jδi[z, u] : Lm2 × Ls2 R (i = 0, k), причём
Jδ0[z,u] ≡ Kδ[z] + Mδ[u]. Предполагаем, что выполняется условие
Л) функционалы Kδ, Mδ и каждый из функционалов Jδi (i = 1, k), δ ∈ [0, δ0], - липши-
цевы на каждом ограниченном множестве пространств Lm2, Ls2 и Lm2 × Ls2 соответственно,
причём липшицевость равномерна по параметру δ ∈ [0, δ0], т.е. соответствующие постоянные
Липшица не зависят от δ ∈ [0, δ0].
Считаем, что данные fδ, δ ∈ (0, δ0], и f0 связаны условиями:
A1) Cуществует постоянная C > 0 такая, что при любом δ ∈ (00] выполняются оценки
∥Aδ - A0 Cδ,
∥Bδ - B0 Cδ,
∥cδ - c02,m Cδ,
∥Aδ - A0 Cδ,
∥Bδ - B0 Cδ,
∥Cδ - C0H Cδ,
|Mδ[u] - M0[u]| (u ∈ D).
A2) Cуществует неубывающая функция N1(·) : R+ R+ такая, что для каждого l > 0
и любого δ ∈ (0, δ0] при ∥z(·)2,m l, u ∈ D выполняются неравенства
|Kδ[z] - K0[z]| N1(l)δ,
|Jδi[z, u] - J0i[z, u]| N1(l)δ (i = 1, k).
Чтобы сформулировать условие A3), воспользуемся следующим предложенным нами ра-
нее (историю вопроса см. в [21]) понятием равностепенной квазинильпотентности. Пусть B -
банахово пространство, Ξ - некоторое множество, {G(ξ)[ · ] : B B}ξ∈Ξ - семейство за-
висящих от параметра ξ ∈ Ξ квазинильпотентных ЛОО (напомним, квазинильпотентность
ЛОО G(ξ)[ · ] : B B означает, чтоk
∥{G(ξ)}k ∥ → 0 при k → ∞). Семейство операторов
{G(ξ)}ξ∈Ξ называем равностепенно квазинильпотентным, если supk
∥{G(ξ)}k ∥ → 0 при
ξ∈Ξ
k → ∞.
A3) Семейство операторов {Aδ : Lm2 → Lm2}δ∈[00] равностепенно квазинильпотентно.
При любом δ ∈ [0, δ0] управляемое функциональное уравнение
z(t) = Aδ[z](t) + Bδ[u](t) + cδ(t), t ∈ Π, z ∈ Lm2, u ∈ Ls2,
(4)
имеет для каждого u ∈ Ls2 единственное в Lm2 решение z(t), t ∈ Π, причём
z(t) = Sδ[Bδ[u] + cδ](t), t ∈ Π, u ∈ Ls2,
(5)
где Sδ[y]
(Aδ)i[y], y ∈ Lm2. Отвечающее управлению u ∈ Ls2 и задаваемое формулой
i=0
(5) решение z(·) уравнения (4) обозначаем zδu(·), δ ∈ [0, δ0]. При любом δ ∈ [0, δ0] имеется
задача оптимизации системы (4):
(OCδ)
Jδ0[u] min, Gδ[u] = Cδ, Jδ1[u] 0, ... , Jδk[u] 0, u ∈ D,
где
Gδ[u] ≡ Aδ[zδu] + Bδ[u], Jδi[u] ≡ Jδi[zδu,u] (i = 0,k), u ∈ Ls2.
(6)
Задачу (OC0) (т.е. задачу (OCδ) при δ = 0) называем точной задачей, а задачи (OCδ),
δ ∈ (00], - приближёнными задачами оптимального управления.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
800
СУМИН В.И., СУМИН М.И.
1.3. МПР и МПР-образующий оператор. Для компактности записи введём обозначе-
ние Jδ[u] ≡ {Jδ1[u], . . . , Jδk[u]}. Положим
Dδ,ϵ ≡ {u ∈ D : ∥Gδ[u] - CδH ϵ, Jδi[u] ϵ (i = 1,k)}, где δ ∈ [00], ϵ 0,
и пусть D0 ≡ D0,0. Определим обобщённую нижнюю грань β задачи (OC0) как предел β ≡
≡ β+0 lim
βϵ, где βϵ inf
J00[u], если D0 =, и βϵ +∞, если D0 =. Очевидно,
ϵ→+0
u∈D0
что β β0, где β0 inf
J00[u] - классическая нижняя грань задачи (OC0). Так как (OC0) -
u∈D0
выпуклая задача с сильно выпуклым функционалом цели, то она может иметь не более одного
оптимального элемента, а β = β0. Если задача (OC0) имеет оптимальный элемент (будем
обозначать его u0), то на нём и достигаются грани β и β0.
Напомним, что последовательность uk(·) ∈ D, k ∈ N, называется МПР задачи (OC0),
если J00[uk(·)] → β при k → ∞, причём uk ∈ D0k для некоторой сходящейся к нулю после-
довательности положительных чисел ϵk, k ∈ N.
Определение 1. Пусть δk (00), k ∈ N, - сходящаяся к нулю последовательность.
Зависящий от δk, k ∈ N, оператор R( · , δk ), ставящий в соответствие каждому набору исход-
ных данных fδk элемент R(fδk , δk) ≡ uδk ∈ D, называем МПР-образующим в задаче (OC0),
если последовательность uδk , k ∈ N, есть МПР в этой задаче.
2. Эквивалентная задача выпуклого программирования и регуляризация прин-
ципа Лагранжа.
2.1. Задача выпуклого программирования. Задача (OCδ) при любом δ ∈ [00] -
это задача выпуклого программирования в Ls2. Запишем её в виде, позволяющем напрямую
воспользоваться результатами работ [1, 16] о регуляризации КУО в задачах выпуклого про-
граммирования в гильбертовом пространстве. Определим ЛОО Gδ[ · ] : Ls2 → H следующей
формулой: Gδ[u] ≡ Aδ[SδBδ[u]]+Bδ[u], u ∈ Ls2, δ ∈ [0, δ0]. Для единообразия записи положим
Jδ0[u] ≡ Jδ0[u], Jδi[u] ≡ Jδi[u] (i = 1,k), u ∈ Ls2. Пусть eδ ≡ Cδ - AδSδ[cδ], δ ∈ [00]. При
каждом δ ∈ [0, δ0] задача выпуклого программирования в Ls2
(Pδ)
Jδ0[u] min, Gδ[u] = eδ, Jδi[u] 0 (i = 1,k), u ∈ D,
эквивалентна задаче (OCδ), т.е. совпадают множества решений и значения задач. Задачи
(Pδ), δ ∈ [0, δ0], принадлежат классу задач выпуклого программирования в гильбертовом
пространстве с сильно выпуклыми функционалами цели, изучавшемуся в [1, 16].
Условие Л) влечёт за собой равномерную по δ ∈ [0, δ0] липшицевость функционалов Jδi
(i = 0, k) на любом ограниченном множестве в Ls2 : существует неубывающая функция N2(·) :
R+ R+ такая, что при каждом δ ∈ [00] и для любого l > 0 выполняются оценки
|Jδi[u1] - Jδi[u2]| N2(l)∥u1 - u22,s, u1, u2 ∈ Ls2,
∥u12,s, ∥u22,s l (i = 0, k).
Из условий A1) и A3) следует свойство семейства операторов {Aδ}0δδ0 .
Лемма 1. Существует число K такое, что ∥Sδ - S0 K∥Aδ - A0∥ при 0 < δ δ0.
Доказательство. Из условия A1) следует существование постоянной C1 такой, что
∥Aδ C1, 0 δ δ0. Фиксируем любое ϵ ∈ (0, 1). В силу условия A3) найдётся натуральное
N (ϵ) такое, что(Aδ)i ϵi при i N(ϵ), 0 δ δ0, т.е. при любом δ ∈ (00] выполняется
N(ϵ)-1
∥Sδ
(C1)i +
ϵi. Зависящее от ϵ число, стоящее в правой части последнего
i=0
i=N(ϵ)
неравенства, обозначим через C2. Произвольно выберем z ∈ Lm2. Так как Sδ[z] = Aδ[Sδ[z]]+z,
δ ∈ (00], то S0[z]-Sδ[z] = A0[S0[z]-Sδ[z]]+(A0-Aδ)[Sδ[z]], и поэтому S0[z]-Sδ[z] = S0[(A0-
- Aδ)[Sδ[z]]]. Следовательно, при любом δ ∈ (00] имеем ∥Sδ - S0 C2∥S0∥∥Aδ - A0 и
можно выбрать K = C2∥S0∥. Лемма доказана.
Из условий A1)-A3) простыми выкладками, использовав лемму 1, получаем следующую
связь входных данных задачи (P0) с входными данными задач (Pδ), δ ∈ (0, δ0]:
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
801
Лемма 2. Существует постоянная Γ, зависящая лишь от операторов A0, B0, A0,
B0, функционалов K0, J0i (i = 1,k), функций c0, N1, чисел C, K, δ0 и множества D,
такая, что для каждого δ ∈ (0, δ0] выполняются неравенства
Gδ - G0 Γδ,
∥eδ - e0H Γδ;
|Jδi[u] - J0i[u]| Γδ, u ∈ D (i = 0, k).
(7)
2.2. МПР и МПР-образующий оператор в задаче выпуклого программирования.
Имеем Dδ,ϵ = {u ∈ D :Gδ[u] - eδH ϵ, Jδi[u] ϵ (i = 1, k)}, 0δδ0, ϵ 0. Так как
обобщённая нижняя грань задачи (P0) определяется фактически той же формулой, что и
обобщённая нижняя грань задачи (OC0), и эти грани совпадают, то мы сохраним за ней
обозначение β. Имеем β ≡ β+0 lim
βϵ, βϵ inf
J00[u], если D0 =; βϵ +∞, если
ϵ→+0
u∈D0
D0 =. Как уже отмечалось, β β0, где β0 inf
J00[u] - классическая нижняя грань
u∈D0
задачи (P0). Так как (P0) - выпуклая задача с сильно выпуклым целевым функционалом,
то она может иметь не более одного оптимального элемента, а β = β0. Если (P0) имеет
оптимальный элемент (будем обозначать его u0), то на нём и достигаются грани β и β0.
Определение 2. Последовательность {uj}∞j=1 ⊂ D, для которой существует стремящаяся
к нулю последовательность положительных чиселj }∞j=1, такая, что uj ∈ D0j (j = 1, 2, . . .)
и J00[uj] → β = inf
J00[u] при j → ∞, называется МПР задачи (P0).
u∈D0
Лемма 3. В силу ограниченности D существование МПР в задаче (P0) равносильно
неравенству β < +∞. Если β < +∞ и сильно выпуклый функционал J00 является субдиф-
ференцируемым (в смысле выпуклого анализа) в точках D, то для любого МПР uk, k ∈ N,
в разрешимой единственным образом в этом случае задаче (P0) справедливо предельное со-
отношение uk → u0, k → ∞.
Доказательство. Пусть β < +∞. Так как J00 - непрерывный и сильно выпуклый, то
упомянутая последовательность uk, k ∈ N, ограничена. Благодаря единственности решения
задачи (P0), слабой полунепрерывности снизу функционалов J00[u], J0i[u] (i = 1, k), u ∈ D,
а также свойствам ЛОО G0, элементы uk при k → ∞ сходятся слабо к решению u0. Так
как J00[uk] J00[u0], k → ∞, то при субдифференцируемости J00 в точках D имеем сильную
сходимость uk к u0 при k → ∞. Лемма доказана.
Положим Jδ[u] ≡ {Jδ1[u], . . . , Jδk[u]}. Введём для задачи (P0) понятие МПР-образующего
(регуляризирующего) оператора [16], согласованное с понятием МПР. Набором исходных дан-
ˆ
ных задачи (Pδ) является набор
f
δ ≡ {Jδ0,Jδ,Gδ,eδ}.
Определение 3. Пусть δk (00), k ∈ N, - сходящаяся к нулю последовательность поло-
жительных чисел. Зависящий от δk, k ∈ N, оператор R( · , · , · , · , δk ), ставящий в соответствие
каждому набору исходных данных {Jδk0 , Jδk , Gδk , eδk } элемент R(J0k , Jδk , Gδk , eδk , δk) = uδk
∈ D, называется МПР-образующим в задаче (P0), если последовательность uδk , k ∈ N, есть
МПР в этой задаче.
2.3. Двойственная задача. Регулярная функция Лагранжа задачи (Pδ)
Lδ(u,λ,μ) Jδ0[u] + 〈λ,Gδ[u] - eδH + 〈μ,Jδ[u]k, u ∈ Ls2, λ ∈ H, μ ∈ Rk+,
(8)
при любых λ ∈ H, μ ∈ Rk+, δ ∈ (0, δ0] сильно выпукла и непрерывна как функция переменной
u в Ls2, а следовательно, достигает минимума на ограниченном выпуклом и замкнутом в Ls2
множестве D, причём в единственной точке
uδ[λ,μ] argmin Lδ(u,λ,μ), λ ∈ H, μ ∈ Rk+
u∈D
(см., например, [5, гл. 8, § 2, теорема 10]). Двойственной к задаче выпуклого программирования
(Pδ) является задача
V δ(λ,μ) minLδ(u,λ,μ) sup, λ ∈ H, μ ∈ Rk+.
u∈D
6
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
802
СУМИН В.И., СУМИН М.И.
Следующая лемма доказывается так же, как и оценка (2.32) в работе [16].
Лемма 4. Существует число K > 0, зависящее лишь от sup ∥u∥2,s, такое, что выпол-
u∈D
няется неравенство
|Vδ(λ, μ) - V0(λ, μ)| Kδ(1 + ∥λ∥H + ∥μ∥k), λ ∈ H, μ ∈ Rk+, δ ∈ (0, δ0].
(9)
2.4. Итеративная двойственная регуляризация. Пусть задача (P0) имеет решение.
Через
∂Vδ(λ,μ) обозначим супердифференциал (в смысле выпуклого анализа) вогнутого
(
функционала Vδ : H × Rk+ R. Вектор
V δ(λ,μ) ≡ {Gδ[uδ[λ,μ]] - eδ,Jδ[uδ[λ,μ]]} лежит
в ∂Vδ(λ,μ). Пусть последовательностьj, μj}, j = 0,1,2,... , конструируется по итераци-
онному правилу
̃
j+1, μj+1} = PrΛ(j, μj} + βj
V δj(λj, μj) - 2βjαjj, μj}), j = 0,1,2,... ,
0, μ0} ∈ Λ ≡ H × Rk+,
(10)
где последовательности δj , αj , βj, j ∈ N, удовлетворяют условиям согласования
δj 0, αj > 0, βj > 0, lim (δj + αj + βj) = 0,
j→∞
αj
j+1 - αj |
βj
δj
C0,
C,
C,
C,
αjβj = +
(11)
αj+1
(αj )3βj
(αj )3
(αj )6
j=1
при некоторых положительных
C, C0. Такие последовательности существуют. Можно взять,
например, значения αj = j-1/6, βj = j-1/(5/3), δj = j-1. Справедлива следующая теорема
сходимости метода итеративной двойственной регуляризации [6, теорема 2].
Теорема 1 (итеративная двойственная регуляризация). Пусть u0 - решение задачи (P0)
и выполняются условия согласования (11). Тогда
αj∥{λj, μj}∥ → 0, J00[uδj [λj, μj]] J00[u0], G0[uδj [λj, μj]] → e0 при j → ∞
и существует стремящаяся к нулю последовательность положительных чисел {κj}∞j=1 та-
кая, что J0i[uδj [λj , μj ]] ≤ κj (i = 1, k), j ∈ N. При дополнительном условии субдифференци-
руемости J00 (в смысле выпуклого анализа) в точках D справедливо
∥uδj [λj , μj ] - u02,s 0 при j → ∞.
(12)
Другими словами, вне зависимости от того, разрешима или нет двойственная к (P0) зада-
ча, алгоритм R( · , δj ), задаваемый равенством R(Jδj0 , Jδj , Gδj , eδj , δj ) = uδj [λj , μj ] для каж-
дого набора исходных данных {Jδj0 ,Jδj ,Gδj ,eδj }, удовлетворяющих оценкам (7) при δ = δj,
является МПР-образующим в смысле определения 3, причём в случае субдифференцируемости
J00 в точках D имеет место и сильная сходимость (12); если такой субдифференцируемо-
сти нет, то, строго говоря, можно гарантировать лишь слабую сходимость uδj [λj, μj] к
u0 при δj 0, j → ∞. Кроме того, справедливы соотношения
〈μj,Jδj[uδj[λj, μj]]k + 〈λj,Gδj[uδj[λj, μj]] - eδjH0 при j → ∞,
V0(λj, μj)
sup
V0(λ,μ) = J00[u0] при j → ∞.
{λ,μ}∈H×Rk
+
Сформулированная теорема может быть дополнена и регуляризирующим правилом остано-
ва итерационного процесса (10) в случае, когда ошибка задания исходных данных δ является
конечной и не стремится к нулю (см., например, теорему 3 из [6]).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
803
2.5. Регуляризованный итерационный принцип Лагранжа. Теперь сформулируем
и докажем регуляризованный принцип Лагранжа в итерационной форме в задаче (P0).
Теорема 2 (регуляризованный итерационный принцип Лагранжа). Для существования в
задаче (P0) МПР необходимо и достаточно, чтобы для последовательности {λj , μj } ∈ H ×
× Rk+, j = 0,1,... , порождаемой итерационным процессом (10) с условиями согласования
(11), выполнялось предельное соотношение
〈λj,Gδj [uδj [λj, μj,]] - eδjH + 〈μj,Jδj [uδj [λj, μj]]k 0 при j → ∞
(13)
и нашлась такая стремящаяся к нулю последовательность положительных чисел {ϵj}∞j=1,
чтобы имело место включение
uδj [λj, μj] ∈ Dδjj , j = 0,1,...
(14)
В этом случае последовательность uδj [λj, μj], j = 0,1,... , есть МПР задачи (P0) и вне
зависимости от того, разрешима двойственная к (P0) задача или нет, при субдифференци-
руемости J00 на D имеет место сильная сходимость в Ls2 :
uδj [λj, μj] → u0 при j → ∞.
(15)
Одновременно выполняется и предельное соотношение
V0(λj, μj)
sup
V0(λ,μ) = J00[u0] при j → ∞.
(16)
(λ,μ)∈H×Rk
+
Другими словами, вне зависимости от того, разрешима или нет двойственная к (P0) зада-
ча, алгоритм R( · , δj ), задаваемый равенством R(Jδj0 , Jδj , Gδj , eδj , δj ) = uδj [λj , μj ] для каж-
дого набора исходных данных {Jδj0 ,Jδj ,Gδj ,eδj }, удовлетворяющих оценкам (7) леммы 2 при
δ = δj, является МПР-образующим в смысле определения 3, а в случае субдифференцируемо-
сти J00 в точках D имеет место и сильная сходимость (15). Если же этой субдифферен-
цируемости нет, то, строго говоря, гарантирована лишь слабая сходимость uδj [λj, μj] к u0
при δj 0, j → ∞.
Доказательство. Для доказательства необходимости заметим, что выпуклая задача (P0),
все функционалы которой непрерывны, разрешима в силу существования МПР и ограничен-
ности D. Поэтому соотношения (13), (14), (16) следуют из теоремы 1.
Для доказательства достаточности заметим, что выпуклая задача (P0), все функциона-
лы которой непрерывны, разрешима благодаря включениям (14) и ограниченности последо-
вательности uδj [λj , μj ], j = 0, 1, . . . Следовательно, в силу теоремы 1 последовательность
j, μj}, j = 0,1,... , итерационного процесса (10) с условиями согласования (11) удовлетво-
ряет помимо предельных соотношений (13) и включений (14) ещё и предельному соотноше-
нию J00(uδj [λj , μj ]) J00(u0), j → ∞. Поэтому последовательность uδj [λj , μj], j = 0, 1, . . . ,
является МПР в задаче (P0), а значит в случае субдифференцируемости J00 на D она схо-
дится к u0 в норме Ls2. Одновременно, ввиду ограниченности D, предельного соотношения
αj∥{λj, μj}∥ → 0, j → ∞, теоремы 1, условий согласования (11) и оценки (9), получаем
предельное соотношение Vδj (λj , μj) - V0(λj , μj ) 0, j → ∞. Так как при этом, в силу дока-
занной сходимости J00(uδj [λj , μj ]) J00(u0), j → ∞ и условия (13), имеет место сходимость
V δj(λj, μj) J00(u0), j → ∞, то справедливо предельное соотношение (16). Теорема доказана.
3. Регуляризация классических условий оптимальности в задачах оптимального
управления распределёнными системами.
3.1. Переформулировка теорем о регуляризации в терминах исходной задачи
оптимального управления. Функция Лагранжа задачи (OCδ) равна функции Лагранжа
задачи (Pδ) и имеет вид
Lδ(u,λ,μ) ≡ Jδ0[u] + 〈λ,Gδ[u] - CδH + 〈μ,Jδ[u]k, u ∈ Ls2, λ ∈ H, μ ∈ Rk+,
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
6
804
СУМИН В.И., СУМИН М.И.
где Jδ[u] ≡ {Jδ1[u], . . . , Jδk[u]}. Соответственно двойственная к (OCδ) задача имеет вид
V δ(λ,μ) minLδ(u,λ,μ) sup, λ ∈ H, μ ∈ Rk+
u∈D
(при любых δ ∈ (0, δ0], λ ∈ H, μ ∈ Rk+ функция Lδ( · , λ, μ) достигает минимума на D в
единственной точке uδ[λ, μ]). “Расшифровка” теорем 1 и 2 в терминах задачи оптимального
управления (OC0) приводит соответственно к алгоритму итеративной двойственной регуля-
ризации и регуляризованному принципу Лагранжа в итерационной форме для этой задачи.
Пусть последовательностьj , μj }, j = 0, 1, 2, . . . , конструируется по итерационному правилу
(
(10) с
V δ(λ,μ) ≡ {Gδ[uδ[λ,μ]] - Cδ,Jδ[uδ[λ,μ]]} и с условиями согласования (11).
Теорема 3 (итеративная двойственная регуляризация в задаче оптимального управления
(OC0)). Пусть u0 - решение задачи (OC0) и выполняются условия (11). Тогда
αj∥{λj, μj}∥ → 0, J00[uδj [λj, μj]] → J00[u0], G0[uδj [λj, μj]] → C0 при j → ∞,
и существует стремящаяся к нулю последовательность положительных чисел {κj}∞j=1 та-
кая, что J0i[uδj [λj, μj ]] ≤ κj (i = 1, k), j = 1, 2, . . . При дополнительном условии субдиф-
ференцируемости J00 (в смысле выпуклого анализа) в точках D выполняется предельное
соотношение
∥uδj [λj , μj ] - u02,s 0 при j → ∞.
(17)
Другими словами, вне зависимости от того, разрешима или нет двойственная к (OC0) за-
дача, алгоритм R( · , δj ), задаваемый равенством R(fδj , δj ) = uδj [λj , μj ] для каждого набора
исходных данных fδj , является МПР-образующим в смысле определения 1, причём в случае
субдифференцируемости J00 в точках D имеет место и сильная сходимость (17); если та-
кой субдифференцируемости нет, то, вообще говоря, гарантирована лишь слабая сходимость
uδj [λj, μj] к u0 при δj 0, j → ∞. Кроме того, справедливы предельные соотношения
〈μj,Jδj[uδj[λj, μj]]k + 〈λj,Gδj[uδj[λj, μj]] - CδjH0 при j → ∞,
V0(λj, μj)
sup
V0(λ,μ) = J00[u0] при j → ∞.
{λ,μ}∈H×Rk
+
Теорема 4 (регуляризованный принцип Лагранжа в итерационной форме для задачи
(OC0)). Для существования МПР в задаче (OC0) необходимо и достаточно, чтобы для по-
следовательности {λj , μj} ∈ H × Rk+, j = 0, 1, . . . , порождаемой итерационным процессом
(
(10) с
V δ(λ,μ) ≡ {Gδ[uδ[λ,μ]]-Cδ,Jδ[uδ[λ,μ]]} и с условиями согласования (11), выполнялось
предельное соотношение
〈λj,Gδj [uδj [λj, μj]] - CδjH + 〈μj,Jδj [uδj [λj, μj]]k 0 при j → ∞,
и нашлась стремящаяся к нулю последовательность положительных чисел {ϵj}∞j=1 такая,
что uδj [λj, μj ] ∈ Dδjj , j
= 0, 1, . . . В этом случае последовательность uδj [λj , μj], j =
= 0, 1, . . . , есть МПР задачи (OC0) и независимо от того, разрешима двойственная к (OC0)
задача или нет, при субдифференцируемости J00 на D имеет место сходимость в Ls2 :
uδj [λj, μj] → u0 при j → ∞.
(18)
Одновременно и V0(λj, μj)
sup
V0(λ,μ) = J00[u0] при j → ∞. Другими сло-
{λ,μ}∈H×Rk
+
вами, вне зависимости от того, разрешима или нет двойственная к (OC0) задача, алго-
ритм R(·,δj), задаваемый равенством R(fδjj) = uδj [λj, μj] для каждого набора исходных
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
805
данных fδj , является МПР-образующим в смысле определения 1, причём в случае субдиффе-
ренцируемости J00 в точках D имеет место и сильная сходимость (18). Если же такой
субдифференцируемости нет, то можно говорить лишь о слабой сходимости uδj [λj, μj] к
u0 при δj 0, j → ∞.
3.2. О минимизации функции Лагранжа. Ключевой задачей процедуры двойственной
регуляризации процесса приближённого решения задачи (OC0), а также возможного примене-
ния регуляризованных КУО для практического решения задач оптимизации является задача
минимизации функции (функционала) Лагранжа Lδ(u, λ, μ), {λ, μ} ∈ H × Rk+, задачи (OCδ)
Lδ(u,λ,μ) min, u ∈ D,
(19)
решение которой мы обозначили через uδ[λ, μ]. От “качества” решения этой “простейшей” зада-
чи напрямую зависит и “качество” решения исходной задачи (OC0) на основе регуляризован-
ных КУО. Предположим для упрощения изложения, что при каждом δ ∈ (0, δ0] функционалы
Kδ[z] : Lm2 R, Mδ[u] : Ls2 R, Jδi[z,u] : Lm2 × Ls2 R (i = 1,k) дифференцируемы по
Фреше. Тогда при каждом δ ∈ (0, δ0] дифференцируемы по Фреше функционалы Jδi[u] : Ls2
R (i = 0,k) и функционал Лагранжа Lδ(u,λ,μ). В этом случае решение uδ[λ,μ] выпуклой
задачи на минимум (19) удовлетворяет критерию минимума
Lδ′u(uδ[λ,μ],λ,μ)[u - uδ[λ,μ]] 0, u ∈ D,
(20)
где Lδ′u(u, λ, μ)[ · ] - производная Фреше функционала Lδ(u, λ, μ) по переменной u в точке
u ∈ Ls2 при фиксированных λ, μ. Пусть Ψδ[u, λ, μ](·) ∈ Ls2 - функция Рисса линейного
непрерывного функционала Lδ′u(u, λ, μ)[ · ] (Ls2). Критерий (20) можно записать как
Ψδ[uδ[λ, μ], λ, μ], u - uδ[λ, μ]2,s 0, u ∈ D.
(21)
Найдём представление функции Ψδ[u, λ, μ](t), t ∈ Π, в терминах задачи (OCδ), δ > 0, а
точнее - в терминах уравнения (4), операторов Aδ, Bδ и функционалов Kδ, Mδ, Jδi (i =
= 1, k), δ > 0. Непосредственно из (5), (6) и (8) следует, что
Lδ′u(u,λ,μ)[v] = Kδ′z(SδBδ u + Sδcδ)SδBδ[v] + Mδ′u(u)[v] +
+ μiJδ′iz(SδBδ u + Sδcδ, u)SδBδ[v] +
μiJδ′iu(SδBδ u + Sδcδ, u)[v] +
i=1
i=1
+ 〈λ, AδSδBδ[v] + Bδ[v]H , v ∈ Ls2,
u∈Ls2.
(22)
Последнее слагаемое в правой части равенства (22) равно(Aδ)[λ], SδBδ[v]2,m+(Bδ)[λ], v〉2,s.
Пусть Γδ[u](·) ∈ Lm2, Υδ[u](·) ∈ Ls2, Θδi[u](·) ∈ Lm2, Ξδi[u](·) ∈ Ls2, Λδ[λ](·) ∈ Lm2 - функ-
ции Рисса, соответственно, функционалов Kδ′z(SδBδ u + Sδcδ)Sδ
(Lm2), Mδ′u(u) (Ls2),
Jδ′iz(SδBδ u + Sδcδ, u)Sδ
(Lm2), Jδ′iu(SδBδ u + Sδcδ, u) (Ls2), 〈(Aδ)[λ], Sδ[ · ]2,m (Lm2)
(i = 1, k). Формулу (22) запишем следующим образом:
Lδ′u(u,λ,μ)[v] = -〈ψδ[u,λ,μ],Bδ[v]2,m + 〈φδ[u,λ,μ],v〉2,s, v ∈ Ls2,
(23)
ψδ[u,λ,μ] ≡ -Γδ[u] -
μiΘδi[u] - Λδ[λ],
(24)
i=1
φδ[u,λ,μ] Υδ[u] +
μiΞδi[u] + (Bδ)[λ].
(25)
i=1
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
806
СУМИН В.И., СУМИН М.И.
Пусть Φδ[u](·) ∈ Lm2 и Ωδi[u](·) ∈ Lm2 - функции Рисса, соответственно, функционалов
Kδ′z(SδBδ u + Sδcδ) (Lm2) и Jδ′iz(SδBδ u + Sδcδ, u) (Lm2) (i = 1,k).
По определению сопряжённого оператора имеем
Γδ[u] = (Sδ)Φδ[u], Θδi[u] = (Sδ)Ωδi[u] (i = 1,k), Λδ[λ] = (Sδ)[(Aδ)[λ]].
Так как (Sδ) ((E -Aδ)-1) = ((E -Aδ))-1 = (E -(Aδ))-1, где E - единичный оператор в
Lm2, то определяемая формулой (24) функция ψδ[u,λ,μ] есть (единственное в Lm2) решение
уравнения
ψ(t) - (Aδ)[ψ](t) = -Φδ[u](t) -
μiΩδi[u](t) - (Aδ)[λ](t), t ∈ Π, ψ ∈ Lm2,
(26)
i=1
правая часть которого записана в терминах задачи (OCδ). Таким образом, из (23) получаем
следующее представление производной Lδ′u(u, λ, μ) в терминах этой задачи:
Lδ′u(u,λ,μ)[v] = 〈-(Bδ)[ψδ[u,λ,μ]] + φδ[u,λ,μ],v〉2,s, v ∈ Ls2.
(27)
Первый сомножитель правой части (27) и даёт искомое представление
Ψδ[u,λ,μ](t) = -(Bδ)[ψδ[u,λ,μ]](t) + φδ[u,λ,μ](t), t ∈ Π,
(28)
где ψδ[u, λ, μ] - Lm2-решение (26), φδ[u, λ, μ] задаётся формулой (25), u∈Ls2.
3.3. Случай ограниченных управлений. Пусть D ≡ {u(·) ∈ Ls∞ : u(t) ∈ U, t ∈ Π},
где U ⊂ Rs - ограниченное замкнутое и выпуклое множество. В этом случае критерий (21)
эквивалентен следующему линеаризованному поточечному принципу максимума.
Лемма 5. Функция u ∈ D будет решением задачи (19) тогда и только тогда, когда
Ψδ[u, λ, μ](t), u(t)s = maxΨδ[u, λ, μ](t), w〉s при почти всех t ∈ Π,
(29)
w∈U
где Ψδ[u, λ, μ] задаётся формулой (28), в которой ψδ[u, λ, μ] - решение сопряжённого урав-
нения (26).
Доказательство. Необходимость доказывается простейшим игольчатым варьированием,
а достаточность - стандартным применением теоремы А.А. Ляпунова (см. [22, § 2.4, § 8.2]).
Благодаря сильной выпуклости целевого функционала, множество управлений u(·) из D,
удовлетворяющих (при сформулированных выше дополнительных предположениях диффе-
ренцируемости) условию (29), состоит ровно из одного элемента, обозначим его uδm[λ, μ], и
uδm[λ,μ] = uδ[λ,μ], т.е. непосредственно из теоремы 4 и леммы 5 получаем следующий регуля-
ризованный ПМП в итерационной форме для задачи (OC0).
Теорема 5 (регуляризованный ПМП в итерационной форме для задачи оптимального
управления (OC0)). При сформулированных выше дополнительных условиях дифференциру-
емости все утверждения теоремы 4 останутся справедливыми, если в них заменить везде
uδj [λj, μj] на uδjm[λj, μj].
4. Иллюстративный пример: регуляризация условий оптимальности в задаче
оптимизации для гиперболической системы. Естественный переход от начально-крае-
вой задачи к эквивалентному ей функциональному уравнению второго рода вольтеррова типа
осуществляется с помощью обращения главной части задачи. Разнообразные конкретные при-
меры начально-краевых задач (для параболических, гиперболических, интегро-дифференци-
альных уравнений с частными производными и систем таких уравнений, различных уравнений
с запаздывающим аргументом и др.), которые допускают эквивалентное описание с помощью
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
807
функциональных уравнений вольтеррова типа можно найти, например, в [17] (см. также обзо-
ры и библиографию в [17, 21]). Из огромного множества самых различных соответствующих
оптимизационных задач для иллюстрации изложенной выше теории выбрана задача опти-
мального управления, связанная с гиперболической системой дифференциальных уравнений
первого порядка (частным случаем этой задачи является некоторая обратная задача финаль-
ного наблюдения). Запишем для этой задачи те основные конструкции, которые и участвуют
в формулировке регуляризованных КУО (формирующая критерий минимума функционала
Лагранжа функция, сопряжённое уравнение, . . . ). Сформулировать с их помощью соответ-
ствующие регуляризованные КУО - конкретные реализации теорем 3, 4, 5 - будет совсем не
трудно.
Пусть n = 2, Π = [0, 1] × [0, 1]; ξi > 0 (i = 1, m) - заданные числа; α(·) ∈ Lm×m∞, γ(·)
∈ Lm×s∞, θj(·) ∈ Lm2[0,1] (j = 1,2) - фиксированные функции. Рассмотрим краевую задачу
для управляемой линейной гиперболической системы первого порядка
∂xi
∂xi
+ξi
= αij(t)xj(t) + γij(t)uj(t), t ∈ Π, i = 1,m,
(30)
∂t1
∂t2
j=1
j=1
x(t1, 0) = θ1(t1),
0 t11; x(0,t2) = θ2(t2),
0 t21,
(31)
где u(·) ∈ Ls2 - управление. Левую часть i-го уравнения (30) понимаем как полную произ-
водную функции xi(·) по t1 вдоль характеристики li дифференциального выражения этой
левой части (уравнение характеристики li = li(t), проходящей через точку t = {t1, t2} плос-
кости t = {t1, t2}, имеет вид t2 = ηi(t; t1) ≡ ξi(t1 - t1) + t2); такую производную обозначаем
∂xi(·)/∂li (i = 1,m). Пусть W - класс функций x(·) из Lm2, у которых при любом i = 1,m
компонента xi(·) абсолютно непрерывна вдоль почти каждой в Π характеристики li, причём
функция ∂xi(t)/∂li, t ∈ Π, принадлежит L2.
Назовём решением задачи (30), (31) при данном u(·) функцию x(·) из W, удовлетворя-
ющую почти всюду граничным условиям (31), i-я компонента которой удовлетворяет i-му
уравнению (30) почти всюду (по линейной мере) вдоль почти каждой в Π характеристики
li, i = 1, m. Приведём задачу (30), (31) к эквивалентному уравнению вида (1), показав тем
самым, что каждому u(·) ∈ Ls2 отвечает единственное решение этой задачи. Введём обозначе-
ния: ai(t) (соответственно bi(t)) - точка из li(t)
Π, имеющая минимальную (соответственно
максимальную) координату t1; Θi(t) ≡ {θi2(a2i(t)), если t2 ξit1; θi1(a1i(t)), если t2 < ξit1},
i=1,
до t;l
y(·,·)dl - криволинейный интеграл от функции двух переменных y(·,·), равный
i[c,t]
t1
определённому интегралу
y(ξ, ηi(t; ξ)) dξ. Формула
c1
xi(t) = Θi(t) +
zi(·,·)dl, t ∈ Π, i = 1,m,
(32)
li[ai(t),t]
устанавливает взаимно-однозначное соответствие между классом Lm2 функций z(·) и классом
удовлетворяющих граничным условиям (31) функций x(·) из W. Cделав в задаче (30), (31)
замену (32) (это и есть процедура обращения главной части задачи (30), (31)), получим
zi(t) =
αij(tj[zj](t) +
γij(t)uj(t) +
αij(tj(t), t ∈ Π, i = 1,m,
j=1
j=1
j=1
где Σj[y](t)
y(·) dl, t ∈ Π, j = 1, m. Или, в более компактной форме,
lj[aj(t),t]
z(t) = α(t)Σ[z](t) + γ(t)u(t) + α(t)Θ(t), t ∈ Π,
(33)
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
808
СУМИН В.И., СУМИН М.И.
где Σ[z](t) col {Σ1[z1](t), . . . , Σm[zm](t)}. Запишем и формулу (32) более компактно:
x(t) = Θ(t) + Σ[z](t), t ∈ Π.
(34)
Уравнение (33) есть уравнение вида (1), эквивалентное краевой задаче (30), (31). Здесь
A[z](t) ≡ α(t)Σ[z](t), z ∈ Lm2, t ∈ Π (квазинильпотентность ЛОО A : Lm2 → Lm2 легко следует
из признака [18, теорема 2]); B[u](t) ≡ γ(t)u(t), u ∈ Ls2, t ∈ Π; c(t) ≡ α(t)Θ(t), t ∈ Π. Если
x(·) ∈ W - решение задачи (30), (31) при некотором u(·) ∈ Ls2, то связанная с x(·) формулой
(34) функция z(·) ∈ Lm2 есть решение уравнения (33) при том же u(·). И наоборот, если
z(·) ∈ Lm2 есть решение уравнения (33) при данном u(·) ∈ Ls2, то функция x(·), связанная с
z(·) формулой (34), есть решение задачи (30), (31) при этом u(·). Отвечающие управлению
u(·) ∈ Ls2 решения задачи (30), (31) и уравнения (33) обозначим xu и zu соответственно.
Пусть заданы выпуклые функции G0(y) : Rm R, Gi(y, w) : Rm × Rs R, i = 1, k;
функции P (·) ∈ Ll×m∞[0, 1], π(·) ∈ Ll2[0, 1], Q( · , · ) ∈ Lq×s2 × Π), ν(·) ∈ Lq2(Π). Формулами
(∫
)
(∫
)
F0[x,u] ≡ G0
x(t) dt
+ ∥u∥2
2,s
,
Fi[x, u] ≡ Gi
x(t) dt, u(t) dt
Π
Π
Π
при i = 1, k для x ∈ W, u ∈ Ls2 определены функционалы. Пусть D - выпуклое ограничен-
ное и замкнутое множество пространства Ls2. Рассмотрим задачу оптимального управления
системой (30), (31) c минимизируемым функционалом цели F0[x, u] при ограничениях
P (t2)x(1, t2) = π(t2) (t2 [0, 1]),
Q(t, ζ)u(ζ) = ν(t) (t ∈ Π),
Π
Fi[x, u] 0 (i = 1, k)
(35)
и множестве допустимых управлений D (при G0 0 задача является обратной задачей
финального наблюдения, см., например, [2]). Эту задачу символически запишем в виде
F0[xu,u] min, P(t2)xu(1,t2) = π(t2) (t2 [0,1]),
Q(t, ζ)u(ζ) = ν(t) (t ∈ Π), Fi[xu, u] 0 (i = 1, k), u ∈ D.
(36)
Π
Сделав в задаче (36) замену (34), получим эквивалентную задачу оптимизации управляе-
мой системы (33). При этом минимизируемый функционал принимает вид
W0[zu,u] ≡ F0[Θ + Σ[zu],u], u ∈ Ls2,
а ограничения (35) преобразуются в ограничения
P[z](t2) = π(t2)- P (t2)Θ(1, t2) (t2 [0, 1]), Q[u](t) = ν(t) (t ∈ Π), Wi[z, u] 0 (i = 1, k),
где
P[z](t2) ≡ P (t2)Σ[z](1, t2) (z ∈ Lm2, t2 [0, 1]), Q[u](t) ≡ Q(t, ζ)u(ζ) (u ∈ Ls2, t ∈ Π),
Π
Wi[z,u] ≡ Fi[Θ + Σ[z],u] (z ∈ Lm2, u ∈ Ls2, i = 1,k).
Полученная задача оптимизации управляемой системы (33), эквивалентная задаче (36), это
задача вида (3), здесь
(∫
)
Ji[u] ≡ Ji[zu,u] ≡ Wi[zu,u] (i = 0,k), K[z] ≡ G0
(Θ(t) + Σ[z](t)) dt
,
Π
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
809
M [u] ≡ ∥u∥22,s, H ≡ Ll2[0, 1] × Lq2(Π), A[z](t) col {P[z](t2), 0q} (z ∈ Lm2, t ∈ Π),
B[u](t) col {0l, Q[u](t)} (u ∈ Ls2, t ∈ Π), C ≡ col(t2) - P (t2)Θ(1, t2), ν(t)} (t ∈ Π).
Пусть f ≡ {α, γ, θ1, θ2, P, π, Q, ν, Gi(i = 0, k)} - входные данные задачи (36), которые под-
вергаются возмущению, и точный набор f0 ≡ {α0, γ0, θ01, θ02, P0, π0, Q0, ν0, G0i(i = 0, k)} нам не
известен, но можно оперировать с приближёнными наборами
fδ ≡ {αδδδ1δ2,Pδδ,Qδδ,Gδi(i = 0,k)} (δ ∈ (00])
(δ0 > 0 фиксировано), которые связаны с набором f0 следующими условиями:
Γ1) Функции Gδ0(y) : Rm R, Gδi(y,w) : Rm × Rs R (i = 1,k) выпуклы при любом
δ ∈ [00] и равномерно по δ ∈ [00] липшицевы на любом ограниченном множестве .
Γ2) Существует постоянная C > 0 такая, что величины ∥αδ0∞,m×m, ∥γδ0∞,m×s,
∥θδi - θ0iLm
∥Pδ - P0Ll×m
,
∥πδ - π0Ll
,
∥Qδ - Q02,q×s,
∥νδ - ν02,q
[0,1] (i = 1, m),
[0,1]
2
[0,1]
2
при любом δ ∈ (0, δ0] не превосходят величины Cδ.
Γ3) Существует неубывающая функция N1(·) : R+ R+ такая, что каковы бы ни были
l > 0 и δ ∈ (00] величины |Gδ0(y)-G00(y)|, |Gδi(y, w)-G0i(y, w)| (i = 1, k) при ∥y∥m, ∥w∥s l
не превосходят величины N1(l)δ.
При любом δ ∈ [0, δ0] имеем управляемую краевую задачу
∂xi
∂xi
+ξi
= αδij(t)xj(t) + γδij(t)uj(t), t ∈ Π, i = 1,m,
(37)
∂t1
∂t2
j=1
j=1
x(t1, 0) = θδ1(t1),
0 t11, x(0,t2) = θδ2(t2),
0 t21,
(38)
минимизируемый функционал Fδ0[x, u] ≡ Gδ0(Π x(t) dt) + ∥u∥22,s, набор ограничений
Pδ(t2)x(1,t2) = πδ(t2) (t2 [0,1]),
Qδ(t,ζ)u(ζ) = νδ(t) (t ∈ Π),
Π
Fδi[x,u] 0 (i = 1,k),
(39)
где Fδi[x, u] ≡ Gδi(Π x(t) dt,Π u(t) dt) (i = 1, k), и задачу оптимального управления
Fδ0[xδu,u] min, Pδ(t2)xδu(1,t2) = πδ(t2) (t2 [0,1]),
Qδ(t,ζ)u(ζ) = νδ(t) (t ∈ Π), Fδi[xδu,u] 0 (i = 1,k), u ∈ D,
(40)
Π
где xδu(·) - отвечающее управлению u(·) решение граничной задачи (37), (38).
Положим Θδi(t) ≡ {θδi2(a2i(t)), t2 ξit1; θδi1(a1i(t)), t2 < ξit1}, t ∈ Π, i = 1, m. Сделав в
задаче (40) замену x(t) = Θδ(t) + Σ[z](t), Θδ(t) col {Θδ1(t), . . . , Θδm(t)}, t ∈ Π, получим
эквивалентную задачу оптимизации управляемой системы
z(t) = αδ(t)Σ[z](t) + γδ(t)u(t) + αδ(tδ(t), t ∈ Π.
(41)
При этом ограничения (39) преобразуются в ограничения
Pδ[z](t2) = πδ(t2) - Pδ(t2δ(1,t2) (t2 [0,1]), Qδ[u](t) = νδ(t) (t ∈ Π),
Условие Γ1 выполняется, в частности, если при каждом i = 0, k функции Gi (δ ∈ [0, δ0]) выпуклы и
равномерно по δ ∈ [0, δ0] ограничены на любом ограниченном множестве (см., например, [23, теорема 8.2]).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
810
СУМИН В.И., СУМИН М.И.
Wδi[z,u] 0 (i = 1,k),
где Pδ[z](t2) ≡ Pδ(t2)Σ[z](1, t2) (z ∈ Lm2, t2 [0, 1]), Qδ[u](t)Π Qδ(t, ζ)u(ζ) (u ∈ Ls2,
t ∈ Π), Wδi[z, u] ≡ Fδiδ + Σ[z], u] (z ∈ Lm2, u ∈ Ls2, i = 1, k). Эту задачу оптимизации
системы (41) запишем в виде (zδu - решение уравнения (41), отвечающее управлению u)
Wδ0[zδu,u] min, Pδ[zδu](t2) = πδ(t2) - Pδ(t2δ(1,t2) (t2 [0,1]),
Qδ[u](t) = νδ(t) (t ∈ Π), Wδi[zδu,u] 0 (i = 1,k), u ∈ D,
(42)
где Wδ0[z, u] ≡ Fδ0δ + Σ[z], u]. Приняв Aδ[z](t) ≡ αδ(t)Σ[z](t), t ∈ Π, z ∈ Lm2; Bδ[u](t)
≡ γδ(t)u(t), t ∈ Π, u ∈ Ls2; cδ(t) ≡ αδ(tδ(t), t ∈ Π, записываем (41) в форме (4).
Таким образом, задача (42) имеет вид (OCδ), здесь
(∫
)
Jδi[u] ≡ Jδi[zδu,u] ≡ Wδi[zδu,u] (i = 0,k), Kδ[z] ≡ Gδ0
δ(t) + Σ[z](t)) dt
,
Π
Mδ ≡ M, H ≡ Ll2[0,1] × Lq2, Aδ[z](t) col {Pδ[z](t2),0q} (z ∈ Lm2, t ∈ Π),
Bδ[u](t) col {0l,Qδ[u](t)} (u ∈ Ls2, t ∈ Π), Cδ colδ(t2)-Pδ(t2δ(1,t2)δ(t)} (t ∈ Π).
При сделанных относительно семейства задач (40), δ ∈ [0, δ0], предположениях семейство
задач (42), δ ∈ [0, δ0], обладает свойствами Л), A1), A2), A3). Действительно, свойство Л) -
прямое следствие предположений Γ1)-Γ3), а неравенства A1) получаются элементарными
выкладками из Γ2). Чтобы доказать A2), оценим величину
|Jδi[z, u] - J0i[z, u]| ≡ |Wδi[z, u] - W0i[z, u]|
при произвольных u ∈ D, l > 0 и z ∈ Lm2 таких, что ∥z∥2,m l, для i ∈ {1, 2, . . . , k},
δ ∈ (00]. Она не превосходит суммы
|Fδiδ + Σ[z], u] - F0iδ + Σ[z], u]| + |F0iδ + Σ[z], u] - F0i[Θ + Σ[z], u]|.
(43)
Вследствие Γ2) справедлива оценка
∫
δ + Σ[z])dt
ϱ · (2Cδ0 + ∥θ01Lm[0,1] + ∥θ2Lm2[0,1]) + l · ∥Σ∥,
(44)
2
m
Π
где Σ - норма ЛОО Σ : Lm2 → Lm2, ϱ ≡ ϱ(ξ1, . . . , ξm) - постоянная, зависящая от чисел
ξi(i = 1, m). Из (44) и Γ3) следует, что первое слагаемое в (43) не превосходит величины
δ · N1(max{σ,max∥u∥2,s}), где σ ≡ σ(ξ1, . . . , ξm, C, δ0, θ01, θ02, l) - правая часть (44). Так как
u∈D
функция G0i липшицева на любом ограниченном множестве, то существует неубывающая
функция μ(·) : R+ R+ такая, что выполняется неравенство
|G0i(y1, w1) - G0i(y2, w2)| μ(l)(∥y1 - y2m + ∥w1 - w2s),
если ∥y1m l,
∥y2m l,
∥w1s l,
∥w2s l (i = 1, k). Ввиду (44) второе слагаемое
правой части (43) не больше произведения μ(max{σ, max∥u∥2,s}) · ∥Πδ - Θ0) dt∥m, второй
u∈D
сомножитель которого не превосходит числа 2Cδ · ϱ(ξ1, . . . , ξm). Таким образом, неравенства
условия A2) для функционалов Jδ1, . . . , Jδk, 0 < δ δ0, выполняются с функцией
N1(l) 2C · ϱ(ξ1,... ,ξm) · μ(max(ξ1,... ,ξm,C00102,l),l}), l > 0.
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
ОБ ИТЕРАТИВНОЙ РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА
811
Аналогичные выкладки можно провести и для Kδ,
0 < δ δ0. Выполнение условия A3)
легко проверить, пользуясь цепочечным признаком равностепенной квазинильпотентности [21,
теорема 2].
Предположив дополнительно, что функции Gδi, i = 0, k, 0 < δ δ0, непрерывно диф-
ференцируемы, можем выписать для данного примера критерий решения задачи (19). Сопря-
жённый к оператору Σ : Lm2 → Lm2 оператор Σ : Lm2 → Lm2 имеет вид
Σ[z] col {Σ1[z1],... ,Σ∗m[zm]},
где
Σ∗j[y](t)
y(·) dl, t ∈ Π, j = 1, m.
lj[t,bj(t)]
Положим κδ(u)Π xδ¯u(ζ) dζ, κ(u)Π u(ζ) dζ. Непосредственным вычислением получим
Φδ[u](t) Σ[{Gδ0(κδ(u))}](t), Υδ[u](t) 2u(t),
Ωδi[u](t) Σ[{Gδiy′(κδ(u),κ(u))}](t) (i = 1,k),
Ξδi[u](t) ≡ {Gδiw′(κδ(u),κ(u))} (i = 1,k), t ∈ Π.
Приняв для λ ∈ H ≡ Ll2[0, 1] × Lq2 двухкомпонентное обозначение λ ≡ col {ω, ϖ}, ω ∈ Ll2[0, 1],
ϖ ∈ Lq2, находим
(Aδ)[λ](t) =[(1i)(t2+ξi-1),1](t1)Mi[(Pδ(·))ω(·)](t)}mi=1 (λ ∈ H, t ∈ Π),
(Bδ)[λ](t) = (Qδ(ζ, t))ϖ(ζ) (λ ∈ H, t ∈ Π),
Π
где Mi[y] - оператор преобразования функции (одной переменной) y(·) в функцию (двух
переменных)
Mi[y](t) ≡ y(t2 - ξi(t1 - 1)), t ∈ Π, i = 1,m.
Уравнение (26) имеет вид
[{
}]
ψ(t) - Σ[αδ∗ψ](t) = -Σ Gδ0(κδ(u)) +
μjGδjy′(κδ(u),κ(u))
(t) - (Aδ)[λ](t), t ∈ Π,
j=1
его решение принадлежит классу W. Это уравнение эквивалентно краевой задаче
∂ψi
∂ψi
δ
+ξi
= αδji(t)ψj(t) + G
(κδ(u)) +
μjGδjyi(κδ(u),κ(u)), t ∈ Π, i = 1,m;
0yi
∂t1
∂t2
j=1
j=1
ψ(t1, 1) = 0m,
0 t11; ψ(1,t2) = -(Pδ(t2))ω(t2),
0 t21,
основные уравнения которой получаются из него дифференцированием вдоль характеристик,
краевые условия - соответствующими подстановками независимых переменных.
Заключение. Предложен регуляризованный принцип Лагранжа в итерационной форме
в выпуклой задаче оптимального управления с операторными ограничениями для управля-
емой системы, задаваемой линейным функционально-операторным уравнением второго рода
общего вида в пространстве Lm2, основной оператор правой части уравнения предполагается
квазинильпотентным.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных ис-
следований (проект 20-01-00199_a).
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022
812
СУМИН В.И., СУМИН М.И.
СПИСОК ЛИТЕРАТУРЫ
1. Сумин М.И. Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом простран-
стве // Журн. вычислит. математики и мат. физики. 2011. Т. 51. № 9. С. 1594-1615.
2. Сумин М.И. Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптималь-
ном управлении и обратных задачах // Тр. Ин-та математики и механики УрО РАН. 2019. Т. 25.
№ 1. C. 279-296.
3. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М., 1979.
4. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М., 1986.
5. Васильев Ф.П. Методы оптимизации: в 2-х кн. М., 2011.
6. Сумин М.И. Регуляризация в линейно выпуклой задаче математического программирования на
основе теории двойственности // Журн. вычислит. математики и мат. физики. 2007. Т. 47. № 4.
С. 602-625.
7. Сумин М.И. Регуляризация принципа максимума Понтрягина в выпуклой задаче оптимального
граничного управления для параболического уравнения с операторным ограничением-равенством
// Тр. Ин-та математики и механики УрО РАН. 2021. Т. 27. № 2. C. 221-237.
8. Бакушинский А.Б. Методы решения монотонных вариационных неравенств, основанные на прин-
ципе итеративной регуляризации // Журн. вычислит. математики и мат. физики. 1977. Т. 17. № 6.
С. 1350-1362.
9. Бакушинский А.Б., Гончарский А.В. Итеративные методы решения некорректных задач. М., 1989.
10. Сумин В.И., Сумин М.И. Регуляризованные классические условия оптимальности в итерацион-
ной форме для выпуклых задач оптимизации распределённых систем вольтеррова типа // Вестн.
Удмуртского ун-та. Математика. Механика. Компьют. науки. 2021. Т. 31. Вып. 2. С. 265-284.
11. Сумин В.И., Сумин М.И. Регуляризация классических условий оптимальности в задачах оптималь-
ного управления линейными распределёнными системами вольтеррова типа // Журн. вычислит.
математики и мат. физики. 2022. Т. 62. № 1. С. 45-70.
12. Аваков Е.Р., Магарил-Ильяев Г.Г., Тихомиров В.М. О принципе Лагранжа в задачах на экстремум
при наличии ограничений // Успехи мат. наук. 2013. Т. 68. Вып. 3(411). С. 5-38.
13. Сумин М.И. Недифференциальные теоремы Куна-Таккера в задачах на условный экстремум и
субдифференциалы негладкого анализа // Вестн. рос. ун-тов. Математика. 2020. Т. 25. Вып. 131.
С. 307-330.
14. Треногин В.А. Функциональный анализ. М., 1980.
15. Сумин М.И. О регуляризации классических условий оптимальности в выпуклых задачах оптималь-
ного управления // Тр. Ин-та математики и механики УрО РАН. 2020. Т. 26. № 2. C. 252-269.
16. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.,
1977.
17. Гохберг И.Ц., Крейн М.Г. Теория вольтерровых операторов в гильбертовом пространстве и её при-
ложения. М., 1967.
18. Сумин В.И. Функционально-операторные вольтерровы уравнения в теории оптимального управле-
ния распределёнными системами // Докл. АН СССР. 1989. Т. 305. № 5. C. 1056-1059.
19. Сумин В.И., Чернов А.В. Операторы в пространствах измеримых функций: вольтерровость и ква-
зинильпотентность // Дифференц. уравнения. 1998. Т. 34. № 10. С. 1402-1411.
20. Сумин В.И. Функциональные вольтерровы уравнения в теории оптимального управления распре-
делёнными системами. Нижний Новгород, 1992.
21. Сумин В.И. Управляемые вольтерровы функциональные уравнения и принцип сжимающих отоб-
ражений // Тр. Ин-та математики и механики УрО РАН. 2019. Т. 25. № 1. C. 262-278.
22. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М., 1974.
23. Дмитрук А.В. Выпуклый анализ. Элементарный вводный курс: учеб. пособие. М., 2012.
Тамбовский государственный университет
Поступила в редакцию 27.12.2021 г.
имени Г.Р. Державина
После доработки 27.12.2021 г.
Нижегородский государственный университет
Принята к публикации 25.05.2022 г.
имени Н.И. Лобачевского
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ том 58
№6
2022