Журнал вычислительной математики и математической физики, 2022, T. 62, № 1, стр. 45-70
Регуляризация классических условий оптимальности в задачах оптимального управления линейными распределенными системами вольтеррова типа
В. И. Сумин 1, 2, *, М. И. Сумин 2, 1, **
1 ННГУ им. Н.И. Лобачевского
603950 Нижний Новгород, пр-т Гагарина, 23, Россия
2 ТГУ им. Г.Р. Державина
392000 Тамбов, ул. Интернациональная, 33, Россия
* E-mail: v_sumin@mail.ru
** E-mail: m.sumin@mail.ru
Поступила в редакцию 12.12.2020
После доработки 21.03.2021
Принята к публикации 07.07.2021
- EDN: QVXLTJ
- DOI: 10.31857/S0044466921110144
Аннотация
Рассматривается регуляризация классических условий оптимальности (КУО) – принципа Лагранжа и принципа максимума Понтрягина – в выпуклой задаче оптимального управления с функциональными ограничениями типа равенства и неравенства. Управляемая система задается линейным функционально-операторным уравнением II рода общего вида в пространстве $L_{2}^{m}$, основной оператор правой части уравнения предполагается квазинильпотентным. Целевой минимизируемый функционал задачи является сильно выпуклым. Получение регуляризованных КУО основано на использовании метода двойственной регуляризации. Основное предназначение регуляризованных принципа Лагранжа и принципа максимума Понтрягина – устойчивое генерирование минимизирующих приближенных решений в смысле Дж. Варги. Регуляризованные КУО: 1) формулируются как теоремы существования в исходной задаче минимизирующих приближенных решений с одновременным конструктивным представлением этих решений; 2) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона–Понтрягина; 3) являются секвенциальными обобщениями классических аналогов – своих предельных вариантов, сохраняя общую структуру последних; 4) “преодолевают” свойства некорректности КУО и дают регуляризирующие алгоритмы для решения оптимизационных задач. В качестве приложения результатов для задачи оптимального управления линейным функционально-операторным уравнением II рода общего вида рассматриваются два примера конкретных задач оптимального управления, связанных с системой уравнений с запаздыванием и с интегродифференциальным уравнением типа уравнения переноса. Библ. 35.
1. ВВЕДЕНИЕ
Принцип Лагранжа (ПЛ) и принцип максимума Понтрягина (ПМП) в их различных вариантах представляют собой классические условия оптимальности (КУО), вопросам формулировки и обоснования которых в теории оптимального управления распределенными системами посвящено большое число публикаций. Хорошо известно, что как ПЛ, так и ПМП были открыты благодаря, прежде всего, необходимости решения различных практических оптимизационных (экстремальных) задач (см., например, [1, гл. 1]–[5]. Однако возможности непосредственного применения ПЛ и ПМП для практического решения многих важных оптимизационных задач сильно ограничивают присущие этим КУО “от природы” свойства некорректности. Это, прежде всего, связано с тем, что различные проявления некорректности свойственны самим задачам оптимизации. К таким хорошо известным свойствам некорректности оптимизационных задач относятся свойства несуществования их решений и решений двойственных к ним задач, а также свойства неустойчивости решений как по аргументу, так и по функции (содержательные примеры такой некорректности можно найти, например, в [6, гл. 9]). Естественно, различные проявления некорректности характерны и для КУО. Говоря о некорректности КУО, в первую очередь мы имеем в виду такие ее проявления, как неустойчивость и невыполнимость КУО. Поясним смысл, который мы вкладываем в термины “неустойчивость” и “невыполнимость”. Мы говорим о неустойчивости КУО, если выделяемые ими в задачах, “близких” к исходной (невозмущенной) задаче элементы, формально удовлетворяющие КУО в этих возмущенных задачах, фактически не являются реальными приближениями к точному решению исходной задачи. Другими словами, при сколь угодно малых возмущениях оптимизационных задач эти удовлетворяюшие “возмущенным” КУО элементы могут сколь угодно сильно отличаться как по аргументу, так и по функции, от оптимальных элементов невозмущенных задач (см., например, [7], [8]). В свою очередь, невыполнимость КУО в той или иной конкретной задаче условной оптимизации мы понимаем как принципиальную невозможность записать их для этой задачи в той привычной (классической) форме, в которой принято записывать условия оптимальности в других задачах данного класса. Простейший пример невыполнимости принципа Лагранжа в задаче выпуклого, а точнее говоря, линейного программирования с ограничением-равенством в бесконечномерном пространстве, можно найти в [1, с. 260], другие содержательные примеры см. в [7], [8]. Указанные и многие подобные им примеры говорят о том, что КУО в каждой конкретной задаче условной оптимизации, в том числе и оптимального управления, априори следует считать математическими объектами, которым в полной мере присущи проявления некорректности, если не доказано обратное.
Настоящая статья посвящена методам преодоления свойств некорректности ПЛ и ПМП в линейно-выпуклых задачах оптимизации распределенных систем с функциональными ограничениями типа равенства и неравенства и способам получения для таких задач регуляризованных ПЛ и ПМП в форме теорем существования обобщенных минимизирующих последовательностей – минимизирующих приближенных решений (МПР) в смысле Дж. Варги [9] (в математическом программировании такие последовательности получили название обобщенных планов [10]). Основное предназначение этих регуляризованных ПЛ и ПМП – устойчивое генерирование МПР в задачах оптимального управления для целей непосредственного практического устойчивого решения таких задач. Таким образом, указанные теоремы существования МПР дают регуляризирующие алгоритмы решения задач оптимального управления.
С общей точки зрения, рассматриваемая в работе задача оптимального управления может быть отнесена к классу задач выпуклого программирования в гильбертовом пространстве с конечным числом функциональных ограничений типа равенства и неравенства. Так как в подобных задачах, ввиду конечномерности образа оператора, задающего ограничения, проблема невыполнимости условий оптимальности в разрешимой задаче, по сути дела, снимается, то главное внимание в статье уделяется проблеме преодоления неустойчивости ПЛ и ПМП для таких задач. Неустойчивость КУО в задачах с ограничениями проявляет себя уже в самых простейших конечномерных задачах выпуклого программирования как с ограниченными, так и неограниченными множествами допустимых элементов (см., в частности, [7, пример 3]).
Наличие совсем простых примеров неустойчивости оптимизационных задач и соответствующих им КУО хорошо объясняет постоянный на протяжении многих лет интерес к проблеме неустойчивости в задачах условной оптимизации с функциональными ограничениями. В частности, подробное изложение основных существующих в настоящее время подходов к регуляризации в задачах с функциональными ограничениями типа равенства и неравенства может быть найдено в [6, гл. 9] (там же см. обширную библиографию).
Укажем две существенные, на наш взгляд, особенности настоящей работы. Во-первых, подчеркнем, что в данной работе мы занимаемся, по сути дела, не регуляризацией “самой задачи” условной минимизации, как это обычно принято в теории регуляризации [6], [11], [12]. Речь идет о регуляризации непосредственно КУО в оптимизационной задаче, которые при этом естественным образом трансформируются нами в теоремы существования МПР и одновременно в регуляризирующие алгоритмы для решения задач оптимального управления. Мы опираемся при этом на предложенный ранее в наших работах (см. данный журнал за 2007 г.) и основанный на теории двойственности подход к регуляризации в задачах условной оптимизации.
Во-вторых, регуляризация КУО нацелена здесь на преодоление их неустойчивости в задачах оптимизации распределенных систем, описываемых линейными функциональными (иначе, функционально-операторными) уравнениями II рода общего вида в пространствах $L_{2}^{m}$. Отличительная черта рассматриваемых нами уравнений – квазинильпотентность основного линейного оператора правой части. Подобным свойством обладают, прежде всего, различного рода вольтерровы операторы. Начиная с работ L.Tonelli [13] и А.Н.Тихонова [14] название “вольтерровы операторы” (операторы типа Вольтерра) присваивалось разными авторами различным семействам операторов со сходными свойствами (используются также названия: причинные операторы, наследственные операторы (см., например, [9, с. 233]) и др.). Подобные семейства выделялись как в классах интегральных (см., например, [15], [16]) и функциональных (см., например, [17]–[19]) операторов, так и в классах разного рода абстрактных операторов (см., например, [20]–[24]); краткий обзор определений вольтеррововсти см. в [25]. В случае линейных операторов определения вольтерровости обычно так или иначе связаны со свойством квазинильпотентности: либо это свойство включено в само определение вольтеррова оператора (см., например, [20, c. 10]), либо при естественных условиях следует из этого определения (см., например, определение [18] функционального оператора, “вольтеррова на системе множеств”, являющееся многомерным обобщением определения А.Н. Тихонова [14], и опирающийся на него цепочечный признак квазинильпотентности [26, теорема 2]). Поэтому рассматриваемые нами в данной статье функциональные уравнения можно назвать функциональными уравнениями вольтеррова типа. К таким уравнениям естественным образом (обращением главной части) сводятся самые разнообразные начально-краевые задачи для различных уравнений с частными производными (гиперболических, параболических, интегродифференциальных, систем таких уравнений, уравнений с запаздываниями разного рода и др., см., например, [25], разд. 5 данной статьи, обзор в [27]). Это позволило в настоящей работе получить регуляризованные ПЛ и ПМП единообразно для широкого класса распределенных оптимизационных задач. В качестве конкретных иллюстрирующих примеров рассматриваются задачи оптимального управления, связанные с системой дифференциальных уравнений с запаздыванием и с интегродифференциальным уравнением типа уравнения переноса.
Отметим, что в настоящей работе используется иное, нежели в [6, гл. 9], понятие регуляризирующего алгоритма для задачи условной оптимизации (см. определение 3.2), введенное ранее в [28]. Оно, как и производное от него понятие МПР-образующего алгоритма (см. определение 3.3) нацелено прежде всего на устойчивое построение МПР в задаче и “жестко привязано” именно к понятию МПР, органично учитывающему, как запросы строгой математической оптимизационной теории [9, гл. IV–VIII], так и потребности инженерной практики [9, гл. III], предполагающей неизбежное наличие у приближенных решений ненулевых “зазоров” как по выполнению ограничений задачи, так и по близости к значению (нижней грани) задачи. Понятие МПР-образующего алгоритма в совокупности с двойственным подходом позволяет получать регуляризованные КУО при очень общих предположениях об исходных данных задачи. Одновременно оно естественным образом “встраивается” в их формулировки. Используемое в статье понятие регуляризирующего алгоритма (определение 3.2) можно квалифицировать как занимающее промежуточное положение между применяемыми в [6, гл. 9] понятиями регуляризирующих алгоритмов первого типа (сходимость нижних граней, см. определение 1 [6, гл. 9, § 2, с. 802]) и второго типа (сходимость по аргументу, см. определение 1 [6, гл. 9, § 6, с. 837, 838]). Такое понятие регуляризирующего алгоритма позволяет конструировать соответствующие ему конкретные реализации путем естественной трансформации КУО при минимальных, на наш взгляд, дополнительных предположениях о задаче. Последнее связано с тем, что применяемый в работе подход к получению регуляризованных КУО (основанный на двойственности) не использует в своих конструкциях ни штрафные функции, ни расширение допустимого множества, ни стабилизацию исходной задачи. Отметим однако, что в отличие от регуляризирующих алгоритмов второго типа, применяемых в [6, гл. 9], предлагаемые нами конкретные реализации регуляризирующих алгоритмов сами по себе не гарантируют сильной сходимости приближенных решений к точному. Здесь тип сходимости (сильная, слабая) приближенных решений, т.е. элементов, составляющих МПР, к точному решению определяется дополнительными свойствами рассматриваемой оптимизационной задачи. Так, в условиях данной работы, ввиду сильной выпуклости функционала цели, в случае его субдифференцируемости можно говорить о сильной сходимости элементов МПР к точному решению задачи.
Ранее различные варианты регуляризованных КУО для задач оптимизации распределенных систем в случае параболических уравнений рассматривались в ряде наших работ (см., например, работу [8], а также библиографию в ней). В данной работе результаты регуляризации КУО представляются сразу для широкого класса распределенных систем, описываемых, как сказано выше, линейными функциональными уравнениями второго рода общего вида в пространствах типа ${{L}_{2}}$ при весьма общих условиях на правые части уравнений (предполагается лишь квазинильпотентность основного оператора правой части уравнения). В этом состоит принципиальное отличие ее результатов от результатов упомянутых работ: применяемый здесь подход позволяет единообразно получить регуляризованные КУО для обширного класса оптимизационных задач, существенно отличающихся от рассмотренных ранее в наших работах по регуляризации КУО в задачах оптимизации распределенных систем.
Работа состоит из введения и четырех основных разделов. Первый из них посвящен постановке задачи оптимального управления системой вольтеррова типа, описываемой линейным функционально-операторным уравнением II рода общего вида в пространстве $L_{2}^{m}$, с функциональными ограничениями. Здесь, в частности, вводятся необходимые далее понятия точной и приближенной оптимизационных задач, определения МПР и МПР-образующего алгоритма. Во втором разделе исходная задача оптимального управления переписывается в терминах эквивалентной задачи выпуклого программирования с сильно выпуклым целевым функционалом. Для этой вспомогательной задачи на основе результатов работ [7], [28] формулируется и доказывается соответствующий регуляризованный ПЛ. Третий раздел посвящен расшифровке результатов второго раздела в терминах исходной задачи оптимального управления, поставленной в первом разделе. Здесь в терминах исходной задачи последовательно формулируются теорема сходимости метода двойственной регуляризации, регуляризованный ПЛ и, в качестве следствия последнего, регуляризованный ПМП. Наконец, в последнем, четвертом разделе, в качестве приложения общих результатов третьего раздела рассматриваются два примера конкретных задач оптимального управления, связанных с системой дифференциальных уравнений с запаздыванием и с интегро-дифференциальным уравнением типа уравнения переноса.
Примем следующие обозначения и соглашения: ${{{\mathbf{R}}}^{n}}$ – пространство $n$-векторов-столбцов; $\mathop {\left\langle { \cdot , \cdot } \right\rangle }\nolimits_n $ и $\mathop {\left\| {\, \cdot \,} \right\|}\nolimits_n $ – евклидовы скалярное произведение и норма в ${{{\mathbf{R}}}^{n}}$; векторы, если не оговорено противное, считаются столбцами; * – знак сопряжения и транспонирования; $\Pi \subset {{{\mathbf{R}}}^{n}}$ – ограниченное и измеримое по Лебегу множество, играющее роль основного множества изменения независимых переменных, элементы которого обозначаем через $t \equiv \{ {{t}^{1}},...,{{t}^{n}}\} $; ${{L}_{p}}(\Pi )$ – лебегово пространство со стандартной нормой ($1 \leqslant p \leqslant \infty $); $L_{p}^{m} \equiv L_{p}^{m}(\Pi ) \equiv {{({{L}_{p}}(\Pi ))}^{m}}$ ($1 \leqslant p \leqslant \infty $); $\mathop {\left\| {\, \cdot \,} \right\|}\nolimits_{p,m} $ – стандартная норма прямого произведения в $L_{p}^{m}$; $\mathop {\left\langle { \cdot , \cdot } \right\rangle }\nolimits_{2,m} $ – стандартное скалярное произведение в $L_{2}^{m}$; $L_{p}^{{m \times l}} \equiv L_{p}^{{m \times l}}(\Pi )$ – пространство $(m \times l)$-матриц-функций с элементами из ${{L}_{p}}(\Pi )$; $\mathop {\left\| {\, \cdot \,} \right\|}\nolimits_{p,m \times l} $ – стандартная норма прямого произведения в $L_{p}^{{m \times l}}$.
2. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
2.1. Базовая оптимизационная задача
Пусть заданы: натуральные числа $m,n,s$; $\Pi \subset {{{\mathbf{R}}}^{n}}$ – ограниченное и измеримое по Лебегу множество; $c(t),\;t \in \Pi ,$ – функция класса $L_{2}^{m} \equiv L_{2}^{m}(\Pi )$; $A:L_{2}^{m} \to L_{2}^{m}$ – линейный ограниченный оператор (ЛОО) с нулевым спектральным радиусом; ЛОО $B:L_{2}^{s} \to L_{2}^{m}$. Рассмотрим линейное функциональное уравнение II рода
(2.1)
$z(t) = A[z](t) + B[u](t) + c(t),\quad t \in \Pi ,\quad z \in L_{2}^{m},\quad u \in L_{2}^{s},$Чтобы поставить для управляемой системы (2.1) задачу оптимального управления, будем считать, что на прямом произведении $L_{2}^{m} \times L_{2}^{s}$ определены некоторые функционалы ${{\mathcal{J}}_{0}},{{\mathcal{J}}_{1}},...,{{\mathcal{J}}_{k}}$, ${{\mathcal{I}}_{1}},...,{{\mathcal{I}}_{r}}$ со свойствами: ${{\mathcal{J}}_{0}}[z,u] \equiv K[z] + M[u]$, $z \in L_{2}^{m}$, $u \in L_{2}^{s}$, где $K:L_{2}^{m} \to {\mathbf{R}}$ – выпуклый функционал, а $M:L_{2}^{s} \to {\mathbf{R}}$ – сильно выпуклый функционал с постоянной сильной выпуклости $\kappa $; ${{\mathcal{J}}_{i}}[z,u]:L_{2}^{m} \times L_{2}^{s} \to {\mathbf{R}}$ – выпуклый функционал ($i = 1,...,k$); ${{\mathcal{I}}_{i}}[z,u]:L_{2}^{m} \times L_{2}^{s} \to {\mathbf{R}}$ – линейный ограниченный функционал, задаваемый формулой ${{\mathcal{I}}_{i}}[z,u] \equiv \mathop {\left\langle {{{a}_{i}},z} \right\rangle }\nolimits_{2,m} + \mathop {\left\langle {{{b}_{i}},u} \right\rangle }\nolimits_{2,s} $, где ${{a}_{i}} \in L_{2}^{m}$, ${{b}_{i}} \in L_{2}^{s}$ ($i = 1,...,r$).
Используя (2.2) как формулу подстановки, зададим на $L_{2}^{s}$ функционалы: ${{J}_{0}}[u] \equiv {{\mathcal{J}}_{0}}[{{z}_{u}},u] \equiv K[{{z}_{u}}] + M[u]$, ${{J}_{i}}[u] \equiv {{\mathcal{J}}_{i}}[{{z}_{u}},u](i = 1,...,k)$, ${{I}_{i}}[u] \equiv {{\mathcal{I}}_{i}}[{{z}_{u}},u](i = 1,...,r)$, $u({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{s}.$ Функционал ${{J}_{0}}[{\kern 1pt} .{\kern 1pt} ]$ сильно выпуклый, функционалы ${{J}_{i}}[{\kern 1pt} .{\kern 1pt} ](i = 1,...,k)$ выпуклые, а функционалы ${{I}_{i}}[{\kern 1pt} .{\kern 1pt} ](i = 1,...,r)$ аффинные на $L_{2}^{s}.$ Пусть $\mathcal{D}$ – выпуклое ограниченное и замкнутое множество пространства $L_{2}^{s}$, ${{d}_{1}},...,{{d}_{r}}$ – некоторые числа. Рассмотрим задачу оптимального управления системой (2.1) c минимизируемым целевым функционалом ${{J}_{0}}[u]$ при функциональных ограничениях
(2.3)
${{J}_{1}}[u] \leqslant 0,...,{{J}_{k}}[u] \leqslant 0,\quad {{I}_{1}}[u] = {{d}_{1}},...,{{I}_{r}}[u] = {{d}_{r}}$2.2. Точная и приближенная оптимизационные задачи
Задача (2.4) полностью определяется набором своих исходных данных
Предполагаем, что выполняется
Условие А. Функционалы ${{K}^{\delta }},\;{{M}^{\delta }}$ и каждый из функционалов $\mathcal{J}_{i}^{\delta }$$(i = 1,...,k),$ $\delta \in [0,{{\delta }_{0}}]$, суть липшицевы на каждом ограниченном множестве пространств $L_{2}^{m},$ $L_{2}^{s}$ и $L_{2}^{m} \times L_{2}^{s}$ соответственно, причем липшицевость равномерна по параметру $\delta \in [0,{{\delta }_{0}}]$, т.е. соответствующие постоянные Липшица не зависят от $\delta \in [0,{{\delta }_{0}}]$.
Считаем, что входные данные оптимизационных задач семейства ($O{{C}^{\delta }}$), $\delta \in (0,{{\delta }_{0}}]$, связаны с входными данными точной задачи ($O{{C}^{0}}$) следующим образом.
Условие Б. Существует постоянная $C > 0$ такая, что при любом $\delta \in (0,{{\delta }_{0}}]$ имеем
(2.5)
$\begin{gathered} \left\| {{{A}^{\delta }} - {{A}^{0}}} \right\| \leqslant C\delta ,\quad \left\| {{{B}^{\delta }} - {{B}^{0}}} \right\| \leqslant C\delta ,\quad {{\left\| {{{c}^{\delta }} - {{c}^{0}}} \right\|}_{{2,m}}} \leqslant C\delta ,\quad {{\left\| {a_{i}^{\delta } - a_{i}^{0}} \right\|}_{{2,m}}} \leqslant C\delta \quad (i = 1,...,r), \\ {{\left\| {b_{i}^{\delta } - b_{i}^{0}} \right\|}_{{2,s}}} \leqslant C\delta \quad (i = 1,...,r),\quad \left| {d_{i}^{\delta } - d_{i}^{0}} \right| \leqslant C\delta \quad (i = 1,...,r),\quad \left| {{{M}^{\delta }}[u] - {{M}^{0}}[u]} \right| \leqslant C\delta \quad (u \in \mathcal{D}). \\ \end{gathered} $Условие В. Существует неубывающая функция ${{N}_{1}}({\kern 1pt} .{\kern 1pt} ):{{{\mathbf{R}}}_{ + }} \to {{{\mathbf{R}}}_{ + }}$ такая, что для каждого $l > 0$ и любого $\delta \in (0,{{\delta }_{0}}]$ при $\mathop {\left\| {z({\kern 1pt} .{\kern 1pt} )} \right\|}\nolimits_{2,m} \leqslant l$, $u({\kern 1pt} .{\kern 1pt} ) \in \mathcal{D}$ выполняются неравенства
(2.6)
$\left| {{{K}^{\delta }}[z] - {{K}^{0}}[z]} \right| \leqslant {{N}_{1}}(l)\delta ,\quad \left| {\mathcal{J}_{i}^{\delta }[z,u] - \mathcal{J}_{i}^{0}[z,u]} \right| \leqslant {{N}_{1}}(l)\delta \quad (i = 1,...,k).$При любом $\delta \in [0,{{\delta }_{0}}]$ управляемое функциональное уравнение
(2.7)
$z(t) = {{A}^{\delta }}[z](t) + {{B}^{\delta }}[u](t) + {{c}^{\delta }}(t),\quad t \in \Pi ,\quad z \in L_{2}^{m},\quad u \in L_{2}^{s},$(2.8)
$z(t) = {{S}^{\delta }}[{{B}^{\delta }}[u] + {{c}^{\delta }}](t),\quad t \in \Pi ,\quad u({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{s},$Кроме того, при любом $\delta \in [0,{{\delta }_{0}}]$ мы имеем набор функциональных ограничений
(2.9)
$J_{1}^{\delta }[u] \leqslant 0,...,J_{k}^{\delta }[u] \leqslant 0,\quad I_{1}^{\delta }[u] = d_{1}^{\delta },...,I_{r}^{\delta }[u] = d_{r}^{\delta },$(2.10)
$J_{i}^{\delta }[u] \equiv \mathcal{J}_{i}^{\delta }[z_{u}^{\delta },u]\quad (i = 1,...,k),\quad I_{i}^{\delta }[u] \equiv \mathcal{I}_{i}^{\delta }[z_{u}^{\delta },u]\quad (i = 1,...,r),\quad u({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{s},$2.3. МПР и МПР-образующий оператор
Для компактности записи введем следующие обозначения: ${{J}^{\delta }}[u] \equiv \left\{ {J_{1}^{\delta }[u],...,J_{k}^{\delta }[u]} \right\}$, ${{I}^{\delta }}[u] \equiv \left\{ {I_{1}^{\delta }[u],...,I_{r}^{\delta }[u]} \right\}$, ${{d}^{\delta }} \equiv \{ d_{1}^{\delta },...,d_{r}^{\delta }\} $. Положим
Определим обобщенную нижнюю грань $\beta $ задачи ($O{{C}^{0}}$) как предел $\beta \equiv {{\beta }_{{ + 0}}} \equiv \mathop {lim}\limits_{\epsilon \to + 0} {{\beta }_{\epsilon }}$, где ${{\beta }_{\epsilon }} \equiv \mathop {inf}\limits_{u \in {{\mathcal{D}}^{{0,\epsilon }}}} J_{0}^{0}[u]$, если ${{\mathcal{D}}^{{0,\epsilon }}} \ne \not {0}$, и ${{\beta }_{\epsilon }} \equiv + \infty $, если ${{\mathcal{D}}^{{0,\epsilon }}} = \not {0}$. Вообще говоря, имеет место очевидное неравенство $\beta \leqslant {{\beta }_{0}}$, где ${{\beta }_{0}} \equiv \mathop {inf}\limits_{u \in {{\mathcal{D}}^{0}}} J_{0}^{0}[u]$ – классическая нижняя грань задачи ($O{{C}^{0}}$). Однако специфика этой задачи такова, что $\beta = {{\beta }_{0}}$, причем обе грани достигаются на ее единственном оптимальном элементе ${{u}^{0}}$ в случае его существования.
Как уже было сказано выше, центральным для нас является понятие МПР в задаче ($O{{C}^{0}}$). Напомним, что последовательность ${{u}^{k}}({\kern 1pt} .{\kern 1pt} ) \in \mathcal{D}$, $k = 1,2, \ldots $, называется МПР задачи ($O{{C}^{0}}$), если $J_{0}^{0}[{{u}^{k}}] \to \beta $ при $k \to \infty $, причем ${{u}^{k}}({\kern 1pt} .{\kern 1pt} ) \in {{\mathcal{D}}^{{0,{{\epsilon }^{k}}}}}$ для некоторой сходящейся к нулю последовательности положительных чисел ${{\epsilon }^{k}},k = 1,2, \ldots $.
Введем, наконец, другое центральное понятие работы, а именно, понятие МПР-образующего оператора (алгоритма) [28] в задаче ($O{{C}^{0}}$).
Определение 2.1. Пусть ${{\delta }^{k}} \in (0,{{\delta }_{0}})$, $k = 1,2, \ldots $, – сходящаяся к нулю последовательность положительных чисел. Зависящий от ${{\delta }^{k}},k = 1,2, \ldots $, оператор $R( \cdot ,{{\delta }^{k}})$, ставящий в соответствие каждому набору исходных данных ${{{\text{f}}}^{{{{\delta }^{k}}}}}$, удовлетворяющих оценкам (2.5), (2.6) при $\delta = {{\delta }^{k}}$, элемент $R({{{\text{f}}}^{{{{\delta }^{k}}}}},{{\delta }^{k}}) \equiv {{u}^{{{{\delta }^{k}}}}} \in \mathcal{D}$, называется МПР-образующим в задаче ($O{{C}^{0}}$), если последовательность ${{u}^{{{{\delta }^{k}}}}},k = 1,2, \ldots $, есть МПР в этой задаче.
3. ЭКВИВАЛЕНТНАЯ ЗАДАЧА ВЫПУКЛОГО ПРОГРАММИРОВАНИЯ И РЕГУЛЯРИЗАЦИЯ ПРИНЦИПА ЛАГРАНЖА
3.1. Задача выпуклого программирования
Задача оптимального управления ($O{{C}^{\delta }}$) при любом $\delta \in [0,{{\delta }_{0}}]$ имеет форму задачи выпуклого программирования в пространстве $L_{2}^{s}.$ Мы перепишем ее в несколько ином виде, позволяющем напрямую воспользоваться результатами работ [7], [28], посвященных регуляризации КУО в задачах выпуклого программирования и выпуклого оптимального управления в гильбертовом пространстве. Для этого выделим в аффинных функционалах $I_{j}^{\delta }[{\kern 1pt} .{\kern 1pt} ]$, $j = 1, \ldots ,r$, линейную часть. Именно, определим функционалы
(Pδ)
${\mathbf{J}}_{0}^{\delta }[u] \to {\text{min}},\quad {\mathbf{J}}_{i}^{\delta }[u] \leqslant 0\quad (i = 1,...,k),\quad {\mathbf{I}}_{j}^{\delta }[u] = e_{j}^{\delta }\quad (j = 1,...,r),\quad u \in \mathcal{D},$Условие А влечет за собой следующее равномерное по $\delta \in [0,{{\delta }_{0}}]$ свойство липшицевости функционалов ${\mathbf{J}}_{i}^{\delta }(i = 0,1,...,k)$ на любом ограниченном множестве пространства $L_{2}^{s}$: существует неубывающая функция ${{{\mathbf{N}}}_{2}}({\kern 1pt} .{\kern 1pt} ):{{{\mathbf{R}}}_{ + }} \to {{{\mathbf{R}}}_{ + }}$ такая, что при каждом $\delta \in [0,{{\delta }_{0}}]$ для любого $l > 0$ имеем
Из условий Б и В, связывающих входные данные задачи оптимального управления ($O{{C}^{0}}$) с входными данными задач ($O{{C}^{\delta }}$) при $\delta \in (0,{{\delta }_{0}}]$, получаем следующую связь входных данных задачи выпуклого программирования (${{P}^{0}}$) с входными данными задач (Pδ) при $\delta \in (0,{{\delta }_{0}}]$.
Лемма 3.1. Существует постоянная $\Gamma $, зависящая лишь от операторов ${{A}^{0}}$, ${{B}^{0}}$, функционалов ${{K}^{0}},\mathcal{J}_{i}^{0}$ $(i = 1,...,k)$, функций ${{c}^{0}},\;a_{i}^{0}$ $(i = 1,...,r)$, $b_{i}^{0}$ $(i = 1,...,r)$, ${{N}_{1}}$, чисел $C,\;{{\delta }_{0}}$ и множества $\mathcal{D}$, такая, что для каждого $\delta \in (0,{{\delta }_{0}}]$ выполняются неравенства
(3.1)
$\begin{gathered} \left| {{\mathbf{J}}_{i}^{\delta }[u] - {\mathbf{J}}_{i}^{0}[u]} \right| \leqslant \Gamma \delta ,\quad u \in \mathcal{D}\quad (i = 0,1,...,k); \\ \left| {{\mathbf{I}}_{i}^{\delta }[u] - {\mathbf{I}}_{i}^{0}[u]} \right| \leqslant \Gamma \delta \mathop {\left\| u \right\|}\nolimits_{2,s} ,\quad u \in L_{2}^{s}\quad (i = 1,...,r);\quad \left| {e_{i}^{\delta } - e_{i}^{0}} \right| \leqslant \Gamma \delta \quad (i = 1,...,r). \\ \end{gathered} $3.2. МПР и МПР-образующий оператор в задаче выпуклого программирования
Положим: ${{{\mathbf{J}}}^{\delta }}[u] \equiv \left\{ {{\mathbf{J}}_{1}^{\delta }[u],...,{\mathbf{J}}_{k}^{\delta }[u]} \right\}$, ${{{\mathbf{I}}}^{\delta }}[u] \equiv \left\{ {{\mathbf{I}}_{1}^{\delta }[u],...,{\mathbf{I}}_{r}^{\delta }[u]} \right\}$, ${{e}^{\delta }} \equiv \{ e_{1}^{\delta },...,e_{r}^{\delta }\} $. Имеем
Определение 3.1. Последовательность $\{ {{u}^{j}}\} _{{j = 1}}^{\infty }$ элементов множества $\mathcal{D}$, для которой существует такая стремящаяся к нулю последовательность положительных чисел $\{ {{\epsilon }^{j}}\} _{{j = 1}}^{\infty }$, что ${{u}^{j}} \in {{\mathcal{D}}^{{0,{{\epsilon }^{j}}}}}$ $(j = 1,2,...)$ и ${\mathbf{J}}_{0}^{0}[{{u}^{j}}] \to \beta = \mathop {inf}\limits_{u \in {{\mathcal{D}}^{0}}} {\mathbf{J}}_{0}^{0}[u]$ при $j \to \infty $, называется минимизирующим приближенным решением (МПР) задачи (${{P}^{0}}$).
Лемма 3.2. В силу ограниченности $\mathcal{D}$ существование МПР в задаче (${{P}^{0}}$) равносильно неравенству $\beta < + \infty $. Если $\beta < + \infty $ и сильно выпуклый функционал ${\mathbf{J}}_{0}^{0}$ является субдифференцируемым $($в смысле выпуклого анализа$)$ в точках $\mathcal{D}$, то для любого МПР ${{u}^{k}},k = 1,2, \ldots $, в разрешимой единственным образом в этом случае задаче (${{P}^{0}}$) справедливо предельное соотношение ${{u}^{k}} \to {{u}^{0}}$, $k \to \infty $.
Доказательство. Во-первых, можно заметить, что, так как $\beta < + \infty $, а функционал ${\mathbf{J}}_{0}^{0}$ непрерывный и сильно выпуклый, то последовательность ${{u}^{k}},k = 1,2, \ldots $, о которой идет речь в лемме, является ограниченной. Во-вторых, благодаря единственности решения ${{u}^{0}}$ и слабой полунепрерывности снизу функционалов ${\mathbf{J}}_{0}^{0}[u]$, ${\mathbf{J}}_{i}^{0}[u]\;(i = 1, \ldots ,k)$, ${\mathbf{I}}_{i}^{0}[u]\;(i = 1, \ldots ,r)$, $u \in \mathcal{D}$, получаем, что элементы ${{u}^{k}}$ при $k \to \infty $ сходятся слабо к решению ${{u}^{0}}$ задачи (${{P}^{0}}$). И, наконец, в-третьих, так как одновременно ${\mathbf{J}}_{0}^{0}[{{u}^{k}}] \to {\mathbf{J}}_{0}^{0}[{{u}^{0}}]$ при $k \to \infty $, то в случае субдифференцируемости ${\mathbf{J}}_{0}^{0}$ в точках $\mathcal{D}$ получаем сильную сходимость ${{u}^{k}}$ к ${{u}^{0}}$ при $k \to \infty $.
Введем для задачи (${{P}^{0}}$) согласованное с понятием МПР понятие регуляризирующего оператора [28]. Набором исходных данных задачи (${{P}^{\delta }}$) является набор ${{{{\hat {f}}}}^{\delta }} \equiv \{ {\mathbf{J}}_{0}^{\delta },{{{\mathbf{J}}}^{\delta }},{{{\mathbf{I}}}^{\delta }},{{e}^{\delta }}\} $ .
Определение 3.2. Зависящий от $\delta \in (0,{{\delta }_{0}})$ оператор $R( \cdot , \cdot , \cdot , \cdot ,\delta )$, ставящий в соответствие каждому набору исходных данных $\{ {\mathbf{J}}_{0}^{\delta },{{{\mathbf{J}}}^{\delta }},{{{\mathbf{I}}}^{\delta }},{{e}^{\delta }}\} $, удовлетворяющих условиям (3.1), элемент $R({\mathbf{J}}_{0}^{\delta },{{{\mathbf{J}}}^{\delta }},{{{\mathbf{I}}}^{\delta }},{{e}^{\delta }},\delta ) = {{u}^{\delta }} \in \mathcal{D}$, называется регуляризирующим в задаче (${{P}^{0}}$), если ${{u}^{\delta }} \in {{\mathcal{D}}^{{0,\epsilon (\delta )}}}$ при $\delta \in (0,{{\delta }_{0}})$, ${\mathbf{J}}_{0}^{0}[{{u}^{\delta }}] \to \beta $, $\epsilon (\delta ) \to 0$ при $\delta \to 0$.
Введем понятие МПР-образующего оператора в задаче (${{P}^{0}}$) как задаче выпуклого программирования.
Определение 3.3. Пусть ${{\delta }^{k}} \in (0,{{\delta }_{0}})$, $k = 1,2, \ldots $, – сходящаяся к нулю последовательность положительных чисел. Зависящий от ${{\delta }^{k}},\;k = 1,2, \ldots $, оператор $R( \cdot , \cdot , \cdot , \cdot ,{{\delta }^{k}})$, ставящий в соответствие каждому набору исходных данных $\{ {\mathbf{J}}_{0}^{{{{\delta }^{k}}}},{{{\mathbf{J}}}^{{{{\delta }^{k}}}}},{{{\mathbf{I}}}^{{{{\delta }^{k}}}}},{{e}^{{{{\delta }^{k}}}}}\} $, удовлетворяющих условиям (3.1) при $\delta = {{\delta }^{k}}$, элемент $R({\mathbf{J}}_{0}^{{{{\delta }^{k}}}},{{{\mathbf{J}}}^{{{{\delta }^{k}}}}},{{{\mathbf{I}}}^{{{{\delta }^{k}}}}},{{e}^{{{{\delta }^{k}}}}},{{\delta }^{k}}) = {{u}^{{{{\delta }^{k}}}}} \in \mathcal{D}$, называется МПР-образующим в задаче (${{P}^{0}}$), если последовательность ${{u}^{{{{\delta }^{k}}}}},\;k = 1,2, \ldots $, есть МПР в этой задаче.
3.3. Двойственная задача
Определим двойственную задачу к задаче выпуклого программирования (${{P}^{\delta }}$). Введем с этой целью регулярную функцию Лагранжа задачи (${{P}^{\delta }}$)
(3.2)
${{L}^{\delta }}(u,\lambda ,\mu ) \equiv {\mathbf{J}}_{0}^{\delta }[u] + \mathop {\left\langle {\lambda ,{{{\mathbf{I}}}^{\delta }}[u] - {{e}^{\delta }}} \right\rangle }\nolimits_r + \mathop {\left\langle {\mu ,{{{\mathbf{J}}}^{\delta }}[u]} \right\rangle }\nolimits_k ,$(3.3)
${{V}^{\delta }}(\lambda ,\mu ) \equiv \mathop {min}\limits_{u \in \mathcal{D}} {{L}^{\delta }}(u,\lambda ,\mu ) \to sup,\quad \lambda \in {{{\mathbf{R}}}^{r}},\quad \mu \in {\mathbf{R}}_{ + }^{k}.$Лемма 3.3. Ввиду ограниченности $\mathcal{D}$ справедлива оценка
(3.4)
$\left| {{{V}^{\delta }}(\lambda ,\mu ) - {{V}^{0}}(\lambda ,\mu )} \right| \leqslant {\mathbf{K}}\delta \left( {1 + {{{\left\| \lambda \right\|}}_{k}} + {{{\left\| \mu \right\|}}_{r}}} \right),$Доказательство этой леммы проводится так же, как и доказательство оценки (2.32) в [28].
3.4. Двойственная регуляризация
Обозначим через $({{\lambda }^{{\delta ,\alpha }}},{{\mu }^{{\delta ,\alpha }}})$ единственную точку, дающую на ${{{\mathbf{R}}}^{r}} \times {\mathbf{R}}_{ + }^{k}$ максимум сильно вогнутому функционалу
В задаче (${{P}^{\delta }}$) выполняются все условия, при которых к ней может быть применена теорема сходимости метода двойственной регуляризации работ [7], [28] (это теорема 3.1 в [7] и теорема 1 в [28]), опирающиеся на предложенный ранее в наших работах (см. данный журнал за 2007 г.) и основанный на теории двойственности подход к регуляризации в задачах условной оптимизации. Задача (${{P}^{\delta }}$) является частным случаем задачи (${{P}^{\delta }}$) этих работ: набор исходных данных $\{ {\mathbf{J}}_{0}^{\delta },{{{\mathbf{J}}}^{\delta }},{{{\mathbf{I}}}^{\delta }},{{e}^{\delta }}\} $ данной работы соответствует набору исходных данных $\{ {{f}^{\delta }},{{g}^{\delta }},{{A}^{\delta }},{{h}^{\delta }}\} $ в [7], [28].
Применяя теорему 3.1 из [7] или, что одно и то же, теорему 1 разд. 2.1 из [28], сформулируем в случае задачи (${{P}^{\delta }}$) теорему сходимости метода двойственной регуляризации. Введем с этой целью соответствующие обозначения. Пусть задача (${{P}^{0}}$) имеет решение ${{u}^{0}}$. Положим
Замечание 3.1. Во-первых, заметим, что теорема 1 в [28] представляет собой уточнение теоремы 3.1 в [7] (см. замечание 3 в разд. 2.1 в [28], а также замечание 3.3 ниже). Во-вторых, для удобства читателя укажем на соответствие обозначений данной работы и работ [7], [28]. Постоянная $\Gamma $ соответствует постоянной $C$ из разд. 3.1 в [7] и из разд. 2 в [28], постоянная ${{{\mathbf{C}}}_{1}}$ соответствует постоянной ${{C}_{1}}$, определенной в формуле (3.15) в [7] и после формулы (2.8) в [28], постоянная ${{{\mathbf{C}}}_{2}}$ соответствует постоянной ${{C}_{2}}$, определенной в формулах (3.16), (3.18) в [7] и после формулы (2.8) в [28]. Величина $\psi (\delta )$ определена в формуле (3.23) в [7] и в равенстве (2.5) в [28], величина $K(\delta )$ соответствует величине $K(\delta )$, определенной в неравенстве (3.16) в [7] и в неравенстве (2.8) в [28], величина $\phi (\delta ,\alpha (\delta ))$ определена в формуле (3.18) в [7] и равенством (2.13) в [28].
Теорема 3.1. Сходимость алгоритма двойственной регуляризации в задаче (${{P}^{0}}$). Пусть задача (${{P}^{0}}$) имеет решение ${{u}^{0}}$. Если выполняется условие согласования (3.5), то (вне зависимости от того, разрешима или нет двойственная к (${{P}^{0}}$) задача (задача (3.3) при $\delta = 0$)) имеют место предельные соотношения
(3.6)
$\alpha (\delta ){{\left\| {{{\lambda }^{{\delta ,\alpha (\delta )}}}} \right\|}_{r}} \to 0,\quad \alpha (\delta ){{\left\| {{{\mu }^{{\delta ,\alpha (\delta )}}}} \right\|}_{k}} \to 0,\quad \delta \to 0,$(3.7)
${{\left\langle {{{\lambda }^{{\delta ,\alpha (\delta )}}},{{{\mathbf{I}}}^{\delta }}\left[ {{{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]} \right] - {{e}^{\delta }}} \right\rangle }_{r}} + {{\left\langle {{{\mu }^{{\delta ,\alpha (\delta )}}},{{{\mathbf{J}}}^{\delta }}\left[ {{{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]} \right]} \right\rangle }_{k}} \to 0,\quad \delta \to 0,$(3.8)
${\mathbf{J}}_{0}^{0}\left[ {{{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]} \right] \leqslant {\mathbf{J}}_{0}^{0}[{{u}^{0}}] + {{\Psi }_{1}}(\delta ),\quad \delta \in (0,{{\delta }_{0}}],$(3.9)
${{\left\| {{{{\mathbf{I}}}^{0}}\left[ {{{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]} \right] - {{e}^{0}}} \right\|}_{r}} \leqslant {{\Psi }_{2}}(\delta ),\quad \delta \in (0,{{\delta }_{0}}],$(3.10)
${\mathbf{J}}_{i}^{0}\left[ {{{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]} \right] \leqslant {{\Psi }_{3}}(\delta ),\quad (i = 1,...,k),\quad \delta \in (0,{{\delta }_{0}}].$Если же сильно выпуклый функционал ${\mathbf{J}}_{0}^{0}$ субдифференцируем (в смысле выпуклого анализа) в точках множества $\mathcal{D}$, то имеем
(3.11)
${{\left\| {{{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}] - {{u}^{0}}} \right\|}_{{2,s}}} \to 0\quad при\quad \delta \to 0.$Другими словами, вне зависимости от того, разрешима или нет двойственная к (${{P}^{0}}$) задача, алгоритм $R( \cdot ,\delta )$, задаваемый равенством $R({\mathbf{J}}_{0}^{\delta },{{{\mathbf{J}}}^{\delta }},{{{\mathbf{I}}}^{\delta }},{{e}^{\delta }},\delta ) = $ ${{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]$ для каждого набора исходных данных $\{ {\mathbf{J}}_{0}^{\delta },{{{\mathbf{J}}}^{\delta }},{{{\mathbf{I}}}^{\delta }},{{e}^{\delta }}\} $, удовлетворяющих оценкам (3.1) леммы 3.1, является регуляризирующим в смысле определения 3.2, причем в случае субдифференцируемости ${\mathbf{J}}_{0}^{0}$ в точках $\mathcal{D}$ имеет место и сильная сходимость (3.11). Если же такой субдифференцируемости нет, то, строго говоря, можно гарантировать лишь слабую сходимость ${{u}^{\delta }}[{{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}]$ к ${{u}^{0}}$ при $\delta \to 0$.
Замечание 3.2. Заметим, во-первых, что предельные соотношения (3.6) являются следствием первого предельного соотношения теоремы 3.1 в [7] и одновременно являются следствием оценки (2.14) в [28]. В обозначениях данной работы эта оценка имеет вид
(3.12)
$\alpha (\delta )\sqrt {\left\| {{{\lambda }^{{\delta ,\alpha (\delta )}}}} \right\|_{k}^{2} + \left\| {{{\mu }^{{\delta ,\alpha (\delta )}}}} \right\|_{r}^{2}} \leqslant {{{\mathbf{C}}}_{2}}\delta + \sqrt {{\mathbf{C}}_{2}^{2}{{\delta }^{2}} - 8\alpha (\delta )\left( {K - {\mathbf{J}}_{0}^{0}({{u}^{0}}) - \Gamma \delta \left( {1 + \left\| {{{u}^{0}}} \right\|_{{2,s}}^{2}} \right)} \right)} ,$Замечание 3.3. В формулировке теоремы 3.1 в [7] были, к сожалению, пропущены полученные при ее доказательстве некоторые слагаемые: слагаемое $\psi (\delta )$ (см. неравенства (3.23), (3.26) в [7]) – в выражении для ${{\psi }_{1}}(\delta )$ в формуле, соответствующей (3.8); слагаемое $C\delta (2 + L)$ – в правой части неравенства, соответствующего (3.9); слагаемое $C\delta (1 + {{L}^{2}})$ – в правой части неравенства, соответствующего (3.10). В формулировке теоремы 1 в [28], а также в приводимой здесь формулировке все указанные слагаемые восстановлены.
3.5. Регуляризованный принцип Лагранжа
Сформулируем и докажем регуляризованный принцип Лагранжа в задаче (${{P}^{0}}$).
Теорема 3.2. Регуляризованный принцип Лагранжа для задачи (${{P}^{0}}$). МПР в задаче (${{P}^{0}}$) существует тогда и только тогда, когда существуют стремящиеся к нулю последовательности положительных чисел $\{ {{\delta }^{j}}\} _{{j = 1}}^{\infty }$, $\{ {{\gamma }^{j}}\} _{{j = 1}}^{\infty }$ и последовательность пар векторов двойственных переменных $\{ {{\lambda }^{j}},{{\mu }^{j}}\} _{{j = 1}}^{\infty } \subset {{{\mathbf{R}}}^{r}} \times {\mathbf{R}}_{ + }^{k}$ такие, что
(3.13)
${{\delta }^{j}}{{\left\| {\{ {{\lambda }^{j}},{{\mu }^{j}}\} } \right\|}_{{k + r}}} \to 0\quad при\quad j \to \infty $(3.14)
${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}] \in {{\mathcal{D}}^{{{{\delta }^{j}},{{\gamma }^{j}}}}}\quad (j = 1,2,...),$(3.15)
${{\left\langle {{{\lambda }^{j}},{{{\mathbf{I}}}^{{{{\delta }^{j}}}}}\left[ {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]} \right] - {{e}^{{{{\delta }^{j}}}}}} \right\rangle }_{r}} + {{\left\langle {{{\mu }^{j}},{{{\mathbf{J}}}^{{{{\delta }^{j}}}}}\left[ {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]} \right]} \right\rangle }_{k}} \to 0\quad при\quad j \to \infty .$Если указанные последовательности $\{ {{\delta }^{j}}\} _{{j = 1}}^{\infty }$, $\{ {{\gamma }^{j}}\} _{{j = 1}}^{\infty }$ и $\{ {{\lambda }^{j}},{{\mu }^{j}}\} _{{j = 1}}^{\infty }$ существуют, то последовательность ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$, $j = 1,2, \ldots $, является МПР задачи (${{P}^{0}}$), т.е. помимо (3.14) выполняется и предельное соотношение
(3.16)
${\mathbf{J}}_{0}^{0}\left[ {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]} \right] \to {\mathbf{J}}_{0}^{0}[{{u}^{0}}]\quad при\quad j \to \infty .$Как следствие соотношений (3.13)–(3.15), выполняется и предельное соотношение
(3.17)
${{V}^{0}}({{\lambda }^{j}},{{\mu }^{j}}) \to \mathop {sup}\limits_{\left\{ {\lambda ,\mu } \right\} \in {{{\mathbf{R}}}^{r}} \times {\mathbf{R}}_{ + }^{k}} {{V}^{0}}(\lambda ,\mu ) = {\mathbf{J}}_{0}^{0}[{{u}^{0}}]\quad при\quad j \to \infty .$В случае субдифференцируемости ${\mathbf{J}}_{0}^{0}$ на $\mathcal{D}$ имеет место и предельное соотношение
(3.18)
${{\left\| {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}] - {{u}^{0}}} \right\|}_{{2,s}}} \to 0\quad при\quad j \to \infty .$Другими словами, вне зависимости от того, разрешима или нет двойственная к (${{P}^{0}}$) задача, алгоритм $R( \cdot ,{{\delta }^{j}})$, задаваемый равенством $R({\mathbf{J}}_{0}^{{{{\delta }^{j}}}},{{{\mathbf{J}}}^{{{{\delta }^{j}}}}},{{{\mathbf{I}}}^{{{{\delta }^{j}}}}},{{e}^{{{{\delta }^{j}}}}},{{\delta }^{j}}) = $ ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ для каждого набора исходных данных $\{ {\mathbf{J}}_{0}^{{{{\delta }^{j}}}},{{{\mathbf{J}}}^{{{{\delta }^{j}}}}},{{{\mathbf{I}}}^{{{{\delta }^{j}}}}},{{e}^{{{{\delta }^{j}}}}}\} $, удовлетворяющих оценкам (3.1) леммы 3.1 при $\delta = {{\delta }^{j}}$, является МПР-образующим в смысле определения 3.3, причем в случае субдифференцируемости ${\mathbf{J}}_{0}^{0}$ в точках $\mathcal{D}$ имеет место и сильная сходимость (3.18). Если же такой субдифференцируемости нет, то, строго говоря, можно гарантировать лишь слабую сходимость ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ к ${{u}^{0}}$ при ${{\delta }^{j}} \to 0$, $j \to \infty $.
В качестве конкретной последовательности $\{ {{\lambda }^{j}},{{\mu }^{j}}\} $, $j = 1,2, \ldots $, можно взять, например, последовательность $\{ {{\lambda }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}},{{\mu }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}}\} $, $j = 1,2, \ldots $, если $\delta /\alpha (\delta ) \to 0,\alpha (\delta ) \to 0$ при $\delta \to 0$, т.е., если выполняется условие согласования (3.5) (здесь $\{ {{\lambda }^{{\delta ,\alpha (\delta )}}},{{\mu }^{{\delta ,\alpha (\delta )}}}\} $ – точка, о которой идет речь в теореме 3.1).
Доказательство. Для доказательства необходимости, прежде всего, заметим, что выпуклая задача (${{P}^{0}}$), все функционалы которой непрерывны, разрешима благодаря ограниченности $\mathcal{D}$ и существованию МПР. По этой причине мы можем воспользоваться теоремой 3.1. Включение (3.14) и предельное соотношение (3.15), а также предельное соотношение (3.15) доказываемой теоремы вытекают из (3.9), (3.10), (3.7), с учетом ограниченности $\mathcal{D}$, и (3.6), если в качестве точек $\{ {{\lambda }^{j}},{{\mu }^{j}}\} $, ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ взять соответственно точки $\{ {{\lambda }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}},{{\mu }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}}\} $, ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}},{{\mu }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}}]$, $j = 1,2, \ldots $, с ${{\delta }^{j}} \to 0$, $j \to \infty $. Следствием (3.8), (3.9) и (3.10) является предельное соотношение (3.16). То есть последовательность ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$, $j = 1,2, \ldots $, есть МПР. Наконец, тот факт, что предельное соотношение (и одновременно равенство) (3.17) есть следствие предельного соотношения (3.13) и соотношений (3.14), (3.15), будет доказан в процессе доказательства достаточности условий теоремы 3.2 для существования МПР.
Для доказательства достаточности заметим, прежде всего, что выпуклая задача (${{P}^{0}}$), все функционалы которой непрерывны, разрешима ввиду включений (3.14) и ограниченности $\mathcal{D}$. Далее, так как ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ минимизирует функционал ${{L}^{{{{\delta }^{j}}}}}( \cdot ,{{\lambda }^{j}},{{\mu }^{j}})$, можем записать
В силу условий теоремы отсюда следует, с учетом ограниченности $\mathcal{D}$, что
4. РЕГУЛЯРИЗАЦИЯ КЛАССИЧЕСКИХ УСЛОВИЙ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ РАСПРЕДЕЛЕННЫМИ СИСТЕМАМИ
4.1. Переформулировка теорем 3.1, 3.2 в терминах исходной задачи оптимального управления
Функция Лагранжа задачи оптимального управления ($O{{C}^{\delta }}$), совпадающая с функцией Лагранжа задачи выпуклого программирования (${{P}^{\delta }}$), имеет вид
Теорема 4.1. Регуляризирующий двойственный алгоритм в задаче оптимального управления. Пусть выполняется условие согласования (3.5). Тогда оператор $R( \cdot ,{{\delta }^{j}})$, ставящий в соответствие набору исходных данных ${{{\text{f}}}^{{{{\delta }^{j}}}}}$, удовлетворяющих оценкам (2.5), (2.6) условий Б, В при $\delta = {{\delta }^{j}}$, управление $R({{{\text{f}}}^{{{{\delta }^{j}}}}},{{\delta }^{j}}) \equiv {{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}},{{\mu }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}}]$, является МПР-образующим в задаче оптимального управления ($O{{C}^{0}}$) в смысле определения 2.1. Более того, имеют место следующие оценки отклонения приближенных решений от точного по функции и ограничениям
Теорема 4.2. Регуляризованный принцип Лагранжа для задачи ($O{{C}^{0}}$). МПР в задаче ($O{{C}^{0}}$) существует тогда и только тогда, когда существуют стремящиеся к нулю последовательности положительных чисел $\{ {{\delta }^{j}}\} _{{j = 1}}^{\infty }$, $\{ {{\gamma }^{j}}\} _{{j = 1}}^{\infty }$ и последовательность пар векторов двойственных переменных $\{ {{\lambda }^{j}},{{\mu }^{j}}\} _{{j = 1}}^{\infty } \subset {{{\mathbf{R}}}^{r}} \times {\mathbf{R}}_{ + }^{k}$ такие, что
(4.1)
${{\delta }^{j}}{{\left\| {\{ {{\lambda }^{j}},{{\mu }^{j}}\} } \right\|}_{{k + r}}} \to 0\quad при\quad j \to \infty $(4.2)
${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}] \in {{\mathcal{D}}^{{{{\delta }^{j}},{{\gamma }^{j}}}}}\quad (j = 1,2,...),$(4.3)
${{\left\langle {{{\lambda }^{j}},{{I}^{{{{\delta }^{j}}}}}\left[ {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]} \right] - {{d}^{{{{\delta }^{j}}}}}} \right\rangle }_{r}} + {{\left\langle {{{\mu }^{j}},{{J}^{{{{\delta }^{j}}}}}\left[ {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]} \right]} \right\rangle }_{k}} \to 0\quad при\quad j \to \infty .$Если указанные последовательности $\{ {{\delta }^{j}}\} _{{j = 1}}^{\infty }$, $\{ {{\gamma }^{j}}\} _{{j = 1}}^{\infty }$ и $\{ {{\lambda }^{j}},{{\mu }^{j}}\} _{{j = 1}}^{\infty }$ существуют, то последовательность ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$, $j = 1,2, \ldots $, является МПР задачи ($O{{C}^{0}}$), т.е. помимо (4.2) выполняется и предельное соотношение
Как следствие соотношений (4.1)–(4.3) выполняется и предельное соотношение
В случае субдифференцируемости $J_{0}^{0}$ на $\mathcal{D}$ имеет место и предельное соотношение
(4.4)
${{\left\| {{{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}] - {{u}^{0}}} \right\|}_{{2,s}}} \to 0\quad при\quad j \to \infty .$Другими словами, вне зависимости от того, разрешима или нет двойственная к ($O{{C}^{0}}$) задача, алгоритм $R( \cdot ,{{\delta }^{j}})$, задаваемый равенством $R({{{\text{f}}}^{{{{\delta }^{j}}}}},{{\delta }^{j}}) = {{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ для каждого набора исходных данных ${{{\text{f}}}^{{{{\delta }^{j}}}}}$, удовлетворяющих оценкам (2.5), (2.6) условий Б, В при $\delta = {{\delta }^{j}}$, является МПР-образующим в смысле определения 2.1, причем в случае субдифференцируемости $J_{0}^{0}$ в точках $\mathcal{D}$ имеет место и сильная сходимость (4.4). Если же такой субдифференцируемости нет, то, строго говоря, можно гарантировать лишь слабую сходимость ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ к ${{u}^{0}}$ при ${{\delta }^{j}} \to 0$, $j \to \infty $.
В качестве конкретной последовательности $\{ {{\lambda }^{j}},{{\mu }^{j}}\} $, $j = 1,2, \ldots $, например, можно взять последовательность $\{ {{\lambda }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}},{{\mu }^{{{{\delta }^{j}},\alpha ({{\delta }^{j}})}}}\} $, $j = 1,2, \ldots $, о которой идет речь в теореме 4.1.
Заметим, что в силу ограниченности $\mathcal{D}$ условие (4.2) со стремящимися к нулю последовательностями положительных чисел $\{ {{\delta }^{j}}\} _{{j = 1}}^{\infty }$, $\{ {{\gamma }^{j}}\} _{{j = 1}}^{\infty }$ имеет место тогда и только тогда, когда ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}},] \in {{\mathcal{D}}^{{0,{{{\tilde {\gamma }}}^{j}}}}}$ $(j = 1,2,...)$ для некоторой сходящейся к нулю последовательности положительных чисел $\{ {{\tilde {\gamma }}^{j}}\} _{{j = 1}}^{\infty }$.
Пользуясь свойством компактности единичной сферы пространства ${{{\mathbf{R}}}^{r}} \times {{{\mathbf{R}}}^{k}}$ и переходя очевидным образом к пределу при $j \to \infty $ в соотношениях (4.2), (4.3), в случае субдифференцируемости $J_{0}^{0}$ на $\mathcal{D}$ получаем следующее классическое условие оптимальности в задаче $(O{{C}^{0}})$ в форме недифференциального принципа Лагранжа как следствие регуляризованного принципа Лагранжа теоремы 4.2.
Следствие 4.1. Пусть ${{u}^{0}} \in {{\mathcal{D}}^{0}}$ – оптимальное управление в задаче $(O{{C}^{0}})$. Тогда существует невырожденный набор множителей Лагранжа $(\nu ,\lambda ,\mu )$, $\nu \geqslant 0$, $\lambda \in {{{\mathbf{R}}}^{r}}$, $\mu \in {\mathbf{R}}_{ + }^{k}$, такой что выполняются соотношения
4.2. О минимизации функции Лагранжа
Ключевой задачей процедуры двойственной регуляризации процесса приближенного решения задачи ($O{{C}^{0}}$), а также возможного применения регуляризованных КУО для практического решения задач оптимального управления является задача минимизации функции (функционала) Лагранжа ${{L}^{\delta }}(u,\lambda ,\mu )$, $\{ \lambda ,\mu \} \in {{{\mathbf{R}}}^{r}} \times {\mathbf{R}}_{ + }^{k}$, задачи ($O{{C}^{\delta }}$)
решение которой мы обозначили через ${{u}^{\delta }}[\lambda ,\mu ]$. От “качества” решения этой “простейшей” задачи напрямую зависит и “качество” решения исходной задачи $(O{{C}^{0}})$ на основе регуляризованных КУО. Для упрощения изложения предположим, что при каждом $\delta \in (0,{{\delta }_{0}}]$ функционалы ${{K}^{\delta }}[z]:L_{2}^{m} \to {\mathbf{R}}$, ${{M}^{\delta }}[u]:L_{2}^{s} \to {\mathbf{R}}$, $\mathcal{J}_{i}^{\delta }[z,u]:L_{2}^{m} \times L_{2}^{s} \to {\mathbf{R}}$ ($i = 1,...,k$) дифференцируемы по Фреше. Тогда при каждом $\delta \in (0,{{\delta }_{0}}]$ дифференцируемы по Фреше функционалы ${\mathbf{J}}_{i}^{\delta }[u]:L_{2}^{s} \to {\mathbf{R}}\;(i = 0,1,...,k)$ и функционал Лагранжа ${{L}^{\delta }}(u,\lambda ,\mu )$. В этом случае решение ${{u}^{\delta }}[\lambda ,\mu ]$ выпуклой задачи на минимум (4.5) удовлетворяет критерию минимума(4.6)
$\mathop {{{L}^{\delta }}}\nolimits_u^/ ({{u}^{\delta }}[\lambda ,\mu ],\lambda ,\mu )[u - {{u}^{\delta }}[\lambda ,\mu ]] \geqslant 0,\quad u \in \mathcal{D},$(4.7)
${{\left\langle {{{\Psi }^{\delta }}[{{u}^{\delta }}[\lambda ,\mu ],\lambda ,\mu ],u - {{u}^{\delta }}[\lambda ,\mu ]} \right\rangle }_{{2,s}}} \geqslant 0,\quad u \in \mathcal{D}.$(4.8)
$\begin{gathered} L_{u}^{{\delta /}}(\bar {u},\lambda ,\mu )[{v}] = K_{z}^{{\delta /}}({{S}^{\delta }}{{B}^{\delta }}\bar {u} + {{S}^{\delta }}{{c}^{\delta }}){{S}^{\delta }}{{B}^{\delta }}[{v}] + M_{u}^{{\delta /}}(\bar {u})[{v}] + \\ + \;\sum\limits_{i = 1}^k \,{{\mu }_{i}}\mathcal{J}_{{i\;z}}^{{\delta /}}({{S}^{\delta }}{{B}^{\delta }}\bar {u} + {{S}^{\delta }}{{c}^{\delta }},\bar {u}){{S}^{\delta }}{{B}^{\delta }}[{v}] + \sum\limits_{i = 1}^k \,{{\mu }_{i}}\mathcal{J}_{{i\;u}}^{{\delta /}}({{S}^{\delta }}{{B}^{\delta }}\bar {u} + {{S}^{\delta }}{{c}^{\delta }},\bar {u})[{v}] + \\ \, + \sum\limits_{i = 1}^r \,{{\lambda }_{i}}{{\left\langle {a_{i}^{\delta },{{S}^{\delta }}{{B}^{\delta }}{v}} \right\rangle }_{{2,m}}} + \sum\limits_{i = 1}^r \,{{\lambda }_{i}}{{\left\langle {b_{i}^{\delta },{v}} \right\rangle }_{{2,s}}},\quad {v} \in L_{2}^{s},\quad \bar {u} \in L_{2}^{s}. \\ \end{gathered} $(4.9)
$L_{u}^{{\delta /}}(\bar {u},\lambda ,\mu )[{v}] = - {{\left\langle {{{\psi }^{\delta }}[\bar {u},\lambda ,\mu ],{{B}^{\delta }}[{v}]} \right\rangle }_{{2,m}}} + {{\left\langle {{{\phi }^{\delta }}[\bar {u},\lambda ,\mu ],{v}} \right\rangle }_{{2,s}}},\quad {v} \in L_{2}^{s},$(4.10)
${{\psi }^{\delta }}[\bar {u},\lambda ,\mu ] \equiv - {{\Gamma }^{\delta }}[\bar {u}] - \sum\limits_{i = 1}^k \,{{\mu }_{i}}\Theta _{i}^{\delta }[\bar {u}] - \sum\limits_{j = 1}^r \,{{\lambda }_{j}}\Lambda _{j}^{\delta },$(4.11)
${{\phi }^{\delta }}[\bar {u},\lambda ,\mu ] \equiv {{\Upsilon }^{\delta }}[\bar {u}] + \sum\limits_{i = 1}^k \,{{\mu }_{i}}\Xi _{i}^{\delta }[\bar {u}] + \sum\limits_{j = 1}^r \,{{\lambda }_{j}}b_{j}^{\delta }.$(4.12)
$\psi (t) - ({{A}^{\delta }}){\kern 1pt} *{\kern 1pt} [\psi ](t) = - {{\Phi }^{\delta }}[\bar {u}](t) - \sum\limits_{i = 1}^k \,{{\mu }_{i}}\Omega _{i}^{\delta }[\bar {u}](t) - \sum\limits_{j = 1}^r \,{{\lambda }_{j}}a_{j}^{\delta }(t),\quad t \in \Pi ,\quad \psi \in L_{2}^{m},$(4.13)
$L_{u}^{{\delta /}}(\bar {u},\lambda ,\mu )[v] = {{\left\langle { - ({{B}^{\delta }}){\kern 1pt} *[{{\psi }^{\delta }}[\bar {u},\lambda ,\mu ]] + {{\phi }^{\delta }}[\bar {u},\lambda ,\mu ],v} \right\rangle }_{{2,s}}},\quad v \in L_{2}^{s}.$(4.14)
${{\Psi }^{\delta }}[\bar {u},\lambda ,\mu ](t) = - ({{B}^{\delta }}){\kern 1pt} *{\kern 1pt} [{{\psi }^{\delta }}[\bar {u},\lambda ,\mu ]](t) + {{\phi }^{\delta }}[\bar {u},\lambda ,\mu ](t),\quad t \in \Pi ,$4.3. Случай ограниченных управлений
Рассмотрим задачу оптимального управления ($O{{C}^{0}}$) в ситуации, когда допустимые управления принимают значения из некоторого ограниченного замкнутого и выпуклого множества $U \subset {{{\mathbf{R}}}^{s}}$ (т.е. $\mathcal{D} \equiv \{ u({\kern 1pt} .{\kern 1pt} ) \in L_{\infty }^{s}:u(t) \in U,\;t \in \Pi \} $). В этом случае получаем из (4.7) критерий минимума функционала Лагранжа в виде следующего линеаризованного поточечного принципа максимума.
Лемма 4.1. Функция $\bar {u}({\kern 1pt} .{\kern 1pt} ) \in \mathcal{D}$ является решением задачи (4.5) тогда и только тогда, когда
(4.15)
$\mathop {\left\langle {{{\Psi }^{\delta }}[\bar {u},\lambda ,\mu ](t),\bar {u}(t)} \right\rangle }\nolimits_s = \mathop {max}\limits_{w \in U} \mathop {\left\langle {{{\Psi }^{\delta }}[\bar {u},\lambda ,\mu ](t),w} \right\rangle }\nolimits_s \;\;при\;\;почти\;\;всех\;\;t \in \Pi ,$Доказательство. Необходимость выполнения для решения $\bar {u}$ задачи (4.5) условия (4.15) доказывается простейшим игольчатым варьированием, а достаточность получается стандартным применением теоремы А.А. Ляпунова (см., например, [31, § 2.4, § 8.2]).
Обозначим через $U_{m}^{\delta }[\lambda ,\mu ]$ множество всех управлений из $\mathcal{D}$, удовлетворяющих (при сформулированных выше дополнительных условиях дифференцируемости) принципу максимума леммы 4.1. Очевидно, в нашем случае, благодаря сильной выпуклости целевого функционала, множество $U_{m}^{\delta }[\lambda ,\mu ]$ состоит из одного элемента, обозначим его через $u_{m}^{\delta }[\lambda ,\mu ]$, и справедливо равенство $u_{m}^{\delta }[\lambda ,\mu ] = {{u}^{\delta }}[\lambda ,\mu ]$. То есть непосредственным следствием теоремы 4.2 и леммы 4.1 является регуляризованный ПМП для задачи ($O{{C}^{0}}$).
Теорема 4.3. Регуляризованный ПМП в задаче оптимального управления $(O{{C}^{0}})$. При сформулированных выше дополнительных условиях дифференцируемости все утверждения теоремы 4.2 останутся справедливыми, если в них ${{u}^{{{{\delta }^{j}}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$ заменить везде на $u_{m}^{{{{\delta }^{j}}}}[{{\lambda }^{j}},{{\mu }^{j}}]$.
5. ПРИМЕРЫ РЕГУЛЯРИЗАЦИИ КЛАССИЧЕСКИХ УСЛОВИЙ ОПТИМАЛЬНОСТИ В КОНКРЕТНЫХ ЗАДАЧАХ ОПТИМИЗАЦИИ РАСПРЕДЕЛЕННЫХ СИСТЕМ
Естественный переход от начально-краевой задачи к эквивалентному ей функциональному уравнению II рода вольтеррова типа осуществляется с помощью обращения главной части задачи. Разнообразные конкретные примеры начально-краевых задач (для параболических, гиперболических, интегродифференциальных уравнений с частными производными и систем таких уравнений, различных уравнений с запаздывающим аргументом и др.), которые допускают эквивалентное описание с помощью функциональных уравнений вольтеррова типа можно найти, например, в [25] (см. также обзор в [27]). Из огромного множества самых различных подобных начально-краевых задач мы для иллюстрации изложенной выше теории выбрали две: начальную задачу для системы с запаздыванием и начально-краевую задачу для интегродифференциального уравнения типа уравнения переноса. В конце каждого примера выписываются те основные конструкции, которые и участвуют в формулировке регуляризованных КУО (формирующая критерий минимума функционала Лагранжа функция, сопряженное уравнение, … ). Сформулировать с их помощью соответствующие регуляризованные КУО – конкретные реализации теорем 4.1, 4.2, 4.3 читателю не составит большого труда.
Пример 1. Оптимизационная задача с терминальными ограничениями для системы с запаздыванием. Пусть $n = 1$, $\Pi = [0,1]$; $\rho \in (0,1)$ – фиксированное число; $\eta \in {{{\mathbf{R}}}^{m}}$ – фиксированный вектор; $\alpha ({\kern 1pt} .{\kern 1pt} ),\beta ({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{{m \times m}}$, $\gamma ({\kern 1pt} .{\kern 1pt} ) \in L_{\infty }^{{m \times s}}$, $\xi ({\kern 1pt} .{\kern 1pt} ) \in L_{\infty }^{m}[ - \rho ,0]$ – фиксированные функции. Рассмотрим начальную задачу для линейной управляемой системы дифференциальных уравнений с запаздывающим аргументом ($x(.)$ – это $m$-вектор-функция)
где $u({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{s}$ – управление. Решение начальной задачи (5.1), (5.2) понимаем как решение в смысле “почти всюду” из пространства ${{(W_{2}^{1}[0,1])}^{m}}$ абсолютно непрерывных функций, рассматривая первое из условий (5.2) как требуемое в (5.1) условие доопределения $x(t)$ слева от $t = 0$: $x(t - \rho ) = \xi (t - \rho )$ при $t - \rho < 0$. Приведем задачу (5.1), (5.2) к эквивалентному уравнению вида (2.1), показав тем самым, что каждому $u({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{s}$ отвечает единственное в классе $W$ функций $x({\kern 1pt} .{\kern 1pt} ) \in {{(W_{2}^{1}[0,1])}^{m}}$, удовлетворяющих второму условию (5.2), решение этой задачи. Для этого сделаем в (5.1), (5.2) замену по формуле устанавливающей взаимно однозначное соответствие между классом $W$ функций $x(.)$ и пространством $L_{2}^{m}$ функций $z(.)$. “Подставляя” (5.3) в (5.1) (с учетом при $t \in [0,\rho )$ первого условия (5.2)), получаем(5.4)
$z(t) = \alpha (t)\eta + \alpha (t)\int\limits_0^t {z(\zeta )d\zeta } + \beta (t)\eta + \beta (t)\int\limits_0^{t - \rho } {z(\zeta )d\zeta } + \gamma (t)u(t),\quad t \in [\rho ,1],$(5.5)
$z(t) = \alpha (t)\eta + \alpha (t)\int\limits_0^t {z(\zeta )d\zeta } + \beta (t)\xi (t - \rho ) + \gamma (t)u(t),\quad t \in [0,\rho ).$(5.6)
$\begin{gathered} z(t) = \alpha (t)\{ \eta + {{\Sigma }_{1}}[z](t)\} + \beta (t)\{ \omega (t) + {{\Sigma }_{2}}[z](t)\} + \gamma (t)u(t) \equiv \\ \equiv \{ \alpha (t){{\Sigma }_{1}}[z](t) + \beta (t){{\Sigma }_{2}}[z](t)\} + \gamma (t)u(t) + \{ \alpha (t)\eta + \beta (t)\omega (t)\} ,\quad t \in \Pi . \\ \end{gathered} $Пусть задано следующее: выпуклые функции ${{G}_{i}}({\kern 1pt} .{\kern 1pt} ):{{{\mathbf{R}}}^{m}} \to {\mathbf{R}},$ $i = 1,...,k$; векторы ${{{\mathbf{a}}}_{j}} \in {{{\mathbf{R}}}^{m}},$ $j = 1,...,r$; действительные числа ${{{\mathbf{d}}}_{j}},\;j = 1,...,r$; выпуклое ограниченное и замкнутое множество $\mathcal{D}$ пространства $L_{2}^{s}$. Формулами ${{F}_{i}}[x] \equiv {{G}_{i}}(x(1))$, $i = 1,...,k$, и ${{Q}_{j}}[x] \equiv \mathop {\left\langle {{{{\mathbf{a}}}_{j}},x(1)} \right\rangle }\nolimits_m $, $j = 1,...,r$, для $x({\kern 1pt} .{\kern 1pt} ) \in {{(W_{2}^{1}[0,1])}^{m}}$ определены терминальные функционалы. Рассмотрим задачу оптимального управления системой (5.1), (5.2) c минимизируемым целевым функционалом ${{F}_{0}}[u] \equiv \mathop {\left\| u \right\|}\nolimits_{2,s}^2 $, $u \in L_{2}^{s}$, при функциональных ограничениях
(5.7)
${{F}_{1}}[x] \leqslant 0,...,{{F}_{k}}[x] \leqslant 0,\quad {{Q}_{1}}[x] = {{{\mathbf{d}}}_{1}},...,{{Q}_{r}}[x] = {{{\mathbf{d}}}_{r}},\quad x \in {{(W_{2}^{1}[0,1])}^{m}},$(5.8)
${{F}_{0}}[u] \to {\text{min}},\quad {{F}_{i}}[{{x}_{u}}] \leqslant 0\quad (i = 1,...,k),\quad {{Q}_{j}}[{{x}_{u}}] = {{{\mathbf{d}}}_{j}}\quad (j = 1,...,r),\quad u \in \mathcal{D}.$Сделав в задаче (5.8) замену (5.3), получим эквивалентную задачу оптимизации управляемой системы (5.6). При этом функциональные ограничения (5.7) преобразуются в ограничения
Пусть ${\text{f}} \equiv \{ \eta ,\alpha ,\beta ,\gamma ,\xi ;{{G}_{i}}(i = 1,...,k);$ ${{{\mathbf{a}}}_{j}},{{{\mathbf{d}}}_{j}}(j = 1,...,r)\} $ – набор входных данных задачи (5.8), которые могут подвергаться возмущению, и точный набор ${{{\text{f}}}^{0}} \equiv \{ {{\eta }^{0}},{{\alpha }^{0}},{{\beta }^{0}},{{\gamma }^{0}},{{\xi }^{0}};G_{i}^{0}(i = 1,...,k);$ ${\mathbf{a}}_{j}^{0},{\mathbf{d}}_{j}^{0}(j = 1,...,r)\} $ нам не известен, но можно оперировать с приближенными наборами ${{{\text{f}}}^{\delta }} \equiv \{ {{\eta }^{\delta }},{{\alpha }^{\delta }},{{\beta }^{\delta }},{{\gamma }^{\delta }},{{\xi }^{\delta }};G_{i}^{\delta }(i = 1,...,k);$ ${\mathbf{a}}_{j}^{\delta },{\mathbf{d}}_{j}^{\delta }(j = 1,...,r)\} $, $\delta \in (0,{{\delta }_{0}}]$ (${{\delta }_{0}} > 0$ фиксировано), которые связаны с набором ${{{\text{f}}}^{0}}$ следующими условиями 1–3.
Условие 1. Функции $G_{i}^{\delta }({\kern 1pt} .{\kern 1pt} ):{{{\mathbf{R}}}^{m}} \to {\mathbf{R}}$ $(i = 1,...,k)$ выпуклы при любом $\delta \in [0,{{\delta }_{0}}]$ и равномерно по $\delta \in [0,{{\delta }_{0}}]$ липшицевы на любом ограниченном множестве.
Заметим, что условие 1 выполняется, в частности, если функции $G_{i}^{\delta }({\kern 1pt} .{\kern 1pt} ):{{{\mathbf{R}}}^{m}} \to {\mathbf{R}}$ $(i = 1,...,k)$ выпуклы при любом $\delta \in [0,{{\delta }_{0}}]$ и равномерно по $\delta \in [0,{{\delta }_{0}}]$ ограничены на любом ограниченном множестве пространства ${{{\mathbf{R}}}^{m}}$ (см., например, [32, теорема 8.2]).
Условие 2. Существует постоянная ${\mathbf{C}} > 0$ такая, что при любом $\delta \in (0,{{\delta }_{0}}]$ величины ${{\left\| {{{\eta }^{\delta }} - {{\eta }^{0}}} \right\|}_{m}}$, ${{\left\| {{{\alpha }^{\delta }} - {{\alpha }^{0}}} \right\|}_{{2,m \times m}}}$, ${{\left\| {{{\beta }^{\delta }} - {{\beta }^{0}}} \right\|}_{{2,m \times m}}}$, ${{\left\| {{{\gamma }^{\delta }} - {{\gamma }^{0}}} \right\|}_{{2,m \times s}}}$, ${{\left\| {{{\xi }^{\delta }} - {{\xi }^{0}}} \right\|}_{{L_{\infty }^{m}[ - \rho ,0]}}}$; ${{\left\| {{\mathbf{a}}_{j}^{\delta } - {\mathbf{a}}_{j}^{0}} \right\|}_{m}}$, $\left| {{\mathbf{d}}_{j}^{\delta } - {\mathbf{d}}_{j}^{0}} \right|$ $(j = 1,...,r)$ не превосходят величины ${\mathbf{C}}\delta $.
Условие 3. Существует неубывающая функция ${{{\mathbf{N}}}_{1}}({\kern 1pt} .{\kern 1pt} ):{{{\mathbf{R}}}_{ + }} \to {{{\mathbf{R}}}_{ + }}$ такая, что для каждого $l > 0$ и любого $\delta \in (0,{{\delta }_{0}}]$ величина $\left| {G_{i}^{\delta }(y) - G_{i}^{0}(y)} \right|$ при $\mathop {\left\| y \right\|}\nolimits_m \leqslant l$ не превосходит величины ${{{\mathbf{N}}}_{1}}(l)\delta $ $(i = 1,...,k).$
При любом $\delta \in [0,{{\delta }_{0}}]$ мы имеем управляемую начальную задачу
(5.9)
$\dot {x} = {{\alpha }^{\delta }}(t)x(t) + {{\beta }^{\delta }}(t)x\left( {t - \rho } \right) + {{\gamma }^{\delta }}(t)u(t),\quad t \in [0,1];$(5.11)
$F_{1}^{\delta }[x] \leqslant 0,...,F_{k}^{\delta }[x] \leqslant 0,\quad Q_{1}^{\delta }[x] = {\mathbf{d}}_{1}^{\delta },...,Q_{r}^{\delta }[x] = {\mathbf{d}}_{r}^{\delta },\quad x \in {{(W_{2}^{1}[0,1])}^{m}},$(5.12)
${{F}_{0}}[u] \to {\text{min}},\quad F_{i}^{\delta }[x_{u}^{\delta }] \leqslant 0\quad (i = 1,...,k),\quad Q_{j}^{\delta }[x_{u}^{\delta }] = {\mathbf{d}}_{j}^{\delta }\quad (j = 1,...,r),\quad u \in \mathcal{D},$Сделав в задаче (5.12) замену
получим эквивалентную задачу оптимизации управляемой системы(5.13)
$z(t) = \{ {{\alpha }^{\delta }}(t){{\Sigma }_{1}}[z](t) + {{\beta }^{\delta }}(t){{\Sigma }_{2}}[z](t)\} + {{\gamma }^{\delta }}(t)u(t) + \{ {{\alpha }^{\delta }}(t){{\eta }^{\delta }} + {{\beta }^{\delta }}(t){{\omega }^{\delta }}(t)\} ,\quad t \in \Pi ,$(5.14)
${{F}_{0}}[u] \to {\text{min}},\quad W_{i}^{\delta }[z_{u}^{\delta }] \leqslant 0\quad (i = 1,...,k),\quad E_{j}^{\delta }[z_{u}^{\delta }] = d_{j}^{\delta }\quad (j = 1,...,r),\quad u \in \mathcal{D},$Положив ${{A}^{\delta }}[z](t) \equiv {{\alpha }^{\delta }}(t){{\Sigma }_{1}}[z](t) + {{\beta }^{\delta }}(t){{\Sigma }_{2}}[z](t)$, $t \in \Pi $, $z({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{m}$; ${{B}^{\delta }}[u](t) \equiv {{\gamma }^{\delta }}(t)u(t),$ $t \in \Pi ,\;u({\kern 1pt} .{\kern 1pt} ) \in L_{2}^{s}$; ${{c}^{\delta }}(t) \equiv {{\alpha }^{\delta }}(t){{\eta }^{\delta }} + {{\beta }^{\delta }}(t){{\omega }^{\delta }}(t)$, $t \in \Pi $, переписываем уравнение (5.13) в форме (2.7). Задача (5.14) имеет вид ($O{{C}^{\delta }}$), в данном случае $J_{0}^{\delta }[u] \equiv {{F}_{0}}[u]$ (${{K}^{\delta }}[z] \equiv 0,$ ${{M}^{\delta }}[u] \equiv {{F}_{0}}[u]$); $J_{i}^{\delta }[u] \equiv \mathcal{J}_{i}^{\delta }[{{z}_{u}},u] \equiv W_{i}^{\delta }[{{z}_{u}}]$ ($\mathcal{J}_{i}^{\delta }[z,u] \equiv W_{i}^{\delta }[z]$) $(i = 1,...,k);$ $I_{j}^{\delta }[u] \equiv \mathcal{I}_{j}^{\delta }[{{z}_{u}},u] \equiv E_{j}^{\delta }[{{z}_{u}}]$ ($\mathcal{I}_{j}^{\delta }[z,u] \equiv E_{j}^{\delta }[z]$) $(j = 1,...,r).$
При сделанных относительно семейства задач (5.12), $\delta \in [0,{{\delta }_{0}}]$, предположениях семейство задач (5.14), $\delta \in [0,{{\delta }_{0}}]$, удовлетворяет условиям А–В. Действительно, условия А, Б получаются элементарными выкладками из предположений в условиях 1–3 и 2 соответственно. Чтобы доказать выполнение условия В, оценим при произвольных $l > 0$ и $z \in L_{2}^{m}$ таких, что $\mathop {\left\| z \right\|}\nolimits_{2,m} \leqslant l$, для $i \in \left\{ {1,2,...,k} \right\},$ $\delta \in [0,{{\delta }_{0}}]$ величину $\left| {W_{i}^{\delta }[z] - W_{i}^{0}[z]} \right| \equiv $ $\left| {G_{i}^{\delta }\left( {{{\eta }^{\delta }} + \int_0^1 \,z(\zeta )d\zeta } \right) - G_{i}^{0}\left( {{{\eta }^{0}} + \int_0^1 \,z(\zeta )d\zeta } \right)} \right|$. Имеем
(5.15)
$\begin{gathered} \left| {W_{i}^{\delta }[z] - W_{i}^{0}[z]} \right| \leqslant \left| {G_{i}^{\delta }\left( {{{\eta }^{\delta }} + \int\limits_0^1 {z(\zeta )d\zeta } } \right) - G_{i}^{0}\left( {{{\eta }^{\delta }} + \int\limits_0^1 {z(\zeta )d\zeta } } \right)} \right| + \\ \, + \left| {G_{i}^{0}\left( {{{\eta }^{\delta }} + \int\limits_0^1 {z(\zeta )d\zeta } } \right) - G_{i}^{0}\left( {{{\eta }^{0}} + \int\limits_0^1 {z(\zeta )d\zeta } } \right)} \right|. \\ \end{gathered} $Предположив дополнительно, что функции $G_{i}^{\delta },i = 1,...,k,$ $\delta \in (0,{{\delta }_{0}}]$, гладкие, можем выписать для этого примера критерии (4.7) и (4.15) решения задачи (4.5). Прямые вычисления дают ${{\Phi }^{\delta }}[\bar {u}](t) \equiv 0,$ ${{\phi }^{\delta }}[\bar {u},\lambda ,\mu ](t) \equiv {{\Upsilon }^{\delta }}[\bar {u}](t) \equiv 2\bar {u}(t)$, $t \in \Pi $; $\Omega _{i}^{\delta }[\bar {u}](t) \equiv (G_{i}^{{\delta /}}(x_{{\bar {u}}}^{\delta }(1))){\kern 1pt} *$, $t \in \Pi $ $(i = 1,...,k)$; $a_{j}^{\delta }(t) \equiv {\mathbf{a}}_{j}^{\delta }$, $t \in \Pi $ $(j = 1,...,r)$. По определению сопряженного оператора
(5.16)
$\begin{gathered} \psi (t) - \int\limits_t^1 {({{\alpha }^{\delta }}(\zeta )){\kern 1pt} *} \psi (\zeta )d\zeta = {{h}^{\delta }}[\bar {u},\lambda ,\mu ],\quad 1 - \rho \leqslant t \leqslant 1, \\ \psi (t) - \int\limits_t^1 {({{\alpha }^{\delta }}(\zeta )){\kern 1pt} *} \psi (\zeta )d\zeta - \int\limits_{t + \rho }^1 {({{\beta }^{\delta }}(\zeta )){\kern 1pt} *} \psi (\zeta )d\zeta = {{h}^{\delta }}[\bar {u},\lambda ,\mu ],\quad 0 \leqslant t \leqslant 1 - \rho , \\ \end{gathered} $${{h}^{\delta }}[\bar {u},\lambda ,\mu ] \equiv \sum\nolimits_{i = 1}^k \,{{\mu }_{i}}(G_{i}^{{\delta /}}(x_{{\bar {u}}}^{\delta }(1))){\kern 1pt} * + \sum\nolimits_{j = 1}^r \,{{\lambda }_{j}}{\mathbf{a}}_{j}^{\delta }$.
Функция ${{\Psi }^{\delta }}[\bar {u},\lambda ,\mu ],$ формирующая критерии (4.7) и (4.15), которым удовлетворяет решение ${{u}^{\delta }}[\lambda ,\mu ]$ задачи (4.5), задается формулой
(5.17)
$\dot {\psi } + ({{\alpha }^{\delta }}(t)){\kern 1pt} *\psi (t) = 0,\quad 1 - \rho \leqslant t \leqslant 1;\quad \psi (1) = {{h}^{\delta }}[\bar {u},\lambda ,\mu ],$(5.18)
$\dot {\psi } + ({{\alpha }^{\delta }}(t)){\kern 1pt} *\psi (t) + ({{\beta }^{\delta }}(t + \rho )){\kern 1pt} *\psi (t + \rho ) = 0,\quad 0 \leqslant t \leqslant 1 - \rho ,$(5.19)
$\psi (1 - \rho ) = \int\limits_{1 - \rho }^1 {({{\alpha }^{\delta }}(\zeta )){\kern 1pt} *} \psi (\zeta )d\zeta + {{h}^{\delta }}[\bar {u},\lambda ,\mu ],$Пример 2. Оптимизационная задача с интегральными ограничениями для интегродифференциального уравнения типа уравнения переноса. Пусть $n = 3,$ $\Pi = [0,1] \times [0,1] \times [ - 1,1]$. Рассмотрим на $\Pi $ следующую краевую задачу для линейного интегродифференциального уравнения (краевая задача (5.20) подобна смешанной задаче для простейшего линейного нестационарного интегродифференциального уравнения переноса (см., например, [33]–[35])
(5.20)
$\begin{gathered} x(0,{{t}^{2}},{{t}^{3}}) = \varphi ({{t}^{2}},{{t}^{3}}),\quad 0 \leqslant {{t}^{2}} \leqslant 1,\quad - {\kern 1pt} 1 \leqslant {{t}^{3}} \leqslant 1; \\ x({{t}^{1}},0,{{t}^{3}}) = {{\psi }_{1}}({{t}^{1}},{{t}^{3}}),\quad 0 \leqslant {{t}^{1}} \leqslant 1,\quad 0 \leqslant {{t}^{3}} \leqslant 1; \\ \end{gathered} $(5.21)
$\theta (\bar {t}) \equiv \left\{ \begin{gathered} \varphi ({{{\bar {t}}}^{2}} - {{{\bar {t}}}^{3}}{{{\bar {t}}}^{1}},{{{\bar {t}}}^{3}}),\quad {\text{если}}\quad \nu (\bar {t}) = 0; \hfill \\ {{\psi }_{1}}({{{\bar {t}}}^{1}} - {{{\bar {t}}}^{2}}{\text{/}}{{{\bar {t}}}^{3}},{{{\bar {t}}}^{3}}),\quad {\text{если}}\quad \nu (\bar {t}) > 0,\quad {{{\bar {t}}}^{3}} > 0; \hfill \\ {{\psi }_{2}}({{{\bar {t}}}^{1}} + (1 - {{{\bar {t}}}^{2}}){\text{/}}{{{\bar {t}}}^{3}},{{{\bar {t}}}^{3}}),\quad {\text{если}}\quad \nu (\bar {t}) > 0,\quad {{{\bar {t}}}^{3}} < 0, \hfill \\ \end{gathered} \right.$Пусть заданы: выпуклые функции ${{G}_{0}}(y):{\mathbf{R}} \to {\mathbf{R}}$, ${{G}_{i}}(y,w):{\mathbf{R}} \times {\mathbf{R}} \to {\mathbf{R}},$ $i = 1,...,k$; функции ${{{\mathbf{a}}}_{j}}({\kern 1pt} .{\kern 1pt} ) \in {{L}_{2}}$ и ${{{\mathbf{b}}}_{j}}({\kern 1pt} .{\kern 1pt} ) \in {{L}_{2}},$ действительные числа ${{{\mathbf{d}}}_{j}},j = 1,...,r$. Формулами ${{F}_{0}}[x,u] \equiv {{G}_{0}}\left( {\int_\Pi \,x(t)dt} \right) + \mathop {\left\| u \right\|}\nolimits_{2,1}^2 $, ${{F}_{i}}[x,u] \equiv {{G}_{i}}\left( {\int_\Pi \,x(t)dt,\int_\Pi \,u(t)dt} \right),$ ${{Q}_{j}}[x,u] \equiv \mathop {\left\langle {{{{\mathbf{a}}}_{j}}({\kern 1pt} .{\kern 1pt} ),x({\kern 1pt} .{\kern 1pt} )} \right\rangle }\nolimits_{2,1} + \mathop {\left\langle {{{{\mathbf{b}}}_{j}}({\kern 1pt} .{\kern 1pt} ),u({\kern 1pt} .{\kern 1pt} )} \right\rangle }\nolimits_{2,1} $ при $i = 1,...,k$, $j = 1,...,r$ для $x({\kern 1pt} .{\kern 1pt} ) \in W,$ $u({\kern 1pt} .{\kern 1pt} ) \in {{L}_{2}}$ определены функционалы. Пусть $\mathcal{D}$ – выпуклое ограниченное и замкнутое множество пространства ${{L}_{2}}$. Рассмотрим задачу оптимального управления системой (5.20) c минимизируемым целевым функционалом ${{F}_{0}}[x,u]$ при функциональных ограничениях
(5.23)
${{F}_{1}}[x,u] \leqslant 0,...,{{F}_{k}}[x,u] \leqslant 0,\quad {{Q}_{1}}[x,u] = {{{\mathbf{d}}}_{1}},...,{{Q}_{r}}[x,u] = {{{\mathbf{d}}}_{r}},\quad x \in W,\quad u \in {{L}_{2}},$(5.24)
${{F}_{0}}[{{x}_{u}},u] \to {\text{min}},\quad {{F}_{i}}[{{x}_{u}},u] \leqslant 0\quad (i = 1,...,k),\quad {{Q}_{j}}[{{x}_{u}},u] = {{{\mathbf{d}}}_{j}}\quad (j = 1,...,r),\quad u \in \mathcal{D}.$Сделав в задаче (5.24) замену (5.22), получим эквивалентную задачу оптимизации соответствующей управляемой системы (2.1). При этом минимизируемый функционал принимает вид ${{W}_{0}}[z,u] \equiv {{F}_{0}}[\theta + {{\Sigma }_{1}}[z],u]$, $z(.) \in {{L}_{2}},u(.) \in {{L}_{2}}$, а функциональные ограничения (5.23) преобразуются в ограничения
Пусть ${\text{f}} \equiv \left\{ {\alpha ,\beta ,\gamma ,Y,\varphi ,{{\psi }_{1}},{{\psi }_{2}};} \right.$ ${{G}_{i}}(i = 0,1,...,k)$; $\left. {{{{\mathbf{a}}}_{j}},{{{\mathbf{b}}}_{j}},{{{\mathbf{d}}}_{j}}(j = 1,...,r)} \right\}$ – набор входных данных задачи (5.24), которые могут подвергаться возмущению, и точный набор
Условие 4. Функции $G_{0}^{\delta }({\kern 1pt} .{\kern 1pt} ):{\mathbf{R}} \to {\mathbf{R}}$ и $G_{i}^{\delta }(.,.):{\mathbf{R}} \times {\mathbf{R}} \to {\mathbf{R}}$ $(i = 1,...,k)$ выпуклы при любом $\delta \in [0,{{\delta }_{0}}]$ и равномерно по $\delta \in [0,{{\delta }_{0}}]$ липшицевы на любом ограниченном множестве.
Условие 5. Существует постоянная ${\mathbf{C}} > 0$ такая, что величины ${{\left\| {{{\alpha }^{\delta }} - {{\alpha }^{0}}} \right\|}_{{\infty ,1}}}$; ${{\left\| {{{\beta }^{\delta }} - {{\beta }^{0}}} \right\|}_{{\infty ,1}}}$; ${{\left\| {{{\gamma }^{\delta }} - {{\gamma }^{0}}} \right\|}_{{\infty ,1}}}$; ${{\left\| {{{Y}^{\delta }} - {{Y}^{0}}} \right\|}_{{\infty ,1}}}$; ${{\left\| {{{\varphi }^{\delta }} - {{\varphi }^{0}}} \right\|}_{{{{L}_{\infty }}([0,1] \times [ - 1,1])}}}$; ${{\left\| {\psi _{1}^{\delta } - \psi _{1}^{0}} \right\|}_{{{{L}_{\infty }}([0,1] \times [0,1])}}}$; ${{\left\| {\psi _{2}^{\delta } - \psi _{2}^{0}} \right\|}_{{{{L}_{\infty }}([0,1] \times [ - 1,0])}}}$; ${{\left\| {{\mathbf{a}}_{j}^{\delta } - {\mathbf{a}}_{j}^{0}} \right\|}_{{2,1}}}$, ${{\left\| {{\mathbf{b}}_{j}^{\delta } - {\mathbf{b}}_{j}^{0}} \right\|}_{{2,1}}}$, $\left| {{\mathbf{d}}_{j}^{\delta } - {\mathbf{d}}_{j}^{0}} \right|$ $(j = 1,...,r)$ при любом $\delta \in (0,{{\delta }_{0}}]$ не превосходят величины ${\mathbf{C}}\delta $.
Условие 6. Существует неубывающая функция ${{{\mathbf{N}}}_{1}}(.):{{{\mathbf{R}}}_{ + }} \to {{{\mathbf{R}}}_{ + }}$ такая, что для каждого ${\mathbf{l}} > 0$ и любого $\delta \in (0,{{\delta }_{0}}]$ величины $\left| {G_{0}^{\delta }(y) - G_{0}^{0}(y)} \right|$, $\left| {G_{i}^{\delta }(y,w) - G_{i}^{0}(y,w)} \right|$ $(i = 1,...,k)$ при $\left| y \right|,\left| w \right| \leqslant {\mathbf{l}}$ не превосходят величины ${{{\mathbf{N}}}_{1}}({\mathbf{l}})\delta $.
При любом $\delta \in [0,{{\delta }_{0}}]$ имеем управляемую краевую задачу
(5.25)
$F_{1}^{\delta }[x,u] \leqslant 0,\;...,\;F_{k}^{\delta }[x,u] \leqslant 0,\quad Q_{1}^{\delta }[x,u] = {\mathbf{d}}_{1}^{\delta },\;...,\;Q_{r}^{\delta }[x,u] = {\mathbf{d}}_{r}^{\delta },\quad x \in W,\quad u \in {{L}_{2}},$(5.26)
$F_{0}^{\delta }[x_{u}^{\delta },u] \to {\text{min}},\quad F_{i}^{\delta }[x_{u}^{\delta },u] \leqslant 0\quad (i = 1,...,k),\quad Q_{j}^{\delta }[x_{u}^{\delta },u] = {{{\mathbf{d}}}_{j}}\quad (j = 1,...,r),\quad u \in \mathcal{D}.$Сделав в задаче (5.26) подстановку
где ${{\theta }^{\delta }}({\kern 1pt} .{\kern 1pt} )$ определяется формулой (5.21) c заменой $\varphi $, ${{\psi }_{1}}$, ${{\psi }_{2}}$ на ${{\varphi }^{\delta }}$, $\psi _{1}^{\delta }$, $\psi _{2}^{\delta }$ соответственно, получим эквивалентную задачу оптимизации системы (2.7), в которой $n = 3$, $m = 1$, $s = 1$, $\Pi = [0,1] \times [0,1] \times [ - 1,1]$; ${{B}^{\delta }}[u](t) \equiv {{\gamma }^{\delta }}(t)u(t)$, $u({\kern 1pt} .{\kern 1pt} ) \in {{L}_{2}}$, $t \in \Pi $;(5.27)
$W_{0}^{\delta }[z_{u}^{\delta },u] \to {\text{min}},\quad {{W}_{i}}[z_{u}^{\delta },u] \leqslant 0\quad (i = 1,...,k),\quad {{E}_{j}}[z_{u}^{\delta },u] = d_{j}^{\delta }\quad (j = 1,...,r),\quad u \in \mathcal{D},$При сделанных относительно семейства задач (5.26), $\delta \in [0,{{\delta }_{0}}]$, предположениях семейство задач (5.27), $\delta \in [0,{{\delta }_{0}}]$, удовлетворяет условиям А–В. Действительно, условия А и Б получаются элементарными выкладками из предположений в условиях 4–6 и 5 соответственно. Чтобы доказать выполнение условия В, оценим величину $\left| {J_{i}^{\delta }[z,u] - J_{i}^{0}[z,u]} \right| \equiv \left| {W_{i}^{\delta }[z,u] - W_{i}^{0}[z,u]} \right|$ при произвольных $u(.) \in \mathcal{D}$, $l > 0$ и $z(.) \in {{L}_{2}}$ таких, что $\mathop {\left\| z \right\|}\nolimits_{2,1} \leqslant l$, для $i \in \left\{ {1,2,...,k} \right\},$ $\delta \in [0,{{\delta }_{0}}]$. Она не превосходит суммы
(5.28)
$\left| {F_{i}^{\delta }[{{\theta }^{\delta }} + {{\Sigma }_{1}}[z],u] - F_{i}^{0}[{{\theta }^{\delta }} + {{\Sigma }_{1}}[z],u]} \right| + \left| {F_{i}^{0}[{{\theta }^{\delta }} + {{\Sigma }_{1}}[z],u] - F_{i}^{0}[{{\theta }^{0}} + {{\Sigma }_{1}}[z],u]} \right|.$Функция $G_{i}^{0}:{\mathbf{R}} \times {\mathbf{R}} \to {\mathbf{R}}$ липшицева на любом ограниченном множестве. То есть существует неубывающая $\mu (.):{{{\mathbf{R}}}_{ + }} \to {{{\mathbf{R}}}_{ + }}$ такая, что $\left| {G_{i}^{0}({{y}_{1}},{{w}_{1}}) - G_{i}^{0}({{y}_{2}},{{w}_{2}})} \right| \leqslant \mu ({\mathbf{l}})\left( {\left| {{{y}_{1}} - {{y}_{2}}} \right| + \left| {{{w}_{1}} - {{w}_{2}}} \right|} \right),$ если $\left| {{{y}_{1}}} \right| \leqslant {\mathbf{l}},$ $\left| {{{y}_{2}}} \right| \leqslant {\mathbf{l}},$ $\left| {{{w}_{1}}} \right| \leqslant {\mathbf{l}},$ $\left| {{{w}_{2}}} \right| \leqslant {\mathbf{l}}.$ Следовательно, второе слагаемое правой части (5.28) не больше произведения $\mu \left( {max\left\{ {\sigma ({{\varphi }^{0}},\psi _{1}^{0},\psi _{2}^{0},{\mathbf{C}},{{\delta }_{0}},l),ma{{x}_{{u \in \mathcal{D}}}}\mathop {\left\| u \right\|}\nolimits_{2,1} } \right\}} \right) \cdot \left| {\int_\Pi \,({{\theta }^{\delta }} - {{\theta }^{0}})dt} \right|$, второй сомножитель которого не превосходит числа ${\mathbf{C}}\delta .$ Таким образом, условие В для функционалов $\mathcal{J}_{1}^{\delta },...,\mathcal{J}_{k}^{\delta }$, $0 < \delta \leqslant {{\delta }_{0}},$ выполняется с функцией
Предположив дополнительно, что функции $G_{i}^{\delta },i = 0,1,...,k,$ $\delta \in (0,{{\delta }_{0}}]$, гладкие, можем выписать для данного примера критерии (4.7) и (4.15) решения задачи (4.5). Сопряженные к операторам ${{\Sigma }_{1}}:{{L}_{2}} \to {{L}_{2}}$ и $\Sigma _{2}^{\delta }:{{L}_{2}} \to {{L}_{2}}$ операторы имеют вид
Введем следующие обозначения: ${{\eta }_{\delta }}(\bar {u}) \equiv \int_\Pi \,x_{{\bar {u}}}^{\delta }(\zeta )d\zeta $, $\eta (\bar {u}) \equiv \int_\Pi \,\bar {u}(\zeta )d\zeta $. Непосредственно вычисляя, получаем ${{\Phi }^{\delta }}[\bar {u}](t) \equiv \Sigma _{1}^{*}[G_{0}^{{\delta /}}\left( {{{\eta }_{\delta }}(\bar {u})} \right)](t),$ ${{\Upsilon }^{\delta }}[\bar {u}](t) \equiv 2\bar {u}(t)$,
(5.29)
$\begin{gathered} \psi (t) - \Sigma _{1}^{*}[{{\alpha }^{\delta }}\psi ](t) - \Sigma _{2}^{{\delta *}}[{{\beta }^{\delta }}\psi ](t) = - \Sigma _{1}^{*}[G_{0}^{{\delta /}}\left( {{{\eta }_{\delta }}(\bar {u})} \right)](t) - \\ \, - \Sigma _{1}^{*}\left[ {\sum\limits_{i = 1}^k \,{{\mu }_{i}}G_{{iy}}^{{\delta /}}\left( {{{\eta }_{\delta }}(\bar {u}),\eta (\bar {u})} \right) + \sum\limits_{j = 1}^r \,{{\lambda }_{j}}{\mathbf{a}}_{j}^{\delta }} \right](t),\quad t \in \Pi , \\ \end{gathered} $Список литературы
Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Наука, 1979.
Тихомиров В.М. Рассказы о максимумах и минимумах. М.: Наука, 1986.
Гамкрелидзе Р.В. Математические работы Л.С. Понтрягина. Итоги науки и техники. ВИНИТИ. Современная математика и ее приложения. Тематические обзоры. Труды Международной конференции, посвященной 90-летию со дня рождения Л.С. Понтрягина (Москва, 31 августа–6 сентября 1998 г.). Том I. Оптимальное управление. 1998. Т. 60. С. 5–23.
Арутюнов А.В., Магарил-Ильяев Г.Г., Тихомиров В.М. Принцип максимума Понтрягина. Доказательство и приложения. М.: Факториал Пресс, 2006.
Гамкрелидзе Р.В. История открытия принципа максимума Понтрягина // Труды матем. ин-та РАН. 2019. Т. 304. С. 7–14.
Васильев Ф.П. Методы оптимизации: В 2-х кн. М.: МЦНМО, 2011.
Сумин М.И. Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве // Ж. вычисл. матем. и матем. физ. 2011. Т. 51. № 9. С. 1594–1615.
Сумин М.И. Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах // Тр. Ин-та матем. и механ. УрО РАН. 2019. Т. 25. № 1. С. 279–296.
Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977.
Гольштейн Е.Г. Теория двойственности в математическом программировании и ее приложения. М.: Наука, 1971.
Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1986.
Бакушинский А.Б., Гончарский А.В. Некорректные задачи. Численные методы и приложения. М.: Изд-во Моск. ун-та, 1989.
Tonelli L. Sulle equazioni funzionali di Volterra // Bull. Calcutta Math. Soc. 1929. V. 20. P. 31–48 (Opere scelte 4, 198–212).
Тихонов А.Н. О функциональных уравнениях типа Вольтерра и их применениях к некоторым задачам математической физики // Бюл. Моск. ун-та. Секц. А. 1938. Т. 1. Вып. 8. С. 1–25.
Забрейко П.П. Об интегральных операторах Вольтерра // Успехи матем. наук. 1967. Т. 22. Вып. 1. С. 167–168.
Corduneanu C. Integral equations and applications. Cambridge.: Cambridge Univ. Press, 1991.
Шрагин И.В. Абстрактные операторы Немыцкого – локально определенные операторы // Докл. АН СССР. 1976. Т. 227. № 1. С. 47–49.
Сумин В.И. Функционально-операторные вольтерровы уравнения в теории оптимального управления распределенными системами // Докл. АН СССР. 1989. Т. 305. № 5. С. 1056–1059.
Жуковский Е.С. К теории уравнений Вольтерра // Дифференц. ур-ния. 1989. Т. 25. № 9. С. 1599–1605.
Гохберг И.Ц., Крейн М.Г. Теория вольтерровых операторов в гильбертовом пространстве и ее приложения. М.: Наука, 1967.
Бухгейм А.Л. Уравнения Вольтерра и обратные задачи. Новосибирск: Наука, 1983.
Гусаренко С.А. Об одном обобщении понятия вольтеррова оператора // Докл. АН СССР. 1987. Т. 295. № 5. С. 1046–1049.
$V\ddot {a}th$ M. Abstract Volterra equations of the second kind // J. Equat. Appl. 1998. V. 10. № 9. P. 125–144.
Жуковский Е.С., Алвеш М.Ж. Абстрактные вольтерровы операторы // Изв. вузов. Матем. 2008. № 3. С. 3–17.
Сумин В.И. Функциональные вольтерровы уравнения в теории оптимального управления распределенными системами. Нижний Новгород: Изд-во ННГУ, 1992.
Сумин В.И., Чернов А.В. Операторы в пространствах измеримых функций: вольтерровость и квазинильпотентность // Дифференц. ур-ния. 1998. Т. 34. № 10. С. 1402–1411.
Сумин В.И. Управляемые вольтерровы функциональные уравнения и принцип сжимающих отображений // Тр. Ин-та матем. и механ. УрО РАН. 2019. Т. 25. № 1. С. 262–278.
Сумин М.И. О регуляризации классических условий оптимальности в выпуклых задачах оптимального управления // Тр. Ин-та матем. и механ. УрО РАН. 2020. Т. 26. № 2. С. 252–269.
Данфорд Н., Шварц Дж. Линейные операторы. Т. 1. Общая теория. М.: Изд-во иностр. лит., 1962.
Функциональный анализ, серия Справочная математическая библиотека // Под ред. С. Г. Крейна. М.: Наука, 1972.
Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.
Дмитрук А.В. Выпуклый анализ. Элементарный вводный курс: Учебное пособие. М.: Издательский отдел факультета ВМиК МГУ; МАКС Пресс, 2012.
Jorgens K. An asymptotic expansion in the theory of neutron transport // Comm. Pure Appl. Math. 1958. V. 11. № 2. P. 219–242.
Морозов С.Ф. Нестационарное интегродифференциальное уравнение переноса // Изв. вузов. Матем. 1969. № 1. С. 26–31.
Кузнецов Ю.А., Морозов С.Ф. Корректность постановки смешанной задачи для нестационарного уравнения переноса // Дифференц. ур-ния. 1972. Т. 8. № 9. С. 1639–1648.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики