Журнал вычислительной математики и математической физики, 2020, T. 60, № 6, стр. 963-974
Итерационные фейеровские процессы в некорректных задачах
В. В. Васин *
Институт математики и механики УрО РАН;
Уральский федеральный университет
620990 Екатеринбург, Екатеринбург, ул. С. Ковалевской, 16, Россия
* E-mail: vasin@imm.uran.ru
Поступила в редакцию 25.09.2019
После доработки 25.09.2019
Принята к публикации 11.02.2020
Аннотация
Представлен краткий обзор по итерационным процессам фейеровского типа для основных постановок некорректно поставленных задач, которые включают задачи условной квадратичной и выпуклой минимизации, вариационные неравенства, линейные и нелинейные операторные уравнения в гильбертовом пространстве. Все эти постановки сводятся к задаче нахождения неподвижной точки нерастягивающего фейеровского оператора на основе метода последовательных приближений и его модификации с помощью корректирующих множителей. Представлен также материал, касающийся двухэтапного метода построения регуляризующего алгоритма для нелинейных некорректных задач с монотонным оператором, излагается экономичный способ учета в алгоритме дополнительной априорной информации о решении с помощью фейеровских отображений. Библ. 22.
1. ВВЕДЕНИЕ
В небольшой заметке [1] Л. Фейер сформулировал следующее определение поточечной близости точки к некоторому множеству.
Определение 1. Пусть $M$ – замкнутое множество из ${{\operatorname{R} }^{n}}$ (или гильбертова пространства). Если для точек $p$ и ${{p}_{1}}$ из ${{\operatorname{R} }^{n}}$ выполнено неравенство $\left\| {p - q} \right\| > \left\| {{{p}_{1}} - q} \right\|$ для любого $q \in M,$ то будем говорить, что ${{p}_{1}}$ поточечно ближе к $M,$ чем $p.$ Причем, если для $p$ не существует точек ${{p}_{1}},$ которые поточечно ближе, чем $p,$ тогда точку $p$ назовем ближайшей к множеству $M.$
Кроме того, им было отмечено, что множество ближайших к $M$ точек совпадает с замкнутой выпуклой оболочкой $\overline {{\text{conv}}(M)} $ множества $M.$ Из этого факта непосредственно вытекает, что если точка $p$ не принадлежит $\overline {{\text{conv}}(M)} ,$ то можно найти точку ${{p}_{1}},$ которая поточечно ближе к множеству $M,$ чем $p.$
На основе определения 1 поточечной близости точки к множеству и отмеченного геометрического факта Т. Моцкин и Дж. Шенберг [2] ввели определение монотонной фейеровской последовательности $\{ {{x}_{k}}\} ,$ для которой ${{x}_{k}} \ne {{x}_{{k + 1}}},$ $\left\| {{{x}_{{k + 1}}} - q} \right\| \leqslant \left\| {{{x}_{k}} - q} \right\|$ $\forall q \in M,$ и предложили релаксационный метод решения систем линейных неравенств. Дальнейшие исследования по методам построения фейеровских последовательностей для задач линейного и выпуклого программирования были продолжены в работах [3], [4]. И.И. Ереминым были введены более общие понятия, связанные с именем Л. Фейера: фейеровский оператор, фейеровский процесс, установлены их свойства и важные факты, которые определили широкий простор для построения итерационных фейеровских методов решения задач математического программирования в ${{\operatorname{R} }^{n}}$, в том числе, несобственных [5], [6] (см. также [7]).
В работе автора [8] было дано определение класса псевдосжимающих операторов, который в книге [8] в рамках единого подхода был переименован в класс сильно M-фейеровских операторов, поскольку эти операторы обладают более сильным свойством сжимаемости, чем фейеровские операторы, введенные И.И. Ереминым, и удовлетворяют тем же базовым условиям. Свойство сильной M-фейеровости оказалось весьма полезным при исследовании итерационных методов решения линейных и нелинейных обратных некорректных задач в бесконечномерных пространствах, что обусловлено уникальными свойствами процессов с фейеровскими операторами шага, а именно.
1. Неединственность решения задачи не является препятствием для применения (сильно) фейеровского процесса.
2. Классы фейеровских операторов замкнуты относительно операций произведения отображений и взятия выпуклой суммы.
3. Возможность решения задачи с помощью разбиения на подзадачи, для каждой из которых строится итерационный процесс с фейеровским оператором шага, и формирование итерационного метода для исходной задачи в виде суперпозиции операторов шага из числа построенных для подзадач.
4. Возможность построения гибридных итерационных методов, в которых оператор шага образуется с помощью операций произведения и выпуклой суммы операторов шага различных фейеровских итерационных схем решения исходной обратной задачи.
5. Фейеровские процессы обладают внутренним параллелизмом, следовательно, хорошо приспособлены для применения параллельных технологий.
6. Гибкий учет в алгоритме дополнительных априорных ограничений, заданных в форме линейных соотношений, и систем линейных и выпуклых неравенств с помощью фейеровских отображений.
2. ОСНОВНЫЕ КЛАССЫ ОПЕРАТОРОВ ФЕЙЕРОВСКОГО ТИПА И ИХ ВЗАИМОСВЯЗЬ
В приводимых ниже определениях классов нелинейных операторов используется двойная терминология. С одной стороны, в качестве основного понятия выступает свойство фейеровости, а с другой, в качестве сравнения привлекается терминология, которая встречается в несколько иной форме в различных разделах функционального анализа. Далее в статье мы будем использовать только ту терминологию, которая была введена в первых работах по фейеровским процессам и основана на идее поточечной аппроксимации множества, восходящей к работе [1]. Если не оговаривается особо, то в дальнейшем предполагается, что исследуемые операторы действуют в гильбертовом пространстве, для которого примем обозначение $H,$ а через ${\text{Fix}}(T)$ обозначим множество неподвижных точек оператора $T,$ т.е.
Определение 2. Оператор $T:H \to H$ называется слабо M-фейеровским (или M-квазинерастягивающим), если $M = {\text{Fix}}(T) \ne \emptyset $ и выполнено неравенство
Определение 3. Оператор $T:H \to H$ называется M-фейеровским (или строго M-квазинерастягивающим), если $M = {\text{Fix}}(T) \ne \emptyset $ и
Определение 4. Оператор $T:H \to H$ называется сильно M-фейеровским (или M-псевдосжимающим), если $M = {\text{Fix}}(T) \ne \emptyset $ и существут константа $\nu $ такая, что
Определение 5. Оператор $T:H \to H$ называется нерастягивающим (нерасширяющим), если выполнено неравенство
обозначим этот класс операторов $\mathcal{K}$. Из определений 2–4 следует, что для введенных классов справедливы включения причем, как показывают примеры (см. [9]), эти включения строгие.В дальнейшем при упоминании о свойстве фейеровости оператора, как правило, будут опускаться слова “слабо” и “сильно”, если из текста ясно, о каком классе фейеровских операторов идет речь. Заметим, что сильную M-фейеровость, с одной стороны, можно рассматривать как некоторое обобщение свойства псевдосжимаемости Б. Мартине [10] для нерастягивающего оператора, а с другой, как усиление свойства M-фейеровости, введенное в [6].Лемма 1. Если оператор $V:H \to H$ и $V \in {{\mathcal{K}}_{M}},$ тогда для $\lambda \in (0,1)$ оператор $T = \lambda V + (1 - \lambda )I$ принадлежит классу $\mathcal{P}_{M}^{\nu }$ для $\nu = (1 - \lambda ){\text{/}}\lambda .$ Обратно, если $T \in \mathcal{P}_{M}^{\nu },$ то $T = \tfrac{1}{{1 + \nu }}V + \tfrac{\nu }{{1 + \nu }}I,$ где $V \in {{\mathcal{K}}_{M}}.$
3. ОСНОВНЫЕ ПОСТАНОВКИ НЕЛИНЕЙНЫХ НЕКОРРЕКТНЫХ ЗАДАЧ
1. Минимизация выпуклого функционала
где $\phi {\kern 1pt} :\;H \to {{\operatorname{R} }^{1}}$ – полунепрерывный снизу выпуклый (в частности, квадратичный) функционал, $Q$ – выпуклое замкнутое подмножество гильбертова пространства $H$, которое называется допустимым множеством, $\phi {\text{*}}$ – оптимальное значение, множество $M$ решений задачи (3.1) называется оптимальным множеством. Если $\phi $ – сильно выпуклый функционал, то задача (3.1) корректно поставлена по Тихонову, однако выпуклость целевого функционала не гарантирует корректность задачи.2. Решение вариационного неравенства
где $F$ – оператор, действующий в гильбертовом пространстве $H$, $Q - $ выпуклое замкнутое подмножество пространства $H$, $\left\langle {\,,\,} \right\rangle $ обозначает скалярное произведение в пространстве $H$.3. Нахождение неподвижной точки нелинейного оператора $T:H \to H$, т.е. решение уравнения II рода
4. Нахождение решения нелинейного операторного уравнения I рода
где оператор $A$ действует на паре гильбертовых пространств, для которого обратный ${{A}^{{ - 1}}},$ в общем случае, разрывный.Установим связь между базовыми постановками некорректных задач, чтобы убедиться, что все они могут быть представлены в форме (3.3) – нахождение неподвижной точки нелинейного оператора.
Теорема 1. Для того чтобы точка $x{\text{*}}$ была решением задачи (3.1) минимизации выпуклого дифференцируемого по Гато функционала, необходимо и достаточно, чтобы точка $x{\text{*}}$ была решением вариационного неравенства
Теорема 2. Задача (3.2), в частности, (3.5) эквивалентна решению уравнения II рода
где $\gamma $ – произвольный положительный параметр, ${{P}_{Q}}$ – оператор метрического проектирования на множество $Q$. В частности, ввиду теоремы 1, задача минимизации (3.1) эквивалентна задаче (3.6) при $F(x) = \nabla \phi (x),$ а задача (3.4) эквивалентна (3.3) при $T(x) = x + A(x) - y$.Таким образом, базовые постановки некорректно поставленных задач 1–4 можно рассматривать с единых позиций как задачу аппроксимации неподвижной точки нелинейного отображения, т.е. решения уравнения (3.3). Однако в приложениях выбор математической модели обычно диктуется типами входных данных, свойствами операторов и наличием для данной постановки сходящихся итерационных процессов.
4. СВОЙСТВА СИЛЬНО ФЕЙЕРОВСКИХ ОПЕРАТОРОВ
Во многих случаях задача допускает разбиение на подзадачи, для каждой из которых строится итерационный оператор, а затем с помощью некоторых операций сборки из имеющихся фрагментов конструируется оператор шага итерационного метода для решения задачи в целом. При этом удается построить разрешающий оператор из того же класса, что и порождающие его операторы, отвечающие за подзадачи. Возможность использования такого подхода для фейеровских операторов из класса $\mathcal{P}_{M}^{\nu }$ устанавливает следующая теорема (см. [7, теорема 1.8], [8]).
Теорема 3. Пусть операторы ${{T}_{i}}:H \to H,$ ${{T}_{i}} \in \mathcal{P}_{{{{M}_{i}}}}^{{{{\nu }_{i}}}}$ и $M = \bigcap\nolimits_{i = 1}^m \,{{M}_{i}} \ne \emptyset .$ Тогда верно следующее:
1) $T = {{T}_{m}}{{T}_{{m - 1}}}T...{{T}_{1}} \in \mathcal{P}_{M}^{\nu }$, $\nu = {{\min }_{{1 \leqslant i \leqslant m}}}\{ {{\nu }_{i}}\} {\text{/}}{{2}^{{m - 1}}}$,
2) $T = \sum\nolimits_{i = 1}^m \,{{\alpha }_{i}}{{T}_{i}} \in \mathcal{P}_{M}^{\nu }$, ${{\alpha }_{i}} > 0$, $\sum\nolimits_{i = 1}^m \,{{\alpha }_{i}} = 1$, $\nu = mi{{n}_{{1 \leqslant i \leqslant m}}}\{ {{\nu }_{i}}\} $.
Заметим, что порядок операторов в произведении из пункта 1 не имеет значение, т.е. соотношение справедливо для любой перестановки индексов.
Для аппроксимации неподвижных точек нелинейного оператора $T,$ т.е. решения уравнения
к которому сводятся основные постановки некорректных задач, применим метод последовательных приближений (МПП)Введем обозначения “$ \rightharpoondown $” и “$ \to $” для слабой и сильной сходимости элементов гильбертова пространства. Сформулируем теорему сходимости для оператора шага $T$ из класса $\mathcal{P}_{M}^{\nu },$ которая была первоначально доказана для нерастягивающего оператора [10], а затем при более общих условиях [8].
Теорема 4. Пусть оператор $T:D(T) \subset H \to H$ из класса $\mathcal{P}_{M}^{\nu },$ удовлетворяет соотношению
(4.3)
${{x}_{j}} \rightharpoondown x,\quad {{x}_{j}} - T({{x}_{j}}) \to 0 \Rightarrow x \in \operatorname{Fix} (T) = M.$1) ${{x}^{k}} \rightharpoondown \hat {x} \in {\text{Fix}}(T)$, т.е. сходится слабо к решению уравнения (4.1);
2) $\inf \{ {{\lim }_{{k \to \infty }}}{\text{||}}{{x}^{k}} - z{\text{||}}:z \in {\text{Fix}}(T)\} = {{\lim }_{{k \to \infty }}}{\text{||}}{{x}^{k}} - \hat {x}{\text{||}}$;
3) либо ${\text{||}}{{x}^{{k + 1}}} - \hat {x}{\text{||}} < {\text{||}}{{x}^{k}} - \hat {x}{\text{||}}$ для любого $k,$ либо ${{x}^{k}}$ стационарна, начиная с некоторого ${{k}_{0}} \geqslant 0,$ т.е. ${{x}^{{{{k}^{0}}}}} = {{x}^{{{{k}^{0}} + 1}}} = ... = \hat {x}$;
4) справедлива оценка
С учетом леммы 1 из теоремы 4 получаем
Следствие 1. Пусть в условиях теоремы вместо $T \in \mathcal{P}_{M}^{\nu }$ выполнено $T \in {{\mathcal{K}}_{M}}$. Тогда заключение теоремы справедливо для процесса
где $0 < \lambda < 1.$Замечание 1. Если дополнительно в теореме 4 оператор $T$ является нерастягивающим (определение 5), тогда условие (4.3) выполнено. Таким образом, если множество $M = \bigcap\nolimits_{i = 1}^m \,{{M}_{i}} \ne \emptyset $ и известны операторы ${{T}_{i}} \in \mathcal{P}_{{{{M}_{i}}}}^{{{{\nu }_{i}}}},$ то, согласно теореме 3, для построения оператора $T \in \mathcal{P}_{M}^{\nu }$ достаточно положить
(4.4)
$T = {{T}_{m}}{{T}_{{m - 1}}}T...{{T}_{1}},\quad T = \sum\limits_{i - 1}^m \,{{\alpha }_{i}}{{T}_{i}},$Теорема 5. Пусть $M = \bigcap\nolimits_{i = 1}^m \,{{M}_{i}} \ne \emptyset ,$ ${{T}_{i}} \in \mathcal{P}_{{{{M}_{i}}}}^{{{{\nu }_{i}}}}$ и для каждого выполнено условие (4.3). Тогда для МПП (4.2), где $T$ – любой из операторов (4.4), справедливо заключение теоремы 4.
Необходимо отметить, что, хотя сходимость итераций в теоремах 4, 5 только слабая, полученные результаты и развитые подходы можно применять при решении конечномерных задач, например, для систем линейных алгебраических уравнений (СЛАУ), в том числе, плохообусловленных
где матрица $A$ – произвольной структуры, а система, в общем случае, разрешима лишь в смысле наименьших квадратов. Во-первых, на примере СЛАУ легко продемонстрировать возможность разбиения на подзадачи (подсистемы), для каждой из которых строится фейеровский оператор, порождающий итерационный процесс, а затем из этих операторов генерируется фейеровский итерационный процесс для решения исходной СЛАУ (4.5) с помощью операций, указанных в теореме 3. В качестве подзадач здесь выступают подсистемы, на которые можно произвольным образом разрезать исходную СЛАУ. Во-вторых, покажем, как можно учитывать в алгоритме априорную информацию о решении СЛАУ с помощью фейеровских отображений.Рассмотрим два итерационных метода решения СЛАУ – метод простой итерации и итерированный вариант метода Тихонова:
(4.6)
${{x}^{{k + 1}}} = {{x}^{k}} - (({{A}^{T}}A{{x}^{k}} - {{A}^{T}}y) \equiv T({{x}^{k}}),\quad {\text{||}}A{\kern 1pt} {\text{||}} \leqslant 1,$(4.7)
${{x}^{{k + 1}}} = {{x}^{k}} - {{({{A}^{T}}A + \alpha I)}^{{ - 1}}}({{A}^{T}}y + \alpha {{x}^{k}}) \equiv T({{x}^{k}}).$(4.9)
${{U}_{i}}(x) = x - \lambda \frac{{f_{i}^{ + }(x)\nabla {{f}_{i}}(x)}}{{{\text{||}}\nabla {{f}_{i}}(x){\text{|}}{{{\text{|}}}^{2}}}},\quad 0 < \lambda < 2,$(4.10)
$U(x) = {{U}_{m}}{{U}_{{m - 1}}}U...{{U}_{1}}(x),\quad U(x) = \sum\limits_{i - 1}^m \,{{\alpha }_{i}}{{U}_{i}}(x).$Следствие 2. Для любого ${{x}^{0}}$ последовательность ${{x}^{k}},$ генерируемая фейеровским процессом
где $U$ – любой из операторов (4.10), сходится к решению СЛАУ (4.5) в смысле наименьших квадратов, удовлетворяющему априорным ограничениям (4.8).Замечание 2. Если априорное множество $Q$ задано системой линейных неравенств, то при возмущенных входных данных СЛАУ и системы неравенств итерационный метод порождает регуляризующий алгоритм (РА). В [7], [9] можно найти доказательство приведенных здесь фактов и примеры использования априорных ограничений при решении прикладных задач.
5. МОДИФИКАЦИЯ МПП НА ОСНОВЕ КОРРЕКТИРУЮЩИХ МНОЖИТЕЛЕЙ
Цель этого раздела – исследование модифицированного варианта МПП, с помощью которого удается получить сильную сходимость итераций для нерастягивающего оператора и его приложений к некорректно поставленным задачам. Следующие две теоремы, полученные в работе Ф. Браудера [11], касаются существования неподвижных точек нерастягивающего оператора и их устойчивости относительно параметра.
Теорема 6. Пусть $D$ – выпуклое замкнутое ограниченное множество гильбертова пространства $H$ и $T$ – нерастягиващий оператор (определение 5), действующий из $D$ в $D.$ Тогда множество неподвижных точек ${\text{Fix}}(T)$ не пусто, выпукло и замкнуто.
Рассмотрим уравнение
с оператором $T \in \mathcal{K}$ и $0 < \gamma < 1,$ где ${{v}^{0}}$ – некоторый элемент из $D.$Теорема 7. Пусть $T:H \to H$ – нерастягивающий оператор (определение 5), отображающий выпуклое замкнутое ограниченное подмножество $D$ из $H$ в $D.$ Тогда для любого ${{v}^{0}} \in D$ и параметра $0 < \gamma < 1$ существует единственное решение ${{x}_{\gamma }} \in D$ уравнения (5.1) и $li{{m}_{{\gamma \to 1}}}{\text{||}}{{x}_{\gamma }} - \hat {x}{\text{||}} = 0,$ где $\hat {x}$ – ближайшая к ${{v}^{0}}$ неподвижная точка оператора $T.$
Б. Гальперин в своей статье [12] предложил модифицированный вариант МПП в форме
и, используя результаты работы [11], установил сильную сходимость итераций к некоторой точке из ${\text{Fix}}(T).$ Для формулировки теоремы сходимости нам понадобится определение допустимой последовательности ${{\gamma }_{i}}.$Определение 6. Числовая последовательность ${{\gamma }_{i}}$ называется допустимой, если следующие условия выполняются:
1) $0 < {{\gamma }_{i}} < 1,\;i = 1,2,...;$
2) ${{\gamma }_{i}} < {{\gamma }_{{i + 1}}},$ $i = 1,2,...,$ $li{{m}_{{i \to \infty }}}{{\gamma }_{i}} = 1$ и справедливы соотношения:
3) существует последовательность номеров $n(i)$ такая, что $n(i + 1) > n(i)$ и справедливы соотношения:
4) $li{{m}_{{i \to \infty }}}{{\varepsilon }_{{i + n(i)}}}\varepsilon _{i}^{{ - 1}} = 1,$ где ${{\varepsilon }_{i}} = 1 - {{\gamma }_{i}};$
5) $li{{m}_{{i \to \infty }}}n(i){{\varepsilon }_{i}} = \infty .$
Теорема 8. Пусть выполнены условия теоремы 7. Тогда для любого начального приближения ${{x}^{0}} \in D$ и для любой допустимой последовательности ${{\gamma }_{k}}$ последовательность ${{x}^{k}}$, порождаемая процессом (5.2), сходится сильно к $\hat {x} \in {\text{Fix}}(T),$ ближайшей к ${{v}_{0}}.$
Замечание 3. Если в теореме 8 наряду с условием $T \in \mathcal{K}$ оператор принадлежит классу $\mathcal{P}_{M}^{\nu }$ (или даже ${{\mathcal{K}}_{M}}$), то в качестве множества $D$ можно взять шар $S(z;r)$ произвольного радиуса $r$ с центром в неподвижной точке $z,$ содержащий ${{v}_{0}}.$ Это означает, что сходимость итерационного метода (5.2) будет гарантирована для любой начальной точки ${{x}^{0}}.$
Замечание 4. Последовательность ${{\gamma }_{i}} = 1 - {{i}^{{ - p}}}$ при $0 < p < 1$ и $n(i) = {{i}^{\nu }},$ $0 < p < \nu < 1$ является допустимой в смысле определения 6. Как было отмечено в разд. 3, основные постановки некорректных задач могут быть сведены к нахождению неподвижной точки некоторого отображения на основе МПП (4.2) или его модифицированного аналога (5.2). Следовательно, в случае возмущенных данных задачи с уровнем погрешности $\delta $ необходимо формулировать правило останова итераций, которое бы гарантировало сильную сходимость ${{x}^{{k(\delta )}}} \to \hat {x} \in {\text{Fix}}(T).$
Исследуем регуляризующие свойства итерационного процесса (5.2). Рассмотрим наряду с (5.2) ее аналог с возмущенным оператором $\tilde {T}$
(5.3)
${{\tilde {x}}^{{k + 1}}} = {{\gamma }_{{k + 1}}}\tilde {T}({{\tilde {x}}^{k}}) + (1 - {{\gamma }_{{k + 1}}}){{v}_{0}}$(5.4)
${\text{||}}\tilde {T}(\tilde {x}_{{}}^{k}) - T(\tilde {x}_{{}}^{k}){\text{||}} \leqslant \phi (\delta ),\quad k = 0,1,...,$(5.5)
${\text{||}}\tilde {T}({{x}^{k}}) - T({{x}^{k}}){\text{||}} \leqslant \phi (\delta ),\quad k = 0,1,...,$Теорема 9. Пусть выполнены условия теоремы 8 и имеет место либо соотношение (5.4), либо (5.5), причем в последнем случае дополнительно предполагается, что $\tilde {T} \in \mathcal{K}$. Тогда при связи параметров $k(\delta )\phi (\delta ) \to 0$, $\delta \to 0$, последовательность ${{\tilde {x}}^{{k(\delta )}}},$ сформированная процессом (5.3), сходится к $\hat {x} \in {\text{Fix}}(T),$ ближайшей к ${{v}_{0}}.$
6. ПРИЛОЖЕНИЯ МПП С КОРРЕКТИРУЮЩИМИ МНОЖИТЕЛЯМИ
Обратимся к уравнению (4.5) и рассмотрим процессы (4.6), (4.7), где теперь вместо матрицы линейный ограниченный оператор $A,$ действующий на паре гильбертовых пространств, обратный оператор ${{A}^{{ - 1}}}$ которого в общем случае разрывный. Нетрудно проверить, что оператор шага в каждом из этих процессов является нерастягивающим, поэтому из теоремы 8 получаем
Следствие 3. Итерационный процесс (5.2), где $T$ – оператор шага любого из процессов (4.6), (4.7), сходится сильно к решению, в общем случае, в смысле наименьших квадратов, ближайшему к ${{v}_{0}}$.
Пусть вместо точной пары $(A,y)$ известны приближенные данные ${{A}_{\delta }},\;{{y}_{\delta }}$ такие, что ${\text{||}}A - {{A}_{\delta }}{\text{||}} \leqslant \delta $, ${\text{||}}y - {{y}_{\delta }}{\text{||}} \leqslant \delta $. Несложная проверка показывает, что в этом случае выполнены соотношения (5.4), (5.5) с функцией $\phi (\delta ) = c\delta ,$ где $c$ – некоторая константа, следовательно, из теоремы 9 имеем
Следствие 4. При связи параметров $k(\delta )\delta \to 0,$ $\delta \to 0$ последовательность ${{\tilde {x}}^{{k(\delta )}}},$ построенная процессом (5.3) с возмущенными данными ${{A}_{\delta }},\;{{y}_{\delta }}$ сходится к решению операторного уравнения (4.5), ближайшему к ${{v}_{0}}$. Аналогичное утверждение справедливо для процесса
где $U \in \mathcal{P}_{Q}^{\nu } \cap \mathcal{K},$ $M \cap Q \ne \emptyset $ при наличии априорной информации о решении операторного уравнения в виде $x \in Q.$В качестве примера множества априорных ограничений для операторного уравнения рассмотрим систему линейных неравенств
(6.2)
$Q = \{ x \in H\,:\;\;{{l}_{i}}(x) \equiv \left\langle {x,{{a}_{i}}} \right\rangle - {{q}_{i}} \leqslant 0\} $(6.3)
${{U}_{i}}(x) = x - \lambda \frac{{l_{i}^{ + }{{a}_{i}}}}{{{\text{||}}{{a}_{i}}{\text{||}}}},\quad 0 < \lambda < 2.$Справедлива следующая [7]
Лемма 2. Оператор ${{U}_{i}}$ принадлежит классу $\mathcal{P}_{{{{Q}_{i}}}}^{\nu } \cap K,$ т.е. является сильно фейеровским и нерастягивающим; здесь ${{Q}_{i}} = \{ x \in H\,:\;\;\left\langle {x,{{a}_{i}}} \right\rangle - {{q}_{i}} \leqslant 0\} ,$ $\nu = (2 - \lambda ){\text{/}}\lambda .$
Это означает, что в качестве оператора $U$ в процессе (6.1) можно принять оператор, образованный произведением или выпуклой суммой операторов ${{U}_{i}}$. Заметим, что при $\lambda = 1$ оператор ${{U}_{i}}$ совпадает с метрической проекцией на гиперплоскость ${{l}_{i}}(x) = 0.$
В приложениях часто используется априорная информация о неотрицательности, монотонности или выпуклости решения в разных сочетаниях. Вместе с ограниченностью эти свойства порождают компактные множества, например, в ${{L}_{p}}.$ После дискретной аппроксимации априорные ограничения принимают вид выпуклых многогранников. В монографии [13] разработаны специальные методы, алгоритмы и программные средства построения регуляризованного семейства приближенных решений для линейных некорректных задач с учетом априорных ограничений такого типа.
Рассмотрим сначала частный случай задачи (3.1), когда целевой функционал – квадратичный
где $A$ – линейный ограниченный оператор, действующий на паре гильбертовых пространств ${{H}_{1}},\;{{H}_{2}}$, а $Q$ – выпуклое замкнутое необязательно компактное подмножество из ${{H}_{1}}.$ Поскольку компактность множества не предполагается и допускается неограниченность обратного оператора ${{A}^{{ - 1}}},$ то задача некорректна по Тихонову. Предполагается, что задача (6.4) имеет непустое множество решений $M$. Согласно теоремам 1, 2 задача (6.4) эквивалентна решению операторного уравнения где ${{P}_{Q}}$ – оператор метрического проектирования. Сформируем МПП с оператором шага $T$(6.5)
${{x}^{{k + 1}}} = {{P}_{Q}}[{{x}^{k}} - \beta (A{\text{*}}A{{x}^{k}} - A{\text{*}}y)] \equiv T({{x}^{k}}),$Лемма 3. При $0 < \beta < 2{\text{||}}A{\text{|}}{{{\text{|}}}^{{ - 1}}}$ оператор шага $T$ итерационного метода (6.5) принадлежит классу $\mathcal{P}_{{{{Q}_{i}}}}^{\nu } \cap K,$ где параметр $\nu = (1{\text{/}}\beta {\text{||}}A{\text{|}}{{{\text{|}}}^{2}} - 1{\text{/}}2)$.
Из теоремы 8, леммы 3 и замечания 3 выводим
Следствие 5. Если последовательность ${{\gamma }_{k}}$ является допустимой, то для любого начального приближения ${{x}^{0}}$ процесс
(6.6)
${{x}^{{k + 1}}} = {{\gamma }_{{k + 1}}}{{P}_{Q}}[{{x}^{k}} - \beta (A{\text{*}}A{{x}^{k}} - A{\text{*}}y)] + (1 - {{\gamma }_{{k + 1}}}){{v}_{0}},$Замечание 5. Если пара $(A,y)$ задана своим $\delta $-приближением $({{A}_{\delta }},{{y}_{\delta }}),$ то для процесса (6.6) справедливо заключение следствия 4 о сходимости итераций к решению $\hat {x}$ при выборе числа итераций $k(\delta )$ таким образом, чтобы $k(\delta )\delta \to 0$ при $\delta \to 0.$
Рассмотрим теперь задачу минимизации выпуклого функционала в общей форме (3.1). Из теорем 1, 2 следует, что решение задачи (3.1) сводится к нахождению неподвижной точки оператора
где $F(x) = \nabla \phi (x)$, $Q$ – выпуклое замкнутое ограниченное подмножество из $H$, ${{P}_{Q}}$ – оператор метрического проектирования. Справедливо следующее утверждение (см. [15, лемма 4.1]).Лемма 4. Если ${\text{||}}F{\kern 1pt} {\text{'}}(x){\text{||}} \leqslant N,$ $x \in Q,$ то при $0 < \gamma \leqslant 2{\text{/}}N$ оператор $T,$ определяемый формулой (6.7), является нерастягивающим.
Из теоремы 8 и леммы 4 получаем
Следствие 6. Пусть выполнены условия леммы 4 и задача (3.1) имеет непустое множество решений. Тогда для любого ${{v}_{0}}$ и для любой допустимой последовательности ${{\gamma }_{k}}$ процесс
(6.8)
${{x}^{{k + 1}}} = {{\gamma }_{{k + 1}}}{{P}_{Q}}({{x}^{k}} - \gamma \nabla \phi ({{x}^{k}})) + (1 - {{\gamma }_{{k + 1}}}){{v}_{0}}$Заметим, что при ${{\gamma }_{k}} = \tfrac{1}{{1 + {{{(1 + k)}}^{p}}}},$ $0 < p < 1,$ ${{v}_{0}} = 0$ утверждение о сильной сходимости (6.8) содержится в работе [14] (см. теорему 4.1).
Установим регуляризующие свойства построенного итерационного процесса.
Теорема 10. Пусть целевой функционал $\phi $ в задаче (3.1) задан приближенно функционалом ${{\phi }_{\delta }}$ и выполнены условия аппроксимации
(6.9)
${\text{||}}\nabla \phi (x) - \nabla {{\phi }_{\delta }}(x){\text{||}} \leqslant \delta \quad \forall x \in Q.$Действительно, по теореме 9 для сходимости итераций в условиях возмущенных данных достаточно проверить для оператора $T(x) = {{P}_{Q}}(x - \gamma F(x))$ выполнение условия (5.4), которое в нашем случае, с учетом (6.9), принимает вид
Prox-метод позволяет аппроксимировать решение некорректной задачи минимизации выпуклого функционала (3.1) последовательностью решений корректно поставленных задач с равномерно выпуклым целевым функционалом, которые эффективно решаются традиционными методами.
Определение 7. Отображение $S_{Q}^{\phi }\,:\;\;H \to Q \subset H,$ определяемое соотношением
Теорема 11. Prox-отображение $S_{Q}^{\phi }$ принадлежит классу $\mathcal{P}_{M}^{1} \cap \mathcal{K},$ т.е. является сильно M-фейеровским и нерастягивающим оператором, где $M$ – множество решений задачи (3.1).
Теорема 8 вместе с теоремой 11 влекут (см. [9, лемма 2.7])
Следствие 7. Пусть задача (3.1) разрешима и $\hat {x}$ – ее решение, ближайшее к ${{v}_{0}}.$ Тогда для ${{x}^{0}} \in Q$ и допустимой последовательности ${{\gamma }_{k}}$ процесс
(6.10)
${{x}^{{k + 1}}} = {{\gamma }_{{k + 1}}}S_{Q}^{\phi }({{x}^{k}}) + (1 - {{\gamma }_{{k + 1}}}){{v}_{0}}$Необходимо отметить, что при реализации процесса (6.10) требуется вычислять $w = S_{Q}^{\phi }(v)$ в каждой итерационной точке $v = {{x}^{k}},$ где prox-отображение задано неявно и элемент $w$ находится как решение задачи на минимум для равномерно выпуклого функционала. Это означает, что для приближенного вычисления $w = S_{Q}^{\phi }(v)$ можно привлечь МПП со сжимающим оператором. Действительно, согласно теоремам 1, 2 вычисление $w$ сводится к нахождению неподвижной точки оператора $T = {{P}_{Q}}(x - \gamma F(x)),$ т.е. к решению уравнения
где $F(x) = \nabla \phi (x) + (x - v).$Лемма 5. Пусть ${\text{||}}F(x) - F(u){\text{||}} \leqslant C{\text{||}}x - u{\text{||}},$ тогда при $\gamma < 2{\text{/}}{{C}^{2}},$ ${\text{||}}T(x) - T(u){\text{||}} < {\text{||}}x - v{\text{||}},$ а при $\gamma = 1{\text{/}}{{C}^{2}},$ $C > 1$, справедлива оценка
Таким образом, для приближенного вычисления $S_{Q}^{\phi }({{x}^{k}})$ в процессе (6.10) можно применить МПП со сжимающим оператором $T$. Если структура множества допускает экономичный алгоритм вычисления метрической проекции ${{P}_{Q}},$ то в целом процесс (6.10) может оказаться вполне эффективным.
7. ДВУХЭТАПНЫЕ МЕТОДЫ РЕШЕНИЯ НЕЛИНЕЙНЫХ УРАВНЕНИЙ С МОНОТОННЫМ ОПЕРАТОРОМ
Регуляризованное семейство приближенных решений для вариационного неравенства (3.2) может быть сформировано на основе принципа итеративной регуляризации А.Б. Бакушинского с помощью итерационной схемы [15]
(7.1)
${{x}^{{k + 1}}} = {{P}_{Q}}[{{x}^{k}} - {{\gamma }_{k}}(F({{x}^{k}}) + {{\varepsilon }_{k}}G({{x}^{k}}))],$Теорема 12. Пусть $F(x) = A(x) - y,$ $A$ – монотонный оператор, для которого $\sup \{ {\text{||}}A{\text{'}}(x){\text{||}}{\kern 1pt} :\;x \in Q\} \leqslant C,$ $y$ задан приближенно элементом ${{y}_{\delta }},$ ${\text{||}}y - {{y}_{\delta }}{\text{||}} \leqslant \delta .$ Пусть параметры ${{\gamma }_{k}},{{\varepsilon }_{k}}$ выбраны в соответствии с соотношениями
Выше уже исследовалась некорректная задача с монотонным оператором в форме вариационного неравенства и итеративно регуляризованный метод последовательных приближений, который порождает регуляризованное семейство приближенных решений. Ниже рассмотрим некорректную задачу в форме операторного уравнения (3.4), где $A:H \to H,$ – монотонный оператор с разрывным обратным ${{A}^{{ - 1}}},$ правая часть задана приближенно ${{y}_{\delta }},{\text{||}}y - {{y}_{\delta }}{\text{||}} \leqslant \delta .$ Для построения устойчивого приближенного решения на первом этапе к операторному уравнению применяется схема Лаврентьева
а на втором для аппроксимации регуляризованного решения ${{x}_{\alpha }}$ используются $\kappa {\text{ - }}$процессы(7.3)
${{x}^{{k + 1}}} = {{x}^{k}} - \beta \frac{{\left\langle {{{{(A{\text{'}}({{x}^{0}}) + \alpha I)}}^{\kappa }}{{S}_{\alpha }}({{x}^{k}}),{{S}_{\alpha }}({{x}^{k}})} \right\rangle }}{{\left\langle {{{{(A{\text{'}}({{x}^{0}}) + \alpha I)}}^{{\kappa + 1}}}{{S}_{\alpha }}({{x}^{k}}),{{S}_{\alpha }}({{x}^{k}})} \right\rangle }}{{S}_{\alpha }}({{x}^{k}}),$Теорема 13. Пусть $A$ – монотонный оператор, $A{\text{'}}({{x}^{0}})$ – самосопряженный (неотрицательно определенный) оператор и выполнены условия
(7.4)
${\text{||}}{{x}^{k}} - {{x}_{\alpha }}{\text{||}} \leqslant {{q}^{k}}{\text{||}}{{x}^{0}} - {{x}_{\alpha }}{\text{||}},\quad q = \left[ {1 - \frac{{{{\alpha }^{4}}}}{{{{{({{N}_{0}} + \alpha )}}^{2}}{{{(N + \alpha )}}^{2}}}}} \right].$Для получения оценки погрешности двухэтапного метода зададим класс корректности (равномерной регуляризации) в форме истокообразной представимости решения
Введем переобозначение для решения регуляризованного уравнения (7.2), теперь $x_{\alpha }^{\delta }$ обозначаем решение с приближенной правой частью ${{y}_{\delta }},$ а ${{x}_{\alpha }}$ в случае точно заданной $y.$ Согласно результату из работы [19] для регуляризованного решения справедливы оценки(7.5)
${\text{||}}{{x}_{{\alpha (\delta )}}} - \hat {x}{\kern 1pt} {\text{||}} \leqslant 2\sqrt {{{k}_{0}}\delta } ,\quad {{k}_{0}} = (1 + {{N}_{2}}r{\text{/}}2)r.$(7.6)
${\text{||}}x_{{\alpha (\delta )}}^{{\delta ,k(\delta )}} - \hat {x}{\kern 1pt} {\text{||}} \leqslant 4\sqrt {{{k}_{0}}\delta } ,$Рассмотрим двухэтапный метод решения нелинейного уравнения (3.4) с монотонным непрерывно дифференцируемым оператором $A:H \to H,$ для которого выполнены условия
(7.7)
${\text{||}}A{\text{'}}(x){\text{||}} \leqslant {{N}_{1}},\quad {\text{||}}A{\text{'}}(x) - A{\text{'}}(v){\text{||}} \leqslant {{N}_{2}}{\text{||}}x - v{\text{ ||}}$(7.8)
${{x}^{{k + 1}}} = {{x}^{k}} - \beta {{[A{\text{'}}({{x}^{0}}) + \bar {\alpha }I]}^{{ - 1}}}{{S}_{\alpha }}({{x}^{k}}) \equiv T({{x}^{k}}).$Теорема 14. Пусть производная $A{\text{'}}({{x}^{0}})$ является самосопряженным (неотрицательно определенным) оператором и выполнены условия (7.7). Пусть параметры $\alpha ,\bar {\alpha }$ и начальное приближение ${{x}^{0}}$ удовлетворяют соотношениям:
(7.9)
${\text{||}}{{x}^{k}} - {{x}_{\alpha }}{\text{||}} \leqslant {{q}^{k}}{{r}_{0}},\quad q = {{\left[ {1 - \frac{{{{\alpha }^{2}}}}{{4{{{(\alpha + {{N}_{1}})}}^{2}}}}} \right]}^{{1/2}}},$Из изложенного в теореме 13 следует, что на том же классе корректности истокообразно представимых решений и при условиях теоремы 14 для двухэтапного метода Ньютона–Лаврентьева (7.2), (7.8) также справедлива оптимальная по порядку оценка (7.6) с той лишь разницей, что теперь параметр $q$ определяется формулой (7.9).
Замечание 6. Ввиду известного факта, что градиент выпуклого функционала является монотонным оператором (см. [22, лемма 4.10, § 4, гл. III]) $\kappa $-процессы и регуляризованный метод Ньютона могут применяться при аппроксимации регуляризованного решения с выпуклым функционалом Тихонова
в частности, для квадратичного функционала $\phi (x) = {\text{||}}Ax - y{\text{|}}{{{\text{|}}}^{2}}$ и стабилизатора $\Omega (x) = \int_D \,\sqrt {{\text{|}}\nabla x(s){{{\text{|}}}^{2}} + \beta } ds.$Список литературы
Fejér L. Über die Lage der Nullstellen fon Polynomen, die aus Minimumforderungen gewsser Art entspringen // Math. Ann. 1922. B. 85. Nr 1. S. 41–48.
Motzkin T.S., Schoenberg J.J. The relaxation method for linear inequalities // Canad. J. Math. 1954. V. 6. № 3. P. 393–404.
Agmon S. The relaxation method for linear inequalities // Canad. J. Math. 1954. V. 6. № 3. P. 382–392.
Брегман Л.M. Нахождение общей точки выпуклых множеств методом последовательного проектирования // ДАН СССР. 1965. Т. 162. № 3. С. 487–490.
Еремин И.И. Обобщение релаксационного метода Моцкина-Агмона // Успехи матем. наук. 1965. Т. 20. Вып. 2. С. 183–187.
Еремин И.И. Методы фейеровских приближений в выпуклом программировании // Матем. заметки. 1968. Т. 3. Вып. 2. С. 217–234.
Vasin V.V., Eremin I.I. Operators and iterative processes of Fejér type. Theory and applications. Berlin-New York: Walter de Gruyter, 2009.
Васин В.В. Итерационные методы решения некорректных задач с априорной информацией в гильбертовых пространствах // Ж. вычисл. матем. и матем. физ. 1988. Т. 28. № 7. С. 971–980.
Васин В.В., Агеев А.Л. Некорректные задачи с априорной информацией. Екатеринбург: УИФ “Наука”, 1993.
Martinet B. Determination approachee d’un point fixe d’une application pseudo-contractante. Cas de l’ application // C. R. Acad. Sci. Paris. Ser. A-B. 1972. V. 274. P. A163–A165.
Browder F.E. Convergence of approximantes in fixed point of non-expansive nonlinear maps in Banach spaces // Arch. Ration. Mech. Anal.1967. V. 24. № 1. P. 82–90.
Halperin B. Fixed point of nonexpansive maps // Bull. Amer. Math. Soc. 1967. V. 73. № 6. P. 57–961.
Тихонов А.Н., Гончарский А.В., Степанов В.В., Ягола А.Г. Регуляризирующие алгоритмы и априорная информация. М: Наука, 1983.
Eicke B. Konvex-restringierte schlechtgestellte Probleme and ihre Regularizierung durch Iterationverfahren // Dr. diss. Berlin, 1991.
Бакушинский А.Б., Гончарский А.В. Итеративные методы решения некорректных задач. М.: Наука, 1989.
Moreau J.J. Proximite et dualite dans un espace Hilbertien // Bull. Soc. Math. 1965. V. 93. № 2. P. 273–299.
Васин В.В. Регуляризованные модифицированные α-процессы для нелинейных уравнений с монотонным оператором // ДАН. 2016. Т. 469. № 1. С. 13–16.
Красносельский М.А., Вайникко Г.М., Забрейко П.П. и др. Приближенное решение операторных уравнений. Москва.: Наука, 1969.
Tautenhahn U. On the method Lavrentiev regularisation for nonlinear ill-posed problems // Inverse Problems. 2002. V. 18. № 1. P. 191–207.
Васин В.В. Итерационные процессы для некорректно поставленных задач с монотонным оператором // Математические труды. 2018. Т. 21. № 2. С. 117–135.
Ivanov V.K., Vasin V.V., Tanana V.P. Theory of linear ill-posed problems and its applications. Utrecht/Boston/Köln/Tokyo: VSP, 2002.
Гаевский Х., Грёгер К., Захариас К. Нелинейные операторные уравнения и операторные дифференциальные уравнения. М.: Мир, 1978.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики