Доклады Российской академии наук. Науки о Земле, 2020, T. 493, № 1, стр. 58-62

ПРОЕКЦИОННЫЙ МЕТОД РЕШЕНИЯ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ И ЕГО ПРИМЕНЕНИЕ В ГРАВИМЕТРИИ

С. М. Агаян 1, Ш. Р. Богоутдинов 12*, А. А. Булычев 3, член-корреспондент РАН А. А. Соловьев 12, И. А. Фирсов 13

1 Геофизический центр Российской академии наук
Москва, Россия

2 Институт физики Земли им. О.Ю. Шмидта Российской академии наук
Москва, Россия

3 Московский государственный университет имени М.В. Ломоносова
Москва, Россия

* E-mail: shm@gcras.ru

Поступила в редакцию 06.02.2020
После доработки 13.04.2020
Принята к публикации 14.04.2020

Полный текст (PDF)

Аннотация

Существующие методы решения обратных задач в большинстве своем, как, например, метод регуляризации, ищут квазирешение, которое может и не являться решением исходной задачи, а лишь приближено к нему. Предлагаемый подход позволяет описать множество решений, удовлетворяющих поставленной задаче, и на его основе среди этих эквивалентных решений найти то решение, которое наилучшим образом удовлетворяет имеющейся априорной информации о распределении свойств модели.

Ключевые слова: система линейных алгебраических уравнений, многообразие решений, проектор, частное решение, гравиразведка

ВВЕДЕНИЕ

Интерпретация геофизических аномалий представляет собой процедуры извлечения информации из данных наблюденных физических полей, в которых в скрытом виде содержится большой объем геологической информации. Основываясь на данных геофизики можно формально описать распределение физических свойств. При этом моделей, генерирующих наблюденное поле, может быть бесчисленное множество. Поэтому для выполнения содержательной интерпретации необходима вся имеющаяся априорная геолого-геофизическая информация по изучаемому объекту.

Одним из основных методов решения обратных задач геофизики является метод регуляризации. В 1960–1980-е гг. в трудах А.Н. Тихонова, В.К. Иванова, М.М. Лаврентьева, а также в работах их многочисленных учеников была создана классическая теория регуляризации систем линейных алгебраических уравнений (СЛАУ). Однако впоследствии В.Р. Страхов показал, что классическая теория регуляризации СЛАУ условиям и потребностям гравиметрии, магнитометрии, геодезии и геоинформатики не адекватна [1].

Предлагается новый подход, который позволяет описать множество решений, удовлетворяющих поставленной задаче, и затем найти среди этих эквивалентных решений то решение, которое наилучшим образом удовлетворяет имеющейся априорной информации о распределении свойств модели.

Конструктивное описание многообразия решений $\Phi (A,b)$ линейной системы $Ax = b$ в n-мерном евклидовом пространстве $E$ позволяет учесть априорную информацию о свойствах искомого решения ${{x}^{f}}$ путем его поиска на многообразии $\Phi (A,b)$.

Технически это выглядит следующим образом: точка зрения на искомое решение ${{x}^{f}}$ формализуется неотрицательным функционалом $F$ на $\Phi (A,b)$, и решение ${{x}^{f}}$ его минимизирует. Если точек зрения на ${{x}^{f}}$ несколько и за них отвечает система функционалов $\Phi = ({{F}_{1}}, \ldots ,{{F}_{k}})$, то поиск ${{x}^{f}}$ сводится к многокритериальному выбору $B(\Phi ,\Phi (A,b))$ относительно $\Phi $ на $\Phi (A,b)$.

Сказанное выше графически передает схема

(1)
$Ax = b \to \Phi (A,b) \to \Phi \to B(\Phi ,\Phi (A,b)) \to {{x}^{f}}.$

• Первый переход полностью относится к линейной алгебре и состоит в эффективном построении ортогонального дополнения к любому подпространству в $E$.

• Второй переход формализует априорную информацию об искомом решении ${{x}^{f}}$ в систему функционалов $\Phi $ на многообразии $\Phi (A,b)$ и потому требует широкого спектра методов (нечеткая математика, машинное обучение и т.д.).

• Третий переход представляет собой в широком смысле оптимизацию $\Phi $ на $\Phi (A,b)$, включающую в себя как классические непрерывные методы (градиент, штрафные функции и т.д.), так и дискретные (теория выбора, нейронные сети и т.д.).

Конструктивное описание $\Phi (A,b)$ также получается в рамках теории ABS-алгоритмов [2], но, к сожалению, его компьютерная реализация неустойчива (несмотря на наличие управляющих параметров, шаг пересчета решения может быть очень большим). Поэтому в первой части работы мы предлагаем более простую и устойчивую на практике параметризацию $\Phi (A,b)$.

Предметом обсуждения во второй части являются возможности конструктивного описания многообразия решений $\Phi (A,b)$ линейной системы $Ax = b$, которые дает проекционный метод. Рассмотрены две формализации априорной информации вида “искомое решение ${{x}^{f}}$ похоже на известный вектор $\mu \in E$”.

В третьей части приведены два примера, демонстрирующие преимущества подхода, описанного во второй части, над методом регуляризации Тихонова [3] при решении двумерной задачи гравиразведки с использованием априорной информации.

ТЕОРИЯ

Исходное  пространство  $E$  предполагается $n$-мерным евклидовым относительно скалярного произведения (,), 1 – единичный оператор на $E$.

В линейной системе $Ax = b$ ($({{a}_{i}},x) = {{b}_{i}}$), i = 1, ..., m, $x \in E$ под $A$ одновременно понимается как совокупность векторов ${{a}_{i}}$ из $E$, так и матрица размера $m \times n$ с ${{a}_{i}}$ в качестве строк, $b = ({{b}_{i}}{\text{|}}_{1}^{m})$.

Для однородной системы $Ax = 0$ пространство решений $\Phi (A,0)$ в точности совпадает с ортогональным дополнением в $E$ к подпространству $L(A)$, порожденному $A$: $\Phi (A,0) = L{{(A)}^{ \bot }}$. Поэтому для решения системы $Ax = 0$ нужно конструктивно по $A$ построить ортопроектор $H(A)$: $E \to L{{(A)}^{ \bot }}$. В простейшем случае $A = (a)$ его явный вид дается следующей конструкцией:

Определение. Для $a \in E$ положим

(2)
$\begin{gathered} H(a) = 1,\quad {\text{если}}\quad a = 1 \\ H(a) = 1 - \frac{{a{{a}^{T}}}}{{{{a}^{T}}a}},\quad {\text{если}}\quad a \ne 1. \\ \end{gathered} $

По системе векторов $\{ {{a}_{i}}{\text{|}}_{1}^{m}\} $ построим в $E$ итеративно систему векторов $\{ {{\theta }_{i}}{\text{|}}_{1}^{m}\} $ и проекторов $\{ {{H}_{i}}{\text{|}}_{1}^{m}\} $ по следующей схеме:

$\begin{array}{*{20}{l}} {{{\theta }_{1}} = {{a}_{1}}}&{{{H}_{1}} = H({{\theta }_{1}})} \\ {{{\theta }_{2}} = {{H}_{1}}{{a}_{2}}}&{{{H}_{2}} = H({{\theta }_{2}})} \\ \cdots & \cdots \\ {{{\theta }_{k}} = {{H}_{{k - 1}}} \cdots {{H}_{1}}{{a}_{k}}\quad }&{{{H}_{k}} = H({{\theta }_{k}})} \\ \cdots & \cdots \\ {{{\theta }_{m}} = {{H}_{{m - 1}}} \cdots {{H}_{1}}{{a}_{m}}}&{{{H}_{m}} = H({{\theta }_{m}})} \end{array}$

Утверждение. Произведение ${{H}_{1}}{{H}_{2}} \ldots {{H}_{m}}$ является ортопроектором на $L{{({{a}_{1}}, \ldots ,{{a}_{m}})}^{ \bot }}$.

Таким образом, это произведение зависит только от $A$: ${{H}_{1}}{{H}_{2}} \ldots {{H}_{m}} = H(A)$ и осуществляет эффективную по $A$ параметризацию пространства решений $\Phi (A,0)$ однородной системы $Ax = 0$: для любого $s \in E$ образ $H(A)s \in \Phi (A,0)$.

Произвольное решение неоднородной системы $Ax = b$ есть сумма частного $x{\text{*}}$ и однородного, так что $\Phi (A,b) = x{\text{*}} + \Phi (A,0)$. Чтобы найти $x{\text{*}}$, выберем в $E$ ортобазис ${{e}_{1}}, \ldots ,{{e}_{n}}$ и запишем систему в координатном виде:

$\begin{gathered} Ax = b \Leftrightarrow \sum {{a}_{{ij}}}{{x}_{j}} = {{b}_{i}};\quad i = 1, \ldots ,m;\quad j = 1, \ldots ,n; \\ {{a}_{{ij}}} = ({{a}_{i}},{{e}_{j}});\quad {{x}_{j}} = (x,{{e}_{j}}). \\ \end{gathered} $

Введем дополнительную переменную ${{x}_{{n + 1}}}$ и свяжем с неоднородной системой $Ax = b$ расширенную однородную систему

$\sum {{a}_{{ij}}}{{x}_{j}} - {{b}_{i}}{{x}_{{n + 1}}} = 0;\quad i = 1, \ldots ,m;\quad j = 1, \ldots ,n.$

Обозначим ее через $\{ A, - b\} {{x}_{e}} = 0$; xe = (x1, ..., xn, ${{x}_{{n + 1}}})$. Если $x_{e}^{*}$ – решение расширенной системы и ${{x}_{{n + 1}}} = 1$, то $(x_{1}^{*}, \ldots ,x_{n}^{*})$$\Phi (A,b)$. Следовательно, нужно найти параметр $s_{e}^{*} \in {{{\text{P}}}^{{n + 1}}}$, при котором решение $H(\{ A, - b\} )s_{e}^{*}$ системы $\{ A, - b\} {{x}_{e}} = 0$ в последней координате равно 1. В качестве $s_{e}^{*}$ можно взять вектор Мура-Пенроуза последней строки проектора $H(\{ A, - b\} )$: если $({{h}_{{ij}}})$, $i,j = 1, \ldots ,n + 1$ – координатное представление $H(\{ A, - b\} )$ и hn + 1 = = $({{h}_{{n + 1j}}})$, $j = 1, \ldots ,n + 1$ – его последняя строка, то

(3)
$s_{e}^{*} = \frac{{{{h}_{{n + 1}}}}}{{{{{\left\| {{{h}_{{n + 1}}}} \right\|}}^{2}}}}.$

Подведем итог: конструкция $H(A)$ полностью описывает многообразие $\Phi (A,b)$ решений неоднородной линейной системы $Ax = b$.

ВОЗМОЖНОСТИ ПРОЕКЦИОННОГО МЕТОДА

С математической точки зрения проекционный метод полностью и конструктивно решает линейные системы, но в реальности уравнение $Ax = b$ – это только часть целого комплекса условий, которым должно удовлетворять решение ${{x}^{f}}$. Если получится в координатах $x$ выразить какие-либо из оставшихся условий, то поиск искомого решения может быть продолжен на многообразии $\Phi (A,b)$ путем, например, оптимизации системы функционалов $\Phi = ({{F}_{1}}, \ldots ,{{F}_{k}})$, формализующих эти условия.

Предметом нашего рассмотрения будет дополнительное условие “искомое решение ${{x}^{f}}$ похоже на известный вектор $\mu \in E$”. Приведем две его возможные формализации.

1) Первая формализация: “${{x}^{f}}$ – ближайшая к $\mu $ точка на многообразии $\Phi (A,b)$”.

Если $x{\text{*}} + Hs$ – проекционная параметризация $\Phi (A,b)$, то поиск решения ${{x}^{f}}$ сводится к безусловной минимизации по $s$ на $E$ квадрата нормы ${{\left\| {x{\text{*}} + H - \mu } \right\|}^{2}}$, что, в свою очередь, приведет к линейной системе на искомый параметр ${{s}^{f}}$:

(4)
${{H}^{T}}H{{s}^{f}} = {{H}^{T}}x{\text{*}}$
и ${{x}^{f}} = x{\text{*}} + H{{s}^{f}}$.

2) Вторая формализация более инвариантна относительно $\mu $ и в известной степени полукорреляционна: “${{x}^{f}}$ – ближайшая точка на $\Phi (A,b)$ к прямой $L(\mu )$, порожденной вектором $\mu $”.

В данном случае поиск ${{x}^{f}}$ сводится к безусловной минимизации по $s$ и $t$ на произведении $E \times {\text{R}}$ квадрата нормы ${{\left\| {x{\text{*}} + H - \mu t} \right\|}^{2}}$. Нужная пара параметров $({{s}^{f}},{{t}^{f}})$ получается как решение линейной системы

(5)
$\left( {\begin{array}{*{20}{c}} {{{H}^{T}}\mu }&{ - {{H}^{T}}\mu } \\ { - {{\mu }^{T}}H}&{{{{\left\| \mu \right\|}}^{2}}} \end{array}} \right)\left( {\begin{array}{*{20}{c}} {{{s}^{f}}} \\ t \end{array}} \right) = \left( {\begin{array}{*{20}{c}} { - {{H}^{T}}x{\text{*}}} \\ {(x{\text{*}},\mu )} \end{array}} \right)$
и ${{x}^{f}} = x{\text{*}} + H{{s}^{f}}$.

ПРИМЕРЫ

Будут рассмотрены два примера, в которых, в соответствие со схемами (4) и (5) формализации близости искомого решения ${{x}^{f}}$ к известному вектору $\mu $, сравниваются с классической тихоновской регуляризацией [2] относительно стабилизатора ${{\left\| {x - \mu } \right\|}^{2}}$.

Первая система выглядит так

$A = \left( {\begin{array}{*{20}{c}} {0.082}&{0.053}&{0.037}&{0.027}&{0.021}&{0.219}&{0.147}&{0.105}&{0.078}&{0.060} \\ {0.313}&{0.144}&{0.082}&{0.053}&{0.037}&{0.641}&{0.356}&{0.219}&{0.147}&{0.105} \\ {4.624}&{1.048}&{0.313}&{0.144}&{0.082}&{1.774}&{1.234}&{0.641}&{0.356}&{0.219} \\ {0.313}&{1.048}&{4.624}&{1.048}&{0.313}&{0.641}&{1.234}&{1.774}&{1.234}&{0.641} \\ {0.082}&{0.144}&{0.313}&{1.048}&{4.624}&{0.219}&{0.356}&{0.641}&{1.234}&{1.774} \\ {0.037}&{0.053}&{0.082}&{0.144}&{0.313}&{0.105}&{0.147}&{0.219}&{0.356}&{0.641} \\ {0.021}&{0.027}&{0.037}&{0.053}&{0.082}&{0.060}&{0.078}&{0.105}&{0.147}&{0.219} \end{array}} \right),$
$b = \left( {\begin{array}{*{20}{c}} {0.341}&{0.802}&{3.236}&{8.680}&{1.454}&{0.501}&{0.247} \end{array}} \right).$

В качестве $\mu $ берется нулевой вектор, так что в этом случае задача сводится к сравнению минимальных   по норме решений, найден-ных проекционным методом и методом Тихонова.

1) Проекционный метод (схема (4)):

$\begin{array}{*{20}{c}} {{{x}^{f}} = \left( {\begin{array}{*{20}{c}} {0.075}&{0.479}&{1.073}&{0.155}&{ - 0.027}&{ - 0.018}&{1.221}&{0.845}&{0.044}&{ - 0.011} \end{array}} \right)} \\ {\left\| {{{x}^{f}}} \right\| = 1.902,\quad \left\| {A{{x}^{f}} - b} \right\| = 2.238{{e}^{{ - 16}}}.} \end{array}$

2) Метод регуляризации Тихонова ($\alpha = 0.001$):

$\begin{array}{*{20}{c}} {{{x}^{t}} = \left( {\begin{array}{*{20}{c}} {0.139}&{0.346}&{1.168}&{0.262}&{ - 0.074}&{0.285}&{0.615}&{0.691}&{0.406}&{ - 0.074} \end{array}} \right)} \\ {\left\| {{{x}^{t}}} \right\| = 1.639,\quad \left\| {A{{x}^{t}} - b} \right\| = 1.163{{e}^{{ - 2}}}.} \end{array}$

Видно, что полученные ответы не сильно отличаются по норме, но ${{x}^{f}}$ с большим правом является решением заданной системы.

Второй пример связан с обратной задачей гравиразведки на двумерной модели с заданной сеткой плотностей $\rho $ (рис. 1).

Рис. 1.

Cетка плотностей.

В этом случае ${{x}_{j}}$ – неизвестная плотность в $j$-ой прямоугольной ячейке с вершинами $\sigma _{\nu }^{j}$, $\nu $ = 1, 2, 3, 4; ${{b}_{i}}$ – значение наблюденного поля в точке ${{s}_{i}}$ на поверхности; ${{a}_{{ij}}}$ – поле, порождаемое $j$-ой ячейкой в $i$-ой точке наблюдения. Имеем:

$\begin{gathered} {{b}_{i}} = \sum\limits_j {{{a}_{{ij}}}{{x}_{j}},} \\ {{a}_{{ij}}} = Re(G({{s}_{i}},{{\sigma }^{j}})). \\ \end{gathered} $

Для расчета решения прямой задачи гравиметрии в данной статье применяется теория функции комплексной переменной. Для расчета поля, порождаемого каждой ячейкой, использовалась формулы для многоугольника с постоянной плотностью [4].

На рис. 2 показаны заданное распределение плотности $\rho $ и априорная информация $\mu $, которая равна немного зашумленной половине плотности.

Рис. 2.

Плотность исходной модели и априорная информация. Графическое представление показывает значение плотности в ячейке. Нумерация начинается в левом верхнем углу модели и идет непрерывно слева направо и сверху вниз.

На рис. 3 показаны распределения плотностей ${{x}^{f}}$ и ${{x}^{t}}$, найденные соответственно с помощью проекционного метода (5) и метода регуляризации Тихонова с $\alpha = 0.03$. Выбор оптимального значения регуляризующего параметра был произведен итерационным методом “L-кривой”. Метод основан на выборе параметра регуляризации, представляющего хороший баланс между погрешностью и сложностью модели [5]. Видно, что, в то время как метод регуляризации Тихонова добавляет к априорной модели неинформативные фоновые значения, исследуемый метод использует априорную информацию с целью найти подобное решение на многообразии. Таким образом получается, что основная информация сконцентрирована там, где хотел бы ее видеть интерпретатор.

Рис. 3.

Сравнение решений с исходной моделью.

1) Оценка решения проекционным методом (схема (4)):

$\left\| {{{x}^{f}} - \rho } \right\| = 0.4382,\quad \left\| {A{{x}^{f}} - b} \right\| = 5.305{{e}^{{ - 7}}}.$

2) Оценка решения методом регуляризации Тихонова ($\alpha = 0.03$):

$\left\| {{{x}^{t}} - \rho } \right\| = 1.8488,\quad \left\| {A{{x}^{t}} - b} \right\| = 2.144{{e}^{{ - 2}}}.$

ЗАКЛЮЧЕНИЕ

Авторы предполагают дальнейшее применение проекционного метода для комплексирования геолого-геофизических данных в обратных задачах геофизики. На сегодняшний день результаты такого комплексирования являются, как правило, квазирешениями. Представляется, что проекционный метод позволит перейти от них к более точным решениям.

Список литературы

  1. Страхов В.Н. Будущее теории интерпретации гравитационных аномалий // Физика Земли. 2013. № 6. С. 151–168.

  2. Абаффи Й., Спедикато Э. Проекционные ABS-алгоритмы. Москва: Мир. 1996. 267 с.

  3. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. Москва: Наука. 1979. Изд. 2-е. 285с.

  4. Булычев А.А., Лыгин И.В., Мелихов В.Р. Численные методы решения прямых задач грави- и магниторазведки (конспект лекций). Москва: Геологический факультет МГУ им. М.В. Ломоносова. 2010. 164 с.

  5. Richard C., Aster, Clifford H. Thurber Parameter Estimation and Inverse Problems. 2nd ed. Academic Press, 2012. 376 p.

Дополнительные материалы отсутствуют.