Журнал вычислительной математики и математической физики, 2019, T. 59, № 6, стр. 972-983

О методе наименьших квадратов для систем линейных обыкновенных дифференциальных уравнений

А. А. Абрамов 1*, Л. Ф. Юхно 2**

1 ВЦ им. А.А. Дородницына ФИЦ ИУ РАН
119333 Москва, ул. Вавилова, 40, Россия

2 ИПМ им. М.В. Келдыша РАН
125047 Москва, Миусская пл., 4а, Россия

* E-mail: alalabr@ccas.ru
** E-mail: yukhno@imamod.ru

Поступила в редакцию 09.01.2019
После доработки 09.01.2019
Принята к публикации 08.02.2019

Полный текст (PDF)

Аннотация

В работе рассматриваются некоторые способы применения метода наименьших квадратов к решению краевых задач для переопределенных систем линейных обыкновенных дифференциальных уравнений с избыточными граничными условиями. Такие задачи в общем случае могут не иметь решения. В этих способах для такого рода задач вариационный подход применяется как для системы уравнений, так и для соответствующих граничных условий. В одном из способов порядок уравнений рассматриваемой системы повышается; в этом случае для нее формулируются дополнительные граничные условия. Приводятся модельные примеры применения методов и их сравнение. Библ. 9. Фиг. 2.

Ключевые слова: переопределенная система линейных обыкновенных дифференциальных уравнений, краевая задача, избыточные граничные условия, метод наименьших квадратов.

ВВЕДЕНИЕ

Метод наименьших квадратов широко используется в линейной алгебре, в частности для приближенного решения прямоугольных систем линейных алгебраических уравнений (см., например, [1]). В настоящей работе этот метод применяется для решения переопределенных систем линейных обыкновенных дифференциальных уравнений с избыточными граничными условиями. Такие задачи могут не иметь решения. Именно эта возможность – главная тема настоящей работы.

Применение вариационных методов решения краевых задач для обыкновенных дифференциальных уравнений связано с заменой краевой задачи задачей минимизации некоторого функционала. Метод наименьших квадратов – это способ получения таких функционалов, которые минимизируются решением исходной краевой задачи.

В работе рассматриваются два способа применения метода наименьших квадратов для указанных дифференциальных задач. Основная область применения методов – задачи, не имеющие решения. В этих методах вариационный подход применяется как для системы уравнений, так и для граничных условий. В одном из них порядок исходных уравнений повышается, что требует построения дополнительных граничных условий для преобразованной дифференциальной системы. В результате оба метода сводят исходную неразрешимую дифференциальную задачу также к дифференциальной задаче, но для замкнутой системы с достаточными граничными условиями. Будем считать, что полученная задача разрешима.

Рассматриваемые в работе способы применения метода наименьших квадратов не эквивалентны, поскольку в них метод действует в разных линейных пространствах. Использование и сравнение этих способов проиллюстрированы на простых модельных примерах.

Кроме того, в работе рассмотрено применение предложенных методов к случаю краевой задачи со связанными граничными условиями.

Другие подходы к решению краевых задач с избыточными условиями, подобных рассматриваемым в работе, изучались авторами ранее (см., например, [2], [3]).

1. О МЕТОДЕ НАИМЕНЬШИХ КВАДРАТОВ В ЛИНЕЙНОЙ АЛГЕБРЕ

В линейной алгебре для приближенного решения ряда задач часто используется метод наименьших квадратов, который, в частности, для решения систем линейных уравнений состоит в следующем.

Рассмотрим систему линейных алгебраических уравнений

(1.1)
$Ax = b,$
где $A$$m \times n$-матрица, $x$$n$-столбец, $b$$m$-столбец; все величины комплексные.

Будем использовать принятые в литературе определения. Система (1.1) называется замкнутой, если $m = n$, переопределенной, если $m > n$, и недоопределенной, если $m < n$. Нам особенно важен случай переопределенной системы, когда $m > n$. Система (1.1) может не иметь решения.

В методе наименьших квадратов вместо системы (1.1) рассматривается модифицированная система

(1.2)
$A{\kern 1pt} {\text{*}}Ax = A{\kern 1pt} {\text{*}}b.$
Здесь и далее A* обозначает сопряженную матрицу (оператор). Переход от системы (1.1) к системе (1.2) называется первой трансформацией Гаусса. Трансформированная система (1.2) всегда совместна; перейти от несовместной системы к совместной – цель метода наименьших квадратов. Каждое решение системы (1.2) (и только эти решения) дает минимум функционала ${\text{|}}Ax - b{{{\text{|}}}^{2}}$, где ${\text{|}}z{\text{|}} = \sqrt {z{\text{*}}z} $ ; отсюда название метода.

Если система (1.1) несовместна, то векторы, минимизирующие этот функционал, называются ее обобщенными или псевдорешениями.

Указанную терминологию будем использовать также в дифференциальном случае.

2. ПОСТАНОВКА ЗАДАЧИ

Рассматривается линейная система обыкновенных дифференциальных уравнений вида

(2.1)
$A(t)y{\kern 1pt} ' = B(t)y + f(t),$
где $0 < t < 1$, $y$$n$-столбец, $f$$m$-столбец, $A$ и $B$$m \times n$-матрицы, $m \geqslant n$, $\operatorname{rank} A = n$. Все заданные функции от $t$ непрерывны. При $m > n$ система является переопределенной.

Для этой системы уравнений ставятся следующие, также линейные, граничные условия

(2.2)
${{a}_{1}}y(0) = {{c}_{1}},\quad {{a}_{2}}y(1) = {{c}_{2}},$
где ${{a}_{1}}$${{k}_{1}} \times n$-матрица, ${{c}_{1}}$${{k}_{1}}$-столбец, ${{a}_{2}}$${{k}_{2}} \times n$-матрица, ${{c}_{2}}$${{k}_{2}}$-столбец; возможно, ${{k}_{1}} + {{k}_{2}} \ne n$. Если ${{k}_{1}} + {{k}_{2}} = n$, то такие граничные условия называются достаточными. Нам особенно интересен случай, когда ${{k}_{1}} + {{k}_{2}} > n$, т.е. рассмотрение задачи с избыточными граничными условиями. Такая переопределенная задача (2.1), (2.2) может не иметь решения.

Будем называть избыточные граничные условия согласованными, если краевая задача разрешима.

Рассмотрим два способа применения метода наименьших квадратов к этой задаче.

3. ВАРИАЦИОННЫЙ ПОДХОД К РЕШЕНИЮ ЗАДАЧИ. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

3.1. Первый способ

В первом способе применения вариационных принципов для решения задачи (2.1), (2.2) дополнительно предположим, что функции $A(t)$, $B(t)$ и $f(t)$ непрерывно дифференцируемы и $\operatorname{rank} {{a}_{1}} = {{k}_{1}}$, $\operatorname{rank} {{a}_{2}} = {{k}_{2}}$. При этом предположении мы имеем ${{k}_{1}} + {{k}_{2}}$ линейно независимых граничных условий (2.2), причем ${{k}_{1}} \leqslant n$, ${{k}_{2}} \leqslant n$.

Пусть задача (2.1), (2.2) является переопределенной и не имеет решения. Цель метода – формулировка краевой задачи для замкнутой дифференциальной системы уравнений с достаточными граничными условиями, решение которой (предполагается, что оно существует) будет приниматься в качестве псевдорешения исходной задачи.

Введем скалярное произведение $(u,v)$ векторных функций $u$ и $v$ как интеграл

$\int\limits_0^1 {v{\kern 1pt} {\text{*}}(t)u(t)dt} .$

Используя метод наименьших квадратов, заменим задачу (2.1), (2.2) задачей минимизации функционала от скалярного квадрата невязки уравнений (2.1)

(3.1)
$\Phi = {{(A(t)y{\kern 1pt} {\text{'}} - B(t)y - f(t))}^{2}} = \int\limits_0^1 {(A(t)y{\kern 1pt} {\text{'}} - B(t)y - f(t)){\text{*}}(A(t)y{\kern 1pt} {\text{'}} - B(t)y - f(t))dt} $
на функциях, удовлетворяющих граничным условиям (2.2). Задачу минимизации этого функционала будем решать классическим вариационным методом (см. [4]). В этом отличие предлагаемого метода от методов типа Ритца, Галеркина (см. [5]) и различных их модификаций (см., например, [6] и приведенную там библиографию), основа которых состоит в том, что функционал минимизируется непосредственно как функция некоторых параметров, определяющих зависимость искомого приближения к функции $y$.

Через $F(t,{{y}_{1}},\;...,\;{{y}_{n}},y_{1}^{'},\;...,\;y_{n}^{'})$ обозначим подынтегральную функцию в (3.1). Функции ${{y}_{i}},\;i = 1,\;...,\;n,$ – компоненты вектора $y(t),$ минимизирующего функционал (3.1), удовлетворяют уравнениям Эйлера

(3.2)
${{F}_{{{{y}_{i}}}}} - \frac{d}{{dt}}{{F}_{{{{y}_{i}}'}}} = 0,\quad i = {\text{1,}}\,...{\text{,}}\,n.$
Система уравнений (3.2) определяет 2n-параметрическое семейство экстремалей вариационной задачи (3.1).

Учитывая вид функции F, можно получить матричную запись системы (3.2), которая будет иметь вид

(3.3)
$B{\kern 1pt} {\text{*}}(Ay{\kern 1pt} {\text{'}} - By - f) + \frac{d}{{dt}}\left( {A{\kern 1pt} {\text{*}}(Ay{\kern 1pt} {\text{'}} - By - f)} \right) = 0$
или

(3.4)
$(A{\kern 1pt} {\text{*}}Ay{\kern 1pt} '){\kern 1pt} {\text{'}} - (A{\kern 1pt} {\text{*}}By){\kern 1pt} {\text{'}} + B{\kern 1pt} {\text{*}}Ay{\kern 1pt} {\text{'}} - B{\kern 1pt} {\text{*}}By - (A{\kern 1pt} {\text{*}}f){\kern 1pt} {\text{'}} - B{\kern 1pt} {\text{*}}f = 0.$

Эта система дифференциальных уравнений состоит из $n$ линейных уравнений второго порядка с коэффициентом при $y{\kern 1pt} ''$, равным $A{\kern 1pt} {\text{*}}A$. Матрица $A{\kern 1pt} {\text{*}}A$ обратима, так что систему (3.4) можно разрешить относительно второй производной вектора $y$.

Введем оператор $D$ как оператор дифференцирования, определенный на функциях, удовлетворяющих граничным условиям (2.2), если положить в них ${{c}_{1}} = 0$ и ${{c}_{2}} = 0$. Пусть $D{\text{*}}$ – сопряженный ему оператор. Используя определение сопряженного оператора

$(Du,v) = (u,D{\kern 1pt} {\text{*}}v),$
нетрудно видеть (используя интегрирование по частям), что оператор $D{\kern 1pt} {\text{*}}$ – это оператор дифференцирования, взятый со знаком минус, при некоторых граничных условиях. Эти граничные условия для дальнейшего нужно сформулировать.

С помощью операторов $D$ и $D{\kern 1pt} {\text{*}}$ систему (3.3) можно записать в эквивалентном виде, который получается, если оператор, сопряженный оператору $(AD - B)$, применить к вектор-функции $Ay{\kern 1pt} {\text{'}} - By - f$ и приравнять нулю. Действительно, мы имеем

(3.5)
$(AD - B){\kern 1pt} {\text{*}}(Ay{\kern 1pt} {\text{'}} - By - f) = (D{\kern 1pt} {\text{*}}A{\kern 1pt} {\text{*}} - B{\kern 1pt} *)(Ay{\kern 1pt} {\text{'}} - By - f) = 0.$
Отсюда, учитывая, что $D{\kern 1pt} {\text{*}}z = - z{\kern 1pt} {\text{'}}$ (z – вектор из области определения $D{\kern 1pt} {\text{*}}$), получается (3.4).

Это свойство будет использовано при получении дополнительных граничных условий для трансформированной задачи.

Проводя параллель, систему уравнений (3.5) можно трактовать как аналог первой трансформации Гаусса дифференциальной системы (2.1) с помощью дифференциального оператора $(AD - B){\text{*}}$. Здесь также от исходной переопределенной дифференциальной системы мы переходим к замкнутой дифференциальной системе, решения которой минимизируют функционал от квадрата невязок исходной системы на функциях, удовлетворяющих граничным условиям (2.2).

Поскольку мы имеем дело с дифференциальными операторами, то рассмотрим подробнее граничные условия соответствующих краевых задач. Отметим, что граничные условия оператора $(AD - B){\text{*}}$ – это граничные условия оператора $D{\kern 1pt} {\text{*}}$ на функциях $A{\kern 1pt} {\text{*}}z$.

Если число заданных линейно независимых граничных условий удовлетворяет условию ${{k}_{1}} = {{k}_{2}} = n$, то получившаяся задача (3.5), (2.2) вполне определенна; ее решение (будем считать, что оно существует) принимается за решение (псевдорешение) исходной задачи (2.1), (2.2) по методу наименьших квадратов.

Если число заданных граничных условий удовлетворяет соотношению ${{k}_{1}} + {{k}_{2}} < 2n$, то возникает необходимость формулировки недостающих граничных условий для трансформированной системы (3.5). Для этого предлагается сделать следующее.

Запишем (3.5) в виде

$D{\kern 1pt} {\text{*}}A{\kern 1pt} {\text{*}}(Ay{\kern 1pt} {\text{'}} - By - f) - B{\kern 1pt} {\text{*}}Ay{\kern 1pt} {\text{'}} + B{\kern 1pt} {\text{*}}By + B{\kern 1pt} {\text{*}}f = 0.$

Далее будем дополнительно предполагать, что векторная функция $A{\kern 1pt} {\text{*}}(Ay{\kern 1pt} {\text{'}} - By - f)$ принадлежит области определения оператора $D{\kern 1pt} {\text{*}}$. Тогда можно вывести соответствующие соотношения, которые дадут необходимые добавочные граничные условия.

Для вывода этих условий найдем граничные условия, которым удовлетворяет оператор $D{\kern 1pt} {\text{*}}$. Для этого вновь используем определение сопряженного оператора $(Du,v) = (u,D{\kern 1pt} {\text{*}}v)$ и интегрирование этого равенства по частям. Поскольку $Du = u{\kern 1pt} {\text{'}}$, $D{\kern 1pt} {\text{*}}v = - v{\kern 1pt} {\text{'}}$, то

$(Du,v) = \int\limits_0^1 {v{\kern 1pt} {\text{*}}u{\kern 1pt} {\text{'}}dt} = v{\kern 1pt} {\text{*}}\left. u \right|_{0}^{1} - \int\limits_0^1 {v{\kern 1pt} {\text{*}}{\kern 1pt} {\text{'}}udt} = v{\kern 1pt} {\text{*}}\left. u \right|_{0}^{1} + (u,D{\kern 1pt} {\text{*}}v).$
Отсюда следует условие
$v{\kern 1pt} {\text{*}}(1)u(1) - v{\kern 1pt} {\text{*}}(0)u(0) = 0,$
которое должно выполняться на всех функциях $u$, $v$ из области определения операторов $D$, $D{\kern 1pt} {\text{*}}$ соответственно. Если $v(1) = 0$ или $u(1) = 0$, то будет иметь место соотношение

(3.6)
$v{\kern 1pt} {\text{*}}(0)u(0) = 0.$

Наша задача – получить отсюда граничное условие для функции $v$ при $t = 0$.

Допустимое значение $u(0)$ выделяется первым условием (2.2) при ${{c}_{1}} = 0$, т.е. условием ${{a}_{1}}u(0) = 0.$ Из этого условия и условия (3.6) следует соотношение $v{\kern 1pt} {\text{*}}(0) = \gamma {{a}_{1}}$, где $\gamma $ – некоторая ${{k}_{1}}$-строка. Требуется выделить совокупность значений $v(0)$, удовлетворяющих этому соотношению, с помощью условия вида

(3.7)
${{p}_{1}}v(0) = 0,$
где ${{p}_{1}}$ – матрица размера $(n - {{k}_{1}}) \times n$, подлежащая определению. Это даст $(n - {{k}_{1}})$ дополнительных условий и позволит получить на левом конце в сумме $n$ граничных условий.

Условие (3.7) эквивалентно условию $v{\text{*}}(0)p_{1}^{*} = 0,$ т.е. условию $\gamma {{a}_{1}}p_{1}^{*} = 0$. Из этого соотношения, в силу произвольности $\gamma $, для искомой матрицы ${{p}_{1}}$ следует, что совокупность строк этой матрицы ортогональна совокупности строк матрицы ${{a}_{1}}$ в смысле скалярного произведения, определяемого для строк формулой $(w,z) = wz{\text{*}}$. Поэтому в качестве строк искомой матрицы ${{p}_{1}}$ берем базис в $(n - {{k}_{1}})$-мерном ортогональном дополнении к ${{k}_{1}}$-мерному пространству строк матрицы ${{a}_{1}}$.

Используя условие (3.7), сформулируем дополнительные граничные условия на левом конце для системы (3.5). С учетом предположения, что функция $A{\kern 1pt} {\text{*}}(Ay{\kern 1pt} {\text{'}} - By - f)$ принадлежит области определения оператора $D{\kern 1pt} {\text{*}}$ и, следовательно, удовлетворяет граничным условиям этого оператора, т.е условию (3.7), получим искомые граничные условия в виде

(3.8)
${{p}_{1}}A{\kern 1pt} {\text{*}}(0)(A(0)y{\kern 1pt} {\text{'}}(0) - B(0)y(0) - f(0)) = 0$
(всего $n - {{k}_{1}}$ условий).

В частности, если на левом конце не задано никаких граничных условий, т.е. ${{k}_{1}} = 0$, то ${{p}_{1}}$ – квадратная невырожденная $(n \times n)$-матрица и дополнительные граничные условия будем задавать уравнением

(3.9)
$A{\kern 1pt} {\text{*}}(0)(A(0)y{\kern 1pt} {\text{'}}(0) - B(0)y(0) - f(0)) = 0$
(всего $n$ условий).

Аналогично для оператора $D{\kern 1pt} {\text{*}}$ находятся граничные условия при $t = 1$ вида

(3.10)
${{p}_{2}}v(1) = 0,$
где ${{p}_{2}}$ – матрица размера $(n - {{k}_{2}}) \times n$. Из (3.10), как показано выше, следует, что в качестве строк матрицы ${{p}_{2}}$ можно взять базис в $(n - {{k}_{2}})$-мерном ортогональном дополнении к ${{k}_{2}}$-мерному пространству строк матрицы ${{a}_{2}}$. В результате для трансформированной задачи (3.5) получаются дополнительные граничные условия при $t = 1$ вида
(3.11)
${{p}_{2}}A{\kern 1pt} {\text{*}}(1)(A(1)y{\kern 1pt} {\text{'}}(1) - B(1)y(1) - f(1)) = 0$
(всего $n - {{k}_{2}}$ условий).

При ${{k}_{2}} = 0$ граничные условия задаются уравнением

(3.12)
$A{\kern 1pt} {\text{*}}(1)(A(1)y{\kern 1pt} {\text{'}}(1) - B(1)y(1) - f(1)) = 0,$
что дает $n$ условий.

Отметим, что выполнение условий (3.9), (3.12) означает требование, чтобы в точках $t = 0$, $t = 1$ решение системы (3.5) удовлетворяло уравнению

$A{\kern 1pt} {\text{*}}Ay{\kern 1pt} {\text{'}} - A{\kern 1pt} {\text{*}}By - A{\kern 1pt} {\text{*}}f = 0.$

Таким образом, мы получили систему $n$ линейно независимых уравнений второго порядка (3.5) и $2n$ линейно независимых граничных условий для нее: при $t = 0$ – это условия (3.8) и первое из условий (2.2), что в сумме дает $n$ условий, или $n$ условий (3.9); аналогично, при $t = 1$ – это условия (3.11) и второе условие (2.2), или $n$ условий (3.12). Такая задача является полностью определеной. Ее решение, как и в случае заданных достаточных граничных условий для (3.5), дает решение (псевдорешение) исходной задачи (2.1), (2.2) по методу наименьших квадратов.

На способах решения системы (3.5) мы не останавливаемся. Отметим только, что если известна фундаментальная система решений соответствующей однородной системы, то решение неоднородной системы может быть выражено в квадратурах. Решение уравнения (3.5), полученного для одного уравнения вида (2.1), всегда выражается в квадратурах (см. Замечание ниже). При численном решении полученной краевой задачи для системы (3.5) применяется, в частности, метод ортогональной прогонки (см. [7]).

Проиллюстрируем применение изложенного метода на некоторых простых примерах. В качестве таких примеров мы будем рассматривать следующий класс задач. Пусть переопределенная задача имеет решение (притом единственное), но если в исходные данные задачи (уравнения или граничные условия) вносится погрешность, то такая возмущенная краевая задача становится неразрешимой. Очевидно, в этом случае псевдорешение, полученное описанным способом, для достаточно малых погрешностей будет близко к решению невозмущенной задачи.

Пример 1. Пусть $n = 1$ и задача (2.1), (2.2) имеет вид

(3.13)
$y{\kern 1pt} {\text{'}} = 2t,\quad y(0) = 0,\quad y(1) = 1.$

Эта задача переопределенная (с избыточными согласованными граничными условиями) и имеет единственное решение $y = {{t}^{2}}.$

Если внести погрешность в коэффициенты уравнения, например, вида

$y{\kern 1pt} {\text{'}} = 2t + \varepsilon ,\quad y(0) = 0,\quad y(1) = 1,$
то граничные условия становятся несогласованными и такая задача решения не имеет. Будем искать ее псевдорешение описанным методом.

В этом случае оператор $D{\kern 1pt} {\text{*}}$ – это минус оператор дифференцирования без каких-либо граничных условий, и задача, полученная после трансформации (3.5), имеет вид

Эта задача определенная (граничные условия у нее достаточные) и имеет единственное решение $y(t) = {{t}^{2}},$ которое в данном случае совпадает с точным решением невозмущенной задачи.

Если внести погрешность в граничные условия задачи (3.13), например, следующим образом:

$y{\kern 1pt} {\text{'}} = 2t,\quad y(0) = 0,\quad y(1) = 1 + \varepsilon ,$
то такие граничные условия несогласованы и задача не имеет решения; ее псевдорешение будет иметь вид $y(t) = {{(t + {\varepsilon \mathord{\left/ {\vphantom {\varepsilon 2}} \right. \kern-0em} 2})}^{2}} - {{{{\varepsilon }^{2}}} \mathord{\left/ {\vphantom {{{{\varepsilon }^{2}}} 4}} \right. \kern-0em} 4}$. (У возмущенного решения вершина параболы сдвинута на величину $O(\varepsilon )$.)

Пример 2. Рассмотрим задачу (2.1), (2.2) для $n = 1$, $m = 2$ вида

(3.14)
$y{\kern 1pt} {\text{'}} = 1,\quad y{\kern 1pt} {\text{'}} = 1 + \varepsilon ,\quad y(0) = 0.$

В этом случае система уравнений переопределенная, а граничное условие одно. (Здесь мы рассматриваем пример возмущения коэффициентов уравнений.) Такая задача решения не имеет.

Здесь

$A = \left( {\begin{array}{*{20}{c}} 1 \\ 1 \end{array}} \right),\quad f = \left( {\begin{array}{*{20}{c}} 1 \\ {1 + \varepsilon } \end{array}} \right),$
$A{\kern 1pt} {\text{*}}A = 2$ и задача для трансформированного уравнения (3.5) имеет вид

$ - 2y{\kern 1pt} '' = 0,\quad y(0) = 0.$

Граничных условий у нее недостаточно, поэтому, согласно (3.12), берем дополнительное условие при $t = 1$ в виде $2y{\kern 1pt} {\text{'}}(1) = 2 + \varepsilon $. Решение трансформированной задачи с такими краевыми условиями – это функция $y = (1 + {\varepsilon \mathord{\left/ {\vphantom {\varepsilon 2}} \right. \kern-0em} 2})t$. Точное решение невозмущенной задачи (3.14), функция $y = \;t,$ отличается от псевдорешения на величину $O(\varepsilon )$.

Рассмотрим более общий пример одного уравнения. Вначале сделаем

Замечание. Пусть система (2.1) состоит из одного уравнения вида $y{\kern 1pt} {\text{'}} - b(t)y = f(t),$ которое разрешимо в квадратурах. Уравнение Эйлера (3.5) для этого случая имеет вид

$(y{\kern 1pt} {\text{'}} - by - f){\kern 1pt} {\text{'}} + b(y{\kern 1pt} {\text{'}} - by - f) = 0.$

Очевидно, что каждое решение исходного уравнения является решением уравнения Эйлера. Поэтому, зная решение однородного уравнения, можно понизить порядок уравнения Эйлера и получить его решение также в квадратурах. Таким образом, для одного уравнения описанный метод всегда позволяет получить искомое псевдорешение в аналитическом виде.

Пример 3. Рассмотрим задачу

(3.15)
$y{\kern 1pt} {\text{'}} - 2ty = {{e}^{{{{t}^{2}}}}},\quad y(0) = {{g}_{0}},\quad y(1) = {{g}_{1}}.$
Общее решение этого уравнения имеет вид $y = (C + t){{e}^{{{{t}^{2}}}}}$. Если ${{g}_{0}}$ и ${{g}_{1}}$ связаны соотношением $\frac{{{{g}_{1}}}}{e} - 1 = {{g}_{0}}$, то задача имеет единственное решение $y = ({{g}_{0}} + t){{e}^{{{{t}^{2}}}}}$. Если эта связь между ${{g}_{0}}$ и ${{g}_{1}}$ нарушена, то задача решения не имеет.

Уравнение Эйлера для этого примера имеет вид

$y{\kern 1pt} {\text{''}} - 2(1 + 2{{t}^{2}})y = 4t{{e}^{{{{t}^{2}}}}}.$
Решение соответствующего однородного уравнения – это функция ${{y}_{1}} = {{e}^{{{{t}^{2}}}}}$. Для понижения порядка уравнения сделаем замену $y = {{y}_{1}}z,\;z{\kern 1pt} ' = u$, где функция $u(t)$ удовлетворяет уравнению $u{\kern 1pt} {\text{'}} + 4tu = 4t$. Решение этого уравнения – $u = 1 + {{C}_{2}}{{e}^{{ - 2{{t}^{2}}}}}$. Отсюда имеем
$z = t + {{C}_{2}}\int\limits_0^t {{{e}^{{ - 2{{t}^{2}}}}}} dt + {{C}_{1}}\quad {\text{и }}\quad y = \left( {{{C}_{1}} + {{C}_{2}}\int\limits_0^t {{{e}^{{ - 2{{t}^{2}}}}}} dt + t} \right){{e}^{{{{t}^{2}}}}}.$
Из граничных условий (3.15) следует
${{C}_{1}} = {{g}_{0}},\quad {{C}_{2}} = \left( {\frac{{{{g}_{1}}}}{e} - 1 - {{g}_{0}}} \right){{\left( {\int\limits_0^1 {{{e}^{{ - 2{{t}^{2}}}}}} dt} \right)}^{{ - 1}}}.$
Если указанное соотношение между ${{g}_{0}}$ и ${{g}_{1}}$ выполняется, то ${{C}_{2}} = 0$ и $y = (g{}_{0} + t){{e}^{{{{t}^{2}}}}}$, что совпадает с точным решением.

3.2. Второй способ

Рассмотрим другой вариант применения метода наименьших квадратов к задаче (2.1), (2.2). В этом способе, в отличие от первого варианта, никаких дополнительных предположений не делается. В частности, здесь допускается, что $\operatorname{rank} {{a}_{1}} < {{k}_{1}}$, $\operatorname{rank} {{a}_{2}} < {{k}_{2}}$, то есть возможны избыточные граничные условия, не являющиеся линейно независимыми.

Как и прежде, наша цель – получить замкнутую согласованную краевую задачу, используя вариационный подход. В этом случае рассмотренный первый способ неприменим. Поступим следующим образом.

Возьмем какую-либо точку $t = {{t}_{0}}$, $0\,\, \leqslant \,\,{{t}_{0}} \leqslant \,\,1,$ и перенесем в нее граничные условия, заданные в точках $t = 0$ и $t = 1$. Для этого будем применять какой-нибудь метод переноса граничных условий (см., например, [7], [8]), используя при этом исходное уравнение (2.1), если система замкнута, т.е. $m = n$, или трансформированное уравнение вида

(3.16)
$A{\kern 1pt} {\text{*}}(t)A(t)y{\kern 1pt} ' = A{\kern 1pt} {\text{*}}(t)B(t)y + A{\kern 1pt} {\text{*}}(t)f(t),$
в противном случае. В результате перенесения всех заданных граничных условий в выбранную точку получится совокупность ${{k}_{1}} + {{k}_{2}}$ линейных алгебраических уравнений относительно величины ${{y}_{0}} = y({{t}_{0}})$. Применим к этой системе уравнений метод наименьших квадратов в виде (1.2). Тогда мы получим значение $y({{t}_{0}})$ (может быть неединственное), которое будет использовано как начальное условие в точке $t = {{t}_{0}}$ для исходного уравнения (при $m = n$) или для уравнения (3.16) (при $m \ne n$) соответственно.

Отметим, что в этом способе отдельно минимизируются сумма квадратов невязок уравнений и сумма квадратов невязок граничных условий.

Продемонстрируем результаты применения этого метода для сравнения на примерах, рассмотренных выше.

Пример 1. Вначале рассмотрим задачу (3.13) с возмущенной правой частью. Выберем какую-либо точку ${{t}_{0}}$, $0\,\, \leqslant \,\,{{t}_{0}} \leqslant \,\,1$. Тогда перенос левого граничного условия в точку ${{t}_{0}}$ решением задачи Коши: $y{\kern 1pt} ' = 2t + \varepsilon ,\;y(0) = 0,$ дает значение $y({{t}_{0}}) = t_{0}^{2} + \varepsilon \,{{t}_{0}},$ а правого – решением задачи Коши: $y{\kern 1pt} ' = 2t + \varepsilon ,\;y(1) = 1,$ – значение $y({{t}_{0}}) = t_{0}^{2} + \varepsilon \,{{t}_{0}} - \varepsilon .$

Получившаяся система уравнений относительно ${{y}_{0}} = y({{t}_{0}})$ имеет вид

$A{{y}_{0}} = b$,
где

$A = \left( {\begin{array}{*{20}{l}} 1 \\ 1 \end{array}} \right),\quad b = \left( {\begin{array}{*{20}{c}} {t_{0}^{2} + \varepsilon {{t}_{0}}} \\ {t_{0}^{2} + \varepsilon {{t}_{0}} - \varepsilon } \end{array}} \right).$

Преобразованная по методу наименьших квадратов система имеет вид $A{\kern 1pt} {\text{*}}A{{y}_{0}} = A{\kern 1pt} {\text{*}}b$, а именно, $2{{y}_{0}} = 2t_{0}^{2} + 2\varepsilon \,{{t}_{0}} - \varepsilon $. Решение уравнения $y{\kern 1pt} ' = 2t + \varepsilon $ с таким начальным условием в точке $t = {{t}_{0}}$ – это псевдорешение возмущенной задачи, полученное рассматриваемым способом применения метода наименьших квадратов; оно задается функцией

$y(t) = {{t}^{2}} + \varepsilon t - \frac{\varepsilon }{2} = {{\left( {t + \frac{\varepsilon }{2}} \right)}^{2}} - \frac{\varepsilon }{2}\left( {\frac{\varepsilon }{2} + 1} \right);$
здесь решение не зависит от выбора точки ${{t}_{0}}$.

Рассмотрим также задачу (3.13) с возмущенным граничным условием. Перенос левого граничного условия в точку ${{t}_{0}}$ решением задачи Коши: $y{\kern 1pt} ' = 2t,\;y(0) = 0,$ дает значение $y({{t}_{0}}) = t_{0}^{2},$ а правого – решением задачи Коши: $y{\kern 1pt} ' = 2t,\;y(1) = 1 + \varepsilon ,$ – значение $y({{t}_{0}}) = t_{0}^{2} + \varepsilon .$

В системе уравнений $A{{y}_{0}} = b$ имеем

$A = \left( {\begin{array}{*{20}{l}} 1 \\ 1 \end{array}} \right),\quad b = \left( {\begin{array}{*{20}{c}} {t_{0}^{2}} \\ {t_{0}^{2} + \varepsilon } \end{array}} \right).$

Из преобразованной по методу наименьших квадратов системы следует начальное условие ${{y}_{0}} = t_{0}^{2} + \frac{\varepsilon }{2}$ в точке $t = {{t}_{0}}$ для уравнения $y{\kern 1pt} ' = 2t$, откуда получаем псевдорешение возмущенной задачи в виде $y = {{t}^{2}} + \frac{\varepsilon }{2};$ это решение также не зависит от выбора начальной точки.

Пример 2. В этом случае псевдорешение задачи (3.14), полученное вторым способом, – это функция $y = (1 + {\varepsilon \mathord{\left/ {\vphantom {\varepsilon 2}} \right. \kern-0em} 2})t;$ оно совпадает с решением, полученным первым способом. Это совпадение, очевидно, обусловлено отсутствием в этой задаче избыточных граничных условий.

Пример 3. Перенос левого граничного условия в точку ${{t}_{0}}$ с помощью уравнения (3.15) дает значение ${{y}_{0}} = y({{t}_{0}}) = ({{t}_{0}} + {{g}_{0}}){{e}^{{{{t}_{0}}^{2}}}}.$ Аналогичный перенос правого граничного условия в точку ${{t}_{0}}$ дает значение ${{y}_{0}} = y({{t}_{0}}) = \left( {{{t}_{0}} + \frac{{{{g}_{1}}}}{e} - 1} \right){{e}^{{{{t}_{0}}^{2}}}}.$

Для нахождения ${{y}_{0}}$ получаем алгебраическую линейную систему уравнений $A{{y}_{0}} = f,$ где

$A = \left( {\begin{array}{*{20}{c}} 1 \\ 1 \end{array}} \right),\quad f = \left( {\begin{array}{*{20}{c}} {({{t}_{0}} + {{g}_{0}}){\kern 1pt} {{e}^{{{{t}_{0}}^{2}}}}} \\ {({{t}_{0}} + \frac{{{{g}_{1}}}}{e} - 1){\kern 1pt} {{e}^{{{{t}_{0}}^{2}}}}} \end{array}} \right).$
Решение этой системы методом наименьших квадратов дает значение
${{y}_{0}} = \left( {{{t}_{0}} + \frac{1}{2}\left( {{{g}_{0}} + \frac{{{{g}_{1}}}}{e} - 1} \right)} \right){{e}^{{{{t}_{0}}^{2}}}}.$
Решение заданного уравнения с таким начальным условием имеет вид
$y(t) = \left( {t + \frac{1}{2}\left( {{{g}_{0}} + \frac{{{{g}_{1}}}}{e} - 1} \right)} \right){{e}^{{{{t}^{2}}}}}$
и не зависит от выбора точки ${{t}_{0}}.$ Если выполняется указанное в этом примере соотношение $\frac{{{{g}_{1}}}}{e} - 1 = {{g}_{0}}$, то получается точное решение исходной задачи $y = ({{g}_{0}} + t){{e}^{{{{t}^{2}}}}}$.

Для иллюстрации на фиг. 1 приведены графики полученных решений этой задачи, в которой значение ${{g}_{0}}$ фиксировалось нулем, а значение ${{g}_{1}}$ варьировалось, т.е. задачи

(3.17)
$y{\kern 1pt} ' = 2ty + {{e}^{{{{t}^{2}}}}},\quad y(0) = 0,\quad y(1) = g,$
с точным решением $y = t{{e}^{{{{t}^{2}}}}}$, удовлетворяющим условию $g = e$.

Фиг. 1.

Графики решений примера 3 для различных значений g.

На этом рисунке сплошной линией изображено точное решение, а пунктирными линиями – псевдорешения, полученные для различных значений $g$.

Пример 4. Рассмотрим также пример задачи, которая допускает решение только вторым способом, поскольку она имеет избыточные линейно зависимые несогласованные граничные условия:

$y{\kern 1pt} ' = 1,\quad \begin{array}{*{20}{l}} {y(0) = 0,\quad y(1) = 2,} \\ {y(0) = 1,\quad y(1) = 0.} \end{array}$
Эта задача, очевидно, решения не имеет. Применяя второй способ, в результате переноса всех граничных условий в точку $t = {{t}_{0}}$ с помощью заданного уравнения получим алгебраическую систему
${{y}_{0}} = {{t}_{0}},\quad {{y}_{0}} = {{t}_{0}} + 1,\quad {{y}_{0}} = {{t}_{0}} + 1,\quad {{y}_{0}} = {{t}_{0}} - 1,$
где ${{y}_{0}} = y({{t}_{0}})$. Задача, полученная после первой трансформации Гаусса для этой системы, имеет вид $4{{y}_{0}} = 4{{t}_{0}} + 1$, откуда ${{y}_{0}} = {{t}_{0}} + {1 \mathord{\left/ {\vphantom {1 4}} \right. \kern-0em} 4}$. Решение заданного уравнения $y{\kern 1pt} ' = 1$ при таком граничном условии – это функция $y = t + {1 \mathord{\left/ {\vphantom {1 4}} \right. \kern-0em} 4}$ (псевдорешение исходной задачи).

Рассмотренные двумя описанными способами примеры задач показывают, что эти способы, как правило, дают различные результаты, поскольку в них метод наименьших квадратов используется в разных линейных пространствах. Кроме того, даже на этих простых примерах видно, что трудно сделать вывод, когда какой метод предпочтительнее, если, конечно, они оба применимы. Логично в рассмотренных простых случаях следовать выбору метода в зависимости от того, в результате каких возмущений исходная задача становится неразрешимой.

Поскольку в первом методе полученное псевдорешение точно удовлетворяет заданным граничным условиям, то его лучше применять, если известно, что возмущения внесены только в коэффициенты уравнений.

Если возмущены граничные условия, а система уравнений – нет, то, видимо, следует применять второй метод, так как он точно учитывает уравнения, а граничные условия усредняет по методу наименьших квадратов.

В общем случае выбор метода зависит от заданной конкретной задачи.

4. СЛУЧАЙ СВЯЗАННЫХ ГРАНИЧНЫХ УСЛОВИЙ

Рассмотрим применение метода наименьших квадратов для случая задачи со связанными граничными условиями. Пусть система уравнений (2.1) дополнена линейными граничными условиями вида

(4.1)
${{a}_{1}}y(0) + {{a}_{2}}y(1) = c,$
где ${{a}_{1}}$, ${{a}_{2}}$$k \times n$-матрицы, $c$$k$-столбец.

Используем известный прием сведения задачи для системы обыкновенных дифференциальных уравнений со связанными граничными условиями к эквивалентной задаче с раздельными граничными условиями, состоящий в следующем (см. [9]). Введем в рассмотрение дополнительную функцию $\tilde {y}(t) = y(1 - t)$. Эта функция, согласно (2.1), является решением уравнения

(4.2)
$A(1 - t)\tilde {y}{\kern 1pt} '(t) = B(1 - t)\tilde {y}(t) + f(1 - t),$
удовлетворяющим следующим граничным условиям: граничные условия для функции $\tilde {y}$ в точке $t = 0$ – это граничные условия для функции $y$ в точке $t = 1$, а граничные условия для функции $\tilde {y}$ в точке $t = 1$ – это граничные условия для функции $y$ в точке $t = 0$.

Тогда условие (4.1) сводится к следующим двум условиям:

(4.3)
${{a}_{1}}y(0) + {{a}_{2}}\tilde {y}(0) = c,\quad {{a}_{1}}\tilde {y}(1) + {{a}_{2}}y(1) = c.$

Таким образом, мы получаем задачу для функций $y(t)$, $\tilde {y}(t)$, состоящую из $2m$ уравнений (2.1), (4.2) и $2k$-граничных условий (4.3), которые запишем в векторном виде

(4.4)
$({{a}_{1}}{\kern 1pt} {{a}_{2}})\left( {\begin{array}{*{20}{l}} {y(0)} \\ {\tilde {y}(0)} \end{array}} \right) = c,\quad ({{a}_{2}}{\kern 1pt} {{a}_{1}})\left( {\begin{array}{*{20}{l}} {y(1)} \\ {\tilde {y}(1)} \end{array}} \right) = c.$

Отметим, что задачу для функций $y(t)$, $\tilde {y}(t)$ можно рассматривать на половинном отрезке, например, $[0,\;{1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-0em} 2}]$, используя при $t = 0$ первое граничное условие (4.3), а при $t = \;{1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-0em} 2}$ – очевидное условие

(4.5)
$y({1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-0em} 2}) = \tilde {y}({1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-0em} 2}).$

Задача для системы уравнений (2.1), (4.2) с условиями (4.4) (или с использованием условия (4.5)) относительно вектор-функции $\left( {\begin{array}{*{20}{l}} {y(t)} \\ {\tilde {y}(t)} \end{array}} \right)$ – того же типа, что и исходная задача (2.1), (2.2). Следовательно, для нее метод наименьших квадратов может быть применен описанными выше способами.

При этом, поскольку матрицы-коэффициенты указанной системы блочно диагональные, то сопряженные матрицы также блочно диагональные, так что трансформированная система, например, во втором методе в случае переопределенной системы будет состоять из уравнения (3.16) и уравнения

$A{\kern 1pt} {\text{*}}(1 - t)A(1 - t)\tilde {y}{\kern 1pt} '(t) = A{\kern 1pt} {\text{*}}(1 - t)B(1 - t)\tilde {y}(t) + A{\kern 1pt} {\text{*}}(1 - t)f(1 - t).$

Однако эти уравнения не могут рассматриваться независимо, поскольку они связаны граничными условиями (4.4).

5. РАЗНОСТНАЯ РЕАЛИЗАЦИЯ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ

Для сравнения с изложенным применением метода наименьших квадратов для решения задачи (2.1), (2.2) в аналитическом виде рассмотрим пример его численной реализации для этой задачи. При этом как для задачи, так и для минимизируемого функционала будем использовать разностную аппроксимацию. Полученная переопределенная система линейных алгебраических уравнений решается методом наименьших квадратов (см. (1.2)).

Проиллюстрируем этот способ на примере задачи

(5.1)
$y{\kern 1pt} ' = p(t)y + q(t),\quad y(0) = {{g}_{0}},\quad y(1) = {{g}_{1}}.$

Введем разностную сетку

${{t}_{k}} = kh,\quad k = 0,1,\;...,\;n,\quad {{t}_{0}} = 0,\quad {{t}_{n}} = 1,\quad h = {1 \mathord{\left/ {\vphantom {1 n}} \right. \kern-0em} n},$
и аппроксимируем уравнение в (5.1) следующей схемой:
(5.2)
$\frac{{{{y}_{k}} - {{y}_{{k - 1}}}}}{h} = p({{t}_{{k - 1/2}}})\frac{{{{y}_{k}} + {{y}_{{k - 1}}}}}{2} + q({{t}_{{k - 1/2}}}),\quad k = 1,\;...,\;n.$
Будем минимизировать функционал (3.1) для уравнения (5.1), дополненный квадратами невязок граничных условий, что в разностном виде дает выражение
$\sum\limits_{k = 1}^n {{{{\left( {\frac{{{{y}_{k}} - {{y}_{{k - 1}}}}}{h} - p({{t}_{{k - 1/2}}})\frac{{{{y}_{k}} + {{y}_{{k - 1}}}}}{2} - q({{t}_{{k - 1/2}}})} \right)}}^{2}}h + {{{({{y}_{0}} - {{g}_{0}})}}^{2}}} + {{({{y}_{n}} - {{g}_{1}})}^{2}},$
т.е. минимизировать сумму
$\sum\limits_{k = 1}^n {{{{\left( {{{y}_{k}} - {{y}_{{k - 1}}} - h{\kern 1pt} p({{t}_{{k - 1/2}}})\frac{{{{y}_{k}} + {{y}_{{k - 1}}}}}{2} - h{\kern 1pt} q({{t}_{{k - 1/2}}})} \right)}}^{2}} + h{\kern 1pt} {\kern 1pt} {{{({{y}_{0}} - {{g}_{0}})}}^{2}}} + h{\kern 1pt} {\kern 1pt} {{({{y}_{n}} - {{g}_{1}})}^{2}}.$
Поэтому к $n$ разностным уравнениям (5.2) добавим нормированные уравнения
$\sqrt h {{y}_{0}} = \sqrt h g{}_{0},\quad \sqrt h {{y}_{n}} = \sqrt h g{}_{1}.$
В результате мы получим линейную систему $n + 2$ алгебраических уравнений с $n + 1$ неизвестными $y{}_{0},\;...,\;{{y}_{n}}$. Матрица трансформированной по Гауссу системы вида (1.2) для этой задачи является трехдиагональной, так что эту систему можно решать прогонкой.

Для численного решения рассматривалась задача (3.17). Результаты расчетов для $h = 0.001$ и различных значений $g$ приведены на фиг. 2. При этом графики приближенного и аналитического решений, полученные для $g = e$ (сплошная линия), полностью совпадают.

Фиг. 2.

Приближенные решения примера 3 для различных значений g.

Отметим, что такой подход к решению поставленной в работе задачи проигрывает по сравнению с изложенными аналитическими методами в случае систем уравнений, поскольку может накладывать ограничение на требуемую точность из-за большого размера разностной задачи и объема вычислений.

ЗАКЛЮЧЕНИЕ

Для переопределенных систем линейных дифференциальных уравнений с избыточными граничными условиями предложены два метода решения, основанных на применении вариационного метода наименьших квадратов. Оба метода сводят исходную краевую задачу, возможно, не имеющую решения, к замкнутой системе дифференциальных уравнений с достаточными граничными условиями. Если исходная задача имеет единственное решение, то оно является также единственным решением полученной краевой задачи в обоих методах. Если исходная задача решения не имеет, то этими методами получаются ее псевдорешения.

Основной областью применения методов можно считать такие задачи из рассматриваемого класса, которые поставлены корректно и имеют единственное решение, но в результате возмущений исходных данных становятся неразрешимыми. Если внесенные погрешности достаточно малы, то полученные описанными методами псевдорешения, очевидно, будут близки к решению невозмущенной задачи.

На элементарных примерах задач этого типа продемонстрирована суть методов и проведено их сравнение.

Список литературы

  1. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. СПб.: Лань, 2002. 736 с.

  2. Абрамов А.А., Юхно Л.Ф. Решение системы обыкновенных дифференциальных уравнений с избыточными условиями // Ж. вычисл. матем. и матем. физ. 2014. Т. 54. № 4. С. 585–590.

  3. Абрамов А.А., Юхно Л.Ф. Решение сингулярной нелокальной задачи с избыточными условиями для линейной системы обыкновенных дифференциальных уравнений // Ж. вычисл. матем. и матем. физ. 2015. Т. 55. № 3. С. 385–392.

  4. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. М.: УРСС, 2002. 320 с.

  5. Березин И.С., Жидков Н.П. Методы вычислений. М.: Физматгиз, 1960. Т. 2. 620 с.

  6. Чистяков В.Ф. К методам решения сингулярных линейных систем обыкновенных дифференциальных уравнений // Вырожденные системы обыкновенных дифференциальных уравнений. Новосибирск: Наука, 1982. С. 37–66.

  7. Абрамов А.А. О переносе граничных условий для систем обыкновенных дифференциальных уравнений (Вариант метода прогонки) // Ж. вычисл. матем. и матем. физ. 1961. Т. 1. № 3. С. 542–545.

  8. Абрамов А.А. О переносе условия ограниченности для некоторых систем обыкновенных дифференциальных уравнений // Ж. вычисл. матем. и матем. физ. 1961. Т. 1. № 4. С. 733–737.

  9. Moszyński K.A. Method of Solving the Boundary Value Problem for a System of Linear Ordinary Differential Equations // Algoritmy. 1964. V. 11. № 3. P. 25–43.

Дополнительные материалы отсутствуют.