Журнал вычислительной математики и математической физики, 2022, T. 62, № 4, стр. 694-704
Сравнительный анализ градиентных методов определения источника диффузионно-логистической модели
Т. А. Звонарева 1, *, О. И. Криворотько 1, 2, **
1 Новосибирский государственный университет
630090 Новосибирск, ул. Пирогова, 2, Россия
2 Институт вычислительной математики
и математической геофизики СО РАН
630090 Новосибирск, пр-т Акад. Лаврентьева, 6, Россия
* E-mail: t.zvonareva@g.nsu.ru
** E-mail: krivorotko.olya@mail.ru
Поступила в редакцию 10.08.2021
После доработки 10.08.2021
Принята к публикации 16.12.2021
- EDN: FTRHQG
- DOI: 10.31857/S0044466922040147
Аннотация
Проведен сравнительный анализ численного решения задачи определения источника диффузионно-логистической модели по данным о диффузионном процессе в фиксированные моменты времени и точках пространства градиентными методами для случаев непрерывной и дискретной постановок. Получены выражения вычисления градиента целевого функционала для двух постановок, связанных с решением соответствующих сопряженных задач. Показано, что в случае аппроксимации дискретных функций модели кубическими сплайнами точность восстановленного источника совпадает с решением в непрерывной постановке. Численные эксперименты решения задачи об источнике для дискретной модели распространения информации в онлайн социальных сетях показали, что применение дискретного подхода в разы увеличивает вычислительное время по сравнению с использованием непрерывного подхода. Библ. 23. Фиг. 1. Табл. 5.
ВВЕДЕНИЕ
Градиентные методы решения задач об источнике для дифференциальных уравнений применялись в [1]–[7]. Основная их идея состоит в последовательном уменьшении значения целевого функционала $J(q) = {{\left\| {A(q) - f} \right\|}^{2}}$ в виде
(1)
${{q}^{{m + 1}}} = {{q}^{m}} - {{\alpha }_{m}}J{\kern 1pt} {\text{'}}{\kern 1pt} ({{q}^{m}}),\quad {{q}^{0}} \in Q,\quad {{\alpha }_{m}} > 0,$В зависимости от типа пространства $Q$ (гильбертово, соболевское, евклидово и т.п.) области определения функционала $J(q)$ и его градиента $J{\kern 1pt} {\text{'}}{\kern 1pt} (q)$ могут быть интегрируемые, непрерывно-дифференцируемые или дискретные. В связи с этим возможно использование двух подходов: 1) непрерывный, который состоит в формулировке используемых функций в непрерывных пространствах с последующим представлением задачи в конечно-разностном виде и 2) дискретный, в котором сначала переходят к конечно-разностному аналогу, для которого формулируют дискретные функции $J(q)$ и $J{\kern 1pt} {\text{'}}{\kern 1pt} (q)$ (см. [8]).
В данной работе для задачи об источнике для диффузионно-логистической модели, возникающей при описании распространения информации в онлайн социальных сетях и сформулированной в непрерывном и дискретном видах, применены оба подхода. Выявлены области их применимости. Получены градиенты целевых функционалов в непрерывной и дискретной постановках, связанных с решениями соответствующих сопряженных задач. Отметим, что дискретный вариант градиента не является следствием дискретизации непрерывного своего аналога, а получен путем минимизации функции Лагранжа (см. [9]–[12]).
Статья организована следующим образом. Формулировки прямой и обратной задач приведены в разд. 1. Вывод градиента целевого функционала в дискретной форме приведен в п. 2.1. Выражение для градиента целевого функционала в непрерывной форме и соответствующая постановка сопряженной задачи приведены в п. 2.2. Алгоритмы градиентных методов для разных параметров спуска, а также сравнительный анализ результатов численных расчетов для решения задачи об источнике для диффузионно-логистической модели приведены в разд. 3.
1. ПОСТАНОВКИ ПРЯМОЙ И ОБРАТНОЙ ЗАДАЧ
1.1. Постановка прямой задачи
Под прямой задачей в данной работе понимается задача моделирования процесса распространения информации в онлайн социальных сетях, в которой требуется найти функцию плотности активных пользователей $u({{x}_{j}},{{t}_{n}})$ в каждой точке пространства и в момент времени. За расстояние $x$ принимается целочисленная величина, описывающая минимальное количество дружеских связей между пользователем и источником информации и измеряемая в единицах. Время $t$ измеряется в часах, а плотность активных пользователей $u({{x}_{j}},{{t}_{n}})$ – в количестве человек на единицу расстояния.
Данные, представленные в [13], иллюстрируют, что интерес к информации проявляется у пользователей с расстоянием $x$ в пределах от 1 до 6. Именно в этих границах происходит значительный вклад в изменение плотности активных пользователей $u({{x}_{j}},{{t}_{n}})$. Также для социальных сетей справедлива теория шести рукопожатий, согласно которой большинство агентов находится на расстоянии x ≤ 6. Поэтому в модели рассматриваются граничные условия Неймана, которые описывают отсутствие потока информации через границы при x = 1, 6.
Задача моделирования процесса распространения информации основана на законе сохранения информационного потока
Обозначим начальные значения плотности вовлеченных пользователей $u({{x}_{i}},1) = {{q}_{i}}$, $i = 0,\; \ldots ,\;5$. Интерполируя вектор значений $q = ({{q}_{0}},\; \ldots ,\;{{q}_{5}})$ кубическими сплайнами, переходим к непрерывной постановке начально-краевой задачи для диффузионно-логистической модели, описываемой уравнением в частных производных параболического типа (см. [13]):
(2)
$\begin{gathered} {{u}_{t}} = d{{u}_{{xx}}} + \left( {1 - \frac{u}{K}} \right)r(t)u,\quad l \leqslant x \leqslant L,\quad t \geqslant 1, \hfill \\ u(x,1) = Q(x),\quad l \leqslant x \leqslant L, \hfill \\ {{u}_{x}}(l,t) = {{u}_{x}}(L,t) = 0,\quad t \geqslant 1. \hfill \\ \end{gathered} $Таблица 1.
Параметры модели (2), описывающие распространение информации в онлайн социальной сети
Параметр | Описание | Среднее значение |
Единицы измерения |
---|---|---|---|
$d$ | популярность информации, которая способствует распространению информации через неструктурные действия, такие как целенаправленный поиск пользователем рассматриваемой информации | 0.01 | расст.2/ч |
$K$ | пропускная способность, которая является максимально возможным числом активных пользователей | 25 | чел./расст. |
$r(t)$ | $ = \frac{{{{\beta }_{2}}}}{{{{\beta }_{1}}}} - {{e}^{{ - {{\beta }_{1}}(t - 1)}}}\left( {\frac{{{{\beta }_{2}}}}{{{{\beta }_{1}}}} - {{\beta }_{2}}} \right)$ скорость роста числа вовлеченных пользователей | – | 1/ч |
${{\beta }_{1}}$ | скорость снижения интереса к информации с течением времени | 1.5 | – |
${{\beta }_{2}}$ | остаточная скорость | 0.375 | – |
${{\beta }_{3}}$ | начальная скорость роста числа активных пользователей | 1.65 | – |

Средние значения и описания параметров модели представлены в табл. 1. Параметры ${{\beta }_{1}}$, ${{\beta }_{2}}$ и ${{\beta }_{3}}$ в рассматриваемой модели соответствуют представленным в [13].
1.2. Постановка обратной задачи
Предположим, что известна дополнительная информация следующего вида:
(3)
$u({{x}_{i}},{{t}_{k}};q) = {{f}_{{ik}}},\quad i = 1,\; \ldots ,\;{{N}_{1}},\quad k = 1, \ldots ,\;{{N}_{2}},$Отметим, что в линейном приближении при ${{N}_{1}}{{N}_{2}} = 6$ и $\det A \ne 0$ существует единственное решение системы $Aq = f$. В случае ${{N}_{1}}{{N}_{2}} > 6$ вводится понятие нормального псевдорешения, т.е. решения, реализующего минимум нормы невязки
В [14] в линейном приближении решение обратной задачи (2)–(3) исследовано на устойчивость, и показано, что число обусловленности матрицы $A$ имеет порядок ${{10}^{{16}}}$, что свидетельствует о неустойчивости решения обратной задачи.
В данной работе невязка имеет вид
(4)
$J(q) = w\sum\limits_{i = 1}^{{{N}_{1}}} {\sum\limits_{k = 1}^{{{N}_{2}}} {\int\limits_l^L {\int\limits_1^T {{{{\left| {u(x,t;q) - f(x,t)} \right|}}^{2}}\delta (x - {{x}_{i}})\delta (t - {{t}_{k}})dtdx} } } } ,$По аналогии сформулируем дискретную постановку целевого функционала
(5)
$I(q) = w\sum\limits_{i = 1}^{{{N}_{1}}} {\sum\limits_{k = 1}^{{{N}_{2}}} {{{{\left| {{v}_{i}^{k} - {{f}_{{ik}}}} \right|}}^{2}}} } ,$2. НЕПРЕРЫВНАЯ И ДИСКРЕТНАЯ ПОСТАНОВКИ ГРАДИЕНТОВ ФУНКЦИОНАЛА
Исследование непрерывной и дискретной постановок прямой и обратной задач для диффузионно-логистической модели было навеяно работой А.Л. Карчевского [8], в которой похожий анализ был проделан для решения обратной задачи для гиперболического уравнения.
Существуют два подхода к численному решению поставленной обратной задачи (2)–(3). Первый состоит из следующих шагов:
• перейти от непрерывной постановки прямой задачи ${{L}_{q}}u = 0$ (${{L}_{q}}$ – оператор прямой задачи) к дискретной ${{\Lambda }_{p}}{v} = 0$ (${{\Lambda }_{p}}$ – конечно-разностный аналог оператора прямой задачи, а функция $p$ является некоторым приближением функции $Q$ и ${{p}_{j}} = {{q}_{{s - 1}}}$ при ${{x}_{j}} = s$, $s = 1,\; \ldots ,\;6$);
• выписать целевой функционал в дискретной постановке $I(q)$;
• получить постановку сопряженной задачи $\Lambda _{p}^{*}\phi = 0$ и градиент целевого функционала в дискретной форме $I{\kern 1pt} {\text{'}}{\kern 1pt} (q)$;
• решить задачу минимизации функционала $I(q)$.
Второй подход подразумевает следующую схему действий:
• выписать целевой функционал в непрерывной постановке $J(q)$;
• получить постановку сопряженной задачи $L_{q}^{*}\psi = 0$ и выражение градиента целевого функционала в непрерывной форме $J{\kern 1pt} {\text{'}}{\kern 1pt} (q)$;
• перейти к задаче ${{\Lambda }_{p}}{v} = 0$;
• выписать целевой функционал $I(q)$, аппроксимирующий $J(q)$;
• от постановки сопряженной задачи $L_{q}^{*}\psi = 0$ перейти к задаче $\Lambda _{p}^{*}\phi = 0$;
• получить соотношение $I{\kern 1pt} {\text{'}}{\kern 1pt} (q)$, которое аппроксимирует градиент целевого функционала $J{\kern 1pt} {\text{'}}{\kern 1pt} (q)$;
• решить задачу минимизации функционала $J(q)$.
Особенность постановки обратной задачи (2)–(3) состоит в дискретном задании дополнительных измерений, а также в определении набора параметров $q = ({{q}_{0}},\; \ldots ,\;{{q}_{5}})$ вместо функции $Q(x)$.
2.1. Градиент функционала в дискретной постановке
Дискретный градиент, полученный с помощью подхода из работ Ю.Г. Евтушенко и Ф.Л. Черноусько [9]–[12], формулируется для дискретной постановки рассматриваемой модели, т.е. для задачи
(6)
$\begin{gathered} \frac{{{v}_{j}^{{n + 1}} - {v}_{j}^{n}}}{\tau } = d\frac{{{v}_{{j + 1}}^{n} - 2{v}_{j}^{n} + {v}_{{j - 1}}^{n}}}{{{{h}^{2}}}} + \left( {1 - \frac{{{v}_{j}^{n}}}{K}} \right){{r}^{n}}{v}_{j}^{n},\quad j = 1,\; \ldots ,\;{{N}_{x}} - 1,\quad n = 0,\; \ldots ,\;{{N}_{t}} - 1, \hfill \\ {v}_{j}^{0} = {{p}_{j}},\quad j = 0,\; \ldots ,\;{{N}_{x}}, \hfill \\ {v}_{0}^{{n + 1}} = \frac{{4{v}_{1}^{{n + 1}} - {v}_{2}^{{n + 1}}}}{3},\quad n = 0,\; \ldots ,\;{{N}_{t}} - 1, \hfill \\ {v}_{{{{N}_{x}}}}^{{n + 1}} = \frac{{4{v}_{{{{N}_{x}} - 1}}^{{n + 1}} - {v}_{{{{N}_{x}} - 2}}^{{n + 1}}}}{3},\quad n = 0,\; \ldots ,\;{{N}_{t}} - 1. \hfill \\ \end{gathered} $Преобразуем ее в условие связи
где ${{{v}}^{n}}$ – набор векторов ${{{v}}_{j}}$, $j = 0,\; \ldots ,\;{{N}_{x}}$.Каждому условию в (7) ставится в соответствие вектор ${{\phi }^{n}} \in {{R}^{{{{N}_{x}} + 1}}}$, их объединение есть вектор ${{\phi }^{{\text{т}}}} = (\phi _{0}^{{\text{т}}},\; \ldots ,\;\phi _{{{{N}_{t}}}}^{{\text{т}}})$, $\phi \in {{R}^{{({{N}_{t}} + 1) \times ({{N}_{x}} + 1)}}}$. И рассматривается аналог функции Лагранжа для многошагового процесса (7):
(8)
$E({v},\phi ;q) = I(q) - \sum\limits_{n = 0}^{{{N}_{t}}} {{{\Phi }^{{\text{т}}}}} (n,{{{v}}^{n}};q){{\phi }^{n}}.$Тогда (см. [9])
(9)
${{\phi }^{{{{i}_{n}}}}} = {{E}_{{{{{v}}^{{{{i}_{n}}}}}}}}({v},\phi ;q) = {{I}_{{{{{v}}^{{{{i}_{n}}}}}}}}(q) - \sum\limits_{n = 0}^{{{N}_{t}}} {\Phi _{{{{v}^{{{{i}_{n}}}}}}}^{{\text{т}}}} (n,{{{v}}^{n}};q){{\phi }^{n}},\quad {{i}_{n}} = 0,\; \ldots ,\;{{N}_{t}},$(10)
$\frac{{\partial I(q)}}{{\partial {{q}_{{{{i}_{s}}}}}}} = {{E}_{{{{q}_{{{{i}_{s}}}}}}}}({v},\phi ;q) = {{I}_{{{{q}_{{{{i}_{s}}}}}}}}(q) - \sum\limits_{n = 0}^{{{N}_{t}}} \Phi _{{{{q}_{{{{i}_{s}}}}}}}^{{\text{т}}}(n,{{{v}}^{n}};q){{\phi }^{n}},\quad {{i}_{s}} = 0, \ldots ,5.$Лемма. Градиент функционала $(5)$ имеет вид
(11)
$\begin{gathered} I{\kern 1pt} {\text{'}}{\kern 1pt} (q)[0] = - \frac{d}{{{{h}^{2}}}}\phi _{1}^{0}, \hfill \\ I{\kern 1pt} {\text{'}}{\kern 1pt} (q)[s] = - \frac{{\phi _{{{{j}_{s}}}}^{0}}}{\tau } - d\frac{{\phi _{{{{j}_{{(s - 1)}}}}}^{0} - 2\phi _{{{{j}_{s}}}}^{0} + \phi _{{{{j}_{{(s + 1)}}}}}^{0}}}{{{{h}^{2}}}} - {{r}^{0}}\phi _{{{{j}_{s}}}}^{0} + \frac{{2{{r}^{0}}{{q}_{s}}}}{K}\phi _{{{{j}_{s}}}}^{0},\quad s = 1,\;2,\;3,\;4, \hfill \\ I{\kern 1pt} {\text{'}}{\kern 1pt} (q)[5] = - \frac{d}{{{{h}^{2}}}}\phi _{{{{N}_{x}} - 1}}^{0}, \hfill \\ \end{gathered} $(12)
$\begin{gathered} \frac{{\phi _{j}^{{n - 1}} - \phi _{j}^{n}}}{\tau } = d\frac{{\phi _{{j - 1}}^{n} - 2\phi _{j}^{n} + \phi _{{j + 1}}^{n}}}{{{{h}^{2}}}} + {{r}^{n}}\phi _{j}^{n} - \frac{{2{{r}^{n}}{v}_{j}^{n}}}{K}\phi _{j}^{n} - \frac{{[\phi ]}}{{\tau h}},\quad j = 1,\; \ldots ,\;{{N}_{x}} - 1,\quad n = 1,\; \ldots ,\;{{N}_{t}}, \hfill \\ \phi _{j}^{{{{N}_{t}}}} = 0,\quad j = 0\; \ldots ,\;{{N}_{x}}, \hfill \\ \phi _{0}^{n} = \frac{d}{{{{h}^{2}}}}\phi _{1}^{n},\quad n = 0\; \ldots ,\;{{N}_{t}} - 1, \hfill \\ \phi _{{{{N}_{x}}}}^{n} = \frac{d}{{{{h}^{2}}}}\phi _{{{{N}_{x}} - 1}}^{n},\quad n = 0\; \ldots ,\;{{N}_{t}} - 1, \hfill \\ \end{gathered} $Доказательство. Функция $E$, определенная по формуле (8), имеет вид
Находим производную функции $E$ по ${v}_{j}^{n}$, что из (9) есть формула для определения функции $\phi _{j}^{n}$:
При всех $0 \leqslant j \leqslant {{N}_{x}}$ составляющая ${v}_{j}^{0}$ не входит в выражение для функции $E$, поэтому можно положить
Таким образом, получили постановку сопряженной задачи (12).
Так как ${{p}_{j}} = {{q}_{{s - 1}}}$ при ${{x}_{j}} = s$, находим производные функции $E$ по ${{q}_{s}}$:
2.2. Градиент функционала в непрерывной постановке
Градиент функционала (4) имеет вид
где функция $\psi (x,t)$ удовлетворяет решению сопряженной задачиВ [15] приведен вывод формулы (13) для более общей постановки задачи (2) с произвольной правой частью.
Отметим, что в силу свойств дельта-функции сопряженная задача может быть записана в виде (см. [16])
3. ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ
Для решения обратной задачи (2)–(3) в качестве синтетических данных ${{f}_{{ik}}}$ были взяты значения решения прямой задачи при значениях параметров, представленных в табл. 1 и 2, в каждой десятой точке по $x < {{N}_{x}}$ и в каждой двадцать пятой точке по $t \geqslant 50$, т.е. ${{N}_{1}} = 5$ и ${{N}_{2}} = 22$. Значения параметров в табл. 2 эмитируют реальные данные новостного сайта Digg.com, представленные в [13].
Таблица 2.
Дискретизованная функция начальной плотности $Q(x)$, используемая как точное решение ${{q}_{{{\text{e}}x}}}$ обратной задачи
Параметр | ${{q}_{0}}$ | ${{q}_{1}}$ | ${{q}_{2}}$ | ${{q}_{3}}$ | ${{q}_{4}}$ | ${{q}_{5}}$ |
---|---|---|---|---|---|---|
Значение | 5.8 | 1.7 | 1.9 | 1 | 0.95 | 0.7 |
Кроме значения функционала также измерялась относительная ошибка
3.1. Градиентные методы
Решение задачи минимизации целевых функционалов $J(q)$ и $I(q)$ было получено с использованием двух градиентных методов:
1. Метод градиентного спуска (МГС) (см. [17], [18]) – классический одношаговый градиентный метод (1) с постоянным параметром спуска ${{\alpha }_{k}} = \alpha $. Скорость сходимости по функционалу (см. [18])
2. Многоуровневый градиентный метод (МГМ) (см. [19], [20]) – это метод локальной оптимизации функции от нескольких переменных. Он является модификацией метода градиентного спуска, что позволяет значительно увеличить скорость сходимости. Алгоритм метода имеет следующий вид:
В случае МГМ скорость сходимости по функционалу оценивается следующим образом (см. [21]):
Были применены и проанализированы МГС и МГМ с непрерывным и дискретным видами градиентов. Причем в случае дискретного градиента МГС имеет параметр спуска ${{\alpha }^{{(1)}}}{{ = 10}^{{ - 7}}}$ и минимум по $\zeta $ в МГМ находится на отрезке $[0,\;{{10}^{{ - 6}}}]$ с шагом ${{10}^{{ - 7}}}$. В случае непрерывного градиента ${{\alpha }^{{(2)}}}{{ = 10}^{{ - 3}}}$, a минимум по $\zeta \in [0,\;{{10}^{{ - 5}}}]$ определяется с шагом ${{10}^{{ - 6}}}$.
3.2. Конечно-разностные схемы решения прямой и сопряженной задач
Для построения разностных схем введем равномерную сетку в замкнутой области $\bar {D} = \{ (x,t)\,|\,l \leqslant x \leqslant L,\;1 \leqslant t \leqslant T\} $:
Для применения классического непрерывного подхода функция начального приближения $Q(x)$ определяется из вектора $q$ (см. табл. 2) интерполяцией кубическими сплайнами.
Прямая задача (2) решается с помощью явной конечно-разностной схемы с порядком аппроксимации $O(\tau + {{h}^{2}})$ в виде (6).
Положим в численных расчетах $l = 1$, $L = 6$, $T = 24$, ${{N}_{x}} = 50$ и ${{N}_{t}} = 575$. Такие значения $l$, $L$ были выбраны в соответствии с данными, представленными в [13], которые иллюстрируют, что интерес к информации проявляется у пользователей с расстоянием $x$ в пределах от 1 до 6. Именно в этих границах происходит значительный вклад в изменение плотности активных пользователей $u(x,t)$. Значения разбиения сетки ${{N}_{x}}$ и ${{N}_{t}}$ выбраны таким образом, чтобы выполнялось условие Куранта–Фридрихса–Леви
с учетом того, что ${{r}_{c}} = \mathop {\max }\limits_t r(t) = 0.44$, $h = 0.1$ и $\tau = 0.04$.Для анализа устойчивости решения прямой задачи была реализована схема Кранка–Николсон с порядком аппроксимации $O({{\tau }^{2}} + {{h}^{2}})$.
3.3. Сравнительный анализ непрерывной и дискретной постановок
Проведем сравнительный анализ подходов решения обратной задачи: с точным подсчетом градиента для дискретной задачи (6)–(3) и с непрерывной постановкой и дискретизацией при вычислении градиента (2)–(3). Этапы сходства и различия алгоритмов решения указанных обратных задач приведены в таблице 3. Отметим, что в обоих случаях идентично решена прямая задача, а сопряженные задачи решены одной конечно-разностной схемой, которые входят в соответствующие выражения для вычисления градиентов целевого функционала. К решению соответствующих задач минимизации применены одинаковые алгоритмы. В качестве сравнения двух подходов анализируется значение целевого функционала и относительная погрешность восстановленных решений. Решение, полученное с помощью градиентных методов, зависит от начального приближения. Было рассмотрено два варианта выбора начального приближения (см. [19], [22], [23]): решение обратной задачи, полученное с помощью метода глобальной оптимизации роя частиц (МРЧ), представленное в табл. 3, и нулевое начальное приближение. Нулевое начальное приближение выбрано из физической постановки, так как ${{q}^{0}}$ описывает первую реакцию пользователей на новость в отсутствиe дополнительной информации об этой реакции. В приведенной реализации МРЧ функционал $J(\hat {q}) = 1.114 \times {{10}^{{ - 3}}}$ и относительная погрешность $\delta = 1.533 \times {{10}^{{ - 3}}}$.
Таблица 3.
Решение обратной задачи, полученное методом роя частиц
Параметр | ${{\hat {q}}_{0}}$ | ${{\hat {q}}_{1}}$ | ${{\hat {q}}_{2}}$ | ${{\hat {q}}_{3}}$ | ${{\hat {q}}_{4}}$ | ${{\hat {q}}_{5}}$ |
---|---|---|---|---|---|---|
Значение | 5.809 | 1.697 | 1.901 | 0.999 | 0.949 | 0.701 |
В табл. 4 представлены результаты, полученные следующими методами:
Таблица 4.
Результаты, полученные методами градиентного спуска и его модификацией
Метод | ${{q}^{0}}$ | $J(q),\; \times \;{{10}^{{ - 4}}}$ | $\delta ,\; \times \;{{10}^{{ - 4}}}$ | ${{N}_{{{\text{iter}}}}}$ | ${{t}_{{{\text{ЭВМ}}}}}$ |
---|---|---|---|---|---|
МГС I | $\hat {q}$ | 9.604 | 6.274 | 5380 | 3 |
МГМ I | $\hat {q}$ | 9.544 | 6.273 | 397 | 3 |
МГМ II | 0 | 9.029 | 6.262 | 245 | 2 |
МГС II | 0 | 9.032 | 6.262 | 16 374 | 9 |
МГС III | $\hat {q}$ | 9.847 | 6.276 | 166 862 | 93 |
МГМ III | $\hat {q}$ | 9.793 | 6.276 | 1372 | 11 |
МГМ IV | 0 | 9.047 | 6.261 | 1630 | 12 |
МГС IV | 0 | 9.101 | 6.266 | 1 005 999 | 569 |
МГМ V | 0 | 11.26 | 6.254 | 1586 | 25 |
Примечание. В столбце начального приближения ${{q}^{0}}$ под $\hat {q}$ понимается вектор решения обратной задачи, полученный с помощью методa роя частиц (представленный в табл. 3), а 0 – нулевой вектор ${{N}_{{{\text{iter}}}}}$ – число итераций, ${{t}_{{{\text{ЭВМ}}}}}$ – время работы программы.
• МГС I и МГМ I – методы с непрерывным градиентом и начальным приближением в виде решения, полученного МРЧ;
• МГС II и МГМ II – методы с непрерывным градиентом и нулевым начальным приближением;
• МГС III и МГМ III – методы с дискретным градиентом и начальным приближением в виде решения, полученного МРЧ;
• МГС IV и МГМ IV – методы с дискретным градиентом и нулевым начальным приближением;
• МГМ V – метод с нулевым начальным приближением и дискретным градиентом в случае, когда прямая и сопряженная задачи численно решались конечно-разностной схемой Кранка–Николсон.
Из табл. 4 видно, что МГМ находит решение с заданной точностью, производя более чем в 10 раз меньше итераций, чем МГС при одинаковых начальных условиях и формах нахождения градиента целевого функционала. В случае начального приближения $\hat {q}$ и непрерывного градиента (т.е. МГС I и МГМ I) времена работ программ не отличаются, однако при других вариантах реализации градиентных методов МГМ находит решение с заданной точностью в несколько раз быстрее МГС. При нулевом начальном приближении методы работают в несколько раз дольше, но достигают большей точности только на шестом знаке после запятой. В случае дискретного градиента МГМ достигает решения того же порядка в несколько раз дольше, а МГС – более чем в 30 раз дольше по времени. При этом МГМ V имеет наименьшее среди всех рассмотренных методов значение погрешности, однако при этом метод работает в несколько раз дольше других реализаций МГМ. На фиг. 1 непрерывными линиями изображены кривые, полученные МГМ II в случае непрерывного вычисления градиента функционала, а пунктирными линиями – кривые, полученные МГМ IV в случае дискретной реализации градиента. Из фиг. 1 следует, что значение функционала и погрешность в случае МГМ II убывают быстрее.
Фиг. 1.
Графики убывания функционалов $J(q)$ и $I(q)$ (а) и относительной погрешности $\delta $ (б) на итерациях с 10-й по 100-ю. Сплошная линия характеризует использование непрерывного градиента, а пунктирная – дискретного градиента целевого функционала.

Был проанализирован случай зашумленных данных:
Для зашумленных данных обратной задачи был реализован МГМ с различными начальными приближениями, а прямая задача решалась методом конечных разностей схемой Кранка–Николсон. Результаты численных экспериментов для такой постановки обратной задачи в случае дискретного и непрерывного градиентов приведены в табл. 5. Можно видеть, что в случае нулевого начального приближения метод с дискретным градиентом имеет наименьшее значение относительной ошибки при шуме в $1\% $, в то время как метод с непрерывным градиентом – при шуме в $5$ и $10\% $. В случае начального приближения в виде решения, полученного с помощью МРЧ, точности восстановленных решений обратной задачи $\delta $ различаются незначительно.
В работе проведено исследование двух подходов к решению задачи восстановления источника, в рамках которых были реализованы две конечно-разностные схемы, в которых порядок аппроксимации по пространственной переменной совпадает и равен 2, а по временной имеют 1-й и 2-й (Кранка–Николсон) порядки. В таблицах 5 и 6 экспериментально показано, что результат сходимости не чувствителен к порядку аппроксимации по временной переменной. Исходя из оценок сходимости и итерационных выражений определения решения обратной задачи, порядок аппроксимации по пространственной переменной при решении прямой и сопряженной задач имеет большое влияние на точность полученного решения и, скорее всего, на скорость сходимости градиентных методов. В случае определения плотности начального распределения пользователей относительно популярной новости в онлайн социальных сетях с большой пропускной способностью (Twitter, Facebook, Reddit и др.) требуется качественно определить тип вовлеченности пользователей и структуру распределения. Для получения более точных оценок взаимосвязи скорости сходимости градиентных методов с точностью аппроксимации необходимы отдельные исследования.
Таблица 5.
Результаты решения обратной задачи с уровнем зашумленности в данных $\varepsilon = 1,\;5,\;10\% $, полученные многоуровневым градиентным методом с градиентом в дискретной и непрерывной постановках
Начальное приближение |
$\varepsilon $, % | Дискретный градиент (11) | Непрерывный градиент (13) | ||
---|---|---|---|---|---|
$I(q)$ | $\delta $ | $J(q)$ | $\delta $ | ||
Нулевое | 1 | 1.133 × 10–2 | 6.706 × 10–4 | 9.628 × 10–2 | 7.356 × 10–4 |
5 | 1.475 × 10–1 | 8.447 × 10–4 | 3.272 × 10–3 | 6.399 × 10–4 | |
10 | 3.461 × 10–2 | 7.305 × 10–4 | 3.286 × 10–3 | 6.407 × 10–4 | |
Решение МРЧ | 1 | 1.242 × 10–3 | 6.271 × 10–4 | 1.403 × 10–3 | 6.262 × 10–4 |
5 | 3.165 × 10–2 | 6.431 × 10–4 | 1.865 × 10–3 | 6.261 × 10–4 | |
10 | 16.795 | 1.707 × 10–2 | 11.289 | 1.388 × 10–2 |
ЗАКЛЮЧЕНИЕ
В работе проведен сравнительный анализ численного решения задачи об источнике для диффузионно-логистической модели по данным о диффузионном процессе в фиксированные моменты времени и точках пространства градиентными методами для случаев непрерывной (классической) и дискретной постановок. Получены выражения для вычисления градиента целевого функционала в случае двух постановок, связанных с решением соответствующих сопряженных задач.
Прямая и сопряженные задачи были решены с помощью явной схемы с порядком аппроксимации $O(\tau + {{h}^{2}})$ и соблюдением условия Куранта–Фридрихса–Леви и полунеявной схемы Кранка–Николсон, имеющей порядок аппроксимации $O({{\tau }^{2}} + {{h}^{2}})$. Задача минимизации целевого функционала была решена методами градиентного спуска с постоянным параметром спуска и многоуровневым градиентным методом. Были проанализированы два варианта начального приближения решения обратной задачи: нулевое и полученное методом роя частиц. Показано, что в случае ненулевого начального приближения с использованием выражения для градиента целевого функционала в непрерывной постановке времена работы программ не отличаются, однако при других вариантах реализации градиентных методов многоуровневый градиентный метод находит решение с заданной точностью в несколько раз быстрее метода градиентного спуска. При нулевом начальном приближении методы работают в несколько раз дольше, но достигают большей точности. В случае дискретного градиента многоуровневый градиентный метод достигает решения того же порядка в несколько раз дольше, а метод градиентного спуска – более чем в 30 раз дольше по времени.
Показано, что в случае аппроксимации кубическими сплайнами дискретных функций в прямой задаче различия в точности полученных решений обратных задач для непрерывной и дискретной постановок наблюдаются только в шестом знаке после запятой в случае незашумленных синтетических данных, описывающих динамику вовлеченных пользователей в онлайн социальной сети. Однако машинное время решения обратной задачи в дискретной форме больше, чем непрерывный аналог.
Список литературы
Hestenes M.R., Stiefel E. Methods of conjugate gradients for solving linear systems // J. Res. Natl. Inst. Stand. Technol. 1952. V. 49. № 6. P. 409–436.
Fletcher R., Reeves C.M. Function minimization by conjugate gradients // Comput. J. 1964. V. 7. № 2. P. 149–154.
Byrd R.H., Nocedal J., Yuan Y. Global convergence of a class of quasi-Newton methods on convex problems // SIAM J. Numer. Anal. 1987. V. 24. № 5. P. 1171–1190.
Hasanov A. Simultaneous determination of source terms in a linear parabolic problem from the final overdetermination: Weak solution approach // J. Math. Anal. Appl. 2007. V. 330. № 2. P. 766–779.
Prilepko A.I., Kamynin V.L., Kostin A.B. Inverse source problem for parabolic equation with the condition of integral observation in time // J. Inverse Ill-Posed Probl. 2018. V. 26. № 4. P. 523–539.
Aida-zade K.A., Rahimov A.B. Numerical solution to inverse source problems for linear parabolic equation // IFAC-PapersOnLine. 2018. V. 51. № 30. P. 231–236.
Cheng J., Liu J. An inverse source problem for parabolic equations with local measurements // Appl. Math. Lett. 2020. V. 103. P. 106213.
Карчевский А.Л. Корректная схема действий при численном решении обратной задачи оптимизационным методом // Сиб. журн. вычисл. матем. 2008. Т. 11. № 2. С. 139–149.
Евтушенко Ю.Г. Оптимизация и быстрое автоматическое дифференцирование. М.: ВЦ РАН, 2013.
Евтушенко Ю.Г., Засухина Е.С., Зубов В.И. О численном подходе к оптимизации решения задачи Бюргерса с помощью граничных условий // Ж. вычисл. матем. и матем. физ. 1997. Т. 37. № 12. С. 1449–1458.
Евтушенко Ю.Г. Приближенный расчет задач оптимального управления // Приклад. матем. и механика. 1970. Т. 34. № 1. С. 95–104.
Черноусько Ф.Л., Колмановский В.Б. Вычислительные и приближенные методы оптимального управления // Итоги науки и техн. Сер. Мат. анал. 1977. Т. 14. С. 101–166.
Wang H., Wang F., Xu K. Diffusive logistic model towards predicting information diffusion in online social networks // Proceed. 32nd Inter. Conf. on Distribut. Comput. Syst. Workshop. 2012. P. 133–139.
Krivorotko O., Zvonareva T. Numerical solution of the inverse problem for diffusion-logistic model arising in online social networks // Commun. Comput. Info. Sci. 2021. V. 1476. P. 444–459.
Krivorotko O., Kabanikhin S., Zhang S., Kashtanova V., Global and local optimization in identification of parabolic systems // J. Inverse Ill-Posed Probl. 2020. V. 28. № 6. P. 899–913.
Владимиров В.С. Уравнения математической физики. М.: Наука, 1981.
Алифанов О.М., Артюхин Е.А., Румянцев С.В. Экстремальные методы решения некорректных задач. М.: Наука, 1988.
Kabanikhin S., Penenko A. Gradient-type methods in inverse parabolic problems // J. Phys. Conf. Ser. 2008. V. 135. P. 012054.
Гасников А.В. Современные численные методы оптимизации. Метод универсального градиентного спуска. М.: МФТИ, 2018.
Nesterov Y., Gasnikov A., Guminov S., Dvurechensky P. Primal–dual accelerated gradient methods with small-dimensional relaxation oracle // Optim. Methods Softw. 2020. P. 1–38.
Gasnikov A.V., Nesterov Y.E. Universal method for stochastic composite optimization problems // Comput. Math. Math. Phys. 2018. V. 58. № 1. P. 48–64.
Kaltenbacher B., Neubauer A., Scherzer O. Iterative regularization methods for nonlinear ill-posed problems. New York: De Gruyter, 2008.
Kaltenbacher B. All-at-once versus reduced iterative methods for time dependent inverse problems // Inverse Probl. 2017. V. 33. P. 064002.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики