Журнал вычислительной математики и математической физики, 2022, T. 62, № 11, стр. 1840-1850
К задаче реконструкции при дефиците информации в квазилинейном стохастическом дифференциальном уравнении
1 Ин-т матем. и механики им. Н.Н. Красовского УрО РАН
620990 Екатеринбург, ул. С. Ковалевской, 16, Россия
* E-mail: rozen@imm.uran.ru
Поступила в редакцию 01.07.2021
После доработки 09.06.2022
Принята к публикации 07.07.2022
- EDN: IRAXMB
- DOI: 10.31857/S0044466922110114
Аннотация
Задача восстановления неизвестных внешних воздействий в квазилинейном стохастическом дифференциальном уравнении рассматривается в рамках подхода теории динамического обращения. Реконструкция возмущений в детерминированном и стохастическом членах уравнения базируется на дискретной информации о некотором количестве реализаций части координат случайного процесса. Задача сводится к обратной задаче для системы обыкновенных нелинейных дифференциальных уравнений, которой удовлетворяют математическое ожидание и ковариационная матрица исходного процесса. Для конечношагового программно реализуемого алгоритма решения, основанного на методе вспомогательных управляемых моделей, получена оценка точности относительно количества доступных измерению реализаций. Приведен модельный пример. Библ. 22. Фиг. 2.
1. ВВЕДЕНИЕ
Рассматриваемая задача реконструкции вкладывается в проблематику обратных задач динамики управляемых систем, которые, как правило, являются некорректными и требуют применения регуляризирующих процедур. Для ее решения используется ставший классическим подход, предложенный в работах Ю.С. Осипова и его коллег (см. [1]–[6] и библиографию в них) и получивший название метода динамического обращения. Он основан на сочетании принципов теории позиционного управления (см. [7]) и идей теории некорректных задач (см. [8]). Суть его в сведении задачи реконструкции к задаче управления по принципу обратной связи (часто на основе принципа экстремального прицеливания Н.Н. Красовского, см. [7]) вспомогательной динамической системой (моделью). Адаптация модельного управления к результатам текущих наблюдений обеспечивает аппроксимацию (в подходящем смысле) неизвестного входа. Метод динамического обращения был многократно реализован для различных детерминированных систем, описываемых обыкновенными дифференциальными уравнениями (ОДУ), дифференциально-функциональными уравнениями, уравнениями и вариационными неравенствами с распределенными параметрами и др. Были созданы устойчивые алгоритмы, работающие для некоторых классов частично наблюдаемых систем (в случае конечномерной системы роль входного сигнала могли играть измерения части координат фазового вектора, а в случае бесконечномерной – значения решения на некоторых подмножествах области определения). Такие задачи были сформулированы и решены, например, в [4], [5]. Касательно стохастических объектов отметим, что впервые задача позиционного моделирования неизвестного стохастического управляющего воздействия в системе, описываемой ОДУ, была рассмотрена в [9]. Впоследствии поле применения методов динамической регуляризации было расширено для систем с неопределенными входами в [10], где рассмотрена задача об устойчивой аппроксимации неизвестного входа управляемой системы по результатам неточных наблюдений ее фазовых состояний при условии, что помехи в канале наблюдения подчинены некоторому вероятностному распределению с малым математическим ожиданием. Впервые в рамках теории динамического обращения использован вероятностный критерий качества и построен динамический алгоритм реконструкции нормального входа, доставляющий сколь угодно высокую точность среднеквадратической аппроксимации с вероятностью, сколь угодно близкой к единице.
Настоящая работа фактически продолжает исследования задач реконструкции неизвестных параметров линейных и квазилинейных стохастических дифференциальных уравнений (СДУ), начатые в [11] с рассмотрения задачи динамического восстановления возмущения, входящего в интеграл Ито и характеризующего амплитуду случайной помехи, на основе измерения реализаций всего фазового вектора линейного СДУ. Идея решения состояла в переходе к задаче для линейной системы ОДУ, которой удовлетворяют математическое ожидание и ковариационная матрица исходного процесса. В [12] исследовалась достаточно общая постановка обратной задачи для линейного СДУ, предполагающая реконструкцию возмущений, входящих и в детерминированный, и в стохастический члены уравнения, на основе дискретной по времени информации о некотором количестве реализаций части координат случайного процесса. Обоснована применимость алгоритма восстановления неизвестных параметров, разработанного ранее для частично наблюдаемой системы ОДУ (см. [4], [5]), и предложена соответствующая модификация. Анализ задачи реконструкции неизвестных входов квазилинейного СДУ при измерении реализаций всего фазового вектора был проведен в [13]. Отличительной особенностью задачи для квазилинейного СДУ является нелинейность системы ОДУ, описывающей динамику математического ожидания и ковариационной матрицы процесса. Настоящая статья призвана дополнить исследование задач динамической реконструкции для квазилинейных СДУ случаем неполной информации, когда измеряется лишь часть координат фазового состояния. Отметим, что обратная задача для системы гибридного типа, состоящей из квазилинейного СДУ и ОДУ, при условии измерения реализаций случайного процесса рассмотрена в [14].
2. ПОСТАНОВКА ЗАДАЧИ
Рассматривается квазилинейное (в соответствии с терминологией [15] и других работ этих авторов) СДУ с диффузией, зависящей от фазового состояния:
(2.1)
$\begin{gathered} dx(t,\omega ) = (A(t)x(t,\omega ) + B(t){{u}_{1}}(t) + f(t)){\kern 1pt} dt + {{U}_{2}}(t){\kern 1pt} x(t,\omega ){\kern 1pt} d\xi (t,\omega ), \\ x(0,\omega ) = {{x}_{0}},\quad t \in T = [0,\vartheta ]. \\ \end{gathered} $Решение уравнения (2.1) определяется как случайный процесс, удовлетворяющий при любом $t$ с вероятностью 1 соответствующему интегральному тождеству, содержащему в правой части стохастический интеграл Ито. Как известно, при сделанных предположениях существует единственное решение, являющееся нормальным марковским процессом с непрерывными реализациями (см. [17]). Отметим, что уравнения типа (2.1) описывают простейшие линеаризованные модели, например, изменения численности многовидовой биологической популяции в стохастической среде или динамики цен на товарных рынках при влиянии случайных факторов.
Изучаемая задача состоит в следующем. В дискретные, достаточно частые, моменты времени ${{\tau }_{i}} \in T$, ${{\tau }_{i}} = i\delta $, $\delta = \vartheta {\text{/}}l$, $i \in [0:(l - 1)],$ поступает информация о некотором количестве $N$ реализаций случайного процесса $x({{\tau }_{i}})$, причем измерению доступны только $q$ ($q \leqslant n$) первых координат, т.е. вектор $({{x}_{1}}, \ldots ,{{x}_{q}})$. Полагаем, что $l = l(N)$ и существуют оценки $m_{{qi}}^{N}$ $q$-подвектора ${{m}_{q}}(t) = \{ {{m}_{j}}(t)\} ,$ ${\kern 1pt} j \in [1:q]$, вектора математического ожидания процесса $m(t) = Mx(t)$ и $D_{{qi}}^{N}$ ($q \times q$)-подматрицы ${{D}_{q}}(t) = \{ {{d}_{{jp}}}(t)\} ,$ $j,p \in [1:q]$, ковариационной матрицы $D(t) = M(x(t) - m(t))(x(t) - $ $ - \;m(t)){\kern 1pt} '$ (штрих означает транспонирование) такие, что выполняется соотношение
(2.2)
$P\left( {\mathop {\max }\limits_{i \in [1:(l(N) - 1)]} \left\{ {{{{\left\| {m_{{qi}}^{N} - {{m}_{q}}({{\tau }_{i}})} \right\|}}_{{{{\mathbb{R}}^{q}}}}},\;{{{\left\| {D_{{qi}}^{N} - {{D}_{q}}({{\tau }_{i}})} \right\|}}_{{{{\mathbb{R}}^{{q \times q}}}}}}} \right\} \leqslant h(N)} \right) = 1 - g(N),$Необходимо построить конструктивный алгоритм динамического восстановления неизвестных возмущений ${{u}_{1}}(t)$ и ${{u}_{2}}(t)$, фактически определяющих случайный процесс $x(t)$, по неполной дискретной информации о реализациях части его координат, причем вероятность сколь угодно малого отклонения приближений от искомых входов в метрике соответственно пространств ${{L}_{2}}(T;{{\mathbb{R}}^{r}})$ и ${{L}_{2}}(T;{{\mathbb{R}}^{n}})$ должна быть близка к 1 при достаточно большом $N$ и специальным образом согласованном с $N$ шаге временной дискретизации $\delta = \delta (N) = \vartheta {\text{/}}l(N)$. Такую обратную задачу можно трактовать как реконструкцию помех в условиях дефицита информации в случае, когда динамика уравнения допускает одновременные измерения достаточно большого количества траекторий.
3. ПЕРЕХОД К ЗАДАЧЕ ДЛЯ СИСТЕМЫ ОДУ
Применяя ставший классическим метод моментов из [19], по аналогии с [12], [13], сведем задачу восстановления для СДУ к задаче для системы ОДУ. Введем обозначения ${{m}_{0}} = M{{x}_{0}}$, ${{D}_{0}} = M({{x}_{0}} - {{m}_{0}})({{x}_{0}} - {{m}_{0}}){\kern 1pt} '$. Отметим, что матрица ${{D}_{0}}$ является диагональной (ввиду независимости координат вектора ${{x}_{0}}$). В силу квазилинейности исходного уравнения и равенства нулю математического ожидания интеграла Ито величина $m(t)$ зависит только от ${{u}_{1}}(t)$; ее динамика описывается уравнением
(3.1)
$\dot {m}(t) = A(t)m(t) + B(t){{u}_{1}}(t) + f(t),\quad m \in {{\mathbb{R}}^{n}},\quad m(0) = {{m}_{0}}.$Напомним, что измерению доступны первые $q$ координат исходного $n$-мерного вектора $x$, что обеспечивает получение оценки (2.2) для первых $q$ координат вектора $m$; количество неизмеряемых координат равно $n - q$. Используя стандартную схему теории динамического обращения (см. [4], [5]), запишем уравнение (3.1) в виде системы с разделением измеряемой и неизмеряемой компонент. Введем следующие матрицы:
(3.2)
${{\dot {y}}_{m}}(t) = A_{{1y}}^{m}(t){{y}_{m}}(t) + A_{{1z}}^{m}(t){{z}_{m}}(t) + B_{1}^{m}(t){{u}_{1}}(t) + C_{1}^{m}f(t),\quad {{y}_{m}}(0) = {{y}_{{m0}}},$(3.3)
${{\dot {z}}_{m}}(t) = A_{{2y}}^{m}(t){{y}_{m}}(t) + A_{{2z}}^{m}(t){{z}_{m}}(t) + B_{2}^{m}(t){{u}_{1}}(t) + D_{1}^{m}f(t),\quad {{z}_{m}}(0) = {{z}_{{m0}}},$Ковариационная матрица $D(t)$ не зависит от ${{u}_{1}}(t)$ явно. Для описания ее динамики используется схема вывода уравнения метода моментов, примененная в [12], [13]. В результате для $D \in {{\mathbb{R}}^{{n \times n}}}$ имеем следующее уравнение:
(3.4)
$\dot {D}(t) = A(t)D(t) + D(t)A{\kern 1pt} '(t) + {{U}_{2}}(t)(D(t) + m(t)m{\kern 1pt} '(t))U_{2}^{'}(t),\quad D(0) = {{D}_{0}}.$Матричное уравнение (3.4) переписываем в виде более традиционного для рассматриваемых задач векторного уравнения, размерность которого, с учетом симметричности матрицы $D(t)$, определяется как ${{n}_{{yz}}} = ({{n}^{2}} + n){\text{/}}2$. Вводится вектор $d(t) = \{ {{d}_{s}}(t)\} ,$ $s \in [1:{{n}_{{yz}}}]$, состоящий из последовательно записанных и пронумерованных элементов матрицы $D(t)$, взятых построчно, начиная с элементов, расположенных на главной диагонали; его координаты находятся по элементам матрицы $D(t) = \{ {{d}_{{ij}}}(t)\} ,$ $i,j \in [1:n]$:
Отметим, что соотношения (3.5) между индексами $s$ и $i,j$ взаимно однозначны ввиду способа нумерации элементов части матрицы $D(t)$. Процедура, аналогичная подробно описанной в [20], позволяет преобразовать уравнение (3.4) к виду
(3.6)
$\dot {d}(t) = \bar {A}(t)d(t) + \bar {B}(d(t),\bar {m}(t))\bar {u}(t),\quad d({{t}_{0}}) = {{d}_{0}},$(3.7)
${{\bar {b}}_{{ss}}} = {{d}_{s}} + {{\bar {m}}_{s}},\quad {{\bar {b}}_{{sr}}} = 0,{\kern 1pt} \quad s \ne r,\quad s,r \in [1:{{n}_{{yz}}}].$Измерения первых $q$ координат вектора $x$ обеспечивают оценку типа (2.2) для $({{q}^{2}} + q){\text{/}}2$ координат вектора $d$, номера которых находятся из (3.5) и, в общем случае, не идут подряд. Обозначим ${{n}_{y}} = ({{q}^{2}} + q){\text{/}}2$, ${{n}_{z}} = {{n}_{{yz}}} - {{n}_{y}}$. Определим ${{I}_{y}}$ как ${{n}_{y}}$-мерный упорядоченный по возрастанию массив индексов, соответствующих измеряемым координатам вектора $d$:
Введем следующие матрицы:
(3.8)
${{\dot {y}}_{d}}(t) = A_{{1y}}^{d}(t){{y}_{d}}(t) + A_{{1z}}^{d}(t){{z}_{d}}(t) + B_{1}^{d}({{y}_{d}}(t),\;{{y}_{m}}(t))\bar {u}(t),\quad {{y}_{d}}(0) = {{y}_{{d0}}},$(3.9)
${{\dot {z}}_{d}}(t) = A_{{2y}}^{d}(t){{y}_{d}}(t) + A_{{2z}}^{d}(t){{z}_{d}}(t) + B_{2}^{d}({{z}_{d}}(t),\;{{z}_{m}}(t))\bar {u}(t),\quad {{z}_{d}}(0) = {{z}_{{d0}}},$Отметим, что ввиду специфики матрицы $\bar {B}$, $B_{1}^{d}$ зависит только от ${{y}_{d}}(t)$, ${{y}_{m}}(t)$, а $B_{2}^{d}$ – только от ${{z}_{d}}(t)$, ${{z}_{m}}(t)$.
Теперь для систем (3.2), (3.3) и (3.8), (3.9) можно переформулировать исходную задачу восстановления. По ходу развития процесса в дискретные моменты времени ${{\tau }_{i}} \in T$, ${{\tau }_{i}} = i\delta $, $\delta = \vartheta {\text{/}}l(N)$, $i \in [0:(l(N) - 1)]$ поступает информация, позволяющая оценить части фазового состояния указанных систем, соответственно, векторы ${{y}_{m}}({{\tau }_{i}})$ и ${{y}_{d}}({{\tau }_{i}})$. Полагаем, что выполняется следующее соотношение, соответствующее (2.2):
(3.10)
$P\left( {\mathop {\max }\limits_{i \in [1:(l(N) - 1)]} \left\{ {{{{\left\| {\xi _{{mi}}^{N} - {{y}_{m}}({{\tau }_{i}})} \right\|}}_{{{{\mathbb{R}}^{q}}}}},{{{\left\| {\xi _{{di}}^{N} - {{y}_{d}}({{\tau }_{i}})} \right\|}}_{{{{\mathbb{R}}^{{{{n}_{y}}}}}}}}} \right\} \leqslant h(N)} \right) = 1 - g(N),$Требуется указать алгоритм динамического восстановления неизвестных возмущений ${{u}_{1}}(t)$ и $\bar {u}(t)$ по информации (3.10), причем вероятность сколь угодно малого отклонения приближений от искомых входов в метрике соответственно пространств ${{L}_{2}}(T;{{\mathbb{R}}^{r}})$ и ${{L}_{2}}(T;{{\mathbb{R}}^{{{{n}_{{yz}}}}}})$ должна быть близка к 1 при достаточно большом $N$ и специальным образом согласованном с $N$ шаге временной дискретизации $\delta = \delta (N) = \vartheta {\text{/}}l(N)$.
В такой формулировке задача соответствует задаче, рассмотренной в [4] для случая измерения части координат ОДУ. В настоящей работе показано, что алгоритм, предложенный в [4], применим к решению задачи, полученной для систем (3.2), (3.3) и (3.8), (3.9), поскольку допускает конструктивное согласование своих параметров с количеством доступных измерению реализаций исходного случайного процесса, при этом легко проверяемые достаточные условия разрешимости задачи фактически формулируются в терминах исходного уравнения (2.1).
4. АЛГОРИТМ ВОССТАНОВЛЕНИЯ НЕИЗВЕСТНЫХ ВОЗМУЩЕНИЙ
Разрешающий алгоритм будем строить в случае выполнения следующих условий.
Условие 1. Размерность неизвестной вектор-функции ${{u}_{1}}({\kern 1pt} \cdot {\kern 1pt} )$ не превосходит размерности компоненты ${{y}_{m}}({\kern 1pt} \cdot {\kern 1pt} )$ ($r \leqslant q$), и при всех $t \in T$ матрица $B_{1}^{m}(t)$ размерности $q \times r$ имеет ранг, равный $r$, т.е. является матрицей полного ранга.
Условие 2. Неизвестная вектор-функции ${{u}_{2}}({\kern 1pt} \cdot {\kern 1pt} )$ имеет следующую структуру: $\exists k \leqslant q$ $\forall i \in [(k + 1):n]$ $\exists j \in [1:k]:{{u}_{{2i}}} = {{u}_{{2j}}}$.
Таким образом, если количество неизвестных компонент функции ${{u}_{2}}({\kern 1pt} \cdot {\kern 1pt} )$ не превосходит $q$, тогда количество неизвестных компонент функции $\bar {u}({\kern 1pt} \cdot {\kern 1pt} )$, равное ${{n}_{k}} = ({{k}^{2}} + k){\text{/}}2$, не превосходит размерности компоненты ${{y}_{d}}({\kern 1pt} \cdot {\kern 1pt} )$, т.е. ${{n}_{k}} \leqslant {{n}_{y}}$.
Отметим, что, в отличие от условий, гарантирующих реконструкцию возмущения в частично наблюдаемой системе линейных СДУ (см. [12]), в случае квазилинейного СДУ можно потребовать наличие полного ранга матрицы $B_{1}^{m}$, но не матрицы $B_{1}^{d}$, которая зависит от решений систем (3.2), (3.3) и (3.8), (3.9).
Лемма 1. Пусть все структурные элементы исходного уравнения (2.1) (именно, матрицы $A$, $B$, $f$, вектор ${{x}_{0}}$, множества ${{S}_{{{{u}_{1}}}}}$ и ${{S}_{{{{u}_{2}}}}}$) таковы, что решение $m(t)$ уравнения (3.1) покоординатно строго больше нуля на всем промежутке времени $T$, а решение $d(t)$ уравнения (3.6) покоординатно неотрицательно на всем промежутке времени $T$. Тогда существует $\bar {N}$ такое, что $\forall N \geqslant \bar {N}$ матрица $B_{1}^{d}(\xi _{{di}}^{N},\xi _{{mi}}^{N})$ с вероятностью $1 - g(N)$ является матрицей полного ранга $\forall i \in [1:(l(N) - 1)]$.
Доказательство. Отметим, что условие леммы выполняется, например, в случае, когда все элементы матриц $A$, $B$, $f$ неотрицательны, все координаты начального вектора ${{m}_{0}}$ строго больше нуля (тогда как элементы матрицы ${{D}_{0}}$ неотрицательны вследствие предположения о независимости координат начального вектора ${{x}_{0}}$), и возмущения ${{u}_{1}}$ и ${{u}_{2}}$ принимают неотрицательные значения. Полагаем, что существует величина $\beta > 0$ такая, что $\forall t \in T$, $\forall j \in [1:n]$ ${{m}_{j}}(t) \geqslant \beta $.
Полнота ранга матрицы $B_{1}^{d}(\xi _{{di}}^{N},\xi _{{mi}}^{N})$ размерности ${{n}_{y}} \times {{n}_{{yz}}}$, ввиду ее структуры, описанной выше, определяется тем, что на местах, соответствующих ${{n}_{y}}$ единицам матрицы $C_{1}^{d}$, расположены ненулевые элементы, являющиеся элементами диагональной матрицы $\bar {B}(d({{\tau }_{i}}),\bar {m}({{\tau }_{i}}))$ с индексами, пробегающими множество ${{I}_{y}}$ (см. (3.7)), и при подстановке $\xi _{{di}}^{N}$ и $\xi _{{mi}}^{N}$. Фактически, для доказательства леммы следует проверить выполнение соотношений
(4.1)
${{\bar {b}}_{{ss}}}(\xi _{{di}}^{N},\xi _{{mi}}^{N}) = \xi _{{dis}}^{N} + \bar {\xi }_{{mis}}^{N} \ne 0,\quad i \in [1:(l(N) - 1)],\quad s \in {{I}_{y}},\quad \bar {\xi }_{{mi}}^{N} = F(\xi _{{mi}}^{N}).$Выполнение условий 1, 2 и леммы 1 гарантирует единственность функций ${{u}_{1}}({\kern 1pt} \cdot {\kern 1pt} )$ и $\bar {u}({\kern 1pt} \cdot {\kern 1pt} )$, определяющих решения $({{y}_{m}}({\kern 1pt} \cdot {\kern 1pt} ),{{z}_{m}}({\kern 1pt} \cdot {\kern 1pt} ))$ и $({{y}_{d}}({\kern 1pt} \cdot {\kern 1pt} ),{{z}_{d}}({\kern 1pt} \cdot {\kern 1pt} ))$ систем (3.2), (3.3) и (3.8), (3.9) соответственно. Обоснование этого утверждения опирается на свойства псевдообратной матрицы для матрицы полного ранга (см. [4], [21]), т.е. в данной постановке на свойства псевдообратных матриц для $B_{1}^{m}$ и $B_{1}^{d}$, и, за вычетом малозначительных деталей, следует аналогичным рассуждениям из [4], [5].
Алгоритм, приведенный ниже, является приложением вычислительной процедуры из [4] к системам (3.2), (3.3) и (3.8), (3.9). В начальный момент ${{\tau }_{0}} = 0$ фиксируется значение $N$, определяются величины ${{l}^{N}} = l(N)$, ${{h}^{N}} = h(N)$ и ${{g}^{N}} = g(N)$ (см. (3.10)) и строится равномерное разбиение промежутка $T$ с шагом ${{\delta }^{N}} = \vartheta {\text{/}}{{l}^{N}}$: ${{\tau }_{i}} \in T,\;{{\tau }_{i}} = i{{\delta }^{N}},\;i \in [0:{{l}^{N}}]$. Вводится управляемая система-модель, фактически содержащая два блока, относящихся к системам (3.2), (3.3) и (3.8), (3.9). Фазовый вектор модели обозначим через $w(t)$; он состоит из двух троек: (i) $q$-мерного вектора ${{w}_{{my}}}(t)$, $(n - q)$-мерного вектора ${{w}_{{mz}}}(t)$, $q$-мерного вектора ${{w}_{{mu}}}(t)$ и (ii) ${{n}_{y}}$-мерного вектора ${{w}_{{dy}}}(t)$, ${{n}_{z}}$‑мерного вектора ${{w}_{{dz}}}(t)$, ${{n}_{y}}$-мерного вектора ${{w}_{{dv}}}(t)$. Динамика модели и ее начальное состояние определяются соотношениями
(4.2)
${{\dot {w}}_{{mu}}}(t) = A_{{1y}}^{m}({{\tau }_{i}})\xi _{{mi}}^{N} + A_{{1z}}^{m}({{\tau }_{i}}){{w}_{{mz}}}({{\tau }_{i}}) + B_{1}^{m}({{\tau }_{i}})\hat {u}_{{1i}}^{N} + C_{1}^{m}f({{\tau }_{i}}),$Динамика (4.2) выбирается из следующих соображений. Движение вспомогательных компонент ${{w}_{{my}}}(t)$ и ${{w}_{{dy}}}(t)$ при подходящем выборе модельных управлений
Работа алгоритма разбивается на ${{l}^{N}}$ однотипных шагов. На $i$-м шаге, который выполняется на интервале $({{\tau }_{i}},{\kern 1pt} {{\tau }_{{i + 1}}}]$, исходными данными для вычислений служат оценки $\xi _{{mi}}^{N}$, $\xi _{{di}}^{N}$ и сформированное к этому моменту состояние модели $w({{\tau }_{i}})$. Предполагая покоординатную ограниченность правых частей уравнений (3.2) и (3.8) константой $\bar {K}$ (ее существование очевидно), находим $s$-ю координату $\bar {u}_{{1is}}^{N}$ вектора $\bar {u}_{{1i}}^{N}$ и $s$-ю координату $\bar {v}_{{is}}^{N}$ вектора $\bar {v}_{i}^{N}$ из соотношений
(4.3)
$\begin{gathered} \bar {u}_{{1is}}^{N} = - \bar {K}\operatorname{sign} ({{w}_{{mys}}}({{\tau }_{i}}) - \xi _{{mis}}^{N}),\quad s \in [1:q], \\ \bar {v}_{{is}}^{N} = - \bar {K}\operatorname{sign} ({{w}_{{dys}}}({{\tau }_{i}}) - \xi _{{dis}}^{N}),\quad s \in [1:{{n}_{y}}]. \\ \end{gathered} $(4.4)
$\begin{gathered} \hat {u}_{{1i}}^{N} = \arg \min \left\{ {2\langle {{w}_{{mu}}}({{\tau }_{i}}) - \xi _{{mi}}^{N},B_{1}^{m}({{\tau }_{i}})u\rangle + {{\alpha }^{N}}\left\| u \right\|_{{{{\mathbb{R}}^{r}}}}^{2}:u \in {{S}_{{{{u}_{1}}}}}} \right\}, \\ \hat {v}_{i}^{N} = \arg \min \left\{ {2\langle {{w}_{{dv}}}({{\tau }_{i}}) - \xi _{{di}}^{N},B_{1}^{d}(\xi _{{di}}^{N},\xi _{{mi}}^{N})v\rangle + {{\alpha }^{N}}\left\| v \right\|_{{{{\mathbb{R}}^{{{{n}_{{yz}}}}}}}}^{2}:v \in {{S}_{{\bar {u}}}}} \right\}, \\ \end{gathered} $Теорема 1. Пусть выполняются условия согласования параметров
(4.5)
${{h}^{N}} \to 0,\quad {{g}^{N}} \to 0,\quad {{\delta }^{N}} \to 0,\quad {{\alpha }^{N}} \to 0,\quad \frac{{{{\delta }^{N}} + {{h}^{N}}}}{{{{\alpha }^{N}}}} \to 0\quad {\text{при}}\quad N \to \infty .$(4.6)
$P\left( {\max \left\{ {{{{\left\| {\hat {u}_{1}^{N}({\kern 1pt} \cdot {\kern 1pt} ) - {{u}_{1}}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}}_{{{{L}_{2}}(T;{{\mathbb{R}}^{r}})}}},{\kern 1pt} {{{\left\| {{{{\hat {v}}}^{N}}({\kern 1pt} \cdot {\kern 1pt} ) - \bar {u}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}}_{{{{L}_{2}}(T;{{\mathbb{R}}^{{{{n}_{{yz}}}}}})}}}} \right\} \to 0} \right) \to 1.$(4.7)
$P\left( {\max \left\{ {{{{\left\| {\hat {u}_{1}^{N}({\kern 1pt} \cdot {\kern 1pt} ) - {{u}_{1}}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}}_{{{{L}_{2}}(T;{{\mathbb{R}}^{r}})}}},\;{{{\left\| {{{{\hat {v}}}^{N}}({\kern 1pt} \cdot {\kern 1pt} ) - \bar {u}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}}_{{{{L}_{2}}(T;{{\mathbb{R}}^{{{{n}_{{yz}}}}}})}}}} \right\} \leqslant {{C}_{1}}{{{\left( {\frac{1}{N}} \right)}}^{{2/13}}}} \right) = 1 - {{C}_{2}}{{\left( {\frac{1}{N}} \right)}^{{2/13}}},$Доказательство теоремы, за вычетом некоторых технических деталей, повторяет доказательство соответствующего утверждения для алгоритма реконструкции двух возмущений в случае измерения части координат линейного СДУ (см. [12]). В частности, там показано, что стандартные оценки $m_{i}^{N}$ математического ожидания $m({{\tau }_{i}})$ и $D_{i}^{N}$ ковариационной матрицы $D({{\tau }_{i}})$, построенные по $N$ $(N > 1)$ реализациям ${{x}^{1}}({{\tau }_{i}}),{{x}^{2}}({{\tau }_{i}}), \ldots ,{{x}^{N}}({{\tau }_{i}})$ случайных величин $x({{\tau }_{i}})$, $i \in [1:{{l}^{N}}],$ по следующим правилам (см. [18]):
(4.8)
$m_{i}^{N} = \frac{1}{N}\sum\limits_{r = 1}^N \,{{x}^{r}}({{\tau }_{i}}),\quad {\kern 1pt} D_{i}^{N} = \frac{1}{{N - 1}}\sum\limits_{r = 1}^N \,({{x}^{r}}({{\tau }_{i}}) - m_{i}^{N})({{x}^{r}}({{\tau }_{i}}) - m_{i}^{N}){\kern 1pt} ',$Теорема 2. Если искомый вектор ${{u}_{2}}( \cdot )$ является единственным, и его координаты неотрицательны, т.e. ${{S}_{{{{u}_{2}}}}}$ таково, что ${{u}_{{2i}}}(t) \geqslant 0$ $\forall t \in T$ $\forall i \in [1:n]$, то алгоритм (4.2)–(4.5) восстанавливает ${{u}_{2}}({\kern 1pt} \cdot {\kern 1pt} )$ в смысле ${{L}_{2}}(T;{{\mathbb{R}}^{n}})$-метрики.
Доказательство. Отметим, что ограничение ${{u}_{{2i}}}(t) \geqslant 0$ представляется естественным для шума с нулевым средним. Рассмотрим $n$-мерный вектор $\bar {\bar {u}}({\kern 1pt} \cdot {\kern 1pt} )$, состоящий из координат вектора $\bar {u}({\kern 1pt} \cdot {\kern 1pt} )$, которые равны $u_{{2i}}^{2}$, $i \in [1:n]$, и вектор ${{\bar {\bar {v}}}^{N}}({\kern 1pt} \cdot {\kern 1pt} )$, состоящий из соответствующих координат вектора ${{\hat {v}}^{N}}({\kern 1pt} \cdot {\kern 1pt} )$. Из структуры множества ${{S}_{{\bar {u}}}}$ и формул (4.4) для нахождения ${{\hat {v}}^{N}}({\kern 1pt} \cdot {\kern 1pt} )$ следует, что $\bar {\bar {v}}_{i}^{N}(t) \geqslant 0$ $\forall t \in T$ $\forall i \in [1:n]$. Поэтому возможно положить $v_{{2i}}^{N}(t) = \sqrt {\bar {\bar {v}}_{i}^{N}(t)} $. Тогда из (4.6) получаем
Используя неравенства
5. ЧИСЛЕННЫЙ ПРИМЕР
Перейдем к описанию модельного примера. Рассмотрим квазилинейное уравнение, описывающее случайный процесс, который можно трактовать как “испорченный” средневозвратный процесс Орнштейна–Уленбека (см. [17]):
(5.1)
$d{{x}_{2}}(t) = (0.1{{x}_{1}}(t) - {{x}_{2}}(t) + 2{{u}_{1}}(t) + 2){\kern 1pt} dt + {{u}_{2}}(t){{x}_{2}}(t){\kern 1pt} d\xi (t),$Уравнения типа (5.1) используются, в частности, в некоторых простейших моделях, описывающих динамику численности относительно устойчивых популяций живых организмов (см. [17]). В таком случае величины ${{x}_{1}}(t)$ и ${{x}_{2}}(t)$ представляют текущие численности (в условных единицах) двух взаимодействующих популяций; структура детерминированной части уравнения определяет численности (например, средние за некоторую предысторию), стремление вернуться к которым “подсознательно” присутствует у популяции. Такому возврату могут препятствовать как влияние соседей, так и воздействие внешних факторов через функцию ${{u}_{1}}(t)$ в детерминированной части и функцию ${{u}_{2}}(t)$, входящую в амплитуду случайных колебаний. Именно внешние возмущения ${{u}_{1}}(t)$ и ${{u}_{2}}(t)$ подлежат восстановлению. Измерению в дискретные моменты времени доступны траектории координаты ${{x}_{1}}(t)$, соответствующие различным колониям организмов первого типа.
Запишем “редуцированные” системы вида (3.2), (3.3) и (3.8), (3.9), описывающие, соответственно, динамику математического ожидания $m(t)$ и ковариационной матрицы $D(t) = \left( {\begin{array}{*{20}{c}} {{{d}_{1}}}&{{{d}_{2}}} \\ {{{d}_{2}}}&{{{d}_{3}}} \end{array}} \right)$:
(5.2)
$\begin{gathered} {{{\dot {m}}}_{1}}(t) = - 2{{m}_{1}}(t) + 0.1{{m}_{2}}(t) + {{u}_{1}}(t) + 1,\quad {{m}_{1}}(0) = 1, \\ {{{\dot {m}}}_{2}}(t) = 0.1{{m}_{1}}(t) - {{m}_{2}}(t) + 2{{u}_{1}}(t) + 2,{\kern 1pt} \quad {{m}_{2}}(0) = 1; \\ \end{gathered} $(5.3)
${{\dot {d}}_{2}}(t) = 0.1{{d}_{1}}(t) - 3{{d}_{2}}(t) + 0.1{{d}_{3}}(t) + ({{d}_{2}}(t) + {{m}_{1}}(t){{m}_{2}}(t))u_{2}^{2}(t),\quad {{d}_{2}}(0) = 0,$Для моделирования динамики системы (5.1) использовался метод Эйлера с заменой винеровского процесса последовательностью случайных импульсов (подробное описание аппроксимационной схемы можно найти, например, в [22]); его среднеквадратический порядок точности для квазилинейного СДУ равен $O({{\delta }_{s}})$, где ${{\delta }_{s}}$ – шаг моделирования. Этот шаг, как правило, очень мал относительно шага ${{\delta }^{N}}$, с которым поступает информация о траекториях системы, обрабатываемая согласно (4.8), и, соответственно, работает процедура восстановления неизвестных функций ${{u}_{1}}(t)$ и ${{u}_{2}}(t)$. Для получения оценок (3.10) необходимо отслеживание $N$ независимых траекторий системы (5.1).
Результаты восстановления функций ${{u}_{1}}(t)$ и ${{u}_{2}}(t)$, полученные для различных наборов параметров алгоритма (4.2)–(4.5), приведены на фиг. 1 и фиг. 2, где реальные функции ${{u}_{1}}(t)$ и ${{u}_{2}}(t)$ изображены штриховой линией, а результаты их восстановления – сплошной. Они согласуются с основным утверждением статьи, подтверждая сходимость типа (4.6)–(4.7): чем больше количество $N$ измеряемых траекторий, тем меньше (с вероятностью, близкой к 1) погрешность восстановления.
Фиг. 1.
Параметры: $N = {{10}^{4}}$, ${{\delta }^{N}} = 0.01$, ${{\alpha }^{N}} = 0.04$, ${{\delta }_{s}} = {{\delta }^{N}}{\text{/}}{{10}^{4}}$; погрешности: ${{\left\| {\hat {u}_{1}^{N}({\kern 1pt} \cdot {\kern 1pt} ) - {{u}_{1}}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}_{{{{L}_{2}}}}} = 0.953$, ${{\left\| {v_{2}^{N}({\kern 1pt} \cdot {\kern 1pt} ) - {{u}_{2}}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}_{{{{L}_{2}}}}} = 0.912$.

Фиг. 2.
Параметры: $N = {{10}^{6}}$, ${{\delta }^{N}} = 0.001$, ${{\alpha }^{N}} = 0.009$, ${{\delta }_{s}} = {{\delta }^{N}}{\text{/}}{{10}^{4}}$; погрешности: ${{\left\| {\hat {u}_{1}^{N}({\kern 1pt} \cdot {\kern 1pt} ) - {{u}_{1}}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}_{{{{L}_{2}}}}} = 0.096$, ${{\left\| {v_{2}^{N}({\kern 1pt} \cdot {\kern 1pt} ) - {{u}_{2}}({\kern 1pt} \cdot {\kern 1pt} )} \right\|}_{{{{L}_{2}}}}} = 0.104$.

6. ЗАКЛЮЧЕНИЕ
Таким образом, исследована постановка обратной задачи для квазилинейного СДУ, предполагающая динамическую реконструкцию двух неизвестных неслучайных возмущений, входящих в детерминированный и стохастический члены уравнения. В качестве входной информации используются точные измерения некоторого количества реализаций части координат случайного процесса в дискретные моменты времени. Решение задачи состоит в переходе к обратной задаче для двух систем ОДУ специального вида с последующим использованием модификации алгоритма восстановления, разработанного ранее для частично наблюдаемых систем ОДУ. Доказанная оценка точности алгоритма относительно количества доступных измерению реализаций проиллюстрирована на модельном примере. Ряд вопросов, связанных с рассматриваемой постановкой, остается открытым: например, об улучшении порядка точности оценки (4.7) при дополнительных предположениях и о возможности введения погрешности измерения траекторий исходного СДУ.
Список литературы
Кряжимский А.В., Осипов Ю.С. О моделировании управления в динамической системе // Изв. АН СССР. Техн. кибернетика. 1983. № 2. С. 51–60.
Osipov Yu.S., Kryazhimskii A.V. Inverse problems for ordinary differential equations: dynamical solutions. London: Gordon and Breach, 1995.
Максимов В.И. Задачи динамического восстановления входов бесконечномерных систем. Екатеринбург: Изд-во УрО РАН, 2000.
Кряжимский А.В., Осипов Ю.С. Об устойчивом позиционном восстановлении управления по измерениям части координат // Некоторые задачи управления и устойчивости. Свердловск: УрО АН СССР, 1989. С. 33–47.
Осипов Ю.С., Кряжимский А.В., Максимов В.И. Методы динамического восстановления входов управляемых систем. Екатеринбург: Изд-во УрО РАН, 2011.
Сурков П.Г. Задача динамического восстановления правой части системы дифференциальных уравнений нецелого порядка // Дифференц. ур-ния. 2019. Т. 55. № 6. С. 865–874.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1984.
Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1978.
Осипов Ю.С., Кряжимский А.В. Позиционное моделирование стохастического управления в динамических системах // Докл. междунар. конф. по стохастической оптимизации. Киев, 1984. С. 43–45.
Кряжимский А.В., Осипов Ю.С. О динамической регуляризации при случайных помехах // Тр. Матем. ин-та им. В.А. Стеклова. 2010. Т. 271. С. 134–147.
Розенберг В.Л. Задача динамического восстановления неизвестной функции в линейном стохастическом дифференциальном уравнении // Автоматика и телемехан. 2007. № 11. С. 76–87.
Розенберг В.Л. Восстановление внешних воздействий при дефиците информации в линейном стохастическом уравнении // Тр. Ин-та матем. и механ. УрО РАН. 2016. Т. 22. № 2. С. 236–244.
Розенберг В.Л. Динамическая реконструкция возмущений в квазилинейном стохастическом дифференциальном уравнении // Ж. вычисл. матем. и матем. физ. 2018. Т. 58. № 7. С. 1121–1131.
Rozenberg V.L. On a problem of dynamical input reconstruction for a system of special type under conditions of uncertainty // AIMS Math. 2020. V. 5. № 5. P. 4108–4120.
Румянцев Д.С., Хрусталев М.М. Оптимальное управление квазилинейными системами диффузионного типа при неполной информации о состоянии // Изв. РАН. Теория и системы управления. 2006. № 5. С. 43–51.
Ширяев А.Н. Вероятность, статистика, случайные процессы. М.: Изд-во МГУ, 1974.
Оксендаль Б. Стохастические дифференциальные уравнения. Введение в теорию и приложения. М.: Мир, 2003.
Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятностей и математической статистике. М.: Наука, 1985.
Черноусько Ф.Л., Колмановский В.Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978.
Rozenberg V.L. A control problem under incomplete information for a linear stochastic differential equation // Ural Math. J. 2015. V. 1. № 1. P. 68–82.
Гантмахер Ф.Р. Теория матриц. М.: Наука, 1988.
Мильштейн Г.Н. Численное интегрирование стохастических дифференциальных уравнений. Свердловск: Изд-во УрГУ, 1988.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики