Доклады Российской академии наук. Математика, информатика, процессы управления, 2020, T. 493, № 1, стр. 108-111
ТЕРМИНАЛЬНАЯ ИНВАРИАНТНОСТЬ СТОХАСТИЧЕСКИХ СИСТЕМ ДИФФУЗИОННО-СКАЧКООБРАЗНОГО ТИПА
М. М. Хрусталев 1, *, К. А. Царьков 1, **
1 Институт проблем управления им. В.А. Трапезникова Российской академии наук
Москва, Россия
* E-mail: mmkhrustalev@mail.ru
** E-mail: k6472@mail.ru
Поступила в редакцию 15.04.2020
После доработки 15.04.2020
Принята к публикации 30.04.2020
Аннотация
Предложены достаточные условия терминальной инвариантности нелинейных динамических стохастических управляемых систем диффузионно-скачкообразного типа, не имеющие аналогов в мировой литературе. Сформулированы как условия инвариантности по возмущениям при заданной начальной точке, так и условия абсолютной инвариантности, обеспечивающие постоянство значения терминального критерия при любых начальных данных.
В настоящем сообщении разрабатываются достаточные условия терминальной инвариантности стохастических управляемых систем диффузионно-скачкообразного типа. В отличие от диффузионных процессов [1, 2], скачкообразные диффузии описываются стохастическими системами, содержащими не только непрерывную гауссовскую часть, но и разрывную пуассоновскую компоненту [3]. Такие системы (и соответствующие им процессы) в различных источниках называют системами с импульсными воздействиями, со случайным периодом квантования или диффузионно-скачкообразными процессами. Авторы считают последнее наименование наиболее удачным в рамках рассматриваемой теории и ориентируются, в частности, на работы [4, 5], где оно также использовано. В сравнении с исследованиями этих процессов и систем в [4], пуассоновская компонента дополнительно предполагается неоднородной по времени [5, 6].
Под измеримостью (подмножеств действительного пространства и действительнозначных функций на нем) в работе понимается измеримость по Борелю. Обозначения $f( \cdot )$ и $f(t)$ для записи функции одной переменной t там, где это не вызывает противоречий, отождествляются.
1. ПОСТАНОВКА ЗАДАЧИ
Предположим, что управляемая динамическая система описывается стохастическим дифференциальным уравнением [3]
(1)
$\begin{gathered} dx(t) = f(t,x(t),u(t,x(t),{v}(t)),{v}(t))dt + \\ + \;g(t,x(t),u(t,x(t),{v}(t)),{v}(t))dw(t) + \\ + \;\int\limits_{{{R}^{r}}} h(t,x({{t}^{ - }}),u(t,x({{t}^{ - }}),{v}),{v})\hat {\mu }(dt \times d{v}),\quad x({{t}_{0}}) = {{x}_{0}}, \\ \end{gathered} $Определение 1. Стратегию управления $(t,x,{v}) \to u(t,x,{v})$ будем называть B0-допустимой, если уравнение (1) имеет слабое решение [3, с. 519] на интервале $[{{t}_{0}};{{t}_{F}}]$ для любого фиксированного начального условия $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$.
Если при заданных множестве B0 и функциях $f( \cdot )$, $g( \cdot )$, $h( \cdot )$, $\Pi ( \cdot )$ не существует ни одной ${{B}_{0}}$-допустимой стратегии, то такая управляемая динамическая система дальнейшему анализу не подлежит. Ниже рассматриваются только B0-допустимые стратегии управления.
Пусть стратегия $(t,x,{v}) \to u(t,x,{v})$ фиксирована. Рассмотрим некоторое начальное условие $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$. В соответствии с определением 1, существует слабое решение Ξ уравнения (1), включающее в себя вероятностное пространство ($\Omega $, Ψ, P) с фильтрацией $\{ {{\Psi }_{t}} \subset \Psi , \;t \in [{{t}_{0}};{{t}_{F}}]\} $, на котором найдутся процесс ${v}(t)$ с распределением $\nu (t, \cdot )$, винеровский процесс $w(t)$, пуассоновская мера $\mu ( \cdot )$ интенсивности $\Pi (t, \cdot )$ и процесс $x(t)$, все согласованные с ${{\Psi }_{t}}$ и P-п.н. связанные соотношением (1) при $t \in [{{t}_{0}};{{t}_{F}}]$. Через $D({{t}_{0}},{{x}_{0}})$ обозначим множество всех таких решений Ξ, и введем также множество
На множестве $D({{B}_{0}})$ определим терминальный критерий, который каждому элементу $\Xi \in D({{B}_{0}})$ ставит в соответствие случайную величину
Определение 2. Систему (1) при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ будем называть инвариантной по возмущениям, если для любой фиксированной начальной точки $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$ и при любом $\Xi \in D({{t}_{0}},{{x}_{0}})$ случайная величина (2) совпадает P-п.н. с некоторым числом ${{J}_{c}}({{t}_{0}},{{x}_{0}})$.
Определение 3. Систему (1) при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ будем называть абсолютно инвариантной, если при любом $\Xi \in D({{B}_{0}})$ случайная величина (2) совпадает P-п.н. с одним и тем же числом $J_{c}^{A}$.
В условиях задачи, сформулированных в настоящем разделе, требуется определить стратегию управления, обеспечивающую терминальную инвариантность динамической системы (1) в смысле определения 2 или определения 3.
2. ДОСТАТОЧНЫЕ УСЛОВИЯ ТЕРМИНАЛЬНОЙ ИНВАРИАНТНОСТИ
Введем в рассмотрение множество $\Phi $ функций $(t,x) \to \varphi (t,x){\text{:}}\,\,[{{t}_{S}};{{t}_{F}}] \times {{R}^{n}} \to R$, имеющих непрерывные производные ${{\varphi }_{t}}$, ${{\varphi }_{x}}$, ${{\varphi }_{{xx}}}$. Для краткости обозначим
(4)
$\begin{gathered} K(t,x,u,{v}) = {{\varphi }_{t}}(t,x) + \varphi _{x}^{{\text{т}}}(t,x)f(t,x,u,{v}) + \\ + \;\frac{1}{2}{\text{tr}}[\sigma (t,x,u,{v}){{\varphi }_{{xx}}}(t,x)], \\ \end{gathered} $(6)
$\begin{gathered} {{\Gamma }^{{(j)}}}(t,x,u,{v}) = \varphi (t,x + {{h}^{{(j)}}}(t,x,u,{v})) - \varphi (t,x), \\ \Gamma = ({{\Gamma }^{{(1)}}},\; \ldots ,\;{{\Gamma }^{{(l)}}}), \\ \end{gathered} $Теорема 1. Если при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ существуют измеримая ограниченная функция $t \to \eta (t){\text{:}}\;[{{t}_{S}};\;{{t}_{F}}] \to R$ и функция $\varphi ( \cdot ) \in \Phi $ такие, что для всех $x \in {{R}^{n}}$, ${v} \in {{R}^{r}}$ выполнены условия
(i) $\varphi ({{t}_{F}},x) = F(x),$
(ii) $L(t,x,u(t,x,{v}),{v}) = \eta (t)$ п.в. на $[{{t}_{S}};\;{{t}_{F}}],$
(iii) $S(t,x,u(t,x,{v}),{v}) = 0$ п.в. на $[{{t}_{S}};\;{{t}_{F}}],$
(iv) $\Gamma (t,x,u(t,x,{v}),{v}) = 0$ всюду на $[{{t}_{S}};\;{{t}_{F}}],$ то система (1) инвариантна по возмущениям, а значение критерия
(9)
${{J}_{c}}({{t}_{0}},{{x}_{0}}) = \varphi ({{t}_{0}},{{x}_{0}}) + \int\limits_{{{t}_{0}}}^{{{t}_{F}}} \eta (t)dt.$Теорема 2. Если при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ существуют измеримая ограниченная функция $t \to \eta (t){\text{:}}\;[{{t}_{S}};\;{{t}_{F}}] \to R$, функция $\varphi ( \cdot ) \in \Phi $ и постоянная A > 0 такие, что для всех $x \in {{R}^{n}}$, ${v} \in {{R}^{r}}$ выполнены условия
(i) $\eta (t_{F}^{ - }) = \eta ({{t}_{F}})$,
(ii) $\varphi ({{t}_{F}},x) = F(x)$,
(iii) $L(t,x,u(t,x,{v}),{v}) = (\eta (t) - A\varphi (t,x))({{t}_{F}} - t{{)}^{{ - 1}}}$ п.в. на $[{{t}_{S}};{{t}_{F}}]$,
(iv) $S(t,x,u(t,x,{v}),{v}) = 0$ п.в. на $[{{t}_{S}};{{t}_{F}}]$,
(v) $\Gamma (t,x,u(t,x,{v}),{v}) = 0$ всюду на $[{{t}_{S}};{{t}_{F}}]$, то система (1) абсолютно инвариантна, а значение критерия
3. ПРИМЕРЫ
Пример 1. Рассмотрим систему
Требуется обеспечить инвариантность системы по возмущениям относительно величины $J = {{x}_{2}}(1)$ для множества ${{B}_{0}} = [0;1) \times {{R}^{2}}$.
Функции $\varphi ( \cdot )$ и $\eta ( \cdot )$ построим в форме
где ${{\psi }_{1}}(t) = sin(t - 1)$, ${{\psi }_{2}}(t) = cos(t - 1)$. Тогда условия теоремы 1 выполняются при выборе управления в виде и замкнутая система становится терминально инвариантной по возмущениям.Пример 2. Запишем систему с дополнительным управлением
При тех же значениях параметров, что и в примере 1, требуется обеспечить абсолютную инвариантность системы относительно величины J = ${{x}_{2}}(1)$ для произвольного начального условия (t0, $x({{t}_{0}})) \in {{B}_{0}}$.
Функции
$J_{c}^{A} = \frac{{\eta (1)}}{A} = 0$.
Список литературы
Хрусталев М.М. Инвариантность стохастических систем диффузионного типа // ДАН. 2017. Т. 476. № 2. С. 148–150.
Хрусталев М.М. Терминальная инвариантность стохастических систем диффузионного типа // АиТ. 2018. № 8. С. 81–100.
Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятностей и математической статистике. М.: Наука, 1985. 640 с.
Øksendal B., Sulem A. Applied Stochastic Control of Jump Diffusions. B.; Heidelberg: Springer, 2005. 266 p.
Рыбаков К.А. Достаточные условия оптимальности в задаче управления системами диффузионно-скачкообразного типа // Тр. Всерос. сов. по пробл. управления (ВСПУ-2014, Москва). М.: ИПУ РАН, 2014. С. 734–744.
Аверина Т.А., Рыбаков К.А. Два метода анализа стохастических систем с пуассоновской составляющей // Дифференц. уравнения и процессы управления. 2013. № 3. С. 85–116.
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления