Доклады Российской академии наук. Математика, информатика, процессы управления, 2020, T. 493, № 1, стр. 108-111

ТЕРМИНАЛЬНАЯ ИНВАРИАНТНОСТЬ СТОХАСТИЧЕСКИХ СИСТЕМ ДИФФУЗИОННО-СКАЧКООБРАЗНОГО ТИПА

М. М. Хрусталев 1*, К. А. Царьков 1**

1 Институт проблем управления им. В.А. Трапезникова Российской академии наук
Москва, Россия

* E-mail: mmkhrustalev@mail.ru
** E-mail: k6472@mail.ru

Поступила в редакцию 15.04.2020
После доработки 15.04.2020
Принята к публикации 30.04.2020

Полный текст (PDF)

Аннотация

Предложены достаточные условия терминальной инвариантности нелинейных динамических стохастических управляемых систем диффузионно-скачкообразного типа, не имеющие аналогов в мировой литературе. Сформулированы как условия инвариантности по возмущениям при заданной начальной точке, так и условия абсолютной инвариантности, обеспечивающие постоянство значения терминального критерия при любых начальных данных.

Ключевые слова: терминальная инвариантность, достаточные условия инвариантности, нелинейные стохастические системы, диффузионно-скачкообразные процессы, системы с импульсными воздействиями

В настоящем сообщении разрабатываются достаточные условия терминальной инвариантности стохастических управляемых систем диффузионно-скачкообразного типа. В отличие от диффузионных процессов [1, 2], скачкообразные диффузии описываются стохастическими системами, содержащими не только непрерывную гауссовскую часть, но и разрывную пуассоновскую компоненту [3]. Такие системы (и соответствующие им процессы) в различных источниках называют системами с импульсными воздействиями, со случайным периодом квантования или диффузионно-скачкообразными процессами. Авторы считают последнее наименование наиболее удачным в рамках рассматриваемой теории и ориентируются, в частности, на работы [4, 5], где оно также использовано. В сравнении с исследованиями этих процессов и систем в [4], пуассоновская компонента дополнительно предполагается неоднородной по времени [5, 6].

Под измеримостью (подмножеств действительного пространства и действительнозначных функций на нем) в работе понимается измеримость по Борелю. Обозначения $f( \cdot )$ и $f(t)$ для записи функции одной переменной t там, где это не вызывает противоречий, отождествляются.

1. ПОСТАНОВКА ЗАДАЧИ

Предположим, что управляемая динамическая система описывается стохастическим дифференциальным уравнением [3]

(1)
$\begin{gathered} dx(t) = f(t,x(t),u(t,x(t),{v}(t)),{v}(t))dt + \\ + \;g(t,x(t),u(t,x(t),{v}(t)),{v}(t))dw(t) + \\ + \;\int\limits_{{{R}^{r}}} h(t,x({{t}^{ - }}),u(t,x({{t}^{ - }}),{v}),{v})\hat {\mu }(dt \times d{v}),\quad x({{t}_{0}}) = {{x}_{0}}, \\ \end{gathered} $
где $t \in [{{t}_{0}};\;{{t}_{F}}] \subset [{{t}_{S}};\;{{t}_{F}}] \subset {{R}_{{\text{ + }}}}$ – время, моменты ${{t}_{S}}$ и ${{t}_{F}}$ фиксированы, ${{t}_{F}}$ совпадает с конечным моментом времени функционирования системы; начальное условие $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$, $ {{t}_{0}} \geqslant {{t}_{S}}$, заранее не задано, но определено множество ${{B}_{0}} \subset [{{t}_{S}};{{t}_{F}}) \times {{R}^{n}}$ всех возможных начальных условий; $x(t)$$n$-мерный вектор, характеризующий состояние системы в момент времени $t$; $t \to {v}(t)$r-мерный случайный процесс с заданным распределением (вероятностной мерой) $\nu (t, \cdot )$, и, в частности, допускается $\nu (t,d{v})\, = \,\delta ({v}\, - \,\phi (t))d{v}$, $\delta ( \cdot )$ – функция Дирака, $\phi ( \cdot )$ – заданная измеримая функция; $t \to w(t)$q-мерный стандартный винеровский процесс, стартующий из нуля в момент времени t0;
$\hat {\mu }(dt \times d{v}){\kern 1pt} {\kern 1pt} : = {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\{ \begin{gathered} \mu (dt \times d{v}) - \Pi (t,d{v})dt,\,\,{\text{если}}\,\,d{v} \subset {{\Theta }_{1}}, \hfill \\ \mu (dt \times d{v}),\,\,{\text{если}}\,\,d{v} \subset {{\Theta }_{2}}, \hfill \\ \end{gathered} \right.$
$\mu ( \cdot )$l-мерная неоднородная случайная пуассоновская мера на $[{{t}_{S}};{{t}_{F}}] \times {{R}^{r}}$ с интенсивностью $t \to \Pi (t, \cdot )$, в каждый момент времени $t$ значение $\Pi (t, \cdot )$ – заданная l-мерная неслучайная ненормированная мера на ${{R}^{r}}$ с условием $0 < \Pi (t,{{R}^{r}}) < + \infty $ такая, что выполнено равенство
$\Pi (t, \cdot ) = \Pi (t,{{R}^{r}})\nu (t, \cdot ),$
${{\Theta }_{{1,2}}}$ – заданные измеримые подмножества ${{R}^{r}}$ такие, что
${{\Theta }_{1}} \cap {{\Theta }_{2}} = \phi , \quad {{\Theta }_{1}} \cup {{\Theta }_{2}} = {{R}^{r}};$
$(t,x,{v}) \to u(t,x,{v})$m-мерная неслучайная измеримая стратегия управления (заранее не задана, но может быть выбрана произвольно в целях, формулируемых далее); $f( \cdot )$, $ g( \cdot )$, $h( \cdot )$ – заданные измеримые матричные функции соответствующих размеров; здесь и далее в работе используется обозначение $x({{t}^{ - }}): = \mathop {lim}\limits_{s \to t - 0} x(s)$. Предполагается, что процессы ${v}(t)$, $w(t)$ и мера $\mu ( \cdot )$ независимы в совокупности.

Определение 1. Стратегию управления $(t,x,{v}) \to u(t,x,{v})$ будем называть B0-допустимой, если уравнение (1) имеет слабое решение [3, с. 519] на интервале $[{{t}_{0}};{{t}_{F}}]$ для любого фиксированного начального условия $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$.

Если при заданных множестве B0 и функциях $f( \cdot )$, $g( \cdot )$, $h( \cdot )$, $\Pi ( \cdot )$ не существует ни одной ${{B}_{0}}$-допустимой стратегии, то такая управляемая динамическая система дальнейшему анализу не подлежит. Ниже рассматриваются только B0-допустимые стратегии управления.

Пусть стратегия $(t,x,{v}) \to u(t,x,{v})$ фиксирована. Рассмотрим некоторое начальное условие $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$. В соответствии с определением 1, существует слабое решение Ξ уравнения (1), включающее в себя вероятностное пространство ($\Omega $, Ψ, P) с фильтрацией $\{ {{\Psi }_{t}} \subset \Psi , \;t \in [{{t}_{0}};{{t}_{F}}]\} $, на котором найдутся процесс ${v}(t)$ с распределением $\nu (t, \cdot )$, винеровский процесс $w(t)$, пуассоновская мера $\mu ( \cdot )$ интенсивности $\Pi (t, \cdot )$ и процесс $x(t)$, все согласованные с ${{\Psi }_{t}}$ и P-п.н. связанные соотношением (1) при $t \in [{{t}_{0}};{{t}_{F}}]$. Через $D({{t}_{0}},{{x}_{0}})$ обозначим множество всех таких решений Ξ, и введем также множество

$D({{B}_{0}}): = \bigcup\limits_{({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}} D({{t}_{0}},{{x}_{0}}).$

На множестве $D({{B}_{0}})$ определим терминальный критерий, который каждому элементу $\Xi \in D({{B}_{0}})$ ставит в соответствие случайную величину

(2)
$J(\Xi ) = F(x({{t}_{F}})),\quad F( \cdot ) \in {{C}^{2}}({{R}^{n}}).$

Определение 2. Систему (1) при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ будем называть  инвариантной по возмущениям, если для любой фиксированной начальной точки $({{t}_{0}},{{x}_{0}}) \in {{B}_{0}}$ и при любом $\Xi \in D({{t}_{0}},{{x}_{0}})$ случайная величина (2) совпадает P-п.н. с некоторым числом ${{J}_{c}}({{t}_{0}},{{x}_{0}})$.

Определение 3. Систему (1) при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ будем называть абсолютно инвариантной, если при любом $\Xi \in D({{B}_{0}})$ случайная величина (2) совпадает P-п.н. с одним и тем же числом $J_{c}^{A}$.

В условиях задачи, сформулированных в настоящем разделе, требуется определить стратегию управления, обеспечивающую терминальную инвариантность динамической системы (1) в смысле определения 2 или определения 3.

2. ДОСТАТОЧНЫЕ УСЛОВИЯ ТЕРМИНАЛЬНОЙ ИНВАРИАНТНОСТИ

Введем в рассмотрение множество $\Phi $ функций $(t,x) \to \varphi (t,x){\text{:}}\,\,[{{t}_{S}};{{t}_{F}}] \times {{R}^{n}} \to R$, имеющих непрерывные производные ${{\varphi }_{t}}$, ${{\varphi }_{x}}$, ${{\varphi }_{{xx}}}$. Для краткости обозначим

(3)
$\sigma (t,x,u,{v}) = g(t,x,u,{v}){{g}^{{\text{т}}}}(t,x,u,{v}),$
(4)
$\begin{gathered} K(t,x,u,{v}) = {{\varphi }_{t}}(t,x) + \varphi _{x}^{{\text{т}}}(t,x)f(t,x,u,{v}) + \\ + \;\frac{1}{2}{\text{tr}}[\sigma (t,x,u,{v}){{\varphi }_{{xx}}}(t,x)], \\ \end{gathered} $
(5)
$S(t,x,u,{v}) = \varphi _{x}^{{\text{т}}}(t,x)g(t,x,u,{v}),$
(6)
$\begin{gathered} {{\Gamma }^{{(j)}}}(t,x,u,{v}) = \varphi (t,x + {{h}^{{(j)}}}(t,x,u,{v})) - \varphi (t,x), \\ \Gamma = ({{\Gamma }^{{(1)}}},\; \ldots ,\;{{\Gamma }^{{(l)}}}), \\ \end{gathered} $
(7)
$\Lambda (t,x,u,{v}) = \Gamma (t,x,u,{v}) - \varphi _{x}^{{\text{т}}}(t,x)h(t,x,u,{v}),$
(8)
$L(t,x,u,{v}) = K(t,x,u,{v}) + \int\limits_{{{\Theta }_{1}}} \Lambda (t,x,u,{v})\Pi (t,d{v}).$

Теорема 1. Если при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ существуют измеримая ограниченная функция $t \to \eta (t){\text{:}}\;[{{t}_{S}};\;{{t}_{F}}] \to R$ и функция $\varphi ( \cdot ) \in \Phi $ такие, что для всех $x \in {{R}^{n}}$, ${v} \in {{R}^{r}}$ выполнены условия

(i) $\varphi ({{t}_{F}},x) = F(x),$

(ii) $L(t,x,u(t,x,{v}),{v}) = \eta (t)$ п.в. на $[{{t}_{S}};\;{{t}_{F}}],$

(iii) $S(t,x,u(t,x,{v}),{v}) = 0$ п.в. на $[{{t}_{S}};\;{{t}_{F}}],$

(iv) $\Gamma (t,x,u(t,x,{v}),{v}) = 0$ всюду на $[{{t}_{S}};\;{{t}_{F}}],$ то система (1) инвариантна по возмущениям, а значение критерия

(9)
${{J}_{c}}({{t}_{0}},{{x}_{0}}) = \varphi ({{t}_{0}},{{x}_{0}}) + \int\limits_{{{t}_{0}}}^{{{t}_{F}}} \eta (t)dt.$

Теорема 2. Если при фиксированной стратегии $(t,x,{v}) \to u(t,x,{v})$ существуют измеримая ограниченная функция $t \to \eta (t){\text{:}}\;[{{t}_{S}};\;{{t}_{F}}] \to R$, функция $\varphi ( \cdot ) \in \Phi $ и постоянная A > 0 такие, что для всех $x \in {{R}^{n}}$, ${v} \in {{R}^{r}}$ выполнены условия

(i) $\eta (t_{F}^{ - }) = \eta ({{t}_{F}})$,

(ii) $\varphi ({{t}_{F}},x) = F(x)$,

(iii) $L(t,x,u(t,x,{v}),{v}) = (\eta (t) - A\varphi (t,x))({{t}_{F}} - t{{)}^{{ - 1}}}$ п.в. на $[{{t}_{S}};{{t}_{F}}]$,

(iv) $S(t,x,u(t,x,{v}),{v}) = 0$ п.в. на $[{{t}_{S}};{{t}_{F}}]$,

(v) $\Gamma (t,x,u(t,x,{v}),{v}) = 0$ всюду на $[{{t}_{S}};{{t}_{F}}]$, то система (1) абсолютно инвариантна, а значение критерия

(10)
$J_{c}^{A} = \frac{{\eta ({{t}_{F}})}}{A}.$

3. ПРИМЕРЫ

Пример 1. Рассмотрим систему

$\begin{gathered} d{{x}_{1}}(t) = {{x}_{2}}(t)dt + {{x}_{2}}({{t}^{ - }})\mu (dt \times R), \\ d{{x}_{2}}(t) = - {{x}_{1}}(t)dt + u(t,x({{t}^{ - }}))\mu (dt \times R), \\ \end{gathered} $
где $t \in [{{t}_{0}};\;1] \subset [0;\;1]$; интенсивность пуассоновской меры $\Pi (t,R) \equiv \lambda = 5$; размерности векторов n = 2, $m = l = 1$; отсутствуют возмущения, связанные со случайными процессами ${v}(t)$ и $w(t)$ (поэтому интеграл в уравнении (1) устраняется с введением обозначения $\hat {\mu }( \cdot ,R)$, и можно считать, что $r = q$  =  1); множества ${{\Theta }_{1}} = \phi $, ${{\Theta }_{2}} = R$, так что $\hat {\mu }( \cdot ) \equiv \mu ( \cdot )$.

Требуется обеспечить инвариантность системы по возмущениям относительно величины $J = {{x}_{2}}(1)$ для множества ${{B}_{0}} = [0;1) \times {{R}^{2}}$.

Функции $\varphi ( \cdot )$ и $\eta ( \cdot )$ построим в форме

$\varphi (t,x) = {{\psi }_{1}}(t){{x}_{1}} + {{\psi }_{2}}(t){{x}_{2}},\quad \eta (t) \equiv 0,$
где ${{\psi }_{1}}(t) = sin(t - 1)$, ${{\psi }_{2}}(t) = cos(t - 1)$. Тогда условия теоремы 1 выполняются при выборе управления в виде
$u(t,x) = - {\text{tg}}(t - 1){{x}_{2}},$
и замкнутая система становится терминально инвариантной по возмущениям.

Пример 2. Запишем систему с дополнительным управлением

$\begin{gathered} d{{x}_{1}}(t) = [{{x}_{2}}(t) + {{u}_{1}}(t,x(t))]dt + {{x}_{2}}({{t}^{ - }})\mu (dt \times R), \\ d{{x}_{2}}(t) = - {{x}_{1}}(t)dt + {{u}_{2}}(t,x({{t}^{ - }}))\mu (dt \times R). \\ \end{gathered} $

При тех же значениях параметров, что и в примере 1, требуется обеспечить абсолютную инвариантность системы относительно величины J = ${{x}_{2}}(1)$ для произвольного начального условия (t0, $x({{t}_{0}})) \in {{B}_{0}}$.

Функции

$\varphi (t,x) = sin(t - 1){{x}_{1}} + cos(t - 1){{x}_{2}},\quad \eta (t) \equiv 0,$
$\begin{gathered} {{u}_{1}}(t,x) = \frac{A}{{t - 1}}\left( {{{x}_{1}} + {\text{ctg}}(t - 1){{x}_{2}}} \right), \\ {{u}_{2}}(t,x) = - {\text{tg}}(t - 1){{x}_{2}},\quad A > 0, \\ \end{gathered} $
обеспечивают выполнение условий теоремы 2 и, следовательно, абсолютную терминальную инвариантность замкнутой системы со значением (10)

$J_{c}^{A} = \frac{{\eta (1)}}{A} = 0$.

Список литературы

  1. Хрусталев М.М. Инвариантность стохастических систем диффузионного типа // ДАН. 2017. Т. 476. № 2. С. 148–150.

  2. Хрусталев М.М. Терминальная инвариантность стохастических систем диффузионного типа // АиТ. 2018. № 8. С. 81–100.

  3. Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятностей и математической статистике. М.: Наука, 1985. 640 с.

  4. Øksendal B., Sulem A. Applied Stochastic Control of Jump Diffusions. B.; Heidelberg: Springer, 2005. 266 p.

  5. Рыбаков К.А. Достаточные условия оптимальности в задаче управления системами диффузионно-скачкообразного типа // Тр. Всерос. сов. по пробл. управления (ВСПУ-2014, Москва). М.: ИПУ РАН, 2014. С. 734–744.

  6. Аверина Т.А., Рыбаков К.А. Два метода анализа стохастических систем с пуассоновской составляющей // Дифференц. уравнения и процессы управления. 2013. № 3. С. 85–116.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления