Доклады Российской академии наук. Математика, информатика, процессы управления, 2020, T. 490, № 1, стр. 16-19
О СКОРОСТИ СХОДИМОСТИ ДЛЯ ОДНОРОДНЫХ ЦЕПЕЙ МАРКОВА
А. Ю. Веретенников 1, 2, 3, *, М. А. Веретенникова 2, **
1 Университет Лидса
Лидс, Великобритания
2 Национальный исследовательский университет “Высшая школа экономики”
Москва, Россия
3 Институт проблем передачи информации
им. А.А. Харкевича Российской академии наук
Москва, Россия
* E-mail: a.veretennikov@leeds.ac.uk
** E-mail: mveretennikova@hse.ru
Поступила в редакцию 01.07.2019
После доработки 01.07.2019
Принята к публикации 31.10.2019
Аннотация
Изучаются улучшенные оценки скорости сходимости для эргодических однородных цепей Маркова. Даны примеры сравнения с классическими оценками.
Классическая оценка скорости сходимости для однородной дискретной неприводимой ациклической цепи Маркова (Xn, $n \geqslant 0$) с конечным фазовым пространством S к единственной инвариантной мере $\mu $ имеет вид
(1)
${{\left\| {{{\mu }_{n}} - \mu } \right\|}_{{TV}}} \leqslant 2(1 - \kappa {{)}^{n}}\quad \forall n,$ЭРГОДИЧЕСКАЯ ТЕОРЕМА, КАПЛИНГ, ОБЩИЙ СЛУЧАЙ
Рассматривается однородный марковский процесс (МП) в дискретном времени (${{X}_{n}}$, $n \geqslant 0$) на общем фазовом пространстве S с топологией и борелевской σ-алгеброй $\mathcal{B}(S)$. Индекс x в выражениях ${{\mathbb{E}}_{x}}$ и ${{\mathbb{P}}_{x}}$ означает неслучайное начальное значение процесса ${{X}_{0}} = x$; оно может быть также случайным с распределением $\mu $; в таком случае могут использоваться обозначения ${{\mathbb{E}}_{\mu }}$ и ${{\mathbb{P}}_{\mu }}$ (см. [7]). Если фазовое пространство S конечно, то |S| обозначает число его элементов, и тогда $\mathcal{P}: = {{({{p}_{{ij}}})}_{{1 \leqslant i,j \leqslant |S|}}}$ – матрица переходных вероятностей процесса. Об истории оценки Маркова–Добрушина (МД) см. [1] и др.
Для общей оценки (4), приведенной ниже ради удобства читателя, предполагается положительность постоянной Маркова–Добрушина:
(2)
$\kappa : = \mathop {\inf }\limits_{x,x{\text{'}}} \int \left( {\frac{{{{P}_{{x{\text{'}}}}}(1,dy)}}{{{{P}_{x}}(1,dy)}} \wedge 1} \right){{P}_{x}}(1,dy) > 0.$В основном результате работы (теорема 1) это условие будет заменено на более слабое. В (2) выражение $\frac{{{{P}_{{x{\text{'}}}}}(1,dy)}}{{{{P}_{x}}(1,dy)}}$ понимается в смысле плотности абсолютно непрерывной компоненты одной меры по другой. Для краткости будем использовать сокращенную нотацию ${{P}_{x}}(dz)$ вместо ${{P}_{x}}(1,dz)$. Отметим, что интеграл от любой борелевской функции по ядру ${{P}_{x}}(dz)$ является борелевской функцией от x; это стандартное требование для марковского процесса, см. [7]. В силу линейности аналогичная измеримость по паре $(x,x{\text{'}})$ будет иметь место и для интеграла от борелевской функции с мерой ${{\Lambda }_{{x,x{\text{'}}}}}$, определенной ниже формулой
Отметим, что ${{\Lambda }_{{x,x{\text{'}}}}}(dz) = {{\Lambda }_{{x{\text{'}},x}}}(dz)$. Справедливо следующее эквивалентное представление постоянной из формулы (2):
(3)
$\kappa = \mathop {\inf }\limits_{x,x{\text{'}}} \int \left( {\frac{{{{P}_{{x{\text{'}}}}}(1,dy)}}{{{{\Lambda }_{{x,x{\text{'}}}}}(dy)}} \wedge \frac{{{{P}_{x}}(1,dy)}}{{{{\Lambda }_{{x,x{\text{'}}}}}(dy)}}} \right){{\Lambda }_{{x,x{\text{'}}}}}(dy)\quad ( > 0).$Положим
Имеет место равенство $\kappa (x,x{\text{'}}) = \kappa (x{\text{'}},x)$ для любых $x,x{\text{'}} \in S$. Условие (2) введено самим А.А. Марковым для конечных однородных цепей [8]; позднее для неоднородных процессов Маркова его аналог был использован Добрушиным [9]. По предложению Сенеты оно названо условием Маркова–Добрушина. Заметим, что во всех ситуациях $\kappa \leqslant 1$. Случай κ = 1 соответствует последовательности независимых, одинаково распределенных случайных величин (Xn, $n \geqslant 0$). В противоположной экстремальной ситуации, когда переходные ядра сингулярны для различных $x$ и $x{\text{'}}$, имеем κ = 0. Условие MД (2), так же, как и (3), исключительно полезно тем, что обеспечивает эффективную количественную оценку сверху на скорость сходимости цепи Маркова к его (единственной) инвариантной мере в метрике полной вариации. Имеет место следующий классический результат: в предположении условия (3) процесс (Xn) является марковским-эргодическим, т.е. для него существует предельная и она же инвариантная вероятностная мера $\mu $, причем справедлива равномерная оценка при всех $n$
(4)
$\mathop {\sup }\limits_x \mathop {\sup }\limits_{A \in \mathcal{B}(S)} \left| {{{P}_{x}}(n,A) - \mu (A)} \right| \leqslant {{(1 - \kappa )}^{n}}.$Далее, напомним, как применить схему каплинга на основе “леммы о двух случайных величинах” [2, Лемма 44; 4, Лемма 1] к цепи Маркова в общем фазовом пространстве $(S,\mathcal{B}(S))$. С методом каплинга можно познакомиться по работам [5, 6, 10, 12] и др. Данная работа следует изложению в [4], которое, в свою очередь, основано на подходе [6]. Заметим, что фазовым пространством в [4] было ${{\mathbb{R}}^{1}}$; однако и в ${{\mathbb{R}}^{d}}$ все формулы остаются такими же.
Итак, рассмотрим две копии $(X_{n}^{1})$ и $(X_{n}^{2})$ одного и того же марковского процесса с начальными распределениями, соответственно, $\mu _{0}^{1}$ и $\mu _{0}^{2}$ (это не исключает случай неслучайных начальных значений). Введем новый векторнозначный марковский процесс $(\eta _{n}^{1},\eta _{n}^{2},{{\xi }_{n}},{{\zeta }_{n}})$. Если ${{\kappa }_{0}} = 0$, то положим
Если $0 < \kappa (0) < 1$, то применим лемму [4, Лемма 1] или [2, Лемма 44] с $\Lambda = {{\Lambda }_{{x,x{\text{'}}}}}$ при “условии” $(X_{0}^{1},X_{0}^{2}) = (x,x{\text{'}})$ к случайным величинам $X_{0}^{1}$ и $X_{0}^{2}$, построив таким образом случайные величины $\eta _{0}^{1}$, $\eta _{0}^{2}$, ${{\xi }_{0}}$ и ${{\zeta }_{0}}$ (они соответствуют величинам ${{\eta }^{1}}$, ${{\eta }^{2}}$, $\xi $ и $\zeta $ в лемме); формально, так можно сделать и при ${{\kappa }_{0}} = 1$; отметим, что упомянутая лемма справедлива и в общих фазовых пространствах. Далее по индукции покажем, как строить вектор $(\eta _{{n + 1}}^{1},\eta _{{n + 1}}^{2}$, ξn + 1, ζn + 1), если уже построены случайные величины $(\eta _{n}^{1},\eta _{n}^{2},{{\xi }_{n}},{{\zeta }_{n}})$. Для этого определим плотности переходных вероятностей φ относительно меры ${{\Lambda }_{{{{x}^{1}},{{x}^{2}}}}} \times {{\Lambda }_{{{{x}^{1}},{{x}^{2}}}}} \times {{\Lambda }_{{{{x}^{1}},{{x}^{2}}}}}$ × $({{\delta }_{0}} + {{\delta }_{1}})$ для нашего векторнозначного процесса следующим образом:
(5)
$\varphi (x,y): = {{\varphi }_{1}}(x,{{y}^{1}}){{\varphi }_{2}}(x,{{y}^{2}}){{\varphi }_{3}}(x,{{y}^{3}}){{\varphi }_{4}}(x,{{y}^{4}}),$(6)
$\begin{gathered} {{\varphi }_{1}}(x,u): = \frac{{p({{x}^{1}},u) - p({{x}^{1}},u) \wedge p({{x}^{2}},u)}}{{1 - \kappa ({{x}^{1}},{{x}^{2}})}}, \\ {{\varphi }_{2}}(x,u): = \frac{{p({{x}^{2}},u) - p({{x}^{1}},u) \wedge p({{x}^{2}},u)}}{{1 - \kappa ({{x}^{1}},{{x}^{2}})}}, \\ \end{gathered} $(7)
$\begin{gathered} {{\varphi }_{3}}(x,u): = 1({{x}^{4}} = 1)\frac{{p({{x}^{1}},u) \wedge p({{x}^{2}},u)}}{{\kappa ({{x}^{1}},{{x}^{2}})}} + \\ + \;1({{x}^{4}} = 0)p({{x}^{3}},u), \\ \end{gathered} $(8)
$\begin{gathered} {{\varphi }_{4}}(x,u): = 1({{x}^{4}} = 1)({{\delta }_{1}}(u)(1 - \kappa ({{x}^{1}},{{x}^{2}})) + \\ + \;{{\delta }_{0}}(u)\kappa ({{x}^{1}},{{x}^{2}})) + 1({{x}^{4}} = 0){{\delta }_{0}}(u), \\ \end{gathered} $Формула (8), определяющая ${{\varphi }_{4}}(x,u)$, применима во всех случаях.
Лемма 1 [4]. Пусть $X_{0}^{1} = x$, $X_{0}^{2} = x{\text{'}}$, и пусть $\tilde {X}_{n}^{1}$ и $\tilde {X}_{n}^{2}$, при $n \in {{\mathbb{Z}}_{ + }}$ определены формулой
Тогда ${{(\tilde {X}_{n}^{1})}_{{n \geqslant 0}}}$ и ${{(\tilde {X}_{n}^{2})}_{{n \geqslant 0}}}$ – однородные марковские процессы, и
Более того,
(9)
${{\mathbb{P}}_{{\mu _{0}^{1},\mu _{0}^{2}}}}(\tilde {X}_{n}^{1} \ne \tilde {X}_{n}^{2}) \leqslant {{\mathbb{E}}_{{\nu _{0}^{1},\nu _{0}^{2}}}}\prod\limits_{i = 0}^{n - 1} (1 - \kappa (\eta _{i}^{1},\eta _{i}^{2})),$В [4] в лемме 1 было дополнительно предположено, что существует единая мера, доминирующая все переходные ядра. Это условие не является необходимым и доказательство проходит с мерами ${{\Lambda }_{{x,x{\text{'}}}}}$ на каждом шаге вместо единой Λ без дальнейших изменений.
Обозначим ${\text{diag}}({{S}^{2}}): = \{ x \in S \times S{\text{:}}\,\,{{x}^{1}} = {{x}^{2}}\} $ и ${{\hat {S}}^{2}}$ := $S \times S{\backslash diag}({{S}^{2}})$. Рассмотрим процесс Xn := := $(\tilde {X}_{n}^{1},\tilde {X}_{n}^{2})$ на S2 и его условную версию ${{\hat {X}}_{n}}$ := := $(\tilde {X}_{n}^{1},\tilde {X}_{n}^{2})|\tilde {X}_{n}^{1} \ne \tilde {X}_{n}^{2}$ на ${{\hat {S}}^{2}}$. Отметим, что процесс ${{\hat {X}}_{n}}$ тоже марковский. Рассмотрим оператор V, определенный на борелевских ограниченных функциях h на пространстве ${{\hat {S}}^{2}}$ по формуле
(10)
$Vh(x): = (1 - \kappa ({{x}^{1}},{{x}^{2}})){{\mathbb{E}}_{{{{x}^{1}},{{x}^{2}}}}}h({{\hat {X}}_{1}}),$(11)
$\begin{gathered} \frac{1}{2}{{\left\| {\mu _{n}^{1} - \mu _{n}^{2}} \right\|}_{{TV}}} \leqslant {{\mathbb{P}}_{{\mu _{0}^{1},\mu _{0}^{2}}}}(\tilde {X}_{n}^{1} \ne \tilde {X}_{n}^{2}) \leqslant \\ \leqslant \;\int {{V}^{n}}1(x)\nu _{0}^{1}(d{{x}^{1}})\nu _{0}^{2}(d{{x}^{2}}). \\ \end{gathered} $По формуле Гельфанда для спектрального радиуса оператора $V$ (см., например, [11])
(12)
$\mathop {\lim \,sup}\limits_{n \to \infty } {{({{V}^{n}}1(x))}^{{1/n}}} \leqslant \mathop {\lim \,sup}\limits_{n \to \infty } {\text{||}}{{V}^{n}}{\text{|}}{{{\text{|}}}^{{1/n}}} = r(V) \leqslant \left\| V \right\|.$Здесь $\left\| V \right\| = \mathop {\sup }\limits_{\left\| h \right\| \leqslant 1} \mathop {\sup }\limits_{x \in {{{\hat {S}}}^{2}}} \left| {Vh(x)} \right|$, наиболее удобной нормой для h является $\left\| h \right\| = \sum\limits_{x \in {{{\hat {S}}}^{2}}} {\left| {h(x)} \right|} $ (хотя все нормы в конечномерном пространстве эквивалентны, и, стало быть, значение r(V) однозначно определено). Соотношения (11) и (12) приводят к следующему результату.
Теорема 1. Во всех случаях имеет место цепочка неравенств
Замечание 1. Если для процесса ${{\hat {X}}_{n}}$ выполнен аналог условия эргодичности (2), то строгое неравенство
справедливо тогда и только тогда, когда функция $1 - \kappa ( \cdot )$ не является $\hat {\mu }$-п.н. постоянной, где $\hat {\mu }$ – единственная инвариантная мера процесса ${{\hat {X}}_{n}}$. Равенство $\left\| V \right\| = 1 - \kappa $ справедливо для выбранной выше нормы.ПРИМЕРЫ: КОНЕЧНОЕ $S$
Предложение 1. Рассмотрим переходную матрицу $\mathcal{P}$ размера 2 × 2 с элементами ${{p}_{{1,1}}} = a$, ${{p}_{{1,2}}} = 1 - a$, ${{p}_{{2,1}}} = (1 - b)$, ${{p}_{{2,2}}} = b$, предполагая, что $0 < a,b < 1$. Тогда $r = 1 - \kappa = \left| {{{\lambda }_{2}}} \right|$, где ${{\lambda }_{2}}$ – наименьшее собственное число матрицы $\mathcal{P}$.
Доказательство несложное и будет приведено в полной версии работы.
Пример 1 (три метода дают одинаковые оценки скорости сходимости). Рассмотрим цепь Маркова (ЦМ) с $S = \{ 1,2\} $ и с переходной матрицей
Вычисления приводят к значениям $1 - \kappa = 0.3$ = = r(V) и ${{\lambda }_{2}} = 0.3 = r(V),$ как и ожидалось, в силу равенства ${{\lambda }_{2}} = 1 - \kappa $.
Пример 2 (новый метод аналогичен МД; оценка спектрального метода лучше). Рассмотрим ЦМ на фазовом пространстве $S = \{ 1,2,3\} $ с переходной матрицей
Простые вычисления показывают, что $r(V) = 0.7$, $1 - \kappa = 0.7$, и что собственные числа матрицы $\mathcal{P}$ равны ${{\lambda }_{1}} = 1$, ${{\lambda }_{{2,3}}} = \pm \sqrt {37} {\text{/}}10 \cong \pm 0.6082763$. Стало быть, $\left| {{{\lambda }_{{2,3}}}} \right| < r(V)$.
Пример 3 (оценка нового метода аналогична классической МД; оценка спектрального метода лучше).
Пример 4 (оценка нового метода лучше, чем МД, и аналогична оценке спектрального). Рассмотрим ЦМ с фазовым пространством S = = $\{ 1,2,3\} $ и с переходной матрицей
В этом случае код (будет приведен в полной версии изложения) дает значения
В этом примере классический метод Маркова–Добрушина бесполезен, поскольку $1 - \kappa = 1$. Замечание 1 здесь также применимо.
Список литературы
Seneta E. Non-negative Matrices and Markov Chains. N.Y.: Springer, 1981. https://doi.org/10.1007/0-387-32792-4
Veretennikov A.Yu. Ergodic Markov processes and Poisson equations (lecture notes). In: Modern problems of stochastic analysis and statistics – Selected contributions in honor of Valentin Konakov / Ed. by V. Panov. Springer, 2017. P. 457–511. https://doi.org/10.1007/978-3-319-65313-6
Гантмахер Ф.Р. Теория матриц. 5-е изд. М.: Физматлит, 2004.
Butkovsky O.A., Veretennikov A.Yu. On Asymptotics for Vaserstein Coupling of Markov Chains // Stochastic Processes and Their Applications. 2013. V. 123. № 9. P. 3518–3541.
Lindvall T. Lectures on the Coupling Method. Dover, 2002.
Васерштейн Л.Н. Марковские процессы на счетном произведении пространств, описывающие большие системы автоматов // Пробл. передачи информ. 1969. Т. 5. № 3. С. 64–72.
Дынкин Е.Б. Марковские процессы. М.: Физматгиз, 1963.
Марков А.А. Распространение закона больших чисел на величины, зависящие друг от друга // Изв. физ.-матем., Казан. унив. 1906. Т. 15. С. 135–156.
Добрушин Р.Л. Центральная предельная теорема для неоднородных цепей Маркова I, II // Теория вероятн. и ее применения. 1956. № 1. С. 72–89; № 4. С. 365–425.
Калашников В.В. Метод склеивания, его развитие и применения / В кн.: Э. Нуммелин. Общие неприводимые цепи Маркова и неотрицательные операторы. М.: Мир, 1989. С. 176–190.
Красносельский М.А., Лифшиц Е.А., Соболев А.В. Позитивные линейные системы. Метод положительных операторов. Сер.: Теория и методы системного анализа. М.: Наука, 1985.
Nummelin E. General Irreducible Markov Chains. CUP. Cambridge, 2008. https://doi.org/10.1017/S001309150001765X
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления