Доклады Российской академии наук. Науки о Земле, 2022, T. 502, № 1, стр. 38-44

Анализ изменения режима осадков на территории Российской Федерации во второй половине 20–начале 21 века с применением байесовской оценки параметров марковской цепи

И. О. Попов 1*, Е. Н. Попова 2**

1 Институт глобального климата и экологии им. Ю.А. Израэля
Москва, Россия

2 Институт географии Российской академии наук
Москва, Россия

* E-mail: igor_o_popov@mail.ru
** E-mail: en_popova@igras.ru

Поступила в редакцию 23.09.2021
После доработки 05.10.2021
Принята к публикации 06.10.2021

Полный текст (PDF)

Аннотация

Произведена байесовская оценка изменения вероятностей однородных переходов в бинарной марковской цепи первого порядка как модели изменения временнóго режима осадков на территории России в 2000–2019 гг. по сравнению с 1966–1985 гг. Показано достоверное изменение этих вероятностей на значительной части территории России, причем в большинстве случаев наблюдаются увеличение вероятности однородных переходов 0→0 и уменьшение вероятности однородных переходов 1→1, что может означать увеличение продолжительности непрерывных периодов без осадков и уменьшение непрерывных периодов с осадками. Построены карты пространственного распределения этих изменений и статистически доказана его неслучайность.

Ключевые слова: изменение климата, осадки, марковские цепи, байесовская статистика

ВВЕДЕНИЕ

Осадки являются важнейшим компонентом климата, влияющим на природные экосистемы и хозяйственную деятельность человека [1]. В связи с наблюдаемыми в настоящее время климатическими изменениями неоднократно отмечено изменение режима осадков, заключающееся, в том числе, в изменении их объема за определенный период времени, а также в изменении числа дней с осадками и без осадков, изменении характера и интенсивности осадков (ливневые или обложные) и др. [2, 3]. Важнейшей характеристикой режима осадков в том или ином географическом локусе является средняя продолжительность непрерывных периодов с осадками и без осадков. Для анализа и моделирования этого режима часто применяются марковские цепи: достаточно простые, но эффективные модели описания дискретных процессов, в ходе которых исследуемая система в один момент времени может принимать лишь одно из конечного множества возможных состояний, а вероятность перехода в некоторое состояние в следующий момент времени определяется состояниями системы в один или несколько предыдущих моментов и только ими. Число таких моментов определяет порядок марковской цепи [46].

Очевидно, что метеорологическая система может характеризоваться одним из двух состояний: отсутствием (состояние 0) или наличием (состояние 1) осадков в некоторый период времени. Обычно в качестве такого периода берутся сутки. В ряде исследований было показано, что наибольшей точностью при описании режима осадков обладают марковские цепи второго порядка. Однако марковские цепи первого порядка также демонстрируют высокую точность, обладая при этом простотой структуры [7]. Марковские цепи первого порядка с двумя возможными состояниями системы 0 или 1 характеризуются четырьмя переходами состояний: 0→0, 0→1, 1→1, 1→0 и соответствующими четырьмя вероятностями перехода p, причем p0→0 + p0→1 = 1 и p1→1 + p 1→0 = 1.

Вероятности однородных переходов (0→0 и 1→1) при описании режима осадков являются важными характеристиками климата, определяющими продолжительность непрерывных периодов с осадками или без них [8]. Их изменения во времени составляют важный компонент климатических изменений. При этом недостаточно фиксации только наблюдаемых частотных изменений. Для заключений о достоверных изменениях вероятностей переходов или об отсутствии таковых необходим статистический анализ.

Цель данной работы – статистическое исследование достоверности изменений вероятностей однородных переходов в марковской цепи как модели временнóго режима осадков суточного разрешения на территории России к современному периоду 2000–2019 гг. по сравнению с периодом 1966–1985 гг., соответствующим началу глобального изменения климата, и исследование пространственного распределения этих изменений. Для решения этой задачи были применены методы байесовского анализа, использование которых в данном контексте не было обнаружено в проанализированной литературе.

МАТЕРИАЛЫ И МЕТОДЫ

Байесовская статистика в последние десятилетия бурно развивается, предоставляя высокоэффективные и гибкие методы решения задач статистического вывода [9]. Основой данного подхода является применение теоремы Байеса для заключения о характере распределения вероятности значений анализируемой величины (апостериорное распределение) на основе предположений о его распределении без учета наблюдаемых данных (априорное распределение) и распределении наблюдаемой переменной, зависящей от анализируемого параметра (функция правдоподобия) [10].

Предположим наличие марковского процесса первого порядка с двумя состояниями системы 0 и 1 и соответствующей матрицей вероятностей переходов. Число n наблюдаемых однородных переходов x→x среди N переходов x→{0.1} при вероятности перехода px→x можно считать распределенным по закону биномиального распределения:

${\text{n}}\sim {\text{Binom}}({\text{n}},{\text{N}},{{{\text{p}}}_{{{\text{x}} \to {\text{x}}}}})$

Данное распределение будем использовать в качестве функции правдоподобия. В качестве априорного распределения величины px→x можно взять бета-распределение:

${{{\text{p}}}_{{{\text{x}} \to {\text{x}},{\text{prior}}}}}\sim {\text{Beta}}({{\alpha }_{{{\text{prior}}}}},{{\beta }_{{{\text{prior}}}}})$

Известно, что биномиальное распределение в качестве функции правдоподобия и бета-распределение в качестве априорного распределения являются сопряженными распределениями, порождающими апостериорное бета-распределение анализируемой величины с параметрами, строго выводимыми из значений n, N, αprior и βprior [11, 12]:

$\begin{gathered} {{{\text{p}}}_{{{\text{x}} \to {\text{x}},{\text{post}}}}}\sim {\text{Beta}}({{\alpha }_{{{\text{post}}}}} = {{\alpha }_{{{\text{prior}}}}} + {\text{n}}, \\ {{\beta }_{{{\text{post}}}}} = {{\beta }_{{{\text{prior}}}}} + {\text{N}}--{\text{n}}) \\ \end{gathered} $

Обычная практика в байесовском анализе – использовать в качестве априорного равномерное распределение, являющееся частным случаем бета-распределения с параметрами αprior = βprior = 1. Тогда параметры апостериорного бета-распределения приобретают значения:

(1)
${{\alpha }_{{{\text{post\;}}}}} = {\text{n}} + 1$
(2)
${{\beta }_{{{\text{post\;}}}}} = {\text{N}}--{\text{n}} + 1$

Формулы (1) и (2) в рамках представленной статистической модели позволяют напрямую вычислять параметры апостериорного распределения, не прибегая к современным вычислительным методам [13].

В качестве источника метеоданных использовалась база данных метеонаблюдений суточного разрешения TTTR, созданная во Всероссийском научно-исследовательском институте гидрометеорологической информации – Мировом центре данных (ВНИИГМИ-МЦД, http://www.meteo.ru). Были отобраны 451 станция, расположенные на территории России, данные по осадкам с которых имели менее 10% пропусков за оба исследуемые периода.

Каждые сутки были охарактеризованы значениями 0 или 1, соответственно, отсутствию или наличию в них осадков. Было рассчитано число четырех видов переходов из одного состояния в такое же или другое для обоих периодов. Для предварительной оценки происшедших изменений были рассчитаны частоты переходов 0→0 относительно событий 0→X и 1→1 относительно события 1→X, X ∈ ∈ {0, 1}, представляющие собой эмпирические оценки исследуемых вероятностей p0→0 и p1→1.

По формулам 1 и 2 для каждой станции были рассчитаны параметры апостериорных бета-распределений значений вероятностей двух однородных переходов для обоих периодов 1966–1985 и 2000–2019 гг. С целью оценки достоверности изменения вероятностей однородных переходов во втором периоде по сравнению с первым была осуществлена оценка вероятности превосходства выборки из апостериорного распределения значений оцениваемых вероятностей для второго периода над распределением для первого периода [10]. Для этого были cгенерированы выборки случайных величин {*p} из всех четырех бета-распределений объемом 5 × 105 экземпляров каждая. Полученные случайные величины объединялись в пары отдельно для каждого вида перехода. Рассчитывалась частота случаев *p(период 2) > *p(период 1). Если эта частота была более 0.975, делалось заключение о достоверном увеличении значения вероятности однородного перехода px→x (x ∈ {0, 1}) во втором периоде по сравнению с первым. Если частота была менее 0.025, делался вывод о достоверном уменьшении значения вероятности однородного перехода. В остальных случаях делался вывод о недостоверности изменений.

В результате этих исследований каждая станция была охарактеризована двумя признаками, отражающими достоверность и направление изменения величин p0→0 и p1→1. Эти признаки имели одно из значений: “изменение недостоверно”, “достоверное уменьшение”, “достоверное увеличение”. Очевидно, что всего может быть девять комбинаций этих признаков для обоих видов вероятности.

Для визуализации пространственного распределения анализируемых изменений для каждой из вероятностей p0→0 и p1→1 были построены две географические карты, на которых кружками отмечены локализации станций, при этом цвет кружка отображает достоверность и направление изменений.

С помощью диаграммы (полигонов) Вороного [14] была осуществлена интерполяция полученных для станций меток на всю территорию Российской Федерации. Каждый полигон на картах закрашивался цветом, соответствующим метке его станции.

Для оценки совместного пространственного распределения характера изменения обоих видов вероятностей была построена карта с полигонами Вороного, цвет которых отображает характер изменений вероятностей p0→0 , а вид штриховки – вероятностей p1→1.

Для оценки неслучайности пространственного распределения меток над множеством локализаций станций в географическом пространстве была проведена триангуляция Делоне [15]. В результате каждая станция была связана с ближайшими станциями двумя или более отрезками (“связями”). Каждая связь может быть охарактеризована как однородная, если соединенные ею станции имеют одинаковые метки, или как разнородная в противоположном случае. Очевидно, что при случайном пространственном распределении меток доля однородных связей меньше по сравнению со случаем пространственной кластеризации станций с одинаковыми метками. Для проверки гипотезы о неслучайном распределении меток был проведен пермутационный тест, в каждом цикле которого метки случайным образом перемешивались между станциями и высчитывалась доля однородных связей. Всего было проведено 5 × 104 циклов. В результате было создано эмпирическое распределение доли однородных меток и определен его 95%-й процентиль. В случае, если наблюдаемое значение доли однородных связей больше данного значения 95%-го процентиля, гипотеза о случайном характере наблюдаемого распределения меток отвергается. Тест проводился как отдельно для переходов 0→0 и 1→1, так и для их совместного пространственного распределения.

Подготовка данных и расчеты проводились с помощью программ, написанных на языке Python с применением библиотек numpy, Pandas, scipy. Построение полигонов Вороного, триангуляция Делоне и отрисовка карт осуществлялись в ГИС QGIS.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

В табл. 1 приведены статистические характеристики (среднее арифметическое и стандартное отклонение) наблюдаемых частот переходов режима осадков типа 0→0 и 1→1 в исследуемые периоды и их изменений. Из этих данных видно, что во второй период среднее значение наблюдаемых частот переходов 0→0 несколько увеличилось по сравнению с первым периодом, а частота переходов 1→1 несколько уменьшилась.

Таблица 1.

Статистические характеристики наблюдаемых частот переходов суточных режимов осадков 0→0 и 1→1 в периоды 1966–1985 и 2000–2019 гг. и их постанционных изменений

Тип перехода Период Среднее значение Стандартное отклонение
0→0 1966–1985 0.702 0.069
2000–2019 0.709 0.069
изменение 0.007 0.019
1→1 1966–1985 0.598 0.084
2000–2019 0.59 0.088
изменение –0.009 0.026

На рис. 1 представлены гистограммы наблюдаемых частот однородных переходов режима осадков и графики ядерных оценок плотности их распределений для двух периодов. Согласно этому рисунку, график плотности распределения частот переходов 0→0 ко второму исследуемому периоду несколько сместился в сторону бóльших значений (рис. 1а), а для плотности распределения частот переходов 1→1 заметно небольшое смещение в сторону уменьшения (рис. 1б), что совпадает с данными, представленными в табл. 1.

Рис. 1.

Плотность распределения значений наблюдаемых частот переходов 0→0 (а) и 1→1 (б). Обозначения: 1 и 2 – гистограммы значений наблюдаемых частот переходов за периоды 1966–1985 гг. (1) и 2000–2019 гг. (2), 3 и 4 – графики ядерной оценки плотности распределения наблюдаемых частот переходов за периоды 1966–1985 гг. (3) и 2000–2019 гг. (4).

В табл. 2 приведено количество станций, характеризующихся различными оценками достоверности и типа изменений вероятностей переходов p0→0 p1→1. Как можно заметить, для большинства станций (58% от общего числа станций) сделан вывод об отсутствии статистически достоверного изменения исследуемых вероятностей переходов. Вероятность p0→0 достоверно уменьшилась на 23 станциях (5%) и достоверно повысилась на 94 станциях (21%). При этом вероятность p1→1 достоверно уменьшилась на 111 станциях (25%) и увеличилась на 42 станциях (9%). Станций, на которых происходит одновременное увеличение вероятности p0→0 и уменьшение вероятности p1→1, отмечено 68 (15%), что более чем в шесть раз превышает число станций с противоположной характеристикой (совместное понижение p0→0 и увеличение p1→1) – 11 (2.5%). При этом не обнаружено станций с одновременным повышением или одновременным понижением обеих вероятностей.

Таблица 2.

Число станций метеонаблюдений, характеризующихся различными байесовскими оценками достоверности и направления изменения вероятностей переходов p0→0 и p1→1

Изменение p1→1 Изменение p0→0
изменение недостоверно достоверное уменьшение достоверное увеличение всего
изменение недостоверно 260 12 26 298
достоверное уменьшение 43 0 68 111
достоверное увеличение 31 11 0 42
всего 334 23 94 451

Из полученных результатов можно сделать вывод о наличии преимущественной тенденции к увеличению вероятности p0→0 и уменьшению вероятности p1→1, что может свидетельствовать об общей тенденции к удлинению периодов без осадков и укорочению периодов непрерывных осадков. При этом в отдельных регионах могут наблюдаться иные, в том числе противоположные, тенденции. В целом эти выводы, сделанные в результате проведения байесовской оценки, согласуются с данными описательного статистического анализа наблюдаемых частот однородных переходов, приведенных в табл. 1, и оценки плотности распределения частот переходов на рис. 1.

На рис. 2а и 2б приведены карты пространственного распределения достоверности и характера изменения вероятностей переходов p0→0 и p1→1. На рис. 2в представлено совместное распределение видов изменения вероятностей обоих типов перехода.

Рис. 2.

Пространственное распределение видов достоверности и направления переходов вероятностей p0→0 (а), p1→1 (б) и их совместного распространения (в) на территории России. Обозначения а) и б): 1 – отсутствие достоверного изменения, 2 – достоверное уменьшение, 3 – достоверное увеличение. Обозначения в): 1 – изменение p0→0 недостоверно, 2 – достоверное уменьшение p0→0, 3 – достоверное увеличение p0→0, 4 – достоверное уменьшение p1→1, 5 – достоверное увеличение p1→1, отсутствие достоверного изменения p1→1 показано отсутствием штриховки.

Анализ этих карт позволяет предположить неслучайный характер распределения полигонов с достоверными изменениями вероятностей переходов. Полигоны одного типа образуют агломерации разного размера, что свидетельствует о распространении соответствующих климатических изменений на достаточно протяженные территории.

Неслучайный характер распределения изменений по территории России доказывают и результаты пермутационного теста, приведенные в табл. 3. Из них видно, что во всех трех случаях наблюдаемая доля однородных связей была значительно больше 95%-го процентиля экспериментального распределения, что позволяет отвергнуть гипотезу о случайном пространственном распределении типов изменений между станциями.

Таблица 3.

Результаты пермутационного теста неслучайности пространственного распределения типов изменения вероятностей переходов

Вид перехода Наблюдаемая доля однородных связей 95% процентиль экспериментального распределения доли однородных связей
0→0 0.579 0.547
1→1 0.593 0.537
совместное распределение 0.41 0.364

Достоверное увеличение p0→0 и одновременное понижение p1→1 наблюдаются в центральных и юго-западных районах Европейской части России. Противоположная тенденция выявлена в Крыму и на некоторой части Кольского полуострова. Значительная часть Азиатской территории России также характеризуется областями с достоверными повышениями p0→0 и понижениями p1→1. При этом области с достоверными понижениями вероятности p0→0 и повышениями p1→1 образуют прерывистый пояс, тянущийся от центральной части Уральских гор через Южную Сибирь до центральной части Восточной Сибири. Эти наблюдения могут свидетельствовать о происшедшем в этих регионах увеличении продолжительности непрерывных периодов осадков и сокращении длины непрерывных последовательностей дней без осадков.

Представляется очевидным, что закономерности этого пространственного распределения, так же, как и его связь с изменениями других климатических параметров, требуют дальнейшего изучения.

Список литературы

  1. Strangeways I. Precipitation. Theory, Measurement and Distribution. Cambridge University Press. 2007. https://doi.org/10.1017/CBO9780511535772

  2. Popova E.N., Popov I.O., Semenov S.M. Assessment of Variations in the Annual Sum of Active Temperatures and Total Precipitation during the Vegetation Period in Russia and Neighboring Countries // Russian Meteorology and Hydrology. 2018. V. 43. № 6. P. 412–417. https://doi.org/10.3103/S1068373918060092

  3. Chernokulsky A., Kozlov F., Zolina O., Bulygina O., Mokhov I., Semenov V. Observed Changes in Convective and Stratiform Precipitation in Northern Eurasia over the Last Five Decades // Environmental Research Letters. 2019. V. 14. № 4. 45001. https://doi.org/10.1088/1748-9326/aafb82

  4. Турчин В.Н., Турчин Е.В. Марковские цепи. Днепропетровск: LuzinoffPress. 2016.

  5. Lennartssona J., Baxevania A., Chenb D. Modelling Precipitation in Sweden Using Multiple Step Markov Chains and a Composite Model // Journal of Hydrology. 2008. V. 363. Iss. 1–4. P. 42–59. https://doi.org/10.1016/j.jhydrol.2008.10.003

  6. Wilks D.S. Statistical Methods in the Atmospheric Sciences. 3rd Edition. International Geophysics Series (V. 100). Elsevier, Academic Press. 2011. https://doi.org/10.1016/B978-0-12-385022-5.00015-4

  7. Schoof J.T., Pryor S.C. On the Proper Order of Markov Chain Model for Daily Precipitation Occurrence in the Contiguous United States // Journal of Applied Meteorology and Climatology. 2008. V. 47. Iss. 9. P. 2477–2486. https://doi.org/10.1175/2008JAMC1840.1

  8. Yeh H.-F., Hsu H.-L. Using the Markov Chain to Analyze Precipitation and Groundwater Drought Characteristics and Linkage with Atmospheric Circulation // Sustainability. 2019. V. 11. Nr 6. Article Number 1817. https://doi.org/10.3390/su11061817

  9. Sprenger J., Hartmann S. Bayesian Philosophy of Science. Oxford University Press; 2019. https://doi.org/10.1093/oso/9780199672110.001.0001

  10. Bradley C.P. Bayes and Empirical Bayes Methods for Data Analysis. Boca Raton: Chapman and Hall/CRC. 2000.

  11. Watanabe S. Mathematical Theory of Bayesian Statistics. Boca Raton: Chapman and Hall/CRC. 2018. https://doi.org/10.1201/9781315373010

  12. Stone J.V. Bayes’ Rule: A Tutorial Introduction to Bayesian Analysis. Sebtel Press. 2013. https://doi.org/10.13140/2.1.1371.6801

  13. Martin O. Bayesian Analysis with Python. Packt Publishing. 2016.

  14. Preparata F., Shamos M. Computational Geometry: An Introduction. Springer. 1985.

  15. Скворцов А.В. Триангуляция Делоне и ее применение. Томск: Издательство Томского университета. 2002.

Дополнительные материалы отсутствуют.