Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 507, № 1, стр. 26-28

О ЗАДАЧЕ КАНТОРОВИЧА С ПАРАМЕТРОМ

В. И. Богачев 123*, С. Н. Попова 42

1 Московский государственный университет имени М.В. Ломоносова
Москва, Россия

2 Национальный исследовательский университет Высшая школа экономики
Москва, Россия

3 Православный Свято-Тихоновский гуманитарный университет
Москва, Россия

4 Московский физико-технический институт
Долгопрудный, Россия

* E-mail: vibogach@mail.ru

Поступила в редакцию 01.06.2022
После доработки 30.10.2022
Принята к публикации 17.11.2022

Полный текст (PDF)

Аннотация

Изучается задача Канторовича оптимальной транспортировки мер на метрических пространствах в случае функций стоимости и маргинальных распределений, зависящих от параметра из метрического пространства. Показано, что расстояние Хаусдорфа между множествами вероятностных мер с заданными маргиналами оценивается через расстояния между маргиналами. В качестве следствия доказано, что стоимость оптимальной транспортировки непрерывна по параметру, если функция стоимости и маргинальные распределения непрерывны по этому параметру.

Ключевые слова: задача Канторовича, метрика Канторовича, оптимальный план, расстояние Хаусдорфа, непрерывность по параметру

Пусть $\mu $ и $\nu $ – борелевские вероятностные меры на полных сепарабельных метрических пространствах X и Y соответственно, $h \geqslant 0$ – непрерывная функция на $X \times Y$. Классическая задача Канторовича оптимальной транспортировки (см. [1–5]) заключается в минимизации интеграла

$\int h{\kern 1pt} d\sigma $
по всем мерам $\sigma $ из множества $\Pi (\mu ,\nu )$, состоящего из борелевских вероятностных мер на $X \times Y$ с проекциями $\mu $ и $\nu $ на сомножители. Меры $\mu $ и $\nu $ называются маргинальными распределениями или маргиналами, а функция $h$ называется функцией стоимости. Если существует мера в $\Pi (\mu ,\nu )$ с конечным интегралом от h, то минимум достигается, а меры, на которых он достигается, называются оптимальными мерами или оптимальными планами Канторовича. Этот минимум называется оптимальной стоимостью и обозначается через ${{K}_{h}}(\mu ,\nu )$.

Если функция стоимости ${{h}_{t}}$ и маргинальные распределения ${{\mu }_{t}}$ и ${{\nu }_{t}}$ зависят от параметра $t$ из метрического пространства T, то возникает вопрос о непрерывности относительно t оптимальной стоимости ${{K}_{{{{h}_{t}}}}}({{\mu }_{t}},{{\nu }_{t}})$ и возможности выбрать оптимальный план в $\Pi ({{\mu }_{t}},{{\nu }_{t}})$ непрерывным по параметру. Кроме того, множество всех транспортных планов $\Pi ({{\mu }_{t}},{{\nu }_{t}})$ также зависит от параметра, поэтому можно изучать его непрерывность при наделении пространства множеств мер метрикой Хаусдорфа, порожденной подходящей метрикой на пространстве мер. Задачи Канторовича с параметром исследовались в работах [58]. В работе [9] было показано, что соответствие $(\mu ,\nu ) \mapsto \Pi (\mu ,\nu )$ непрерывно. Более короткое доказательство было недавно дано в работе [10], где использовалась метрика Прохорова на пространстве мер. Наш первый результат дает значительно более простую явную оценку с метрикой Канторовича.

Напомним (см. [1, 11]), что слабая топология на пространстве $\mathcal{P}(X)$ борелевских вероятностных мер на полном сепарабельном метрическом пространстве X метризуема посредством метрики Канторовича–Рубинштейна ${{d}_{{KR}}}$, заданной формулой

${{d}_{{KR}}}(\mu ,\nu ) = \sup \left\{ {\int f{\kern 1pt} d(\mu - \nu ):f \in {\text{Li}}{{{\text{p}}}_{1}},\;{\text{|}}f{\text{|}} \leqslant 1} \right\},$
где ${\text{Li}}{{{\text{p}}}_{1}}$ – множество 1-липшицевых функций на пространстве X. Пространство $(\mathcal{P}(X),{{d}_{{KR}}})$ также полно и сепарабельно.

Для ограниченного пространства $X$ можно использовать метрику Канторовича

${{d}_{K}}(\mu ,\nu ) = \sup \left\{ {\int f{\kern 1pt} d(\mu - \nu ):f \in {\text{Li}}{{{\text{p}}}_{1}}} \right\}.$

Для всякого пространства, лежащего в шаре радиуса 1, верно равенство ${{d}_{K}} = {{d}_{{KR}}}$.

Заметим, что неограниченное метрическое пространство $(X,d)$ можно наделить ограниченной метрикой $\varrho = \min (d,1)$, порождающей исходную топологию, хотя $(X,\varrho )$ не обязано быть полным. Для новой метрики $\varrho $ и соответствующих ей метрик Канторовича–Рубинштейна ${{\varrho }_{{KR}}}$ и Канторовича ${{\varrho }_{K}}$ (отличие от старых возникает из-за различия в классах липшицевых функций) имеем ${{\varrho }_{K}} = {{\varrho }_{{KR}}}$. Кроме того,

${{2}^{{ - 1}}}{{\varrho }_{K}} \leqslant {{d}_{{KR}}} \leqslant 2{{\varrho }_{K}}.$

Для наших целей можно использовать ограниченную метрику $\varrho $ и ассоциированную с ней метрику Канторовича.

Стоит отметить, что, взяв d в качестве функции стоимости на $X \times X$, получаем формулу двойственности Канторовича ${{d}_{K}}(\mu ,\nu ) = {{K}_{d}}(\mu ,\nu )$.

Пусть $(X,{{d}_{X}})$ и $(Y,{{d}_{Y}})$ – метрические пространства. Пространство $X \times Y$ наделим метрикой

$d(({{x}_{1}},{{y}_{1}}),({{x}_{2}},{{y}_{2}})) = {{d}_{X}}({{x}_{1}},{{x}_{2}}) + {{d}_{Y}}({{y}_{1}},{{y}_{2}}).$

Эта метрика порождает соответствующие метрики Канторовича–Рубинштейна и Канторовича на пространстве $\mathcal{P}(X \times Y)$ вероятностных мер на произведении $X \times Y$.

Напомним, что расстояние Хаусдорфа между ограниченными замкнутыми подмножествами A и B метрического пространства $(M,d)$ определяется формулой

$H(A,B) = \max \{ \mathop {\sup }\limits_{x \in A} \,d(x,B),\mathop {\sup }\limits_{y \in B} \,d(y,A)\} .$

Это расстояние будет рассматриваться для подмножеств пространства вероятностных мер $\mathcal{P}(X \times Y)$ с метрикой Канторовича–Рубинштейна ${{d}_{{KR}}}$ (порожденной метрикой на $X \times Y$, введенной выше) или с метрикой Канторовича ${{d}_{K}}$, если X и Y ограничены, что дает соответствующие расстояния Хаусдорфа ${{H}_{{KR}}}$ и ${{H}_{K}}$. Как объяснено выше, можно иметь дело с последним случаем и считать, что $X$ и $Y$ ограничены.

Теорема 1. Пусть ${{\mu }_{1}},{{\mu }_{2}} \in \mathcal{P}(X)$, ${{\nu }_{1}},{{\nu }_{2}} \in \mathcal{P}(Y)$. Тогда для каждой меры ${{\sigma }_{1}} \in \Pi ({{\mu }_{1}},{{\nu }_{1}})$ существует такая мера ${{\sigma }_{2}} \in \Pi ({{\mu }_{2}},{{\nu }_{2}})$, что

(1)
${{d}_{K}}({{\sigma }_{1}},{{\sigma }_{2}}) \leqslant {{d}_{K}}({{\mu }_{1}},{{\mu }_{2}}) + {{d}_{K}}({{\nu }_{1}},{{\nu }_{2}}).$

Значит, для соответствующей метрики Хаусдорфа имеем

(2)
$H(\Pi ({{\mu }_{1}},{{\nu }_{1}}),\Pi ({{\mu }_{2}},{{\nu }_{2}})) \leqslant {{d}_{K}}({{\mu }_{1}},{{\mu }_{2}}) + {{d}_{K}}({{\nu }_{1}},{{\nu }_{2}}).$

Теорема 2. Предположим, что меры ${{\mu }_{n}} \in \mathcal{P}(X)$ слабо сходятся к мере $\mu \in \mathcal{P}(X)$, меры ${{\nu }_{n}} \in \mathcal{P}(Y)$ слабо сходятся к мере $\nu \in \mathcal{P}(Y)$, а равномерно ограниченные непрерывные функции hn: X × $Y\, \to \,[0, + \infty )$ сходятся к функции $h:X \times Y \to [0, + \infty )$ равномерно на компактных множествах. Тогда

${{K}_{h}}(\mu ,\nu ) = \mathop {\lim }\limits_{n \to \infty } {{K}_{{{{h}_{n}}}}}({{\mu }_{n}},{{\nu }_{n}}).$

Доказательство сводится к случаю общей функции стоимости h, более того, достаточно рассмотреть случай функции h, удовлетворяющей условию Липшица с некоторой постоянной $L$. В этом случае имеем следующую явную оценку:

${\text{|}}{{K}_{h}}(\mu ,\nu ) - {{K}_{h}}({{\mu }_{n}},{{\nu }_{n}}){\text{|}} \leqslant L{{d}_{K}}(\mu ,{{\mu }_{n}}) + L{{d}_{K}}(\nu ,{{\nu }_{n}}).$

В самом деле, пусть $\sigma \in \Pi (\mu ,\nu )$ – оптимальная мера. По предыдущей теореме имеется такая мера $\pi \in \Pi ({{\mu }_{n}},{{\nu }_{n}})$, что

${{d}_{K}}(\sigma ,\pi ) \leqslant {{d}_{K}}(\mu ,{{\mu }_{n}}) + {{d}_{K}}(\nu ,{{\nu }_{n}}).$

Поскольку $h$ является L-липшицевой, имеем

$\int h{\kern 1pt} d\pi - \int h{\kern 1pt} d\sigma \leqslant L({{d}_{K}}(\mu ,{{\mu }_{n}}) + {{d}_{K}}(\nu ,{{\nu }_{n}})).$

Следовательно,

${{K}_{h}}({{\mu }_{n}},{{\nu }_{n}}) \leqslant {{K}_{h}}(\mu ,\nu ) + L({{d}_{K}}(\mu ,{{\mu }_{n}}) + {{d}_{K}}(\nu ,{{\nu }_{n}})).$

Меняя местами пары $(\mu ,\nu )$ и $({{\mu }_{n}},{{\nu }_{n}})$, получаем оценку

${{K}_{h}}(\mu ,\nu ) \leqslant {{K}_{h}}({{\mu }_{n}},{{\nu }_{n}}) + L({{d}_{K}}(\mu ,{{\mu }_{n}}) + {{d}_{K}}(\nu ,{{\nu }_{n}})).$

Пусть $T$ – метрическое пространство.

Следствие 1. Предположим, что отображения

$t \mapsto {{\mu }_{t}},\quad T \to \mathcal{P}(X)\quad и\quad t \mapsto {{\nu }_{t}},\quad T \to \mathcal{P}(Y)$
непрерывны и $(t,x,y)\, \mapsto \,{{h}_{t}}(x,y)$, T × X × $Y\, \to \,[0, + \infty )$ограниченная непрерывная функция. Тогда функция $t \mapsto {{K}_{{{{h}_{t}}}}}({{\mu }_{t}},{{\nu }_{t}})$ непрерывна.

Возникает вопрос, существует ли оптимальный план, непрерывно зависящий от параметра t. Можно показать посредством примеров, что такой выбор не всегда возможен. Однако имеются приближенные оптимальные планы, непрерывные по t. Для заданного $\varepsilon > 0$ мера $\sigma \in \Pi (\mu ,\nu )$ будет называться $\varepsilon $-оптимальной для функции стоимости h, если

$\int h{\kern 1pt} d\sigma \leqslant {{K}_{h}}(\mu ,\nu ) + \varepsilon .$

Теорема 3. В ситуации предыдущего следствия можно выбрать $\varepsilon $-оптимальные меры $\sigma _{t}^{\varepsilon } \in \Pi ({{\mu }_{t}},{{\nu }_{t}})$ для функций стоимости ${{h}_{t}}$ так, что они будут непрерывны по t в слабой топологии для каждого фиксированного $\varepsilon > 0$.

Если для каждого t имеется единственный оптимальный план ${{\sigma }_{t}}$, то он непрерывен по t.

Рассмотрим нелинейный функционал стоимости вида

${{J}_{H}}(\sigma ) = \int\limits_{X \times Y} H(x,y,\sigma ){\kern 1pt} \sigma (dx{\kern 1pt} dy),$
где $H$ – ограниченная непрерывная функция на $X \times Y \times \mathcal{P}(X \times Y)$. Функционалы такого типа были недавно изучены в работах [12–15].

Предположим, что H зависит от параметра $t\, \in \,T$ и функция

$(t,x,y,\sigma ) \mapsto {{H}_{t}}(x,y,\sigma )$
ограничена и непрерывна на $T\, \times \,X\, \times \,Y\, \times \,\mathcal{P}(X\, \times \,Y)$.

Теорема 4. Предположим, что $t \mapsto {{\mu }_{t}}$ и $t \mapsto {{\nu }_{t}}$ – непрерывные отображения со значениями в $\mathcal{P}(X)$ и $\mathcal{P}(Y)$ соответственно. Тогда функция

$t \mapsto \mathop {\min }\limits_{\sigma \in \Pi ({{\mu }_{t}},{{\nu }_{t}})} \int\limits_{X \times Y} {{H}_{t}}(x,y,\sigma ){\kern 1pt} \sigma (dx{\kern 1pt} dy)$
непрерывна.

Доказательства представленных результатов будут даны в подробной статье.

Список литературы

  1. Bogachev V.I. Weak convergence of measures, Amer. Math. Soc., Providence, Rhode Island, 2018.

  2. Богачев В.И., Колесников А.В. // Успехи матем. наук. 2012. Т. 67. № 5. С. 3–110.

  3. Rachev S.T., Rüschendorf L. Mass transportation problems, V. I, II, Springer, New York, 1998.

  4. Santambrogio F. Optimal transport для applied mathematicians, Birkhäuser/Springer, Cham, 2015.

  5. Villani C. Optimal transport, old and new, Springer, New York, 2009.

  6. Малофеев И.И. // Докл. Акад. наук. 2016. Т. 470. № 1. С. 13–17.

  7. Bogachev V.I., Malofeev I.I. // J. Math. Anal. Appl. 2020. V. 486. № 1. P. 1–30.

  8. Богачев В.И., Доледенок А.Н., Малофеев И.И. // Матем. заметки. 2021. Т. 110. № 6. С. 149–153.

  9. Bergin J. // Econom. Theory. 1999. V. 13. № 2. P. 471–481.

  10. Ghossoub M., Saunders D. // Econom. Theory Bull. 2021. V. 9. № 1. P. 113–117.

  11. Bogachev V.I. Measure theory, V. 1, 2, Springer, Berlin, 2007.

  12. Gozlan N., Roberto C., Samson P.-M., Tetali P. // J. Funct. Anal. 2017. V. 273. № 11. P. 3327–3405.

  13. Alibert J.-J., Bouchitté G., Champion T. // European J. Appl. Math. 2019. V. 30. № 6. P. 1229–1263.

  14. Backhoff-Veraguas J., Beiglböck M., Pammer G. // Calc. Var. Partial Differ. Equ. 2019. V. 58, Paper no. 203. P. 1–28.

  15. Backhoff-Veraguas J., Pammer G. // Bernoulli. 2022. V. 28. № 1. P. 370–394.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления