Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 503, № 1, стр. 45-47

О ПОВЕДЕНИИ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ ВБЛИЗИ МЕДИАНЫ

Н. А. Волков 1, Д. И. Дмитриев 2, М. Е. Жуковский 1*

1 Московский физико-технический институт (национальный исследовательский университет)
Долгопрудный, Московская обл., Россия

2 ETH Zürich, ETH AI Center
Zurich, Switzerland

* E-mail: zhukmax@gmail.com

Поступила в редакцию 06.01.2022
После доработки 06.01.2022
Принята к публикации 10.02.2022

Полный текст (PDF)

Аннотация

В работе исследуется поведение функции распределения биномиальной случайной величины с параметрами n и $b{\text{/}}(n + c)$ в точке b – 1 при натуральных $b \leqslant n$ и $c \in [0,\;1]$. Полученные результаты имеют непосредственное следствие в широко известной задаче о малых отклонениях сумм независимых случайных величин от их математического ожидания. Кроме того, мы ответили на вопрос о монотонности функции Рамануджана для биномиального распределения, который сформулировали в своей работе Джогдео и Самуэльс в 1968 г.

Ключевые слова: биномиальное распределение, медиана, функция Рамануджана, малые отклонения сумм независимых случайных величин

1. ПУАССОНОВСКОЕ РАСПРЕДЕЛЕНИЕ И ЗАДАЧА РАМАНУДЖАНА

Пусть $b \in \mathbb{N}$ – натуральное число. Разложим rb в ряд Тэйлора: ${{e}^{b}} = \sum\limits_{j = 0}^\infty {\frac{{{{b}^{j}}}}{{j!}}} $. Зададимся вопросом: каково наименьшее натуральное μ такое, что $\sum\limits_{j = 0}^\mu {\frac{{{{b}^{j}}}}{{j!}}} \geqslant \frac{1}{2}{{e}^{b}}$? Ответ на этот вопрос хорошо известен.

Пусть $\xi $ – неотрицательная целочисленная случайная величина. Медианой $\xi $ называется наименьшее целое неотрицательное число $\mu : = \mu (\xi )$ такое, что $P(\xi \leqslant m) \geqslant \frac{1}{2}$. Для пуассоновской случайной величины ${{\eta }_{b}}$ с натуральным параметром b известно [1], что $\mu ({{\eta }_{b}}) = b$, что и является ответом на поставленный выше вопрос. Но насколько близка вероятность ${\text{P}}({{\eta }_{b}} \leqslant b)$ к $\frac{1}{2}$? Рамануджан выдвинул гипотезу [2], что

${{y}_{b}}: = \frac{{\frac{1}{2} - {\text{P}}({{\eta }_{b}} < b)}}{{{\text{P}}({{\eta }_{b}} = b)}} \in \left( {\frac{1}{3},\frac{1}{2}} \right)\;{\text{и}}\;{\text{убывает}}.$

Эта гипотеза была доказана независимо Сего в [3] и Ватсоном в [4]. С тех пор поведение функции ${{y}_{b}}$ было хорошо изучено. В 1913 г. в своем письме Харди Рамануджан выдвинул еще одну гипотезу:

${{y}_{b}} = \frac{1}{3} + \frac{4}{{135(b + {{\alpha }_{b}})}},$
где $8{\text{/}}45 \geqslant {{\alpha }_{b}} \geqslant 2{\text{/}}21$. Эта гипотеза была подтверждена лишь в 1995 г. Флажолетом и соавт. [5]. В 2003 г. Алм [6] доказал, что ${{\alpha }_{b}}$ убывает, а в 2004 г. Алзер [7] усилил гипотезу Рамануджана:
${{y}_{b}} = \frac{1}{3} + \frac{4}{{135b}} - \frac{8}{{2835({{b}^{2}} + {{\beta }_{b}})}},$
где
$ - \frac{1}{3} < {{\beta }_{b}} \leqslant - 1 + \frac{4}{{\sqrt {21(368 - 135e)} }},$
причем указанные границы являются точными.

2. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ И ЗАДАЧА САМУЭЛЬСА

Пусть ${{\xi }_{{b,n}}}$ – биномиальная случайная величина с параметрами n и b/n, где $b \leqslant n$ – натуральные числа. Хорошо известно, что ${{\xi }_{{b,n}}}$ сходится по распределению к случайной величине ${{\eta }_{b}}$ при $n \to \infty $. Поэтому естественно ожидать, что описанные в предыдущем разделе свойства пуассоновского распределения справедливы и для биномиального распределения при достаточно больших n. Но можно ли ответить на аналогичные вопросы при всех $n$?

Так как $\left| {\mu ({{\xi }_{{b,n}}}) - b} \right| \leqslant \ln 2$ [8], медиана биномиальной случайной величины равна $\mu ({{\xi }_{{b,n}}}) = b$. В 1968 г. Джогдео и Самуэльс [9] рассмотрели величину, аналогичную той, которую ввел Рамануджан для пуассоновского распределения:

${{z}_{{b,n}}}: = \frac{{1{\text{/}}2 - P({{\xi }_{{b,n}}} < b)}}{{P({{\xi }_{{b,n}}} = b)}}.$

Теорема 1 (K. Jogdeo, S.M. Samuels, 1968 [9]). ${{z}_{{b,n}}}$ убывает при $n \geqslant 2b$, ${{z}_{{b,n}}} \to {{y}_{n}}$ при $n \to \infty $. Более того, для всех $n > 2b$ справедливо $\frac{1}{3} < {{z}_{{b,n}}} < \frac{1}{2}$; при $b < n < 2b$ справедливо $\frac{1}{2} < {{z}_{{b,n}}} < \frac{2}{3}$; zb, 2b = = $\frac{1}{2}\, = \,{{z}_{{b,b}}}$.

Они также заметили, что ${{z}_{{b + 1,n}}} < {{z}_{{b,n}}}$ для всех достаточно больших n, но не смогли уточнить этот результат.

Рассмотрим теперь биномиальную случайную величину ${{\xi }_{{b,n,c}}}$ с параметрами n и $\frac{b}{{n + c}}$, где $b < n$ – натуральные числа и $c \in [0,\;1]$. Обозначим ${{p}_{{b,n,c}}}: = P({{\xi }_{{b,n,c}}} < b)$. Исследование монотонности ${{p}_{{b,n,c}}}$ по b мотивировано широко известной задачей о неравенстве малых отклонений, поставленной Самуэльсом [10], которая может быть сформулирована следующим образом: найти минимум ${\text{P}}({{\xi }_{1}} + {{\xi }_{2}} + \; \ldots \; + {{\xi }_{n}} < n + c)$ по всем множествам независимых неотрицательных случайных величин $\{ {{\xi }_{1}},\; \ldots ,\;{{\xi }_{n}}\} $ с одинаковым математическим ожиданием, равным 1. Эта задача до сих пор не решена. Тем не менее известно, что оптимальными случайными величинами являются величины, принимающие два значения с вероятностью 1 (как говорится, с двумя атомами). Если мы далее ограничимся одинаково распределенными случайными величинами с двумя атомами, то сведем исходную задачу к анализу монотонности ${{p}_{{b,n,c}}}$ по b.

Из упомянутого результата Сего и Ватсона следует, что ${\text{P}}({{\eta }_{b}} < b)$ возрастает. Так как $\mathop {\lim }\limits_{n \to \infty } {{p}_{{b,n,c}}}$ = = P(ηb < b), то при достаточно больших n справедливо ${{p}_{{b + 1,n,c}}} > {{p}_{{b,n,c}}}$. С другой стороны, например, при $n = b + 1$ и $c = 0$ выполнено $0 = {{p}_{{b + 1,n,c}}} < {{p}_{{b,n,c}}}$. Таким образом, с ростом n монотонность ${{p}_{{b,n,c}}}$ (как функции от b) меняется.

3. НОВЫЕ РЕЗУЛЬТАТЫ

Нам удалось решить задачу, поставленную Джогдео и Самуэльсом о монотонности ${{z}_{{b,n}}}$ по $b$.

Теорема 2. Пусть $\varepsilon > 0$. Существует такое ${{n}_{0}}$, что при всех $n \geqslant {{n}_{0}}$ справедливо следующее.

1. Если $n - (1 + \varepsilon )\sqrt {\frac{{77}}{{360}}n} > b > (1 + \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, то ${{z}_{{b + 1,n}}} > {{z}_{{b,n}}}$;

2. Если либо $b > n - (1 - \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, либо b < < $(1 - \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, то ${{z}_{{b + 1,n}}} < {{z}_{{b,n}}}$.

Кроме того, мы исследовали функцию ${{p}_{{b,n,c}}}$ на монотонность по b.

Теорема 3. Справедливы следующие утверждения:

1. Если $n \geqslant 3b + 2$, то ${{p}_{{b + 1,n,0}}} > {{p}_{{b,n,0}}}$. Если $n \leqslant 3b + 1$, то ${{p}_{{b + 1,n,0}}} < {{p}_{{b,n,0}}}$;

2. При всех $1 \leqslant b < n$ справедливо ${{p}_{{b + 1,n,1}}} > {{p}_{{b,n,1}}}$;

3. Если $n \geqslant 3b + 2$ и $c \in (0,1)$, то ${{p}_{{b + 1,n,c}}} > {{p}_{{b,n,c}}}$.

К сожалению, исчерпывающий результат удалось получить лишь для c = 0 и c = 1. Тем не менее мы нашли асимптотическое значение порога, после которого меняется монотонность.

Теорема 4. Для всех положительных δ, $\varepsilon $, достаточно больших $n$ и целых $b \in (\varepsilon n,n)$ справедливо следующее:

1. Если $b < \frac{{n(1 - \delta )}}{{3(1 - c)}}$, то ${{p}_{{b + 1,n}}} > {{p}_{{b,n}}}$;

2. Если $b > \frac{{n(1 + \delta )}}{{3(1 - c)}}$, то ${{p}_{{b + 1,n}}} < {{p}_{{b,n}}}$.

Заметим, что из теоремы 3 вытекает следствие в задаче о малых отклонениях при $c = 1$. Пусть $\alpha \in (0,\;1)$, $\beta > 1$. Пусть b – целое число такое, что $b < \frac{{n + 1 - n\alpha }}{{\beta - \alpha }} \leqslant b + 1$. Тогда P(ξ1 + ... + ξn < < $n + 1) \geqslant {{p}_{{b,n,1}}}$, где ${{\xi }_{1}},\; \ldots ,\;{{\xi }_{n}}$ – независимые одинаково распределенные случайные величины со средним 1, и равенство выполняется тогда и только тогда, когда $\alpha = 0$ и $\frac{{n + 1}}{\beta } = b + 1$. Аналогичные утверждения можно было бы сформулировать для любого $c \in (0,\;1)$, если бы удалось асимптотический результат в теореме 4 сделать точным.

4. ${\text{B}}$-ФУНКЦИЯ

Напомним, что ${\text{B}}(x,y) = \int\limits_0^1 {{{t}^{{x - 1}}}} {{(1 - t)}^{{y - 1}}}$. Доказательства приведенных в предыдущем разделе утверждений опираются на следующие полученные нами удобные выражения для ${{p}_{{b + 1,n,c}}} - {{p}_{{b,n,c}}}$ и ${{z}_{{b,n}}}$.

Утверждение 1. Для всех натуральных $b \leqslant n$ и $c \in [0,\;1]$ справедливы равенства

$\begin{gathered} {{p}_{{b,n,c}}} = \frac{{\int\limits_0^{1\, - \,\frac{b}{{n + c}}} {{{{(1 - z)}}^{{b - 1}}}} {{z}^{{n - b}}}dz}}{{b{\text{B}}(b,n - b + 1)}}, \\ {{z}_{{b,n}}} = \frac{{\frac{1}{2}b\left( {\left[ {\int\limits_{1 - b/n}^1 {} - \int\limits_0^{1 - b/n} {} } \right]{{{(1 - z)}}^{{b - 1}}}{{z}^{{n - b}}}dz} \right)}}{{{{{\left( {\frac{b}{n}} \right)}}^{b}}{{{\left( {1 - \frac{b}{n}} \right)}}^{{n - b}}}}}. \\ \end{gathered} $

Анализ этих выражений сводится к исследованию поведения функции $g(z) = (1 - z{{)}^{{b - 1}}}{{z}^{{n - b}}}$ на $\left[ {1 - \frac{{b + 1}}{{n + c}},1 - \frac{b}{{n + c}}} \right]$. Ее поведение удается исследовать, используя формулу Тейлора (достаточно разложить до пятого члена) с остаточным членом в форме Лагранжа и следующее удобное представление производных от функции g:

$\begin{gathered} \frac{{{{\partial }^{\ell }}g}}{{\partial {{z}^{\ell }}}} = (1 - z{{)}^{{b - 1 - \ell }}}{{z}^{{n - b - \ell }}} \times \\ \times \;\sum\limits_{i = 0}^\ell {\left( \begin{gathered} \ell \hfill \\ i \hfill \\ \end{gathered} \right)} {{( - 1)}^{{\ell - i}}}{{z}^{{\ell - i}}}\frac{{(n - 1 - i)!}}{{(n - 1 - \ell )!}}\frac{{(n - b)!}}{{(n - b - i)!}}, \\ \ell \in \{ 1,\; \ldots ,\;\min \{ b - 1,n - b\} \} . \\ \end{gathered} $

Список литературы

  1. Choi K.P. On the medians of Gamma distributions and an equation of Ramanujan // Proc. Amer. Math. Soc. 1994. V. 121. № 1. P. 245–251.

  2. Ramanujan S. Question 294 // Indian Math. Soc. 1911. V. 3. P. 151–152.

  3. Szegö G. Über einige von S. Ramanujan gestellte Aufgaben // J. Lond. Math. Soc. 1928. V. 3. P. 225–232.

  4. Watson G.N. Theorems stated by Ramanujan (V): approximations connected with ${{e}^{x}}$ // Proc. Lond. Math. Soc. 1929. V. 29. P. 293–308.

  5. Flajolet P., Grabner P.J., Kirschenhofer P., Prodinger H. On Ramanujan’s $Q$-function // J. Comput. Appl. Math. 1995. V. 58. P. 103–116.

  6. Alm S.E. Monotonicity of the difference between median and mean of gamma distributions and of a related Ramanujan sequence // Bernoulli. 2003. V. 9. P. 351–371.

  7. Alzer H. On Ramanujan’s inequalities for exp(k) // J. Lond. Math. Soc. 2004. V. 69. P. 639–656.

  8. Hamza K. The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions // Statist. Probab. Lett. 1995. V. 23. P. 21–25.

  9. Jogdeo K., Samuels S.M. Monotone convergence of binomial probabilities and a generalization of Ramanujan’s equation // Ann. Math. Statist. 1968. V. 39. № 4. P. 1191–1195.

  10. Samuels S.M. On a Chebyshev-type inequality for sums of independent random variables // The Ann. of Math. Stat. 1966. V. 37. P. 248–259.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления