Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 503, № 1, стр. 45-47

О ПОВЕДЕНИИ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ ВБЛИЗИ МЕДИАНЫ

Н. А. Волков¹, Д. И. Дмитриев², М. Е. Жуковский^1, *

¹ Московский физико-технический институт (национальный исследовательский университет)
Долгопрудный, Московская обл., Россия

² ETH Zürich, ETH AI Center
Zurich, Switzerland

^* E-mail: zhukmax@gmail.com

Поступила в редакцию 06.01.2022
После доработки 06.01.2022
Принята к публикации 10.02.2022

EDN: VOAHNW
DOI: 10.31857/S2686954322020199

Полный текст (PDF)

Аннотация

В работе исследуется поведение функции распределения биномиальной случайной величины с параметрами n и $b{\text{/}}(n + c)$ в точке b – 1 при натуральных $b \leqslant n$ и $c \in [0,\;1]$. Полученные результаты имеют непосредственное следствие в широко известной задаче о малых отклонениях сумм независимых случайных величин от их математического ожидания. Кроме того, мы ответили на вопрос о монотонности функции Рамануджана для биномиального распределения, который сформулировали в своей работе Джогдео и Самуэльс в 1968 г.

Ключевые слова: биномиальное распределение, медиана, функция Рамануджана, малые отклонения сумм независимых случайных величин

1. ПУАССОНОВСКОЕ РАСПРЕДЕЛЕНИЕ И ЗАДАЧА РАМАНУДЖАНА

Пусть $b \in \mathbb{N}$ – натуральное число. Разложим r^b в ряд Тэйлора: ${{e}^{b}} = \sum\limits_{j = 0}^\infty {\frac{{{{b}^{j}}}}{{j!}}} $. Зададимся вопросом: каково наименьшее натуральное μ такое, что $\sum\limits_{j = 0}^\mu {\frac{{{{b}^{j}}}}{{j!}}} \geqslant \frac{1}{2}{{e}^{b}}$? Ответ на этот вопрос хорошо известен.

Пусть $\xi $ – неотрицательная целочисленная случайная величина. Медианой $\xi $ называется наименьшее целое неотрицательное число $\mu : = \mu (\xi )$ такое, что $P(\xi \leqslant m) \geqslant \frac{1}{2}$. Для пуассоновской случайной величины ${{\eta }_{b}}$ с натуральным параметром b известно [1], что $\mu ({{\eta }_{b}}) = b$, что и является ответом на поставленный выше вопрос. Но насколько близка вероятность ${\text{P}}({{\eta }_{b}} \leqslant b)$ к $\frac{1}{2}$? Рамануджан выдвинул гипотезу [2], что

${{y}_{b}}: = \frac{{\frac{1}{2} - {\text{P}}({{\eta }_{b}} < b)}}{{{\text{P}}({{\eta }_{b}} = b)}} \in \left( {\frac{1}{3},\frac{1}{2}} \right)\;{\text{и}}\;{\text{убывает}}.$

Эта гипотеза была доказана независимо Сего в [3] и Ватсоном в [4]. С тех пор поведение функции ${{y}_{b}}$ было хорошо изучено. В 1913 г. в своем письме Харди Рамануджан выдвинул еще одну гипотезу:

${{y}_{b}} = \frac{1}{3} + \frac{4}{{135(b + {{\alpha }_{b}})}},$

где $8{\text{/}}45 \geqslant {{\alpha }_{b}} \geqslant 2{\text{/}}21$. Эта гипотеза была подтверждена лишь в 1995 г. Флажолетом и соавт. [5]. В 2003 г. Алм [6] доказал, что ${{\alpha }_{b}}$ убывает, а в 2004 г. Алзер [7] усилил гипотезу Рамануджана:

${{y}_{b}} = \frac{1}{3} + \frac{4}{{135b}} - \frac{8}{{2835({{b}^{2}} + {{\beta }_{b}})}},$

где

$ - \frac{1}{3} < {{\beta }_{b}} \leqslant - 1 + \frac{4}{{\sqrt {21(368 - 135e)} }},$

причем указанные границы являются точными.

2. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ И ЗАДАЧА САМУЭЛЬСА

Пусть ${{\xi }_{{b,n}}}$ – биномиальная случайная величина с параметрами n и b/n, где $b \leqslant n$ – натуральные числа. Хорошо известно, что ${{\xi }_{{b,n}}}$ сходится по распределению к случайной величине ${{\eta }_{b}}$ при $n \to \infty $. Поэтому естественно ожидать, что описанные в предыдущем разделе свойства пуассоновского распределения справедливы и для биномиального распределения при достаточно больших n. Но можно ли ответить на аналогичные вопросы при всех $n$?

Так как $\left| {\mu ({{\xi }_{{b,n}}}) - b} \right| \leqslant \ln 2$ [8], медиана биномиальной случайной величины равна $\mu ({{\xi }_{{b,n}}}) = b$. В 1968 г. Джогдео и Самуэльс [9] рассмотрели величину, аналогичную той, которую ввел Рамануджан для пуассоновского распределения:

${{z}_{{b,n}}}: = \frac{{1{\text{/}}2 - P({{\xi }_{{b,n}}} < b)}}{{P({{\xi }_{{b,n}}} = b)}}.$

Теорема 1 (K. Jogdeo, S.M. Samuels, 1968 [9]). ${{z}_{{b,n}}}$ убывает при $n \geqslant 2b$, ${{z}_{{b,n}}} \to {{y}_{n}}$ при $n \to \infty $. Более того, для всех $n > 2b$ справедливо $\frac{1}{3} < {{z}_{{b,n}}} < \frac{1}{2}$; при $b < n < 2b$ справедливо $\frac{1}{2} < {{z}_{{b,n}}} < \frac{2}{3}$; z_{b, 2b} = = $\frac{1}{2}\, = \,{{z}_{{b,b}}}$.

Они также заметили, что ${{z}_{{b + 1,n}}} < {{z}_{{b,n}}}$ для всех достаточно больших n, но не смогли уточнить этот результат.

Рассмотрим теперь биномиальную случайную величину ${{\xi }_{{b,n,c}}}$ с параметрами n и $\frac{b}{{n + c}}$, где $b < n$ – натуральные числа и $c \in [0,\;1]$. Обозначим ${{p}_{{b,n,c}}}: = P({{\xi }_{{b,n,c}}} < b)$. Исследование монотонности ${{p}_{{b,n,c}}}$ по b мотивировано широко известной задачей о неравенстве малых отклонений, поставленной Самуэльсом [10], которая может быть сформулирована следующим образом: найти минимум ${\text{P}}({{\xi }_{1}} + {{\xi }_{2}} + \; \ldots \; + {{\xi }_{n}} < n + c)$ по всем множествам независимых неотрицательных случайных величин $\{ {{\xi }_{1}},\; \ldots ,\;{{\xi }_{n}}\} $ с одинаковым математическим ожиданием, равным 1. Эта задача до сих пор не решена. Тем не менее известно, что оптимальными случайными величинами являются величины, принимающие два значения с вероятностью 1 (как говорится, с двумя атомами). Если мы далее ограничимся одинаково распределенными случайными величинами с двумя атомами, то сведем исходную задачу к анализу монотонности ${{p}_{{b,n,c}}}$ по b.

Из упомянутого результата Сего и Ватсона следует, что ${\text{P}}({{\eta }_{b}} < b)$ возрастает. Так как $\mathop {\lim }\limits_{n \to \infty } {{p}_{{b,n,c}}}$ = = P(η_b < b), то при достаточно больших n справедливо ${{p}_{{b + 1,n,c}}} > {{p}_{{b,n,c}}}$. С другой стороны, например, при $n = b + 1$ и $c = 0$ выполнено $0 = {{p}_{{b + 1,n,c}}} < {{p}_{{b,n,c}}}$. Таким образом, с ростом n монотонность ${{p}_{{b,n,c}}}$ (как функции от b) меняется.

3. НОВЫЕ РЕЗУЛЬТАТЫ

Нам удалось решить задачу, поставленную Джогдео и Самуэльсом о монотонности ${{z}_{{b,n}}}$ по $b$.

Теорема 2. Пусть $\varepsilon > 0$. Существует такое ${{n}_{0}}$, что при всех $n \geqslant {{n}_{0}}$ справедливо следующее.

1. Если $n - (1 + \varepsilon )\sqrt {\frac{{77}}{{360}}n} > b > (1 + \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, то ${{z}_{{b + 1,n}}} > {{z}_{{b,n}}}$;

2. Если либо $b > n - (1 - \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, либо b < < $(1 - \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, то ${{z}_{{b + 1,n}}} < {{z}_{{b,n}}}$.

Кроме того, мы исследовали функцию ${{p}_{{b,n,c}}}$ на монотонность по b.

Теорема 3. Справедливы следующие утверждения:

1. Если $n \geqslant 3b + 2$, то ${{p}_{{b + 1,n,0}}} > {{p}_{{b,n,0}}}$. Если $n \leqslant 3b + 1$, то ${{p}_{{b + 1,n,0}}} < {{p}_{{b,n,0}}}$;

2. При всех $1 \leqslant b < n$ справедливо ${{p}_{{b + 1,n,1}}} > {{p}_{{b,n,1}}}$;

3. Если $n \geqslant 3b + 2$ и $c \in (0,1)$, то ${{p}_{{b + 1,n,c}}} > {{p}_{{b,n,c}}}$.

К сожалению, исчерпывающий результат удалось получить лишь для c = 0 и c = 1. Тем не менее мы нашли асимптотическое значение порога, после которого меняется монотонность.

Теорема 4. Для всех положительных δ, $\varepsilon $, достаточно больших $n$ и целых $b \in (\varepsilon n,n)$ справедливо следующее:

1. Если $b < \frac{{n(1 - \delta )}}{{3(1 - c)}}$, то ${{p}_{{b + 1,n}}} > {{p}_{{b,n}}}$;

2. Если $b > \frac{{n(1 + \delta )}}{{3(1 - c)}}$, то ${{p}_{{b + 1,n}}} < {{p}_{{b,n}}}$.

Заметим, что из теоремы 3 вытекает следствие в задаче о малых отклонениях при $c = 1$. Пусть $\alpha \in (0,\;1)$, $\beta > 1$. Пусть b – целое число такое, что $b < \frac{{n + 1 - n\alpha }}{{\beta - \alpha }} \leqslant b + 1$. Тогда P(ξ₁ + ... + ξ_n < < $n + 1) \geqslant {{p}_{{b,n,1}}}$, где ${{\xi }_{1}},\; \ldots ,\;{{\xi }_{n}}$ – независимые одинаково распределенные случайные величины со средним 1, и равенство выполняется тогда и только тогда, когда $\alpha = 0$ и $\frac{{n + 1}}{\beta } = b + 1$. Аналогичные утверждения можно было бы сформулировать для любого $c \in (0,\;1)$, если бы удалось асимптотический результат в теореме 4 сделать точным.

4. ${\text{B}}$-ФУНКЦИЯ

Напомним, что ${\text{B}}(x,y) = \int\limits_0^1 {{{t}^{{x - 1}}}} {{(1 - t)}^{{y - 1}}}$. Доказательства приведенных в предыдущем разделе утверждений опираются на следующие полученные нами удобные выражения для ${{p}_{{b + 1,n,c}}} - {{p}_{{b,n,c}}}$ и ${{z}_{{b,n}}}$.

Утверждение 1. Для всех натуральных $b \leqslant n$ и $c \in [0,\;1]$ справедливы равенства

$\begin{gathered} {{p}_{{b,n,c}}} = \frac{{\int\limits_0^{1\, - \,\frac{b}{{n + c}}} {{{{(1 - z)}}^{{b - 1}}}} {{z}^{{n - b}}}dz}}{{b{\text{B}}(b,n - b + 1)}}, \\ {{z}_{{b,n}}} = \frac{{\frac{1}{2}b\left( {\left[ {\int\limits_{1 - b/n}^1 {} - \int\limits_0^{1 - b/n} {} } \right]{{{(1 - z)}}^{{b - 1}}}{{z}^{{n - b}}}dz} \right)}}{{{{{\left( {\frac{b}{n}} \right)}}^{b}}{{{\left( {1 - \frac{b}{n}} \right)}}^{{n - b}}}}}. \\ \end{gathered} $

Анализ этих выражений сводится к исследованию поведения функции $g(z) = (1 - z{{)}^{{b - 1}}}{{z}^{{n - b}}}$ на $\left[ {1 - \frac{{b + 1}}{{n + c}},1 - \frac{b}{{n + c}}} \right]$. Ее поведение удается исследовать, используя формулу Тейлора (достаточно разложить до пятого члена) с остаточным членом в форме Лагранжа и следующее удобное представление производных от функции g:

$\begin{gathered} \frac{{{{\partial }^{\ell }}g}}{{\partial {{z}^{\ell }}}} = (1 - z{{)}^{{b - 1 - \ell }}}{{z}^{{n - b - \ell }}} \times \\ \times \;\sum\limits_{i = 0}^\ell {\left( \begin{gathered} \ell \hfill \\ i \hfill \\ \end{gathered} \right)} {{( - 1)}^{{\ell - i}}}{{z}^{{\ell - i}}}\frac{{(n - 1 - i)!}}{{(n - 1 - \ell )!}}\frac{{(n - b)!}}{{(n - b - i)!}}, \\ \ell \in \{ 1,\; \ldots ,\;\min \{ b - 1,n - b\} \} . \\ \end{gathered} $

Список литературы

Choi K.P. On the medians of Gamma distributions and an equation of Ramanujan // Proc. Amer. Math. Soc. 1994. V. 121. № 1. P. 245–251.
Ramanujan S. Question 294 // Indian Math. Soc. 1911. V. 3. P. 151–152.
Szegö G. Über einige von S. Ramanujan gestellte Aufgaben // J. Lond. Math. Soc. 1928. V. 3. P. 225–232.
Watson G.N. Theorems stated by Ramanujan (V): approximations connected with ${{e}^{x}}$ // Proc. Lond. Math. Soc. 1929. V. 29. P. 293–308.
Flajolet P., Grabner P.J., Kirschenhofer P., Prodinger H. On Ramanujan’s $Q$-function // J. Comput. Appl. Math. 1995. V. 58. P. 103–116.
Alm S.E. Monotonicity of the difference between median and mean of gamma distributions and of a related Ramanujan sequence // Bernoulli. 2003. V. 9. P. 351–371.
Alzer H. On Ramanujan’s inequalities for exp(k) // J. Lond. Math. Soc. 2004. V. 69. P. 639–656.
Hamza K. The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions // Statist. Probab. Lett. 1995. V. 23. P. 21–25.
Jogdeo K., Samuels S.M. Monotone convergence of binomial probabilities and a generalization of Ramanujan’s equation // Ann. Math. Statist. 1968. V. 39. № 4. P. 1191–1195.
Samuels S.M. On a Chebyshev-type inequality for sums of independent random variables // The Ann. of Math. Stat. 1966. V. 37. P. 248–259.

Дополнительные материалы отсутствуют.

Инструменты

следующая статья выпуска предыдущая статья выпуска содержание выпуска

Доклады Российской академии наук. Математика, информатика, процессы управления

Архивы выпусков Информация о журнале Отправить рукопись в журнал