Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 503, № 1, стр. 45-47
О ПОВЕДЕНИИ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ ВБЛИЗИ МЕДИАНЫ
Н. А. Волков 1, Д. И. Дмитриев 2, М. Е. Жуковский 1, *
1 Московский физико-технический институт (национальный исследовательский университет)
Долгопрудный, Московская обл., Россия
2 ETH Zürich, ETH AI Center
Zurich, Switzerland
* E-mail: zhukmax@gmail.com
Поступила в редакцию 06.01.2022
После доработки 06.01.2022
Принята к публикации 10.02.2022
- EDN: VOAHNW
- DOI: 10.31857/S2686954322020199
Аннотация
В работе исследуется поведение функции распределения биномиальной случайной величины с параметрами n и $b{\text{/}}(n + c)$ в точке b – 1 при натуральных $b \leqslant n$ и $c \in [0,\;1]$. Полученные результаты имеют непосредственное следствие в широко известной задаче о малых отклонениях сумм независимых случайных величин от их математического ожидания. Кроме того, мы ответили на вопрос о монотонности функции Рамануджана для биномиального распределения, который сформулировали в своей работе Джогдео и Самуэльс в 1968 г.
1. ПУАССОНОВСКОЕ РАСПРЕДЕЛЕНИЕ И ЗАДАЧА РАМАНУДЖАНА
Пусть $b \in \mathbb{N}$ – натуральное число. Разложим rb в ряд Тэйлора: ${{e}^{b}} = \sum\limits_{j = 0}^\infty {\frac{{{{b}^{j}}}}{{j!}}} $. Зададимся вопросом: каково наименьшее натуральное μ такое, что $\sum\limits_{j = 0}^\mu {\frac{{{{b}^{j}}}}{{j!}}} \geqslant \frac{1}{2}{{e}^{b}}$? Ответ на этот вопрос хорошо известен.
Пусть $\xi $ – неотрицательная целочисленная случайная величина. Медианой $\xi $ называется наименьшее целое неотрицательное число $\mu : = \mu (\xi )$ такое, что $P(\xi \leqslant m) \geqslant \frac{1}{2}$. Для пуассоновской случайной величины ${{\eta }_{b}}$ с натуральным параметром b известно [1], что $\mu ({{\eta }_{b}}) = b$, что и является ответом на поставленный выше вопрос. Но насколько близка вероятность ${\text{P}}({{\eta }_{b}} \leqslant b)$ к $\frac{1}{2}$? Рамануджан выдвинул гипотезу [2], что
Эта гипотеза была доказана независимо Сего в [3] и Ватсоном в [4]. С тех пор поведение функции ${{y}_{b}}$ было хорошо изучено. В 1913 г. в своем письме Харди Рамануджан выдвинул еще одну гипотезу:
где $8{\text{/}}45 \geqslant {{\alpha }_{b}} \geqslant 2{\text{/}}21$. Эта гипотеза была подтверждена лишь в 1995 г. Флажолетом и соавт. [5]. В 2003 г. Алм [6] доказал, что ${{\alpha }_{b}}$ убывает, а в 2004 г. Алзер [7] усилил гипотезу Рамануджана: где причем указанные границы являются точными.2. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ И ЗАДАЧА САМУЭЛЬСА
Пусть ${{\xi }_{{b,n}}}$ – биномиальная случайная величина с параметрами n и b/n, где $b \leqslant n$ – натуральные числа. Хорошо известно, что ${{\xi }_{{b,n}}}$ сходится по распределению к случайной величине ${{\eta }_{b}}$ при $n \to \infty $. Поэтому естественно ожидать, что описанные в предыдущем разделе свойства пуассоновского распределения справедливы и для биномиального распределения при достаточно больших n. Но можно ли ответить на аналогичные вопросы при всех $n$?
Так как $\left| {\mu ({{\xi }_{{b,n}}}) - b} \right| \leqslant \ln 2$ [8], медиана биномиальной случайной величины равна $\mu ({{\xi }_{{b,n}}}) = b$. В 1968 г. Джогдео и Самуэльс [9] рассмотрели величину, аналогичную той, которую ввел Рамануджан для пуассоновского распределения:
Теорема 1 (K. Jogdeo, S.M. Samuels, 1968 [9]). ${{z}_{{b,n}}}$ убывает при $n \geqslant 2b$, ${{z}_{{b,n}}} \to {{y}_{n}}$ при $n \to \infty $. Более того, для всех $n > 2b$ справедливо $\frac{1}{3} < {{z}_{{b,n}}} < \frac{1}{2}$; при $b < n < 2b$ справедливо $\frac{1}{2} < {{z}_{{b,n}}} < \frac{2}{3}$; zb, 2b = = $\frac{1}{2}\, = \,{{z}_{{b,b}}}$.
Они также заметили, что ${{z}_{{b + 1,n}}} < {{z}_{{b,n}}}$ для всех достаточно больших n, но не смогли уточнить этот результат.
Рассмотрим теперь биномиальную случайную величину ${{\xi }_{{b,n,c}}}$ с параметрами n и $\frac{b}{{n + c}}$, где $b < n$ – натуральные числа и $c \in [0,\;1]$. Обозначим ${{p}_{{b,n,c}}}: = P({{\xi }_{{b,n,c}}} < b)$. Исследование монотонности ${{p}_{{b,n,c}}}$ по b мотивировано широко известной задачей о неравенстве малых отклонений, поставленной Самуэльсом [10], которая может быть сформулирована следующим образом: найти минимум ${\text{P}}({{\xi }_{1}} + {{\xi }_{2}} + \; \ldots \; + {{\xi }_{n}} < n + c)$ по всем множествам независимых неотрицательных случайных величин $\{ {{\xi }_{1}},\; \ldots ,\;{{\xi }_{n}}\} $ с одинаковым математическим ожиданием, равным 1. Эта задача до сих пор не решена. Тем не менее известно, что оптимальными случайными величинами являются величины, принимающие два значения с вероятностью 1 (как говорится, с двумя атомами). Если мы далее ограничимся одинаково распределенными случайными величинами с двумя атомами, то сведем исходную задачу к анализу монотонности ${{p}_{{b,n,c}}}$ по b.
Из упомянутого результата Сего и Ватсона следует, что ${\text{P}}({{\eta }_{b}} < b)$ возрастает. Так как $\mathop {\lim }\limits_{n \to \infty } {{p}_{{b,n,c}}}$ = = P(ηb < b), то при достаточно больших n справедливо ${{p}_{{b + 1,n,c}}} > {{p}_{{b,n,c}}}$. С другой стороны, например, при $n = b + 1$ и $c = 0$ выполнено $0 = {{p}_{{b + 1,n,c}}} < {{p}_{{b,n,c}}}$. Таким образом, с ростом n монотонность ${{p}_{{b,n,c}}}$ (как функции от b) меняется.
3. НОВЫЕ РЕЗУЛЬТАТЫ
Нам удалось решить задачу, поставленную Джогдео и Самуэльсом о монотонности ${{z}_{{b,n}}}$ по $b$.
Теорема 2. Пусть $\varepsilon > 0$. Существует такое ${{n}_{0}}$, что при всех $n \geqslant {{n}_{0}}$ справедливо следующее.
1. Если $n - (1 + \varepsilon )\sqrt {\frac{{77}}{{360}}n} > b > (1 + \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, то ${{z}_{{b + 1,n}}} > {{z}_{{b,n}}}$;
2. Если либо $b > n - (1 - \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, либо b < < $(1 - \varepsilon )\sqrt {\frac{{77}}{{360}}n} $, то ${{z}_{{b + 1,n}}} < {{z}_{{b,n}}}$.
Кроме того, мы исследовали функцию ${{p}_{{b,n,c}}}$ на монотонность по b.
Теорема 3. Справедливы следующие утверждения:
1. Если $n \geqslant 3b + 2$, то ${{p}_{{b + 1,n,0}}} > {{p}_{{b,n,0}}}$. Если $n \leqslant 3b + 1$, то ${{p}_{{b + 1,n,0}}} < {{p}_{{b,n,0}}}$;
2. При всех $1 \leqslant b < n$ справедливо ${{p}_{{b + 1,n,1}}} > {{p}_{{b,n,1}}}$;
3. Если $n \geqslant 3b + 2$ и $c \in (0,1)$, то ${{p}_{{b + 1,n,c}}} > {{p}_{{b,n,c}}}$.
К сожалению, исчерпывающий результат удалось получить лишь для c = 0 и c = 1. Тем не менее мы нашли асимптотическое значение порога, после которого меняется монотонность.
Теорема 4. Для всех положительных δ, $\varepsilon $, достаточно больших $n$ и целых $b \in (\varepsilon n,n)$ справедливо следующее:
1. Если $b < \frac{{n(1 - \delta )}}{{3(1 - c)}}$, то ${{p}_{{b + 1,n}}} > {{p}_{{b,n}}}$;
2. Если $b > \frac{{n(1 + \delta )}}{{3(1 - c)}}$, то ${{p}_{{b + 1,n}}} < {{p}_{{b,n}}}$.
Заметим, что из теоремы 3 вытекает следствие в задаче о малых отклонениях при $c = 1$. Пусть $\alpha \in (0,\;1)$, $\beta > 1$. Пусть b – целое число такое, что $b < \frac{{n + 1 - n\alpha }}{{\beta - \alpha }} \leqslant b + 1$. Тогда P(ξ1 + ... + ξn < < $n + 1) \geqslant {{p}_{{b,n,1}}}$, где ${{\xi }_{1}},\; \ldots ,\;{{\xi }_{n}}$ – независимые одинаково распределенные случайные величины со средним 1, и равенство выполняется тогда и только тогда, когда $\alpha = 0$ и $\frac{{n + 1}}{\beta } = b + 1$. Аналогичные утверждения можно было бы сформулировать для любого $c \in (0,\;1)$, если бы удалось асимптотический результат в теореме 4 сделать точным.
4. ${\text{B}}$-ФУНКЦИЯ
Напомним, что ${\text{B}}(x,y) = \int\limits_0^1 {{{t}^{{x - 1}}}} {{(1 - t)}^{{y - 1}}}$. Доказательства приведенных в предыдущем разделе утверждений опираются на следующие полученные нами удобные выражения для ${{p}_{{b + 1,n,c}}} - {{p}_{{b,n,c}}}$ и ${{z}_{{b,n}}}$.
Утверждение 1. Для всех натуральных $b \leqslant n$ и $c \in [0,\;1]$ справедливы равенства
Анализ этих выражений сводится к исследованию поведения функции $g(z) = (1 - z{{)}^{{b - 1}}}{{z}^{{n - b}}}$ на $\left[ {1 - \frac{{b + 1}}{{n + c}},1 - \frac{b}{{n + c}}} \right]$. Ее поведение удается исследовать, используя формулу Тейлора (достаточно разложить до пятого члена) с остаточным членом в форме Лагранжа и следующее удобное представление производных от функции g:
Список литературы
Choi K.P. On the medians of Gamma distributions and an equation of Ramanujan // Proc. Amer. Math. Soc. 1994. V. 121. № 1. P. 245–251.
Ramanujan S. Question 294 // Indian Math. Soc. 1911. V. 3. P. 151–152.
Szegö G. Über einige von S. Ramanujan gestellte Aufgaben // J. Lond. Math. Soc. 1928. V. 3. P. 225–232.
Watson G.N. Theorems stated by Ramanujan (V): approximations connected with ${{e}^{x}}$ // Proc. Lond. Math. Soc. 1929. V. 29. P. 293–308.
Flajolet P., Grabner P.J., Kirschenhofer P., Prodinger H. On Ramanujan’s $Q$-function // J. Comput. Appl. Math. 1995. V. 58. P. 103–116.
Alm S.E. Monotonicity of the difference between median and mean of gamma distributions and of a related Ramanujan sequence // Bernoulli. 2003. V. 9. P. 351–371.
Alzer H. On Ramanujan’s inequalities for exp(k) // J. Lond. Math. Soc. 2004. V. 69. P. 639–656.
Hamza K. The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions // Statist. Probab. Lett. 1995. V. 23. P. 21–25.
Jogdeo K., Samuels S.M. Monotone convergence of binomial probabilities and a generalization of Ramanujan’s equation // Ann. Math. Statist. 1968. V. 39. № 4. P. 1191–1195.
Samuels S.M. On a Chebyshev-type inequality for sums of independent random variables // The Ann. of Math. Stat. 1966. V. 37. P. 248–259.
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления