Автоматика и телемеханика, № 10, 2019
© 2019 г. А. КАРПАНТЬЕ, д-р (alexandra.carpentier@ovgu.de)
(Магдебургский университет, Германия),
О. КОЛЬЕ, д-р (olivier.collier@u-paris10.fr)
(Modal’X, Университет Париж-Нантер и CREST, Франция),
Л. КОМЕНЖ, д-р (comminges@ceremade.dauphine.fr)
(CEREMADE, Университет Париж-Дофин и CREST, Франция),
А.Б. ЦЫБАКОВ, д-р физ.-мат. наук (alexandre.tsybakov@ensae.fr)
(CREST, ENSAE, Париж, Франция),
Ю. ВАНГ (yuhaow@mit.edu)
(LIDS-IDSS, MIT, Кембридж, Массачусетс, США)
МИНИМАКСНАЯ ТОЧНОСТЬ ПРОВЕРКИ ГИПОТЕЗ В
РАЗРЕЖЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ1
Рассматривается задача проверки гипотезы о том, что параметр моде-
ли линейной регрессии равен нулю против s-разреженной альтернативы,
отделенной от нуля в2-расстоянии. Показывается, что в модели гауссов-
ской линейной регрессии с p < n, где p — размерность параметра, а n
размер вырки, неасимптотическая минимаксная скорость тестирования
имеет вид
(s/n) log(1 +
√p/s). Также показывается, что это минимакс-
ная скорость оценивания2-нормы параметра регрессии.
Ключевые слова: линейная регрессия, разреженность, обнаружение сиг-
нала.
DOI: 10.1134/S0005231019100040
1. Введение
Настоящая работа посвящена задаче проверки гипотез о параметре моде-
ли линейной регрессии при разреженных альтернативах. Эта задача имеет
различные приложения в генетике, передаче и обнаружении сигналов, сжа-
тии данных. Подробное описание этих приложений можно найти, например,
в [6]. Важную роль играет поиск оптимальных методов проверки таких ги-
потез, причем один из естественных подходов состоит в том, чтобы понятие
оптимальности определять в минимаксном смысле. Минимаксная постанов-
ка задачи проверки гипотез при разреженных альтернативах была впервые
изучена в [1, 2], где рассматривалась модель гауссовской последовательности.
В этих работах применялся асимптотический подход в предположении, что
1 Работа А. Карпантье поддержана грантами Emmy Noether grant MuSyAD CA 1488/1-1,
GK 2297 MathCoRe on Mathematical Complexity Reduction 314838170, GRK 2297 MathCoRe,
SFB 1294 Data Assimilation “The seamless integration of data and models”, Project A03, фи-
нансируемыми фондом Deutsche Foschungsgemeinschaft (DFG) и французско-немецким уни-
верситетом в рамках программы докторского колледжа Потсдам-Тулуза CDFA 01-18. Ра-
бота О. Колье выполнена в рамках проекта Labex MME-DII (ANR11-LBX-0023-01). Рабо-
та А.Б. Цыбакова поддержана институтом GENES и грантами IPANEMA (ANR-13-BSH1-
0004-02) и Labex Ecodec (ANR-11-LABEX-0047).
78
индекс разреженности зависит от размерности степенным образом. Неасимп-
тотическая постановка для модели гауссовской последовательности была рас-
смотрена в [3], где границы для минимаксной скорости тестирования были
установлены с точностью до логарифмического множителя. Наконец, точная
неасимптотическая минимаксная скорость тестирования для модели гауссов-
ской последовательности была получена в [4]. В настоящей работе результа-
ты [4] обобщаются на линейную регрессионную модель с гауссовским шумом.
Заметим, что задача минимаксного тестирования для линейной регрессии при
разреженных альтернативах уже изучалась в [5-7]. А именно, в [5, 6] рассмат-
ривалась асимптотическая постановка при дополнительных предположениях
о параметрах задачи, а в [7] были установлены неасимптотические границы
с точностью до логарифмического множителя, аналогичные [3]. Цель данной
работы состоит в том, чтобы найти неасимптотическую минимаксную ско-
рость тестирования в модели гауссовской линейной регрессии без каких-либо
специфических предположений о параметрах задачи. Здесь дается ответ на
этот вопрос в случае, когда p < n, где p — размерность, а n — размер выборки.
Рассмотрим модель
(1)
Y =+σξ,
где σ > 0, ξ ∈ Rn — векторный гауссовский белый шум, т.е. ξ ∼ N (0, In), In
единичная матрица размера n×n, X — матрица размера n×p со случайными
элементами и θ ∈ Rp — неизвестный параметр. Далее везде предполагается,
что X не зависит от ξ.
Ниже будут использованы следующие обозначения. Для u = (u1, . . . , up)
Rp через ∥ · ∥2 обозначим2-норму, т.е.
∥u∥22 =
u2i,
i=1
и пусть ∥ · ∥0 обозначает0-полунорму, т.е.
∥u∥0 =
1{ui=0},
i=1
где 1{·} — индикаторная функция. Обозначим через 〈u, v〉 = uTv скаляр-
ное произведение векторов u ∈ Rp и v ∈ Rp, а через λmin(M) и tr[M] ми-
нимальное собственное значение и след матрицы M ∈ Rp×p. Для целого
s ∈ {1,...,p} рассмотрим множество B0(s) всех s-разреженных векторов в
пространстве Rp:
B0(s) := {u ∈ Rp : ∥u∥0 s}.
Рассмотрим следующую задачу проверки гипотез по наблюдениям (X, Y ):
(2)
H0 : θ = 0 против альтернативы H1
: θ ∈ Θ(s,τ),
79
где
Θ(s, τ) = {θ ∈ B0(s) : ∥θ∥2 τ}
для некоторых s ∈ {1, . . . , p} и τ > 0. Пусть Δ = Δ(X, Y ) — статистика со
значениями в {0, 1}. Определим риск теста, основанного на Δ, как сумму
ошибки первого рода и максимальной ошибки второго рода:
P0(Δ = 1) + sup Pθ(Δ = 0),
θ∈Θ(s,τ)
где Pθ обозначает совместное распределение пары (X, Y ), удовлетворяю-
щей (1). Наименьшее возможное значение этого риска равно минимаксному
риску
{
}
Rs,τ := inf
P0(Δ = 1) + sup Pθ(Δ = 0)
,
Δ
θ∈Θ(s,τ)
где нижняя грань inf берется по всем {0, 1}-значным статистикам Δ. Опре-
делим минимаксную скорость тестирования для класса B0(s) относительно
2-расстояния как значение λ > 0, для которого выполняются следующие два
свойства:
(i) (верхняя граница) для любого ε ∈ (0, 1) существует Aε > 0, не зависящее
от p, n, s, σ, такое что для всех A > Aε
(3)
Rs,Aλ
ε,
(ii) (нижняя граница) для любого ε ∈ (0, 1) существует aε > 0, не зависящее
от p, n, s, σ, такое что для всех 0 < A < aε
(4)
Rs,Aλ
1 - ε.
Заметим, что определенная таким образом скорость λ неасимптотическая, и
поэтому данное определение отличается от классического асимптотическо-
го определения минимаксной скорости тестирования, которое можно найти,
например, в [8]. В [4] показано, что когда X — единичная матрица и p = n
(что соответствует модели гауссовской последовательности), неасимптотиче-
ская минимаксная скорость тестирования на классе B0(s) по отношению к
2-расстоянию имеет следующий вид:
{
σ
s log(1 + p/s2), если s <
√p,
(5)
λ=
σp1/4,
если s
√p.
Для модели регрессии со случайным X, удовлетворяющей некоторым силь-
ным предположениям, асимптотическая минимаксная скорость тестирования
при n, p и s стремящимся к так, что s = pa для некоторого 0 < a < 1, изуче-
на в [5]. В частности, в [5] показано, что для этой конфигурации параметров
80
и при условии, что матрица X имеет независимые одинаково распределен-
ные (н.о.р.) стандартные нормальные компоненты, асимптотическая скорость
имеет вид
(√
)
1/4
s log(p)
p
(6)
λ = σ min
,n-1/4,
n
√n
Аналогичный результат для несколько иначе определенной альтернативы H1
получен в [6].
Ниже будет показано, что без каких-либо специфических ограничений на
параметры n, p и s неасимптотическая нижняя граница для минимаксной
скорости тестирования имеет вид
(√
)
1/4
s log(2 + p/s2)
p
(7)
λ = σ min
,n-1/4,
,
n
√n
какова бы ни была матрица X с изотропным распределением и независимы-
ми субгауссовскими элементами (определения изотропности и субгауссовости
распределения даны в разделе 3). Кроме того, будет показано, что верхняя
граница совпадает по порядку с нижней в случае, когда X — матрица с н.о.р.
стандартными гауссовскими элементами и p < n. Заметим, что при p < n вы-
ражение (7) принимает вид
(√
)
1/4
s log(2 + p/s2)
p
(8)
λ = σ min
,
n
√n
Также полезно отметить, что, поскольку для s
√p функция s → s log(2 +
+p/s2) возрастает и удовлетворяет неравенству log(2+p/s2) 2log(1+p/s2),
скорость (8) можно эквивалентным образом (с точностью до числового по-
стоянного множителя) записать в виде
s log(1 + p/s2)
σ
, если s <
√p,
n
(9)
λ=
p1/4
σ
если s
√p.
√n,
Это выражение аналогично (5). Наконец, заметим, что скорость может быть
записана в следующей более компактной форме:
(√
)
1/4
s log(2 + p/s2)
p
s log(1 +
√p/s)
(10)
σ min
,
≍σ
,
n
√n
n
где обозначает эквивалентность с точностью до числового постоянного мно-
жителя.
81
2. Верхние границы для минимаксных скоростей
В этом разделе предполагается, что p < n и X — матрица с н.о.р. стандарт-
ными гауссовскими элементами, и устанавливается верхняя граница (9) для
минимаксной скорости тестирования. Для этого используется связь между
проверкой гипотез и оценкой функционалов. Сначала будет введена оцен-
каQ квадратичного функционала ∥θ∥22 и установлена верхняя граница для
его риска. Затем из этого результата будет выведена верхняя граница для
риска оценкиN нормы ∥θ∥2, определяемой следующим образом:
N=max( Q,0).
Наконец, используя
N как статистику критерия, получим верхнюю оценку
минимаксной скорости тестирования.
Введем обозначение
(
)
αs = E
Z2|Z2 > 2log(1 + p/s2)
,
где Z — стандартная нормальная величина, и положим
{
}
yi =
(XTX)-1XTY
,
i
где
{(XTX)-1XTY }i
i-я компонента оценки наименьших квадратов
(XTX)-1XTY . Заметим, что обратная матрица (XTX)-1 существует почти
наверное, так как в этом разделе предполагается, что X является матрицей
с н.о.р. стандартными гауссовскими элементами и p < n, так что X почти
наверное имеет полный ранг. Рассмотрим следующую оценку квадратичного
функционала ∥θ∥22 :
y2i - σ2tr[(XTX)-1],
если s
√p,
i=1
Q :=
[
]
y2i - σ2(XTX)-1iiαs
1{y2
√p.
>2σ2(XTX)-1ii log(1+p/s2)},еслиs<
i
i=1
Здесь и далее (XTX)-1ij обозначает (i, j)-й элемент матрицы (XTX)-1.
Для любых целых чисел n, p, s таких, что s p, положим
s log(1 + p/s2)
, если s <
√p,
n
ψ(s, p) =
1/2
p
,
если s
√p.
n
Теорема 1. Пусть n,p,s — целые числа такие, что s p, n 9 и
p min(γn,n - 8) для некоторой константы 0 < γ < 1. Пусть r > 0, σ > 0.
Предположим, что все элементы матрицы X — н.о.р. стандартные гаус-
совские случайные величины. Тогда существует константа c > 0, завися-
щая только от γ, такая что
(
)
[
]
r2
sup
Eθ
(Q - ∥θ∥22)2 c σ2
+ σ4ψ2(s,p)
θ:∥θ∥0s,∥θ∥2r
n
82
Доказательство теоремы 1 дано в Приложении.
Рассуждая точно так же, как в доказательстве теоремы 8 в [4], из теоре-
мы 1 выводим следующую верхнюю оценку квадратичного риска оценкиN.
Теорема 2. Пусть выполнены условия теоремы 1. Тогда существует
константа c > 0, зависящая только от γ, такая что
[
]
sup Eθ
N - ∥θ∥2)2
cσ2ψ(s,p).
θ∈B0(s)
Из теоремы 2 следует, что для теста Δ = 1{ˆN>Aλ/2}, где λ = σ
ψ(s, p)
(т.е. то же значение λ, что и в (9)), справедливы неравенства
P0 = 1) + sup Pθ = 0)
θ∈Θ(s,Aλ)
≤P0
N >Aλ/2)+ sup Pθ
N - ∥θ∥2-Aλ/2)
θ∈B0(s)
Eθ[
N - ∥θ∥2)2]
2
sup
CA-2,
θ∈B0(s)
(A/2)2λ2
где C > 0 — некоторая константа. Используя это замечание и выбирая Aε =
= (C)1/2, получаем верхнюю оценку (i), определенную в предыдущем раз-
деле. Этот вывод сформулирован в следующей теореме.
Теорема 3. Пусть выполнены условия теоремы 1 и пусть λ определя-
ется через (9). Тогда для любого ε ∈ (0,1) существует Aε > 0, зависящее
только от ε и γ, такое что
Rs,Aλ ε
для всех A > Aε.
3. Нижние границы для минимаксных скоростей
В этом разделе предполагается, что распределение матрицы X изотроп-
но и имеет независимые σX -субгауссовские строки для некоторого σX > 0.
Изотропия X означает, что EX (XTX/n) = Ip, где EX обозначает математи-
ческое ожидание по распределению PX матрицы X.
Определение 1. Пусть b > 0. Вещественнозначная случайная величи-
на ζ называется b-субгауссовской, если
E exp() exp(b2t2/2),
∀t ∈ R.
Случайный вектор η со значениями в Rd называется b-субгауссовским, если
все скалярные произведения 〈η, v〉 с векторами v ∈ Rd, такими что ∥v∥2 = 1,
являются b-субгауссовскими случайными величинами.
Следующая теорема о нижней границе является неасимптотической и она
справедлива без ограничений на параметры n, p, s за исключением неизбеж-
ного условия s p.
83
Теорема 4. Пусть ε ∈ (0,1), σ > 0 и пусть целые n,p,s таковы, что
s p. Предположим, что распределение матрицы X изотропно и X имеет
независимые σX-субгауссовские строки при некотором σX > 0. Тогда суще-
ствует aε > 0, зависящее только от ε, и σX, такое что для
(√
)
1/4
s log(2 + p/s2)
p
(11)
τ = min
,n-1/4,
n
√n
с произвольным A, удовлетворяющим 0 < A < aε, имеем
Rs,τ 1 - ε.
Доказательство теоремы 4 дано в Приложении.
Следующий результат является непосредственным следствием теорем 3
и 4.
Следствие 1. Пусть выполнены условия теоремы 1. Тогда минимакс-
ная скорость тестирования на классе B0(s) по отношению к ℓ2-расстоянию
задается через (8).
Кроме того, из теоремы 4 получаем следующую нижнюю границу мини-
максного риска оценки2-нормы ∥θ∥2.
Теорема 5. Пусть выполнены условия теоремы 4 и пусть λ определено
в (7). Тогда существует константа c > 0, зависящая только от σX , такая
что
[
]
inf sup Eθ
T - ∥θ∥2)2
cλ2,
T θ∈B0(s)
где infˆT обозначает инфимум по всем оценкам.
Результат теоремы 5 вытекает из теоремы 4, если заметить, что для τ в (11)
иλв(7) имеем τ =идля любой оценк
T справедливы неравенства
[
]
[
]
[
]
1
sup
Eθ
T - ∥θ∥2)2
E0
T2] + sup Eθ
T - ∥θ∥2)2
θ∈B0(s)
2
θ∈Θ(s,τ)
[
]
2
τ
P0
T >τ/2)+ sup Pθ
Tτ/2)
8
θ∈Θ(s,τ)
2
()
Rs,τ.
8
Следствие 2. Пусть выполнены условия теоремы 1 и пусть λ опреде-
лено в (8). Тогда минимаксная скорость оценки нормы ∥θ∥2 относительно
среднеквадратичного риска для класса B0(s) равна λ2, т.е.
[
]
cλ2 inf sup Eθ
T - ∥θ∥2)2
cλ2,
T θ∈B0(s)
где c > 0 — числовая константа, а c > 0 — константа, зависящая только
от γ.
84
Это утверждение является непосредственным следствием теорем 2 и 5.
Замечание 1. Из доказательств, приведенных в Приложении, видно,
что результаты этого раздела остаются в силе, если заменить везде0-шар
B0(s) на0-сферуB0(s) = {u ∈ Rp : ∥u∥0 = s}.
ПРИЛОЖЕНИЕ
П.1. Вспомогательные леммы для доказательства теоремы 1
Приведем два основных вспомогательных результата, используемых в до-
казательстве теоремы 1. Первый из них позволяет оценить математическое
ожидание от отрицательных степеней минимального собственного значения
эмпирической матрицы ковариаций. Второй используется при оценке ошибки
идентификации ненулевых компонент в разреженной постановке. Для этого
нужны точные границы для корреляций между урезанными вариантами двух
центрированных коррелированных случайных величин с распределением χ21.
Напомним сначала два общих факта, которые будут использоваться для по-
лучения первого результата.
В дальнейшем будем обозначать одним и тем же символом C различные
положительные константы, встречающиеся в выкладках.
Лемма 1 ([9], см. также [10]). Пусть матрица X удовлетворяет усло-
виям теоремы 1 и пусть λmin(Σ) — наименьшее собственное значение вы-
борочной ковариационной матрицыΣ =1nXTX. Тогда для любого t > 0 с ве-
роятностью не менее 1 - 2exp(-t2/2) имеем
p
t
p
t
1-
-
+
n
√nλmin(Σ)1+
n
√n.
Лемма 2 ([11, лемма A4], см. также [12, лемма 4.14]). Пусть 1 p n.
Пусть Ri — i-й столбец матрицы X ∈ Rn×p и R-i — линейная оболочка
векторов {Rj : j = i}. Если X — матрица полного ранга, то
(XTX)-1ii = dist(Ri, R-i)-2,
где dist(Ri, R-i) — евклидово расстояние вектора Ri до пространства R-i.
Лемма 3. Пусть n 9 и p min(γn,n - 8) для некоторой постоян-
ной γ такой, что 0 < γ < 1. Предположим, что все компоненты матри-
цы X ∈ Rn×p — н.о.р. стандартные гауссовские случайные величины. Тогда
существует константа c > 0, зависящая только от γ, такая что
[
]
(Π.1)
E λ-2min(Σ)
c.
Доказательство. Положим β =
√γ. Из неравенства p γn и леммы 1
имеем
(√
)
(√
)
p
t
P λmin(Σ) < 1 - β -√
≤ P λmin(Σ) < 1 -
-
n
n
√n
2exp(-t2/2).
85
Полагая здесь t =
√n(1 - β)/2, приходим к неравенству
(
)
(
)
2
(1)
n(1 - β)2
P λmin(Σ) <
2exp
-
2
8
Используя это неравенство, получим
(
)
[
]
√ [
]
(1)-4
n(1 - β)2
(Π.2)
E λ-2min(Σ)
+ E λ-4min(Σ)
2 exp
-
2
16
Оценим теперь сверху математическое ожидание E[λ-4min(Σ)]. Ясно, что
[
]
(Π.3)
λ-1min(Σ) tr
Σ-1 .
Из леммы 2 следует, что почти наверное
[
]4
(
)
tr[Σ-1]
4 =n4
dist(Ri, R-i)-2
n4p3
dist(Ri, R-i)-8.
i=1
i=1
Поскольку случайные величины dist(Ri, R-i) одинаково распределены и p
n, имеем
]
[(
)4
[
]
(Π.4)
E tr[Σ-1]
n8E
dist(R1, R-1)-8
Остается только оценить сверху E[dist(R1, R-1)-8]. Если S — подпростран-
ство Rn размерности p - 1, то случайная величина dist(R1, S)2 имеет χ2-рас-
пределение χ2n-p+1 с n - p + 1 степенями свободы. Следовательно, так как
R-1 — линейная оболочка случайных векторов, не зависящих от R1, и про-
странство R-1 — почти наверное (p - 1)-мерное, то
[
]
1
E[dist(R1, R-1)-8] = E
=
(χ2n-p+1)4
1
1
(Π.5)
=
(n - p - 1)(n - p - 3)(n - p - 5)(n - p - 7)
105
Объединяя (Π.2)-(Π.5), получим
(
)
[
]
(1)-4
n8
n(1 - β)2
E λ-2min(Σ)
+
2 exp
-
,
2
105
16
что доказывает лемму.
Теперь перейдем ко второму вопросу данного раздела, т.е. к оценке сверху
корреляций. Здесь понадобится следующая лемма о хвостах стандартного
нормального распределения.
86
Лемма 4. Для η ∼ N(0,1) и всякого x > 0 имеем
4
exp(-x2/2) ≤ P(|η| > x)
2π(x +
x2 + 4)
(Π.6)
4
exp(-x2/2),
2π(x +
x2 + 2)
(
)
2
2
(Π.7)
E[η21{|η|>x}]
x+
exp(-x2
/2),
π
x
(
)
2
1
(Π.8)
E[η41{|η|>x}]
x3 + 3x +
exp(-x2
/2).
π
x
Более того, если x 1, то
(Π.9)
x2 < E[η2 | |η| > x] 5x2.
Неравенства (Π.6)-(Π.8) даны, например, в [4, лемма 4], а (Π.9) легко вы-
текает из (Π.6) и (Π.7).
Лемма 5. Пусть (η,ζ) — гауссовский вектор со средним 0 и матрицей
(
)
1
ρ
ковариаций Γ =
, 0 < ρ < 1. Положим α = E[η2 | |η| > x]. Тогда суще-
ρ
1
ствует числовая постоянная C > 0 такая, что
[
]
E
(η2 - α)(ζ2 - α)1{|η|>x}1{|ζ|>x}
2x4 exp(-x2/2)
для всякого x 1.
Доказательство. Из (Π.9) получаем, что α 5x2. Таким образом, ис-
пользуя (Π.8) и условие, что x 1, находим
[
]
[
]
E
(ζ2 - α)21{|ζ|>x}
≤E
(ζ4 + α2)1{|ζ|>x}
(Π.10)
[
]
(
)
26E
ζ41{|ζ|>x}
Cx3 exp
-x2/2
Следовательно,
[
]
E
(η2 - α)(ζ2 - α)1{|η|>x}1{|ζ|>x}
[
]
[
]
(
)
≤E
(η2 - α)21{|η|>x}
+E
(ζ2 - α)21{|ζ|>x}
Cx3 exp
-x2/2
Это доказывает лемму для ρ 1/
5.
Рассмотрим теперь случай, когда 0 < ρ < 1/
5. Заметим, что, поскольку
α 5x2, для 0 < ρ < 1/
5 также выполняется неравенство
x
ρ<
√α.
87
В силу симметричности распределения (η, ζ) имеем
[
]
E (η2 - α)(ζ2
- α)1{|η|>x}1{|ζ|>x}
=
(Π.11)
[
]
= 2E (η2 - α)(ζ2
- α)1{|η|>x}1{ζ>x} .
= (ρζ +
= означа-
ет равенство по распределению и Z — стандартная гауссовская случайная
величина, не зависящая от ζ. Таким образом,
[
]
[
]
E (η2 - α)(ζ2
− α)1{|η|>x}1{ζ>x}
= ρ2E (ζ2 - α)2
1{|ρζ+12Z|>x}1{ζ>x}+
[
]
(Π.12)
+ 2ρ
1 - ρ2E ζZ(ζ2
- α)1{|ρζ+12Z|>x}1{ζ>x}+
[
]
+ (1 - ρ2)E (Z2 - α)(ζ2
- α)1{|ρζ+12Z|>x}1{ζ>x}.
Оценим сверху каждое из трех слагаемых в правой части (Π.12). Для первого
слагаемого, используя (Π.10), получаем оценку
[
]
ρ2E (ζ2 - α)21
1{ζ>x}
{|ρζ+
12Z|>x}
(
)
(Π.13)
[
]
x2
26ρ2E ζ41{ζ>x}
2x3 exp
-
2
Чтобы оценить второе слагаемое, запишем сначала
[
]
[
]
(Π.14)
E ζZ(ζ2
− α)1
1{ζ>x}
= E ζ(ζ2
- α)g(ζ)1{ζ>x} ,
{|ρζ+
12Z|>x}
где g(ζ) := E[Z1
| ζ]. Непосредственно проверяется, что
{|ρζ+
12Z|>x}
(
)
(
)
(x - ρζ)2
(x + ρζ)2
g(ζ) = exp
-
- exp
-
2(1 - ρ2)
2(1 - ρ2)
Таким образом, g(ζ) положительна при ζ > x. Следовательно, имеем
[
]
[
]
(Π.15)
E ζ(ζ2
− α)g(ζ)1{ζ>x}
≤E ζ3g(ζ)1{ζ>x} .
Кроме того,
(
)(
(
))
(x - ρζ)2
2xρζ
g(ζ) = exp
-
1 - exp
-
2(1 - ρ2)
12
(Π.16)
(
)
2xρζ
2xρζ
1 - exp
-
12
12
88
Объединяя (Π.14)-(Π.16) с (Π.8) и учитывая, что ρ12 , получаем
(
)
[
]
x2
(Π.17)
2ρ
1 - ρ2E ζZ(ζ2
2x4 exp -
− α)1{|ρζ+12Z|>x}1{ζ>x}
2
Рассмотрим теперь третье слагаемое правой части (Π.12). Докажем, что
[
]
(Π.18)
E (Z2 - α)(ζ2
- α)1
1{ζ>x}
0.
{|ρζ+
12Z|>x}
Имеем
[
]
[
]
E (Z2 - α)(ζ2
= E (ζ2
- α)f(ζ)1{ζ>x} ,
− α)1{|ρζ+12Z|>x}1{ζ>x}
где
[
]
f (ζ) := E (Z2 - α)1
=
{|ρζ+
12Z|>x}
-√
(
)
12
(
)
z2
z2
=
(z2 - α) exp
-
dz +
(z2 - α) exp
-
dz.
2
2
−∞
12
Заметим, что x <
√α в силу (Π.9). Чтобы доказать (Π.18), достаточно пока-
зать, что
(Π.19)
∀ζ ∈ [x,
√α],
f (ζ) f(
α)
и
(Π.20)
∀ζ ∈[√α,∞),
f (ζ) f(
α).
Действительно, предположим, что (Π.19) и (Π.20) выполнены. Тогда имеем
[
]
[
]
E (ζ2
− α)f(ζ)1{x<ζ√α}
≤ E (ζ2 - α)f(
α)1{x<ζ√α}
=
[
]
[
]
= -E (ζ2 - α)f(
α)1{ζ>√α}
-E (ζ2
- α)f(ζ)1{ζ>√α} ,
где равенство следует из того, что
[
]
[
]
1
E (ζ2
− α)1{ζ>x}
=
E (ζ2
- α)1{|ζ|>x}
=0
2
ввиду симметричности нормального распределения и определения α. Таким
образом, чтобы закончить доказательство леммы, остается показать (Π.19)
и (Π.20). Сначала установим (Π.19), для чего достаточно показать, что
f(ζ) < 0 при ζ ∈ [x,
√α]. Поскольку 0 < ρ < x/√α и x <√α, имеем
(x - ρy)2
(Π.21)
< α при всех y ∈ [x,
α].
12
89
Используя (Π.21), для всех ζ ∈ [x,
√α] будем иметь
(
(
)2)((
)
))
2
1
x + ρζ
(x-ρζ)
( 2ρxζ)
((x + ρζ)2
f(ζ)
exp
-
exp
-
12
2
12
12
12
12
(
)
2
)
))
ρ
x + ρζ
(((x - ρζ)2
((x + ρζ)2
exp-1
-α -
=
12
2
12
12
12
(
)
2
ρ
x + ρζ
=-
exp-1
4xρζ
< 0.
12
2
12
12
Это влечет (Π.19). Наконец, докажем (Π.20). Для этого достаточно устано-
вить следующие три факта:
(i) f непрерывна и f(√α) < 0;
(ii) уравнение f(y) = 0 имеет не более одного решения в интервале [√α, +);
(iii) f() = limy→∞ f(y) f(√α).
Свойство (i) уже доказано выше. Чтобы доказать (ii), прежде всего заме-
тим, что решение уравненияddy f(y) = 0 также является решением уравнения
h(y) = 0, где
(
)(
(
)
)
2
(x - ρy)
2ρxy
4ρxy
h(y) :=
- α exp
-1
-
12
12
12
Пусть теперь y1 и y2 — решения квадратного уравнения(x-ρy)2
= α:
12
x-
α(1 - ρ2)
x+
α(1 - ρ2)
y1 =
и y2 =
ρ
ρ
В силу (Π.21) имеем y1 <
√α < y2. Следовательно, h(y) < 0 на интервале
[√α, y2]. Кроме того, на интервале (y2, +) функция h строго выпукла и
h(y2) < 0. Отсюда следует, что h принимает нулевое значение только в одной
точке интервала (y2, +). Следовательно, (ii) доказано.
Остается показать, что f(√α) f() =∞-∞(z2 - α) exp(-z2/2)dz. Пере-
писывая f(√α) в виде
x-ρ√α
12
(
)
z2
f(
α) = f() -
(z2 - α) exp
-
dz,
2
√α
-√ ρ
12
получаем, что неравенство f() f(√α) вытекает из (Π.21). Это доказы-
вает (iii) и, значит, (Π.20). Доказательство (Π.18) завершено. Лемма теперь
следует из (Π.11)-(Π.13), (Π.17) и (Π.18).
90
П.2. Доказательство теоремы 1
Рассмотрим отдельно случаи s
√p и s <√p.
Случай s
√p. Из (1) получаем, что почти наверное
(XTX)-1XTY = θ + ϵ,
где
ϵ= σ(XTX)-1XTξ.
Учитывая это, имеем
]
[(
)2
(
[
])2
Eθ
Q - ∥θ∥22
=Eθ
2θTϵ+ ∥ϵ∥22 - σ2tr
(XTX)-1
(Π.22)
(
)2
(
[
])2
8Eθ
θTϵ
+2Eθ
∥ϵ∥22 - σ2tr
(XTX)-1
Заметим, что при фиксированном X случайный вектор ϵ имеет нормальное
распределение со средним 0 и матрицей ковариаций σ2(XTX)-1. Следова-
тельно, при фиксированном X случайная величина θTϵ имеет нормальное
распределение со средним 0 и дисперсией σ2θT(XTX)-1θ. Таким образом,
(
)2
[
]
Eθ
θTϵ
σ2r2E
λ-1min(XTX)
. Значит, применяя лемму 3, имеем
(
)2
2
r
(Π.23)
Eθ
θTϵ
2
,
n
где C — постоянная, зависящая только от γ. Рассмотрим теперь второй член
в правой части (Π.22). Обозначим через λi, i = 1, . . . , p, собственные значения
матрицы (XTX)-1 и через ui, i = 1, . . . , p, соответствующие ортонормальные
собственные векторы. Положим vi =
√λiuTiXTξ. Имеем
(
)2
(
[
])
Eθ
∥ϵ∥22 - σ2tr
(XTX)-1
2 =σ4E
λi[v2i - 1]
i=1
При фиксированном X случайные величины v1, . . . , vp являются н.о.р. стан-
дартными гауссовскими. Используя этот факт и лемму 3, получаем
(
[
])2
Eθ
∥ϵ∥22 - σ2tr
(XTX)-1
=
(
)
(Π.24)
[
(
)]
σ4p
= 2σ4E
λ2
24E
λ-2min
XTX
C
,
i
n2
i=1
где C — постоянная, зависящая только от γ, Объединяя (Π.22)-(Π.24), полу-
чаем результат теоремы при s
√p.
91
Случай s <
√p. Положим S = {i : θi = 0}. Имеем
)2
(
)2
(∑
Eθ
Q-∥θ∥2
3Eθ
(y2i - σ2(XTX)-1iiαs - θ2i)
+
2
i∈S
)2
(∑[
]
(Π.25)
+3Eθ
y2i2(XTX)-1iiαs
1{y2
+
2σ2(XTX)-1ii log(1+p/s2)}
i
i∈S
2
∑[
]
+3Eθ
ϵ2i2(XTX)-1iiαs
1{y2
,
>2σ2(XTX)-1ii log(1+p/s2)}
i
i∈S
где ϵi обозначает i-ю компоненту ϵ. Оценим теперь сверху каждый из трех
членов в правой части (Π.25). Для оценки первого члена заметим, что
)2
(∑
Eθ
(y2i - σ2(XTX)-1iiαs - θ2i)
i∈S
(Π.26)
)2
)2
(∑
(∑
8Eθ
θiϵi
+ 2Eθ
(ϵ2i - σ2(XTX)-1iiαs)
i∈S
i∈S
Второе слагаемое в правой части (Π.26) удовлетворяет неравенству
)2
(∑
Eθ
(ϵ2i - σ2(XTX)-1iiαs)
i∈S
∑∑
(Π.27)
2σ4(α2s + 3)E
(XTX)-1ii(XTX)-1jj
i∈S j∈S
[
]
2σ4(α2s + 3)s2E
λ-2min(XTX)
Из (Π.9) получаем
(Π.28)
αs 10log(1 + p/s2
).
Используя (Π.26)-(Π.28) вместе с леммой 3 и (Π.23), находим, что
)2
(∑
(Π.29)
Eθ
(y2i - σ2(XTX)-1iiαs - θ2i)
4s2 log2(1 + p/s2)/n2,
i∈S
где константа C зависит только от γ.
Кроме того, нетрудно видеть, что второй член в правой части (Π.25), мень-
ше, с точностью до числового постоянного множителя, чем
∑∑
Eσ4
(XTX)-1ii(XTX)-1jj(α2s + 4 log2(1 + p/s2)).
i∈S j∈S
92
Действуя так же, как в (Π.27), и применяя лемму 3 и (Π.28), получаем
)2
(∑[
]
Eθ
y2i - σ2(XTX)-1iiαs
1{y2
2σ2(XTX)-1ii log(1+p/s2)}
(Π.30)
i
i∈S
4s2 log2(1 + p/s2)/n2,
где константа C зависит только от γ. Для третьего члена правой части (Π.25)
имеем
2
∑[
]
(Π.31)
Eθ
ϵ2i - σ2(XTX)-1iiαs
1{y2
=
>2σ2(XTX)-1ii log(1+p/s2)}
i
i∈S
∑∑ (
)
=σ4
E (XTX)-1ii(XTX)-1jj
ξ2i - αs)
ξ2
- αs)1{|˜ξ
1{|˜ξ
,
j
i|>x}
j|>x}
i∈S j∈S
где
ϵi
x=
2 log(1 + p/s2),
ξi =
σ2(XTX)-1
ii
Заметим, что E
ξ2i|X) = E
ξ2j|X) = 1 и при фиксированном X вектор
ξi
ξj)
R2 имеет гауссовское распределение с нулевым средним и ковариацией
(XTX)-1ij
ρij =
(XTX)-1
(XTX)-1
ii
jj
Используя лемму 5, получим, что существуют числовые константы C такие,
что
∑∑ (
)
E (XTX)-1ii(XTX)-1jj
ξ2i - αs)
ξ2
- αs)1{|˜ξ
1{|˜ξ
=
j
i|>x}
j|>x}
i∈S j∈S
∑∑ (
[
])
=
E (XTX)-1ii(XTX)-1jjE
ξ2i - αs)
ξ2j - αs)1{|˜ξ
1{|˜ξ
|X
i|>x}
j
|>x}
i∈S j∈S
∑ [
]
C E (XTX)-1ii(XTX)-1jj ρ2
x4 exp(-x2/2) =
ij
i,j=1
[
]
=CE
(XTX)-12F
x4 exp(-x2/2)
[
2
]s
CE
(XTX)-12
log2(1 + p/s2)
F p
[
]
CE
λ-2min(XTX)
s2 log2(1 + p/s2),
где(XTX)-1F — норма Фробениуса матрицы (XTX)-1. Наконец, лемма 3,
(Π.31) и последняя выкладка влекут, что существует постоянная C, завися-
93
щая только от γ, такая что
2
∑[
]
Eθ
ϵ2i - σ2(XTX)-1iiαs
1{y2
⎠ ≤
>2σ2(XTX)-1ii log(1+p/s2)}
i
(Π.32)
i∈S
σ4s2 log2(1 + p/s2)
C
n2
Доказательство завершается соединением неравенств (Π.25), (Π.29), (Π.30) и
(Π.32).
П.3. Вспомогательные леммы для доказательства теоремы 4
Напомним сначала некоторые общие факты о нижних границах для рис-
ков в задаче проверки гипотез. Пусть Θ — измеримое множество, не обяза-
тельно множество Θ(s, τ), и пусть μ — вероятностная мера на Θ. Рассмотрим
произвольное семейство вероятностных мер Pθ, индексированное параметром
θ ∈ Θ. Обозначим через Pμ смесь вероятностных мер
Pμ = Pθ μ().
Θ
Определим χ2-расхождение между двумя вероятностными мерами P и P как
χ2(P,P) = (dP/dP)2dP - 1,
если P ≪ P , и положим χ2(P, P ) = + в противном случае. Следующая
лемма играет ключевую роль в методе Ле Кама доказательства нижних гра-
ниц (см., например, [4, лемма 3]).
Лемма 6. Пусть μ — вероятностная мера на Θ и пусть {Pθ : θ ∈ Θ} —
семейство вероятностных мер на X , индексированных параметром θ ∈ Θ.
Тогда для любой вероятностной меры Q на X имеем
{
}
inf Q(Δ = 1) + sup Pθ(Δ = 0)
1 - χ2(Pμ,Q),
Δ
θ∈Θ
где нижняя грань inf берется по всем статистикам Δ со значениями в
{0, 1}.
Применяя лемму 6 с Q = P0, видим, что достаточно выбрать подходящую
меру μ и ограничить χ2(Pμ, P0) сверху величиной, строго меньшей 1, чтобы
получить искомую нижнюю границу для Rs,τ . Следующая лемма полезна
при оценке χ2(Pμ, P0).
Лемма 7. Пусть μ — вероятностная мера на Θ и пусть {Pθ : θ ∈ Θ} —
семейство вероятностных мер на X , индексированных параметром θ ∈ Θ.
94
Пусть Q — вероятностная мера на X такая, что Pθ ≪ Q для всех θ ∈ Θ.
Тогда
(∫
)
dPθdPθ
χ2
(Pμ, Q) = E(θ,θ)∼μ2
- 1.
dQ
Здесь E(θ,θ)∼μ2 обозначает математическое ожидание относительно рас-
пределения пары (θ,θ), где θ и θ — независимые случайные величины, каж-
дая из которых распределена в соответствии с μ.
Доказательство. Достаточно заметить, что
2
(dPμ)
χ2(Pμ,Q) =
- 1,
dQ
тогда как
(dPμ)2
dPθμ()Θ dPθ μ()
dPθdPθ
Θ
=
=
μ()μ()
dQ
dQ
dQ
Θ Θ
Найдем теперь выражение для χ2-расхождения в лемме 7, когда Pθ
вероятностное распределение, порожденное моделью (1) и Q = P0.
Лемма 8. Пусть Pθ — распределение (X,Y ), удовлетворяющее (1). То-
гда
χ2(Pμ,P0) = E(θ,θ)∼μ2 EX exp(〈Xθ,Xθ〉/σ2) - 1.
Доказательство. Применяем лемму 7 и замечаем, что для любых
(θ, θ) Θ × Θ имеют место равенства
dPθdPθ
=
dP0
(
)
1
1
=
EX exp
-
(∥y - Xθ∥22 + ∥y - Xθ22 - ∥y∥22) dy =
(2πσ)n/2
2σ2
Rn
(
)
1
1
=
EX exp -
(∥y∥22 - 2〈y, X(θ + θ)+ ∥X(θ + θ)22 - 2〈Xθ, Xθ) dy =
(2πσ)n/2
2σ2
Rn
(
)
1
=EXexp(〈Xθ,Xθ〉/σ2)
exp
-
∥y - X(θ + θ)2
2
dy =
(2πσ)n/2
2σ2
Rn
= EX exp(〈Xθ,Xθ〉/σ2).
Лемма 9. Пусть a ∈ R — постоянная и пусть W — случайная величина.
Тогда
E exp(W ) exp(a)1 + etp(t)dt ,
0
где p(t) = P (|W - a| t).
95
Доказательство. Имеем
E exp(W ) exp(a)E exp(|W - a|) =
= exp(a) P (exp(|W - a|) x) dx =
0
= exp(a)1 + P (exp(|W - a|) x) dx =
1
= exp(a)1 + etp(t)dt .
0
Лемма 10. Предположим, что матрица X имеет изотропное распреде-
ление с независимыми σX -субгауссовскими строками при некотором σX > 0.
Тогда для всех x > 0 и всех θ, θ Rp имеем
(
)
PX
|〈Xθ, Xθ〉 - n〈θ, θ〉| ∥θ∥2∥θ2x
6exp(-C1 min(x,x2/n)),
где константа C1 > 0 зависит только от σX.
Доказательство. Используя однородность, достаточно рассмотреть
случай, когда ∥θ∥2 = ∥θ2 = 1. Это и будет предполагаться далее в доказа-
тельстве. Тогда имеем
∥Xθ∥22 + ∥Xθ22 - ∥X(θ - θ)22
2 - ∥θ - θ22
〈Xθ, Xθ =
,
〈θ, θ =
,
2
2
что приводит к неравенству
(
1
1
1
1
Xθ,Xθ〉 - 〈θ,θ
Xθ∥22 - 1
22 - 1
≤
+
+
n〈
2
n∥
n∥
)
1
(Π.33)
+
∥X(θ - θ)22 - ∥θ - θ22
n
Третье слагаемое в правой части (Π.33) приводится перенормировкой к тому
же виду, что и первые два слагаемых. Учитывая это, для доказательства
леммы достаточно показать, что
(
)
1
(Π.34)
PX
Xθ∥22 -1
v
2exp(-C1 min(v,v2)n),
∀ v > 0,∥θ∥2
= 1,
≥
n∥
где константа C1 > 0 зависит только от σX .
Обозначим i-ю строку матрицы X через xi. Тогда
1
1
∥Xθ∥22 - 1 =
(Z2i - 1),
n
n
i=1
96
где Zi = xTiθ — независимые σX -субгауссовские случайные величины, та-
кие что E(Z2i) = 1 при i = 1, . . . , n. Следовательно, Z2i - 1, i = 1, . . . , n, —
независимые субэкспоненциальные случайные величины с нулевыми сред-
ними, и (Π.34) немедленно вытекает из неравенства Бернштейна для суб-
экспоненциальных случайных величин (ср., например, [10, следствие 5.17]).
Лемма 11. Предположим, что матрица X имеет изотропное распреде-
ление с независимыми σX -субгауссовскими строками при некотором σX > 0.
Тогда существует число u0 > 0, зависящее только от σX , такое что для
всех θ, θ с ∥θ∥2, ∥θ2 un-1/4 и всех u ∈ (0, u0) имеем
EX exp(〈Xθ,Xθ) exp(n〈θ,θ)(1 + C0u2),
где константа C0 > 0 зависит только от σX.
Доказательство. По лемме 10 для всех x > 0 с PX-вероятностью не
менее 1 - 6e-C1 min(x,x2/n) имеем
〈Xθ, Xθ〉 - n〈θ, θ≤∥θ∥2∥θ2x u2n-1/2x.
Следовательно, для всех t > 0 с PX -вероятностью не менее
√nt/u2,t2/u4)
1 - 6e-C1 min(
имеем
〈Xθ, Xθ〉 - n〈θ, θ≤t.
Отсюда и из леммы 9 вытекает, что для всех u u0 := (C1/2)1/2 выполнены
неравенства
nt/u2,t2/u4))dt⎠≤
EX exp(〈Xθ,Xθ) exp(n〈θ,θ)1 + 6 et-C1 min(
0
exp(n〈θ, θ)1 + 6 et(1-C1
n/u2)dt + 6 et-C1t2/u4 dt⎠ ≤
0
0
exp(n〈θ, θ)1 + 6 e-C1
nt/(2u2)dt + 6 e-t(C1t/u4-1)dt⎠ ≤
0
0
2
12u4
exp(n〈θ, θ)1 +12
+
e2u4/C1 + 6
e-t2C1/(2u4)dt⎠ ≤
C1
n
C1
2u4/C1
(
)
exp(n〈θ, θ)
1+C0u2
,
где использован тот факт, что C1
√n/u2 > 2 и константа C0 > 0 зависит толь-
ко от C1 и, следовательно, только от σX .
97
П.4. Доказательство теоремы 4
Пусть s — целое число, такое что 1 s p, и пусть τ > 0. Обозначим через
μτ равномерное распределение на множестве всех векторов в Rp, имеющих
в точности s ненулевых коэффициентов, каждый из которых равен τ/√s.
Заметим, что носитель меры μτ содержится в Θ(s, τ).
Возьмем теперь τ = τ(s, n, p), определенное в (11), и положим μ = μτ . В си-
лу лемм 6-8, чтобы доказать теорему 4, достаточно показать, что
(Π.35)
E(θ,θ)∼μ2
EX exp(〈Xθ,Xθ〉/σ2) 1 + oA
(1),
τ
где oA(1) стремится к нулю при A → 0.
Прежде чем доказывать (Π.35), введем некоторые упрощения. Во-первых,
заметим, что для τ, определенного в (11), левая часть (Π.35) не зависит
от σ. Таким образом, в дальнейшем будем полагать σ = 1 без потери общ-
ности. Далее заметим, что достаточно доказать теорему для случая s
√p.
Действительно, для s >
√p можно использовать включения Θ(s,τ(s,n,p))
Θ(s(s,n,p))Θ(s(s,n,p)), где s — наибольшее целое число, меньшее
или равное
√p. Поскольку
(
)
1/4
p
τ (s, n, p) min
,n-1/4
,
√n
а скорость (11) также имеет этот порядок для s >
√p, достаточно доказать
нижнюю оценку для s s и, следовательно, для s
√p. Принимая во внима-
ние эти упрощения, в дальнейшем будем считать без ограничения общности,
что s
√p, σ = 1 и
(√
)
s log(1 + p/s2)
(Π.36)
τ := A min
,n-1/4
n
Теперь докажем (Π.35) при этих предположениях. По лемме 11 для всех 0 <
A < u0 имеем
(Π.37)
E(θ,θ)∼μ2
EX exp(〈Xθ,Xθ) ≤ E(θ,θ)∼μ2
exp(n〈θ, θ)(1 + C0A2
).
τ
τ
Предположим, что A < 1. Рассуждая точно так же, как в доказательстве
леммы 1 в [4], находим
(Π.38) E(θ,θ)∼μ2
exp(n〈θ, θ) = E
exp2s-1
(θ,θ)∼μ2τ
1j=0}1′j=0}⎠ ≤
τ
j=1
(
)s
s
s
1-
+
exp(2s-1)
p
p
(
)A2)s
s
s(
p
1-
+
1+
p
p
s2
(
)s
A2
1+
exp(A2),
s
98
где было использовано неравенство (1 + x)A2 - 1 A2x, выполненное при
0 < A <1 и x > 0. Из (Π.37) и (Π.38) получим, что для всех 0 < A < min(1,u0)
имеет место неравенство
E(θ,θ)∼μ2
EX exp(〈Xθ,Xθ) exp(A2)(1 + C0A2)
τ
при некоторых u0 > 0 и C0 > 0, зависящих только от σX . Это завершает до-
казательство теоремы.
СПИСОК ЛИТЕРАТУРЫ
1.
Ingster Y.I. Some Problems of Hypothesis Testing Leading to Infinitely Divisible
Distributions // Math. Methods Statist. 1997. No. 6. P. 47-49.
2.
Donoho D.L., Jin J. Higher Criticism for Detecting Sparse Heterogeneous
Mixtures // Ann. Statist. 2004. No. 32. P. 962-994.
3.
Baraud Y. Non Asymptotic Minimax Rates of Testing in Signal Detection //
Bernoulli. 2002. No. 8. P. 577-606.
4.
Collier O., Comminges L., Tsybakov A.B. Minimax Estimation of Linear and
Quadratic Functionals Under Sparsity Constraints // Ann. Statist. 2017. No. 45.
P. 923-958.
5.
Ingster Y.I., Tsybakov A.B., Verzelen N.
Detection Boundary in Sparse
Regression // Electron. J. Stat. 2010. No. 4. P. 1476-1526.
6.
Arias-Castro E., Candes E., Plan Y. Global Testing Under Sparse Alternatives:
ANOVA, Multiple Comparisons and the Higher Criticism // Ann. Statist. 2011.
No. 39. P. 2533-2556.
7.
Verzelen N. Minimax Risks for Sparse Regressions: Ultra-High Dimensional
Phenomenons // Electron. J. Stat. 2012. No. 6. P. 38-90.
8.
Ingster Y.I., Suslina I.A. Nonparametric Goodness-of-Fit Testing under Gaussian
Models. N.Y.: Springer, 2003.
9.
Davidson K.R., Szarek S.J. Local Operator Theory, Random Matrices and Banach
Spaces. Handbook of the geometry of Banach spaces / Eds.: W.B. Johnson,
J. Lindenstrauss. 2001. V. 1. P. 317-366
10.
Vershynin R. Introduction to the Non-Asymptotic Analysis of Random Matrices.
Compressed sensing. Cambridge: Cambridge Univ. Press. 2012. P. 210-268.
11.
Tao T., Vu V. Random Matrices: Universality of Esds and the Circular Law //
Ann. Probab. 2010. V. 38. No. 5. P. 2023-2065.
12.
Bordenave C., Chafa¨ı D. Around the Circular Law // Probab. Surveys. 2012. No. 9.
P. 1-89.
Статья представлена к публикации членом редколлегии А.В. Назиным.
Поступила в редакцию 19.07.2018
После доработки 03.10.2018
Принята к публикации 08.11.2018
99