Известия РАН. Теория и системы управления, 2019, № 5, стр. 10-19

АНАЛИЗ НАДЕЖНОСТИ ЛИНЕЙНЫХ НЕСМЕЩЕННЫХ ОЦЕНОК ПРИ НАЛИЧИИ ПОМЕХ С НЕИЗВЕСТНЫМ УНИМОДАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ

А. С. Архипов a*, К. В. Семенихин ab**

a МАИ (национальный исследовательский ун-т)
Москва, Россия

b ИРЭ им. В.А. Котельникова РАН
Москва, Россия

* E-mail: ege3145@yandex.ru
** E-mail: siemenkv@rambler.ru

Поступила в редакцию 21.11.2018
После доработки 30.03.2019
Принята к публикации 20.05.2019

Полный текст (PDF)

Аннотация

Решена задача оценивания линейной комбинации неизвестных параметров в модели линейной регрессии с центрированными помехами, образующими случайный вектор с неопределенным симметричным унимодальным распределением и заданной ковариационной матрицей. Качество оценки определяется вероятностью выхода ошибки за заданные границы. Для учета неопределенности используется оптимизационная постановка в форме минимаксной задачи. Основной результат работы состоит в том, что неравенство Гаусса определяет неулучшаемую границу для надежности произвольной линейной несмещенной оценки. Найдено наихудшее распределение вектора помех в форме линейного преобразования случайного вектора с нормальным распределением и равномерной случайной величины. Установлено, что оценка, минимаксная по вероятностному критерию, совпадает с оценкой метода наименьших квадратов. Полученное решение проиллюстрировано на примере задачи оценивания параметров движения для нескольких гипотез о распределении помех.

Введение. Проблемы оценивания неизвестных параметров возникают при решении задач обработки статистической информации в самых различных отраслях науки и техники. Надежность оценок параметров движения является фундаментальным фактором при реализации алгоритмов навигации и управления объектами авиационной и космической техники [1]. Нарушение стандартного предположения о нормальности распределения измерительных ошибок ведет к неоправданно оптимистическим выводам о качестве используемых оценок [2]. Поэтому весьма актуальной является постановка задачи оценивания, в которой ошибки наблюдения имеют априори неизвестное распределение, но удовлетворяют естественному предположению унимодальности (одновершинности). Теория унимодальных распределений изложена в [3].

В статистике предположение об унимодальности играет важную роль для повышения надежности точечных и интервальных оценок [4]. В сравнении с чебышевской границей неравенство Гаусса [5] позволяет снизить наихудшее значение вероятности ошибки более чем в 2 раза. Нахождение верхней границы вероятности на классе унимодальных распределений составляет проблему моментов Маркова [5], которая в многомерном случае сводится к задаче выпуклого программирования [6, 7].

В данной работе рассматривается задача оценивания линейной комбинации неизвестных неограниченных параметров по наблюдениям, имеющим центрированные случайные помехи с неопределенным симметричным унимодальным распределением и заданной ковариационной матрицей. Оценка считается надежной, если ее ошибка оказалась по модулю не выше заданного порога. Поэтому критерием качества оценки является максимум надежности или, что то же самое, минимум вероятности выхода ошибки оценивания из заданного диапазона [8]. Поскольку указанная вероятность является неопределенной, для математически корректной формулировки используется минимаксный подход [9]. Цель решения соответствующей минимаксной задачи – определение линейной оценки, минимизирующей наихудшее значение указанной выше вероятности. Вместе с тем важным представляется решение двойственной задачи – задачи определения наихудшего представителя из класса унимодальных распределений вектора помех.

Основной результат работы состоит в том, что для рассматриваемой линейной регрессионной модели наблюдения известная граница, описываемая неравенством Гаусса, оказывается неулучшаемой с точки зрения надежности произвольной линейной несмещенной оценки. Необходимость рассмотрения только несмещенных оценок вытекает из предположения о неограниченности вектора неизвестных параметров. Полученная граница надежности занимает промежуточное положение между двумя крайними случаями: случай, соответствующий оптимистичному предположению о нормальном распределении, и пессимистичный случай, описываемый чебышевской границей. Наихудшее распределение унимодального вектора помех найдено в форме линейного преобразования гауссовского вектора и равномерной случайной величины. Доказано, что оценка, минимаксная по вероятностному критерию, совпадает с оценкой метода наименьших квадратов (МНК). Надежность полученной оценки проанализирована в задаче оценивания параметров движения для нескольких гипотез о виде распределения ошибок наблюдений.

1. Постановка задачи. Рассмотрим модель линейной регрессии

(1.1)
$X = \langle a,\theta \rangle ,\quad Y~ = B\theta + \eta ,$
в которой скалярная величина X подлежит оцениванию по результатам наблюдений {Y1, …, Yn}, составляющим вектор YRn. При этом θ ∈ Rp – вектор неизвестных параметров, относительно которых отсутствует какая-либо априорная информация; η ∈ Rn – вектор случайных ошибок наблюдений (вектор помех); aRp – известный вектор коэффициентов; 〈a, θ〉 – скалярное произведение векторов a, θ; BRn ×p – заданная матрица регрессии, где n > p и det[BTB] ≠ 0.

Кроме того, предположим, что наблюдения не содержат систематической погрешности и образуют случайный вектор с известной положительно определенной ковариационной матрицей K. Эти условия можно кратко записать в виде

(1.2)
$~M\eta \,~ = \,~0,\quad {\text{cov}}\left\{ {\eta ,~\eta } \right\}~\, = \,~K.$

Специфика исследуемой модели наблюдений состоит в том, что распределение ошибок наблюдений предполагается симметричным относительно нуля, унимодальным и имеющим заданные моментные характеристики (1.2), но в остальном – полностью неопределенным.

Для скалярной случайной величины ξ условие симметричности и унимодальности означает, что либо она имеет четную плотность, монотонно невозрастающую на положительной полуоси, либо ее распределение есть смесь распределения с указанной плотностью и δ0, где δ0 – распределение константы, равной нулю. Таким образом, ноль – это и точка симметрии, и наиболее вероятное значение (мода), и математическое ожидание. Если дополнительно известна дисперсия Dξ = s2, то указанные предположения будем кратко записывать в виде ξ ~ $\mathcal{U}$(s2).

Распределение случайного вектора называется унимодальным (точнее, линейно унимодальным [3]), если любая линейная комбинация его координат подчиняется одномерному унимодальному распределению. Предположение о том, что случайный вектор η имеет симметричное относительно нуля унимодальное распределение с моментными характеристиками (1.2), будем кратко записывать в виде

(1.3)
$~\eta ~\, \sim \mathcal{U}(K).$

Рассмотрим произвольную линейную оценку величины X:

(1.4)
$\tilde {X} = \langle f,Y\rangle + c,\quad {\text{где}}\quad f \in {{R}^{n}},\quad c \in R.~$

Допустим, что задан порог h > 0 величин ошибки оценивания $\tilde {X}$X. Надежность оценки $\tilde {X}$ будет определяться вероятностью превышения ее ошибкой указанного порога:

(1.5)
$P\{ {\text{|}}\tilde {X}~ - ~X{\text{|}} \geqslant h\} .~$

Для краткости будем называть (1.5) вероятностью ошибки. Чем меньше вероятность ошибки, тем более надежной следует признать оценку. Поэтому построение наиболее надежной оценки равносильно минимизации вероятности ошибки. Однако эта вероятность не определена однозначно, поскольку распределение ошибки $\tilde {X}$X априори неизвестно. Для того чтобы корректно сформулировать оптимизационную постановку задачи оценивания, воспользуемся минимаксным подходом.

Рассмотрим задачу нахождения минимаксной оценки $\hat {X}$ = 〈$\hat {f}$, Y〉 + $\hat {c}$. Вектор коэффициентов $\hat {f}$R n и величина сдвига $\hat {c}$R минимаксной оценки выбираются из условия минимума наихудшего значения вероятности ошибки:

(1.6)
$(\hat {f},\hat {c}) = \mathop {{\text{argmin}}}\limits_{(f,c) \in {{R}^{n}} \times R} \mathop {{\text{sup}}}\limits_{\eta \sim \mathcal{U}(K)} \mathop {{\text{sup}}}\limits_{\theta \in {{R}^{p}}} P\{ {\text{|}}\tilde {X} - X{\text{|}} \geqslant h\} ,$
где argmin обозначает точку минимума, $\tilde {X}$– оценка вида (1.4), а величина X и вектор Y удовлетворяют уравнениям (1.1).

Важно отметить, что при определении минимаксной оценки вместо исходного показателя надежности (1.5) рассматривается его наихудшее значение, т.е. берется супремум вероятности ошибки с учетом того, что вектор неизвестных параметров θ пробегает все евклидово пространство R p, а распределение вектора помех η может быть любым из класса всех допустимых унимодальных распределений (1.3).

Помимо минимаксной оценки $\hat {X}$ важно знать, какое наихудшее распределение ${{\hat {P}}_{\eta }}$ может иметь вектор помех. По определению на наихудшем распределении достигается наибольшее значение вероятности ошибки:

$\hat {P}\{ {\text{|}}\hat {X} - X{\text{|}} \geqslant h\} = \mathop {\sup }\limits_{\eta \sim \mathcal{U}(K){\text{\;}}} P\{ {\text{|}}\hat {X} - X{\text{|}} \geqslant h\} ,~~$
где символ $\hat {P}$ указывает на то, что вероятность вычислена с учетом η ~ ${{\hat {P}}_{\eta }}$.

2. Минимаксная оценка и наихудшее распределение. Вывод минимаксной оценки и синтез наихудшего распределения основаны на неравенстве Гаусса для случайных величин с унимодальным распределением [5]:

(2.1)
$~P\left\{ {\left| \xi \right| \geqslant h} \right\} \leqslant {{{\mathbf{u}}}_{h}}(s) = \left\{ \begin{gathered} \frac{{4{{s}^{2}}}}{{9{{h}^{2}}}}~\quad {\text{при}}\quad s \leqslant \frac{{h\sqrt 3 }}{2}~, \hfill \\ 1 - \frac{h}{{s\sqrt 3 }}~\quad {\text{при}}\quad s \geqslant \frac{{h\sqrt 3 }}{2}~, \hfill \\ \end{gathered} \right.$
где ξ – произвольная случайная величина из класса $\mathcal{U}$(s2), s > 0.

Таким образом, в сравнении с неравенством Чебышева

(2.2)
$~P\left( {\left| \xi \right| \geqslant h} \right) \leqslant {{{\mathbf{p}}}_{h}}(s) = {\text{min}}({{s}^{2}}{\text{/}}{{h}^{2}},1),$
которое справедливо для любой случайной величины ξ с нулевым средним и дисперсией s2, неравенство Гаусса определяет более точную границу, учитывающую унимодальность распределения. Эта граница uh(s) никогда не обращается в единицу и, как минимум, в 9/4 раз меньше чебышевской границы ph(s) в случае ph(s) < 1. Например, если порог h составляет две “сигмы”, т.е. h = 2s, то вероятность превышения этого порога для унимодальной величины в наихудшем случае будет составлять 1/9, что при использовании неравенства Чебышева достижимо только начиная со значения h, равного трем “сигмам”. Если h = 3s, то uh(s) = 4/81 ≈ 0.0494. Несмотря на то, что эта вероятность на порядок больше, чем для нормальной случайной величины ξ ~ $\mathcal{N}$(0, s2):
(2.3)
${{{\mathbf{v}}}_{h}}(s) = P\left( {\left| \xi \right| \geqslant h} \right) = 2{\Psi }\left( {h{\text{/}}s} \right),\quad {\text{где}}\quad ~{\Psi }(x) = \mathop \smallint \limits_x^{ + \infty } \frac{{{\text{exp}}( - {{t}^{2}}{\text{/}}2)}}{{\sqrt {2\pi } }}dt,$
этот факт позволяет строить стандартные 95%-ные доверительные интервалы, лишь в 1.5 раза более широкие, чем при соблюдении гипотезы о нормальном распределении. Если же h = s, то чебышевская граница ph(s) становится бессмысленной, так как ph(s) = 1, в то время как uh(s) = 1 – – 1/$\sqrt 3 $ ≈ 0.4226, что не намного хуже, чем для нормальной случайной величины: vh(s) ≈ 0.3173.

На рис. 1 представлены графики зависимости вероятности p = P(|ξ| ≥ h) от величины порога h для трех случаев: p = vh(s) при ξ ~ $\mathcal{N}$(0, s2); p = uh(s) при наихудшем выборе унимодальной величины ξ ~ $\mathcal{U}$(s2); p = ph(s) при наихудшем выборе произвольной величины ξ, такой, что Mξ = 0, Dξ = s2.

Рис. 1

Наконец, граница, описываемая неравенством Гаусса, является неулучшаемой, т.е. существует унимодальное распределение ${{\mathcal{W}}_{h}}$(s2), на котором неравенство (2.1) обращается в равенство. Определим это распределение [5]:

а) если sh$\sqrt 3 $/2, то ${{\mathcal{W}}_{h}}$(s2) представляет собой смесь равномерного распределения $\mathcal{R}$(–3h/2, 3h/2) с весом q = 4s2/(3h2) и распределения δ0 с весом 1 – q;

б) если $s \geqslant h\sqrt 3 {\text{/}}2$, то ${{\mathcal{W}}_{h}}({{s}^{2}}) = \mathcal{R}( - s\sqrt 3 ,~s\sqrt 3 )$.

Для нахождения минимаксной оценки необходимо выполнить несколько этапов исследования. Первый этап состоит в том, чтобы установить равенство (см. теорему 1 из [8])

$~\mathop {{\text{sup}}}\limits_{\theta \in {{R}^{p}}} P\{ {\text{|}}\tilde {X} - X{\text{|}} \geqslant h\} = 1$
для любой оценки $\tilde {X}$ вида (1.4), у которой вектор коэффициентов  f не является решением уравнения

(2.4)
$~{{B}^{{\text{T}}}}f = a.~$

На втором этапе необходимо убедиться, что нулевое значение аддитивного коэффициента с соответствует минимуму наихудшего значения вероятности ошибки при условии (2.4). Этот факт доказан в [10]. Тем самым можно ограничиться только несмещенными оценками, т.е. оценками вида $\tilde {X}$ = 〈f, Y〉, где вектор коэффициентов удовлетворяет уравнению (2.4).

На третьем этапе исходная минимаксная задача (1.6) сводится к следующей:

$\hat {f}~ = \mathop {{\text{argmin}}}\limits_{f:{{B}^{{\text{T}}}}f = a} \mathop {{\text{sup}}}\limits_\varepsilon P\left\{ {\left| \varepsilon \right| \geqslant h} \right\},$
где ε пробегает класс случайных величин, допускающих представление в виде линейной формы ε = 〈f, η〉 от вектора η с произвольным распределением из класса $\mathcal{U}$(K). Этот факт – прямое следствие соотношений

$\tilde {X} - X = ~\langle f,B\theta + \eta \rangle - \langle a,\theta \rangle = \langle {{B}^{{\text{T}}}}f - a,\theta \rangle + \langle f,\eta \rangle = \langle f,\eta \rangle .$

На последнем этапе решается основная проблема – проверка того, что указанный супремум совпадает с границей из неравенства Гаусса:

(2.5)
$\mathop {{\text{sup}}}\limits_\varepsilon P\left\{ {\left| \varepsilon \right| \geqslant h} \right\} = {{{\mathbf{u}}}_{h}}(\sqrt {\langle Kf,f\rangle } ).~$

Левая часть (2.5), очевидно, не превосходит правую, так как любая величина ε указанного вида центрирована, имеет дисперсию 〈Kf, f〉 и подчиняется симметричному унимодальному распределению.

Чтобы проверить обратное неравенство, достаточно для величины ξ ~ ${{\mathcal{W}}_{h}}$(〈Kf, f〉) подобрать случайный вектор η так, чтобы его распределение принадлежало классу $\mathcal{U}$(K) и с вероятностью 1 было выполнено равенство ξ = 〈f, η〉. Согласно методу, изложенному в [8], искомый вектор η определим по правилу

(2.6)
$\eta = T\{ \xi {{\left| g \right|}^{{ - 2}}}g + ({{I}_{n}} - {{\left| g \right|}^{{ - 2}}}g{{g}^{{\text{T}}}})\zeta \} ,~$
где T – квадратная матрица, участвующая в представлении K = TTT, g = TTf, In – единичная матрица размера n × n, а ζ – стандартный n-мерный гауссовский вектор, не зависящий от случайной величины ξ.

Проверим сначала равенство ξ = 〈f, η〉:

$\langle f,\eta \rangle = \langle g,\xi {{\left| g \right|}^{{ - 2}}}g + ({{I}_{n}} - {{\left| g \right|}^{{ - 2}}}g{{g}^{{\text{T}}}})\zeta \rangle = \xi .$

Вычислим ковариационную матрицу

${\text{cov}}\left\{ {\eta ,\eta } \right\} = T\{ D\left\{ \xi \right\}{{\left| g \right|}^{{ - 4}}}g{{g}^{{\text{T}}}} + {{({{I}_{n}} - {{\left| g \right|}^{{ - 2}}}g{{g}^{{\text{T}}}})}^{2}}\} {{T}^{{\text{T}}}} = K,$
где учтено, что D{ξ} = 〈Kf, f〉 = |g|2.

Для проверки η ~ $\mathcal{U}$(K) остается установить, что каким бы ни был детерминированный вектор bR n, распределение величины 〈b, η〉 будет унимодальным. Этот факт следует из унимодальности свертки двух симметричных унимодальных одномерных распределений, каковыми являются нормальное и равномерное [3].

Теперь можно сформулировать основной результат. Поскольку вероятностная граница (2.5) монотонно зависит от дисперсии 〈Kf, f〉, ее минимизация на подпространстве (2.4) приводит к оценке МНК [11]:

(2.7)
$\hat {X} = \langle \hat {f},Y\rangle ,~\quad \hat {f} = {{K}^{{ - 1}}}B{{({{B}^{{\text{T}}}}{{K}^{{ - 1}}}B)}^{{ - 1}}}~a.$

Тем самым (2.7) – искомая минимаксная оценка, а наихудшее значение вероятности ошибки для нее совпадает с границей из неравенства Гаусса (2.1):

$\mathop {{\text{sup}}}\limits_{\eta ~ \sim \mathcal{U}(K)} P\{ {\text{|}}\hat {X} - X{\text{|}} \geqslant h\} = {{{\mathbf{u}}}_{h}}(s),$
где ${{s}^{2}} = \langle {{({{B}^{{\text{T}}}}{{K}^{{ - 1}}}B)}^{{ - 1}}}~a,a~\rangle $ – дисперсия оценки МНК.

Наихудшее распределение вектора помех можно определить как закон распределения случайного вектора (2.6) c учетом того, что f = $\hat {f}$, $\xi \sim {{\mathcal{W}}_{h}}({{s}^{2}})$ и $\zeta \sim \mathcal{N}(0,{{I}_{n}})$, причем ξ и ζ независимы.

3. Оценивание параметров движения. Рассмотрим задачу оценивания движения материальной точки при наличии измерительных ошибок с унимодальным распределением.

Предположим, что положение материальной точки описывается функцией x(t) = x0 + ${v}$t, где начальное положение x0 и постоянная скорость движения ${v}$ неизвестны. Наблюдения положения

${{Y}_{k}} = x({{t}_{k}}) + {{\eta }_{k}}$
проводятся в моменты tk, k = 1, …, n, через равные промежутки времени и содержат помехи ηk, которые имеют нулевое среднее и одинаковую дисперсию σ2, являются некоррелированными и образуют случайный вектор с унимодальным распределением. Располагая небольшим количеством наблюдений n, требуется наиболее надежным способом восстановить будущее положение объекта X = x(t'), где t' > max{t1, …, tn}.

Описанная модель может быть задана в виде уравнений (1.1) с учетом условий (1.2), (1.3), если положить

$\theta = \left[ {\begin{array}{*{20}{c}} {{{x}_{0}}} \\ {v} \end{array}} \right],\quad a = \left[ {\begin{array}{*{20}{c}} 1 \\ {t'} \end{array}} \right],\quad B = \left[ {\begin{array}{*{20}{c}} 1&{{{t}_{1}}} \\ \vdots & \vdots \\ 1&{{{t}_{n}}} \end{array}} \right],\quad K = {{\sigma }^{2}}{{I}_{n}}.$

Согласно результату предыдущего раздела, при любом выборе порога ошибки h > 0 для наиболее надежного оценивания величины X = x(t') с учетом имеющейся априорной информации достаточно вычислить оценку МНК (2.7):

$\hat {X} = \langle \hat {f},Y\rangle ,\quad \hat {f} = B{{({{B}^{{\text{T}}}}B)}^{{ - 1}}}~a$
и ее дисперсию ${{s}^{2}} = {{\sigma }^{2}}\langle {{({{B}^{{\text{T}}}}B)}^{{ - 1}}}~a,a\rangle $.

Отметим, что $\hat {X}$ естественным образом выражается через оценку МНК вектора параметров $\hat {\theta }$ [11]:

$\hat {X} = {{\hat {x}}_{0}} + {\hat {v}}t{\text{'}},\quad \hat {\theta } = \left[ {\begin{array}{*{20}{c}} {{{{\hat {x}}}_{0}}} \\ {{\hat {v}}} \end{array}} \right] = {{({{B}^{{\text{T}}}}B)}^{{ - 1}}}~{{B}^{{\text{T}}}}Y.$

Проанализируем надежность данной оценки в зависимости от уровня информированности о совместном распределении помех. Рассмотрим следующие четыре гипотезы:

1) вектор помех представляет собой гауссовский вектор $\eta \sim \mathcal{N}(0,{{\sigma }^{2}}{{I}_{n}})$, что равносильно тому, что помехи η1, …, ηn независимы и распределены по нормальному закону $\mathcal{N}$(0, σ2);

2) вектор η составлен из независимых величин η1, …, ηn, каждая из которых подчиняется распределению Тьюки, т.е. смеси двух нормальных распределений $(1 - p)\mathcal{N}(0,\sigma _{0}^{2}) + p\mathcal{N}(0,\sigma _{1}^{2})$, где σ0 и σ1 – средние квадратичные отклонения (с.к.о.) помех в номинальном случае и в случае выброса соответственно, а p – вероятность выброса, причем $(1 - p)\sigma _{0}^{2} + p\sigma _{1}^{2} = {{\sigma }^{2}}$, σ10 = 5 и p = 0.1;

3) вектор помех может иметь произвольное симметричное унимодальное распределение, т.е. $\eta \sim \mathcal{U}({{\sigma }^{2}}{{I}_{n}})$;

4) вектор η подчиняется неизвестному распределению, но удовлетворяет

(3.1)
$~M\eta = 0,\quad {\text{cov}}\{ \eta ,~\eta \} = {{\sigma }^{2}}{{I}_{n}}.$

Важно отметить, что во всех четырех случаях помехи имеют одни и те же моментные характеристики (3.1). При этом гипотезы 1) и 2) описывают вполне определенный совместный закон распределения величин η1, …, ηn, а при использовании гипотез 3) и 4) распределение является неопределенным и выбирается из расчета на наихудший случай. Кроме того, в случае 1) и 2) помехи предполагаются независимыми, в то время как гипотезы 3) и 4) накладывают только требование некоррелированности в силу (3.1).

Для гипотезы 3) конструкция унимодального вектора помех η с наихудшим распределением была описана в предыдущем разделе, а именно

(3.2)
$\eta ~ = \xi {\text{|}}\hat {f}{{{\text{|}}}^{{ - 2}}}\hat {f} + \sigma ({{I}_{n}} - \,{\text{|}}\hat {f}{{{\text{|}}}^{{ - 2}}}\hat {f}{{\hat {f}}^{{\text{T}}}})\zeta ,$
где случайная величина $\xi \sim {{\mathcal{W}}_{h}}({{s}^{2}})$ и случайный вектор ζ ~ $\mathcal{N}$(0, In) независимы, $\hat {f}$ – вектор коэффициентов оценки МНК, а s2 – ее дисперсия.

В случае гипотезы 4) при h > s для построения наихудшего вектора помех η заменим в (3.2) распределение величины ξ трехточечным [8]:

(3.3)
$P\{ \xi = h\} = P\{ \xi = - h\} = {{s}^{2}}{\text{/}}(2{{h}^{2}}),~\quad P\{ \xi = 0\} = 1 - {{s}^{2}}{\text{/}}{{h}^{2}}.$

Если hs, то достаточно взять двухточечное распределение:

(3.4)
$P\{ \xi = s\} = P\{ \xi = - s\} = 1{\text{/}}2.$

Теперь для каждой из четырех гипотез укажем выражения для вероятности ошибки и частной плотности помех.

В рамках гипотезы 1) имеем $\eta \sim \mathcal{N}(0,{{\sigma }^{2}}{{I}_{n}})$, откуда $\hat {X}~--~X\sim \mathcal{N}(0,{{s}^{2}})$, поэтому с использованием обозначения (2.3) искомая вероятность ошибки равна $P\{ {\text{|}}\hat {X}~ - ~X{\text{|}} \geqslant h\} = {{{\mathbf{v}}}_{h}}(s)$. Укажем также явный вид плотности f(x) частного распределения помех ηk:

$f(x) = \frac{1}{\sigma }\phi \left( {\frac{x}{\sigma }} \right),\quad {\text{где}}\quad \phi (t) = \frac{{\exp ( - {{t}^{2}}{\text{/}}2)}}{{\sqrt {2\pi } }}.$
В случае гипотезы 2) вероятность ошибки можно найти по формуле полной вероятности. Предположим, что известны номера наблюдений $1 \leqslant {{k}_{1}} < \ldots < {{k}_{m}} \leqslant n$, в которых произошли выбросы, и определим матрицу E размера n × n, у которой на главной диагонали в позициях с указанными номерами стоят единицы, а остальные элементы равны нулю. Тогда ошибку оценивания можно представить в виде
$\hat {X}~ - ~X = \langle \hat {f},\eta \rangle = \langle ({{I}_{n}} - E)\hat {f},({{I}_{n}} - E)\eta \rangle + \langle E\hat {f},E\eta \rangle ,$
где векторы $\left( {{{I}_{n}} - E} \right)\eta $, Eη независимы и подчиняются распределениям $\mathcal{N}(0,\sigma _{0}^{2}({{I}_{n}} - E))$ и $\mathcal{N}(0,\sigma _{1}^{2}E)$ соответственно. Теперь вероятность ошибки в модели Тьюки можно записать как
$P\{ {\text{|}}\hat {X}~ - ~X{\text{|}} \geqslant h\} = 2\sum {{\Psi }(h{\text{/}}\sqrt {\sigma _{0}^{2}{\text{|}}({{I}_{n}} - E)\hat {f}{{{\text{|}}}^{2}} + \sigma _{1}^{2}{\text{|}}E\hat {f}{{{\text{|}}}^{2}}} ){{{(1 - p)}}^{{n - m}}}{{p}^{m}},} $
где сумма берется по всем матрицам E указанного вида, m обозначает число единиц в матрице E, p – вероятность выброса, а функция Ψ(x) определена в (2.3). Укажем также выражение для плотности помех

$f\left( x \right) = \frac{{1 - p}}{{{{\sigma }_{0}}}}\phi \left( {\frac{x}{{{{\sigma }_{0}}}}} \right) + \frac{p}{{{{\sigma }_{1}}}}\phi \left( {\frac{x}{{{{\sigma }_{1}}}}} \right).$

Рассмотрим гипотезу 3), согласно которой $\eta \sim \mathcal{U}({{\sigma }^{2}}{{I}_{n}})$. Поскольку распределение вектора помех выбирается наихудшим образом, вероятность ошибки определяется правой частью неравенства Гаусса:

$P\{ {\text{|}}\hat {X}~ - ~X{\text{|}} \geqslant h\} = {{{\mathbf{u}}}_{h}}(s).$

Для того чтобы определить частную плотность  fk(x) компонент ηk вектора (3.2), воспользуемся следующим фактом. Если условное распределение величины V при условии U = u является нормальным $\mathcal{N}$(u, b2), а величина U распределена по закону $\mathcal{R}$(–d, d), то плотность величины V имеет вид

${{f}_{V}}(x) = \frac{1}{{2d}}\left( {{\Psi }\left( {\frac{{x - d}}{b}} \right) - {\Psi }\left( {\frac{{x + d}}{b}} \right)} \right).$
Из (3.2) следует, что условное распределение величины ηk при условии ckξ = u является нормальным $\mathcal{N}$$(u,b_{k}^{2})$, где $b_{k}^{2} = {{\sigma }^{2}}(1 - \,{\text{|}}\hat {f}{{{\text{|}}}^{{ - 2}}}\hat {f}_{k}^{2})$ и ${{c}_{k}} = {\text{|}}\hat {f}{{{\text{|}}}^{{ - 2}}}{\text{|}}{{\hat {f}}_{k}}{\text{|}}$. Поэтому в силу $\xi \sim {{\mathcal{W}}_{h}}({{s}^{2}})$ и ${{\hat {f}}_{k}}$ ≠ 0 получаем:

а) если $s \leqslant h\sqrt 3 {\text{/}}2$, то с учетом $q = 4{{s}^{2}}{\text{/}}(3{{h}^{2}})$

${{f}_{k}}(x) = \frac{{1 - q}}{{{{b}_{k}}}}\phi \left( {\frac{x}{{{{b}_{k}}}}} \right) + \frac{{q{{b}_{k}}}}{{3{{c}_{k}}h}}\left( {\Psi \left( {\frac{{x - 3{{c}_{k}}h{\text{/}}2}}{{{{b}_{k}}}}} \right) - \Psi \left( {\frac{{x + 3{{c}_{k}}h{\text{/}}2}}{{{{b}_{k}}}}} \right)} \right);$
б) если $s \geqslant h\sqrt 3 {\text{/}}2$, то
${{f}_{k}}(x) = \frac{{{{b}_{k}}}}{{2{{c}_{k}}s\sqrt 3 }}\left( {{\Psi }\left( {\frac{{x - {{c}_{k}}s\sqrt 3 }}{{{{b}_{k}}}}} \right) - {\Psi }\left( {\frac{{x + {{c}_{k}}s\sqrt 3 }}{{{{b}_{k}}}}} \right)} \right).$
Наконец, рассмотрим гипотезу 4). Случай произвольного распределения, связанного только моментными ограничениями (3.1), приведен в [8]. Там доказано, что наихудшее значение вероятности ошибки определяется чебышевской границей (2.2), т.е. $P\{ {\text{|}}\hat {X}~ - ~X{\text{|}} \geqslant h\} = {{{\mathbf{p}}}_{h}}(s)$.

Воспользуемся указанным выше условным распределением помехи ηk при ${{c}_{k}}\xi = u$ тем фактом, что наихудшее распределение величины ξ имеет вид (3.3)–(3.4). В результате получаем искомую плотность помехи

${{f}_{k}}(x) = \frac{{1 - {{s}^{2}}{\text{/}}{{h}^{2}}}}{{{{b}_{k}}}}\phi \left( {\frac{x}{{{{b}_{k}}}}} \right) + \frac{{{{s}^{2}}{\text{/}}{{h}^{2}}}}{{2{{b}_{k}}}}\phi \left( {\frac{{x - {{c}_{k}}h}}{{{{b}_{k}}}}} \right) + \frac{{{{s}^{2}}{\text{/}}{{h}^{2}}}}{{2{{b}_{k}}}}\phi \left( {\frac{{x + {{c}_{k}}h}}{{{{b}_{k}}}}} \right),$
если s < h, а в противном случае имеем

${{f}_{k}}\left( x \right) = \frac{1}{{2{{b}_{k}}}}\phi \left( {\frac{{x - {{c}_{k}}s}}{{{{b}_{k}}}}} \right) + \frac{1}{{2{{b}_{k}}}}\phi \left( {\frac{{x + {{c}_{k}}s}}{{{{b}_{k}}}}} \right).$

Перейдем к описанию результатов численного эксперимента, который проводился со следующими параметрами:

${{x}_{0}} = 3600\,\,{\text{м}},\quad {v} = 255\,\,{\text{м/с}},\quad {{t}_{1}} = 15,\quad {{t}_{n}} = 70\,\,{\text{с}},\quad n = 12,$
$x(t{\text{'}}) = 24000~\,\,{\text{м}},~~t{\text{'}} = 80~\,\,{\text{с}},\quad \sigma = 1000\,\,{\text{м}}.$

На рис. 2 изображена истинная траектория движения x = x(t) и ее оценка x = $\hat {x}$(t), имеющая вид $\hat {x}$(t) = ${{\hat {x}}_{0}}$ + ${\hat {v}}$t, где ${{\hat {x}}_{0}}$, ${\hat {v}}$ образуют оценку МНК вектора параметров $\hat {\theta }$ при наличии нормальных помех. Кроме того, для случая h = 1000 м изображены границы интервала ($\hat {X}$h, $\hat {X}$ + h), который представляет собой интервальную оценку терминального положения X = x(t'). Надежность этого доверительного интервала равна

$P\{ X \in (\hat {X} - h,~\hat {X} + h)\} = 1 - P\{ {\text{|}}\hat {X}~ - X{\text{|}} \geqslant h\} = 1 - {{{\mathbf{v}}}_{h}}(s) \approx 0.8525,$
где учтено, что с.к.о. оценки $\hat {X}$ = $\hat {x}$(t') равно s ≈ 690 м.

Рис. 2.

Истинная траектория (сплошная линия), ее оценка (штриховая линия), наблюдения с нормальными помехами (точки), границы интервальной оценки (тонкие штриховые линии)

На рис. 3 представлены результаты оценивания для случая, когда помехи соответствовали наихудшему унимодальному распределению. В сравнении со случаем нормальных помех заметен больший разброс наблюдений относительно истинной траектории. При этом надежность той же интервальной оценки оказывается несколько меньше

$P\{ X \in (\hat {X} - h,~\hat {X} + h)\} = 1 - {{{\mathbf{u}}}_{h}}(s) \approx 0.7881.$
Рис. 3.

Истинная траектория (сплошная линия), ее оценка (штриховая линия), наблюдения при наихудшем выборе унимодального распределения помех (точки), границы интервальной оценки (тонкие штриховые линии)

Данные о вероятности ошибки для всех четырех гипотез и нескольких значений порога h сведены в таблицу. Результаты, полученные на основе гипотезы 3) об унимодальности помех, занимают промежуточное положение между двумя крайними случаями: гипотеза 1) о нормальном распределении соответствует слишком оптимистичным выводам о надежности оценивания, а гипотеза 4), основанная на знании только моментных характеристик, приводит к неоправданно пессимистичному заключению о качестве оценки.

Для исходного набора параметров частные плотности помех в случае гипотез 1), 3) и 4) визуально совпадают. Это связано с тем, что плотности наихудшего распределения получаются из плотности нормального распределения с помощью свертки с величиной, принимающей относительно малые значения при небольшом с.к.о. s = $\sqrt {D\{ \hat {X}\} } $. Поэтому для демонстрации различия плотностей, соответствующих разным гипотезам, взята модель с другим набором параметров:

${{t}_{1}} = 15,\quad {{t}_{n}} = 35~\,\,{\text{с}},\quad n = 5,\quad x(t') = 15075~\,\,{\text{м}},\quad t' = 45~\,\,{\text{с,}}~$
при которых с.к.о. оценки оказалась значительно больше: s ≈ 1342 м.

На рис. 4 представлен вид частной плотности помех для всех четырех гипотез и указанного набора параметров в случае h = 1000 м.

Рис. 4.

Плотность  fk(x) помехи ηk при k = n = 5 для четырех гипотез: 1) – сплошная, 2) – штрихпунктирная, 3) – штриховая, 4) – пунктирная

Заключение. В работе сформулирована задача минимаксного оценивания по вероятностному критерию для линейной регрессионной модели наблюдения с помехами, имеющими неопределенное унимодальное распределение и фиксированные моментные характеристики. Вектор параметров предполагался полностью неизвестным, оцениванию подлежала линейная комбинация его координат, а качество линейных оценок определялось вероятностью превышения ошибкой заданного порога.

Изложены схема нахождения минимаксной оценки и метод построения наихудшего распределения вектора помех. Используемая методология исследования основана на минимаксном подходе в сочетании с методами регрессионного анализа и теории унимодальных распределений (неравенство Гаусса). Установлено, что если вектор помех имеет известную ковариационную матрицу и произвольное унимодальное распределение, то оценка, минимаксная по вероятностному критерию, совпадает с оценкой МНК. Описана конструкция случайного вектора, соответствующего случаю наихудшего распределения. Проведен сравнительный анализ качества оценок МНК для нескольких вариантов совместного распределения помех.

Полученные теоретические результаты могут быть использованы для повышения надежности параметрических оценок в различных прикладных областях, где необходимо обрабатывать статистические данные, содержащие случайные ошибки и возмущения с унимодальным распределением.

Таблица.

Вероятность ошибки для гипотез 1)–4)

Гипотеза 1) 2) 3) 4)
h h/s vh(s) τh(s) uh(s) ph(s)
500 0.7242 0.468950 0.377438 0.581889 1
750 1.0863 0.277354 0.215647 0.372834 0.847449
1000 1.4484 0.147511 0.126294 0.211862 0.476690
1250 1.8105 0.070222 0.075652 0.135592 0.305082
1500 2.1726 0.029813 0.045435 0.094161 0.211862
1750 2.5347 0.011256 0.027033 0.069179 0.155654
2000 2.8968 0.003770 0.015862 0.052966 0.119172

Список литературы

  1. Степанов О.А. Основы теории оценивания с приложениями к задачам обработки навигационной информации. Ч. 1. Введение в теорию оценивания. СПб.: ОАО “Концерн “ЦНИИ “Электроприбор”, 2010.

  2. Maryak J.L., Spall J.C., Heydon B.D. Use of the Kalman Filter for Inference in State-Space Models With Unknown Noise Distributions // IEEE Trans. Automat. Control. 2004. V. 49. № 1. P. 87–90.

  3. Dharmadhikari S., Joag-dev K. Unimodality, Convexity, and Applications. San Diego: Academic, 1988.

  4. Zeytinoglu M., Mintz M. Robust Fixed Size Confidence Procedures for a Restricted Parameter Space // Ann. Statist. 1988. V. 16. № 3. P. 1241–1253.

  5. Карлин С., Стадден В.Д. Чебышевские системы и их применение в анализе и статистике. М.: Наука, 1976.

  6. Popescu I. A Semidefinite Programming Approach to Optimal Moment Bounds for Convex Classes of Distributions // Mathematics of Operations Research. 2005. V. 30. № 3. P. 632–657.

  7. Delage E., Ye Y. Distributionally Robust Optimization Under Moment Uncertainty with Application to Data-Driven Problems // Operations Research. 2010. V. 58. № 3. P. 595–612.

  8. Панков А.Р., Семенихин К.В. О минимаксном оценивании по вероятностному критерию // АиТ. 2007. № 3. С. 66–82.

  9. Verdu S., Poor H.V. On Minimax Robustness: A General Approach and Applications // IEEE Trans. Inform. Theory. 1984. V. 30. № 2. P. 328–340.

  10. Семенихин К.В. Двусторонняя вероятностная граница для симметричной унимодальной случайной величины // АиТ. 2019. № 3. С.103–122.

  11. Демиденко Е.З. Линейная и нелинейная регрессии. М.: Финансы и статистика, 1981.

Дополнительные материалы отсутствуют.