Радиотехника и электроника, 2021, T. 66, № 8, стр. 748-759

Оптимальное оценивание дискретно-непрерывных марковских процессов по наблюдаемым цифровым сигналам

А. Н. Детков *

Государственный научно-исследовательский институт авиационных систем
125319 Москва, ул. Викторенко, 7, Российская Федерация

* E-mail: detkov@gosniias.ru

Поступила в редакцию 14.12.2020
После доработки 20.03.2021
Принята к публикации 22.03.2021

Полный текст (PDF)

Аннотация

На основе теории условных марковских процессов синтезированы рекуррентные оптимальный и квазиоптимальный алгоритмы оценивания дискретно-непрерывных марковских процессов по наблюдаемым цифровым сигналам. Эффективность квазиоптимального алгоритма подтверждена статистическим моделированием.

ВВЕДЕНИЕ

Для решения задач оптимальной обработки сигналов широкое применение находит теория условных марковских процессов, основы которой были разработаны Р.Л. Стратоновичем [1]. Помимо основных четырех видов марковских процессов [23] могут быть более сложные – дискретно-непрерывные марковские процессы (ДНМП), часть компонентов которых принимает непрерывное, а часть дискретное множество значений [4]. Описание радиоэлектронных систем, успешно функционирующих в сложной динамически изменяющейся сигнально-помеховой обстановке, с помощью аппарата ДНМП оказалось чрезвычайно эффективным. Впервые аппарат ДНМП был применен для решения задачи фильтрации сообщений при непрерывных наблюдениях в работах В.И. Тихонова [5, 6] и затем получил развитие в многочисленных работах других авторов [711]. В них получены интегро-дифференциальные уравнения, описывающие эволюцию апостериорной плотности вероятности ДНМП.

Цифровая реализация полученных на основе аппарата ДНМП при непрерывных наблюдениях алгоритмов встречает значительные трудности, вызванные сильной зависимостью точности и устойчивости алгоритмов от величины шага дискретизации. Дальнейшее развитие этот подход получил при решении задач оптимальной обработки ДНМП в дискретном времени [7, 12]. При формировании же цифровых сигналов погрешность квантования ДНМП носит шумовой характер и может моделироваться путем добавления аддитивного шума к сигналу, что не всегда справедливо, так как погрешность квантования аналого-цифровых преобразователей (АЦП) далеко не случайна и, как правило, коррелирована с процессом. Конечно, уменьшение погрешности квантования возможно путем увеличения числа уровней квантования. Однако в системах передачи аналоговых сообщений по цифровым каналам связи [13] и радиолокации [14] это не всегда возможно, кроме того, в некоторых случаях необходимо учитывать статистические характеристики квантователей при расчете коэффициентов чувствительности показателя качества систем управления конечным положением в условиях противодействия среды [15].

Все эти факторы вызывают необходимость разработки методов оптимального оценивания ДНМП в дискретном времени с учетом статистических характеристик квантователей АЦП, адекватных реальным задачам цифровой обработки сигналов радиоэлектронных систем.

1. ПОСТАНОВКА ЗАДАЧИ

Теория построения алгоритмов распознавания и оценивания состояний ДНМП рассмотрена достаточно полно в [511], где получены непрерывные уравнения для законов распределения фазовых координат, их моментов и вероятностей состояний дискретных компонентов ДНМП. Для реализации этих уравнений на цифровых вычислительных машинах указанные алгоритмы необходимо синтезировать в дискретной форме в виде рекуррентных соотношений. В связи с этим при синтезе оптимальных алгоритмов цифровой фильтрации непрерывных компонентов ДНМП центральным является вопрос о статистически эквивалентном дискретном представлении стохастических дифференциальных уравнений (СДУ) непрерывных компонентов ДНМП и алгебраических уравнений измерений. Традиционно при формулировке эквивалентной задачи с дискретным временем используются два подхода.

1. Дискретные модели записываются непосредственно для этих уравнений (см., например, в [12]).

2. Априорные уравнения объекта и измерителя в непрерывном времени записываются в разностной форме с интервалом дискретизации ${{\Delta }}$. При этом в уравнении измерений непрерывный белый гауссовский шум (БГШ) приближенно заменяется его допредельной моделью – некоррелированной последовательностью центрированных случайных величин с ковариационной матрицей ${{\mathbf{I}} \mathord{\left/ {\vphantom {{\mathbf{I}} {{\Delta }}}} \right. \kern-0em} {{\Delta }}}$ (например, в [4]), где ${\mathbf{I}}$ – единичная матрица интенсивностей исходного непрерывного БГШ. Применительно к задачам цифровой фильтрации непрерывных компонентов ДНМП это представление является некорректным уже потому, что оно не согласовано с каким-либо техническим способом формирования отсчетов непрерывного измеряемого процесса, а также противоречит физике рассматриваемых явлений [16]. В частности, при увеличении интервала дискретизации $\Delta $ точность оценивания непрерывных компонентов будет увеличиваться, так как будет уменьшаться интенсивность шумов измерений.

Следует отметить, что физически процессы, протекающие в радиоэлектронных системах, являются непрерывными случайными процессами, поэтому для этих систем актуальна задача оптимизации алгоритмов оценивания ДНМП по наблюдаемым цифровым сигналам на основе корректного эквивалентного дискретного представления непрерывных компонентов ДНМП.

Рассмотрим задачу оценивания ${{n}_{x}}$-мерного вектора состояния ${\mathbf{x}}(t)$, описывающего в пространстве состояний динамику фазовых координат ДНМП. Пусть СДУ вектора состояния и уравнение измерений имеют вид

(1)
$\begin{gathered} \frac{{d{\mathbf{x}}}}{{dt}} = {\mathbf{F}}\left( {t,{{a}_{j}}({{t}_{k}})} \right){\mathbf{x}}(t) + {{{\mathbf{G}}}_{x}}\left( {t,{{a}_{j}}({{t}_{k}})} \right){\mathbf{\xi }}(t), \\ {\mathbf{x}}\left( {{{t}_{0}}} \right) = {{{\mathbf{x}}}_{0}}, \\ \end{gathered} $
(2)
$\begin{gathered} {\mathbf{v}}(t) = {\mathbf{H}}\left( {t,{{b}_{m}}({{t}_{k}})} \right){\mathbf{x}}(t) + {{{\mathbf{G}}}_{y}}\left( {t,{{b}_{m}}({{t}_{k}})} \right){\mathbf{\zeta }}(t), \\ t \in \left[ {{{t}_{0}},t} \right), \\ \end{gathered} $
где ${\mathbf{v}}(t)$${{n}_{y}}$-мерный вектор измерений; s(tk) = $ = {{\left[ {{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})} \right]}^{T}}$ – дискретная компонента ДНМП – условная марковская цепь с матрицами вероятностей переходов, T – знак транспонирования.
$\begin{gathered} {{{\mathbf{\Pi }}}_{1}}(k - 1,k) = \left\{ {{{{{\pi }}}_{{ij}}}(k - 1,k)} \right\} = \left\{ {P\left( {{{a}_{j}}({{t}_{k}})\left| {{{a}_{i}}({{t}_{{k - 1}}})} \right.} \right)} \right\}, \\ i,j = \overline {1,{{M}_{1}}} , \\ \end{gathered} $
$\begin{gathered} {{{\mathbf{\Pi }}}_{2}}(k - 1,k) = \left\{ {{{{{\pi }}}_{{nm}}}(k - 1,k)} \right\} = \left\{ {P\left( {{{b}_{m}}({{t}_{k}})\left| {{{b}_{n}}({{t}_{{k - 1}}})} \right.} \right)} \right\}, \\ n,m = \overline {1,{{M}_{2}}} \\ \end{gathered} $
смена состояний которой может происходить только в фиксированные моменты времени ${{t}_{k}} = {{t}_{0}} + k\Delta $, k = 1, 2, …, разделенные постоянным интервалом $\Delta = {{t}_{k}} - {{t}_{{k - 1}}}$; ${{M}_{1}}$, ${{M}_{2}}$ – число значений дискретных параметров ${{a}_{j}}$, ${{b}_{m}}$ соответственно; ${\mathbf{\xi }}(t)$, ${\mathbf{\zeta }}(t)$ – независимые между собой ${{n}_{{{\xi }}}}$-, ${{n}_{{{\varsigma }}}}$-мерные векторы БГШ с нулевыми математическими ожиданиями и единичными матрицами интенсивностей соответствующей размерности.

По условию задачи известны матрицы ${\mathbf{F}}\left( \cdot \right)$, ${{{\mathbf{G}}}_{x}}\left( \cdot \right)$, ${\mathbf{H}}\left( \cdot \right)$, ${{{\mathbf{G}}}_{y}}\left( \cdot \right)$, а также начальные распределения марковского вектора ${{\left[ {{{{\mathbf{x}}}^{T}}(t),{{{\mathbf{v}}}^{T}}(t),{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})} \right]}^{Т}}$, причем компонент марковской цепи ${{b}_{m}}({{t}_{k}})$, характеризующий нарушения в канале измерения, не зависит от процесса ${\mathbf{x}}(t)$ и от компонента ${{a}_{j}}({{t}_{k}})$, характеризующего изменения статистических свойств непрерывных компонентов ДНМП. Непрерывный процесс ${\mathbf{v}}(t)$ подвергается дискретизации с постоянным шагом Δ в моменты времени ${{t}_{k}} = {{t}_{0}} + k\Delta $ и амплитудному квантованию по уровням в квантователях многоканального АЦП измерителя. Особенностью задачи является то, что для оценивания отсчетов ${\mathbf{x}}(t)$ непосредственному наблюдению доступны только цифровые выходные сигналы АЦП. Требуется по наблюдаемым цифровым сигналам

${\mathbf{D}}_{1}^{k} \triangleq \left\{ {{\mathbf{d}}\left( 1 \right),{\mathbf{d}}\left( 2 \right),...,{\mathbf{d}}\left( k \right)} \right\}$
найти апостериорное распределение отсчетов вектора ${\mathbf{x}}(t)$ и дискретной компоненты ДНМП ${\mathbf{s}}({{t}_{k}})$ с точным учетом характеристик АЦП: нормированных оптимальных уровней и порогов квантования, а также нормированного равномерного шага квантования. Здесь и далее знак $ \triangleq $ обозначает равенство по определению.

2. ЭКВИВАЛЕНТНАЯ ЗАДАЧА ОЦЕНИВАНИЯ ДИСКРЕТНО-НЕПРЕРЫВНОГО МАРКОВСКОГО ПРОЦЕССА В ДИСКРЕТНОМ ВРЕМЕНИ

Для корректного статистически эквивалентного дискретного представления непрерывных моделей вектора состояния ДНМП и измерителя воспользуемся методами теории условных марковских процессов [1], в соответствии с которыми модели (1), (2) описываются в виде совместного условно-марковского процесса. При помощи равенства [15]

(3)
$\frac{{d{\mathbf{y}}}}{{dt}} = {\mathbf{v}}(t)$

введем векторный процесс у(t), статистическая динамика которого согласно (2) описывается стохастическим дифференциальным уравнением

(4)
$\begin{gathered} \frac{{d{\mathbf{y}}}}{{dt}} = {\mathbf{H}}\left( {t,{{b}_{m}}({{t}_{k}})} \right){\mathbf{x}}(t) + {{{\mathbf{G}}}_{y}}\left( {t,{{b}_{m}}({{t}_{k}})} \right)\zeta (t), \\ {\mathbf{y}}({{t}_{0}}) = 0. \\ \end{gathered} $

Согласно (1), (4) совместный процесс z = $ = {{\left[ {{{{\mathbf{x}}}^{Т}}(t),{{{\mathbf{y}}}^{Т}}(t)} \right]}^{Т}}$ является условно-марковским и описывается СДУ

(5)
$\begin{gathered} \frac{{d{\mathbf{z}}}}{{dt}} = {{{\mathbf{F}}}_{z}}\left( {t,{\mathbf{s}}({{t}_{k}})} \right){\mathbf{z}}(t) + {{{\mathbf{G}}}_{z}}\left( {t,{\mathbf{s}}({{t}_{k}})} \right){{{\mathbf{n}}}_{z}}(t), \\ {\mathbf{z}}({{t}_{0}}) = {{{\mathbf{z}}}_{0}}, \\ \end{gathered} $
где

$\begin{gathered} {{{\mathbf{F}}}_{z}} = \left[ {\begin{array}{*{20}{c}} {{\mathbf{F}}\left( {{{a}_{j}}({{t}_{k}})} \right)}&{\mathbf{0}} \\ {{\mathbf{H}}\left( {{{b}_{m}}({{t}_{k}})} \right)}&{\mathbf{0}} \end{array}} \right],\,\,\,\,{{{\mathbf{G}}}_{z}} = \left[ {\begin{array}{*{20}{c}} {{{{\mathbf{G}}}_{x}}\left( {{{a}_{j}}({{t}_{k}})} \right)}&{\mathbf{0}} \\ {\mathbf{0}}&{{{{\mathbf{G}}}_{y}}\left( {{{b}_{m}}({{t}_{k}})} \right)} \end{array}} \right], \\ {{{\mathbf{n}}}_{z}} = \left[ {\begin{array}{*{20}{c}} {\mathbf{\xi }} \\ {\mathbf{\zeta }} \end{array}} \right]. \\ \end{gathered} $

Уравнение (5) может быть представлено в статистически эквивалентной форме [2] в виде разностного уравнения с шагом дискретизации Δ

(6)
$\begin{gathered} {\mathbf{z}}\left( k \right) = {{{\mathbf{\Phi }}}_{{zz}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})){\mathbf{z}}\left( {k - 1} \right) + \\ + \,\,{{{\mathbf{\Gamma }}}_{{zz}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})){{{\mathbf{N}}}_{z}}(k - 1), \\ \end{gathered} $
в котором используются обозначения
${{{\mathbf{\Phi }}}_{{zz}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})) = \left[ {\begin{array}{*{20}{c}} {{{{\mathbf{\Phi }}}_{{xx}}}(k,k - 1,{{a}_{j}}({{t}_{k}}))}&{\mathbf{0}} \\ {{{{\mathbf{\Phi }}}_{{yx}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}}))}&{\mathbf{I}} \end{array}} \right],$
${{{\mathbf{\Gamma }}}_{{zz}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})) = \left[ {\begin{array}{*{20}{c}} {{{{\mathbf{\Gamma }}}_{{xx}}}(k,k - 1,{{a}_{j}}({{t}_{k}}))}&{\mathbf{0}} \\ {{{{\mathbf{\Gamma }}}_{{yx}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}}))}&{{{{\mathbf{\Gamma }}}_{{yy}}}(k,k - 1,{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}}))} \end{array}} \right],$
${{{\mathbf{N}}}_{z}} = \left[ {\begin{array}{*{20}{c}} {{{{\mathbf{n}}}_{x}}} \\ {{{{\mathbf{n}}}_{y}}} \end{array}} \right],$
где Nz – (nx + ny)-мерный вектор независимых гауссовских случайных величин с нулевыми математическими ожиданиями и единичными дисперсиями. Элементы блочных матриц ${{{\mathbf{\Phi }}}_{{zz}}}$, ${{{\mathbf{\Gamma }}}_{{zz}}}$, где ${{{\mathbf{\Gamma }}}_{{zz}}}$ – нижняя треугольная матрица априорной корреляционной матрицы ${{{\mathbf{B}}}_{{zz}}}(k,k - 1,{\mathbf{s}}({{t}_{k}}))$, определяются из решения системы уравнений [2, 6]
$\frac{{d{{{\mathbf{\Phi }}}_{{zz}}}}}{{dt}} = {{{\mathbf{F}}}_{z}}\left( {{\mathbf{s}}({{t}_{k}})} \right){{{\mathbf{\Phi }}}_{{zz}}}(t,{{t}_{0}}),\,\,\,\,{{{\mathbf{\Phi }}}_{{zz}}}({{t}_{0}},{{t}_{0}}) = {\mathbf{I}},$
$\begin{gathered} \frac{{d{{{\mathbf{B}}}_{{zz}}}}}{{dt}} = {{{\mathbf{F}}}_{z}}\left( {{\mathbf{s}}({{t}_{k}})} \right){{{\mathbf{B}}}_{{zz}}}(t,{{t}_{0}}) + {{{\mathbf{B}}}_{{zz}}}(t,{{t}_{0}}){\mathbf{F}}_{z}^{T}\left( {{\mathbf{s}}({{t}_{k}})} \right) + \\ + \,\,{{{\mathbf{G}}}_{z}}\left( {{\mathbf{s}}({{t}_{k}})} \right){\mathbf{G}}_{z}^{T}\left( {{\mathbf{s}}({{t}_{k}})} \right),\,\,\,\,{{{\mathbf{B}}}_{{zz}}}({{t}_{0}},{{t}_{0}}) = {\mathbf{0}}, \\ \end{gathered} $
где блочная корреляционная матрица ${{{\mathbf{B}}}_{{zz}}}$ имеет вид

$\begin{gathered} {{{\mathbf{B}}}_{{zz}}}(k,k - 1,{\mathbf{s}}({{t}_{k}})) = \\ = \left[ {\begin{array}{*{20}{c}} {{{{\mathbf{B}}}_{{xx}}}(k,k - 1,{\mathbf{s}}({{t}_{k}}))}&{{{{\mathbf{B}}}_{{xy}}}(k,k - 1,{\mathbf{s}}({{t}_{k}}))} \\ {{{{\mathbf{B}}}_{{yx}}}(k,k - 1,{\mathbf{s}}({{t}_{k}}))}&{{{{\mathbf{B}}}_{{yy}}}(k,k - 1,{\mathbf{s}}({{t}_{k}}))} \end{array}} \right]. \\ \end{gathered} $

Эквивалентное дискретное представление (6) непрерывных моделей векторов состояния маневрирующего объекта (1) и измерения (3) является абсолютно точным в том смысле, что для любых ${{t}_{k}} - {{t}_{{k - 1}}} > 0$ оно позволяет получить случайные процессы с теми же статистическими характеристиками, что и решение СДУ (6), без погрешностей аппроксимации [16]. Особенность задачи состоит в том, что требуемые уравнения апостериорного закона распределения ненаблюдаемого вектора состояния эквивалентной дискретной системы ${{\left[ {{{{\mathbf{x}}}^{Т}}\left( k \right),{{{\mathbf{y}}}^{Т}}\left( k \right),{{{\mathbf{s}}}^{Т}}({{t}_{k}})} \right]}^{Т}}$ определяются по наблюдаемым цифровым сигналам ${\mathbf{d}}\left( k \right)$, которые формируются квантователями АЦП путем амплитудного квантования ${{n}_{y}}$-мерного вектора

${\mathbf{y}}\left( k \right) = {{\left[ {{{y}_{1}}\left( k \right),...,{{y}_{u}}\left( k \right),...,{{y}_{{{{n}_{y}}}}}\left( k \right)} \right]}^{Т}}.$

Каждый квантователь АЦП представляет собой устройство с нулевой памятью и осуществляет безынерционную нумерацию областей квантования, в которые попадает входная величина ${{y}_{u}}\left( k \right)$, $u = \overline {1,{{n}_{y}}} $. Динамический диапазон u-го квантователя разбит на соприкасающиеся области ${{\Omega }_{u}}\left[ {k,{{l}_{u}}} \right]$, ${{l}_{u}} = \overline {1,{{L}_{u}}} $ [17]. Каждая область ограничивается порогами квантования ${{{{\eta }}}^{{(u)}}}(k,{{l}_{u}} - 1)$ и ${{{{\eta }}}^{{(u)}}}(k,{{l}_{u}})$. Цифровой сигнал ${{d}_{u}}\left( k \right)$, $\forall $ $u = \overline {1,{{n}_{y}}} $, формируется в соответствии с алгоритмом [18]

(7)
${{d}_{u}}(k) = \left\{ {\begin{array}{*{20}{c}} {{{d}_{u}}(k,1),{{y}_{u}}(k) \in {{\Omega }_{u}}\left[ {k,1} \right],} \\ { \cdot \cdot \cdot } \\ {{{d}_{u}}(k,{{l}_{u}}),{{y}_{u}}(k) \in {{\Omega }_{u}}\left[ {k,{{l}_{u}}} \right],} \\ { \cdot \cdot \cdot } \\ {{{d}_{u}}(k,{{L}_{u}}),{{y}_{u}}(k) \in {{\Omega }_{u}}\left[ {k,{{L}_{u}}} \right],} \end{array}} \right.$
${{\Omega }_{u}}\left[ {k,{{l}_{u}}} \right] = \left[ {{{{{\eta }}}^{{(u)}}}(k,{{l}_{u}} - 1),\,\,\,{{{{\eta }}}^{{(u)}}}(k,{{l}_{u}}){{l}_{u}}} \right) = \overline {1,{{L}_{u}}} ,$
где ${{L}_{u}}$ – число областей квантования. Если условие (7) выполняется для всех компонентов вектора ${\mathbf{y}}\left( k \right)$, то формируется вектор цифровых сигналов ${\mathbf{d}}\left( k \right) = {{\left[ {{{d}_{1}}\left( k \right),...,{{d}_{u}}\left( k \right),...,{{d}_{{{{n}_{y}}}}}\left( k \right)} \right]}^{Т}}$.

3. ЗАКОН РАСПРЕДЕЛЕНИЯ РАСШИРЕННОГО ВЕКТОРА СОСТОЯНИЯ ДИСКРЕТНО-НЕПРЕРЫВНОГО МАРКОВСКОГО ПРОЦЕССА

На основании свойств марковских процессов в дискретном времени запишем рекуррентные уравнения, описывающие апостериорную плотность вероятности вектора

${{\left[ {{{{\mathbf{x}}}^{Т}}(k),{{{\mathbf{y}}}^{Т}}(k),{\mathbf{s}}(t_{k}^{{}})} \right]}^{Т}} = {{\left[ {{{{\mathbf{z}}}^{Т}}(k),{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})} \right]}^{Т}}$
по наблюдаемым цифровым сигналам ${\mathbf{D}}_{1}^{k} \triangleq $ $ \triangleq \left\{ {{\mathbf{d}}\left( 1 \right),{\mathbf{d}}\left( 2 \right),...,{\mathbf{d}}\left( k \right)} \right\}$

(8)
$\begin{gathered} f\left( {{\mathbf{z}}\left( k \right),{{a}_{j}},{{b}_{m}}\left| {{\mathbf{D}}_{1}^{k}} \right.} \right) = \hat {f}\left( {{\mathbf{z}}\left( k \right),{{a}_{j}},{{b}_{m}}} \right) = \\ = \frac{1}{{P\left( {{\mathbf{d}}\left( k \right)\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)}}\sum\limits_i {\sum\limits_n {{{\pi }}_{{ij}}^{a}{{\pi }}_{{nm}}^{b}} \times } \\ \times \,\,\int {f\left( {{\mathbf{z}}\left( k \right)|{\mathbf{z}}\left( {k - 1} \right),{{a}_{j}},{{b}_{m}}} \right)} \times \\ \times \,\,\hat {f}\left( {{\mathbf{z}}\left( {k - 1} \right),{{a}_{i}}\left( {{{t}_{{k - 1}}}} \right),{{b}_{n}}\left( {{{t}_{{k - 1}}}} \right)} \right)d{\mathbf{z}}\left( {k - 1} \right), \\ \end{gathered} $
(9)
$\begin{gathered} P\left( {{\mathbf{d}}\left( k \right)\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right) = \sum\limits_j {\sum\limits_m {\sum\limits_i {\sum\limits_n {{{\pi }}_{{ij}}^{a}} } } } {{\pi }}_{{nm}}^{b} \times \\ \times \,\,\int\limits_\Omega {\int\limits_{} {f\left( {{\mathbf{y}}\left( k \right)\left| {{\mathbf{z}}\left( {k - 1} \right),{{a}_{j}},{{b}_{m}}} \right.} \right)} } \times \\ \times \,\,\hat {f}\left( {{\mathbf{z}}\left( {k - 1} \right),{{a}_{i}},{{b}_{n}}} \right)d{\mathbf{z}}\left( {k - 1} \right)d{\mathbf{y}}\left( k \right), \\ \end{gathered} $
$\sum\limits_j \triangleq \sum\limits_{j = 1}^{{{M}_{1}}} , \,\,\,\,\sum\limits_i \triangleq \sum\limits_{i = 1}^{{{M}_{1}}} , \,\,\,\,\sum\limits_m \triangleq \sum\limits_{m = 1}^{{{M}_{2}}} , \,\,\,\,\sum\limits_n \triangleq \sum\limits_{n = 1}^{{{M}_{2}}} . $

В (8) и далее для простоты записи аргументы k, $k - 1$, ${{t}_{k}}$, ${{t}_{{k - 1}}}$ всех функций, где это возможно и не вызывает сомнений, опущены, а интегрирование по переменной ${\mathbf{z}}$ ведется в области ${{\Re }^{{{{n}_{x}}}}} \times \Omega $ $\left( {\Omega \subset {{\Omega }_{1}} \times \cdot \cdot \cdot \times {{\Omega }_{{{{n}_{y}}}}}} \right)$.

Представим апостериорную плотность вероятности вектора z при условии ${{a}_{j}}({{t}_{k}})$, ${{b}_{m}}({{t}_{k}})$ – (8) в виде системы рекуррентных уравнений

(10)
$\begin{gathered} {{{\hat {f}}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right) = \hat {f}\left( {{\mathbf{z}}\left( k \right),{{a}_{j}},{{b}_{m}}} \right) = \\ = \frac{1}{{P\left( {{\mathbf{d}}\left( k \right)\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)}}{{{\tilde {f}}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right), \\ \end{gathered} $
(11)
$\begin{gathered} {{{\tilde {f}}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right) = \sum\limits_i {\sum\limits_n {{{\pi }}_{{ij}}^{a}} } {{\pi }}_{{nm}}^{b}{{{\hat {P}}}_{{in}}}(k - 1) \times \\ \times \,\,\int {f\left( {{\mathbf{z}}\left( k \right)\left| {{\mathbf{z}}\left( {k - 1} \right),{{a}_{j}},{{b}_{m}}} \right.} \right)} {{{\hat {f}}}_{{in}}}\left( {{\mathbf{z}}\left( {k - 1} \right)} \right)d{\mathbf{z}}\left( {k - 1} \right), \\ \end{gathered} $
где ${{\tilde {f}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right) = f\left( {{\mathbf{z}}\left( k \right)\left| {{{a}_{j}},{{b}_{m}},{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)$ – условная плотность вероятности вектора ${{\left[ {{{{\mathbf{z}}}^{Т}}(k),{{a}_{j}}({{t}_{k}}),{{b}_{m}}({{t}_{k}})} \right]}^{Т}}$.

Апостериорная вероятность дискретной компоненты ДНМП при условии ${{a}_{j}}({{t}_{k}})$, ${{b}_{m}}({{t}_{k}})$${{\hat {P}}_{{jm}}}(k)$ описывается системой рекуррентных уравнений:

(12)
$\begin{gathered} {{{\hat {P}}}_{{jm}}}(k) = P\left( {{{a}_{j}},{{b}_{m}}\left| {{\mathbf{D}}_{1}^{k}} \right.} \right) = \\ = \frac{{P\left( {{\mathbf{d}}\left( k \right),{{a}_{j}},{{b}_{m}}\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)}}{{P\left( {{\mathbf{d}}\left( k \right)\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)}}{{{\tilde {P}}}_{{jm}}}(k), \\ \end{gathered} $
(13)
${{\tilde {P}}_{{jm}}}(k) = \sum\limits_i {\sum\limits_n {{{\pi }}_{{ij}}^{a}} } {{\pi }}_{{nm}}^{b}{{\hat {P}}_{{in}}}(k - 1),$
(14)
$\begin{gathered} P\left( {{\mathbf{d}}\left( k \right),{{a}_{j}},{{b}_{m}}\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right) = \\ = \int\limits_\Omega {f\left( {{\mathbf{y}}\left( k \right)\left| {{{a}_{j}},{{b}_{m}},{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)\,} d{\mathbf{y}}\left( k \right), \\ \end{gathered} $
где $P\left( {{\mathbf{d}}\left( k \right),{{a}_{j}},{{b}_{m}}\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right)$ – условная вероятность одношагового предсказания наблюдаемого цифрового сигнала (вывод уравнений (8)–(14) приведен в Приложении).

Для замыкания систем уравнений (10)–(14) необходимо выполнить двухмоментную параметрическую гауссовскую аппроксимацию условной плотности вероятности ${{\tilde {f}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right)$. Эта аппроксимация состоит в замене неизвестных функций ${{\tilde {f}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right)$ некоторыми известными функциями, в частности ${\mathbf{\tilde {z}}}(k,{{a}_{j}},{{b}_{m}})$, ${{{\mathbf{\tilde {R}}}}_{{zz}}}(k,{{a}_{j}},{{b}_{m}})$ – математического ожидания и корреляционной функции условной плотности вероятности ${{\tilde {f}}_{{jm}}}\left( {{\mathbf{z}}\left( k \right)} \right)$ соответственно [19].

4. КВАЗИОПТИМАЛЬНЫЙ АЛГОРИТМ ОЦЕНИВАНИЯ ВЕКТОРА СОСТОЯНИЯ ДИСКРЕТНО-НЕПРЕРЫВНОГО МАРКОВСКОГО ПРОЦЕССА ПО НАБЛЮДАЕМЫМ ЦИФРОВЫМ СИГНАЛАМ

Задача оценивания считается практически решенной, если на выходе рекуррентного цифрового фильтра (ЦФ) на каждом k-м шаге формируется безусловная оптимальная оценка, соответствующая определенному критерию оптимальности. Байесовское решение может быть получено на основе минимизации условного апостериорного риска (УАР), которая выполняется в два этапа: сначала по непрерывному компоненту (при каждом фиксированном значении дискретного компонента), а затем по дискретному компоненту. На втором этапе на основе сравнения УАР ${{\gamma }_{{jm}}}\left( k \right)$ выбираются оптимальные оценки ${{\hat {a}}_{j}}({{t}_{k}})$, ${{\hat {b}}_{m}}({{t}_{k}})$дискретных параметров, если выполняется условие

(15)
$\begin{gathered} {{\gamma }_{{jm}}}(k) \leqslant {{\gamma }_{{in}}}(k),\,\,\,\,i,j = \overline {1,{{M}_{1}}} ,\,\,\,\,n,m = \overline {1,{{M}_{2}}} , \\ i \ne j,\,\,\,\,m \ne n. \\ \end{gathered} $

В (15) выражение УАР для функции потерь простой по дискретному и квадратичной по непрерывному компонентам имеет вид [12]

(16)
$\begin{gathered} {{\gamma }_{{jm}}}(k) = \sum\limits_{{\mu }} {\sum\limits_{{\nu }} {{{{\hat {P}}}_{{j{{\mu }}}}}(k)} } {{{\hat {P}}}_{{m{\text{v}}}}}(k)\left\{ {{{\alpha }_{{jm{{\mu \nu }}}}} + } \right. \\ + \,\,{{\beta }_{{jm{{\mu \nu }}}}}{\text{Tr}}\left\{ {{\mathbf{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{R} }}(k,{{a}_{{{\mu }}}},{{b}_{{{\nu }}}}) + } \right. \\ + \,\,\left( {{\mathbf{\hat {z}}}(k,{{a}_{j}},{{b}_{m}}) - {\mathbf{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{z} }}(k,{{a}_{{{\mu }}}},{{b}_{{{\nu }}}})} \right) \times \\ \left. { \times \,\,\left. {{{{\left( {{\mathbf{\hat {z}}}(k,{{a}_{j}},{{b}_{m}}) - {\mathbf{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{z} }}(k,{{a}_{{{\mu }}}},{{b}_{{{\nu }}}})} \right)}}^{T}}} \right\}} \right\}, \\ \end{gathered} $
где ${\mathbf{\hat {z}}}(k,{{a}_{j}},{{b}_{m}})$ – оптимальная условная оценка [20],
(17)
${\mathbf{\hat {z}}}(k,{{a}_{j}},{{b}_{m}}) = \frac{{\sum\limits_{{\mu }} {\sum\limits_{{\nu }} {{{{\hat {P}}}_{{j{{\mu }}}}}(k)} } {{{\hat {P}}}_{{m{\text{v}}}}}(k){{\beta }_{{jm{{\mu \nu }}}}}{\mathbf{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{z} }}(k,{{a}_{{{\mu }}}},{{b}_{{{\nu }}}})}}{{\sum\limits_{{\mu }} {\sum\limits_{{\nu }} {{{{\hat {P}}}_{{j{{\mu }}}}}(k)} } {{{\hat {P}}}_{{m{\text{v}}}}}(k){{\beta }_{{jm{{\mu \nu }}}}}}},$
(18)
${{\alpha }_{{jm{{\mu \nu }}}}} = 1 - {{g}_{{{{\mu \nu }}}}}{{\delta }_{{jm{{\mu \nu }}}}},\,\,\,\,{{\beta }_{{jm{{\mu \nu }}}}} = {{g}_{{{{\mu \nu }}}}}{{c}_{{{{\mu \nu }}}}}{{\delta }_{{jm{{\mu \nu }}}}},$
${\mathbf{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{z} }}(k,{{a}_{{{\mu }}}},{{b}_{{{\nu }}}})$, ${\mathbf{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{R} }}(k,{{a}_{{{\mu }}}},{{b}_{{{\nu }}}})$ – математическое ожидание и корреляционная матрица условной апостериорной плотности вероятности ${{\hat {f}}_{{{{\mu \nu }}}}}\left( {{\mathbf{z}}\left( k \right)} \right)$ соответственно; ${{g}_{{{{\mu \nu }}}}}$, ${{c}_{{{{\mu \nu }}}}}$ – коэффициенты потерь; ${{{{\delta }}}_{{jm{{\mu \nu }}}}}$ – символ Кронекера.

При выполнении условия (15) за окончательную оценку отсчетов вектора состояния ${\mathbf{z}}\left( k \right)$ принимается соответствующая условная оценка ${\mathbf{\hat {z}}}(k,{{a}_{j}},{{b}_{m}})$. Из (15) и (16) следует, что в качестве оценок дискретных компонентов ${{\hat {a}}_{j}}({{t}_{k}})$, ${{\hat {b}}_{m}}({{t}_{k}})$ берется решение, для которого взвешенная сумма потерь (выражение в фигурных скобках в (16)) минимальна. Причем эта сумма растет с уменьшением апостериорной точности фильтрации вектора ${\mathbf{z}}\left( k \right)$, что является важным для практических приложений [21]. Для определения УАР ${{\gamma }_{{jm}}}(k)$, $\forall j = \overline {1,{{M}_{1}}} $, $m = \overline {1,{{M}_{2}}} $, может быть использован квазиоптимальный алгоритм цифровой фильтрации непрерывных компонентов вектора состояния ДНМП, который описывается системой рекуррентных уравнений и получен с учетом гауссовской аппроксимации условной плотности вероятности $\tilde {f}({\mathbf{z}}\left( k \right),{{a}_{j}},{{b}_{m}})$ и оптимизации процедуры квантования

(19)
$\begin{gathered} {\mathbf{\tilde {x}}}(k,{{a}_{j}},{{b}_{m}}) = \\ = \sum\limits_i {\sum\limits_n {\frac{{{{\pi }}_{{ij}}^{a}{{\pi }}_{{nm}}^{b}{{{\hat {P}}}_{{in}}}(k - 1)}}{{{{{\tilde {P}}}_{{jm}}}(k)}}} } {{{\mathbf{\Phi }}}_{{xx}}}({{a}_{j}}){\mathbf{\hat {x}}}(k - 1,{{a}_{i}},{{b}_{n}}), \\ \end{gathered} $
(20)
$\begin{gathered} {{{{\mathbf{\tilde {R}}}}}_{{xx}}}(k,{{a}_{j}},{{b}_{m}}) = \sum\limits_i {\sum\limits_n {\frac{{{{\pi }}_{{ij}}^{a}{{\pi }}_{{nm}}^{b}{{{\hat {P}}}_{{in}}}(k - 1)}}{{{{{\tilde {P}}}_{{jm}}}(k)}}} } \times \\ \times \,\,\left\{ {{{{\mathbf{\Phi }}}_{{xx}}}\left( {{{a}_{j}}} \right){\mathbf{\hat {R}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right){\mathbf{\Phi }}_{{xx}}^{T}\left( {{{a}_{j}}} \right) + {{{\mathbf{B}}}_{{xx}}}\left( {{{a}_{j}}} \right)} \right. + \\ + \,\,\left[ {{{{\mathbf{\Phi }}}_{{xx}}}\left( {{{a}_{j}}} \right){\mathbf{\hat {x}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right) - {\mathbf{\tilde {x}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right)} \right] \times \\ \times \,\,\left[ {{{{\mathbf{\Phi }}}_{{xx}}}\left( {{{a}_{j}}} \right){\mathbf{\hat {x}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right) - {\mathbf{\tilde {x}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right)} \right]\left. {^{T}} \right\}, \\ \end{gathered} $
(21)
$\begin{gathered} {\mathbf{\tilde {y}}}(k,{{a}_{j}},{{b}_{m}}) = \\ = \sum\limits_i {\sum\limits_n {\frac{{{{\pi }}_{{ij}}^{a}{{\pi }}_{{nm}}^{b}{{{\hat {P}}}_{{in}}}(k - 1)}}{{{{{\tilde {P}}}_{{jm}}}(k)}}} } {{{\mathbf{\Phi }}}_{{yx}}}({{a}_{j}},{{b}_{m}}){\mathbf{\hat {x}}}(k - 1,{{a}_{i}},{{b}_{n}}), \\ \end{gathered} $
(22)
$\begin{gathered} {{{{\mathbf{\tilde {R}}}}}_{{xy}}}(k,{{a}_{j}},{{b}_{m}}) = \sum\limits_i {\sum\limits_n {\frac{{{{\pi }}_{{ij}}^{a}{{\pi }}_{{nm}}^{b}{{{\hat {P}}}_{{in}}}(k - 1)}}{{{{{\tilde {P}}}_{{jm}}}(k)}}} } \times \\ \times \,\,{\mathbf{\hat {x}}}(k - 1,{{a}_{i}},{{b}_{n}})\left( {{{{\mathbf{\Phi }}}_{{xx}}}\left( {{{a}_{j}},{{b}_{m}}} \right)} \right. \times \\ \times \,\,\left. {{{{{\mathbf{\hat {R}}}}}_{{xx}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right){\mathbf{\Phi }}_{{yx}}^{T}\left( {{{a}_{j}},{{b}_{m}}} \right) + {{{\mathbf{B}}}_{{xy}}}\left( {{{a}_{j}},{{b}_{m}}} \right)} \right), \\ \end{gathered} $
(23)
$\begin{gathered} {{{{\mathbf{\tilde {R}}}}}_{{yy}}}(k,{{a}_{j}},{{b}_{m}}) = \sum\limits_i {\sum\limits_n {\frac{{{{\pi }}_{{ij}}^{a}{{\pi }}_{{nm}}^{b}{{{\hat {P}}}_{{in}}}(k - 1)}}{{{{{\tilde {P}}}_{{jm}}}(k)}}} } \times \\ \times \,\,\left\{ {{{{\mathbf{\Phi }}}_{{yx}}}\left( {{{a}_{j}}} \right){{{{\mathbf{\hat {R}}}}}_{{xx}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right){\mathbf{\Phi }}_{{yx}}^{T}\left( {{{a}_{j}}} \right)} \right. + {{{\mathbf{B}}}_{{xx}}}\left( {{{a}_{j}}} \right) + \\ + \,\,{{\left[ {{{{\mathbf{\Phi }}}_{{yx}}}\left( {{{a}_{j}}} \right){\mathbf{\hat {x}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right) - {\mathbf{\tilde {y}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right)} \right]}^{{}}} \times \\ \times \,\,\left[ {{{{\mathbf{\Phi }}}_{{yx}}}\left( {{{a}_{j}}} \right){\mathbf{\hat {x}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right) - {\mathbf{\tilde {y}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right)} \right]\left. {^{T}} \right\} = \\ = {{{\mathbf{T}}}_{{yy}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right){\mathbf{T}}_{{yy}}^{T}\left( {k,{{a}_{j}},{{b}_{m}}} \right), \\ \end{gathered} $
(24)
${\mathbf{K}}(k,{{a}_{j}},{{b}_{m}}) = {{{\mathbf{\tilde {R}}}}_{{xy}}}(k,{{a}_{j}},{{b}_{m}}){\mathbf{T}}_{{yy}}^{{ - 1}}\left( {k,{{a}_{j}},{{b}_{m}}} \right),$
(25)
$\begin{gathered} {\mathbf{\hat {x}}}(k,{{a}_{j}},{{b}_{m}}) = {\mathbf{\tilde {x}}}(k,{{a}_{j}},{{b}_{m}}) + \\ + \,\,{\mathbf{K}}(k,{{a}_{j}},{{b}_{m}}){{{\mathbf{Y}}}_{{{\text{opt}}}}}(k,{\mathbf{d}}\left( k \right)), \\ \end{gathered} $
(26)
$\begin{gathered} {{{{\mathbf{\hat {R}}}}}_{{xx}}}(k,{{a}_{j}},{{b}_{m}}) = {{{{\mathbf{\tilde {R}}}}}_{{xx}}}(k,{{a}_{j}},{{b}_{m}}) + \\ + \,\,{{{{\mathbf{\tilde {R}}}}}_{{xy}}}(k,{{a}_{j}},{{b}_{m}}){\mathbf{\tilde {R}}}_{{yy}}^{{ - 1}}(k,{{a}_{j}},{{b}_{m}}) \times \\ \times \,\,\left[ {{\mathbf{I}} - {{{\mathbf{E}}}_{{kb}}}} \right]{\mathbf{\tilde {R}}}_{{xy}}^{T}(k,{{a}_{j}},{{b}_{m}}), \\ \end{gathered} $
(27)
$\begin{gathered} {{{\mathbf{T}}}_{{yy}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right){{{\mathbf{H}}}_{{{\text{opt}}}}}(k,{{l}_{u}} - 1) < \\ < \int\limits_{{{t}_{{k - 1}}}}^{{{t}_{k}}} {{\mathbf{v}}({{\tau }})d{{\tau }} - {\mathbf{\tilde {y}}}(k,{{a}_{j}},{{b}_{m}})} \leqslant {{{\mathbf{T}}}_{{yy}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right){{{\mathbf{H}}}_{{{\text{opt}}}}}(k,{{l}_{u}}), \\ \end{gathered} $
(28)
$\begin{gathered} {{{\mathbf{H}}}_{{{\text{opt}}}}}(k,{{l}_{u}}) = {{[{{\eta }}_{{{\text{opt}}}}^{{(1)}},...,{{\eta }}_{{{\text{opt}}}}^{{(u)}},...,{{\eta }}_{{{\text{opt}}}}^{{({{n}_{y}})}}]}^{T}}, \\ {{{\mathbf{Y}}}_{{{\text{opt}}}}}(k,{{l}_{u}}) = {{[y_{{{\text{opt}}}}^{{(1)}},...,y_{{{\text{opt}}}}^{{(u)}},...,y_{{{\text{opt}}}}^{{({{n}_{y}})}}]}^{T}}, \\ \forall u = \overline {1,{{n}_{y}}} ,\,\,\,\,{{\eta }}_{{{\text{opt}}}}^{{(u)}} = \left( {{{l}_{u}} - {{{{L}_{u}}} \mathord{\left/ {\vphantom {{{{L}_{u}}} 2}} \right. \kern-0em} 2}} \right){{\delta }}_{{{\text{opt}}}}^{{(u)}}, \\ y_{{{\text{opt}}}}^{{(u)}} = \left( {{{l}_{u}} - {{({{L}_{u}} + 1)} \mathord{\left/ {\vphantom {{({{L}_{u}} + 1)} 2}} \right. \kern-0em} 2}} \right){{\delta }}_{{{\text{opt}}}}^{{(u)}},\,\,\,\,d_{k}^{{(u)}} = y_{{{\text{opt}}}}^{{(u)}}, \\ {{{\mathbf{E}}}_{{kb}}} = {{\left[ {{{\varepsilon }}_{{{\text{opt}}}}^{{(u)}}{{{{\delta }}}_{{uw}}}} \right]}^{{}}},\,\,\,\,u,w = \overline {1,{{n}_{y}}} . \\ \end{gathered} $

Уравнения ${\text{o}}$ценивания дискретных компонентов вектора состояния (10), (11) остаются без изменения, при этом условная вероятность одношагового предсказания наблюдаемого цифрового сигнала имеет вид

(29)
$\begin{gathered} P\left( {{\mathbf{d}}\left( k \right),{{a}_{j}},{{b}_{m}}\left| {{\mathbf{D}}_{1}^{{k - 1}}} \right.} \right) = \\ \prod\limits_{u = 1}^{{{n}_{y}}} {\left\{ {F\left\{ {\frac{{{{\eta }}_{{{\text{opt}}}}^{{(u)}}({{l}_{u}}) - {{{\tilde {y}}}_{u}}(k,{{a}_{j}},{{b}_{m}})}}{{{{{{\tau }}}_{u}}(k)}}} \right\}} \right.} - \\ \left. { - \,\,F\left\{ {\frac{{{{\eta }}_{{{\text{opt}}}}^{{(u)}}({{l}_{u}} - 1) - {{{\tilde {y}}}_{u}}(k,{{a}_{j}},{{b}_{m}})}}{{{{{{\tau }}}_{u}}(k)}}} \right\}} \right\}, \\ \end{gathered} $
где ${{\tilde {y}}_{u}}(k,{{a}_{j}},{{b}_{m}})$и-й элемент вектора ${\mathbf{\tilde {y}}}(k,{{a}_{j}},{{b}_{m}})$; ${{{{\tau }}}_{u}}$ ($u = \overline {1,{{n}_{y}}} $) – диагональный элемент нижней треугольной матрицы ${{{\mathbf{T}}}_{{yy}}}\left( {k,{{a}_{j}},{{b}_{m}}} \right)$; $F\left\{ \cdot \right\}$ – интеграл вероятности. Значения ${{\delta }}_{{{\text{opt}}}}^{{(u)}}$, ${{\varepsilon }}_{{{\text{opt}}}}^{{(u)}}$ оптимального равномерного шага и среднего квадрата ошибок квантования для заданного числа уровней квантования ${{L}_{u}}$ приведены в [13]. Квазиоптимальный ЦФ, реализующий алгоритм (10), (11), (17)(28), является многоканальным с числом каналов $M = {{M}_{1}} \times {{M}_{2}}$ (рис. 1). Каждый канал состоит из многоканального АЦП (МКАЦП), цифроаналогового преобразователя ЦАП; блока вычисления коэффициента усиления КУ ${\mathbf{K}}(k,{{a}_{j}},{{b}_{m}})$, блока оценки БО, в котором вычисляются ${\mathbf{\hat {x}}}(k,{{a}_{j}},{{b}_{m}})$, ${\mathbf{\hat {x}}}(k - 1,{{a}_{i}},{{b}_{n}})$; блока прогноза БП, в котором вычисляются ${\mathbf{\tilde {x}}}(k,{{a}_{j}},{{b}_{m}})$, ${{{\mathbf{\tilde {y}}}}_{{jm}}}(k)$; блока апостериорных вероятностей БАВ, в котором вычисляются ${{\hat {P}}_{{jm}}}(k)$, ${{\hat {P}}_{{in}}}(k - 1)$, ${{\tilde {P}}_{{jm}}}(k)$, и блока корреляционных матриц БКМ, в котором вычисляются ${{{\mathbf{\tilde {R}}}}_{{xx}}}(k,{{a}_{j}},{{b}_{m}})$, ${{{\mathbf{\tilde {R}}}}_{{xy}}}(k,{{a}_{j}},{{b}_{m}})$, ${{{\mathbf{\tilde {R}}}}_{{yy}}}(k,{{a}_{j}},{{b}_{m}})$, ${{{\mathbf{\hat {R}}}}_{{xx}}}(k,{{a}_{j}},{{b}_{m}})$ и ${{{\mathbf{\hat {R}}}}_{{xx}}}\left( {k - 1,{{a}_{i}},{{b}_{n}}} \right)$. Окончательное решение о принятии оценок ${\mathbf{\hat {x}}}(k)$, ${{\hat {a}}_{j}}({{t}_{k}})$, ${{\hat {b}}_{m}}({{t}_{k}})$ производится в решающем устройстве РУ.

Рис. 1.

Квазиоптимальный М-канальный цифровой фильтр дискретно-непрерывного марковского процесса (условные обозначения см. в тексте).

Основной особенностью МКAЦП является формирование значений вектора ${\mathbf{y}}\left( k \right)$ накоплением аналоговым путем измеряемого процесса ${\mathbf{v}}\left( t \right)$ на интеграторе со сбросом в конце каждого интервала дискретизации. Полученная таким образом последовательность ${\mathbf{y}}\left( k \right)$ преобразуется квантователем Кв в цифровые сигналы ${\mathbf{d}}\left( k \right)$, которые далее участвуют в алгоритме формирования оценок.

Пример. В качестве примера использования полученных квазиоптимальных алгоритмов рассмотрим задачу синтеза цифрового фильтра ДНМП вида

(30)
$\begin{gathered} \frac{{dx\left( t \right)}}{{dt}} = - \,{{\alpha }}x\left( t \right) + \sqrt {2{{\alpha \sigma }}_{x}^{2}\left( {{{a}_{j}}({{t}_{k}})} \right)} {{\xi }}\left( t \right), \\ x\left( {{{t}_{0}}} \right) = {{x}_{0}},\,\,\,\,j = 1,2, \\ \end{gathered} $
где $\alpha $ – коэффициент, характеризующий ширину спектральной плотности ДНМП; ${{\sigma }}_{x}^{2}\left( {{{a}_{j}}({{t}_{k}})} \right)$ – дисперсия оцениваемого ДНМП, значение которой изменяется по закону марковской цепи в дискретные моменты времени ${{t}_{k}}$; ${{\xi }}\left( t \right)$ – стандартный БГШ с нулевым математическим ожиданием и единичной интенсивностью.

Пусть на вход АЦП цифрового фильтра поступает непрерывный случайный процесс

(31)
$v\left( t \right) = hx\left( t \right) + \sqrt {\frac{{{{N}_{0}}}}{2}} {{\varsigma }}\left( t \right),$
где h – известный коэффициент; ${{\varsigma }}\left( t \right)$ – стандартный БГШ с нулевым математическим ожиданием и единичной интенсивностью, N0 – спектральная плотность БГШ. Требуется по наблюдаемым цифровым сигналам получить текущую оценку $\hat {x}\left( {{{t}_{k}}} \right)$ отсчетов ДНМП $x\left( t \right)$, описываемого стохастическим дифференциальным уравнением (30).

С учетом (4) совместный марковский процесс ${\mathbf{z}} = {{\left[ {\begin{array}{*{20}{c}} x&y \end{array}} \right]}^{T}}$ в этом случае описывается уравнением (5), в котором

${{{\mathbf{F}}}_{z}} = \left[ {\begin{array}{*{20}{c}} { - {\kern 1pt} {\kern 1pt} {{\alpha }}}&0 \\ h&0 \end{array}} \right],\,\,\,\,{{{\mathbf{G}}}_{z}}\left( {{{a}_{j}}({{t}_{k}})} \right) = \left[ {\begin{array}{*{20}{c}} {\sqrt {2{{\alpha \sigma }}_{x}^{2}\left( {{{a}_{j}}({{t}_{k}})} \right)} }&0 \\ 0&{\sqrt {\frac{{{{N}_{0}}}}{2}} } \end{array}} \right].$

Элементы фундаментальной матрицы ${\mathbf{\Phi }}_{{zz}}^{{}}\left( \Delta \right)$ и матрица ${\mathbf{B}}_{{zz}}^{{}}\left( {\Delta ,{{a}_{j}}({{t}_{k}})} \right)$ определяются соотношениями

$\begin{gathered} {{\Phi }_{{xx}}} = \exp \left\{ { - {{\alpha \Delta }}} \right\},\,\,\,\,{{\Phi }_{{xy}}} = 0, \\ {{\Phi }_{{yx}}} = {{\chi }}\left( {1 - \exp \left\{ { - {{\alpha \Delta }}} \right\}} \right), \\ {{\Phi }_{{yy}}} = 1,\,\,\,\,{{B}_{{xx}}} = 1 - \exp \left\{ { - 2{{\alpha \Delta }}} \right\}, \\ {{B}_{{xy}}} = {{B}_{{yx}}} = {{\chi }}{{\left( {1 - \exp \left\{ { - {{\alpha \Delta }}} \right\}} \right)}^{2}},\,\,\,\,{{B}_{{yy}}}\left( {{{a}_{j}}({{t}_{k}})} \right) = \\ = {{{{\chi }}}^{2}}\left( {{{\alpha \Delta }}\left( {2 + {{q}^{{ - 1}}}\left( {{{a}_{j}}({{t}_{k}})} \right)} \right) - \left( {{{{\left( {2 - \exp \left\{ { - {{\alpha \Delta }}} \right\}} \right)}}^{2}} - 1} \right)} \right), \\ q\left( {{{a}_{j}}({{t}_{k}})} \right) = \frac{{2{{h}^{2}}{{a}_{j}}({{t}_{k}})}}{{{{\alpha }}{{N}_{0}}}}, \\ \end{gathered} $
где αΔ, χ = h/α – безразмерные коэффициенты; q – отношение сигнал–шум; $\Delta = {{t}_{k}} - {{t}_{{k - 1}}}$ – интервал дискретизации.

Алгоритм оценивания ДНМП $x\left( t \right)$ по наблюдаемым цифровым сигналам описывается уравнениями (19)(29). Оценка дискретного компонента определяется по решающему правилу (12)–(14). Квазиоптимальный ЦФ, реализующий алгоритм (12)(14), (19)(29), является двухканальным. Окончательное решение о принятии оценок $\hat {x}(k)$, ${{\hat {a}}_{j}}({{t}_{k}})$ производится в РУ.

Проверка качества квазиоптимального алгоритма проведена с помощью статистического моделирования на ЭВМ для случая, когда параметры уравнений (30), (31): ${{\alpha }}$ = 0.1 с–1, $\Delta $ = 1 с, $h$ = 1, $q$ = = 1 … 1000, а цепь Маркова принимает значения ${{a}_{1}}$ = 1, ${{a}_{2}}$ = 10. Вероятности перехода ${{{{\pi }}}_{{11}}}$ = 0.8; ${{{{\pi }}}_{{12}}}$ = 0.2. В целях повышения наглядности функционирования алгоритма была сформирована тестовая реализации для дискретного компонента $A\left( k \right)$. При этом было принято, что длина реализации $k = \overline {1,50} $, а цепь Маркова принимает значения

$A\left( k \right) = \left\{ {\begin{array}{*{20}{c}} {{{a}_{1}},}&{10 \leqslant k < 20} \\ {{{a}_{2}},}&{1 \leqslant k < 10{{,}_{{}}}20 \leqslant k < 50} \end{array}} \right..$

При определении статистических характеристик квазиоптимальных алгоритмов фильтрации методом Монте-Карло проводилось 100 испытаний, при этом тестовая реализация дискретной цепи Маркова A(k) сохранялась неизменной, а независимые гауссовские последовательности nx(k), ny(k) формировались с помощью датчика случайных чисел.

На рис. 2 представлены графики зависимости относительного среднего квадрата ошибки цифровой фильтрации $\varepsilon $ от отношения сигнал/шум q при различных значениях числа уровней квантования L. Здесь же для сравнения приведена зависимость $\varepsilon $ от q при аналоговой оптимальной фильтрации ДНМП [5]. Все кривые получены интерполяцией значений оценок $\varepsilon $, полученных при моделировании.

Рис. 2.

Зависимость относительного среднего квадрата ошибки цифровой фильтрации $\varepsilon $ от отношения сигнал/шум q при различных значениях числа уровней квантования L = 2 (1), 4 (2), 8 (3), L→ ∞ (4), αΔ → 0 (5).

Следует отметить, что полученное при синтезе ЦФ ДНМП значение отношения сигнал/шум q (исходя из его физической сущности) является единым для цифровых (дискретных) и аналоговых алгоритмов фильтрации [16]. Это позволяет достаточно просто сравнить точность и помехоустойчивость квазиоптимальной цифровой, дискретной и аналоговой фильтрации.

На рис. 3 представлены зависимости вероятности правильного определения значений марковской цепи A(k) от дискретного времени при различных отношениях сигнал/шум q. Здесь же приведена тестовая последовательность марковской цепи A(k).

Рис. 3.

Зависимость вероятности правильного определения значений марковской цепи A(k) от дискретного времени при различных отношениях сигнал/шум q и тестовая последовательность марковской цепи A(k).

ЗАКЛЮЧЕНИЕ

Для оптимизации алгоритмов оценивания дискретно-непрерывных марковских процессов по наблюдаемым цифровым сигналам применено эквивалентное дискретное представление непрерывных компонентов этих процессов. Полученный квазиоптимальный алгоритм оценивания вектора состояния дискретно-непрерывных марковских процессов позволяет построить практически реализуемый ЦФ на базе высокопроизводительной вычислительной техники.

Список литературы

  1. Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления. М.: Изд-во МГУ, 1966.

  2. Тихонов В.И., Миронов М.А. Марковские процессы. М.: Сов. радио, 1977.

  3. Тихонов В.И., Кульман Н.К. Нелинейная фильтрация и квазикогерентный приём сигналов. М.: Сов. радио, 1975.

  4. Тихонов В.И., Харисов В.Н. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991.

  5. Тихонов В.И., Степанов Д.С. // РЭ. 1973. Т. 18. № 7. С. 1376.

  6. Тихонов В.И., Харисов В.Н., Смирнов В.А. // РЭ. 1978. Т. 23. № 7. С. 1442.

  7. Сосулин Ю.Г. Теория обнаружения и оценивания стохастических сигналов. М.: Сов. радио, 1978.

  8. Ярлыков М.С. Применение марковской теории оценивания случайных процессов в радиотехнике. М.: Сов. радио, 1980.

  9. Ярлыков М.С., Миронов М.А. Марковская теория оценивания случайных процессов. М.: Радио и связь, 1993.

  10. Чердынцев В.А. // Изв. АН БССР. Сер. физ.-техн. наук. 1975. № 2. С. 102.

  11. Чердынцев В.А. Статистическая теория совмещенных радиотехнических систем. Минск: Высш. школа, 1980.

  12. Жук С.Я. // Изв. вузов СССР. Радиоэлектроника. 1988. Т. 31. № 1. С. 33.

  13. Величкин А.И. Передача аналоговых сообщений по цифровым каналам связи. М.: Радио и связь, 1983.

  14. Горбунов Ю.Н. Цифровая обработка радиолокационных сигналов в условиях использования грубого (малоразрядного) квантования. М.: ЦНИРТИ им. акад. А.И. Берга, 2008.

  15. Федосов Е.А., Инсаров В.В., Селивохин О.С. Системы управления конечным положением в условиях противодействия среды. М.: Наука, 1989.

  16. Mиpoнoв M.A. // PЭ. 1993. T. 38. № 1. C. 109.

  17. Beличкин A.И. // PЭ. 1990. T. 35. № 7. C. 1471.

  18. Дeткoв A.H. // PЭ. 1995. T. 42. № 5. C. 1406.

  19. Детков А.Н. // Изв. РАН. Теория и системы управления. 1997. № 2. С. 73.

  20. Дeткoв A.H. // PЭ. 2017. T. 62. № 6. C. 556.

  21. Тихонов В.И. Статистическая радиотехника. М.: Радио и связь, 1982.

Дополнительные материалы отсутствуют.