Доклады Российской академии наук. Математика, информатика, процессы управления, 2022, T. 507, № 1, стр. 81-85

ПОСТРОЕНИЕ ЭФФЕКТИВНЫХ РАНДОМИЗИРОВАННЫХ ПРОЕКЦИОННЫХ ОЦЕНОК РЕШЕНИЙ ИНТЕГРАЛЬНЫХ УРАВНЕНИЙ НА ОСНОВЕ ПОЛИНОМОВ ЛЕЖАНДРА

Член-корреспондент РАН Г. А. Михайлов 12*, А. С. Корда 1**, С. В. Рогазинский 12***

1 Институт вычислительной математики и математической геофизики Сибирского отделения Российской академии наук
Новосибирск, Россия

2 Новосибирский государственный университет
Новосибирск, Россия

* E-mail: gam@sscc.ru
** E-mail: asc@osmf.sscc.ru
*** E-mail: svr@osmf.sscc.ru

Поступила в редакцию 02.06.2022
После доработки 08.09.2022
Принята к публикации 21.11.2022

Полный текст (PDF)

Аннотация

Строятся и оптимизируются численно-статистические проекционные оценки решений интегральных уравнений с использованием полиномов Лежандра в связи с вычислительной сложностью ортогональных разложений с адаптированным весом. На основе аналитических и соответствующих численных расчетов минимизируется среднеквадратическая погрешость как функция длины используемого отрезка проекционного разложения при фиксированном объеме статистической выборки, реализуемой для оценки коэффициентов разложения. Предлагаемая методика успешно апробирована в тестовой задаче, близкой к проблеме Милна, причем она оказалась весьма эффективной, сравнительно с использованием регуляризованного разложения по полиномам Лагерра.

Ключевые слова: метод Монте-Карло, проекционная оценка, среднеквадратическая погрешность, оценка по столкновениям, прямое моделирование, полиномы Лежандра, индикатриса Хеньи–Гринстейна

1. Работа посвящена построению и оптимизации численно-статистических проекционных оценок одномерных функциональных характеристик $\varphi (z),0 \leqslant z \leqslant H < + \infty ,$ решения интегральных уравнений вида

(1)
$\Phi (x) = \int\limits_X k(x{\kern 1pt} ',x)\Phi (x{\kern 1pt} ')dx{\kern 1pt} '\, + f(x),$
или $\Phi = K\Phi + f.$ Здесь $x \in {{R}_{n}},$ $K \in [{{L}_{1}} \to {{L}_{1}}],$ $f \in {{L}_{1}}(x)$ и спектральный радиус $\rho ({{K}_{1}}) < 1$, где K1 – интегральный оператор с ядром ${\text{|}}k(x{\kern 1pt} ',x){\text{|}}$. Функция $\varphi (z)$ получается интегрированием решения $\Phi (x)$ по всем переменным, кроме $z \in {{R}_{1}}$ в некоторой системе координат. Для простоты изложения далее предполагается, что z – одна из координат фазовой точки: $z = z(x)$.

Методом Монте-Карло уравнения типа (1) решаются с помощью моделирования специальных цепей Маркова [1]. Важной частью такого метода являются оценки функциональных зависимостей, в основном разные типы ядерных и статистических проекционных оценок (см., например, [1]). Решая конкретную задачу, необходимо проводить сравнительный анализ таких оценок, предварительно их оптимизируя. Следует отметить, что использовать статистические проекционные оценки в методе Монте-Карло впервые предложил Н.Н Ченцов [2], разработавший общую методику их оптимизации, которая требует существенной доработки и детализации в конкретных задачах. Простая приближенная оптимизация специальных статистических проекционных оценок для решения задач из областей эффективного применения метода Монте-Карло (переноса излучения с учетом поляризации, теории разреженных газов) использована в [3, 4]. Она может быть существенно улучшена с использованием излагаемых далее результатов.

В настоящей работе предлагается детализированная универсальная методика оптимизации для практически важного класса статистических проекционных оценок с использованием комбинации аналитических и соответствующих численных расчетов.

С целью построения функции $\varphi (z) \in {{L}_{2}}(0,H)$ используется ее разложение по полиномам Лежандра $\{ {{\psi }_{i}}(z)\} $ (см. [5]), ортонормированным в заданном интервале $(0,H)$:

(2)
$\begin{gathered} \varphi (z) \approx {{\varphi }_{m}}(z) = \sum\limits_{i = 0}^m {{a}_{i}}{{\psi }_{i}}(z), \\ {{a}_{i}} = (\varphi ,{{\psi }_{i}}) = \int\limits_X \varphi (x){{\psi }_{i}}(z(x))dx. \\ \end{gathered} $

В процессе расчетов значения полиномов вычисляются рекуррентно [6]:

$\begin{gathered} {{\psi }_{0}}(z) = \frac{1}{{\sqrt 2 }},\quad {{\psi }_{1}}(z) = z\sqrt {\frac{3}{2}} , \\ {{\psi }_{{n + 1}}}(z)\, = \,\sqrt {4 - \frac{1}{{{{{(n + 1)}}^{2}}}}} z{{\psi }_{n}}(z)\, - \,\frac{n}{{n + 1}}\sqrt {1\, + \,\frac{4}{{2n - 1}}} {{\psi }_{{n - 1}}}(z)\,. \\ \end{gathered} $

Использование полиномов Лежандра связано с тем, что реализация ортогональных разложений с адаптированным весом $p \approx \varphi $ может быть арифметически весьма затруднительной, как это показало решение рассматриваемой далее типовой тестовой задачи теории переноса с экспоненциальной асимптотикой $\varphi (z)$ при $H \to \infty $.

Имея достаточно хорошее приближение $\varphi \, \approx \,{{\varphi }_{0}}$, можно использовать оценку $\varphi _{m}^{{(1)}} = {{\varphi }_{0}}{{\left( {\frac{\varphi }{{{{\varphi }_{0}}}}} \right)}_{m}}$, для которой ${\text{||}}\varphi - \varphi _{m}^{{(1)}}{\text{||}} \leqslant \max {{\varphi }_{0}}\left\| {\frac{\varphi }{{{{\varphi }_{0}}}} - {{{\left( {\frac{\varphi }{{{{\varphi }_{0}}}}} \right)}}_{m}}} \right\|$.

Следует отметить, что численно-статистическая оптимизация оценки $\varphi _{m}^{{(1)}}$ требует дополнительного исследования в каждом конкретном случае. В рассматриваемой далее тестовой задаче использование в качестве ${{\varphi }_{0}}$ асимптотики решения при $H \to \infty $ не дало улучшения статистической оценки, сравнительно с ${{\tilde {\varphi }}_{m}}$, вследствие увеличения дисперсий оценок коэффициентов разложения и недостаточного приближения $\varphi (z)$ функцией ${{\varphi }_{0}}(z)$для малых $z$.

2. Рандомизация оценки (2) получается путем вычисления линейных функционалов (φ, ψi) = = $\int \varphi (z){{\psi }_{i}}(z)dz$ методом Монте-Карло с использованием так называемой “оценки по столкновениям” (см., например, [1]) ${{\xi }_{i}} = \sum\nolimits_{k = 0}^{{{N}_{c}}} {{Q}_{k}}{{\psi }_{i}}(z({{x}_{k}})).$ Здесь ${{x}_{0}},{{x}_{1}},...,{{x}_{{{{N}_{c}}}}}$ – вспомогательная обрывающаяся с вероятностью 1 цепь Маркова, определяемая переходной плотностью $p(x{\kern 1pt} ',x)$ и плотностью начального состояния f0(x), Q0 = $f({{x}_{0}}){\text{/}}{{f}_{0}}({{x}_{0}}),$ ${{Q}_{k}} = {{Q}_{{k - 1}}}k({{x}_{{k - 1}}},{{x}_{k}}){\text{/}}p({{x}_{{k - 1}}},{{x}_{k}})$, причем выполняются условия несмещенности [1]. Предполагается, что $\rho ({{K}_{p}}) < 1$, где Kp – интегральный оператор с ядром ${{k}^{2}}(x{\kern 1pt} ',{{x}^{2}}){\text{/}}p(x{\kern 1pt} ',x)$. При сформулированных выше условиях имеем ${\text{E}}{{\xi }_{i}}\, = \,(\varphi ,{{\psi }_{i}})\, = \,{{a}_{i}},$ ${\text{D}}{{\xi }_{i}} < + \infty $.

Рандомизированная оценка после реализации $N$ траекторий строится следующим образом:

${{\tilde {\varphi }}_{m}}(z) = \sum\limits_{i = 0}^m {{\tilde {a}}_{i}}{{\psi }_{i}}(z).$

Здесь ${{\tilde {a}}_{i}} = \frac{1}{N}\sum \xi _{i}^{{(k)}}$, где ${{\{ \xi _{i}^{{(k)}}\} }_{{k = 1,...,N}}}$ – выборочные значения “оценки по столкновениям” ${{\xi }_{i}}$. Выполняются соотношения ${\text{E}}{{\tilde {\varphi }}_{m}} = {{\varphi }_{m}},$ ${\text{D}}{{\tilde {\varphi }}_{m}}\, < \, + {\kern 1pt} \infty $.

По аналогии с [2] имеем

$\begin{gathered} L(m) = {\text{E||}}\varphi - {{{\tilde {\varphi }}}_{m}}{\text{|}}{{{\text{|}}}^{2}} = \\ \, = \sum\limits_{i = 0}^m {\text{D}}{{{\tilde {a}}}_{i}} + \sum\limits_{i = m + 1}^\infty a_{i}^{2} = {{L}_{1}}(m) + {{L}_{2}}(m), \\ \end{gathered} $
где ${{L}_{2}}(m) = {\text{||}}\varphi - {{\varphi }_{m}}{\text{|}}{{{\text{|}}}^{2}}$.

3. Перейдем теперь к решению задачи минимизации квадрата среднеквадратической погрешности L(m). С этой целью сформулируем утверждение, которое является простым следствием теоремы 4.10 из [5].

Лемма 1. Если для $r \geqslant 1$ выполняется соотношение $\frac{{{{d}^{r}}\varphi (z)}}{{{{d}^{r}}z}} < c < + \infty $, при $0 \leqslant z \leqslant H,$ то

(3)
${\text{||}}\varphi - {{\varphi }_{m}}{\text{|}}{{{\text{|}}}^{2}} \leqslant \frac{{{{C}_{2}}}}{{{{m}^{{2r - 1}}}}}.$

Расчеты, проведенные, в частности, при выполнении работ [3, 4] и настоящей работы, показали, что изменением величины ${\text{D}}{{\tilde {a}}_{i}}$, сравнительно с $a_{i}^{2}$, можно пренебречь, т.е. полагать ${{L}_{1}}(m) \approx {{C}_{1}}m = (d{\text{/}}n)m$.

Было также замечено, что последовательности $a_{i}^{2}$ для четных и нечетных номеров в асимптотике могут существенно различаться и поэтому целесообразно с целью минимизации $L(m)$ рассматривать ${{L}_{2}}(m)$ для нечетных m в виде

${{L}_{2}}(m) = \sum\limits_{i = 0}^{(m + 1)/2} b_{i}^{2},\quad b_{i}^{2} = a_{{2i}}^{2} + a_{{2i + 1}}^{2}.$

Это свойство коэффициентов было проверено на примере разложения функции φ(z) = = $\exp ( - z{\text{/}}5.4)$ по полиномам Лежандра в интервале $0 < z < 10$.

Лемма 1 дает основание предполагать, что в случае достаточно гладкой $\varphi (z)$ выполняется соотношение

(4)
${{L}_{2}}(m) \lesssim \frac{{{{C}_{2}}}}{{{{m}^{k}}}},\quad k \geqslant 1.$

Достаточно просто доказывается следующее утверждение.

Лемма 2. Если

(5)
$L(m) = {{C}_{1}}m + \frac{{{{C}_{2}}}}{{{{m}^{k}}}},$
то выполняются соотношения

(6)
${{m}_{{opt}}} = \arg \min L(m) = {{\left( {k\frac{{{{C}_{2}}}}{{{{C}_{1}}}}} \right)}^{{\frac{1}{{k + 1}}}}},$
(7)
$\begin{gathered} {{L}_{1}}({{m}_{{opt}}})\, = \,{{k}^{{\frac{1}{{k + 1}}}}}C_{1}^{{\frac{1}{{k + 1}}}}C_{2}^{{\frac{1}{{k + 1}}}},\quad {{L}_{2}}({{m}_{{opt}}})\, = \,{{k}^{{ - \frac{1}{{k + 1}}}}}C_{1}^{{\frac{k}{{k + 1}}}}C_{2}^{{\frac{1}{{k + 1}}}}, \\ L({{m}_{{opt}}}) = (1 + k){{L}_{2}}({{m}_{{opt}}})\,. \\ \end{gathered} $

Лемма 2 показывает, что при выполнении соотношения (5) асимптотически при $N \to \infty $ вследствие соотношения ${{C}_{1}} = d{\text{/}}N$ имеем

${{m}_{{opt}}} \asymp {{N}^{{\frac{1}{{k + 1}}}}},\quad {{({{L}_{2}}({{m}_{{opt}}}))}^{{1/2}}} \asymp {{N}^{{ - \,\frac{k}{{2(k + 1)}}}}}.$

Для решения рассматриваемой задачи минимизации $L(m)$ необходимо с помощью предварительных расчетов оценивать величины ${{C}_{2}}$ и $k$ (${{C}_{1}}$ – это среднее значение слабо меняющейся величины ${\text{D}}{{\tilde {a}}_{i}}$). Использование соотношения (7) для оценки $k$ неэффективно из-за сильного возрастания относительной статистической погрешности оценок ${{\tilde {a}}_{i}}$. Поэтому для исследования асимптотики величины ${{L}_{2}}(m)$ используется тот факт, что соотношение ${{L}_{2}}(m) \asymp {{C}_{2}}{\text{/}}{{m}^{k}}$ соответствует соотношению $b_{i}^{2} \asymp \frac{{C_{2}^{{(1)}}}}{{{{i}^{{k + 1}}}}}$, причем $b_{i}^{2}{\text{/}}b_{{i + 1}}^{2} = ((i + 1){\text{/}}i{{)}^{{k + 1}}}$.

Определив интервал $({{i}_{1}},{{i}_{2}})$ слабого изменения отношения $b_{i}^{2}{\text{/}}b_{{i + 1}}^{2}$, можно оценить подходящее значение $k + 1$ путем осреднения отношений $\ln (b_{i}^{2}{\text{/}}b_{{i + 1}}^{2}){\text{/}}\ln ((i + 1){\text{/}}i)$, т.е. по формуле

(8)
$k + 1 \approx \frac{1}{{{{i}_{2}} - {{i}_{1}}}}\sum\limits_{i = {{i}_{1}}}^{{{i}_{2}} - 1} \frac{{2(\ln {\text{|}}{{b}_{i}}{\text{|}} - \ln {\text{|}}{{b}_{{i + 1}}}{\text{|}})}}{{\ln (i + 1) - \ln i}}.$

Заметим, что значение k в (4) практически ограничивается возможным нарастанием производных; это было замечено и при решении рассматриваемой далее тестовой задачи. Оценив, как указано выше, значение k, далее можно оценить коэффициент ${{C}_{2}}$, используя те же значения $\tilde {b}_{i}^{2}$ по формуле

(9)
${{C}_{2}} = \frac{{{{L}_{2}}(2{{i}_{2}} + 1) - {{L}_{2}}(2{{i}_{1}} - 1)}}{{\frac{1}{{{{{(2{{i}_{2}} + 1)}}^{k}}}} - \frac{1}{{{{{(2{{i}_{1}} - 1)}}^{k}}}}}}.$

Замечательным свойством этой формулы является то, что она не требует знания ${{a}_{i}}$ для $i\, > \,2{{i}_{2}}$ + 2.

4. В качестве тестовой рассматривалась задача об оценке плотности $\varphi (z)$ столкновений частицы в слое $0 \leqslant z \leqslant H = 10$ рассеивающего и поглощающего вещества для источника столкновений с плотностью f(z1, z2, z; ω) = ezδ(z1 – 0)δ(z2 – 0)$\delta (\omega - {{\omega }_{0}}),$ $z > 0,$ где ${{\omega }_{0}} = (0,0,1)$ – направление скорости частицы, вызывающей начальное столкновение.

Параметры среды: коэффициент ослабления σ = 1, вероятность рассеяния ${{\sigma }_{s}}{\text{/}}\sigma = 0.9$, вероятность поглощения ${{\sigma }_{c}}{\text{/}}\sigma = 0.1$, индикатриса рассеяния Хеньи–Гринстейна:

$g(\mu ) = \frac{{1 - \mu _{0}^{2}}}{{2(1 + \mu _{0}^{2} - 2{{\mu }_{0}}\mu {{)}^{{3/2}}}}}.$

Средний косинус угла рассеяния ${{\mu }_{0}} = 0.9$. При этом значение $\mu $ моделируется по формуле:

$\mu = \frac{1}{{2{{\mu }_{0}}}}\left( {1 + \mu _{0}^{2} - {{{\left( {\frac{{1 - \mu _{0}^{2}}}{{2{{\mu }_{0}}{\text{rand}} + 1 - {{\mu }_{0}}}}} \right)}}^{2}}} \right),$
где ${\text{rand}}$ – случайное число, равномерно распределенное в $(0,1)$.

Отметим, что при $\sigma \equiv 1$ осредненная по ${{z}_{1}},{{z}_{2}}$ плотность столкновений φ(z) = $\int \int \int \Phi ({{z}_{1}},{{z}_{2}},z;\omega )d{{z}_{1}}d{{z}_{2}}d\omega ,$ где $\Phi $ – интенсивность излучения. Таким образом, фактически рассматривается задача, близкая к проблеме Милна [7]. Для данных параметров довольно высокую точность имеет транспортное приближение [7], которое дает для $\varphi (z)$ следующую асимптотическую оценку ${{\varphi }_{{as}}}(z) \asymp {{e}^{{ - \lambda z}}},\lambda \approx \frac{1}{{5.4}}$.

Для построения оптимальной согласно сказанному выше оценки ${{\tilde {\varphi }}_{m}}(z)$ в рамках сформулированной физико-вероятностной модели было реализовано 109 траекторий частиц-квантов излучения. В результате расчетов были получены значения слагаемых ${{k}_{i}} + 1$ в сумме (8), приведенные для ${{i}_{1}} \leqslant i \leqslant {{i}_{2}} = 11$ в табл. 1. Эта таблица показывает практически достаточную устойчивость оценки параметра степенного изменения величины $b_{i}^{2}$ в интервале $3 \leqslant i \leqslant 11$. Из формулы (8) получаем $\tilde {k} = 4.97 \approx 5$.

Таблица 1.

Слагаемые в сумме (8)

i 3 4 5 6 7 8 9 10 11
${{k}_{i}}\, + \,1$ 5.71 6.05 5.70 6.47 6.39 6.29 5.46 5.26 6.42

По формуле (9) здесь получается значение ${{C}_{2}} \approx 0.094$, а осреднение величин ${\text{D}}{{\tilde {a}}_{i}}$ в интервале $0 \leqslant i \leqslant 30$ дает ${{C}_{1}} \approx {{10}^{{ - 9}}}$. С использоваеним этих оценок по формулам (6), (7) получено: ${{m}_{{opt}}} \approx 28,{\text{E}}{{(\varphi - {{\tilde {\varphi }}_{{28}}})}^{2}} \approx \tilde {L}(28)$ = 3.3 × 10–8, т.е. среднеквадратическая погрешность оценивается величиной ${{\tilde {\delta }}_{2}} = \sqrt {\tilde {L}(28)} \approx 1.8$ × 10–4.

Известно [1], что в данной задаче $\varphi (z)$ равно среднему числу пересечений частицей уровня $z$ с весом $1{\text{/|}}{{\omega }_{z}}{\text{|}}$. При ограничении ${\text{|}}{{\omega }_{z}}{\text{|}} > \varepsilon $ дисперсия соответствующей статистической “локальной оценки” ${{\tilde {\varphi }}_{l}}(z)$ конечна, а относительное смещение не превосходит $\varepsilon $. В расчетах было использовано $\varepsilon = {{10}^{{ - 6}}}$, а относительная статистическая погрешность при $N = {{10}^{9}}$ имеет порядок величины 0.001%. В результате расчетов было получено значение $\tilde {\delta }_{2}^{{(l)}} = {{\tilde {\delta }}_{2}}({{\tilde {\varphi }}_{{28}}} - {{\tilde {\varphi }}_{l}}) \approx 2.2$ × 10–4, а минимальное значение $\delta _{2}^{{(l)}} = 2.0$ × 10–4 реализуется при m = 36.

Полученное отличие $\tilde {\delta }_{2}^{{(l)}}$ от ${{\tilde {\delta }}_{2}}$ можно объяснить асимптотическим характером леммы 2, а также статистической погрешностью оценки ${{\tilde {\varphi }}_{l}}$. С помощью прямого дифференцирования интегрального уравнения вида (1) “локальная оценка” была распространена на производные функции $\varphi (z)$. Уже первая производная для больших значений $z$ оказалась на порядок больше $\varphi (z)$; этим объясняется полученное по формуле (8) значение $k = 5$ (хотя $\varphi (z)$, по-видимому, бесконечно дифференцируема при $0 < z < H)$).

Как уже было указано в конце пункта 1 текста статьи, разложение функции $\varphi {\text{/}}{{\varphi }_{0}}$ здесь не улучшает оценку из-за недостаточного приближения функции $\varphi (z)$ экспонентой $\exp ( - z{\text{/}}5.4)$. Попытка построить оценку ${{\tilde {\varphi }}_{m}}(z)$ на основе разложения по полиномам, ортогональным с весом $\exp ( - z{\text{/}}5.4)$, оказалась неудачной из-за необходимости расчетов со слишком большим количеством арифметических разрядов.

Использование разложения по полиномам Лагерра, ортонормированным на $(0, + \infty )$, здесь заведомо неэффективно из-за разрыва функции $\varphi (z)$ в точке $z = H = 10$. Однако соответствующий алгоритм был улучшен путем моделирования траекторий в полупространстве $z \geqslant 0$ с игнорированием вклада в оценку от столкновений на траекториях, до этого покинувших слой $0 \leqslant z \leqslant H$. Таким образом, $\varphi (z)$ была продолжена непрерывно на $z \geqslant H$, но с разрывом 1-го рода производной для z = H. При этом была получена оценка ${{L}_{2}}(m) \approx \frac{{{{C}_{2}}}}{m}$ и соответственно (6) ${{m}_{{opt}}}$ получалось путем уравнивания ${{L}_{2}}(m)$ и ${{L}_{1}}(m)$. Для такого “регуляризованного” алгоритма в случае $N = {{10}^{9}}$ было получено значение ${{\tilde {\delta }}_{2}} \approx 3.6$ × 10–3, в то время как для алгоритма, связанного с полиномами Лежандра, имеем ${{\tilde {\delta }}_{2}} \approx 1.8$ × 10–4.

Большой объем проведенных расчетов показал, что при малой величине среднеквадратического отклонения практически всегда малым является и равномерное отклонение рассматриваемой статистической проекционной оценки от искомого решения. По-видимому, это связано с достаточно точной среднеквадратической оценкой производной от решения, что требует дополнительного довольно сложного исследования.

Список литературы

  1. Ермаков С.М., Михайлов Г.А. Статистическое моделирование. М.: Наука, 1982.

  2. Ченцов Н.Н. Статистические решающие правила и оптимальные выводы. М.: Наука, 1972.

  3. Михайлов Г.А., Трачева Н.В., Ухинов С.А. Рандомизированный проекционный метод для оценки угловых распределений поляризованного излучения на основе численного статистического моделирования // Comput. Math. and Math. Phys. 2016. V. 56. № 9. P. 1540–1550. https://doi.org/10.7868/S0044466916090155

  4. Rogasinsky S.V. Two variants of Monte Carlo projection method for numerical solution of nonlinear Boltzmann equation // Russian Journal of Numerical Analysis and Mathematical Modelling. 2019. V. 34. № 3. P. 143–150. https://doi.org/10.1515/rnam-2019-0012

  5. Суетин П.К. Классические ортогональные многочлены. М.: Наука, 1979.

  6. Jackson D. Fourier Series And Orthogonal Polynomials. The University of Minnesota, 1941.

  7. Davison B. Neutron Transport Theory. Oxford University Press, 1957.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления