Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 510, № 1, стр. 8-12
ЭЛЕМЕНТАРНЫЕ ИНВАРИАНТЫ ДЛЯ КВАНТОРНОЙ ВЕРОЯТНОСТНОЙ ЛОГИКИ
1 Математический институт им. В.А. Стеклова Российской академии наук
Москва, Россия
* E-mail: katze.tail@gmail.com
Поступила в редакцию 20.01.2023
После доработки 01.02.2023
Принята к публикации 02.03.2023
- EDN: XHTJMV
- DOI: 10.31857/S2686954323600040
Аннотация
Пусть QPL – предложенный в [8] двусортный вероятностный язык, который расширяет хорошо известный “полиномиальный” язык, описанный в [3, раздел 6], посредством добавления кванторов по событиям. Мы показываем, что все безатомные пространства имеют одну и ту же QPL-теорию и эта теория разрешима. Также мы вводим понятие элементарного инварианта для QPL и используем его для получения точных верхних оценок на сложность некоторых интересных вероятностных теорий.
1. ВВЕДЕНИЕ
Нас будет интересовать двусортный вероятностный язык QPL, предложенный в [8]. Можно думать о ${\text{QPL}}$ как о естественной комбинации элементарного языка булевых алгебр и языка упорядоченных полей. Его фрагмент, содержащий только кванторы по вещественным числам (но не по событиям), является вариантом хорошо известного “полиномиального” языка, описанного в [3, раздел 6].
Несколько важных сложностных результатов о QPL было получено в [8]. Мы знаем, что если $\mathcal{K}$ – класс вероятностных пространств, который содержит все бесконечные дискретные пространства, то его QPL-теория имеет как минимум ту же сложность, что и полная арифметика второго порядка. QPL-теория конечных вероятностных пространств намного проще, но по-прежнему неразрешима; точнее, она имеет ту же сложность, что и дополнение проблемы остановки. Кроме того, эти результаты остаются справедливы, если мы исключим кванторы по вещественным числам. С другой стороны, для каждого положительного целого числа n QPL-теория пространств с ровно n элементами является разрешимой. Можно задаться вопросом, существуют ли какие-нибудь другие естественные примеры разрешимых вероятностных теорий. Мы отвечаем на этот вопрос утвердительно, показывая, что все безатомные пространства имеют одну и ту же QPL-теорию и эта теория разрешима.
Другая интересная проблема, возникающая в кванторной вероятностной логике, касается верхних оценок сложности. А именно, вероятностные пространства не могут быть непосредственно закодированы в языке арифметики высших порядков, что затрудняет получение верхних оценок сложности для многих вероятностных теорий. Чтобы преодолеть эту трудность, мы разрабатываем теорию элементарных инвариантов для QPL. В отличие от вероятностных про-странств, их инварианты могут быть легко закодированы как множества натуральных чисел, что позволяет нам доказать, что для любого “аналитического” класса вероятностных пространств его QPL-теория имеет как максимум ту же сложность, что и полная арифметика второго порядка. Это решает одну из главных проблем, заявленных в [8].
Настоящую работу можно рассматривать как исследование по элементарным теориям классов вероятностных пространств; ср. [2] и [7].
2. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Поскольку многие сложностные результаты о кванторной вероятностной логике формулируются, используя арифметику второго порядка, мы начнем с описания языка последней и лишь затем перейдем к определению QPL.
2.1. Арифметика второго порядка
Напомним, что в арифметике второго порядка имеются: (i) индивидные переменные $x$, $y$, $z$, …, которые предназначены пробегать $\mathbb{N}$; (ii) для каждого положительного целого числа k переменные по множествам Xk, Yk, Zk, … типа k, которые предназначены пробегать подмножества ${{\mathbb{N}}^{k}}$. Обозначим через $\mathfrak{N}$ стандартную модель арифметики и через $\sigma $ – ее сигнатуру. Для удобства мы будем считать, что $\sigma $ содержит символ для любой вычислимой функции или отношения. $\sigma $-Формулы второго порядка строятся из первопорядковых атомарных $\sigma $-формул и выражений вида
где k – положительное целое число, Xk – переменная по множествам типа k и ${{t}_{1}}$, …, ${{t}_{k}}$ – $\sigma $-термы, обычным образом. В дальнейшем под $\sigma $-формулой мы будем понимать $\sigma $-формулу второго порядка.Пусть $n$ – положительное целое число. Напомним, что $\sigma $-формула лежит в $\Pi _{n}^{1}$, если она имеет вид
Теорема 2.1 (см. [9]). Пусть ${{\sigma }_{ + }}$ обозначает $\langle + ; = \rangle $. Тогда любое $\Pi _{n}^{1}$-подмножество ${{\mathbb{N}}^{k}}$ может быть определено в $\mathfrak{N}$ посредством ${{\sigma }_{ + }}$-формулы вида
Давайте называть $\Pi _{n}^{1}$-${{\sigma }_{ + }}$-формулу специальной, если она имеет вид ($ \star $).
Следствие 2.2 (см. [9]). Совокупность всех специальных $\Pi _{n}^{1}$-${{\sigma }_{ + }}$-предложений, истинных в $\mathfrak{N}$, является $\Pi _{n}^{1}$-полной.
Главный (и единственный) результат в [5] тривиальным образом следует из следствия выше. В [1] и [10] он был использован для получения некоторых интересных результатов о нижних оценках сложности для языков, предложенных в [4] и [11] соответственно.
2.2. Кванторная вероятностная логика
Под вероятностным пространстваом мы понимаем пару $\langle \mathcal{A},{\text{P}}\rangle $, где $\mathcal{A}$ – булева алгебра, в которой у всякого счетного множества элементов есть супремум (а потому и инфимум), и P – вероятностная мера на $\mathcal{A}$, т.е. функция из $\mathcal{A}$ в [0, 1] такая, что для любого счетного множества S попарно непересекающихся элементов $\mathcal{A}$,
Поскольку само наше определение вероятностной меры подразумевает два различных рода объектов, нам нужны два сорта переменных: (a) булевы переменные X, Y, Z, …, которые предназначены бегать по событиям; (b) переменные по полю $x$, $y$, $z$, …, которые предназначены бегать по вещественным числам. Это, в свою очередь, приводит к расмотрению двух множеств символов:
Булевы термы строятся из $ \bot $, $ \top $ и булевых переменных с использованием $ \wedge $, $ \vee $ и $\neg $ следующим образом: если ${{T}_{1}}$ и ${{T}_{2}}$ – булевы термы, то таковы и $\left( {{{T}_{1}} \wedge {{T}_{2}}} \right)$, $\left( {{{T}_{1}} \vee {{T}_{2}}} \right)$ и $\neg {{T}_{1}}$. Они представляют булевы комбинации событий. Под атомарной ${\text{QPL}}$-формулой мы понимаем выражение вида
Мы будем использовать $ \wedge $, $ \vee $ и $\neg $ для обозначения не только булевых операций, но также и обычных логических связок. Поскольку их булевы версии не будут встречаться вне области действия $\mu $, интерпретации $ \wedge $, $ \vee $ and $\neg $ будут всегда ясны из контекста. В качестве наших кванторных символов возьмем $\forall $ и $\exists $. Тогда QPL-формулы строятся из атомарных ${\text{QPL}}$-формул с использованием символов логических связок и кванторов – связывающих булевы переменные или переменные по полю – обычным образом. Мы сокращаем $\neg \Phi \vee \Psi $ как $\Phi \to \Psi $ и $\left( {\Phi \to \Psi } \right) \wedge \left( {\Psi \to \Phi } \right)$ – как $\Phi \leftrightarrow \Psi $. Кроме того, = и < трактуются как определенные в терминах $ \leqslant $.
Отношение выполнимости $ \Vdash $ для ${\text{QPL}}$ может быть определено очевидным образом, и оно ведет себя так, как можно ожидать. Например, рассмотрим
Пусть $\mathcal{P} = \langle \mathcal{A},{\text{P}}\rangle $ – вероятностное пространство. Тогда $\mathcal{P} \Vdash \Theta $, если и только если для каждого $r \in \left[ {0,1} \right]$ существует $E \in \mathcal{A}$ такое, что ${\text{P}}\left( E \right) = r$.
Замечание 2.3. Фрагмент ${\text{QPL}}$, содержащий только кванторы по вещественным числам (но не по событиям), можно воспринимать как “полиномиальную” логику, описанную ранее в [3], разделе 6. В этой логике булевы переменные трактуются как константные символы и называются “пропозициональными переменными”; поэтому булевы термы становятся “пропозициональными формулами”.
Пусть $\mathcal{K}$ – класс вероятностных пространств. Под QPL-теорией $\mathcal{K}$, обозначаемой ${\text{Th}}\left( \mathcal{K} \right)$, мы понимаем совокупность всех QPL-предложений, истинных в любом пространстве из $\mathcal{K}$. Мы используем ${\text{T}}{{{\text{h}}}^{{\text{e}}}}\left( \mathcal{K} \right)$ для обозначения множества предложений из ${\text{Th}}\left( \mathcal{K} \right)$, которые не содержат кванторов по вещественным числам. Мы будем часто писать ${\text{Th}}\left( \mathcal{P} \right)$ и ${\text{T}}{{{\text{h}}}^{{\text{e}}}}\left( \mathcal{P} \right)$ вместо ${\text{Th}}\left( {\left\{ \mathcal{P} \right\}} \right)$ и ${\text{T}}{{{\text{h}}}^{{\text{e}}}}\left( {\left\{ \mathcal{P} \right\}} \right)$ соответственно. Два пространства ${{\mathcal{P}}_{1}}$ и ${{\mathcal{P}}_{2}}$ называются элементарно эквивалентными, если их QPL-теории совпадают, т.е. ${{\mathcal{P}}_{1}}$ и ${{\mathcal{P}}_{2}}$ не различимы посредством QPL-предложений.
Используя следствие 2.2, можно получить следующее.
Теорема 2.4 (см. [8]). Пусть $\mathcal{K}$ – класс вероятностных пространств, который содержит все бесконечные дискретные пространства. Тогда теория второго порядка $\mathfrak{N}$ $m$-сводима к ${\text{T}}{{{\text{h}}}^{{\text{e}}}}\left( \mathcal{K} \right)$.
3. ФАКТОР-ПРОСТРАНСТВА
Пусть $\mathcal{P} = \langle \mathcal{A},{\text{P}}\rangle $ – вероятностное пространство. Рассмотрим формулу
Она определеляет весьма естественное отношение эквивалентности на $\mathcal{A}$, а именно
Для каждого $E \in \mathcal{A}$ обозначим через ${{\left[ E \right]}_{ \approx }}$ класс эквивалентности E по $\mathcal{E}$. Теперь возмем ${{\mathcal{A}}_{ \approx }}$ равным совокупности всех таких классов эквивалентности и определим функцию ${{{\text{P}}}_{ \approx }}$ из ${{\mathcal{A}}_{ \approx }}$ в [0, 1] посредством
Нетрудно проверить, что ${{\mathcal{P}}_{ \approx }} = \langle {{\mathcal{A}}_{ \approx }},{{{\text{P}}}_{ \approx }}\rangle $ является вероятностным пространством, которое называется фактор-пространством $\mathcal{P}$ по модулю $\mathcal{E}$. Более того, ${\text{QPL}}$-теории $\mathcal{P}$ и ${{\mathcal{P}}_{ \approx }}$ совпадают.
Замечание 3.1. Что касается языков из [4], мы не можем безопасно переходить от структур к их фактор-структурам по модулю событий меры ноль, поскольку теория данной структуры может отличаться от теории ее фактор-структуры (см. дискуссию в [8]).
Напомним, что $E \in \mathcal{A}$ является атомом $\mathcal{A}$, если $E \ne \, \bot $ (где $ \bot $ обозначает наименьший элемент $\mathcal{A}$) и для каждого $F \in \mathcal{A}$ мы имеем $E \wedge F = \, \bot $ или $E \wedge F = E$. Рассмотрим формулу
Очевидно, $\mathcal{P} \Vdash {\text{At}}\left( E \right)$ тогда и только тогда, когда ${{\left[ E \right]}_{ \approx }}$ является атомом ${{\mathcal{A}}_{ \approx }}$. Мы называем $\mathcal{P}$ безатомным, если $\mathcal{P} \Vdash \neg \exists X{\kern 1pt} {\text{At}}\left( X \right)$. Например, пространство Лебега на [0, 1] является безатомным. Разумеется, существуют альтернативные определения безатомности, но приведенное выше – в духе булевых алгебр; ср. [6].
Теорема 3.2. Любые два безатомных вероятностных пространства элементарно эквивалентны. Кроме того, QPL-теория безатомных вероятностных пространств разрешима.
Это наводит на мысль, что хорошая “элементарная” классификация вероятностных пространств должна основываться на понятии атома (ср. [6]). Вместе с тем теорема выше обобщает результат Тарского о том, что первопорядковая теория упорядоченного поля вещественных чисел является разрешимой; см. [12].
4. ЭЛЕМЕНТАРНЫЕ ИНВАРИАНТЫ
Пусть $\mathcal{P} = \langle \mathcal{A},{\text{P}}\rangle $ – вероятностное пространство. Возьмем $\mathcal{D}$ равным совокупности всех атомов ${{\mathcal{A}}_{ \approx }}$. Под элементарным инвариантом $\mathcal{P}$ мы понимаем функцию ${{\sharp }_{\mathcal{P}}}$ из $\left( {0, + \infty } \right)$ в $\mathbb{N}$, заданную посредством
Значит, в частности, $\mathcal{P}$ является безатомным, если и только если ${{\sharp }_{\mathcal{P}}}$ – функция, тождественно равная нулю.
Поскольку дискретные пространства состоят из атомов, их элементарные инварианты могут рассматривать как их абстрактные представления. К примеру, рассмотрим дискретное распределение g на $\mathbb{N}$, заданное посредством
Пусть $\mathcal{P} = \langle \mathcal{A},{\text{P}}\rangle $ – соответствующее вероятностное пространство. Значит, $\mathcal{A}$ – совокупность всех подмножеств $\mathbb{N}$ и для каждого $E \subseteq \mathbb{N}$ мы имеем
Тогда $\mathcal{D} = \left\{ {\left\{ n \right\}\,{\text{|}}\,n \in \mathbb{N}} \right\}$ и для любого положительного $r \in \mathbb{R}$,
Таким образом, ${{\sharp }_{\mathcal{P}}}$ очень похож на g. Как было показано в [8], ${\text{Th}}\left( \mathcal{P} \right)$ и ${\text{T}}{{{\text{h}}}^{{\text{e}}}}\left( \mathcal{P} \right)$ обе m-эквивалентны теории второго порядка $\mathfrak{N}$.
Теорема 4.1. Для любых вероятностных пространств ${{\mathcal{P}}_{1}}$ и ${{\mathcal{P}}_{2}}$,
Другими словами, два пространства имеют один и тот же инвариант, если и только если они элементарно эквивалентны.
Замечание 4.2. Аналогичные формулировки возникают в метаматематике булевых алгебр; ср. [6]. Хотя эти два направления исследований явно связаны, они в некотором смысле несравнимы, поскольку QPL имеет дело с мерами на булевых алгебрах специального рода.
Для наших текущих целей мы можем отождествить каждое пространство с его элементарным инвариантом. Отметим, что такие инварианты могут быть легко закодированы как подмножества $\mathbb{N}$. Назовем класс пространств $\mathcal{K}$ аналитическим, если $\left\{ {{{\sharp }_{\mathcal{P}}}\,{\text{|}}\,\mathcal{P} \in \mathcal{K}} \right\}$ определимо в $\mathfrak{N}$ (как множество подмножетсв $\mathbb{N}$).
Теорема 4.3. Пусть $\mathcal{K}$ – аналитический класс пространств. Тогда ${\text{Th}}\left( \mathcal{K} \right)$ m-сводима к теории второго порядка $\mathfrak{N}$.
Это приводит к следующему.
Следствие 4.4. Пусть $\mathcal{K}$ – аналитический класс пространств, который содержит все бесконечные дискретные пространства. Тогда ${\text{Th}}\left( \mathcal{K} \right)$ m-эквивалентна теории второго порядка $\mathfrak{N}$.
Доказательство. Непосредственно из Теорем 2.4 и 4.3.
В частности, Следствие 4.4 применимо к классу всех пространств и классу всех бесконечных пространств. Это решает одну из главных проблем, заявленных в [8].
Список литературы
Abadi M., Halpern J.Y. Decidability and expressiveness for first-order logics of probability // Information and Computation. 1994. V. 112. № 1. P. 1–36.
Ershov Yu.L., Lavrov I.A., Taimanov A.D., Taitslin M.A. Elementary theories // Russian Mathematical Surveys. 1965. V. 20. № 4. P 35–105.
Fagin R., Halpern J.Y., Megiddo N. A logic for reasoning about probabilities // Information and Computation. 1990. V. 87. № 1–2. P. 78–128.
Halpern J.Y. An analysis of first-order logics of probability // Artificial Intelligence. 1990. V. 46. № 3. P. 311–350.
Halpern J.Y. Presburger arithmetic with unary predicates is $\Pi _{1}^{1}$ complete // Journal of Symbolic Logic. 1991. V. 56. № 2. P. 637–642.
Koppelberg S. General theory of Boolean algebras // in Handbook of Boolean Algebras, Vol. 1, Ed. by Monk J.D., Bonnet R. (North-Holland, 1989), P. 1–311.
Solovay R.M., Arthan R.D., Harrison J. Some new results on decidability for elementary algebra and geometry // Annals of Pure and Applied Logic. 2012. V. 163. № 12. P. 1765–1802.
Speranski S.O. Quantifying over events in probability logic: an introduction // Mathematical Structures in Computer Science. 2017. V. 27. № 8. P. 1581–1600.
Speranski S.O. A note on definability in fragments of arithmetic with free unary predicates // Archive for Mathematical Logic. 2013. V. 52. № 5–6. P. 507–516.
Speranski S.O. Complexity for probability logic with quantifiers over propositions // Journal of Logic and Computation. 2013. V. 23. № 5. P. 1035–1055.
Speranski S.O. Quantification over propositional formulas in probability logic: decidability issues // Algebra and Logic. 2011. V. 50. № 4. P. 365–374.
Tarski A. A Decision Method for Elementary Algebra and Geometry (University of California Press, 1951).
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления