Журнал физической химии, 2022, T. 96, № 7, стр. 947-951

Вариационный принцип в статистической физике

Э. А. Аринштейн a*

a Тюменский государственный университет
Тюмень, Россия

* E-mail: earin@inbox.ru

Поступила в редакцию 04.01.2022
После доработки 04.01.2022
Принята к публикации 10.01.2022

Полный текст (PDF)

Аннотация

Изложена идеология построения теории конденсированных систем, основанная на переходе от разложения по потенциалам к разложению по корреляциям. Показано, что зависимость термодинамического потенциала от корреляций при этом преобразовании определяется вариационным принципом.

Ключевые слова: корреляции, уравнение Боголюбова, вариационный принцип

Развитие современной физики, ядерной, атомной и молекулярной, начиналось в конце XIX – начале XX века. Ее важным разделом является теоретическая база молекулярной физики – статистическая физика, развитие которой остается актуальным и в настоящее время. (Термин “статистическая механика” ввел Гиббс в 1884 году) В XIX веке термодинамика и гипотетическая в то время молекулярная теория развивались практически независимо, хотя распределение Максвелла–Больцмана было весьма убедительной молекулярной интерпретацией термодинамических свойств идеальных газов. Проблему расширения этой интерпретации на системы взаимодействующих молекул за несколько лет до экспериментального подтверждения реального существования атомов и молекул решил Джозайя Вилард Гиббс: в 1901 г. он опубликовал вывод распределения вероятностей состояний PN(En) макроскопической системы N взаимодействующих молекул в зависимости от значения ее энергии En.. Термодинамическая свободная энергия FN пропорциональна, как следствие, логарифму нормировочного коэффициента – статистической суммы ZN. Эти соотношения в современных обозначениях имеют вид (β = 1/kT):

$\begin{gathered} {{P}_{N}}({{E}_{n}}) = Z_{N}^{{ - 1}}\exp ( - \beta {{E}_{n}});\quad {{Z}_{N}} = \sum {{\text{exp}}( - \beta {{E}_{n}})} ; \\ {{F}_{N}}(V,T) = --kT\ln {{Z}_{N}}. \\ \end{gathered} $

После экспериментального подтверждения молекулярной структуры вещества стала актуальной проблема практического использования теории Гиббса при анализе свойств конденсированного состояния. Исследование молекулярной структуры конденсированного вещества начиналось с изучения кристаллов, их симметрии, спектра колебаний, а затем и электронных состояний. Моделирование структуры жидкости – задача гораздо более сложная, так как нет параметров, которые могли бы служить основой теории, подобно кристаллической решетке. Поэтому до сих пор для большинства работ по статистической теории жидкости исходной служит сферически симметричная модель молекул, что ограничивает сравнение с экспериментальными данными, и инертными газами.

Из теории Гиббса непосредственно следует вириальное разложение. Для некоторых моделей потенциала взаимодействия были рассчитаны несколько (до 4–5) вириальных коэффициентов. Однако это разложение не дает достаточной информации о свойствах потенциала и структуры жидкости, о связи радиуса сходимости разложения и фазовых переходов. Для решения этих и ряда других задач были разработаны методы расчета распределений в малых группах частиц термодинамической системы.

В 1914 г. Л. Орнштейн и Ф. Цернике (ОЦ) ввели представление о “прямой” $C(r)$ и “полной” $h(r)$ корреляции для расстояний между парами частиц при описании рассеяния рентгеновских лучей жидкостью. Первое приближение работы ОЦ – это модель прямой корреляции – прямоугольный выступ, его высота, ширина и расстояние от центра определялись данными о радиусе молекул и плотности жидкости. Полная корреляция – это следующее приближение, она дополнительно содержит связь двух частиц через третью, что приводит к соотношению ОЦ:

$~h({{r}_{{1,2}}}) = C({{r}_{{1,2}}}) + \int {h({{r}_{{1,3}}})C({{r}_{{2,3}}}){{\rho }_{1}}(3){{d}^{3}}{{r}_{3}}} .$

В 1935 г. Ивон ввел в рассмотрение систему частичных плотностей $~{{\rho }_{S}}{\kern 1pt} \left( {\{ s\} } \right)$ и частичных функций распределения ${{F}_{s}}{\kern 1pt} \left( {\{ s\} } \right)$:

$~{{\rho }_{S}}{\kern 1pt} \left( {\{ s\} } \right) = \int {{{\rho }_{N}}{\kern 1pt} \left( {\{ N\} } \right)d\{ N - s\} } = \prod {{{\rho }_{1}}(i){{F}_{s}}{\kern 1pt} \left( {\{ s\} } \right)} .$
Так как уравнение для функции Fs содержит ${{F}_{{s + 1}}}$, для ${{F}_{{s + 1}}}$ содержит ${{F}_{{s + 2}}}$, и т.д., то при $N \to \infty ~$ возникает проблема бесконечной “цепочки ББГКИ” (Боголюбова–Борна–Грина–Кирквуда–Ивона).

В 1946 г. Н.Н. Боголюбов показал, что преобразованием цепочки удается обосновать кинетическое уравнение Больцмана и объединил все уравнения цепочки в единое функциональное уравнение.

В 1952 г. T.D. Lee и C.N. Yang [1, 2] выделили из цепочки уравнение, содержащее соотношение ОЦ и дополнительно, в его правой части, последовательность некоторых элементов цепочки. В результате исходное соотношение ОЦ в последующих работах было представлено как “незамкнутое” уравнение, которое можно решить, выполнив некоторую процедуру замыкания, т.е. определив дополнительную связь между прямой и полной корреляциями. Критерия качества замыкания нет, поиск эффективного способа – метод проб. Это уравнения PY (J.K. Percus, G.J. Yevik, 1958 г.), T. Morita, K. Hiroike (1960 г.), HNC (гиперцепное, J.G. Kirwood 1935 г.) и ряд других. Их можно назвать моделями (вариантами) уравнения ОЦ. Это – нелинейные интегральные уравнения, (аналитическое решение существует только для модели твердых сфер уравнения PY – единственное исключение). Численные решения этих уравнений позволяют определить внутреннюю энергию и давление модели, при сравнении с экспериментом они дают наглядную иллюстрацию зависимости некоторых свойств жидкостей от параметров бинарной корреляции. Подробности, различные варианты и область их применимости изложены в курсе Р. Балеску [1], в монографии и статье И.З. Фишера [2, 3]$,$ в публикациях Г.А. Мартынова [4].

Проблема всех (кроме HNC) вариантов в том, что они не дают возможности найти свободную энергию или другой термодинамический потенциал модели и построить термодинамически согласованную теорию. Это специально подчеркивал И.З. Фишер [3].

Проблема термодинамической согласованности определяет необходимость исследования других вариантов теории частичных функций распределения, отличных от “уравнения ОЦ”.

Таким возможным вариантом является уравнение Боголюбова и основанный на этом уравнении вариационный метод.

УРАВНЕНИЕ БОГОЛЮБОВА. ВАРИАЦИОННЫЙ ПРИНЦИП

В квазиклассическом приближении вклад кинетической энергии молекул в термодинамические функции системы совпадает с теми же функциями идеального газа, поэтому в теории функций распределения этот вклад известен, его можно учитывать без изменений в конечном результате. (Исключение составляет задача о системе осцилляторов, но ее рассмотрение не требует использования функций распределения.)

Исходная структура теории – производящий функционал Боголюбова L(u), который определяет частичные функции распределения Fn, либо частичные плотности ρn = ρnFn:

(1)
$\begin{gathered} {{\rho }_{n}}{\kern 1pt} \left( {\{ n\} } \right) = \frac{{{{\delta }^{n}}L(u)}}{{\delta u(1) \ldots \delta u(n)}}; \\ L(u) = \int {\exp (--\beta {{U}_{N}})} \prod {(1 + u(i))d\{ N\} {\text{/}}{{Z}_{N}}(0)} = \\ = {{Z}_{N}}(u){\text{/}}{{Z}_{N}}(0), \\ \end{gathered} $
ZN(u) – конфигурационный интеграл в поле $\varphi (q)$: 1 + u(i) = eβφ(i).

Исключив ZN(0) из (1) и его функциональной производной, получим уравнение Боголюбова [5, 6]:

(2)
$\begin{gathered} \rho (q) = (1 + u(q))\delta L(u){\text{/}}L(u)\delta u(q) = \\ = (1 + u(q))\delta \ln L(u){\text{/}}\delta u(q) = \\ = (1 + u(q))\delta W(u){\text{/}}\delta u(q) = - \delta W(u){\text{/}}\beta \delta \varphi (q). \\ \end{gathered} $
Решение уравнения (2) для функционала W(u) = = $\ln L(u)$ имеет смысл термодинамического потенциала F, так как W(u) – W(0) определяет изменение потенциала F при включении поля $\varphi (q)$; W(u) является производящим функционалом для корреляций:
(3)
$\begin{gathered} {{g}_{n}}{\kern 1pt} \left( {\{ n\} } \right) = \prod {\rho (i){{h}_{n}}{\kern 1pt} \left( {\{ n\} } \right)} = \\ = \prod {\left( {1 + u(i)} \right){{\delta }^{n}}W(u)} {\text{/}}\prod {\delta u(i)} , \\ \end{gathered} $
осуществляющих разложение Урсела–Майера функций ρn.

Ограничивая в выражениях (2) и (3) число членов разложений, т.е. число корреляций, мы пренебрегаем корреляциями более высоких порядков и получаем термодинамически согласованные приближенные уравнения для оставшихся корреляций.

Формально (2) является уравнением вида: y = = ∂Φ/x, определяющим y в зависимости от х. Преобразование Лежандра:

$\Phi (x,y) \to \Psi (x,y) = (xy)--\Phi (x,y)$
сводит это уравнение к вариационной задаче Ψ/∂x = 0. Обратное преобразование Ψ(x, y) → → Φ(x, y) = (xy) – Ψ(x,y) при ∂Φ/∂y = 0 также эквивалентно вариационной задаче. Это позволяет решать исходную задачу в разных переменных, как при переходе от лагранжиана к гамильтониану в механике, либо найти связи между переменными, упрощающие решение.

Переменные x и y могут принадлежать любому множеству, что позволяет использовать вариационный метод для исследования структуры и термодинамики конденсированного состояния, исходя из уравнения (2) при $~x \to \varphi (q)$, $y \to \rho (q)$, $(xy) \to \int {\rho (q)\ln (1 + u(q))dq + f(\rho )} $. При этом условие экстремума ∂Φ/∂y $ \to $ W1(q) = 0 для обратного преобразования является соотношением ОЦ, которое определяет “прямую” корреляцию ОЦ и ее связь с g2. Это позволяет упростить развернутое выражение уравнения (2) [7]$.$

Дальнейшее преобразование уравнения Боголюбова основано на том, что конфигурационный интеграл зависит не только от внешнего поля, но и от потенциалов взаимодействия молекул ${{\varphi }_{n}}{\kern 1pt} \left( {\{ n\} } \right)$, причем не только парного, но и тройного, и более сложного.

Соответствие $x \to \bigcup {{{\varphi }_{n}}{\kern 1pt} \left( {\{ n\} } \right)} $, $y \to \bigcup {{{g}_{n}}{\kern 1pt} \left( {\{ n\} } \right)} $ позволяет упростить подлежащие минимизации выражения, содержащие полные gn и “прямые” корреляции Wn({n}) = ${{\delta }^{n}}{{^{ - }}^{1}}$W1(1)/δρ1(2)δρ1(n) последовательно до 4-го порядка (второе приближение), затем до 6-го (третье), и т.д. [810]. Эти выражения весьма громоздки даже после упрощения, их аналитическая минимизация прямым вариационным методом требует использования предельно упрощенных пробных функций – моделей корреляций. Тем не менее, современная вычислительная техника при уточнении этих моделей может оценить вклад высших корреляций и многочастичных взаимодействий.

Основной вывод: построен функционал, минимальное значение которого является свободной энергией системы F, что определяет все ее термодинамические параметры.

Подчеркну еще раз: свободная энергия – это минимальное значение функционала, но не исходный неминимизированный функционал.

Если этот функционал имеет несколько минимумов, то стабильное состояние определяется самым глубоким минимумом, остальные определяют метастабильные состояния. Фазовое равновесие определяется равенством глубины двух (или больше) минимумов. Исчезновение минимума при изменении термодинамических параметров – это потеря устойчивости состояния, граница его существования.

Существование стабильных и метастабильных состояний и фазовых переходов следует из теории Гиббса. Доказательство этого вывода опубликовал в 1954 г. Б.Т. Гейликман $~\left[ {11} \right]$. Он свел конфигурационный интеграл к интегралу по замкнутому контуру в комплексной плоскости дополнительной переменной, равной сумме значений подынтегральной функции в точках перевала при $N \gg 1,$ что соответствует минимумам функционала вариационного метода. Привел пример возможного поведения членов вириального ряда. Но построить общий метод расчета или оценки параметров рассматриваемых состояний и условий фазовых переходов ему не удалось. Для этого необходимо использовать теорию частичных функций распределения.

ПРЯМОЙ ВАРИАЦИОННЫЙ МЕТОД

Для многих задач, сводимых к вариационной, весьма эффективен прямой вариационный метод, особенно в иллюстративных примерах и при использовании вычислительной техники. Предлагаемый вариационный метод решения уравнения Боголюбова позволяет построить последовательность приближений возрастающей точности, термодинамически согласованных, при том, что можно оценить смысл предлагаемых упрощений.

Вариационный принцип справедлив не только для свободной энергии, но и для термодинамического потенциала большого канонического ансамбля Ω = F – V$\partial F{\text{/}}\partial V$ = F + pV = $\int_V^{} {\omega (\rho )d(q)} $ (в переменных (p, T)). Это удобно при исследовании системы с переменным числом частиц или двухфазной системы. Пример – модель поверхностного слоя простой жидкости. Полагаем, что условия равновесия, определяющие плотности жидкости ρ1 и пара ρ2, выполнены. Тогда

$\begin{gathered} {{\Omega }_{S}} = \Omega (\rho )--{{\Omega }_{1}}({{\rho }_{1}})--{{\Omega }_{2}}({{\rho }_{2}}), \\ \rho (q) = {{\rho }_{1}}(1--f(q)) + {{\rho }_{2}}f(q), \\ \end{gathered} $
функция f(q), определяющая профиль плотности поверхностного слоя, удовлетворяет граничным условиям  f → 0, $q \in V(2)$,  f → 1, $q \in V(1)$ и требованием минимума функционала ΩS(f).

В работе [12] явный вид функционала ΩS(f) был получен в первом приближении прямым разложением функционала Боголюбова. В работе [13]$~$ была представлена техника преобразования операторов, которая позволяет находить следующие приближения, к сожалению, очень громоздкие. Получено общее выражение функционала от f(x), минимум которого равен поверхностной энергии. В первом приближении и в случае плоской границы раздела оно достаточно обозримо:

$\begin{gathered} \sigma = \frac{{{{\Omega }_{s}}}}{s} = \frac{{{{{(\Delta \rho )}}^{2}}}}{4}\int {({{{(f(x)(1 - f(x)))}}^{2}}} \times \\ \times \;\left( {\frac{{{{k}_{2}}}}{{{{\rho }_{2}}}}f(x) + \frac{{{{k}_{1}}}}{{{{\rho }_{1}}}}(1 - f(x))} \right)dx + \frac{{{{{(\Delta \rho )}}^{2}}T}}{4} \times \\ \times \;\int {{{{(f(x + h) - f(x))}}^{2}}} \times \\ \times \;\left( {(1 - f(x)){{K}_{1}}(h) + f(x){{K}_{2}}(h))} \right)dhdx, \\ \end{gathered} $
где ki =dp/dρ)T,i – обратная изотермическая сжимаемость фаз, $~{{K}_{i}}(h) = 2\pi \int_h^\infty {{{W}_{2}}(r\,{\text{|}}\,{{\rho }_{i}})rdr} $, ${{W}_{2}}(r)$, – прямая корреляция ОЦ.

Уже в первом приближении поверхностная энергия нелокальна: она существенно зависит от корреляций частиц в объеме – прямой бинарной в первом приближении и старших в следующих.

Из выражения для σ следует уравнение Эйлера для функции f(x). Это нелинейное интегральное уравнение не имеет аналитического решения, но его можно решить методом проб и оценить поведение этой функции с любой точностью. Сравнение результатов с экспериментальными данными для жидкого аргона показало хорошее согласие уже для первого приближения.

Важность учета старших корреляций, “полных” и “прямых” демонстрирует задача определения особенностей их поведения в окрестности критической точки жидкости [14].

Расходимость сжимаемости в критической точке требует расходимости фурье-образа полной корреляции и конечного значения фурье-образа прямой. Это приводит к “очевидной” критической асимптотике классической теории: h(r) ≈ ≈ aexp(ξr)/r, ξ → 0. Однако анализ уравнения Боголюбова с точностью до членов 4-го порядка дает a → 0, и это выражение обнуляется. Остается степенная асимптотика, показатели совпадают с результатами флуктуационной теории критических явлений [15].

Можно назвать еще несколько задач, обсуждение которых оказалось возможным без привлечения сложного математического аппарата.

Условия устойчивости моделируемого состояния

Для модели кристалла с дефектами в виде вакантных узлов условие устойчивости первого порядка совпадает с условием положительности сжимаемости, бездефектный кристалл не может иметь отличную от нуля положительную сжимаемость.

Второе приближение позволяет определить теплоемкость.

Условие устойчивости второго порядка – требование положительности квадратичной формы произвольной функции двух переменных Y(i, k):

$\begin{gathered} \frac{1}{4}\int {\left( {{{h}_{4}}(1,2,3,4) + {{h}_{2}}(1,2){{h}_{2}}(3,4)} \right)} Y(1,3)Y(2,4)d\{ 4\} + \\ ~~ + \;\int {{{h}_{3}}(1,2,3)} \frac{{Y(1,2)Y(1,3)}}{{{{\rho }_{1}}(1)}}d\{ 3\} > 0. \\ \end{gathered} $
При $Y(i,k) = {{\varphi }_{2}}(i,k)$ это выражение совпадает с выражением для вклада энергии взаимодействия атомов в теплоемкость. Условие устойчивости совпадает с требованием положительности этого вклада. Полная теплоемкость содержит также вклад кинетической энергии.

Модель фазового перехода жидкость–кристалл и квазикристаллическая модель жидкости [16] уточняет значения параметров, определяющих устойчивость кристалла для стабильной – гранецентрированной и метастабильных – объемно-центрированной и простой кубической структур, в том числе температуру потери устойчивости этих структур при равном нулю давлении, что близко к температуре плавления аргона.

Вариационный метод применим также к системам, поведение которых определяется законами квантовой механики. Разработана техника производящих функционалов для матричных элементов, входящих в статистическую сумму [17]$.$ Дальнейшие преобразования аналогичны классической технике,$~$но во многом не совпадают [18, 19].

Основы и техника применения вариационного метода, а также приведенные примеры подробно изложены в монографии [20] и во втором ее издании [21], расширенном за счет дополнительных приложений.

ЗАКЛЮЧЕНИЕ

Основная цель данной публикации – привлечь внимание к этому направлению развития статистической физики. Различные варианты вариационной техники используются в физических теориях довольно давно: в геометрической оптике – принцип наименьшего времени при преломлении, в механике – принцип наименьшего действия, минимума потенциальной энергии при равновесии, в неравновесной термодинамике – принцип минимальной генерации энтропии…

Оказывается, эта техника применима и в статистической физике. Использование прямых вариационных методов иногда требует большого объема вычислений, что препятствовало их применению. Но развитие современной вычислительной техники позволяет успешно решать такие проблемы. Нерешенные, или недостаточно проработанные проблемы статистической физики конденсированных состояний относятся к их числу.

Список литературы

  1. Балеску Р. Равновесная и неравновесная статистическая механика. Пер. с англ. Т. 1. М.: Мир, 1978.

  2. Фишер И.З. Статистическая теория жидкостей. 1961.

  3. Коваленко Н.П., Фишер И.З. // УФН. 1972. Т. 108. № 2. С. 209.

  4. Мартынов Г.А. // Там же. 1999. Т. 169. № 6. С. 595.

  5. Боголюбов Н.Н. Проблемы динамической теории в статистической физике. М.-Л.: ОГИЗ, Гостехиздат, 1946.

  6. Боголюбов Н.Н. Метод функциональных производных в статистической механике. Избранные труды. Т. 2. Киев: Наукова думка, 1971. С. 197–209.

  7. Аринштейн Э.А. // ТМФ. 2004. Т. 142. № 1. С. 152.

  8. Аринштейн Э.А. // Там же. 2000. Т. 124. № 1. С. 136.

  9. Аринштейн Э.А., Ганопольский Р.М. // Там же. 2002. Т. 131. № 2. С. 278.

  10. Arinshteyn E.A. // J. Stat. Phys. 2011. V. 144. P. 831.https://doi.org/10.10077/s10955-011-0275y

  11. Гейликман. Б.Т. Статистическая теория фазовых превращений. М.: ГИТТЛ, 1954.

  12. Аринштейн Э.А., Шабаева Н.И. // Изв. вузов. Физика. 1981. № 7. С. 81.

  13. Аринштейн Э.А. // ТМФ. 2006. Т. 148. № 2. С. 323.

  14. Аринштейн Э.А. // Докл. АН СССР. 1969. Т. 189. № 5. С. 502.

  15. Ма Ш. Современная теория критических явлений. М.: Мир, 1980.

  16. Аринштейн Э.А. // ТМФ. 2007. Т. 151. № 1. С. 155.

  17. Аринштейн Э.А. // Там же. 2002. Т. 130. № 1. С. 54.

  18. Аринштейн Э.А. // Там же. 2009. Т. 161. № 2. С. 243.

  19. Arinshteyn E.A. // J. Modern Phys. 2014. V. 5. P. 1272.

  20. Аринштейн Э.А. Вариационный принцип в теории функций распределения статистической физики. Москва-Ижевск: РХД, 2008.

  21. Аринштейн Э.А. Вариационный принцип в статистической физике. Lambert Academic Publishing, 2014.

Дополнительные материалы отсутствуют.