Доклады Российской академии наук. Математика, информатика, процессы управления, 2020, T. 493, № 1, стр. 99-103

КОНТАКТНАЯ ГЕОМЕТРИЯ В ОПТИМАЛЬНОМ УПРАВЛЕНИИ ТЕРМОДИНАМИЧЕСКИМИ ПРОЦЕССАМИ В ГАЗАХ

А. Г. Кушнер 12*, В. В. Лычагин 3**, М. Д. Рооп 13***

1 Московский государственный университет имени М.В. Ломоносова
Москва, Россия

2 Московский педагогический государственный университет
Москва, Россия

3 Институт проблем управления им. В.А. Трапезникова Российской академии наук
Москва, Россия

* E-mail: kushner@physics.msu.ru
** E-mail: valentin.lychagin@uit.no
*** E-mail: mihail_roop@mail.ru

Поступила в редакцию 27.03.2020
После доработки 14.04.2020
Принята к публикации 06.06.2020

Полный текст (PDF)

Аннотация

Решается задача оптимального управления термодинамическими процессами для идеального газа. Термодинамическое состояние задается как лежандрово многообразие в контактном пространстве. С помощью принципа максимума Понтрягина на этом многообразии находится оптимальная траектория (термодинамический процесс), при которой максимизируется работа, совершаемая газом. Показано, что в случае идеального газа соответствующая гамильтонова система является вполне интегрируемой, и приводится ее решение в квадратурах.

Ключевые слова: контактная геометрия, термодинамика, оптимальное управление, гамильтоновы системы, интегрируемость

Проблема оптимального управления является важной при решении ряда практических задач газовой динамики, фильтрации газов в пористых средах, когда с помощью внешних воздействий можно регулировать термодинамический процесс, в котором участвует среда. При этом естественно прежде всего рассмотреть случай, когда среди всех процессов находится тот, при котором максимизируется работа, совершаемая газом. В отличие от работ [1], в которых предлагаются методы управления неравновесными термодинамическими процессами, мы ограничимся равновесной термодинамикой. Наш подход основан на геометрической формулировке термодинамики, восходящей к работам [24] и, как показано в работе [5], тесно связанной с теорией измерений. Представление термодинамического состояния газа как лежандрова подмногообразия в термодинамическом контактном пространстве, а также тот факт, что неотрицательность дисперсии измерений экстенсивных термодинамических величин приводит к римановым структурам на этом многообразии [5], позволяет применить принцип максимума Понтрягина к задаче нахождения такой кривой на лежандровом многообразии, которая реализует максимум функционала работы. Такая постановка задачи в случае идеального газа приводит к интегрируемой по Лиувиллю гамильтоновой системе, и тем самым задача оптимального управления допускает точное решение.

1. ТЕРМОДИНАМИКА

Рассмотрим контактное пространство $({{\mathbb{R}}^{5}},\theta )$ с координатами ($s$, $e$, ${v}$, p, $T$), обозначающими соответственно удельные энтропию, внутреннюю энергию и объем, давление и температуру, на котором контактная структура задана дифференциальной 1-формой

$\theta = ds - {{T}^{{ - 1}}}de - p{{T}^{{ - 1}}}d{v}.$

Под термодинамическим состоянием будем понимать максимальное интегральное многообразие L формы θ, т.е. лежандрово многообразие, что физически означает выполнение первого начала термодинамики на L. Выбор в качестве координат на L экстенсивных переменных ($e$, ${v}$), а также условие ${{\left. \theta \right|}_{L}} = 0$ приводят к тому, что L можно задать с помощью функции $\sigma (e,{v})$:

(1)
$L\, = \,\left\{ {(s,e,{v},p,T)\, \in \,{{\mathbb{R}}^{5}}|s\, = \,\sigma (e,{v}),T\, = \,\frac{1}{{{{\sigma }_{e}}}},p\, = \,\frac{{{{\sigma }_{{v}}}}}{{{{\sigma }_{e}}}}} \right\}.$

На лежандровом многообразии L определена дифференциальная квадратичная форма [5]

$\kappa = d({{T}^{{ - 1}}}) \cdot de + d(p{{T}^{{ - 1}}}) \cdot d{v},$
где $ \cdot $ означает симметрическое произведение. Допустимые термодинамические состояния соответствуют тем областям на L, где форма $\kappa $ отрицательно определена, а значения формы $ - \kappa (Y,Y)$, где $Y$ – векторное поле на L, в этих областях являются суммарной дисперсией величин ($e$, ${v}$), измеряемых в соответствующих точках на L в направлении Y.

Под термодинамическим процессом будем понимать контактный диффеоморфизм Φ : ${{\mathbb{R}}^{5}} \to {{\mathbb{R}}^{5}}$, сохраняющий лежандрову поверхность L. С инфинитезимальной точки зрения, преобразование $\Phi $ есть сдвиг вдоль траекторий векторного поля Xf. Общий вид контактного векторного поля X:

$\begin{gathered} {{X}_{f}} = T(p{{f}_{p}} + T{{f}_{T}}){{\partial }_{e}} - T{{f}_{p}}{{\partial }_{{v}}} + \\ + \;(f + T{{f}_{T}}){{\partial }_{s}} + T({{f}_{{v}}} - p{{f}_{e}}){{\partial }_{p}} - T({{f}_{s}} + T{{f}_{e}}){{\partial }_{T}}, \\ \end{gathered} $
где $f = f(s,e,{v},p,T)$ – производящая функция контактного векторного поля Xf. Нетрудно показать, что ${{X}_{f}}(f) = ff{{~}_{s}}$, откуда следует, что Xf. касается гиперповерхности $\left\{ {f = 0} \right\}$. Выберем в качестве функций fj

${{f}_{1}} = p - \frac{{{{\sigma }_{{v}}}}}{{{{\sigma }_{e}}}},\quad {{f}_{2}} = T - \frac{1}{{{{\sigma }_{e}}}},\quad {{f}_{3}} = s - \sigma (e,{v}).$

Тогда в силу (1) соотношение ${{f}_{1}} = {{f}_{2}} = {{f}_{3}} = 0$ задает лежандрово многообразие L, а ограничения ${{Y}_{j}}$ соответствующих векторных полей ${{X}_{{{{f}_{j}}}}}$ на L имеют вид

${{Y}_{1}} = \frac{{{{\sigma }_{{v}}}}}{{\sigma _{e}^{2}}}{{\partial }_{e}} - \frac{1}{{{{\sigma }_{e}}}}{{\partial }_{{v}}},\quad {{Y}_{2}} = \frac{1}{{\sigma _{e}^{2}}}{{\partial }_{e}},\quad {{Y}_{3}} = 0.$

Выберем ${{Y}_{1}}$ и ${{Y}_{2}}$ в качестве базиса модуля векторных полей на L. Тогда искомый термодинамический процесс $l \subset L$ будет интегральной кривой векторного поля $Y = {{u}_{1}}{{Y}_{1}} + {{u}_{2}}{{Y}_{2}}$, где коэффициенты $u = ({{u}_{1}},{{u}_{2}})$ играют роль управляющих параметров. Для того чтобы задать область допустимых управлений, ограничим относительную дисперсию измерений вектора $(e,{v})$ положительным числом δ, т.е. предположим, что выполнено соотношение

$ - \frac{{\kappa (Y,Y)}}{{{{e}^{2}}}} \leqslant \delta ,$
что приводит к неравенству

$ - \kappa ({{Y}_{1}},{{Y}_{1}})u_{1}^{2} - 2\kappa ({{Y}_{1}},{{Y}_{2}}){{u}_{1}}{{u}_{2}} - \kappa ({{Y}_{2}},{{Y}_{2}})u_{2}^{2} \leqslant \delta {{e}^{2}}.$

Таким образом, для фиксированной точки $a \in L$ граница $\partial U$ множества допустимых управлений $U$ представляет собой эллипс с центром в этой точке, причем длина полуосей эллипса, вообще говоря, зависит от этой точки.

Введем форму работы $\omega = pd{v}$. Тогда функционал качества $J = \int\limits_l^{} \omega $ будет иметь вид

$J = \int\limits_0^{\bar {t}} \omega (Y)dt,$
где $t \in [0,\bar {t}]$ – параметр на кривой $l$. Значение параметра t = 0 соответствует начальной точке, а значение $t = \bar {t}$ — конечной.

Пусть ${{Y}^{{(1)}}}(x,u)$ и ${{Y}^{{(2)}}}(x,u)$ – коэффициенты векторного поля Y:

$Y = {{Y}^{{(1)}}}(x,u)\frac{\partial }{{\partial e}} + {{Y}^{{(2)}}}(x,u)\frac{\partial }{{\partial {v}}}.$

Тогда постановка задачи имеет следующий вид:

$\dot {x} = F(x,u),\quad x \in {{\mathbb{R}}^{2}},\quad u \in U,$
(2)
где $x = {{(e,{v})}^{Т}}$, $F(x,u) = \mathop {({{Y}^{{(1)}}}(x,u),{{Y}^{{(2)}}}(x,u))}\nolimits^Т $.

Гамильтониан для задачи (2) имеет вид

$H(x,\lambda ,u) = \omega (Y) + {{\lambda }_{1}}{{Y}^{{(1)}}}(x,u) + {{\lambda }_{2}}{{Y}^{{(2)}}}(x,u),$
где ${{\lambda }_{1}}$, ${{\lambda }_{2}}$ – множители Лагранжа.

2. ИДЕАЛЬНЫЙ ГАЗ

Для идеального газа лежандрова поверхность L задана следующими уравнениями состояния:

$\begin{gathered} {{f}_{1}} = p{v} - RT,\quad {{f}_{2}} = e - \frac{{nRT}}{2}, \\ {{f}_{3}} = s - Rln({{e}^{{n/2}}}{v}), \\ \end{gathered} $
где $R$ – универсальная газовая постоянная, $n$ — число степеней свободы.

Дифференциальная квадратичная форма $\kappa $ имеет вид

$\kappa = - \frac{{nR}}{{2{{e}^{2}}}}de \cdot de - \frac{R}{{{{{v}}^{2}}}}d{v} \cdot d{v}.$

Векторные поля ${{Y}_{1}}$ и ${{Y}_{2}}$ для идеального газа имеют следующий вид:

${{Y}_{1}} = - \frac{{2e{v}}}{{nR}}{{\partial }_{{v}}},\quad {{Y}_{2}} = - \frac{{2{{e}^{2}}}}{{nR}}{{\partial }_{e}}.$

Следовательно, область допустимых управлений $U$ задана как

$U = \left\{ {({{u}_{1}},{{u}_{2}}) \in {{\mathbb{R}}^{2}}\,\left| {\,\,\frac{4}{{{{n}^{2}}R}}} \right.u_{1}^{2} + \frac{2}{{nR}}u_{2}^{2} \leqslant \delta } \right\},$
и ее граница является эллипсом с постоянными полуосями.

Коммутатор векторных полей ${{Y}_{1}}$ и ${{Y}_{2}}$:

$[{{Y}_{1}},{{Y}_{2}}] = \frac{{2e}}{{nR}}{{Y}_{1}}.$

Дуальный базис порожден дифференциальными 1-формами

${{\omega }_{1}} = - \frac{{nR}}{{2e{v}}}d{v},\quad {{\omega }_{2}} = - \frac{{nR}}{{2{{e}^{2}}}}de.$

По теореме Ли–Бьянки [6, 7] форма ${{\omega }_{2}}$ точна и является внешним дифференциалом функции q1 = $nR\mathop {\left( {2e} \right)}\nolimits^{ - 1} $. Ограничение формы ${{\omega }_{1}}$ на кривую $nR\mathop {(2e)}\nolimits^{ - 1} $ = C1 также является точной формой с потенциалом ${{q}_{2}} = - {{C}_{1}}ln{v} + {{C}_{2}}$. Выберем $({{q}_{1}},{{q}_{2}})$ в качестве новых координат на L. Обратное преобразование задается в виде

(3)
$e = \frac{{nR}}{{2{{q}_{1}}}},\quad {v} = exp\left( { - \frac{{{{q}_{2}}}}{{{{q}_{1}}}}} \right).$

Тогда векторные поля ${{Y}_{1}}$ и ${{Y}_{2}}$ примут более простой вид:

${{Y}_{1}} = {{\partial }_{{{{q}_{2}}}}},\quad {{Y}_{2}} = {{\partial }_{{{{q}_{1}}}}} + \frac{{{{q}_{2}}}}{{{{q}_{1}}}}{{\partial }_{{{{q}_{2}}}}}.$

Гамильтониан задачи (2) в случае идеального газа примет следующий вид:

$H(q,\lambda ,u) = - \frac{{R{{u}_{1}}}}{{q_{1}^{2}}} + {{\lambda }_{1}}{{u}_{2}} + {{\lambda }_{2}}\left( {\frac{{{{q}_{2}}{{u}_{2}}}}{{{{q}_{1}}}} + {{u}_{1}}} \right).$

Поскольку гамильтониан $H(q,\lambda ,u)$ линеен по ${{u}_{1}}$ и ${{u}_{2}}$, то он экстремален на границе $\partial U$ области управления U. Следовательно, выбрав $\tau $ в качестве параметра на $\partial U$, можно записать:

${{u}_{1}} = \frac{{n\sqrt {R\delta } }}{2}cos\tau ,\quad {{u}_{2}} = \sqrt {\frac{{nR\delta }}{2}} sin\tau .$

Тогда гамильтониан $H(q,\lambda ,u)$ примет вид

(4)
$\begin{gathered} H(q,\lambda ,\tau ) = \\ = \;\frac{{\sqrt {2nR\delta } {{q}_{1}}({{q}_{1}}{{\lambda }_{1}} + {{q}_{2}}{{\lambda }_{2}}){\text{sin}}\tau + \sqrt {R\delta } n(q_{1}^{2}{{\lambda }_{2}} - R){\text{cos}}\tau }}{{2q_{1}^{2}}}. \\ \end{gathered} $

Для нахождения точек максимума гамильтониана требуется решить уравнение $\tfrac{{\partial H}}{{\partial \tau }} = 0$, которое эквивалентно

$sin\left( {\tau + {\text{arctg}}\left( {\frac{{\sqrt 2 {{q}_{1}}({{q}_{1}}{{\lambda }_{1}} + {{q}_{2}}{{\lambda }_{2}})}}{{\sqrt n (R - q_{1}^{2}{{\lambda }_{2}})}}} \right)} \right) = 0.$

Следовательно, точки максимума гамильтониана задаются формулой

$\begin{gathered} \tau {\text{*}}(q,\lambda ) = \pi (2k + 1) - \\ - \;{\text{arctg}}\left( {\frac{{\sqrt 2 {{q}_{1}}({{q}_{1}}{{\lambda }_{1}} + {{q}_{2}}{{\lambda }_{2}})}}{{\sqrt n \left( {R - q_{1}^{2}{{\lambda }_{2}}} \right)}}} \right),\quad k \in \mathbb{Z}. \\ \end{gathered} $

Подставляя корни $\tau {\text{*}}(q,\lambda )$ в (4), получим, что на оптимальной траектории гамильтониан имеет вид

(5)
$H(q,\lambda ) = \frac{1}{{2q_{1}^{2}}}\sqrt {nR\delta (nq_{1}^{4}\lambda _{2}^{2} + 2q_{1}^{4}\lambda _{1}^{2} + 4q_{1}^{3}{{q}_{2}}{{\lambda }_{1}}{{\lambda }_{2}} + 2q_{1}^{2}q_{2}^{2}\lambda _{2}^{2} - 2Rnq_{1}^{2}{{\lambda }_{2}} + {{R}^{2}}n)} .$

Соответствующая гамильтонова система имеет вид

(6)
$\dot {q} = \frac{{\partial H}}{{\partial \lambda }},\quad \dot {\lambda } = - \frac{{\partial H}}{{\partial q}},$
где $H(q,\lambda )$ задан формулой (5). Поскольку гамильтониан $H(q,\lambda )$ явно не зависит от времени, то он является интегралом гамильтоновой системы (6), т.е. постоянен на траекториях: $H(q,\lambda )$ = H1 = = const.

Теорема 1. Гамильтонова система (6) обладает интегралом $G(q,\lambda ) = {{q}_{1}}{{\lambda }_{2}}$, который находится в инволюции с гамильтонианом $H(q,\lambda )$, т.е. $[G,H]$ = 0, где [G, H] — скобка Пуассона на фазовом пространстве, определенная формулой

$[G,H]\Omega \wedge \Omega = dG \wedge dH \wedge \Omega ,\quad \Omega = \sum\limits_{i = 1}^2 d {{q}_{i}} \wedge d{{\lambda }_{i}}.$

Таким образом, гамильтонова система (6) интегрируема по Лиувиллю.

3. РЕШЕНИЕ ГАМИЛЬТОНОВОЙ СИСТЕМЫ

Многообразие $M \subset {{\mathbb{R}}^{4}}(q,\lambda )$, на котором лежат фазовые траектории гамильтоновой системы (6), задается уровнями ${{H}_{1}} = {\text{const}}$ и ${{H}_{2}} = {\text{const}}$ ее интегралов:

$M = \{ (q,\lambda ) \in {{\mathbb{R}}^{4}}{\text{|}}\,H(q,\lambda ) = {{H}_{1}},G(q,\lambda ) = {{H}_{2}}\} .$

Для нахождения явных решений системы (6) мы применяем метод введения переменных действие–угол [8], в которых гамильтонова система принимает наиболее простой вид. Однако прежде проанализируем многообразие $M$. Выберем $({{q}_{1}},{{q}_{2}})$ в качестве координат на $M$. Тогда при неотрицательных $D = 2R\delta n(4H_{1}^{2}q_{1}^{4} - \delta R{{n}^{2}}{{(R - {{H}_{2}}{{q}_{1}})}^{2}})$

${{\lambda }_{1}} = \frac{{ - 2{{H}_{2}}R\delta n{{q}_{2}} \pm \sqrt D }}{{2Rn\delta q_{1}^{2}}},\quad {{\lambda }_{2}} = \frac{{{{H}_{2}}}}{{{{q}_{1}}}}.$

Заметим, что D является полиномом четвертой степени по ${{q}_{1}}$. Поскольку D может менять знак в зависимости от значений ${{H}_{1}}$ и ${{H}_{2}}$, а многообразие $M$ определено там, где $D \geqslant 0$, то в зависимости от числа вещественных корней полинома D многообразие M может иметь различное, но не превышающее трех, число компонент связности. В случае, когда полином $D$ имеет четыре различных вещественных корня, $M$ трехсвязно, если D имеет два различных вещественных корня, то $M$ двусвязно, если у D единственный вещественный корень или вещественных корней нет, то многообразие $M$ односвязно.

Теорема 2. Многообразие $M$ имеет три компоненты связности, если значения интегралов ${{H}_{1}}$ и ${{H}_{2}}$ удовлетворяют неравенству

$H_{2}^{4}\delta {{n}^{2}} - 64RH_{1}^{2} \geqslant 0.$

В остальных случаях многообразие $M$ двусвязно.

Множество $\Sigma $ особенностей проекции $M$ на плоскость $({{q}_{1}},{{q}_{2}})$ задано как $\Sigma = \cup {{\Sigma }_{j}}$, где

${{\Sigma }_{j}} = \{ (q_{1}^{{(j)}},{{q}_{2}})|{{q}_{2}} \in \mathbb{R},D(q_{1}^{{(j)}}) = 0\} .$

Таким образом, для заданной начальной точки $({{q}^{{(0)}}},{{\lambda }^{{(0)}}}) \in M$ областью достижимости являются все точки, принадлежащие той же компоненте связности, что и $({{q}^{{(0)}}},{{\lambda }^{{(0)}}})$.

В качестве базиса модуля векторных полей на $M$ выберем два гамильтоновых поля XH и XG, где

${{X}_{\Psi }} = {{\Psi }_{{{{\lambda }_{1}}}}}{{\partial }_{{{{q}_{1}}}}} + {{\Psi }_{{{{\lambda }_{2}}}}}{{\partial }_{{{{q}_{2}}}}} - {{\Psi }_{{{{q}_{1}}}}}{{\partial }_{{{{\lambda }_{1}}}}} - {{\Psi }_{{{{q}_{2}}}}}{{\partial }_{{{{\lambda }_{2}}}}}.$

Наша задача состоит в том, чтобы найти две замкнутые формы ${{\varkappa }_{1}}$ и ${{\varkappa }_{2}}$ на M, дуальные к векторным полям XH и XG. Тогда их потенциалы ${{\Omega }_{1}}$ и ${{\Omega }_{2}}$ будут служить углами, а интегралы $H(q,\lambda )$ и $G(q,\lambda )$, записанные в терминах углов, – действиями.

Теорема 3. Переменные типа угол имеют следующий вид:

(7)
$\begin{gathered} {{\Omega }_{1}} = \pm \int {\frac{{4{{H}_{1}}q_{1}^{2}d{{q}_{1}}}}{{\sqrt D }}} , \\ {{\Omega }_{2}} = \frac{{{{q}_{2}}}}{{{{q}_{1}}}} \pm \int {\frac{{{{n}^{2}}R\delta (R - {{H}_{2}}{{q}_{1}})d{{q}_{1}}}}{{{{q}_{1}}\sqrt D }}} . \\ \end{gathered} $

Гамильтонова система (6) эквивалентна системе

${{\dot {\Omega }}_{1}} = 1,\quad {{\dot {\Omega }}_{2}} = 0.$

Таким образом, решение гамильтоновой системы (6) в части переменных (q1, q2) выглядит следующим образом:

(8)
${{\Omega }_{1}} = t + {{\alpha }_{1}},\quad {{\Omega }_{2}} = {{\alpha }_{2}},$
где ${{\Omega }_{1}}$ и ${{\Omega }_{2}}$ задаются соотношениями (7), а ${{\alpha }_{1}}$ и ${{\alpha }_{2}}$ – константы, определяемые с помощью условий на правом и левом концах кривой $l$. С помощью обратного преобразования (3) можно записать решение (8) в терминах исходных термодинамических переменных ($e$, ${v}$).

Траектории гамильтоновой системы, отвечающие начальной точке $T = 0.25$, ${v} = 0.78$ и различным конечным точкам, в случае одноатомного газа (n = 3) представлены на рис. 1. Этим траекториям отвечают процессы перевода термодинамической системы из начального состояния в конечные.

Рис. 1.

Оптимальные траектории для идеального газа.

Список литературы

  1. Розоноэр Л.И., Цирлин А.М. Оптимальное управление термодинамическими процессами // АиТ. 1983. № 1. С. 70–79; № 2. С. 88–101; № 3. С. 50–64.

  2. Gibbs J.W. A Method of Geometrical Representation of the Thermodynamic Properties of Substances by Means of Surfaces. Transactions of the Connecticut Academy. 1873. P. 382–404.

  3. Mrugala R. Geometrical formulation of equilibrium phenomenological thermodynamics // Reports on Mathematical Physics. 1978. V. 14. P. 419–427.

  4. Ruppeiner G. Riemannian Geometry in Thermodynamic Fluctuation Theory // Reviews of Modern Physics. 1995. V. 67. № 3. P. 605–659.

  5. Lychagin V. Contact Geometry, Measurement and Thermodynamics / In: Nonlinear PDEs, their geometry and applications. Cham: Birkhauser, 2019.

  6. Бочаров А.В., Вербовецкий А.М. и др. / Под ред. А.М.  Виноградова, И.С. Красильщика. Симметрии и законы сохранения уравнений математической физики. М.: Факториал пресс, 2005.

  7. Kushner A., Lychagin V., Rubtsov V. Contact Geometry and Non-linear Differential Equations. Cambridge: Cambridge University Press, 2007.

  8. Арнольд В.И. Математические методы классической механики. М.: УРСС, 2003.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления