Журнал вычислительной математики и математической физики, 2021, T. 61, № 3, стр. 369-372

О вычислении T-конгруэнтного централизатора

Х. Д. Икрамов *

МГУ, ВМК
119992 Москва, Ленинские горы, Россия

* E-mail: ikramov@cs.msu.su

Поступила в редакцию 10.02.2020
После доработки 24.07.2020
Принята к публикации 16.09.2020

Полный текст (PDF)

Аннотация

Пусть $A$ – комплексная $n \times n$-матрица. Множество $\mathcal{L}$ матриц $X$, удовлетворяющих соотношению ${{X}^{T}}AX = A$, называется $T$-конгруэнтным централизатором матрицы $A$. Показано, что вычисление матриц из нелинейного многообразия $\mathcal{L}$ можно свести к решению линейного матричного уравнения. Библ. 3.

Ключевые слова: *-конгруэнция, $T$-конгруэнция, $T$-конгруэнтный централизатор, дробно-линейная функция, матричное уравнение типа Сильвестра.

1. В пространстве ${{M}_{n}}({\mathbf{C}})$ комплексных $n \times n$-матриц рассматриваются два типа конгруэнтных преобразований: $T$-конгруэнции как преобразования вида

$A \to {{P}^{ \top }}AP$
и *-конгруэнции
$A \to P{\kern 1pt} *AP.$
В обоих случаях $P$ – произвольная невырожденная матрица. В этой статье речь пойдет о преобразованиях первого типа.

Множество $\mathcal{L}$ матриц $X$, удовлетворяющих соотношению

(1)
${{X}^{ \top }}AX = A,$
мы называем $T$-конгруэнтным централизатором матрицы $A$ по той причине, что оно есть аналог классического централизатора в том случае, когда группа $G{{L}_{n}}({\mathbf{C}})$ действует на пространстве ${{M}_{n}}({\mathbf{C}})$ конгруэнциями вместо подобий.

Хорошо известно, как вычисляется обычный централизатор, задаваемый линейным условием коммутирования с матрицей $A$. Напротив, решение квадратичного уравнения (1) представляет собой непростую задачу, решенную до конца лишь для небольшого числа матриц $A$. Нелегко даже просто определить размерность многообразия (1).

Цель настоящей заметки – показать, что вычисление матриц из $\mathcal{L}$, спектр которых не содержит хотя бы одного из чисел 1 и $ - {\kern 1pt} 1$, можно свести к решению линейного матричного уравнения. Как это делается, показано в п. 2. В п. 3 описанный прием редукции применяется к некоторым конкретным матрицам $A$.

2. Найдем дробно-линейные функции

$\phi (\lambda ) = \frac{{a\lambda + b}}{{c\lambda + d}}$
такие, что
(2)
$\phi (\lambda ) = - \phi ({{\lambda }^{{ - 1}}}),$
т.е.
$\frac{{a\lambda + b}}{{c\lambda + d}} = - \frac{{b\lambda + a}}{{d\lambda + c}}.$(3)
Нетрудно проверить, что равенство (3) невозможно, если хотя бы один из коэффициентов $a,\;b,\;c,\;d$ равен нулю. Оно эквивалентно соотношениям
$\frac{a}{b} = \frac{b}{a} = - \frac{c}{d} = - \frac{d}{c}$
или
${{a}^{2}} = {{b}^{2}},\quad {{c}^{2}} = {{d}^{2}},\quad ac = - bd,\quad ad = - bc.$
Варианты $a = b,$ $c = d$ и $a = - b,$ $c = - d$ соответствуют несовместным системам. Поэтому (3) имеет два семейства решений: функции вида
(4)
${{\phi }_{C}}(\lambda ) = C\frac{{\lambda + 1}}{{\lambda - 1}},$
получающиеся при выборе $a = b,c = - d$, и функции
(5)
${{\psi }_{D}}(\lambda ) = D\frac{{\lambda - 1}}{{\lambda + 1}},$
отвечающие выбору $a = - b,$ $c = d$. Здесь $C$ и $D$ – произвольные ненулевые константы.

3. Очевидно, что невырожденные решения уравнения (1) образуют мультипликативную группу. Если $X$ – такое решение, то (1) можно переписать в виде

(6)
${{X}^{ \top }}A = A{{X}^{{ - 1}}}.$
При любом натуральном $k$ матрица ${{X}^{k}}$ также является решением (1), а потому
(7)
${{({{X}^{k}})}^{ \top }}A = A{{({{X}^{{ - 1}}})}^{k}}.$
Рассматривая произвольную линейную комбинацию соотношений (7) для одной и той же матрицы $X$, заключаем, что
(8)
${{[f(X)]}^{ \top }}A = Af({{X}^{{ - 1}}})$
для всякого многочлена $f$ от матрицы $X$. Для любой аналитической функции $f$, определенной на спектре матрицы $X$, матрица $f(X)$ может интерпретироваться как многочлен от $X$; поэтому равенство (8) имеет место и для всех таких функций.

Выберем многочлен $f$ для формулы (8) так, чтобы матрица $f(X)$ совпала с $\phi (X) \equiv {{\phi }_{1}}(X)$, где ${{\phi }_{1}}(\lambda )$ – функция из семейства (4). Тогда

${{[\phi (X)]}^{ \top }}A = A\phi ({{X}^{{ - 1}}}).$
Согласно (2),
$\phi ({{X}^{{ - 1}}}) = - \phi (X).$
Полагая
(9)
$Y = \phi (X) = (X + I){{(X - I)}^{{ - 1}}},$
видим, что матрица $Y$ есть решение однородного матричного уравнения типа Сильвестра:
(10)
$AY + {{Y}^{ \top }}A = 0.$
При этом она не может иметь собственного значения 1.

Напротив, пусть $Y$ – произвольное решение уравнения (1), не имеющее собственного значения 1. Для такой матрицы $Y$ формула (9) допускает обращение

$X = (Y + I){{(Y - I)}^{{ - 1}}} = \phi (Y).$
Эта матрица $X$ принадлежит $T$-конгруэнтному централизатору $\mathcal{L}$.

Если спектр матрицы $X \in {{C}_{A}}$ содержит 1, но не содержит $ - {\kern 1pt} 1$, то функцию ${{\varphi }_{1}}(\lambda )$ в проведенных рассуждениях нужно заменить функцией ${{\psi }_{1}}(\lambda )$ (см. (5)).

Замечание 1. Идея приема, использованного в данном пункте, заимствована автором в книге Веддерберна “Лекции о матрицах” (см. [1]). Рецензент этой статьи указал, что хорошо известное дробно-рациональное преобразование типа (9), обсуждаемое в обзоре [2] и цитируемых там работах, позволяет значительно более простой и изящный переход от уравнения (1) к уравнению (10). Несложно проверить, что для любых квадратных матриц $A$ и $X$ справедливо равенство

$({{X}^{ \top }} - I)A(X + I) + ({{X}^{ \top }} + I)A(X - I) = 2({{X}^{ \top }}AX - A).$
Если $X$ – матрица из $T$-конгруэнтного централизатора $\mathcal{L}$, то правая часть этого равенства обращается в нуль. Тем самым, для такой матрицы $X$ имеем
$({{X}^{ \top }} - I)A(X + I) + ({{X}^{ \top }} + I)A(X - I) = 0.$
Умножая полученное соотношение слева на матрицу, обратную к ${{X}^{ \top }} - I$, и справа на матрицу, обратную к $X - I$, находим
$A(X + I){{(X - I)}^{{ - 1}}} + {{({{X}^{ \top }} - I)}^{{ - 1}}}({{X}^{ \top }} + I)A = 0.$
Учитывая (9), это и есть равенство (10).

Дополнительное достоинство этого рассуждения состоит в том, что оно не требует невырожденности от матрицы $X$.

4. Полное описание решений уравнения (10) для некоторых матриц $A$ дано в [3]. Уравнение $ZA + A{{Z}^{{\text{T}}}} = 0$, рассматриваемое в этой статье, переходит в наше уравнение (10), если положить $Z = {{Y}^{{\text{T}}}}$.

Пусть $A$ есть жорданова клетка ${{J}_{n}}(0)$ с нулем на главной диагонали. Вид решений $Y$ уравнения (10) зависит от четности числа $n$. Покажем, например, как выглядят матрицы $Y$ для четного $n = 2m$:

$\left( {\begin{array}{*{20}{c}} {{{y}_{1}}}&0&{ - {{y}_{2}}}&0&{ - {{y}_{3}}}&0& \cdots &{ - {{y}_{m}}}&0 \\ 0&{ - {{y}_{1}}}&0&0&0&0& \cdots &0&0 \\ 0&0&{{{y}_{1}}}&0&{ - {{y}_{2}}}&0& \cdots &{ - {{y}_{{m - 1}}}}&0 \\ 0&{{{y}_{2}}}&0&{ - {{y}_{1}}}&0&0& \cdots &0&0 \\ 0&0&0&0&{{{y}_{1}}}&0& \cdots &{ - {{y}_{{m - 2}}}}&0 \\ 0&{{{y}_{3}}}&0&{{{y}_{2}}}&0&{ - {{y}_{1}}}& \cdots &0&0 \\ \ldots & \ldots & \ldots & \ldots & \ldots & \ldots & \ldots & \ldots & \ldots \\ 0&{{{y}_{m}}}&0&{{{y}_{{m - 1}}}}&0&{{{y}_{{m - 2}}}}& \cdots &0&{ - {{y}_{1}}} \end{array}} \right).$

Отсюда следует, что размерность пространства решений уравнения (10) равна $m = \tfrac{n}{2}$. Такова же (нелинейная) размерность $T$-конгруэнтного централизатора $\mathcal{L}$. При нечетном $n = 2m + 1$ обе размерности равны числу $m + 1$.

Положим теперь

(11)
$A = \left( {\begin{array}{*{20}{c}} {}&{}&{}&{}&{}&{}&{{{{( - 1)}}^{{n + 1}}}} \\ {}&{}&{}&{}&{}& \cdots &{{{{( - 1)}}^{n}}} \\ {}&{}&{}&{}& \cdots & \cdots &{} \\ {}&{}&{}&{ - 1}&{ - 1}&{}&{} \\ {}&{}&1&1&{}&{}&{} \\ {}&{ - 1}&{ - 1}&{}&{}&{}&{} \\ 1&1&{}&{}&{}&{}&{} \end{array}} \right).$
При любом $n$ решения $Y$ уравнения (10), соответствующего такой матрице $A$, являются верхнетреугольными тёплицевыми матрицами. Размерность пространства решений всегда равна $\left\lfloor {\tfrac{n}{2}} \right\rfloor $. Покажем, как выглядят матрицы $Y$ для нечетного $n = 2m + 1$:

$\left( {\begin{array}{*{20}{c}} 0&{{{y}_{1}}}&0&{{{y}_{2}}}&0&{{{y}_{3}}}& \cdots &{{{y}_{m}}}&0 \\ {}&0&{{{y}_{1}}}&0&{{{y}_{2}}}&0& \cdots &0&{{{y}_{m}}} \\ {}&{}&0&{{{y}_{1}}}&0&{{{y}_{2}}}& \cdots &{{{y}_{{m - 1}}}}&0 \\ {}&{}&{}& \cdots & \cdots & \cdots & \cdots & \cdots &{} \\ {}&{}&{}&{}&{}&{}&0&{{{y}_{1}}}&0 \\ {}&{}&{}&{}&{}&{}&{}&0&{{{y}_{1}}} \\ {}&{}&{}&{}&{}&{}&{}&{}&0 \end{array}} \right).$

Замечание 2. Выбор именно таких матриц $A$, т.е. ${{J}_{n}}(0)$ и матрицы (11), обозначаемой в [3] как ${{\Gamma }_{n}}$, объясняется следующим обстоятельством. Каноническая форма произвольной $n \times n$-матрицы относительно $T$-конгруэнций есть прямая сумма блоков трех типов. Матрицы ${{J}_{k}}(0)$ и ${{\Gamma }_{k}}$ (при различных порядках $k$) представляют два из этих типов.

В заключение я хотел бы поблагодарить рецензента первоначального варианта этой статьи за очень полезные замечания, в частности, на указание, что аналогичные приемы могут быть использованы для сведения квадратных и полуторалинейных матричных уравнений типа (1) к линейным и полулинейным уравнениям.

Список литературы

  1. Wedderburn J.H.M. Lectures on Matrices. AMS, Providence, 1934.

  2. Simoncini V. Computational methods for linear matrix equations // SIAM Review. 2016. V. 58. № 3. P. 377–441.

  3. De Terán F., Dopico F.M. The solution of the equation $XA + A{{X}^{T}} = 0$ and its application to the theory of orbits // Linear Algebra Appl. 2011. V. 434. P. 44–67.

Дополнительные материалы отсутствуют.

Инструменты

Журнал вычислительной математики и математической физики