Журнал вычислительной математики и математической физики, 2022, T. 62, № 10, стр. 1615-1619

Канонические углы нормальных матриц и теоремы типа Хоффмана–Виландта и Сана

Х. Д. Икрамов *

МГУ, ВМК
119992 Москва, Ленинские горы, Россия

* E-mail: ikramov@cs.msu.su

Поступила в редакцию 23.10.2021
После доработки 05.04.2022
Принята к публикации 08.06.2022

Полный текст (PDF)

Аннотация

Теоремы Хоффмана–Виландта и Сана оценивают величину возмущений в собственных значениях нормальной матрицы, вызванных возмущениями ее элементов. В теории конгруэнтных преобразований роль диагонализуемых матриц и собственных значений в известной мере выполняют юнитоидные матрицы и их канонические углы. Юнитоидными являются, в частности, нормальные матрицы. Статья посвящена обсуждению аналогов теорем Хоффмана–Виландта и Сана для канонических углов. Библ. 4. Фиг. 1.

Ключевые слова: конгруэнция, коквадрат, юнитоид, канонические углы, сходящаяся матрица.

1. Пусть $A$ и $B$ – нормальные $n \times n$-матрицы с собственными значениями соответственно ${{\lambda }_{1}}, \ldots ,{{\lambda }_{n}}$ и ${{\mu }_{1}}, \ldots ,{{\mu }_{n}}$. Теорема, опубликованная Хоффманом и Виландтом в 1953 г. (см. [1], а также [2, с. 407]) утверждает, что найдется такая перестановка $\pi $ чисел $\{ 1,2, \ldots ,n\} $, что

(1)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{\lambda }_{j}} - {{\mu }_{{\pi (j)}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant {{\left\| {A - B} \right\|}_{F}}.$
Напомним, что символ ${{\left\| {\, \cdot \,} \right\|}_{F}}$ обозначает норму Фробениуса, называемую также евклидовой матричной нормой.

Спустя более чем 40 лет теорема Хоффмана–Виландта была существенно дополнена китайским математиком Саном (J.-g. Sun), значительную часть жизни проработавшим в западных университетах, в частности, в университете шведского города Умео. Сан показал (см. [3]), что ценой небольшого ухудшения оценки (1) можно опустить предположение о нормальности матрицы $B$ при том, что $A$ остается нормальной матрицей. В этом случае (1) нужно заменить оценкой

(2)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{\lambda }_{j}} - {{\mu }_{{\pi (j)}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant \sqrt n {{\left\| {A - B} \right\|}_{F}}.$

Квадратная комплексная матрица $A$ называется юнитоидной (или юнитоидом), если она может быть приведена к диагональному виду посредством конгруэнции, т.е. матричного преобразования типа

$A \to P{\kern 1pt} *{\kern 1pt} AP,$
где $P$ – произвольная невырожденная матрица. (Это понятие впервые появилось в [4].) Юнитоидны, например, нормальные матрицы, приводимые к диагональному виду унитарными конгруэнциями (являющимися заодно унитарными подобиями). Однако существуют и анормальные юнитоиды. Например, жорданова клетка ${{J}_{n}}(1)$ порядка $n$ с единицей на главной диагонали есть юнитоид.

Условимся в дальнейшем рассматривать только невырожденные матрицы. Если такая матрица $A$ есть юнитоид, то среди ее диагональных форм имеется единственная, все диагональные элементы которой унимодулярны. Аргументы этих элементов, выбираемые, скажем, в интервале $[0,2\pi )$, называются каноническими углами матрицы $A$.

Невырожденной матрице $A$ можно сопоставить матрицу

${{\mathcal{C}}_{A}} = {{A}^{ - }}{\kern 1pt} *{\kern 1pt} A,$
называемую коквадратом матрицы $A$ (см. [2, § 4.5]). Если $A$ – юнитоид, то собственными значениями матрицы ${{\mathcal{C}}_{A}}$ являются числа ${{e}^{{2i{{\phi }_{1}}}}}, \ldots ,{{e}^{{2i{{\phi }_{n}}}}}$, где ${{\phi }_{1}}, \ldots ,{{\phi }_{n}}$ – канонические углы матрицы $A$.

Нетрудно показать, что коквадрат нормальной матрицы есть матрица унитарная. Верно даже более сильное утверждение: невырожденная матрица $A$ нормальна тогда и только тогда, когда ее коквадрат является унитарной матрицей.

Множество канонических углов (невырожденной) нормальной матрицы $A$ будем называть ее каноническим спектром. Наша цель – обсудить, как должны выглядеть аналоги теорем Хоффмана–Виландта и Сана для канонических углов нормальных матриц. В п. 2 мы выводим оценку типа Хоффмана–Виландта для расстояния между каноническими спектрами нормальных матриц $A$ и $B$. Эта оценка универсальна в том смысле, что она верна для любых $A$ и $B$, однако она дает довольно пессимистические результаты, если $A$ и $B$ имеют малые собственные значения. В связи с этим мы вводим в п. 3 понятие растягивающей матрицы и показываем, как для матриц этого типа улучшить универсальную оценку. В п. 4 обсуждаются аналоги теоремы Сана.

2. Пусть $A$ и $B$ – нормальные матрицы с собственными значениями соответственно ${{\lambda }_{j}} = {{r}_{j}}{{e}^{{i{{\phi }_{j}}}}}$ и ${{\mu }_{j}} = {{\rho }_{j}}{{e}^{{i{{\psi }_{j}}}}},\;j = 1,2, \ldots ,n$. Как отмечено в п. 1, коквадраты ${{\mathcal{C}}_{A}}$ и ${{\mathcal{C}}_{B}}$ суть унитарные матрицы с собственными значениями соответственно ${{e}^{{2i{{\phi }_{j}}}}}$ и ${{e}^{{2i{{\psi }_{j}}}}}$, $j = 1,2, \ldots ,n$. К этим унитарным матрицам можно применить теорему Хоффмана–Виландта в ее “классической” форме: найдется такая перестановка $\pi $ чисел $\{ 1,2, \ldots ,n\} $, что

(3)
$\sum\limits_{j = 1}^n {{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}^{2}} \leqslant \left\| {{{\mathcal{C}}_{A}} - {{\mathcal{C}}_{B}}} \right\|_{F}^{2}.$
Положим
$\Delta = B - A$
и оценим правую часть неравенства (3). Имеем
$\begin{gathered} {{\mathcal{C}}_{A}} - {{\mathcal{C}}_{B}} = {{A}^{ - }}{\text{*}}A - {{B}^{ - }}{\kern 1pt} *{\kern 1pt} B = ({{A}^{ - }}{\kern 1pt} *{\kern 1pt} A - {{A}^{ - }}{\kern 1pt} *{\kern 1pt} B) + ({{A}^{ - }}{\kern 1pt} *{\kern 1pt} B - {{B}^{ - }}{\kern 1pt} *{\kern 1pt} B) = \\ \, = - {{A}^{ - }}{\kern 1pt} *{\kern 1pt} \Delta + ({{A}^{ - }}{\kern 1pt} * - {{B}^{ - }}{\kern 1pt} *)B = - {{A}^{ - }}{\kern 1pt} *{\kern 1pt} \Delta + {{A}^{ - }}{\kern 1pt} *{\kern 1pt} \Delta {\kern 1pt} *{\kern 1pt} {{B}^{ - }}{\kern 1pt} *{\kern 1pt} B. \\ \end{gathered} $
Отсюда выводим
${{\left\| {{{\mathcal{C}}_{A}} - {{\mathcal{C}}_{B}}} \right\|}_{F}} \leqslant {{\left\| {{{A}^{{ - 1}}}} \right\|}_{2}}\left( {{{{\left\| {{{\mathcal{C}}_{B}}} \right\|}}_{F}} + {{{\left\| I \right\|}}_{F}}} \right){{\left\| \Delta \right\|}_{F}}$
и
(4)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2\sqrt n {{\left\| {{{A}^{{ - 1}}}} \right\|}_{2}}{{\left\| {A - B} \right\|}_{F}}.$
Символ ${{\left\| {\, \cdot \,} \right\|}_{2}}$ в применении к матрице есть стандартное обозначение спектральной нормы. В неравенстве (4) учтено то обстоятельство, что фробениусова норма унитарной $n \times n$-матрицы ${{\mathcal{C}}_{B}}$ равна $\sqrt n $.

3. Присутствие в универсальной оценке типа Хоффмана–Виландта величины порядка $\left\| {{{A}^{{ - 1}}}} \right\|$ представляется неизбежным, исходя из следующего соображения. Пусть $A$ имеет собственное значение ${{\lambda }_{0}} = r{{e}^{{i\phi }}}$ с малым модулем $r$, и пусть при возмущении $A$ матрицей $\Delta $ число ${{\lambda }_{0}}$ переходит в ${{\tilde {\lambda }}_{0}} = r{{e}^{{i\psi }}}$. Собственным значениям ${{\lambda }_{0}}$ и ${{\tilde {\lambda }}_{0}}$ матриц $A$ и $B$ соответствуют собственные значения ${{e}^{{2i\phi }}}$ и ${{e}^{{2i\psi }}}$ их коквадратов. При этом модули разностей ${{e}^{{2i\phi }}} - {{e}^{{2i\psi }}}$ и ${{\lambda }_{0}} - {{\tilde {\lambda }}_{0}}$ отличаются друг от друга множителем порядка $1{\text{/}}r$.

Напомним, что квадратная матрица $A$ называется сходящейся (convergent; см. [2, с. 180]), если ${{A}^{m}} \to 0$ при $m \to \infty $. Необходимое и достаточное условие сходимости состоит в том, чтобы все собственные значения матрицы $A$ были по модулю меньше единицы. Мы выделим подкласс сходящихся матриц условием

${{\left\| A \right\|}_{2}} < 1.$
Будем называть матрицы этого подкласса сжимающими.

Определение. Назовем невырожденную матрицу $A$ растягивающей, если ${{A}^{{ - 1}}}$ – сжимающая матрица.

Таким образом, все собственные значения растягивающей матрицы больше единицы по модулю.

Для растягивающей матрицы оценка (4) принимает вид

(5)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2n{{\left\| {A - B} \right\|}_{F}}.$
Здесь использовано известное соотношение
${{\left\| {{{A}^{{ - 1}}}} \right\|}_{F}} \leqslant \sqrt n {{\left\| {{{A}^{{ - 1}}}} \right\|}_{2}}.$
Поэтому для растягивающей матрицы $A$ имеем ${{\left\| {{{A}^{{ - 1}}}} \right\|}_{F}} \leqslant \sqrt n $.

Оказывается, что от множителя $n$ в оценке (5) можно избавиться. В этом нам поможет фиг. 1.

Фиг. 1.

Пусть $\lambda = r{{e}^{{i\phi }}}$ и $\mu = \rho {{e}^{{i\psi }}}$ – собственные значения соответственно матриц $A$ и $B$. Положим $\alpha = \phi - \psi $. Тогда углы при основании равнобедренного треугольника OLM равны $\beta = (\pi - \alpha ){\text{/}}2$. Предполагая для определенности, что $\left| \mu \right| \leqslant \left| \lambda \right|$, проведем из точки $\mu $ отрезок, параллельный хор-де LM, до его пересечения в точке $\nu $ с лучом O$\lambda $. В треугольнике $\lambda \mu \nu $ угол $\gamma $ при вершине $\nu $ равен $\pi - \beta = (\pi + \alpha ){\text{/}}2$, т.е. этот угол тупой и, значит, сторона $\lambda \mu $ – наибольшая в $\Delta \lambda \mu \nu $. Итак,

$\left| {\lambda - \mu } \right| > \left| \mu \right|\left| {{{e}^{{i\phi }}} - {{e}^{{i\psi }}}} \right| > \left| {{{e}^{{i\phi }}} - {{e}^{{i\psi }}}} \right|.$
С другой стороны,
$\left| {{{e}^{{2i\phi }}} - {{e}^{{2i\psi }}}} \right| = \left| {{{e}^{{i\phi }}} - {{e}^{{i\psi }}}} \right|\left| {{{e}^{{i\phi }}} + {{e}^{{i\psi }}}} \right| \leqslant 2\left| {{{e}^{{i\phi }}} - {{e}^{{i\psi }}}} \right|.$
Следовательно,

(6)
$\left| {{{e}^{{2i\phi }}} - {{e}^{{2i\psi }}}} \right| \leqslant 2\left| {\lambda - \mu } \right|.$

Применяя неравенство (6) ко всем разностям, входящим в левую часть соотношения (3), получаем

$\sum\limits_{j = 1}^n {{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}^{2}} \leqslant 4\sum\limits_{j = 1}^n {{\left| {{{\lambda }_{j}} - {{\mu }_{{\pi (j)}}}} \right|}^{2}} \leqslant 4\left\| {A - B} \right\|_{F}^{2},$
т.е.
(7)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2{{\left\| {A - B} \right\|}_{F}}.$
Подчеркнем, что это симпатичное неравенство верно только для растягивающих матриц $A$ и $B$.

4. Говоря об аналоге теоремы Сана для канонических углов, нужно иметь в виду следующее обстоятельство. Матрица $B$ теперь не обязана быть нормальной. Более того, если на нормальную матрицу $A$ не наложены никакие ограничения, то в любой ее окрестности может находиться матрица, не являющаяся юнитоидной. Простой пример дают матрицы

$A = \left( {\begin{array}{*{20}{c}} 0&1 \\ 1&0 \end{array}} \right)\quad {\text{и}}\quad B = \left( {\begin{array}{*{20}{c}} 0&1 \\ 1&{\varepsilon i} \end{array}} \right),\quad \varepsilon \ne 0.$
Матрица $A$ симметрична, а $B$ анормальна, и жорданова форма ее коквадрата – это клетка второго порядка для собственного значения 1. Если для пары матриц $(A,B)$ мы имеем подобный случай, то бессмысленно говорить о расстоянии между их каноническими спектрами.

Таким образом, должно быть выдвинуто какое-то условие, обеспечивающее простоту спектра матрицы $A$ и достаточную разделенность ее собственных значений. В этом случае существует некоторая окрестность $A$, в которой все матрицы юнитоидны. Матрица $B$ должна принадлежать этой окрестности.

В выкладки п. 2 следует в случае теоремы Сана внести такие изменения:

1) в соответствии с (2) оценку (3) нужно заменить на

$\sum\limits_{j = 1}^n {{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}^{2}} \leqslant n\left\| {{{\mathcal{C}}_{A}} - {{\mathcal{C}}_{B}}} \right\|_{F}^{2};$

2) коквадрат ${{\mathcal{C}}_{B}}$ не будет унитарной матрицей, если $B$ анормальна. Поэтому его фробениусову норму нельзя заменить на константу $\sqrt n $, как это сделано в неравенстве (4). Вместо (4) мы должны теперь иметь

${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant \sqrt n \left( {\sqrt n + {{{\left\| {{{\mathcal{C}}_{B}}} \right\|}}_{F}}} \right){{\left\| {{{A}^{{ - 1}}}} \right\|}_{2}}{{\left\| {A - B} \right\|}_{F}}.$

Понятия сходящейся, сжимающей и растягивающей матриц никак не связаны со свойством нормальности. Поэтому рассуждения п. 3, относящиеся к растягивающим матрицам $A$ и $B$, сохраняют силу и в данном случае. Вместо (7) мы получим теперь оценку

${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2\sqrt n {{\left\| {A - B} \right\|}_{F}}.$

Замечание. Рецензент этой статьи указал, что от коэффициента $\sqrt n $ в формуле (4) можно избавиться изобретательным применением стандартных неравенств типа ${{\left\| {XY} \right\|}_{F}} \leqslant {{\left\| X \right\|}_{2}}{{\left\| Y \right\|}_{F}}$ и ${{\left\| {XYZ} \right\|}_{F}} \leqslant {{\left\| X \right\|}_{2}}{{\left\| Y \right\|}_{F}}{{\left\| Z \right\|}_{2}}$. Автор не хотел бы присваивать себе честь публикации этой улучшенной оценки и надеется, что рецензент сделает это сам под собственным именем. С моей же точки зрения присутствие или отсутствие в оценке нормы обратной матрицы важнее конкретных численных коэффициентов, что я и стремился показать в статье.

Список литературы

  1. Hoffman A.J., Wielandt H.W. The variation of the spectrum of a normal matrix // Duke Math. J. 1953. V. 20. P. 37–39.

  2. Horn R.A., Johnson C.R. Matrix Analysis. Second edition. Cambridge: Cambridge Univer. Press, 2013.

  3. Sun J.-g. On the variation of the spectrum of a normal matrix // Linear Algebra Appl. 1996. V. 246. P. 215–223.

  4. Johnson C.R., Furtado S. A generalization of Sylvester’s law of inertia // Linear Algebra Appl. 2001. V. 338. P. 287–290.

Дополнительные материалы отсутствуют.