Журнал вычислительной математики и математической физики, 2022, T. 62, № 10, стр. 1615-1619
Канонические углы нормальных матриц и теоремы типа Хоффмана–Виландта и Сана
Х. Д. Икрамов *
МГУ, ВМК
119992 Москва, Ленинские горы, Россия
* E-mail: ikramov@cs.msu.su
Поступила в редакцию 23.10.2021
После доработки 05.04.2022
Принята к публикации 08.06.2022
- EDN: ICTACL
- DOI: 10.31857/S0044466922100064
Аннотация
Теоремы Хоффмана–Виландта и Сана оценивают величину возмущений в собственных значениях нормальной матрицы, вызванных возмущениями ее элементов. В теории конгруэнтных преобразований роль диагонализуемых матриц и собственных значений в известной мере выполняют юнитоидные матрицы и их канонические углы. Юнитоидными являются, в частности, нормальные матрицы. Статья посвящена обсуждению аналогов теорем Хоффмана–Виландта и Сана для канонических углов. Библ. 4. Фиг. 1.
1. Пусть $A$ и $B$ – нормальные $n \times n$-матрицы с собственными значениями соответственно ${{\lambda }_{1}}, \ldots ,{{\lambda }_{n}}$ и ${{\mu }_{1}}, \ldots ,{{\mu }_{n}}$. Теорема, опубликованная Хоффманом и Виландтом в 1953 г. (см. [1], а также [2, с. 407]) утверждает, что найдется такая перестановка $\pi $ чисел $\{ 1,2, \ldots ,n\} $, что
(1)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{\lambda }_{j}} - {{\mu }_{{\pi (j)}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant {{\left\| {A - B} \right\|}_{F}}.$Спустя более чем 40 лет теорема Хоффмана–Виландта была существенно дополнена китайским математиком Саном (J.-g. Sun), значительную часть жизни проработавшим в западных университетах, в частности, в университете шведского города Умео. Сан показал (см. [3]), что ценой небольшого ухудшения оценки (1) можно опустить предположение о нормальности матрицы $B$ при том, что $A$ остается нормальной матрицей. В этом случае (1) нужно заменить оценкой
(2)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{\lambda }_{j}} - {{\mu }_{{\pi (j)}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant \sqrt n {{\left\| {A - B} \right\|}_{F}}.$Квадратная комплексная матрица $A$ называется юнитоидной (или юнитоидом), если она может быть приведена к диагональному виду посредством конгруэнции, т.е. матричного преобразования типа
где $P$ – произвольная невырожденная матрица. (Это понятие впервые появилось в [4].) Юнитоидны, например, нормальные матрицы, приводимые к диагональному виду унитарными конгруэнциями (являющимися заодно унитарными подобиями). Однако существуют и анормальные юнитоиды. Например, жорданова клетка ${{J}_{n}}(1)$ порядка $n$ с единицей на главной диагонали есть юнитоид.Условимся в дальнейшем рассматривать только невырожденные матрицы. Если такая матрица $A$ есть юнитоид, то среди ее диагональных форм имеется единственная, все диагональные элементы которой унимодулярны. Аргументы этих элементов, выбираемые, скажем, в интервале $[0,2\pi )$, называются каноническими углами матрицы $A$.
Невырожденной матрице $A$ можно сопоставить матрицу
называемую коквадратом матрицы $A$ (см. [2, § 4.5]). Если $A$ – юнитоид, то собственными значениями матрицы ${{\mathcal{C}}_{A}}$ являются числа ${{e}^{{2i{{\phi }_{1}}}}}, \ldots ,{{e}^{{2i{{\phi }_{n}}}}}$, где ${{\phi }_{1}}, \ldots ,{{\phi }_{n}}$ – канонические углы матрицы $A$.Нетрудно показать, что коквадрат нормальной матрицы есть матрица унитарная. Верно даже более сильное утверждение: невырожденная матрица $A$ нормальна тогда и только тогда, когда ее коквадрат является унитарной матрицей.
Множество канонических углов (невырожденной) нормальной матрицы $A$ будем называть ее каноническим спектром. Наша цель – обсудить, как должны выглядеть аналоги теорем Хоффмана–Виландта и Сана для канонических углов нормальных матриц. В п. 2 мы выводим оценку типа Хоффмана–Виландта для расстояния между каноническими спектрами нормальных матриц $A$ и $B$. Эта оценка универсальна в том смысле, что она верна для любых $A$ и $B$, однако она дает довольно пессимистические результаты, если $A$ и $B$ имеют малые собственные значения. В связи с этим мы вводим в п. 3 понятие растягивающей матрицы и показываем, как для матриц этого типа улучшить универсальную оценку. В п. 4 обсуждаются аналоги теоремы Сана.
2. Пусть $A$ и $B$ – нормальные матрицы с собственными значениями соответственно ${{\lambda }_{j}} = {{r}_{j}}{{e}^{{i{{\phi }_{j}}}}}$ и ${{\mu }_{j}} = {{\rho }_{j}}{{e}^{{i{{\psi }_{j}}}}},\;j = 1,2, \ldots ,n$. Как отмечено в п. 1, коквадраты ${{\mathcal{C}}_{A}}$ и ${{\mathcal{C}}_{B}}$ суть унитарные матрицы с собственными значениями соответственно ${{e}^{{2i{{\phi }_{j}}}}}$ и ${{e}^{{2i{{\psi }_{j}}}}}$, $j = 1,2, \ldots ,n$. К этим унитарным матрицам можно применить теорему Хоффмана–Виландта в ее “классической” форме: найдется такая перестановка $\pi $ чисел $\{ 1,2, \ldots ,n\} $, что
(3)
$\sum\limits_{j = 1}^n {{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}^{2}} \leqslant \left\| {{{\mathcal{C}}_{A}} - {{\mathcal{C}}_{B}}} \right\|_{F}^{2}.$(4)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2\sqrt n {{\left\| {{{A}^{{ - 1}}}} \right\|}_{2}}{{\left\| {A - B} \right\|}_{F}}.$3. Присутствие в универсальной оценке типа Хоффмана–Виландта величины порядка $\left\| {{{A}^{{ - 1}}}} \right\|$ представляется неизбежным, исходя из следующего соображения. Пусть $A$ имеет собственное значение ${{\lambda }_{0}} = r{{e}^{{i\phi }}}$ с малым модулем $r$, и пусть при возмущении $A$ матрицей $\Delta $ число ${{\lambda }_{0}}$ переходит в ${{\tilde {\lambda }}_{0}} = r{{e}^{{i\psi }}}$. Собственным значениям ${{\lambda }_{0}}$ и ${{\tilde {\lambda }}_{0}}$ матриц $A$ и $B$ соответствуют собственные значения ${{e}^{{2i\phi }}}$ и ${{e}^{{2i\psi }}}$ их коквадратов. При этом модули разностей ${{e}^{{2i\phi }}} - {{e}^{{2i\psi }}}$ и ${{\lambda }_{0}} - {{\tilde {\lambda }}_{0}}$ отличаются друг от друга множителем порядка $1{\text{/}}r$.
Напомним, что квадратная матрица $A$ называется сходящейся (convergent; см. [2, с. 180]), если ${{A}^{m}} \to 0$ при $m \to \infty $. Необходимое и достаточное условие сходимости состоит в том, чтобы все собственные значения матрицы $A$ были по модулю меньше единицы. Мы выделим подкласс сходящихся матриц условием
Будем называть матрицы этого подкласса сжимающими.Определение. Назовем невырожденную матрицу $A$ растягивающей, если ${{A}^{{ - 1}}}$ – сжимающая матрица.
Таким образом, все собственные значения растягивающей матрицы больше единицы по модулю.
Для растягивающей матрицы оценка (4) принимает вид
(5)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2n{{\left\| {A - B} \right\|}_{F}}.$Оказывается, что от множителя $n$ в оценке (5) можно избавиться. В этом нам поможет фиг. 1.
Пусть $\lambda = r{{e}^{{i\phi }}}$ и $\mu = \rho {{e}^{{i\psi }}}$ – собственные значения соответственно матриц $A$ и $B$. Положим $\alpha = \phi - \psi $. Тогда углы при основании равнобедренного треугольника OLM равны $\beta = (\pi - \alpha ){\text{/}}2$. Предполагая для определенности, что $\left| \mu \right| \leqslant \left| \lambda \right|$, проведем из точки $\mu $ отрезок, параллельный хор-де LM, до его пересечения в точке $\nu $ с лучом O$\lambda $. В треугольнике $\lambda \mu \nu $ угол $\gamma $ при вершине $\nu $ равен $\pi - \beta = (\pi + \alpha ){\text{/}}2$, т.е. этот угол тупой и, значит, сторона $\lambda \mu $ – наибольшая в $\Delta \lambda \mu \nu $. Итак,
(6)
$\left| {{{e}^{{2i\phi }}} - {{e}^{{2i\psi }}}} \right| \leqslant 2\left| {\lambda - \mu } \right|.$Применяя неравенство (6) ко всем разностям, входящим в левую часть соотношения (3), получаем
(7)
${{\left( {\sum\limits_{j = 1}^n {{{\left| {{{e}^{{2i{{\phi }_{j}}}}} - {{e}^{{2i{{\psi }_{{\pi (j)}}}}}}} \right|}}^{2}}} \right)}^{{1/2}}} \leqslant 2{{\left\| {A - B} \right\|}_{F}}.$4. Говоря об аналоге теоремы Сана для канонических углов, нужно иметь в виду следующее обстоятельство. Матрица $B$ теперь не обязана быть нормальной. Более того, если на нормальную матрицу $A$ не наложены никакие ограничения, то в любой ее окрестности может находиться матрица, не являющаяся юнитоидной. Простой пример дают матрицы
Таким образом, должно быть выдвинуто какое-то условие, обеспечивающее простоту спектра матрицы $A$ и достаточную разделенность ее собственных значений. В этом случае существует некоторая окрестность $A$, в которой все матрицы юнитоидны. Матрица $B$ должна принадлежать этой окрестности.
В выкладки п. 2 следует в случае теоремы Сана внести такие изменения:
1) в соответствии с (2) оценку (3) нужно заменить на
2) коквадрат ${{\mathcal{C}}_{B}}$ не будет унитарной матрицей, если $B$ анормальна. Поэтому его фробениусову норму нельзя заменить на константу $\sqrt n $, как это сделано в неравенстве (4). Вместо (4) мы должны теперь иметь
Понятия сходящейся, сжимающей и растягивающей матриц никак не связаны со свойством нормальности. Поэтому рассуждения п. 3, относящиеся к растягивающим матрицам $A$ и $B$, сохраняют силу и в данном случае. Вместо (7) мы получим теперь оценку
Замечание. Рецензент этой статьи указал, что от коэффициента $\sqrt n $ в формуле (4) можно избавиться изобретательным применением стандартных неравенств типа ${{\left\| {XY} \right\|}_{F}} \leqslant {{\left\| X \right\|}_{2}}{{\left\| Y \right\|}_{F}}$ и ${{\left\| {XYZ} \right\|}_{F}} \leqslant {{\left\| X \right\|}_{2}}{{\left\| Y \right\|}_{F}}{{\left\| Z \right\|}_{2}}$. Автор не хотел бы присваивать себе честь публикации этой улучшенной оценки и надеется, что рецензент сделает это сам под собственным именем. С моей же точки зрения присутствие или отсутствие в оценке нормы обратной матрицы важнее конкретных численных коэффициентов, что я и стремился показать в статье.
Список литературы
Hoffman A.J., Wielandt H.W. The variation of the spectrum of a normal matrix // Duke Math. J. 1953. V. 20. P. 37–39.
Horn R.A., Johnson C.R. Matrix Analysis. Second edition. Cambridge: Cambridge Univer. Press, 2013.
Sun J.-g. On the variation of the spectrum of a normal matrix // Linear Algebra Appl. 1996. V. 246. P. 215–223.
Johnson C.R., Furtado S. A generalization of Sylvester’s law of inertia // Linear Algebra Appl. 2001. V. 338. P. 287–290.
Дополнительные материалы отсутствуют.
Инструменты
Журнал вычислительной математики и математической физики