Журнал вычислительной математики и математической физики, 2021, T. 61, № 5, стр. 776-786

О ТТ-рангах приближенных тензоризаций некоторых гладких функций

Л. И. Высоцкий^1, 2, *

¹ Ин-т вычисл. матем. им. Г.И. Марчука РАН
119333 Москва, ул. Губкина, 8, Россия

² МГУ им. М.В. Ломоносова, ВМК
119991 Москва, Ленинские горы, Россия

^* E-mail: vysotskylev@yandex.ru

Поступила в редакцию 24.11.2020
После доработки 24.11.2020
Принята к публикации 14.01.2021

DOI: 10.31857/S0044466921050173

Полный текст (PDF)

Аннотация

Исследуются “тензоризации” функций, т.е. тензоры с элементами $A({{i}_{1}}, \ldots ,{{i}_{d}}) = f(x({{i}_{1}}, \ldots ,{{i}_{d}}))$, где $f(x)$ – некоторая функция, заданная на отрезке, а $\{ x({{i}_{1}}, \ldots ,{{i}_{d}})\} $ – сетка на этом отрезке. Для таких тензоров ставится задача приближения тензорами, допускающими ТТ (Tensor Train)-разложение с малыми ТТ-рангами. Для класса функций, являющихся следами аналитических в некоторых эллипсах на комплексной плоскости функций комплексного переменного, получены верхние и нижние оценки ТТ-рангов оптимальных приближений. Указанные оценки применены к тензоризациям полиномиальных функций. В частности, известная верхняя граница ТТ-рангов приближений таких функций улучшена до $O(logn)$, где $n$ – степень полинома. Библ. 10.

Ключевые слова: ТТ-разложение, tensor train, ТТ-ранги, тензоризации функций, приближения.

1. ВВЕДЕНИЕ

Относительно недавние успехи по преодолению “проклятия размерности” позволяют оперировать с дискретизациями функций на очень густых сетках. Например (в духе работ [1]–[5]), заданную на отрезке $[L,R]$ функцию $f(x)$ можно дискретизировать, т.е. превратить в вектор c элементами $f(x(i))$, где $\{ x(i)\} _{{i = 0}}^{{N - 1}}$ – произвольная сетка на $[L,R]$. Если $N = {{n}_{1}} \times \ldots \times {{n}_{d}}$, то полученный вектор можно рассматривать (см. [6]) как тензор (многомерный массив) размером ${{n}_{1}} \times \ldots \times {{n}_{d}}$ с элементами:

$A({{i}_{1}}, \ldots ,{{i}_{d}}) = f(x({{i}_{1}}{{N}_{1}} + \ldots + {{i}_{d}}{{N}_{d}})),\quad {{N}_{k}} = {{n}_{{k + 1}}} \cdots {{n}_{d}},\quad {{i}_{k}} \in \{ 0, \ldots ,{{n}_{k}} - 1\} .$

Тензор $A$ будем называть тензоризацией функции $f$ на сетке $\{ x(i)\} $. Этот тензор на практике часто допускает приближение другим тензором $B$, имеющим малопараметрическое представление. К примеру, можно использовать ТТ-разложение [2], [7] (tensor train, тензорный поезд):

(1)

$B({{i}_{1}}, \ldots ,{{i}_{d}}) = \sum\limits_{{{\alpha }_{1}}, \ldots ,{{\alpha }_{{d - 1}}}} \,{{H}_{1}}({{i}_{1}},{{\alpha }_{1}}) \cdots {{H}_{k}}({{\alpha }_{{k - 1}}},{{i}_{k}},{{\alpha }_{k}}) \cdots {{H}_{d}}({{\alpha }_{{d - 1}}},{{i}_{d}}),$

где ${{H}_{k}}$ имеет размеры ${{r}_{{k - 1}}} \times {{n}_{k}} \times {{r}_{k}}$, а индекс суммирования ${{\alpha }_{k}}$ пробегает значения от $1$ до ${{r}_{k}}$. Числа ${{r}_{k}}$ называются ТТ-рангами представления (1), причем для единообразия определения тензоров ${{H}_{k}}$ считается, что ${{r}_{0}} = {{r}_{d}} = 1$.

Стоит также отметить, что в случае тензоризаций высокой размерности, когда число $N$ очень велико, вычисление и хранение в памяти элементов тензора $A$ не представляется возможным. Тем не менее иногда есть возможность получить сразу представление (1), вычисляя $f(x(i))$ лишь для небольшого количества точек $x(i)$. Например, можно использовать крестовое приближение (TT-cross approximation) из [8].

Величины ТТ-рангов играют ключевую роль для применимости ТТ-разложения, ведь требуемая для хранения тензоров ${{H}_{k}}$ память и сложность распространенных операций над тензорами в этом формате растут пропорционально полиномам малой степени от ${{r}_{k}}$ [7]. Поэтому представляется интересным исследовать, насколько малы могут быть ТТ-ранги приближений тензоризаций функций.

Для некоторых классов функций известны компактные представления для тензоризаций, например, для экспоненты, синуса и некоторых других [1], [3]. Для тензоризации полинома степени $n$ на равномерной сетке известно [2], [3], что все ее ТТ-ранги ограничены $n + 1$. В [2] было показано, что ТТ-ранги приближений тензоризаций так называемых асимптотически гладких (т.е. бесконечно дифференцируемых с “не слишком быстро” растущими при приближении к сингулярностям производными) функций ограничены числом, растущим при уменьшении требуемой погрешности $\varepsilon $ как $ - lo{{g}_{2}}(\varepsilon )$. В [5] были получены оценки ТТ-рангов приближений тензоризаций полиномов на равномерных сетках, улучшающие известную оценку $n + 1$.

В данной работе для тензоризаций вещественнозначных функций, являющихся следами аналитических в некотором эллипсе функций комплексного переменного, доказаны верхние и нижние оценки ТТ-рангов приближений. Полученные оценки были применены к тензоризациям полиномов, существенно улучшив известные результаты: вместо $O(\sqrt[3]{n})$ из [5] доказана оценка $O(lnn)$.

2. НЕОБХОДИМЫЕ ОПРЕДЕЛЕНИЯ

Определение 1. Матрицами развертки тензора $A \in {{\mathbb{R}}^{{{{n}_{1}} \times \ldots \times {{n}_{d}}}}}$ называются матрицы

${{A}_{k}} \in {{\mathbb{R}}^{{({{n}_{1}} \cdots {{n}_{k}}) \times ({{n}_{{k + 1}}} \cdots {{n}_{d}})}}},\quad {{A}_{k}}({{i}_{1}}, \ldots ,{{i}_{k}};{{i}_{{k + 1}}}, \ldots ,{{i}_{d}}) = A({{i}_{1}}, \ldots ,{{i}_{d}}),$

где группы индексов до и после точки с запятой образуют так называемые мультииндексы, отождествляемые со своим номером (нумерация с нуля) в лексикографическом (словарном) порядке.

Для тензора $A \in {{\mathbb{R}}^{{{{n}_{1}} \times \ldots \times {{n}_{d}}}}}$ определим нормы

${{\left\| A \right\|}_{\infty }} = max\left| {A({{i}_{1}}, \ldots ,{{i}_{d}})} \right|\quad {\text{и}}\quad {{\left\| A \right\|}_{F}} = \sqrt {\sum {{{{(A({{i}_{1}}, \ldots ,{{i}_{d}}))}}^{2}}} } .$

В основном мы будем рассматривать “кубические” тензоризации на равномерных сетках, т.е. тензоры, все размеры которого равны одному и тому же числу $b$, а элементы заданы значениями функции $f(x)$ в равноудаленных узлах. Такие $d$-мерные тензоризации с шагом $(R - L){{b}^{{ - d}}}$ на отрезке $[L,R]$ будем обозначать через ${{T}_{{b,d,[L,R]}}}(f)$.

Для ТТ-разложения вида (1) $d$-мерного тензора $B \in {{\mathbb{R}}^{{b \times \ldots \times b}}}$ определим $\mathcal{R}({{H}_{1}}, \ldots ,{{H}_{d}})$ как максимальный из его ТТ-рангов. Далее определим $\mathcal{R}(B) = min\mathcal{R}({{H}_{1}}, \ldots ,{{H}_{d}})$, где минимум берется по всевозможным ТТ-разложениям вида (1) тензора $B$. Для оценки ТТ-рангов наилучших приближений нам понадобится функция

${{\mathcal{R}}_{\varepsilon }}(A) = \mathop {min}\limits_{B:\,\mathop {\left. {\parallel B - A} \right\|}\nolimits_F \varepsilon } \mathcal{R}(B).$

Определение 2. Эллипс на комплексной плоскости с центром в нуле и осями, параллельными осям координат, чьи полуоси равны $(\rho + {{\rho }^{{ - 1}}}){\text{/}}2$ и $(\rho - {{\rho }^{{ - 1}}}){\text{/}}2$ для некоторого $\rho > 1$, будем называть эллипсом Бернштейна и обозначать через ${{\Gamma }_{\rho }}$. Также эллипс Бернштейна можно рассматривать (см. [9]) как образ окружности $\{ \rho {{e}^{{i\varphi }}}\,:\varphi \in [0,2\pi )\} $ под действием отображения Жуковского $w \to (w + {{w}^{{ - 1}}}){\text{/}}2$. Такой же эллипс, но с центром в точке $z \in \mathbb{C}$, будем обозначать через ${{\Gamma }_{\rho }}(z)$.

Определение 3. Чебышёвской сеткой на $[ - 1,1]$ с числом узлов $n$ будем называть упорядоченное множество точек $\{ {{x}_{0}}, \ldots ,{{x}_{{n - 1}}}\} $, где ${{x}_{j}} = cos(\pi {\text{/}}(2n) + \pi j{\text{/}}n)$. Известно [9], что числа ${{x}_{j}}$ являются корнями полинома Чебышёва степени $n$, т.е. ${{T}_{n}}(x) = cos(arccos(nx))$.

Круг радиуса $r$ с центром в точке $z$ на комплексной плоскости будем обозначать через $U(r,z)$.

3. ВЕРХНИЕ ОЦЕНКИ

Докажем некоторые верхние оценки ТТ-рангов и связанных с ними величин для приближений тензоризаций функций на равномерных сетках. Основная лемма 1 уточняет известную (см., например, [9]) оценку точности приближения функции, являющейся следом аналитической в эллипсе Бернштейна. Теорема 1 демонстрирует возможность низкорангового приближения матриц развертки тензоризаций функций, аналитических в круге, чей диаметр является отрезком дискретизации. Следствие 1 дает оценку непосредственно для величины ${{\mathcal{R}}_{\epsilon }}({{T}_{{b,d,[L,R]}}}(f))$ для функций $f$ с указанным свойством. Наконец, теорема 2 рассматривает более простой случай, когда функция является аналитической в достаточно большом эллипсе. Заметим, что теорему 1 может иметь смысл применять даже для функций, являющихся аналитическими в произвольно больших множествах, так как в оценку теоремы 2 входит максимум модуля $f(z)$ на некотором эллипсе – число, которое может быть нежелательно велико для интересующей нас функции $f(z)$. Эта особенность будет использована ниже при применении полученных результатов к полиномам.

Лемма 1. Пусть $f(x)$ – след аналитической внутри эллипса Бернштейна ${{\Gamma }_{\rho }}$, $\rho > 1$, функции $f(z)$, причем ${\text{|}}{\kern 1pt} f(z){\kern 1pt} {\text{|}} \leqslant M$ на ${{\Gamma }_{\rho }}$. Пусть также ${{P}_{n}}(x)$ – полином Лагранжа степени $n$ для $f(x)$ на чебышёвской сетке на $[ - 1,1]$ с $(n + 1)$ узлом $\{ {{x}_{0}}, \ldots ,{{x}_{n}}\} $. Тогда для всех $x \in [ - 1,1]$ выполнено следующее:

$\left| {f(x) - {{P}_{n}}(x)} \right| \leqslant \frac{M}{{{{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}}}}\frac{{\rho + {{\rho }^{{ - 1}}}}}{{\tfrac{1}{2}(\rho + {{\rho }^{{ - 1}}} - 1)}}.$

Доказательство. Зафиксируем произвольное $x \in [ - 1,1]{{\backslash }}\{ {{x}_{0}}, \ldots ,{{x}_{n}}\} $. Далее рассмотрим функцию

$F(z) = \frac{{f(z)}}{{(z - x)\prod\limits_{j = 0}^n \,(z - {{x}_{j}})}}$

и, применяя теорему о вычетах и домножая на $\prod\nolimits_j {(x - {{x}_{j}})} $ (т.е. рассуждая аналогично [9, Теорема 13.6]), придем к представлению:

$\prod\limits_{j = 0}^n \,(x - {{x}_{j}})\int\limits_{{{\Gamma }_{\rho }}} \,F(z)dz = 2\pi i\left( {f(x) - \underbrace {\sum\limits_{\ell = 0}^n \,f({{x}_{\ell }})\frac{{\prod\limits_{j \ne \ell } {(x - {{x}_{j}})} }}{{\prod\limits_{j \ne \ell } {({{x}_{\ell }} - {{x}_{j}})} }}}_{{{P}_{n}}(x)}} \right).$

Так как ${{x}_{j}}$ суть в точности корни полинома Чебышёва ${{T}_{{n + 1}}}(x)$ степени $n + 1$, то можно записать

${{T}_{{n + 1}}}(x)\int\limits_{{{\Gamma }_{\rho }}} \frac{{f(z)dz}}{{(z - x){{T}_{{n + 1}}}(z)}} = 2\pi i(f(x) - {{P}_{n}}(x)).$

Используя доказанное в [9, Теорема 13.6] для $z \in {{\Gamma }_{\rho }}$ неравенство $\left| {{{T}_{{n + 1}}}(z)} \right| \geqslant ({{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}}){\text{/}}2$, а также очевидное для $x \in [ - 1,1]$ неравенство $\left| {{{T}_{{n + 1}}}(x)} \right| \leqslant 1$, при $x \in [ - 1,1]$ получаем

$\begin{gathered} \left| {f(x) - {{P}_{n}}(x)} \right| \leqslant \frac{1}{{2\pi }}\left| {{{T}_{{n + 1}}}(x)} \right|\left| {\int\limits_{{{\Gamma }_{\rho }}} \,\frac{{f(z)dz}}{{(z - x){{T}_{{n + 1}}}(z)}}} \right| \leqslant \frac{1}{{2\pi }}\int\limits_{{{\Gamma }_{\rho }}} \frac{{M\left| {dz} \right|}}{{\left| {z - x} \right|\left| {{{T}_{{n + 1}}}(z)} \right|}} \leqslant \\ \, \leqslant \frac{M}{{2\pi }}\frac{2}{{{{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}}}}\int\limits_{{{\Gamma }_{\rho }}} \,\frac{{\left| {dz} \right|}}{{\left| {z - x} \right|}} \leqslant \frac{M}{{\pi ({{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}})}}\frac{{\left| {{{\Gamma }_{\rho }}} \right|}}{{\mathop {min}\limits_{z \in {{\Gamma }_{\rho }}} \left| {z - x} \right|}}. \\ \end{gathered} $

Для оценки длины эллипса ${{\Gamma }_{\rho }}$ воспользуемся упомянутым фактом, что первый является образом окружности ${{S}_{\rho }} = \{ \rho {{e}^{{i\varphi }}}\,:\varphi \in [0,2\pi )\} $ под действием отображения $w \to (w + {{w}^{{ - 1}}}){\text{/}}2$:

$\left| {{{\Gamma }_{\rho }}} \right| = \int\limits_{{{\Gamma }_{\rho }}} \,\left| {dz} \right| = \int\limits_{{{S}_{\rho }}} \,\left| {\frac{1}{2}dw - \frac{1}{2}{{w}^{{ - 2}}}dw} \right| = \int\limits_0^{2\pi } \,\frac{1}{2}\left| {1 - {{{(\rho {{e}^{{i\varphi }}})}}^{{ - 2}}}} \right|\rho d\varphi \leqslant \frac{1}{2}(1 + {{\rho }^{{ - 2}}})\rho 2\pi .$

Далее вычислим $min{{\left| {z - x} \right|}^{2}}$ для $z \in {{\Gamma }_{\rho }}$ и $x \in [ - 1,1]$. Обозначим через ${{r}_{1}}$ и ${{r}_{2}}$ большую и меньшую полуоси эллипса ${{\Gamma }_{\rho }}$ соответственно. Тогда точки этого эллипса параметризуются углом $\varphi {\kern 1pt} :\;z = {{r}_{1}}cos\varphi + i{{r}_{2}}sin\varphi $. Преобразуем минимизируемое выражение

(2)

${{\left| {z - x} \right|}^{2}} = {{({{r}_{1}}cos\varphi - x)}^{2}} + {{({{r}_{2}}sin\varphi )}^{2}} = (r_{1}^{2} - r_{2}^{2})co{{s}^{2}}\varphi - 2{{r}_{1}}xcos\varphi + {{x}^{2}} + r_{2}^{2}.$

В силу симметрии достаточно рассмотреть $x \geqslant 0$. При фиксированном $x$ выражение (2) – это квадратный трехчлен относительно $cos\varphi $, причем вершина соответствующей параболы имеет абсциссу ${{r}_{1}}x{\text{/}}(r_{1}^{2} - r_{2}^{2}) = {{r}_{1}}x$. При ${{r}_{1}}x \leqslant 1$ минимум по $\varphi $ достигается при $cos\varphi = {{r}_{1}}x$ и равен $r_{2}^{2}$. При ${{r}_{1}}x > 1$ минимум достигается при $cos\varphi = 1$ и равен ${{({{r}_{1}} - x)}^{2}}$, причем это выражение достигает минимума по $x$ при $x = 1$. Так как ${{r}_{1}} - 1 < {{r}_{2}}$, то и $min\left| {z - x} \right| = {{r}_{1}} - 1 = (\rho + {{\rho }^{{ - 1}}}){\text{/}}2 - 1$.

В итоге имеем

$\left| {f(x) - {{P}_{n}}(x)} \right| \leqslant \frac{{M\rho \pi (1 + {{\rho }^{{ - 2}}})}}{{\pi ({{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}})\left( {\tfrac{1}{2}(\rho + {{\rho }^{{ - 1}}}) - 1} \right)}} = \frac{M}{{{{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}}}}\frac{{\rho + {{\rho }^{{ - 1}}}}}{{\tfrac{1}{2}(\rho + {{\rho }^{{ - 1}}}) - 1}}.$

Теорема 1. Пусть $f{\kern 1pt} :\;[L,R] \to \mathbb{R}$ является следом аналитической в круге с диаметром $[L,R]$ функции $f(z)$, причем $\left| {f(z)} \right| \leqslant M$ для всех $z$ из этого круга.

Тогда для произвольного $\varepsilon > 0$, каждой матрицы развертки ${{A}_{k}} \in {{\mathbb{R}}^{{{{b}^{k}} \times {{b}^{{d - k}}}}}}$ тензора ${{T}_{{b,d,[L,R]}}}(f)$ и любого натурального $\mu \in [1,{{b}^{k}} - 1]$ существует матрица ${{B}_{k}} \in {{\mathbb{R}}^{{{{b}^{k}} \times {{b}^{{d - k}}}}}}$ такая, что

$rank{{B}_{k}} \leqslant 2\mu + s + 1\quad и\quad {{\left\| {{{A}_{k}} - {{B}_{k}}} \right\|}_{\infty }} \leqslant \varepsilon ,$

где $s = \left\lfloor {lo{{g}_{\rho }}(3M{\text{/}}\varepsilon + 1)} \right\rfloor $, $\rho = 2\mu + 1 + 2\sqrt {{{\mu }^{2}} + \mu } $.

Доказательство. Обозначим через $h$ шаг дискретизации: $h = (R - L){{b}^{{ - d}}}$. Строка матрицы ${{A}_{k}}$ с индексом $j$ соответствует отрезку $[L + jh,L + (j + 1)h]$.

Рассмотрим функцию

${{g}_{j}}(y) = f\left( {L + jh + \frac{{1 + y}}{2}h} \right),\quad y \in [ - 1,1],$

а также соответствующую функцию комплексного аргумента ${{g}_{j}}(w)$, $w \in U((\rho + {{\rho }^{{ - 1}}}){\text{/}}2,0)$.

Отображение $w \mapsto \alpha + \beta w$ переводит круг $U((\rho + {{\rho }^{{ - 1}}}){\text{/}}2,0)$ в $U(\beta (\rho + {{\rho }^{{ - 1}}}){\text{/}}2,\alpha )$. В нашем случае $\alpha = L + jh + h{\text{/}}2$, $\beta = h{\text{/}}2$.

Покажем, что при $j = \mu ,\mu + 1, \ldots ,{{b}^{k}} - \mu - 1$ круг $U(\beta (\rho + {{\rho }^{{ - 1}}}){\text{/}}2,\alpha )$ лежит внутри круга с диаметром $[L,R]$, т.е.

$\begin{gathered} L + jh + \frac{h}{2} - \frac{h}{4}(\rho + {{\rho }^{{ - 1}}}) \geqslant L, \\ L + jh + \frac{h}{2} + \frac{h}{4}(\rho + {{\rho }^{{ - 1}}}) \leqslant R. \\ \end{gathered} $

Действительно, для заданного в условии значения $\rho $ верно равенство $\rho + {{\rho }^{{ - 1}}} = 4\mu + 2$, поэтому указанная пара условий переписывается в виде

$\left\{ \begin{gathered} (j - \mu )h \geqslant 0, \hfill \\ L + (j + \mu + 1)h \leqslant R, \hfill \\ \end{gathered} \right.\quad \Leftrightarrow \quad \left\{ \begin{gathered} j \geqslant \mu , \hfill \\ j \leqslant {{b}^{k}} - \mu - 1. \hfill \\ \end{gathered} \right.$

Внутри круга с диаметром $[L,R]$ по условию выполнено неравенство $\left| {f(z)} \right| \leqslant M$, поэтому и $\left| {{{g}_{j}}(w)} \right| \leqslant M$ для $w \in U((\rho + {{\rho }^{{ - 1}}}){\text{/}}2,0)$, а значит, и для $w \in {{\Gamma }_{\rho }}$. Поэтому из леммы 1 следует, что для полинома Лагранжа ${{\hat {P}}_{{s,j}}}(y)$ степени $s$ на чебышёвской сетке для $g(y)$ верно неравенство:

(3)

$\begin{gathered} \left| {{{g}_{j}}(y) - {{{\hat {P}}}_{{s,j}}}(y)} \right| \leqslant \frac{{\rho + {{\rho }^{{ - 1}}}}}{{\tfrac{1}{2}(\rho + {{\rho }^{{ - 1}}}) - 1}}\frac{M}{{{{\rho }^{{s + 1}}} - {{\rho }^{{ - s - 1}}}}} = \frac{{4\mu + 2}}{{2\mu }}\frac{M}{{{{\rho }^{{s + 1}}} - {{\rho }^{{ - s - 1}}}}} \leqslant \\ \leqslant \frac{{3M}}{{{{\rho }^{{s + 1}}} - 1}} \leqslant \frac{{3M}}{{3M{\text{/}}\varepsilon + 1 - 1}} = \varepsilon . \\ \end{gathered} $

Пусть ${{P}_{{s,j}}}(x) = {{\hat {P}}_{{s,j}}}\left( {\tfrac{2}{h}(x - L - jh) - 1} \right)$. Из неравенства (3) получаем, что $\left| {f(x) - {{P}_{{s,j}}}(x)} \right| \leqslant \varepsilon $ на отрезке $[L + jh,L + (j + 1)h]$ для $j = \mu $, $\mu + 1, \ldots ,{{b}^{k}} - \mu - 1$. Поэтому строки $a_{j}^{{\text{T}}}$ с этими индексами приблизим строками:

${\mathbf{P}}_{{s,j}}^{{\text{T}}} = [{{P}_{{s,j}}}(L + h(j + \ell {{b}^{{k - d}}}))]_{{\ell = 0}}^{{{{b}^{{d - k}}} - 1}}.$

Так как степень полиномов ${{P}_{{s,j}}}(x)$ не превосходит $s$, все строки ${\mathbf{P}}_{{s,j}}^{{\text{T}}}$ лежат в линейной оболочке векторов ${{p}_{0}}, \ldots ,{{p}_{s}} \in {{\mathbb{R}}^{{d - k}}}$, ${{p}_{t}}(\ell ) = {{\ell }^{t}}$.

Строки $a_{j}^{{\text{T}}}$ матрицы ${{A}_{k}}$ с индексами $j \in \{ 0, \ldots ,\mu - 1\} \cup \{ {{b}^{k}} - \mu , \ldots ,{{b}^{k}} - 1\} $ “приблизим” ими самими, т.е. матрицу ${{B}_{k}}$ построим в виде

$\mathop {\left[ {a_{0}^{{\text{T}}}, \ldots ,a_{{\mu - 1}}^{{\text{T}}},{\mathbf{P}}_{{s,\mu }}^{{\text{T}}}, \ldots ,{\mathbf{P}}_{{s,{{b}^{k}} - \mu - 1}}^{{\text{T}}},a_{{{{b}^{k}} - \mu }}^{{\text{T}}}, \ldots ,a_{{{{b}^{k}} - 1}}^{{\text{T}}}} \right]}\nolimits^{\text{T}} .$

Очевидно, $rank{{B}_{k}} \leqslant 2\mu + s + 1$ и ${{\left\| {{{A}_{k}} - {{B}_{k}}} \right\|}_{\infty }} \leqslant \varepsilon $.

Следствие 1. В условиях теоремы 1 для любого $\hat {\varepsilon } > 0$ выполнено

${{\mathcal{R}}_{{\hat {\varepsilon }}}}({{T}_{{b,d,[L,R]}}}(f)) \leqslant \hat {s} + 3,\quad {\text{где}}\quad \hat {s} = \left\lfloor {lo{{g}_{\rho }}(3M{{b}^{{d/2}}}\sqrt {d - 1} {\kern 1pt} {{{\hat {\varepsilon }}}^{{ - 1}}} + 1)} \right\rfloor ,\quad \rho = 3 + 2\sqrt 2 .$

Доказательство. Положим в теореме 1 $\mu = 1$ (чтобы удовлетворить условию $\mu \in [1,{{b}^{k}} - 1]$ для всех $k = 1, \ldots ,d - 1$) и

$\varepsilon = \frac{{\hat {\varepsilon }}}{{{{b}^{{d/2}}}\sqrt {d - 1} }}$

и рассмотрим приближения ${{B}_{k}}$ к матрицам развертки ${{A}_{k}}$ со свойствами $rank{{B}_{k}} \leqslant \hat {s} + 3$ и ${{\left\| {{{A}_{k}} - {{B}_{k}}} \right\|}_{\infty }} \leqslant \varepsilon $. Из последнего неравенства следует, что ${{\left\| {{{A}_{k}} - {{B}_{k}}} \right\|}_{F}} \leqslant \varepsilon {{b}^{{d/2}}}$.

Теорема 2.2 из [8] гарантирует существование тензора $\widehat B$ с ТТ-рангами ${{r}_{k}}$, приближающего тензор $A$ в норме Фробениуса с точностью:

$\sqrt {\sum\limits_{k = 1}^{d - 1} \,\varepsilon _{k}^{2}} ,$

где ${{r}_{k}}$ суть ${{\varepsilon }_{k}}$-ранги матриц развертки ${{A}_{k}}$.

Положим ${{\varepsilon }_{k}} = \varepsilon {{b}^{{d/2}}}$, тогда ${{r}_{k}} \leqslant rank{{B}_{k}} \leqslant \hat {s} + 3$ и при этом

${{\left\| {A - \widehat B} \right\|}_{F}} \leqslant \sqrt {d - 1} \varepsilon {{b}^{{d/2}}} = \hat {\varepsilon }.$

Теорема 2. Пусть $\widehat \Gamma $ – образ эллипса ${{\Gamma }_{\rho }}$ под действием линейного отображения

$\xi (w) = \frac{{R + L}}{2} + \frac{{R - L}}{2}w,$

а $f(z)$ – аналитическая внутри $\widehat \Gamma $ функция, для которой $\left| {f(z)} \right| \leqslant M$ для $z \in \widehat \Gamma $ и имеющая вещественнозначный след на $[L,R]$.

Тогда для произвольного $\varepsilon > 0$ и натуральных $b$ и $d$ существует тензор $B$ такой, что

$\mathcal{R}(B) \leqslant \left\lfloor {lo{{g}_{\rho }}(3M{\text{/}}\varepsilon + 1)} \right\rfloor ,\quad {{\left\| {{{T}_{{b,d,[L,R]}}}(f) - B} \right\|}_{\infty }} \leqslant \varepsilon .$

Доказательство. Будем обозначать через $(f \circ \xi )(x)$ композицию функций $f$ и $\xi $, т.е. $(f \circ \xi )(x) = f(\xi (x))$. Заметим, что $(f \circ \xi )(z)$ аналитична в ${{\Gamma }_{\rho }}$ как композиция аналитических функций $f$ и $\xi $. Приблизим $(f \circ \xi )(x)$ полиномом Лагранжа ${{\hat {P}}_{s}}(x)$ степени $s$ на чебышёвской сетке на $[ - 1,1]$, $(f \circ \xi )(x)$ – след аналитической в ${{\Gamma }_{\rho }}$ функции $(f \circ \xi )(z)$. Аналогично доказательству теоремы 1 можно показать, что для параметра $s$ из условия выполнено неравенство:

$\begin{gathered} \left| {(f \circ \xi )(x) - {{{\hat {P}}}_{s}}(x)} \right| \leqslant \varepsilon \;\;\forall x \in [ - 1,1],\;\; \Rightarrow \;\;\left| {(f \circ \xi )({{\xi }^{{ - 1}}}(y)) - {{{\hat {P}}}_{s}}({{\xi }^{{ - 1}}}(y))} \right| \leqslant \varepsilon \;\;\forall y \in [L,R],\;\; \Rightarrow \\ \Rightarrow \;\;\left| {f(y) - ({{{\hat {P}}}_{s}} \circ {{\xi }^{{ - 1}}})(y)} \right| \leqslant \varepsilon \;\;\forall y \in [L,R], \\ \end{gathered} $

где $({{\hat {P}}_{s}} \circ {{\xi }^{{ - 1}}})(y)$ есть полином степени не более $s$, поэтому согласно [3], [2] его тензоризация $B$ допускает ТТ-разложение с ТТ-рангами, не превосходящими $s + 1$.

4. НИЖНИЕ ОЦЕНКИ

Рассмотрим пример функции $f(x)$, являющейся следом аналитической в $\mathbb{C}$ функции. Для приближенных ТТ-рангов тензоризации этой функции будет доказана нижняя оценка (теорема 3).

Зафиксируем натуральные $b \geqslant 2$, $d \geqslant 2$ и $k \geqslant d{\text{/}}3$. Определим $f(z) = sin(2\pi {{b}^{{2k}}}{{z}^{2}})$, $z \in \mathbb{C}$, и обозначим через $f(x)$ ее (вещественнозначный) след на $\mathbb{R}$. Пусть $A = {{T}_{{b,d,[0,1]}}}(f)$.

Введем в рассмотрение функции:

${{f}_{s}}(\xi ) = f\left( {\left( {s + \frac{\xi }{{2\pi }}} \right){{b}^{{ - k}}}} \right),\quad \xi \in [0,2\pi ],\quad s \in \{ 0, \ldots ,{{b}^{k}} - 1\} .$

Строка матрицы развертки ${{A}_{k}}$ с индексом $s$ есть дискретизация функции ${{f}_{s}}(\xi )$ на равномерной сетке на $[0,2\pi ]$.

Для всех $s,t \in \{ 0, \ldots ,{{b}^{k}} - 1\} $ определим интегралы

${{d}_{{s,t}}} = \frac{1}{\pi }\int\limits_0^{2\pi } \,{{f}_{s}}(\xi ){{f}_{t}}(\xi )d\xi .$

Для тех же $s,t$ введем величины (здесь ${{a}_{{s,i}}}$ – элементы матрицы ${{A}_{k}}$):

(4)

${{\hat {d}}_{{s,t}}} = \frac{{2\pi }}{{{{b}^{{d - k}}}}}\frac{1}{\pi }\sum\limits_{i = 0}^{{{b}^{{d - k}}} - 1} \,{{a}_{{s,i}}}{{a}_{{t,i}}}.$

Матрицу из элементов ${{\hat {d}}_{{s,t}}}$ обозначим через $\hat {D}$.

Лемма 2. Для всех $s,t \in \{ 0, \ldots ,{{b}^{k}} - 1\} $ верно неравенство

$\left| {{{d}_{{s,t}}} - {{\delta }_{{s,t}}}} \right| \leqslant \frac{2}{{{{{(s + t)}}^{2}}}},$

где ${{\delta }_{{s,t}}}$ – символ Кронекера.

Доказательство. Преобразуем выражения для ${{f}_{s}}(\xi )$:

${{f}_{s}}(\xi ) = sin\left( {2\pi {{b}^{{2k}}}\left( {{{s}^{2}} + \frac{{s\xi }}{\pi } + \frac{{{{\xi }^{2}}}}{{4{{\pi }^{2}}}}} \right){{b}^{{ - 2k}}}} \right) = sin\left( {2s\xi + \frac{1}{{2\pi }}{{\xi }^{2}}} \right).$

Отсюда получим

(5)

$\begin{gathered} {{d}_{{s,t}}} = \frac{1}{\pi }\int\limits_0^{2\pi } \,{{f}_{s}}(\xi ){{f}_{t}}(\xi )d\xi = \frac{1}{{2\pi }}\int\limits_0^{2\pi } \,cos(2(s - t)\xi ) - cos\left( {2(s + t)\xi + \frac{1}{\pi }{{\xi }^{2}}} \right)d\xi = \\ \, = \frac{1}{{2\pi }}\left\{ \begin{gathered} 2\pi - \int\limits_0^{2\pi } \,cos\left( {4s\xi + \tfrac{1}{\pi }{{\xi }^{2}}} \right)d\xi ,\quad {\text{если}}\;s = t, \hfill \\ - \int\limits_0^{2\pi } \,cos\left( {2(s + t)\xi + \tfrac{1}{\pi }{{\xi }^{2}}} \right)d\xi ,\quad {\text{если}}\;s \ne t. \hfill \\ \end{gathered} \right. \\ \end{gathered} $

Пусть $\beta = 1{\text{/}}\pi $, $p = 2(s + t)$. Исследуем интеграл $\int_0^{2\pi } {{{e}^{{ip\xi + i\beta {{\xi }^{2}}}}}d\xi } $:

$\int\limits_0^{2\pi } \,{{e}^{{ip\xi + i\beta {{\xi }^{2}}}}}d\xi = \int\limits_0^{2\pi } \,\tfrac{1}{{ip}}{{e}^{{i\beta {{\xi }^{2}}}}}d{{e}^{{ip\xi }}} = \tfrac{1}{{ip}}\left( {\left. {{{e}^{{i\beta {{\xi }^{2}}}}}{{e}^{{ip\xi }}}} \right|_{0}^{{2\pi }} - \int\limits_0^{2\pi } \,i\beta 2\xi {{e}^{{ip\xi }}}{{e}^{{i\beta {{\xi }^{2}}}}}d\xi } \right).$

Первый член в скобках равен 0, так как ${{e}^{{i\beta {{{(2\pi )}}^{2}}}}} = {{e}^{{i4\pi }}} = 1 = {{e}^{{ip2\pi }}}$. Повторяя интегрирование по частям, получаем

$\begin{gathered} \int\limits_0^{2\pi } \,{{e}^{{ip\xi + i\beta {{\xi }^{2}}}}}d\xi = \tfrac{{ - 2i\beta }}{{ip}}\int\limits_0^{2\pi } \,\xi {{e}^{{ip\xi }}}{{e}^{{i\beta {{\xi }^{2}}}}}d\xi = \tfrac{{ - 2\beta }}{p}\tfrac{1}{{ip}}\int\limits_0^{2\pi } \,\xi {{e}^{{i\beta {{\xi }^{2}}}}}d{{e}^{{ip\xi }}} = \\ = \tfrac{{ - 2\beta }}{{i{{p}^{2}}}}\left( {\left. {\xi {{e}^{{i\beta {{\xi }^{2}}}}}{{e}^{{ip\xi }}}} \right|_{0}^{{2\pi }} - \int\limits_0^{2\pi } \,{{e}^{{ip\xi }}}{{e}^{{i\beta {{\xi }^{2}}}}}(1 + i\beta 2{{\xi }^{2}})d\xi } \right) = \tfrac{{ - 2\beta }}{{i{{p}^{2}}}}\left( {2\pi - \int\limits_0^{2\pi } \,{{e}^{{ip\xi }}}{{e}^{{i\beta {{\xi }^{2}}}}}(1 + i\beta 2{{\xi }^{2}})d\xi } \right). \\ \end{gathered} $

Взяв вещественную часть от обеих частей полученного равенства, имеем

$\int\limits_0^{2\pi } \,cos(p\xi + \beta {{\xi }^{2}})d\xi = - \tfrac{{2\beta }}{{{{p}^{2}}}}{\text{Im}}\int\limits_0^{2\pi } \,{{e}^{{ip\xi }}}{{e}^{{i\beta {{\xi }^{2}}}}}(1 + i\beta 2{{\xi }^{2}})d\xi .$

Поэтому верно

$\left| {\int\limits_0^{2\pi } \,cos(p\xi + \beta {{\xi }^{2}})d\xi } \right| \leqslant \tfrac{{2\beta }}{{{{p}^{2}}}}\int\limits_0^{2\pi } \,(1 + 2\beta {{\xi }^{2}})d\xi = \tfrac{{4\beta \pi }}{{{{p}^{2}}}} + \tfrac{{4{{\beta }^{2}}}}{{3{{p}^{2}}}}8{{\pi }^{3}} = \tfrac{1}{{{{p}^{2}}}}\left( {4 + \tfrac{{32\pi }}{3}} \right).$

Отсюда и из (5) следует, что

$\left| {{{d}_{{s,t}}} - {{\delta }_{{s,t}}}} \right| \leqslant \frac{1}{{8\pi {{{(s + t)}}^{2}}}}\left( {4 + \frac{{32\pi }}{3}} \right) \leqslant \frac{2}{{{{{(s + t)}}^{2}}}}.$

Лемма 3. Для всех $s,t \in \{ 0, \ldots ,{{b}^{k}} - 1\} $ верно неравенство

$\left| {{{{\hat {d}}}_{{s,t}}} - {{d}_{{s,t}}}} \right| \leqslant 2\pi {{b}^{{k - d}}}(2s + 2t + 4).$

Доказательство. Напомним, что формулой левых прямоугольников для вычисления интеграла $\int_{{{x}_{i}}}^{{{x}_{{i + 1}}}} {\varphi (x)dx} $ называется выражение $({{x}_{{i + 1}}} - {{x}_{i}})\varphi ({{x}_{i}})$, а составной формулой для сетки $\{ {{x}_{0}}, \ldots ,{{x}_{n}}\} $ с шагом $h$ называется сумма $\sum\nolimits_{i = 0}^{n - 1} {\varphi ({{x}_{i}})h} $. Простая формула имеет погрешность:

$\left| {\int\limits_{{{x}_{i}}}^{{{x}_{{i + 1}}}} \,\varphi (x)dx - \int\limits_{{{x}_{i}}}^{{{x}_{{i + 1}}}} \,\varphi ({{x}_{i}})dx} \right| \leqslant \int\limits_{{{x}_{i}}}^{{{x}_{{i + 1}}}} \left| {\varphi {\kern 1pt} '(\xi (x))} \right|(x - {{x}_{i}})dx \leqslant {{\left\| {\varphi {\kern 1pt} '{\kern 1pt} } \right\|}_{{C[{{x}_{i}},{{x}_{{i + 1}}}]}}}\frac{1}{2}{{({{x}_{{i + 1}}} - {{x}_{i}})}^{2}},$

где $\xi (x) \in [{{x}_{i}},{{x}_{{i + 1}}}]$. При применении составной формулы на отрезке $[L,R]$ с шагом $h$ погрешность не превосходит ${{\left\| {\varphi {\kern 1pt} '{\kern 1pt} } \right\|}_{{C[L,R]}}}(R - L)h{\text{/}}2$.

Ясно видно, что выражение (4) для ${{\hat {d}}_{{s,t}}}$ есть в точности составная формула левых прямоугольников для вычисления интеграла ${{d}_{{s,t}}}$ на отрезке $[0,2\pi ]$. Погрешность аппроксимации интеграла оценивается (подразумевается норма ${{\left\| {\, \cdot \,} \right\|}_{{C[0,2\pi ]}}}$) в виде

$\begin{gathered} \left| {{{{\hat {d}}}_{{s,t}}} - {{d}_{{s,t}}}} \right| \leqslant \left\| {\frac{d}{{d\xi }}\left( {\frac{1}{\pi }{{f}_{s}} \cdot {{f}_{t}}} \right)} \right\|2\pi \frac{{2\pi }}{{2{{b}^{{d - k}}}}} = 2\pi {{b}^{{k - d}}}{\kern 1pt} {\text{|}}{\kern 1pt} {\text{|}}{\kern 1pt} f_{s}^{'}{{f}_{t}} + {{f}_{s}}f_{t}^{'}{\kern 1pt} {\text{|}}{\kern 1pt} {\text{|}} \leqslant \\ \leqslant 2\pi {{b}^{{k - d}}}({\kern 1pt} {\text{|}}{\kern 1pt} {\text{|}}{\kern 1pt} f_{s}^{'}{\kern 1pt} {\text{|}}{\kern 1pt} {\text{|}}\; + \;{\text{|}}{\kern 1pt} {\text{|}}{\kern 1pt} f_{t}^{'}{\kern 1pt} {\text{|}}{\kern 1pt} {\text{|}}{\kern 1pt} ) \leqslant 2\pi {{b}^{{k - d}}}\left( {2s + \frac{{2\pi }}{\pi } + 2t + \frac{{2\pi }}{\pi }} \right) = 2\pi {{b}^{{k - d}}}(2s + 2t + 4). \\ \end{gathered} $

Лемма 4. Пусть $F$ – главная подматрица матрицы $\hat {D}$, находящаяся на пересечении строк и столбцов с индексами $s,t \in [\ell ,u)$, где

$u = \left\lfloor {{{b}^{{\tfrac{{d - k}}{2}}}}{\text{/}}8} \right\rfloor ,\quad \ell = \left\lceil {{{b}^{{\tfrac{{d - k}}{2}}}}{\text{/}}16} \right\rceil ,$

причем ${{b}^{{d - k}}} \geqslant {{2}^{{10}}}$. Тогда младшее сингулярное число ${{\sigma }_{{min}}}(F) > 1{\text{/}}2$.

Доказательство. Обратим внимание, что заявленное в началe раздела условие $k \geqslant d{\text{/}}3$ гарантирует, что $\ell ,u < {{b}^{k}}$, поэтому выбирать подматрицу с указанными индексами в матрице $\hat {D} \in {{\mathbb{R}}^{{{{b}^{k}} \times {{b}^{k}}}}}$ корректно.

Пусть $G = F - I$. Заметим, что

(6)

$\begin{gathered} {{\sigma }_{{min}}}(F) = {{\sigma }_{{min}}}(I + G) = \left\| {{{{(I + G)}}^{{ - 1}}}} \right\|_{2}^{{ - 1}} = \left\| {I - G + {{G}^{2}} - {{G}^{3}} + \ldots } \right\|_{2}^{{ - 1}} \geqslant \\ \, \geqslant {{({{\left\| I \right\|}_{2}} + {{\left\| G \right\|}_{2}} + \left\| G \right\|_{2}^{2} + \ldots )}^{{ - 1}}} = \mathop {\left( {\frac{1}{{1 - \left\| G \right\|}}} \right)}\nolimits^{ - 1} = 1 - {{\left\| G \right\|}_{2}}. \\ \end{gathered} $

Из лемм 2 и 3 следует, что все элементы матрицы $\hat {D} - I$, а значит, и $F - I$, по модулю не превосходят

$\frac{2}{{{{{(s + t)}}^{2}}}} + 2\pi {{b}^{{k - d}}}(2s + 2t + 4).$

Поэтому имеем

$\begin{gathered} {{\left\| G \right\|}_{2}} = {{\left\| {F - I} \right\|}_{2}} \leqslant {{\left\| {F - I} \right\|}_{F}} \leqslant (u - \ell ){{\left\| {F - I} \right\|}_{\infty }} \leqslant \\ \, \leqslant (u - \ell )\left( {\frac{2}{{{{{(s + t)}}^{2}}}} + 2\pi {{b}^{{k - d}}}(2s + 2t + 4)} \right) \leqslant \frac{{{{b}^{{\tfrac{{d - k}}{2}}}}}}{{16}}\left( {\frac{2}{{4{{\ell }^{2}}}} + \frac{{2\pi \cdot 4u}}{{{{b}^{{d - k}}}}}} \right) \leqslant \frac{{256}}{{32{{b}^{{\tfrac{{d - k}}{2}}}}}} + \frac{{8\pi }}{{128}}. \\ \end{gathered} $

По условию ${{b}^{{d - k}}} \geqslant {{2}^{{10}}}$, тогда получаем

${{\left\| G \right\|}_{2}} \leqslant \frac{1}{4} + \frac{\pi }{{16}} < \frac{1}{2}.$

Отсюда и из неравенства (6) следует утверждение леммы.

Теорема 3. Пусть $b \geqslant 2$, $d \geqslant 2$ и $k \geqslant d{\text{/}}3$ – натуральные числа, удовлетворяющие условию ${{b}^{{d - k}}} \geqslant {{2}^{{10}}}$, а $f(x) = sin(2\pi {{b}^{{2k}}}{{x}^{2}})$, $x \in [0,1]$. Тогда верно неравенство

${{\mathcal{R}}_{\varepsilon }}\left( {{{T}_{{b,d,[0,1]}}}(f)} \right) \geqslant \frac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2,\quad где\quad \varepsilon = \frac{1}{2}{{b}^{{\tfrac{{d - k}}{2}}}}.$

Доказательство. Исследуем сингулярные числа ${{\sigma }_{s}}({{A}_{k}})$ матрицы ${{A}_{k}}$. Для этого воспользуемся известным фактом, что

(7)

${{\sigma }_{s}}({{A}_{k}}) = \sqrt {{{\lambda }_{s}}(A_{k}^{{\text{T}}}{{A}_{k}})} = \sqrt {{{\sigma }_{s}}(A_{k}^{{\text{T}}}{{A}_{k}})} .$

Из определения (4) матрицы $\hat {D}$ следует, что $A_{k}^{{\text{T}}}{{A}_{k}} = {{b}^{{d - k}}}\hat {D}{\text{/}}2.$ Далее, для главной подматрицы $F$ матрицы $\hat {D}$ из леммы можно применить теорему о чередовании сингулярных чисел симметричной матрицы [9] и получить, что ${{\sigma }_{{u - \ell }}}(\hat {D}) \geqslant 1{\text{/}}2$. Отсюда и из равенства (7) вытекает

${{\sigma }_{{u - \ell }}}({{A}_{k}}) \geqslant \frac{1}{{\sqrt 2 }}{{b}^{{\tfrac{{d - k}}{2}}}}\sqrt {{{\sigma }_{{u - \ell }}}(\hat {D})} > \frac{1}{2}{{b}^{{\tfrac{{d - k}}{2}}}}.$

Рассмотрим теперь произвольный тензор $B$ со свойством ${{\left\| {A - B} \right\|}_{F}} \leqslant \tfrac{1}{2}{{b}^{{(d - k)/2}}}$. Аналогичное неравенство верно и для матриц развертки ${{A}_{k}}$ и ${{B}_{k}}$. По теореме Эккарта–Юнга [10] наилучшее приближение в норме Фробениуса ранга $u - \ell - 1$ имеет погрешность как минимум

$\sqrt {\sigma _{{u - \ell }}^{2}({{A}_{k}}) + \ldots + \sigma _{N}^{2}({{A}_{k}})} \geqslant {{\sigma }_{{u - \ell }}}({{A}_{k}}) > \frac{1}{2}{{b}^{{\tfrac{{d - k}}{2}}}},$

где $N = \min \{ {{b}^{k}},{{b}^{{d - k}}}\} $ – меньший из размеров матрицы ${{A}_{k}}$. Поэтому верно

$rank{{B}_{k}} \geqslant u - \ell \geqslant \left( {\frac{1}{8}{{b}^{{\tfrac{{d - k}}{2}}}} - 1} \right) - \left( {\frac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 1} \right) = \frac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2.$

Рассмотрим произвольное ТТ-разложение тензора $B$ вида (1). Для $k$-й матрицы развертки можно написать

${{B}_{k}}({{i}_{1}}, \ldots ,{{i}_{k}};{{i}_{{k + 1}}}, \ldots ,{{i}_{d}}) = \sum\limits_{{{\alpha }_{k}} = 1}^{{{r}_{k}}} \,H{\kern 1pt} '({{i}_{1}}, \ldots ,{{i}_{k}},{{\alpha }_{k}})H{\kern 1pt} '{\kern 1pt} '({{\alpha }_{k}},{{i}_{{k + 1}}}, \ldots ,{{i}_{d}}),$

откуда следует, что ${{r}_{k}} \geqslant rank{{B}_{k}} \geqslant \tfrac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2$, а в силу произвольности $B$ и

${{\mathcal{R}}_{\varepsilon }}(A) \geqslant \frac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2.$

Чтобы наглядно связать верхнюю оценку из данного раздела и нижние оценки из предыдущего, имеет смысл зафиксировать некоторые величины и перейти к асимптотической нотации. Именно, зафиксируем натуральное $b \geqslant 2$, произвольно малое $\varepsilon > 0$ и отрезок $[L,R]$ на вещественной прямой. Определим функцию

${{\mathcal{R}}_{{b,\varepsilon ,[L,R]}}}(M,d) = \mathop {max}\limits_{|f(z)| \leqslant M\;{\text{на}}\;U} {{\mathcal{R}}_{\varepsilon }}({{T}_{{b,d,[L,R]}}}(f)).$

Здесь максимум берется по всем аналитическим в круге $U$ с диаметром $[L,R]$ функциям $f(z)$, имеющим вещественный след на $[L,R]$.

Следствие 1 гарантирует оценку ${{\mathcal{R}}_{{b,\varepsilon ,[L,R]}}}(M,d) = O(lnM + d)$ при $M,d \to \infty $. С другой стороны, для функции $f(z)$ из данного раздела несложно оценить максимум модуля на единичном круге:

(8)

$\left| {f(z)} \right| = \left| {sin(2\pi {{b}^{{2k}}}{{z}^{2}})} \right| = \left| {\frac{1}{{2i}}\left( {{{e}^{{2\pi i{{b}^{{2k}}}{{z}^{2}}}}} - {{e}^{{ - 2\pi i{{b}^{{2k}}}{{z}^{2}}}}}} \right)} \right| \leqslant {{e}^{{2\pi {{b}^{{2k}}}\left| {{{z}^{2}}} \right|}}} \leqslant {{e}^{{2\pi {{b}^{{2k}}}}}}.$

Пусть $k = \left\lceil {d{\text{/}}3} \right\rceil $, тогда по теореме 3 максимальный ТТ-ранг есть как минимум:

$\frac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2 = \Omega ({{b}^{k}}) = \Omega \left( {\sqrt {lnM(d)} } \right)\quad {\text{при}}\quad d \to \infty .$

В последнем равенстве через $M(d)$ обозначено число ${{e}^{{2\pi {{b}^{{2d/3}}}}}}$. Получается, что

${{\mathcal{R}}_{{b,\varepsilon ,[L,R]}}}(M(d),d) = \Omega \left( {\sqrt {lnM(d)} } \right)\quad {\text{при}}\quad d \to \infty .$

5. ПРИМЕНЕНИЕ К ПОЛИНОМАМ

В работе [5] рассматривались ТТ-ранги приближений к тензоризациям полиномов. В данном разделе мы применим результаты предыдущих разделов к полиномам, существенно улучшив верхние оценки из указанной работы. Также мы получим нижние оценки ТТ-рангов $\varepsilon $-приближений для этого класса функций.

Утверждение 1. Пусть $p(x) = {{p}_{0}} + {{p}_{1}}x + \ldots + {{p}_{n}}{{x}^{n}}$ – полином с вещественными коэффициентами. Пусть $A = {{T}_{{b,d,[0,1]}}}(f)$ и $M = \sum\nolimits_{i = 0}^n {\left| {{{p}_{i}}} \right|} $. Зафиксируем произвольное $\varepsilon > 0$.

Тогда для каждой матрицы развертки ${{A}_{k}}$ тензора $A$, $k = 1, \ldots ,d - 1$, и натурального $\mu \in [1,{{b}^{k}} - 1]$ существует матрица ${{B}_{k}}$ такая, что

$rank{{B}_{k}} \leqslant 2\mu + s + 1\quad и\quad {{\left\| {{{A}_{k}} - {{B}_{k}}} \right\|}_{\infty }} \leqslant \varepsilon ,$

где

$s = \left\lfloor {lo{{g}_{\rho }}(3M{\text{/}}\varepsilon + 1)} \right\rfloor ,\quad \rho = 2\mu + 1 + 2\sqrt {{{\mu }^{2}} + \mu } .$

Доказательство. Достаточно заметить, что на единичном круге на комплексной плоскости (а тем более, в круге с диаметром $[0,1]$) аналитическое продолжение $p(z)$ полинома $p(x)$ ограничено по модулю суммой $\sum\nolimits_i {\left| {{{p}_{i}}} \right|} $, и применить теорему 1.

Замечание. Если в духе работы [5] ограничить коэффициенты ${{p}_{i}}$ по модулю фиксированной константой и поинтересоваться асимптотическим поведением $\varepsilon $-рангов матриц развертки при стремлении $n$ к бесконечности, то доказанное утверждение даст оценку вида $O(lnn)$ в отличиe от оценки $O(\sqrt[3]{n})$, полученной в [5].

Утверждение 2. Пусть $b \geqslant 2$, $d \geqslant 2$ и $k \geqslant d{\text{/}}3$ – натуральные числа, удовлетворяющие условию ${{b}^{{d - k}}} \geqslant {{2}^{{10}}}$.

Тогда для любого $n \geqslant \left\lfloor {lo{{g}_{2}}(1 + 14{{b}^{{k/2}}}{{e}^{{10{{b}^{{2k}}}}}})} \right\rfloor $ существует полином ${{P}_{n}}(x) = {{p}_{0}} + \ldots + {{p}_{n}}{{x}^{n}}$ такой, что верно следующее:

1. $\sum\limits_{i = 0}^n \,{\text{|}}{{p}_{i}}{\kern 1pt} {\text{|}} \leqslant {{2}^{{2n}}}{{(n + 1)}^{2}}$;

2. ${{\mathcal{R}}_{\varepsilon }}({{T}_{{b,d,[0,1]}}}({{P}_{n}})) \geqslant \tfrac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2$, где $\varepsilon = \tfrac{1}{4}{{b}^{{\tfrac{{d - k}}{2}}}}$.

Доказательство. Возьмем функцию $f(x)$ из теоремы 3. Обозначим через ${{P}_{n}}(x)$ полином Лагранжа степени $n$, интерполирующий $f(x)$ на чебышёвской сетке с $n + 1$ узлом на $[ - 1,1]$.

Сначала оценим коэффициенты $p(x)$. Полином Лагранжа можно записать в следующем виде [9]:

${{P}_{n}}(x) = \sum\limits_{j = 0}^n \,\frac{{f({{x}_{j}})\omega (x)}}{{(x - {{x}_{j}})\omega {\kern 1pt} '({{x}_{j}})}},\quad \omega (x) = (x - {{x}_{0}}) \cdots (x - {{x}_{n}}),$

где ${{x}_{j}}$ суть корни полинома Чебышёва степени $n + 1$, т.е.

${{x}_{j}} = cos\left( {\frac{\pi }{{2(n + 1)}} + \frac{\pi }{{n + 1}}j} \right),\quad \omega (x) = {{2}^{{ - n}}}cos((n + 1)arccosx).$

Оценим снизу модуль $\omega {\kern 1pt} '({{x}_{j}})$:

$\omega {\kern 1pt} '({{x}_{j}}) = {{2}^{{ - n}}}(n + 1)\frac{1}{{\sqrt {1 - x_{j}^{2}} }}sin((n + 1)arccos{{x}_{j}}) = \frac{{{{2}^{{ - n}}}(n + 1)}}{{sin\left( {\tfrac{\pi }{{2(n + 1)}} + \tfrac{\pi }{{n + 1}}j} \right)}}sin\left( {\frac{\pi }{2} + \pi j} \right).$

Поэтому ${\text{|}}\omega {\kern 1pt} '({{x}_{j}}){\kern 1pt} {\text{|}} \geqslant {{2}^{{ - n}}}(n + 1)$. Коэффициент при ${{x}^{m}}$ многочлена $\omega (x){\text{/}}(x - {{x}_{j}})$ есть, очевидно,

т.е. по модулю не превосходит $C_{n}^{{n - m}}$. Итого получаем

$\sum\limits_{m = 0}^n \,{\text{|}}{{p}_{m}}{\text{|}} \leqslant \sum\limits_{j = 0}^n \,\left| {\frac{{f({{x}_{j}})}}{{\omega {\kern 1pt} '({{x}_{j}})}}} \right|\sum\limits_{m = 0}^n \,C_{n}^{{n - m}} \leqslant (n + 1){{2}^{n}}(n + 1){{2}^{n}} = {{2}^{{2n}}}{{(n + 1)}^{2}}.$

Применим лемму 1 для оценки отклонения $f(x)$ от ${{P}_{n}}(x)$ на $[ - 1,1]$:

${\text{|}}{\kern 1pt} f(x) - {{P}_{n}}(x){\kern 1pt} {\text{|}} \leqslant \frac{M}{{{{\rho }^{{n + 1}}} - {{\rho }^{{ - n - 1}}}}}\frac{{\rho + {{\rho }^{{ - 1}}}}}{{\tfrac{1}{2}(\rho + {{\rho }^{{ - 1}}} - 1)}},\quad M = \mathop {max}\limits_{z \in {{\Gamma }_{\rho }}} {\text{|}}{\kern 1pt} f(z){\kern 1pt} {\text{|}}.$

Положим $\rho = 2$ и оценим величину $M$, исходя из рассуждения, аналогичного (8):

$M \leqslant {{e}^{{2\pi {{{\left( {\tfrac{{\rho + {{\rho }^{{ - 1}}}}}{2}} \right)}}^{2}}{{b}^{{2k}}}}}} \leqslant {{e}^{{10{{b}^{{2k}}}}}}.$

Таким образом, с учетом неравенства для $n$ (из условия утверждения) имеем для всех $x \in [ - 1,1]$:

${\text{|}}{\kern 1pt} f(x) - {{P}_{n}}(x){\kern 1pt} {\text{|}} \leqslant \frac{{{{e}^{{10{{b}^{{2k}}}}}}}}{{14{{b}^{{k/2}}}{{e}^{{10{{b}^{{2k}}}}}}}}\frac{{2.5}}{{0.75}} \leqslant \frac{1}{4}{{b}^{{ - k/2}}}.$

Это означает, что

${{\left\| {{{T}_{{b,d,[0,1]}}}(f) - {{T}_{{b,d,[0,1]}}}({{P}_{n}})} \right\|}_{F}} \leqslant \frac{1}{4}{{b}^{{\tfrac{{d - k}}{2}}}} = \varepsilon .$

Теперь возьмем произвольный тензор $B$, приближающий ${{T}_{{b,d,[0,1]}}}({{P}_{n}})$ с ошибкой не более $\varepsilon $. Заметим, что по неравенству треугольника для нормы он дает приближение ${{T}_{{b,d,[0,1]}}}(f)$ с ошибкой не более $2\varepsilon $. Из теоремы 3 сразу получаем неравенство

$\mathcal{R}(B) \geqslant \frac{1}{{16}}{{b}^{{\tfrac{{d - k}}{2}}}} - 2,$

а в силу произвольности $B$ и свойство из условия.

Автор выражает благодарность Виктории Владимировне Высоцкой за помощь в оформлении статьи.

Список литературы

Oseledets I. Constructive representation of functions in low-rank tensor formats // Constructive Approximat. 2013. V. 37. № 1. P. 1–18.
Grasedyck L. Polynomial approximation in hierarchical Tucker format by vector–tensorization. Marburg: Philipps-Universität, 2010.
Khoromskij B. $O(dlogN)$-Quantics approximation of $N$-d tensors in high-dimensional numerical modeling // Constructive Approximat. 2011. V. 34. № 2. P. 257–280.
Tyrtyshnikov E.E. Tensor approximations of matrices generated by asymptotically smooth functions // Mat. Sb. 2003. V. 194. I. 6. P. 941–954.
Vysotsky L. On tensor-train ranks of tensorized polynomials // Large-Scale Scientific Computing. LSSC 2019. Lect. Notes in Comp. Sc. 2020. V. 11958. P. 189–196.
Oseledets I. Approximation of ${{2}^{d}} \times {{2}^{d}}$ matrices using tensor decomposition // SIAM Journal on Matrix Anal. and Appl. 2009. V. 31. № 4. P. 2130–2145.
Oseledets I. Tensor-train decomposition // SIAM Journal on Scientific Comp. 2011. V. 33. № 5. P. 2295–2317.
Oseledets I., Tyrtyshnikov E. TT-cross approximation for multidimensional arrays // Linear Algebra and Its Appl. 2010. V. 432. № 1. P. 70–88.
Тыртышников Е.Е. Методы численного анализа. М.: Академия, 2007.
Eckart C., Young G. The approximation of one matrix by another of lower rank // Psychometrika. 1936. V. 1. № 3. P. 211–218.

Дополнительные материалы отсутствуют.

Инструменты

следующая статья выпуска предыдущая статья выпуска содержание выпуска

Журнал вычислительной математики и математической физики

Архивы выпусков Информация о журнале Отправить рукопись в журнал