Письма в ЖЭТФ, том 114, вып. 6, с. 360 - 364
© 2021 г. 25 сентября
Оптимизация многослойных фотонных структур с помощью
искусственных нейронных сетей для получения заданного
оптического отклика
К.Р.Сафронов1), В.О.Бессонов, А.А.Федянин
Физический факультет, МГУ им. М. В. Ломоносова, 119991 Москва, Россия
Поступила в редакцию 11 августа 2021 г.
После переработки 12 августа 2021 г.
Принята к публикации 12 августа 2021 г.
Предложен новый метод глубокого машинного обучения для задачи подбора параметров многослой-
ной фотонной структуры по заданному оптическому спектру коэффициента отражения. Предложенный
метод обучения основан на соединении искусственной нейронной сети для решения обратной задачи
и аналитического метода матриц распространения. Такой подход позволяет добиться высокой точно-
сти работы сети. Показана возможность применения разработанного метода для дизайна структуры,
выполняющей взятия производной по координате для падающего оптического сигнала.
DOI: 10.31857/S123456782118004X
Устройства нанофотоники обеспечивают слож-
тано множество оптимизационных методов [14-17].
ные функциональные возможности за счет структу-
Однако они являются итеративными и, следователь-
рирования материалов на микро- и наноуровне [1-3].
но, дорогостоящими с точки зрения вычислений, что
Одной из наиболее простых, но при этом универсаль-
делает их неподходящими для крупномасштабных и
ных нанофотонных структур является массив чере-
сложных структур. Кроме того, даже незначитель-
дующихся слоев с различной толщиной и показате-
ная модификация целевого оптического отклика за-
лем преломления. Оптический отклик такой много-
ставляет начинать оптимизацию заново.
слойной структуры (МС) регулируется параметра-
Чтобы преодолеть это препятствие, недавно бы-
ми слоев и может подстраиваться под требования
ло предложено использовать подход, основанный на
конкретной задачи. Благодаря такой гибкости, МС
искусственных нейронных сетях (ИНС) [18, 19]. ИНС
успешно применяются в таких областях, как топо-
можно использовать одним из двух способов. Первый
логическая фотоника [4], нелинейная оптика [5, 6],
вариант - предсказание оптического отклика струк-
магнитооптика [7], оптические вычисления [8], поля-
туры по геометрическим параметрам [19-21]. В этом
ритоника [9] и др. [10-12]. Однако для реализации
случае ИНС заменяет дорогостоящее вычислитель-
всех этих возможностей необходима разработка ме-
ное моделирование и повышает скорость стандарт-
тодов подбора параметров (дизайна) МС, обладаю-
ных методов оптимизации. Второй вариант - обу-
щей заданным оптическим откликом.
чение ИНС для предсказания структуры с требуе-
Дизайн МС может быть осуществлен перебором
мым откликом [22, 23], т. е. для решения обратной
всевозможных конфигураций и расчетом оптическо-
задачи. Это позволяет подбирать структуры с за-
го отклика для каждого набора параметров. Такой
данным оптическим откликом за доли секунды. Ос-
расчет может быть проведен одним из многих хоро-
новной проблемой второго варианта использования
шо разработанных методов, включая метод конеч-
ИНС является неединственность решения обратной
ных элементов, метод конечных разностей во времен-
задачи, что приводит к несогласованности данных
ной области, метод матриц распространения (ММР)
и плохой сходимости ИНС [18]. Для решения этой
и др. Недостатком такого подхода являются его боль-
проблемы было предложено несколько подходов. Од-
шие временные и вычислительные затраты. Другой
ним из наиболее распространенных из них является
подход основан на решении обратной задачи, т. е.
двухэтапное обучение ИНС: сначала обучается од-
определении параметров МС напрямую из заданного
на сеть для предсказания оптического отклика по
отклика [13]. Для решения обратной задачи разрабо-
заданным параметрам, а затем эта предварительно
обученная ИНС соединяется с другой сетью для ре-
1)e-mail: safronov@nanolab.phys.msu.ru
шения обратной задачи, чтобы сформировать тандем
360
Письма в ЖЭТФ том 114 вып. 5 - 6
2021
Оптимизация многослойных фотонных структур с помощью искусственных нейронных сетей. . .
361
Рис. 1. (Цветной онлайн) (a) - Зависимость десятичного логарифма СКО (MSE) для тренировочного (оранжевая кри-
вая) и тестового (синяя кривая) наборов данных от номера эпохи. (b) - Гистограмма распределения СКО по тестовому
набору данных. (c)-(f) - Зависимости действительной части Re(R), мнимой части Im(R), модуля |R| и фазы arg(R),
нормированной на π, коэффициента отражения от угла падения. Целевой коэффициент отражения показан синей
кривой, коэффициент отражения МС, предсказанной ИНС, показан оранжевой кривой
сетей [18, 23]. В этом случае от ИНС не требуется
на стеклянную подложку (n = 1.52). Цель состоит в
какого-то конкретного решения обратной задачи и
определении толщин слоев di (i = 1...10) МС с задан-
сеть выбирает какое-то одно из множества решений,
ным оптическим откликом. Входными данными для
которое приводит к лучшей сходимости. Другой при-
ИНС является угловой спектр амплитудного коэф-
мечательный подход основан на генеративных состя-
фициента отражения для TE-поляризованного излу-
зательных сетях. В этом случае две ИНС (генера-
чения при λ = 800 нм в диапазоне углов падения θ
тор и дискриминатор) обучаются одновременно [24].
от 0до 40. Спектр дискретизован на 100 точек. На
Третий подход использует уменьшение размерности
вход ИНС поступает массив, состоящий из действи-
пространства параметров с помощью автоэнкодера
тельной r′i и мнимой r′′i части коэффициента отра-
[25]. При этом предполагается, что обратная задача
жения для каждого угла падения, т.е. массив имеет
имеет единственное решение в пространстве меньшей
длину 200. Действительная и мнимая части спектра
размерности. Одной общей проблемой во всех пред-
отражения были выбраны вместо фазы и амплиту-
лагаемых методах является необходимость обучения
ды, поскольку в фазе могут наблюдаться разрывы,
нескольких ИНС, что неизбежно приводит к допол-
ограничивающие точность ИНС [26]. Выходные дан-
нительным ошибкам.
ные ИНС представляют собой массив D из 10 нор-
В данной работе предложен альтернативный под-
мированных толщин di/dmax МС. Материал каждого
ход, использующий только одну ИНС для решения
слоя считается известным и фиксированным. Слой
обратной задачи дизайна МС, что позволяет зна-
на границе с воздухом выполнен из SiO2.
чительно повысить качество работы сети. Показа-
ММР был использован для создания набора дан-
но, что обученная ИНС успешно обходит проблему
ных, содержащих спектры коэффициента отраже-
неединственности решения обратной задачи. Данный
ния случайно сгенерированных 10-слойных струк-
подход может использоваться для определения пара-
тур. Это гарантирует, что целевые спектры могут
метров различных нанофотонных устройств.
быть реализованы с помощью рассматриваемой в ра-
В работе рассматривается МС, состоящая из 10
боте одномерной МС. Затем набор данных делится
чередующихся слоев SiO2 (n = 1.45)/Ta2O5 (n =
на тренировочную часть (используется для обуче-
= 2.08) толщиной от 0 до dmax = 350 нм, нанесенных
ния ИНС) и тестовую (для проверки качества ра-
Письма в ЖЭТФ том 114 вып. 5 - 6
2021
362
К.Р.Сафронов, В.О.Бессонов, А.А.Федянин
боты ИНС). Наш метод обучения ИНС основан на
соединении сети с ММР [27]. В процессе обучения
целевой угловой спектр Rtarget(θ) используется в ка-
честве входа ИНС, а массив D нормированных тол-
щин является выходом ИНС. Затем D используется в
ММР для вычисления углового спектра Rpredicted(θ)
МС, сгенерированной ИНС. Затем вычисляется сред-
неквадратичная ошибка (СКО) между спектрами
Rpredicted и Rtarget. После этого веса и смещения слоев
ИНС обновляются с помощью обратного распростра-
нения ошибки, чтобы минимизировать СКО. Для то-
го, чтобы ММР не становился узким местом в обуче-
нии ИНС, был разработан оптимизированный код, в
котором ММР реализован путем перемножения мно-
гомерных матриц (тензоров). ММР естественным об-
разом вписывается в процесс обучения ИНС, по-
скольку он основан на умножении матриц - основ-
ной операции глубокого обучения. Кроме того, ММР
определяет аналитическую зависимость между тол-
Рис. 2. (Цветной онлайн) (a), (b) - Зависимости моду-
щиной слоя и спектром отражения и может быть
ля |R| и фазы arg(R), нормированной на π, коэффи-
использован для обратного распространения ошиб-
циента отражения от угла падения для двух близких
ки, т.е. расчета градиента СКО относительно весов и
по спектру примеров из тестового набора данных (си-
смещений ИНС. В описанном процессе обучения па-
няя и оранжевая кривые) и спектры МС, предсказан-
раметры МС из тренировочного набора данных ни-
ных ИНС (зеленая и красная кривые). (c), (d) - МС
с близкими спектрами из тестового набора данных и
как не используются. В этом случае ИНС выучивает
МС, предсказанные ИНС
закономерности, заложенные в ММР, а не просто ин-
терполирует данные из тренировочного набора.
Метод обучения ИНС был протестирован на при-
демонстрируются два похожих спектра от совершен-
мере сети, содержащей 4 скрытых слоя по 500 нейро-
но разных МС из тестового набора данных (рис. 2c).
нов. ИНС обучалась на 100 000 образцов из трениро-
Среднее отклонение толщин слоев, определяемое
вочного набора данных в течение 700 эпох. СКО рез-
формулой:
ко падает через 10 эпох, а затем постепенно умень-
шается до 10-4 (рис.1a). Распределение СКО в те-
dtarget1i - diarget2
Δd =
,
стовом наборе данных локализовано около нуля, что
N
i=1
доказывает хорошее качество обучения (рис. 1b). Ри-
сунки 1c,d демонстрируют работу нашей сети на слу-
где N = 10, было использовано как мера сходства
чайном примере из тестового набора данных. Наша
МС. Для выбранных образцов Δd = 96 нм. Как вид-
сеть успешно справляется с обратной задачей. Рисун-
но из рис. 2a, b, ИНС успешно справляется с дизай-
ки 1e, f демонстрируют амплитуду |R| и фазу arg(R)
ном МС с выбранными спектрами. Однако средняя
коэффициента отражения, которые вычисляются из
разница в толщине слоев Δd для сгенерированных
действительной r′i и мнимой r′′i части коэффициента
МС составляет всего 3 нм (рис. 2d). Далее была оце-
отражения по формулам:
нена корреляция между разницей спектров ΔR и
разницей толщин слоев Δd для образцов из тестово-
|Ri| =
(r′i)2 + (r′′i)2,
(1)
го набора данных и для МС, сгенерированных ИНС.
arg(Ri) = arctan(r′′i/r′i),
(2)
В качестве меры корреляции был использован ко-
эффициент Пирсона ρ(ΔR,Δd). Для тестового набора
где i = 1...100. Так как arg(R) лежит в пределах от
данных ρtest(ΔR,Δd) = -0.05, а для МС, подобранных
-π до π, то в спектре коэффициента отражения мо-
ИНС, ρNN(ΔR,Δd) = 0.48. Видно, что в тестовом наборе
жет наблюдаться скачок на 2π (рис. 1f).
данных нет корреляции между разницей спектров и
Важный вопрос заключается в том, как разрабо-
разницей толщин, т. е. похожий оптический отклик
танная ИНС справляется с проблемой неединствен-
могут демонстрировать МС с абсолютно разными па-
ности решения обратной задачи. На рисунках 2a, b
раметрами. Однако существует довольно сильная по-
Письма в ЖЭТФ том 114 вып. 5 - 6
2021
Оптимизация многослойных фотонных структур с помощью искусственных нейронных сетей. . .
363
Рис. 3. (Цветной онлайн) (a) - Зависимости модуля |R| (левая ось ординат) и фазы arg(R) (правая ось ординат), нор-
мированной на π, коэффициента отражения от угла падения для идеального дифференциатора (красные кривые) и
МС, предсказанной ИНС (оранжевые кривые). (b), (c) - Зависимость интенсивности падающего и отраженного от МС
пучков от координаты. (d) - Сечение интенсивности падающего пучка (синяя кривая), отраженного (оранжевая) и
аналитически вычисленная производная интенсивности падающего пучка (красная)
ложительная корреляция между разницей спектров
бранная ИНС, обладает спектром, похожим на от-
и разницей толщин для образцов, подобранных се-
клик идеального дифференциатора (рис. 3a). Рабо-
тью. Это означает, что для этих МС близкие спектры
та разработанного устройства была исследована с
создаются похожими структурами. Таким образом,
помощью собственного метода матриц распростра-
при обучении ИНС сглаживает пространство пара-
нения, который позволяет вычислять отражение не
метров и из множества возможных решений обрат-
только для плоских волн, но и для сфокусирован-
ной задачи сходится к какому-то одному.
ных гауссовых пучков. Это достигается путем раз-
В качестве примера применения нашей сети были
ложения гауссова пучка на набор плоских волн [29].
подобраны параметры МС, являющейся оптическим
Качество дифференцирования было исследовано для
пространственным дифференциатором. Как извест-
сфокусированного на поверхность МС 3-мкм гауссо-
но, для реализации пространственной производной
ва пучка. Поскольку отражение в районе 20 близ-
первого порядка такое устройство должно иметь пе-
ко к 0, то падающий (рис. 3b) и отраженный лу-
редаточную функцию (в нашем случае коэффици-
чи (рис. 3c) визуализированы отдельно для нагляд-
ент отражения) R ≈ ikx [28], где kx = k0 sinθ -
ности. Рисунок 3d показывает поперечное сечение
тангенциальная компонента волнового вектора, θ -
падающего и отраженного лучей, а также анали-
угол падения. Таким образом, амплитуда коэффи-
тически рассчитанную производную первого поряд-
циента отражения дифференциатора должна иметь
ка. Действительно, наша ИНС подобрала МС с от-
форму, аналогичную модулю x, а фаза должна ис-
кликом, похожим на идеальный дифференциатор,
пытывать скачок на π. Для демонстрации работы
но не идентичную ему. Увеличение количества сло-
сети была спроектирована МС, выполняющая диф-
ев может обеспечить лучшее качество взятия произ-
ференцирование при угле падения 20. МС, подо-
водной.
Письма в ЖЭТФ том 114 вып. 5 - 6
2021
364
К.Р.Сафронов, В.О.Бессонов, А.А.Федянин
Таким образом, в данной работе продемонстриро-
9.
F. Barachati, A. Fieramosca, S. Hafezian, J. Gu,
ван метод обучения одной единственной искусствен-
B. Chakraborty, D. Ballarini, L. Martinu, V. Menon,
ной нейронной сети для решения обратной задачи
D. Sanvitto, and S. Kéna-Cohen, Nature Nanotech. 13,
дизайна многослойной фотонной структуры по за-
906 (2018).
данному угловому спектру коэффициента отраже-
10.
I. S. Kriukova, V. A. Krivenkov, P. S. Samokhvalov, and
ния. Предложенный метод позволяет достичь сред-
I. R. Nabiev, JETP Lett. 112, 537 (2020).
неквадратической ошибки меньше 10-4, и тем са-
11.
A. E. Schegolev, A. M. Popov, A. V. Bogatskaya,
мым проектировать МС, обладающие целевым оп-
P. M. Nikiforova, M. V. Tereshonok, and N. V. Klenov,
тическим откликом с высокой степенью достовер-
JETP Lett. 111, 371 (2020).
ности. Обученная ИНС успешно решает проблему
12.
K. R. Safronov, D. N. Gulkin, I. M. Antropov,
неединственности решения обратной задачи путем
K. A. Abrashitova, V. O. Bessonov, and A. A. Fedyanin,
сглаживания пространства параметров. Кроме того,
ACS Nano 14, 10428 (2020).
ИНС подходит для проектирования устройств на-
13.
S. D. Campbell, D. Sell, R.P. Jenkins, E. B. Whiting,
нофотоники, например, оптического дифференциа-
J. A. Fan, and D. H. Werner, Opt. Mater. Express 9,
тора. Предложенный метод обучения ИНС может
1842 (2019).
быть перенесен на частотный спектр коэффициента
14.
R. L. Haupt and D. H. Werner, Genetic algorithms
отражения, что откроет еще больше возможностей
in electromagnetics, John Wiley & Sons, New Jersey
для создания нанофотонных устройств с различной
(2007).
функциональностью.
15.
J. Robinson and Y. Rahmat-Samii, IEEE Trans.
Исследование выполнено при финансовой под-
Antennas Propag. 52, 397 (2004).
держке Министерства науки и высшего образования
16.
J. S. Jensen and O. Sigmund, Laser Photonics Rev. 5,
Российской Федерации, грант # 14.W03.008.31 (раз-
308 (2011).
работка оптического дифференциатора) и грант
17.
S. Molesky, Z. Lin, A. Y. Piggott, W. Jin, J. Vucković,
#075-15-2020-801 (разработка нейронной сети),
and A. W. Rodriguez, Nat. Photonics 12, 659 (2018).
Российского фонда фундаментальных исследо-
18.
D. Liu, Y. Tan, E. Khoram, and Z. Yu, ACS Photonics
ваний в рамках научного проекта
#19-32-90225
5, 1365 (2018).
(разработка оптимизированного метода матриц
19.
J. Peurifoy, Y. Shen, L. Jing, Y. Yang, F. Cano-Renteria,
распространения). Часть исследований выполне-
B. G. DeLacy, J. D. Joannopoulos, M. Tegmark, and
на при поддержке Центра квантовых технологий
M. Soljačić, Sci. Adv. 4, eaar4206 (2018).
МГУ и некоммерческого Фонда развития науки и
20.
C. C. Nadell, B. Huang, J. Malof, and W. J. Padilla, Opt.
образования “Интеллект”.
Express 27, 27523 (2019).
21.
I. Sajedian, J. Kim, and J. Rho, Microsyst. Nanoeng. 5,
1 (2019).
1. A. F. Koenderink, A. Alu, and A. Polman, Science 348,
22.
J. He, C. He, C. Zheng, Q. Wang, and J. Ye, Nanoscale
516 (2015).
11, 17444 (2019).
2. А. Д. Гартман, М. К. Кройчук, А. С. Шорохов,
23.
S. So, J. Mun, and J. Rho, ACS Appl. Mater. Interfaces
А.А. Федянин, Письма в ЖЭТФ 112, 730 (2020).
11, 24264 (2019).
3. A. M. Chernyak, M. G. Barsukova, A. S. Shorokhov,
24.
Z. Liu, D. Zhu, S. P. Rodrigues, K. T. Lee, and W. Cai,
A.I. Musorin, and A.A. Fedyanin, JETP Lett. 111, 46
Nano Lett. 18, 6570 (2018).
(2020).
25.
Y. Kiarashinejad, S. Abdollahramezani, and A. Adibi,
4. P. S. Pankin, B.-R. Wu, J.-H. Yang, K.-P. Chen,
Npj Comput. Mater. 6, 1 (2020).
I. V. Timofeev, and A. F. Sadreev, Commun. Phys. 3,
1 (2020).
26.
S. An, C. Fowler, B. Zheng, M. Y. Shalaginov, H. Tang,
H. Li, L. Zhou, J. Ding, A. M. Agarwal, C. Rivero-
5. B. I. Afinogenov, A. A. Popkova, V. O. Bessonov,
Baleine, K. A. Richardson, T. Gu, J. Hu, and H. Zhang,
B. Lukyanchuk, and A. A. Fedyanin, Phys. Rev. B 97,
115438 (2018).
ACS Photonics 6, 3196 (2019).
27.
C. C. Katsidis and D. I. Siapkas, Appl. Opt. 41, 3978
6. B. I. Afinogenov, V. O. Bessonov, I. V. Soboleva, and
A.A. Fedyanin, ACS Photonics 6, 844 (2019).
(2002).
7. M. N. Romodina, I. V. Soboleva, A. I. Musorin,
28.
A. Pors, M. G. Nielsen, and S. I. Bozhevolnyi, Nano Lett.
Y. Nakamura, M. Inoue, and A. A. Fedyanin, Phys.
15, 791 (2015).
Rev. B 96, 081401 (2017).
29.
F. I. Baida and M.-P. Bernal, Commun. Phys. 3, 1
8. W. Wu, W. Jiang, J. Yang, S. Gong, and Y. Ma, Opt.
(2020).
Lett. 42, 5270 (2017).
Письма в ЖЭТФ том 114 вып. 5 - 6
2021