Поверхность. Рентгеновские, синхротронные и нейтронные исследования, 2022, № 1, стр. 102-106

Моделирование деградации резонансно-туннельных диодов с использованием искусственных нейронных сетей

К. П. Пчелинцев a*, Н. А. Ветрова a**, В. Д. Шашурин a

a Московский государственный технический университет им. Н.Э. Баумана
105005 Москва, Россия

* E-mail: pkp@bmstu.ru
** E-mail: vetrova@bmstu.ru

Поступила в редакцию 31.05.2021
После доработки 20.06.2021
Принята к публикации 30.06.2021

Полный текст (PDF)

Аннотация

Приборы на основе наноразмерных нелинейных элементов с поперечным транспортом носителей заряда широко применяются в различных современных радиоэлектронных системах. Однако в настоящее время не разработан оптимальный (с точки зрения временнóй сложности и точности) подход для прогнозирования эксплуатационных параметров с учетом временнóго фактора и внешнего воздействия подобных устройств. В данной работе авторами предложен вариант решения задачи моделирования деградации гетероструктурных наноэлектронных приборов с поперечным транспортом носителей заряда на основе искусственной нейронной сети прямого распространения. Использование нейросетевых подходов при моделировании резонансно-туннельных диодов позволяет значительно (на несколько порядков) повысить быстродействие таких моделей. Обучение разработанной искусственной нейронной сети данными, полученными в рамках испытаний на надежность низкоразмерных полупроводниковых гетероструктурных диодов, позволяет в несколько раз повысить точность модели за счет учета влияния технологических погрешностей (возникающих при производстве), а также различных деградационных изменений (протекающих с течением времени и под воздействием внешних факторов в процессе эксплуатации резонансно-туннельных диодов).

Ключевые слова: гетероструктуры, терагерцовый диапазон, осциллятор, полупроводниковые эпитаксиальные слои, беспроводная связь, наноэлектроника, резонансно-туннельный диод, математическое моделирование, искусственные нейронные сети, персептрон, деградация.

ВВЕДЕНИЕ

В настоящее время в современных радиоэлектронных системах в качестве нелинейного элемента широко применяется резонансно-туннельный диод (РТД). При изменении параметров слоев гетероструктуры РТД можно осуществлять управление формой вольтамперной характеристики, создавая диод, оптимальный для различных устройств [1], к примеру, осцилляторов [2] или смесителей [3] терагерцового диапазона. Однако на сегодняшний день является нерешенной задача обеспечения требуемого уровня надежности РТД при стабильном технологическом процессе изготовления [4]. Причиной сложившейся ситуации является отсутствие адекватных моделей деградации гетероструктурных устройств. При разработке подобных моделей необходимо выявить основные деградационные механизмы, определить энергию активации и коэффициенты диффузии соответствующих процессов [5, 6]. Кроме того, в погрешность моделей неизбежно “закладываются” ошибки вычисления эмпирических поправочных коэффициентов комбинированных расчетно-экспериментальных моделей токопереноса [7, 8]. Достижимость высокого уровня точности и достоверности таких деградационных моделей, построенных на традиционных подходах, вызывает очевидные сомнения.

Авторами предложено использование искусственной нейронной сети (ИНС) [9, 10] для аппроксимации сложных, в том числе скрытых, функциональных зависимостей эксплуатационных характеристик РТД от конструкторско-технологических параметров с учетом временнóго фактора и внешнего воздействия.

МЕТОДИКА

В общем случае искусственная нейронная сеть представляет собой систему соединенных и взаимосвязанных элементарных нелинейных вычислительных блоков, называемых нейронами. В соответствии с обобщенной аппроксимационной теоремой, с помощью линейных операций и каскадного соединения нелинейных элементов может быть установлена с заданной точностью и аппроксимирована любая непрерывная функциональная зависимость [11, 12]. Первым шагом при разработке ИНС является выбор структуры. Структурой или же топологией нейронной сети называют схему, описывающую модель соединения нейронов между собой. Авторами предложено использование многослойного персептрона, в качестве нелинейной функции активации подтверждена эффективность использования гиперболического тангенса.

В рамках решения задачи моделирования деградации РТД, в качестве конструкторско-технологических параметров выделены толщины гетерослоев, формирующих барьеры и яму, внешнее воздействие рассмотрено как повышение температуры в течение заданного времени. Соответственно, аппроксимируемая функциональная зависимость может быть формализована следующим образом:

$J = F({{d}_{w}},{{d}_{b}},T,t,V),$
где ${{d}_{w}}$ – толщина слоя, формирующего потенциальную яму; ${{d}_{b}}$ – толщины слоев, формирующих потенциальные барьеры; $T$ – величина температуры; $t$ – длительность температурного воздействия; $V$ – значения приложенного напряжения.

Число нейронов на входном слое определено числом независимых параметров аппроксимируемой характеристики РТД. На выходе сети один нейрон, принимающий значение плотности тока.

Значительное внимание при разработке нейронной сети было уделено выбору метода обучения нейронной сети. С математической точки зрения обучение ИНС представляет собой решение многопараметрической нелинейной оптимизационной задачи. Именно в процессе обучения нейронная сеть способна выявить и обобщить функциональную зависимость между входными и выходными данными. Обобщающая способность является важнейшим свойством ИНС, позволяющим модели отражать исходные данные в искомые результаты на всем множестве данных, а не только в тренировочных примерах. В качестве критерия выбора оптимального метода обучения использовано время обучения сети. Исследования, проведенные авторами на модельных структурах, показали, что алгоритм Левенберга–Марквардта является наиболее быстродействующим методом обучения ИНС. При оценке быстродействия алгоритмов обучения в качестве критерия их остановки принималось достижение заданной точности.

В настоящее время не существует универсального метода, используемого для определения гиперпараметров и структуры ИНС [13, 14]. При разработке нейронной сети проведены исследования влияния числа нейронов на скрытом слое на время и точность обучения. В качестве критерия при оценке точности выбрана ошибка обучения (величина расхождения прогнозируемого значения, полученного на выходе ИНС, и данными, использованными при формировании обучающей выборки). Анализ полученных результатов позволил получить точечную оценку числа нейронов на скрытом слое. Обобщенные результаты представлены на рис. 1.

Рис. 1.

Результаты моделирования: 1 – Зависимость усредненной ошибки обучения $\sigma $ от числа нейронов на скрытом слое N, 2 – Зависимость времени обучения нейронной сети t от числа нейронов на скрытом слое N.

Таким образом, в рамках разработки модели деградации РТД с использованием искусственных нейронных сетей, была получена структура сети, определена функция активации, осуществлен выбор числа нейронов на скрытом слое и выбран метод обучения сети, позволяющие с требуемой точностью установить и аппроксимировать искомую функциональную зависимость.

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ

Для верификации, разработанной нейросетевой модели выполнено сравнение электрических характеристик прибора на выходе ИНС с результатами, полученными с использованием квантовомеханической модели токопереноса в гетероструктуре GaAs/AlGaAs с учетом времени и внешних факторов. В данной модели с целью учета изменений структуры с течением времени использована диффузионная модель, описывающая дрейф атомов алюминия из барьеров в яму и спейсеры (1). Зависимость коэффициента диффузии алюминия от температуры определена с помощью модели Аррениуса (2). В рамках формализма волновых функций, прозрачность вычислялась как отношение амплитуд волн, падающих и прошедших через моделируемую структуру (3), определяемых из уравнения Шредингера (4), а расчет плотности тока, в рамках формализма Ландауэра, был сведен к интегрированию (5).

Таким образом, численная модель может быть представлена системой интегро-дифференциальных уравнений:

(1)
$\frac{{\partial {{X}_{{{\text{Al}}}}}(t)}}{{\partial t}} = {{D}_{{{\text{Al}}}}}(T)\frac{{{{\partial }^{2}}{{X}_{{{\text{Al}}}}}(z)}}{{\partial {{z}^{2}}}},$
(2)
${{D}_{{{\text{Al}}}}}(T) = {{D}_{0}}\exp ({{ - {{E}_{{\text{a}}}}} \mathord{\left/ {\vphantom {{ - {{E}_{{\text{a}}}}} {kT)}}} \right. \kern-0em} {kT)}},$
(3)
$Tr(E) = \frac{{{{{\left| {{{A}_{{\text{n}}}}} \right|}}^{2}}}}{{{{{\left| {{{A}_{1}}} \right|}}^{2}}}}\frac{{{{K}_{{\text{n}}}}m_{1}^{*}}}{{{{K}_{1}}m_{{\text{n}}}^{*}}},$
(4)
$H\Psi = E\Psi ,$
(5)
$J(V,t) = \frac{{2m{\kern 1pt} {\text{*}}ekT}}{{{{{(2\pi )}}^{2}}{{\hbar }^{3}}}}\int\limits_0^\infty {Tr(E)} \ln \left( {\frac{{1 + {{e}^{{ - {\kern 1pt} \frac{{E - E_{F}^{L}}}{{kT}}}}}}}{{1 + {{e}^{{ - {\kern 1pt} \frac{{E - E_{F}^{R}}}{{kT}}}}}}}} \right)dE,$

где Tr(E) – прозрачность моделируемой гетероструктуры, k – постоянная Больцмана, T – температура, m * – эффективная масса электрона, e – элементарный заряд, ${{X}_{{{\text{Al}}}}}$ – доля замещения атомов галлия атомами алюминия, ${{D}_{{{\text{Al}}}}}(T)$ – коэффициент диффузии, ${{D}_{0}}$ – предэкспоненциальный множитель, ${{E}_{{\text{a}}}}$ – энергия активации диффузионного процесса, $E_{F}^{{{\text{L}}({\text{R}})}}$ – энергия Ферми в левом (правом) резервуаре, $A$ – амплитуды падающей и прошедшей волны, ${{K}_{i}} = {{\sqrt {2m_{i}^{*}(E - {{U}_{i}})} } \mathord{\left/ {\vphantom {{\sqrt {2m_{i}^{*}(E - {{U}_{i}})} } \hbar }} \right. \kern-0em} \hbar }$ – волновое число электрона в i-ой точке, $\hbar $ – постоянная планка, E – полная энергия электрона.

При формировании массива обучающих данных параметры были заданы на регулярной сетке. С целью оценки обобщающей способности полученной нейронной сети выборка разделена на две (первая использована для обучения, вторая для оценки ошибки обобщения, полученной при использовании входных данных, не участвовавших в обучении). Зависимости ошибки обучения и обобщения от величины приложенного напряжения представлены на рис. 2.

Рис. 2.

Результаты моделирования: 1 – Зависимость ошибки обучения от величины приложенного напряжения, 2 – Зависимость ошибки обобщения от величины приложенного напряжения.

Итоговая ошибка обучения не превышает 2%, а максимальная ошибка обобщения составляет 2.5%, что позволяет сделать вывод о высокой точности нейросетевой модели. Кроме этого, сравнительный анализ времени вычислений полученной модели и квантовомеханической модели показал, что модель на основе обученной нейронной сети является более эффективной для многоитерационных вычислений, так как осуществляет расчеты на несколько порядков быстрее.

В рамках валидации разработанной нейросетевой модели, для обучения использованы экспериментальных измерения ВАХ, соответствующие следующему набору параметров: T = 300, 500, 550, 600 K; t = 0, 1, 2, 3, 4, 7, 14, 21, 28, 60, 72, 110, 145 ч. Следует отметить, что вольтамперная характеристика получена не для всех возможных сочетаний параметров, то есть, фактически область обучения нерегулярна. Результаты моделирования при температурах 550 К и времени нагрева 14 и 21 ч, а также и их сравнение с экспериментальными данными представлены на рис. 3.

Рис. 3.

Результаты моделирования: 1 – экспериментальные данные (Т = 550 К, t = 14 ч), 2 – нейросетевая модель (T = 550 К, t = 14 ч), 3 – экспериментальные данные (T = 550 К, t = 28 ч), 4 – нейросетевая модель (T = 550 К, t = 28 ч).

РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ

Анализ полученных результатов позволяет сделать вывод о высокой точности аппроксимации с помощью искусственных нейронных сетей нелинейной функциональной зависимости эксплуатационных характеристик РТД от конструкторско-технологических параметров с учетом времени и воздействия внешних факторов, и, как следствие, о перспективности развития нейросетевых методов при моделировании деградации приборов на основе низкоразмерных полупроводниковых гетероструктур.

Показано, что нейронная сеть способна обучиться на основе выборки входных параметров с нерегулярным разбиением. В данный момент авторами ведутся исследования для оценки значимости и требуемого числа параметров, а также количества значений для каждого параметра. Последняя задача особенно важна при обучении ИНС с помощью экспериментальных данных, так как изготовление и испытания низкоразмерных полупроводниковых структур требует значительных финансовых затрат.

Анализ результатов, полученных с использованием ИНС, обученной на основе экспериментальных данных, позволяет сделать вывод о возможности учета совокупного влияния технологических погрешностей и различных деградационных изменений. Что обеспечивает перспективность подобного подхода для решения прикладных задач проектирования современных радиоэлектронных приборов.

ЗАКЛЮЧЕНИЕ

Представлено использование современного нейросетевого подхода к моделированию характеристик РТД и их изменения с течением времени под воздействием внешних факторов. Разработанная модель на основе ИНС прямого распространения способна с высокой точностью оценить электрические характеристики РТД, что подтверждено на этапе верификации полученной нейросетевой модели численной квантовомеханической моделью (максимальная ошибка обучения не превышает 2%, а ошибка обобщения составляет не больше 2.5%). При обучении разработанной ИНС экспериментальными данными предложенная модель учитывает совокупное влияние технологических погрешностей и различных деградационных изменений, протекающих в приборе за время его эксплуатации. Как следствие, нет необходимости ввода дополнительных “поправочных” эмпирических коэффициентов, которые имеются во всех известных и широко применимых на сегодняшний день феноменологических моделях. Для оценки электрических параметров РТД с помощью, представленной нейросетевой модели требуется выделение значительно меньшего объема вычислительных ресурсов в сравнении с комбинированными квантовомеханическими моделями, что делает ее использование привлекательным для итерационного решения оптимизационной задачи обеспечения требуемого уровня надежности РТД.

Список литературы

  1. Wang J., Al-Khalidi A., Zhang C., Ofiare A., Wang L., Wasige E., Figueiredo J.M.L. // 10th UK-Europe-China Workshop on Millimetre Waves and Terahertz Technologies. 2017. 1–4. https://doi.org/10.1109/UCMMT.2017.8068497

  2. Kasagi K., Suzuki S., Asada M. // J. Applied Physics. 2019. V. 125. № 15. P. 151601.https://doi.org/10.1063/1.5051007

  3. Yang F. // J. Computational and Theoretical Nanoscience. 2017. V. 14. № 4. P. 1766.https://doi.org/10.1166/jctn.2017.6501

  4. Baba R., Stevens B.J., Mukai T., Hogg R.A. // IEEE J. quantum electronic. 2018. V. 54. № 2. P. 21.https://doi.org/10.1109/JQE.2018.2797960

  5. Soboleva O.S., Yuferev V.S., Podoskin A.A., Pikhtin N.A., Zolotarev V.V., Golovin V.S., Slipchenko S.O. // IEEE Transactions on Electron Devices. 2020. V. 67. № 2. P. 438.https://doi.org/10.1109/TED.2019.2960936

  6. Makeev M.O., Meshkov S.A., Sinyakin V.Yu. // IOP Conf. Series: J. Physics: Conf. Series. 2017. V. 917. https://doi.org/10.1088/1742-6596/917/9/092004

  7. Nadar S., Zaknoune M., Wallart X., Coinon C., Emilien P., Ducournau G., Gamand F., Thirault M. // IEEE Transactions on Terahertz Science and Technology. 2017. V. 7. № 6. P. 780.https://doi.org/10.1109/TTHZ.2017.2755503

  8. Anantram M.P., Lundstrom M.S., Nikonov D.E. // Proceedings of the IEEE. 2008. V. 96. № 9. P. 1511.https://doi.org/10.1109/JPROC.2008.927355

  9. Schmidhuber J. // Neural Networks. 2015. V. 61. P. 85.https://doi.org/10.1016/j.neunet.2014.09.003

  10. Laudani A., Lozito G.M., Fulginei F.R., Salvini A. // Computational Intelligence and Neuroscience. 2015. V. 2015. P. 264.https://doi.org/10.1155/2015/818243

  11. Dua V. // Computers & Chemical Engineering. 2011. V. 35. № 3. P. 545.https://doi.org/10.1016/j.compchemeng.2010.06.005

  12. Jamili E., Dua V. // Computers & Chemical Engineering. 2019. V. 147. P. 107221. https://doi.org/10.1016/j.compchemeng.2020.107221

  13. Vujicic T., Tripo M., Jelena L., Balota A., Sevarac Z. // Central European Conference on Information and Intelligent Systems. 2016. P. 219.

  14. Gnana Sheela K., Deepa S.N. // Mathematical Problems in Engineering. 2013. V. 6. P. 965.https://doi.org/10.1155/2013/425740

Дополнительные материалы отсутствуют.