Приборы и техника эксперимента, 2021, № 4, стр. 105-118

РАЗРАБОТКА АЛГОРИТМА КОДИРОВАНИЯ ЗВУКА ДЛЯ СИСТЕМЫ КОХЛЕАРНОЙ ИМПЛАНТАЦИИ

Е. М. Глуховский *, А. И. Егоров a**, М. И. Карапетянц a***

a Лаборатория медицинского приборостроения Московского физико-технического института (национального исследовательского университета)
141701 Долгопрудный, Московской обл., Институтский пер., 9, Россия

* E-mail: glukhovskii.em@mipt.ru
** E-mail: egorov.aleksei.i@mipt.ru
*** E-mail: yanturina.mi@phystech.edu

Поступила в редакцию 11.11.2020
После доработки 27.01.2021
Принята к публикации 29.01.2021

Полный текст (PDF)

Аннотация

Разработана стратегия стимуляции для нового устройства системы кохлеарной имплантации, создаваемой в МФТИ. Построена модель восприятия звука, обработанного по такой стратегии, человеком с кохлеарным имплантом. Качество работы стратегии оценивалось на слух путем сравнения звука, полученного с помощью обратного преобразования, и исходного сигнала. Трудно было учесть многие индивидуальные физиологические факторы, такие как перекрестная стимуляция соседних каналов, состояние нервных окончаний индивида. Но при использовании описанных упрощений было получено, что информация, передаваемая посредством стимуляции кохлеарной зоны при применении данной стратегии, позволяет разборчиво воспроизводить речь.

1. ВВЕДЕНИЕ

В данной статье описаны основные принципы работы известных алгоритмов кодирования звука для стимуляции кохлеарной зоны, позволяющей воспринимать звук пациентам с сенсоневральной тугоухостью, проведен обзор существующих методов обработки звука, дано разъяснение определения частоты стимуляции электродов.

Задачей нашего исследования было моделирование алгоритма кодирования звука для нового прибора – системы кохлеарной имплантации (с.к.и.) и оценка качества его работы с помощью построенной модели. Данный прибор – собственная отечественная разработка, создаваемая для замещения таких импортных аналогов, как Cochlear, Med-El и Advanced Bionics, популярных в нашей стране.

Авторами разработана и представлена новая стратегия стимуляции для с.к.и., оптимизирующая вычислительные затраты, используемые для обработки звука, и продемонстрированы ее основные преимущества. Описаны основные этапы алгоритма кодирования звука. Проведена оценка качества работы алгоритма на слух, проведено моделирование работы алгоритма в системе matlab. В работе приведено наглядное сравнение исходного звука и звука, воспринимаемого пациентом, а также анализ результатов. Построены амплитудные спектры получаемых сигналов, приведена схема разработанного алгоритма, построены графики исходного и конечного сигналов, а также сигнала на промежуточных этапах обработки.

Для технологии с.к.и., помогающей слабослышащим людям, требуется использование специализированных алгоритмов кодирования звука, называемых стратегиями стимуляции. На данный момент известны различные способы стимуляции рецепторов улитки (CIS, ACE, HiRes, SPEAK и другие). О принципах их работы известна лишь общая информация, так как разработки в этой области защищены авторским правом производителей приборов.

Аналогично стратегии CIS на начальном этапе обработки в нашей стратегии была использована фильтрация. Затем были применены рекурсивный алгоритм Герцеля, нелинейное сжатие и фильтр нижних частот. В ходе анализа количества действий, необходимых для использования того или иного метода, было показано преимущество применения алгоритма Герцеля вместо быстрого преобразования Фурье для экономии вычислительных ресурсов.

Понятно, что для комфортного применения алгоритма в приборе, необходимо использовать минимально возможное количество вычислительных ресурсов с наименьшими потерями качества передаваемого звука. В статье приведен анализ различных этапов алгоритма, разобраны их достоинства и недостатки, приведены возможности совершенствования.

2. ВОСПРИЯТИЕ ЗВУКА ЧЕЛОВЕКОМ. УСТРОЙСТВО СИСТЕМЫ КОХЛЕАРНОЙ ИМПЛАНТАЦИИ

Барабанная перепонка передает импульсы звуковой волны в среднее ухо, где колебания с помощью слуховых костей (молоточек и наковальня) передаются во внутреннее ухо на улитку. На базилярной мембране в улитке расположены волосковые клетки, которые и являются рецепторами слуховой системы. Через жидкость, заполняющую улитку, вибрации передаются рецепторным клеткам, которые преобразуют механический импульс в электрический, он и воспринимается нервами.

Повреждение волосковых клеток может привести к потере слуха. В такой ситуации и может быть использована с.к.и. Она состоит из микрофона и речевого процессора. Затем звук через катушку, размещенную под кожей, попадает на матрицу электродов, расположенную на улитке. Далее сигнал передается в мозг путем стимуляции слуховых нервов.

С.к.и. состоит из кохлеарного импланта и носимого речевого процессора. Кохлеарный имплант – устройство, применяемое при поражении внутреннего уха в случае сохранности функционирования нейронов спирального ганглия. Речевой процессор снабжен микрофоном, устройством обработки звука и катушкой индуктивности для передачи энергии и данных импланту. Сам имплант состоит из приемной катушки, блока стимуляции и электродной матрицы.

Речевой процессор передает звук с цифровым кодированием импланту через катушку. Приемник-стимулятор кохлеарного импланта преобразует звук из цифровой формы в электрические сигналы, а затем передает их на электродную матрицу, используя одну из стратегий стимуляции. Число электродов варьируется для разных производителей и может достигать от 12 до 22.

После того, как были выбраны частоты для стимуляции, нужно их правильно разместить на электроде, чтобы они стимулировали именно в тех точках, где расположены рецепторы улитки на данные частоты. У большинства людей они расположены одинаково, что можно увидеть на рис. 1.

Рис. 1.

Распределение частот по глубине внутри улитки.

Распределение частот, воспринимаемых ухом, на улитке для человека известно из экспериментальных данных и было аппроксимировано эмпирической формулой [1]

$\begin{gathered} F{{C}_{{GP}}}(x) = \\ \, = 0.1654\;{\text{кГц}}\left( {\exp \left( {\frac{{0.13815(35\;{\text{мм }} - {\text{ }}x)}}{{1\;{\text{мм}}}}} \right) - 1} \right). \\ \end{gathered} $

3. РАЗНОВИДНОСТИ СТРАТЕГИЙ СТИМУЛЯЦИИ

Наиболее близкие к разработанной нами стратегии стимуляции – это стратегии ACE (advanced combinational encoder) и CIS (continuous interleaved sampling). Поэтому рассмотрим их более подробно.

3.1. Описание стратегии стимуляции CIS

Приведем основные этапы стратегии стимуляции CIS (см. рис. 2). Сначала к сигналу применяются полосовые фильтры, разделяющие его на несколько частот. Каждый фильтр соответствует своему электроду. Следующий этап – выпрямление, после которого следуют низкочастотные фильтры (обычно на 200 или на 400 Гц). Таким образом получаем низкочастотный сигнал, который напоминает форму огибающей исходного сигнала. Далее производится сжатие данного сигнала с помощью нелинейной функции, например логарифма, чтобы убедиться, что электрический сигнал, который в дальнейшем будет передан на электроды, попадает в комфортный человеку диапазон значений сигнала. Этот диапазон устанавливается врачом. Соотношения амплитуд полученных электрических импульсов соответствуют нелинейно сжатым амплитудам огибающих в каждом канале стимуляции. Используется 16 электродов. Важным моментом является то, что они все стимулируются за один цикл, но не одновременно [2].

Рис. 2.

Блок-схема стратегии стимуляции CIS. ПФ – полосовой фильтр, ФНЧ – фильтр нижних частот.

3.2. Описание стратегии стимуляции ACE

Так же, как и для стратегии CIS, в стратегии ACE на входе к сигналу применяются полосовые фильтры (см. рис. 3). После фильтрации в каждом канале получают огибающие. Для каждой полосы пропускания вычисляется энергия. Далее в каждом цикле выбирается 6–10 диапазонов частот, для которых энергия максимальна. Энергия остальных для стимуляции не используется. Затем проводится преобразование импульсов в электрический сигнал в диапазоне, комфортном для восприятия пациентом, и последовательно стимулируются выбранные электроды. Обычно используется 22 электрода. И итерация цикла (выбор каналов с максимальной энергией) повторяется [2].

Рис. 3.

Блок-схема стратегии стимуляции ACE.

4. РАЗРАБОТАННАЯ СТРАТЕГИЯ СТИМУЛЯЦИИ

В программной среде matlab была смоделирована следующая схема, представленная на рис. 4.

Рис. 4.

Схема разработанной стратегии стимуляции.

Рассмотрим более подробно блоки нашего алгоритма. Начальная часть – фильтрация полосовыми фильтрами – аналогична стратегиям CIS и ACE. Полосовые фильтры разделяют сигнал на 16 каналов. С этими фильтрами нет необходимости использовать оконную функцию, которая убирает искажения, вызванные краевым эффектом при вычислении преобразования Фурье. Вычисление дискретного преобразования Фурье приводит к разрывам на краях анализируемого блока, что проявляется искажением спектра. Этот эффект менее выражен, если в анализируемом блоке присутствует сигнал с узким спектром после применения полосового фильтра. Применение фильтров без оконной функции позволяет существенно экономить вычислительные ресурсы при расчете преобразования Фурье и использовать рекурсивные алгоритмы для вычисления преобразования. На выходе возможно применение как последовательной, так и параллельной стимуляции электродов.

4.1. Входные полосовые фильтры

Для разделения сигнала на 16 каналов были взяты соответствующие им частоты [3]:

№ канала 1 2 3 4 5 6 7 8
Частота, Гц 333 450 540 642 762 906 1076 1278
№ канала 9 10 11 12 13 14 15 16
Частота, Гц 1518 1803 2142 2544 3022 3590 4264 6665

Нелинейная фазочастотная характеристика фильтра может привести к нежелательным фазовым искажениям сигнала при восстановлении, однако для корректного восприятия речи человеком фаза не играет роли. Изначально для наиболее эффективной обработки звука нами были выбраны фильтры с конечной импульсной характеристикой – к.и.х.-фильтры, обеспечивающие линейную фазочастотную характеристику. Хотя к.и.х.-фильтры расходуют больше вычислительных ресурсов, звук, получаемый с их помощью, немного более качественный из-за отсутствия фазовых задержек между сигналами, но это отличие незначительно. Если учесть все вышесказанное, а также то, что ухо человека не сильно восприимчиво к задержкам фазы (они имеют большее значение только на низких частотах), мы решили использовать именно фильтры с бесконечной импульсной характеристикой (б.и.х.).

Чтобы оценить эффективность разработанного алгоритма, было проведено сравнение восстановленного звука, полученного с помощью б.и.х.-фильтров, и исходного (графики см. на рис. 5а и 5б). На этих графиках видно, что исходный звук и звук, полученный после использования нашего алгоритма и восстановления, отличаются незначительно.

Рис. 5.

а – исходный сигнал, получаемый микрофоном; б – звуковой сигнал после восстановления (использование б.и.х.-фильтров).

4.2. Алгоритм Герцеля и модифицированный алгоритм Герцеля

Алгоритм Герцеля – это способ вычисления преобразования Фурье для отдельно взятой частоты. Стандартный алгоритм Герцеля вычисляет коэффициенты Фурье для набора частот:

$\{ 2{{\pi }}k{\text{/}}N\} ,$
где $k = \overline {0,N - 1} ,$ N – число отсчетов сигнала [4].

Алгоритм Герцеля имеет структуру вычисления, как у б.и.х.-фильтра, поэтому его часто называют фильтром Герцеля. Сравним его с алгоритмом быстрого преобразования Фурье, который позволяет вычислить преобразование в конкретных точках (мы можем выбрать наиболее удобное нам число точек, например). Если вернуться к приведенным выше частотам, то можно заметить, что расстояние между нужными нам частотами около 100 Гц и при грубой оценке нужно будет считать алгоритм примерно по 160 точкам (частота дискретизации 16 кГц/100 Гц), и даже это не дает гарантии, что мы точно попадем в выбранные нами частоты. Таким образом, расчет по 160 точкам, очевидно, займет больше ресурсов, чем по 16 в случае алгоритма Герцеля, например, когда мы будем вычислять конкретные частоты. Поэтому алгоритм Герцеля оптимальный, особенно если учитывать, что есть его модификация – рекурсивный алгоритм. Схема классического фильтра Герцеля приведена на рис. 6. Рассмотрим сначала его устройство, а затем его модификации [4]. Применение такого фильтра позволяет рассчитать значение k-го бина (фиксированного номера спектрального отсчета дискретного преобразования Фурье) N-точечного дискретного преобразования Фурье:

$\begin{gathered} {{S}_{N}}(k) = \sum\limits_{n = 0}^{N - 1} {x(n)W_{N}^{{kn}}} , \\ W_{N}^{{kn}} = \exp \left( { - j\frac{{2{{\pi }}}}{N}kn} \right), \\ \end{gathered} $
где x(n) – сигнал.

Рис. 6.

Схема фильтра Герцеля.

Введем дискретные экспоненциальные функции:

$W_{N}^{{(p + {{\theta )}}l}} = \exp \left[ { - j\frac{{2{{\pi }}}}{{N(p + {{\theta )}}}}} \right]l.$

Значение спектра $S_{N}^{{(k + {{\theta }})}}(r)$ можно вычислить из скользящего окна длиной N отсчетов на шаге r:

$S_{N}^{{(k + {{\theta )}}}}(r) = \sum\limits_{n = 0}^{N - 1} {x(n + r)W_{N}^{{(k + {{\theta )}}n}}} .$

Обозначим z-преобразование x(n) и $S_{N}^{{(k + {{\theta )}}}}(n)$ через X(z) и Y(z) соответственно. Передаточная характеристика изображенного на рис. 6 б.и.х.-фильтра имеет вид:

$N(z) = \frac{{Y(z)}}{{X(z)}} = \frac{{W_{N}^{{ - (k + {{\theta )}}}}}}{{1 - {{z}^{{ - 1}}}W_{N}^{{ - (k + {{\theta )}}}}}},$
где целочисленная переменная k заменена на параметрически введенную –(k + θ), в которой k = $\overline {0,N - 1} $, 0 < θ < 1, набор анализируемых частот варьируется с помощью параметра θ: $\left\{ {\frac{{2{{\pi (}}k + {{\theta )}}}}{N}} \right\}$.

Разностные уравнения фильтра Герцеля приведены ниже (на рис. 6 справа от штриховой линии – прямая цепь фильтра, слева – обратная):

обратная цепь фильтра –

$\upsilon (n) = 2\cos (2{{\pi }}k{\text{/}}N)\upsilon {\text{(}}n - {\text{1)}} - \upsilon {\text{(}}n - {\text{2)}} + x{\text{(}}n{\text{),}}$

прямая цепь фильтра –

$y(n) = W_{N}^{{ - k}}\upsilon {\text{(}}n{\text{)}} - \upsilon {\text{(}}n - {\text{1)}}{\text{.}}$

На выходе фильтра Герцеля получаем коэффициенты, по которым можно рассчитать амплитуду сигнала в каждом канале.

Алгоритм Герцеля удобен для сокращения вычислительных мощностей, затрачиваемых на обработку получаемого аппаратом звука, так как он заменяет сразу несколько процедур других алгоритмов, а именно: выпрямление и применение фильтра нижних частот. Алгоритм представляет из себя б.и.х.-фильтр второго порядка. Обработка данных происходит блоками длиной в N точек (окно), а полученные в результате значения совпадают с соответствующими коэффициентами дискретного преобразования Фурье. Окно заданной длины N с перекрытием производит вычисление коэффициентов в каждой точке дискретизации.

В нашей работе проводилось моделирование с использованием окна Хэннинга [5]. Полученные комплексные величины в каждой точке сигнала определяют его амплитуду, т.е. позволяют получить огибающие. Таким образом, можно поучить 16 огибающих для каждой из выделенных частотных составляющих сигнала, после чего находится модуль данных комплексных величин.

Итак, коэффициенты Фурье для каждой отдельной частоты (выделенной нами из ряда, соответствующего каналам стимуляции) позволяют вычислить амплитуды огибающих для каждого частотного канала. На этом заканчивается сходство с CIS. Стратегия CIS так же получает после полосового фильтра выпрямленный сигнал, похожий в нашем случае на огибающую. Фильтр CIS сначала вычисляет модуль сигнала, а затем применяет низкочастотный фильтр. Эти три звена заменяются у нас одним алгоритмом Герцеля.

Оценить эффективность алгоритма можно, сравнив частотные спектры сигналов (см. графики на рис. 7а и 7б). Видно, что на высоких частотах 4.5–8 кГц при применении алгоритма Герцеля без входных фильтров появляется шум. Мы показали, что при реализации алгоритма Герцеля с входными фильтрами, а также при применении окна Хэннинга без фильтров шум на этих частотах подавляется.

Рис. 7.

Амплитудный спектр получившегося сигнала при применении алгоритма Герцеля с полосовым б.и.х.-фильтром (а) и без него (б).

Есть метод, позволяющий использовать фильтр Герцеля рекурсивно, его схема представлена на рис. 8. Получается, что каждый раз не нужно вычислять значения во всех точках заново. Он позволяет получать значения спектральных отсчетов в реальном времени.

Рис. 8.

Схема модифицированного фильтра Герцеля (скользящее дискретное преобразование Фурье).

Выигрыш, получаемый с помощью применения рекурсивной формулы для модифицированного фильтра Герцеля, можно увидеть, посмотрев на количество действий, необходимых для работы фильтра (см. сравнительнную табл. 1).

Таблица 1.

Количество действий, необходимых для работы фильтра [4]

Метод Вычисление значения $S_{N}^{{(N)}}(k,{{\theta )}}$
Действительные умножения Действительные сложения
Алгоритм Герцеля N + 2 2N + 2
Модифицированный алгоритм Герцеля 4 4
Дискретное преобразование Фурье 4N 4N

Рекуррентное уравнение скользящего дискретного преобразования Фурье:

$S_{N}^{k}(n) = W_{N}^{{ - k}}[S_{N}^{k}(n - 1) + x(n) - x(n - N)],$
где $S_{N}^{k}(n)$ – значение k-го фиксированного номера спектрального отсчета N-точечного дискретного преобразования Фурье в момент времени n.

Также здесь следует отметить, что вычисления преобразования Фурье с помощью алгоритма Герцеля подразумевают применение не оконной функции, а фильтров. Поэтому, чтобы мы могли использовать рекурсивный алгоритм, потребляющий мало ресурсов, нужно использовать на входе полосовые фильтры. В результате с применением фильтров вычислений будет меньше, чем с применением оконной функции, так как оконная функция аналогична по затрачиваемым ресурсам применению к.и.х.-фильтров, а б.и.х.-фильтры требуют меньше ресурсов на вычисления. Так, наименее ресурсоемкий результат получается при применении б.и.х.-фильтров на входе и использовании модифицированного рекурсивного алгоритма Герцеля.

Таким образом, после проведения ряда испытаний мы пришли к выводу, что, хотя оконная функция дает такой же результат, что и применение фильтров, удобнее использовать фильтры без оконной функции, потому что есть возможность использовать модифицированный (рекурсивный) алгоритм, который требует значительно меньше вычислительных ресурсов. Поэтому оптимальный вариант – это применение б.и.х.-фильтров на входе и замена оконной функции на рекурсивный модифицированный алгоритм Герцеля.

4.3. Обратное преобразование

Понятно, что человек будет воспринимать сигнал худшего качества, чем тот, который поступил в прибор изначально. А для того, чтобы понять какой именно сигнал воспринимается человеком, проведем обратное преобразование – восстановим исходный сигнал с потерями кодирования, т.е. полученную амплитуду умножим на косинус частоты, соответствующей одному из 16 каналов. Начальные фазы не учитываются, так как в результате кодирования звука эту информацию нельзя восстановить, и для распознавания речи это не важно. В результате сложения восстановленных с помощью косинусов сигналов во всех каналах получаем воссозданный звук:

${\text{signal}}(j,i) = {\text{amplitude}}(j,i){\text{cos}}\left( {\frac{{{\text{freq}}(i)2j{{\pi }}}}{{{{F}_{s}}}}} \right),$
где i – номер канала,  j – номер строки в массиве, содержащем сигнал или его амплитуду; Fs – частота дискретизации; amplitude – коэффициенты, равные амплитуде сигнала; freq(i) – частота, соответствующая каналу, и тогда в массиве signal(j, i) получим восстановленный сигнал в данном канале.

Таким образом, получив воссозданный сигнал, проверяем работу алгоритма.

4.4. Нелинейное сжатие

Нервные окончания улитки воспринимают токовую стимуляцию нелинейно. При электрической стимуляции громкость воспринимается по следующему закону:

$L = {{k}_{a}}{{p}^{{{{{{\beta }}}_{a}}}}} = {{k}_{e}}{{i}^{{{{{{\beta }}}_{e}}}}},$
где i – ток, p – звуковое давление, коэффициенты βa = 0.6, βe = 2.7 [6]. Тогда ток, а следовательно, и напряжение на микрофоне определяются по следующему закону:
$i = {{k}_{m}}{{p}^{{{{{{\beta }}}_{m}}}}},$
где βm = βae = 0.22.

Видно, что воспринимаемая громкость связана со стимулирующими импульсами по степенному закону. Поэтому после получения огибающих для стимуляции электродов прибора необходимо провести нелинейное сжатие.

В результате получаются амплитуды электрических импульсов – у. Они устанавливаются в некотором уровне значений (комфортный и пороговый – М и В). Задача нелинейного сжатия – перевести весь сигнал в такой комфортный диапазон, настраиваемый врачом. Формула нелинейного сжатия сигнала следующая [6]:

$y = \left\{ \begin{gathered} \frac{{{\text{log}}\left( {1 + \alpha \left( {\frac{{\upsilon - B}}{{M - B}}} \right)} \right)}}{{{\text{log}}(1 + \alpha )}},\quad ~B \leqslant \upsilon \leqslant M \hfill \\ 0,\quad \upsilon \leqslant B \hfill \\ 1,\quad \upsilon \geqslant M \hfill \\ \end{gathered} \right.,$
где υ – огибающая, α – степень сжатия, М – уровень насыщения, В – пороговое значение.

4.5. Алгоритм скользящего среднего

С целью исключения из сигнала низкочастотных колебаний можно применить к огибающей в каждом из каналов вместо стандартного низкочастотного фильтра метод скользящего среднего. При этом для наилучшего результата следует взять фильтр третьего порядка и выбирать его длину таким образом, чтобы она была кратна периоду частоты канала стимуляции. Для начала следует определить окно, по которому будет происходить усреднение (его ширину).

Функция, получаемая после преобразования, численно равна в каждой точке среднему значению исходной функции, рассчитанному по изначально заданному сглаживающему интервалу (количество значений исходной функции, взятых для вычисления). В результате исходные данные оказываются сглаженными, а приведенный алгоритм реализует фильтрацию огибающей.

Расчет значений для метода скользящего среднего ведется по формуле

$\bar {X}(k) = \frac{1}{n}\sum\limits_{t = k}^{n + k} {X(t)} ,$
где n – размер окна (период сглаживания), k – номер члена ряда, значение которого заменяется средним.

На рис. 9 изображена профильтрованная методом скользящего среднего третьего порядка огибающая 2, а также исходная огибающая 1, которую профильтровали. Следует заметить, что предварительно был вычислен модуль огибающей.

Рис. 9.

Огибающая (1) и сглаженная огибающая (2), полученная методом скользящего среднего в 10-м канале.

Также для сравнения был использован низкочастотный фильтр на 400 Гц [6].

Этот этап, как упоминалось выше, можно опустить и заменить единственной процедурой – алгоритмом Герцеля.

5. ОПРЕДЕЛЕНИЕ ЧАСТОТЫ СТИМУЛЯЦИИ ЭЛЕКТРОДОВ

Частота стимуляции – это количество полностью завершенных импульсов во всех каналах стимуляции на электродной матрице за секунду. Диапазон значений частоты стимуляции у разных производителей достаточно широк.

В качестве примера рассмотрим кохлеарный имплант HiRes™ Ultra Cochlear фирмы Advanced boinics. Из описания прибора можно узнать, что максимальная длительность импульса 229 мкс, максимальная частота стимуляции 83 кГц, 16 каналов. Предположим, что период стимуляции (включает в себя как положительный, так и отрицательный импульс) равен 192 мкс, тогда частота в отдельном канале ≈5.2 кГц, а общая 5.2 × 16 ≈ 83 кГц. Таким образом, предположение об определении частоты стимуляции подтверждается.

В данном приборе возможна реализация разных стратегий, в том числе виртуальные каналы (hiRes 120) или парная стимуляция в каждом канале (стратегия hiRes paired). Рассмотрим последнюю более подробно. Частота стимуляции для стратегий, использующих 8 и 16 каналов, приведена в табл. 2 [7].

Таблица 2.

Частота стимуляции в зависимости от количества каналов и типа стимуляции

Количество каналов Частота стимуляции на канал, импульсов/с Общая частота стимуляции, импульсов/с Тип стимуляции
16 5000 80 000 Парная
16 2500 40 000 Последовательная
8 5000 40 000 Последовательная
8 2500 20 000 Последовательная

Хотя в некоторых приборах частота стимуляции очень высокая, она не является решающим фактором качественной передачи звука, так как рефрактерный период не позволяет проводить эффективную стимуляцию с частотой, большей чем способны воспринимать нервные окончания. Это время для человека составляет порядка 500 мкс [8]. Также одновременная стимуляция нескольких зон при применении стратегии парной стимуляции вызывает перекрестное возбуждение нервных окончаний соседних зон, так как электродная матрица находится в токопроводящей жидкости, что не позволяет стимулировать исключительно одну зону.

Так в исследовании, проведенном на группе из 13 взрослых, сравнивающем парную и последовательную стимуляцию [7], было показано, что лучшие результаты обеспечивает стратегия последовательной стимуляции. Откуда также следует вывод, что частоты стимуляции 40 кГц вполне достаточно для качественного воспроизведения звука. Авторы исследования замечают, что более явные различия в восприятии между двумя стратегиями ощутимы в условиях присутствия фонового шума, что хорошо соотносится с реальными условиями.

Для ознакомления с различными производителями с.к.и. и их частотами стимуляции, которые они используют, приведена табл. 3 [9].

Таблица 3.

Характеристики с.к.и. для различных производителей [9]

Производитель, модель Med-El, SYNCHRONY 2 Nurotron, Venus AB HiRes, 90 K Nucleus, N6
Стратегия CIS CIS HiRes SPEAK
Частота стимуляции по всей электродной матрице, кГц 50 40 83 32
Число электродов 12 24 16 22

6. СТИМУЛЯЦИЯ С ИСПОЛЬЗОВАНИЕМ ВИРТУАЛЬНЫХ КАНАЛОВ

Наряду со стратегией CIS, где стимуляция строго последовательна, существует еще один интересный метод. Это техника, использующая виртуальные каналы и несколько источников, чтобы увеличить количество различных частот в передаваемом звуке. Какие электроды стимулировать выбирается в зависимости от громкости. Двумя импульсами стимулируются два прилежащих электрода. Пропорция тока, который пойдет на два соседних электрода, определяется так же соотношением громкости. Два наружных электрода используются в качестве заземления, направляя ток по внутренним электродам (два электрода генерируют один виртуальный канал). Виртуальные каналы возникают в результате смещения плотности тока на области между электродами, такое происходит при неравномерном распределении тока между электродами. Стимулируется участок улитки, находящийся между электродами, а соотношение подаваемых токов определяет место стимуляции.

Референсным электродом в нашем случае выступает корпус импланта. Если после выхода из стимулирующей зоны ток попадает на референсный электрод, то это монополярный режим стимуляции. Если ток выходит из одного электрода, а входит в соседний, то это биполярный режим.

7. ЗАКЛЮЧЕНИЕ

В разных странах, где еще нет национальной с.к.и., научные круги проводят работу в направлении разработки собственных стратегий стимуляции и приборов, чтобы операции по восстановлению слуха сделать доступнее. Так, командой университета UGR (University of Granada, Spain) разработана программа Cochlear Implant Simulation version 2.0, которая осуществляет симуляцию с.к.и. со стратегией CIS и представляет результаты обработки звука известными стратегиями [10]. Программа предоставляет возможность использовать для вычисления огибающей сигнала преобразование Гильберта либо выпрямление и фильтр нижних частот. Путем настройки различных параметров можно учесть взаимодействие соседних каналов, а также некоторые физиологические особенности пациента, выбрать количество каналов стимуляции и т.д. Мы же предоставляем открытый код программы на matlab (см. Приложение) собственной стратегии.

Первый блок разработанного алгоритма содержит фильтрацию полосовыми фильтрами, которые разделяют сигнал на 16 каналов. Этот этап используется также и в других уже известных стратегиях стимуляции. Фильтры убирают искажения и позволяют не использовать оконную функцию, за счет чего при расчете преобразования Фурье мы экономим вычислительные ресурсы. Второй блок, введенный нами, – рекурсивный алгоритм Герцеля, преимущество использования которого так же состоит в экономии ресурсов, затем следует нелинейное сжатие, фильтры нижних частот и, наконец, передача сигнала на электроды. На выходе возможно применение как последовательной, так и параллельной стимуляции.

Анализируя результаты моделирования, мы пришли к выводу, что, хотя преобразование Фурье с оконной функцией дает такой же результат, как и с применением полосовых фильтров, удобнее использовать полосовые фильтры без оконной функции. Это дает возможность использовать модифицированный (рекурсивный) алгоритм Герцеля для преобразования Фурье, благодаря которому можно значительно сократить количество проводимых вычислений. Поэтому самый оптимальный вариант – это применение б.и.х.-фильтров на входе и замена преобразования Фурье с оконной функцией на рекурсивный модифицированный алгоритм Герцеля. Также можно заключить, что алгоритм воспроизводит сигнал хорошего качества.

Таким образом, была разработана собственная стратегия стимуляции для с.к.и., оптимизирующая вычислительные затраты, используемые для обработки звука, и проведены обратное преобразование для сравнения исходного и восстановленного сигналов и оценки качества работы алгоритма на слух, а также моделирование работы алгоритма кодирования звука для с.к.и. в системе matlab. Мы получили возможность услышать как изменится звук после его обработки нашей стратегией стимуляции и пришли к выводу, что достигнуто качественное воспроизведение речи, но восприятие полной гаммы звуковых сигналов, например музыки и звуков природы, на данном этапе затруднительно. Поэтому дальнейшие исследования будут посвящены моделированию стратегии с применением виртуальных каналов для увеличения частотного разрешения слухового восприятия пациентам с с.к.и. при том же количестве физических каналов стимуляции.

Список литературы

  1. Новоселова С.М. // Записки научных семинаров ЛОМИ. Математические вопросы теории распространения волн. 1989. Т. 179. С. 128. http://www. mathnet.ru/php/archive.phtml?wshow=paper&jrnid=znsl&paperid=4697&option_lang=rus

  2. Choi C.T.M., Lee Y.-H. // Cochlear Implant Res. Updat. 2012. V. 2. № 2005. https://doi.org/10.5772/47983

  3. Choi C.T.M., Hsu C.H., Tsai W.Y., Hsuan Lee Yi // IFMBE Proceedings. 2009. C. 310. https://doi.org/10.1007/978-3-540-92841-6_76

  4. Пономарев В.А. //Цифровая обработка сигналов. 2014. № 1. С. 3.

  5. Оппенгейм А., Шафер Р. Цифровая обработка сигналов. М.: Техносфера, 2012.

  6. Swanson B.A. // PhD thesis. Faculty of Medicine, Dentistry & Health Sciences, Otolaryngology Eye and Ear Hospital, The University of Melbourne. 2008.

  7. Buechner A., Frohne-Buechner C., Stoever T., Gaertner L., Battmer R.-D., Lenarz T. // Otol. Neurotol. 2005. V. 26. № 5. P. 941. https://doi.org/10.1097/01.mao.0000185069.27705.f0

  8. Lai W. An NRT Cookbook: Guidelines for Making NRT Measurements. Zurich, Cochlear AG, 1999. https://www.uzh.ch/orl/Cookbook.pdf

  9. Zeng F.-G., Rebscher S., Qian-Jie Fu, Hongbin Chen, Xiaoan Sun, Li Yin, Lichuan Ping, Haihong Feng, Shiming Yang, Shusheng Gong, Beibei Yang, Hou-Yong Kang, Na Gao, Fanglu Chi // Hear. Res. 2015. V. 322. P. 188. https://doi.org/10.1016/j.heares.2014.09.013

  10. Angel de la Torre Vega, Marta Bastarrica Marti, Rafael de la Torre Vega, Manuel Sainz Quevedo. Cochlear Implant Simulation version 2.0 Description and usage of the program. http://www.ugr.es/~atv/web_ci_SIM/en /ci_sim_en.htm

Дополнительные материалы отсутствуют.