Физиология человека, 2022, T. 48, № 6, стр. 32-43

Слуховые вызванные потенциалы человека в условиях пространственной маскировки

Л. Б. Шестопалова 1***, Е. А. Петропавловская 1, Д. А. Саликова 1, В. В. Семенова 1, Н. И. Никитин 1

1 ФГБУН Институт физиологии имени И.П. Павлова РАН
Санкт-Петербург, Россия

* E-mail: shestopalovalb@infran.ru
** E-mail: shestolido@mail.ru

Поступила в редакцию 11.02.2022
После доработки 16.05.2022
Принята к публикации 27.05.2022

Полный текст (PDF)

Аннотация

Исследование посвящено изучению слуховых вызванных потенциалов (ВП) мозга человека в условиях пространственной маскировки при действии некоррелированных шумовых сигналов. Испытуемым (n = 18) в ходе записи электроэнцефалограммы (ЭЭГ) в условиях пассивного прослушивания предъявляли неподвижные тестовый сигнал и маскер, пространственное положение которых задавалось при помощи межушных различий стимуляции по интенсивности. Сигнал и маскер либо располагались в одной точке пространства, либо были разнесены на 90 и 180 град. Анализировали зависимость компонентов ВП от углового разнесения сигнала и маскера. Предъявление сигнала на фоне маскера приводило к заметному снижению амплитуды и увеличению латентности компонентов N1 и P2 по сравнению с его изолированным предъявлением. Пространственное освобождение от маскировки проявлялось в нарастании амплитуды и уменьшении латентности волн N1 и P2 при увеличении углового расстояния между сигналом и маскером от 0 до 90 град. Дальнейшее увеличение углового расстояния между латерализованным сигналом и маскером до 180 град не сопровождалось ростом уровня освобождения от маскировки. Амплитуда ВП оказалась более чувствительным показателем углового разнесения сигнала и маскера, чем латентность. Совокупность полученных результатов указывает на то, что механизмы пространственной маскировки функционируют уже на предсознательном этапе анализа сложных слуховых сцен.

Ключевые слова: ЭЭГ, вызванные потенциалы, локализация звука, маскировка.

Под пространственной слуховой маскировкой понимают ухудшение обнаружения или локализации источника звука в присутствии посторонних источников, выступающих в роли маскера. В настоящее время накоплен большой объем данных, характеризующих пространственную маскировку в условиях свободного звукового поля и при дихотическом предъявлении звуковых сигналов [1, 2]. К наиболее изученным явлениям относится пространственное освобождение от маскировки [3]. При дихотической звуковой стимуляции это явление представлено феноменом “бинаурального освобождения от маскировки”, или БОМ [2]. Величина БОМ определяется изменением порога обнаружения сигнала в зависимости от соотношения величин межушных различий стимуляции в сигнале и маскере. Чем сильнее различаются сигнал и маскер по этим величинам, тем больше значение БОМ. В условиях свободного звукового поля этому явлению соответствует эффект снижения уровня маскировки сигнала по мере увеличения углового расстояния между источниками сигнала и маскера.

Пространственная маскировка может проявляться не только в изменениях порога обнаружения, но и в пространственной различимости сигнала. Под действием маскера может снижаться дифференциальная чувствительность к межушным различиям по времени и интенсивности в тестовом сигнале [4], а также пространственная разрешающая способность слуха при одновременном предъявлении сигналов от пространственно разнесенных источников [5–8]. В любой экспериментальной парадигме остается неизменным основное свойство пространственной маскировки, а именно – ее усиление по мере пространственного сближения маскера и сигнала [1].

Несмотря на подробное изучение реакций мозга при локализации обособленных источников звука [2, 9, 10], а также эффектов маскировки в психофизических исследованиях и на уровне одиночных нейронов слуховой системы животных [2], проявления маскировки в слуховых вызванных потенциалах человека (ВП) остаются малоизученными. Первые исследования проявлений освобождения от маскировки в длиннолатентных слуховых ВП проводились с применением классического приема синфазной и противофазной бинауральной стимуляции при предъявлении сигнала или маскера. В этих работах было выявлено увеличение амплитуды комплекса N1P2 при противофазном включении сигнала по сравнению с его синфазным предъявлением [11–13]. Увеличение амплитуды комплекса N1P2 и уменьшение латентности компонента N1 наблюдалось также при диотическом (синфазном) предъявлении маскера и введении в тестовый сигнал межушной задержки 500 мкс по сравнению с предъявлением сигнала с нулевой задержкой [14].

Впоследствии в работах [15, 16] подробно анализировались параметры компонентов N1, P2, MMN, N2 и P3, полученные в активных и в пассивных условиях при маскировке слоговых стимулов широкополосным и низкочастотным шумом с разной полосой пропускания. По данным этих авторов, компонент N1 был в меньшей степени подвержен действию маскировки, чем остальные компоненты ВП, и кроме того, латентность ВП оказалась более чувствительным показателем маскировки, чем амплитуда. Иной результат получили C.J. Billings et al. [17] при анализе амплитуд, латентностей и площади под кривыми компонентов P1, N1, P2, и N2: наилучшими прогностическими параметрами осознанного восприятия речевых стимулов при маскировке шумом оказались амплитуда и латентность волны N1 в отведении Cz.

J. Lewald и S. Getzmann [18] исследовали динамику ВП, связанных с локализацией неречевых стимулов в тишине и при одновременном действии нескольких маскеров в горизонтальной плоскости. Локализация сигнала в условиях маскировки сопровождалась ростом амплитуды компонента P1, снижением N1 и увеличением N2, по сравнению с локализацией в тишине. Анализ источников генерации компонентов ВП показал усиление электрической активности в интервале компонента P1 в правых височно-теменных областях, включая слуховую кору, и ее последующее снижение. Фокус активности смещался от правой нижнетеменной доли (в интервале N1) к левой дорсо-фронтальной коре (в интервале N2d, N2 difference wave). При этом контралатеральный компонент N2ac (N2 anterior contralateral) отражал пространственную направленность внимания. Продолжение этого исследования с маскировкой речевых стимулов показало, что фокусировка внимания на тестовом сигнале отражается в компонентах N2ac и LPCpc (Late Positive posterior-contralateral) [19].

В работе [20] описано электрофизиологическое исследование маскировки речевых сигналов в условиях дихотической звуковой стимуляции. Анализ ВП и функциональных связей различных областей мозга убедительно продемонстрировал различия между нейрональными процессами, активизируемыми в условиях энергетической и информационной маскировки. Функциональные связи при энергетической маскировке были более выражены в нижнем α- и γ-диапазонах частот, а при информационной – в θ- и β-диапазонах. Таким образом, распознавание и локализация сигналов в условиях маскировки основывается на определенной последовательности электрических реакций в пределах специализированной кортикальной нейронной сети, обеспечивающей решение пространственной задачи в сложной акустической обстановке.

Большая часть упомянутых выше исследований были сосредоточены на эффектах маскировки, проявляющихся на этапе осознанного различения сигналов. Представленный в настоящей работе эксперимент нацелен на изучение нейрональных механизмов пространственной маскировки, действующих на самом раннем, предсознательном этапе обработки слуховой информации. Как известно, активизация процессов, связанных с извлечением первичных признаков стимула и не требующих привлечения внимания, проявляется в длиннолатентных слуховых ВП приблизительно через 50 мс после слухового события [21]. Если механизмы пространственной маскировки начинают функционировать уже на предсознательном этапе восприятия, то можно ожидать значимого влияния маскировки на компоненты ВП в интервале 50–300 мс и, в первую очередь, на параметры волны N1.

В настоящем исследовании применялась парадигма пространственной маскировки взаимно некоррелированных шумовых сигналов в условиях пассивного прослушивания. Для того чтобы отделить реакцию на включение маскера от реакции на включение сигнала, начало сигнала было отсрочено относительно момента включения маскера. Сигнал и маскер были неподвижны, а их пространственное положение либо совпадало, либо отличалось на 90 или 180 град. В задачу исследования входило выяснение следующих вопросов: 1) какие из компонентов ВП демонстрируют зависимость от углового разнесения сигнала и маскера; 2) какая характеристика ВП – амплитуда или латентность – сильнее отражает степень маскировки.

МЕТОДИКА

В экспериментах принимали участие 18 праворуких испытуемых (6 мужчин и 12 женщин) в возрасте от 18 до 45 лет (средний возраст 27.8 ± 1.4 лет) с нормальным слухом (по данным тональной аудиометрии) и без истории неврологических заболеваний (по отчетам испытуемых). Во время экспериментов испытуемые располагались в кресле внутри экранированной звукоизолированной камеры, и им дихотическим способом предъявляли звуковые сигналы. При этом вели запись электроэнцефалограммы (ЭЭГ). Во время звуковой стимуляции испытуемые читали про себя книгу по своему выбору. Чтение книги позволяет избежать синхронизации неконтролируемых движений глаз со звуковой стимуляцией и провести корректное удаление глазодвигательных артефактов из записи ЭЭГ.

Стимулы. Исходными сигналами служили два отрезка белого шума, синтезированные с частотой дискретизации 96 кГц и фильтрованные в полосе 200–10 000 Гц при помощи фильтра Баттерворта 20 порядка. Шумовые посылки, используемые в дальнейшем для создания тестового и маскирующего стимулов (сигнала и маскера, соответственно), были сгенерированы независимо, что обеспечивало отсутствие корреляции между ними. Предъявление некоррелированных маскера и сигнала моделирует результат интерференции звуковых волн двух различных источников в свободном звуковом поле (без учета отражений). Сигналы преобразовывали в аналоговую форму при помощи многоканальной аудиоплаты Gina24 (Echo Audio, США) и предъявляли дихотически с помощью звукоизлучателей Etymotic ER-2 (Etymotic Research Inc., США). Звуководы излучателей фиксировали в слуховых проходах с помощью ушных вставок, которые обеспечивали подавление внешних шумов на 30 дБ. Неравномерность амплитудно-частотных характеристик звукоизлучателей в диапазоне 0.1–10 кГц составляла ±3 дБ.

Пространственное положение всех стимулов задавали величиной межушных различий по интенсивности (ΔI) между бинаурально предъявляемыми сигналами. Предварительное тестирование показало, что при ΔI = ±10 дБ достигалась полная латерализация звукового образа, соответствующая его угловому смещению на ±90 град от средней линии головы.

В эксперименте использовали три типа маскеров, различавшихся только пространственным положением и условно обозначенных как левый, центральный и правый (рис. 1, А, Б). Центральным маскером служил стимул с ΔI = 0 дБ, вызывающий ощущение неподвижного звукового образа по средней линии головы. Левым и правым маскерами служили стимулы с ΔI = –10 и +10 дБ, соответственно, вызывающие ощущение неподвижного звукового образа, расположенного вблизи левого или правого уха.

Рис. 1.

Методика эксперимента. А – структура эпохи стимуляции. Серая и черная линии – стимулы с разной длительностью среднего фрагмента (он использован для других задач и в данной работе не рассматривается). Черными стрелками обозначены моменты включения тестового сигнала, анализируемые в работе. Два верхних ряда – примеры структуры сигналов в тишине, два нижних ряда – на фоне маскера. Схемы головы справа – расположение сигнала без маскера (кружки) или сигналов на фоне маскера (кружки и крестики). Б – варианты взаимного расположения сигнала и маскера: 0, 90, 180 град, а также положения сигнала без маскера (в тишине). Черный кружок – тестовый сигнал, крестик – маскер. В – электродный кластер. Пунктирная линия – группа из 24 электродов, по которой усредняли записи ЭЭГ.

Тестовые сигналы состояли из трех фрагментов, следующих друг за другом без паузы: 1) начального стационарного участка длительностью 1000 мс с постоянной величиной ΔI, равной 0 или ±10 дБ; 2) динамического участка длительностью 200 или 400 мс с линейным изменением ΔI (от 0 до ±10 и от ±10 до 0 дБ); 3) конечного стационарного участка длительностью 800 или 600 мс соответственно, с постоянной конечной величиной ΔI, равной ±10 или 0 дБ. Полная длительность тестового сигнала составляла 2000 мс.

В настоящей работе анализировали вызванные реакции только на включение начального (неподвижного) фрагмента тестового сигнала. Последующие фрагменты, начиная с участка с динамическим изменением ΔI, использовали для других задач. Поэтому в дальнейшем изложении тестовый сигнал будет представляться как неподвижный сигнал. На начальном участке стимула постоянная величина ΔI принимала значения 0, +10 или –10 дБ. Также как и в случае маскирующих сигналов, при предъявлении в тишине эти сигналы вызывали ощущение неподвижного звукового образа, расположенного либо у средней линии головы, либо вблизи левого или правого уха. В тексте тестовые сигналы обозначаются как центральный, левый и правый.

Тестовые стимулы предъявляли на фоне непрерывно звучащего маскера длительностью 9070 мс (рис. 1, А). Каждая эпоха содержала трехкратное повторение тестового стимула вместе с предваряющей его паузой 770 мс. Наличие паузы перед первым предъявлением тестового стимула в эпохе обеспечивало отставление реакции на сигнал от реакции на включение маскера. После третьего повторения тестового стимула следовала пауза 760 мс до окончания маскера. В условиях изолированного предъявления тестовых стимулов (в тишине, без маскера) временнáя структура эпохи стимуляции была точно такой же, как в условиях маскировки (рис. 1, А, вверху). Таким образом, полная длительность каждой эпохи стимуляции была одинаковой и составляла 9070 мс. Во избежание щелчков, огибающая маскеров и тестовых сигналов в начале и в конце нарастала и спадала в течение 10 мс как приподнятый косинус (raised cosine envelope). Длительность сигналов приведена без учета участков нарастания и спада огибающей.

Угловое расстояние между положениями тестового сигнала и маскера определяли разницей величин ΔI между ними, и составляло 0, 90 или 180 град (рис. 1, Б). Следует подчеркнуть, что в данной работе точные значения воспринимаемых угловых расстояний не оценивали, поэтому приведенные угловые величины в градусах нужно рассматривать как категориальную меру.

Процедура эксперимента. На предварительном этапе каждого эксперимента у всех испытуемых измеряли монауральные пороги слышимости с использованием шумовых посылок полосой 200–10 000 Гц и длительностью 700 мс. Разница порогов левого и правого уха не превышала 6 дБ. Далее устанавливали уровень интенсивности 45 дБ над порогом на обоих каналах, диотически предъявляли идентичные шумовые посылки и проводили коррекцию интенсивности в пределах 1–3 дБ таким образом, чтобы стимул располагался по средней линии головы. В дальнейшем интенсивность тестовых сигналов (без маскера) устанавливали на уровне 45 дБ над порогом слышимости испытуемого. Интенсивность маскера превышала тестовый стимул на 5 дБ. В условиях маскировки суммирование тестового сигнала (45 дБ) и маскера (50 дБ) соответствует увеличению общей интенсивности стимулов на 6 дБ.

Тип экспериментальной серии определяли пространственным положением маскера (центральный, левый, правый). Вид тестового стимула определяли характером изменения ΔI (и направлением движения звукового образа) в его среднем фрагменте (рис. 1). Все серии состояли из 8 видов стимулов: 4 вида стимулов без маскера (в соответствии с 4 видами динамических участков с изменением ΔI от 0 до ±10 и от ±10 до 0 дБ) и те же 4 вида в сочетании с маскером (центральным, левым или правым в разных сериях). В пределах одной серии эпохи стимуляции чередовались в квазислучайном порядке, причем эпохи без маскера повторялись по 3 раза, а эпохи с маскером – по 8 раз. Этим обеспечивалось уравнивание количества ответов для каждого вида стимулов, поскольку эпохи без маскера были одними и теми же в сериях с разным положением маскера. Межстимульный интервал от начала эпохи до начала следующей был фиксирован и составлял 10 000 мс, включая паузу 930 мс между окончанием одной эпохи и началом следующей. Серии каждого типа предъявляли минимум 4 раза каждому из испытуемых. Чередование серий было рандомизировано индивидуально и по всей группе. Каждый из видов эпох с маскером был предъявлен испытуемому минимум 32 раза, что соответствовало (с учетом трехкратного повторения стимулов) предъявлению 96 тестовых сигналов каждого вида. Запись одной серии продолжалась около 8 мин. Каждый испытуемый проходил эксперимент в течение трех дней с интервалом 1–2 нед.

Регистрация и обработка ЭЭГ. Регистрацию ЭЭГ проводили при помощи хлорсеребряных электродов, в 32 точках по международной системе 10–20, с заменой точек отведения PO3/PO4 на C5/C6. Дополнительные электроды располагали на мочках ушей. Горизонтальную и вертикальную электроокулограммы записывали при помощи электродов, установленных над правым глазом и под левым глазом, ближе к их внешнему краю. Активность регистрировали с помощью энцефалографа ActiveTwo (BIOSEMI, Голландия) и специально разработанной программы, обеспечивающей фильтрацию сигналов и запись на жесткий диск компьютера. ЭЭГ оцифровывали в полосе 0—102 Гц с частотой дискретизации 2048 Гц с последующим понижением до частоты 512 Гц.

Непрерывную запись ЭЭГ разбивали на эпохи длительностью 10 000 мс. Эпохи, содержащие нестереотипные артефакты, удаляли вручную на основе визуального поиска избыточных изменений потенциала в большинстве отведений (в среднем около 2% эпох). После этого вычисляли потенциал в каждом отведении относительно усредненного потенциала всех электродов, и фильтровали в диапазоне 0.5–45 Гц. Оставшиеся артефакты удаляли при помощи метода анализа независимых компонент (ICA), основанного на алгоритме infomax и реализованного в модуле EEGLab среды MATLAB [22] и оптимизированного для выявления глазодвигательных артефактов, морганий и нарушений контакта кожи с электродами. После устранения артефактов ЭЭГ восстанавливали, и в качестве референтного принимали усредненный потенциал электродов на мочках ушей. Затем проводили коррекцию ЭЭГ относительно базовой линии по предстимульному участку длительностью 930 мс перед началом маскера.

Анализ данных. Для получения ВП ЭЭГ дополнительно фильтровали в полосе 2–30 Гц. Записи ЭЭГ в каждом из 32 отведений усредняли отдельно по всем типам стимулов для каждого испытуемого. Для анализа эффектов пространственного положения маскера и сигнала индивидуальные записи ЭЭГ усредняли по группе 24 электродов (Fz, Cz, Fp1, AF3, F3, F7, FC1, FC5, C3, C5, T7, CP1, CP5, Fp2, AF4, F4, F8, FC2, FC6, C4, C6, T8, CP2 и CP6) (рис. 1, В). Для получения гранд-усредненных потенциалов проводили усреднение по группе в целом. В пределах каждой эпохи выделяли участки, соответствующие реакции на каждое из трех повторений тестового сигнала, и усредняли их между собой. Далее усредняли реакции на сигналы, содержавшие разные паттерны изменения ΔI во втором временнóм фрагменте (изменения ΔI в течение 200 или 400 мс) при совпадавшем первом, поскольку исследуемые в данной работе эффекты относились именно к начальному фрагменту сигнала (1000 мс). Также усредняли реакции на одинаковые стимулы в тишине, регистрируемые в качестве контроля в сериях с разным положением маскера. В результате были сформированы выборки участков ЭЭГ, содержавших ВП на левый, центральный и правый сигнал, звучащий в тишине либо на фоне левого, центрального или правого маскера. При получении ВП усредняли 394 ± ± 25 участков ЭЭГ для центральных сигналов и по 197 ± 12 участков ЭЭГ для левого и правого сигналов.

В реакции на включение маскера для каждого испытуемого измеряли пиковые латентности и средние амплитуды компонентов N1, P2 и N2 в окне шириной 50 мс, центрированном на соответствующем пике гранд-усредненного потенциала. Измеренные таким образом величины подвергали 1-факторному дисперсионному анализу (repeated measures ANOVA, rmANOVA) с фактором Маскер (левый, центральный, правый).

В реакции на тестовый сигнал также измеряли индивидуальные пиковые латентности и средние амплитуды компонентов N1, P2 и N2 в окне шириной 50 мс, центрированном на соответствующем пике гранд-усредненного потенциала. Измеренные величины подвергали 2-факторному дисперсионному анализу (repeated measures ANOVA, rmANOVA) с факторами Маскер (без маскера, левый, центральный, правый) и Сигнал (левый, центральный, правый). При отклонении данных от сферичности применяли поправку к степеням свободы Гринхауза-Гайссера. При проведении множественных сравнений применяли поправку Бонферрони. Все сравнения проводили с уровнем значимости p < 0.05.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

ВП в реакции на включение маскера слева, справа или по средней линии головы различались только по одному параметру, а именно – по амплитуде волны N1. Дисперсионный анализ средних амплитуд N1 ВП, усредненных по кластеру из 24 электродов, с фактором Маскер (левый, центральный, правый) показал значимость главного эффекта (F(1.93, 32.78) = 4.93, p < 0.05). Согласно попарным сравнениям, амплитуда N1 в реакции на левый и правый маскеры (2.4 ± 0.2 и 2.3 ± 0.2 мкВ, соответственно) была больше, чем в реакции на центральный маскер (2.1 ± 0.2 мкВ, p < 0.05). Все остальные параметры компонентов ВП в реакции на маскер не зависели от его пространственного положения (p > 0.05).

ВП в реакции на тестовый сигнал, предъявленный в тишине или на фоне маскера разной локализации, усредненные по группе из 24 электродов, приведены на рис. 2. Маскировка оказывала существенное влияние как на амплитуду, так и на латентность основных колебаний ВП. Компоненты N1, P2 и N2 в условиях маскировки развивались позже и достигали меньшей величины, чем в реакции на сигнал в тишине. Выраженность маскировки иллюстрируется зависимостью амплитуды и латентности компонентов ВП от углового расстояния между сигналом и маскером (рис. 3). В качестве показателя маскировки по вертикальной оси отложены усредненные по всей выборке (n = 18) амплитуды и латентности компонентов N1, P2 и N2. Самое сильное снижение ВП наблюдалось в тех пространственных комбинациях, в которых межушные различия ΔI в маскере и сигнале совпадали, т.е. при нулевом угловом разнесении маскера и сигнала. В этих ситуациях в реакции на левый и правый сигнал амплитуда N1 снижалась относительно ответа в тишине приблизительно от –2.2 до –0.7 мкВ, а в реакции на центральный сигнал от –1.9 до ‒0.3 мкВ. Амплитуда P2 снижалась от 2.7 до 0.4 мкВ в ответе на левый и правый сигнал, и до 0.2 мкВ в ответе на центральный сигнал. Увеличение латентности обоих компонентов было весьма значительным: порядка 50 мс для N1 и более 70 мс для P2 (рис. 2 и 3).

Рис. 2.

Гранд-усредненные вызванные потенциалы (n = 18) в реакции на включение тестового сигнала в тишине или на фоне маскера разной локализации. Кружки около схемы головы – положение тестового сигнала, крестики – положение маскера. Тонкая черная линия – сигнал без маскера, толстая черная линия – маскер у левого уха, пунктирная черная линия – маскер по центру головы, толстая серая линия – маскер у правого уха.

Рис. 3.

Зависимость амплитуды и латентности компонентов вызванных потенциалов (ВП) (n = 18) от углового расстояния между сигналом и маскером. А – амплитуды компонентов ВП (мкВ), Б – латентности (мс). По оси абсцисс – сочетания взаимного расположения сигнала и маскера. Рядам соответствуют положения тестового сигнала слева, справа и по центру. Черная линия – компонент N1, светло-серая – компонент P2, темно-серая – компонент N2. Пунктир – недостоверные различия (p > 0.05) между значениями соседних точек, сплошные линии – достоверные различия (p < 0.05).

Дисперсионный анализ (rmANOVA) средних амплитуд компонентов N1, P2 и N2 (Маскер (без маскера, левый, центральный, правый) $ \times $ Сигнал (левый, центральный, правый)) выявил для всех трех компонентов ВП высокую значимость главных эффектов Маскера (N1: F(1.39, 23.55) = 36.68, P2: F(1.67, 28.39) = 100.13, N2: F(2.14, 36.39) = = 15.44, p < 0.001 для всех) и Сигнала (N1: F(1.70, 28.83) = 39.58, p < 0.001, P2: F(1.64, 27.95) = 19.08, p < 0.001, N2: F(1.57, 26.64) = 4.31, p < 0.05), а также их взаимодействия (N1: F(1.88, 31.95) = 38.79, P2: F(2.56, 43.50) = 66.16, N2: F(4.11, 69.83) = 9.34, p < < 0.001 для всех). Аналогичный анализ пиковых латентностей N1, P2 и N2 выявил для всех трех компонентов высокую значимость главных эффектов Маскера (N1: F(2.44, 41.49) = 52.43, P2: F(2.31, 39.34) = 123.94, N2: F(2.40, 40.85) = 23.29, p < 0.001 для всех) и Сигнала (N1: F(1.77, 30.07) = = 6.02, p < 0.01, P2: F(1.98, 33.68) = 14.83, p < 0.001, N2: F(1.96, 33.23) = 87.13, p < 0.001), а также их взаимодействия (N1: F(1.98, 33.66) = 9.22, P2: F(3.67, 62.46) = 24.79, N2: F(4.12, 69.95) = 6.37, p < 0.001 для всех).

Результаты попарных сравнений rmANOVA для амплитуд и латентностей показаны видом штриховки линий на рис. 3: сплошные линии указывают на достоверные различия (p < 0.05) в степени маскировки между соседними комбинациями сигнала и маскера, а пунктирные отрезки соответствуют отсутствию достоверных различий (p > > 0.05). Эффект маскировки, выражающийся в подавлении ответа и увеличении его латентности при действии маскера, оказался значимым для компонентов N1 и P2, но менее значимым для волны N2. Важный результат сравнений, отразившийся в значимых взаимодействиях, состоял также в том, что степень маскировки латерализованных сигналов в большинстве случаев была статистически неразличимой при угловых расстояниях маскер-сигнал 90 и 180 град, а также при действии левого и правого маскера на центральный сигнал (p > 0.05). Иными словами, увеличение углового расстояния с 90 до 180 град не приводило к дополнительному освобождению от маскировки. Освобождение от маскировки было значимым при увеличении углового расстояния маскер-сигнал от 0 до 90 град. Оно проявлялось в достоверном росте амплитуды всех компонентов и уменьшении латентности волны N1 в реакции на правый сигнал, а также латентности волны P2 в реакции на центральный и левый сигналы (p < < 0.05).

Для того чтобы продемонстрировать влияние маскировки на компоненты вызванных ответов, были вычислены разностные кривые вида “ВП без маскера минус ВП с маскером” для каждого из экспериментальных условий (рис. 4). Разностные кривые можно рассматривать как показатель той части активности, которая в условиях маскировки подавлена, либо запаздывает по сравнению с ответом в тишине. В разностных кривых отчетливо выделяются компоненты N1d и P2d (N1 difference и P2 difference соответственно), причем компонент N2d в разностных кривых выражен значительно заметнее, чем N2 в исходных кривых. Пространственное распределение амплитуд разностного ответа оставалось фронто-центральным на всем его протяжении: фокус активности охватывал область отведений Fz, Cz, FC1 и FC2.

Рис. 4.

Гранд-усредненные разностные потенциалы (“ВП без маскера минус ВП с маскером”, n = 18). ВП – вызванные потенциалы. N2d – негативное отклонение разностного потенциала в интервале волны N2 (N2 difference wave). Остальные обозначения см. рис. 2.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Исследовалось влияние пространственной маскировки на амплитуду и латентность основных компонентов слуховых ВП, регистрируемых при пассивном прослушивании, без привлечения внимания к звуковой стимуляции. Согласно полученным результатам, на этапе предсознательного различения сигнала происходит подавление и запаздывание ВП в реакции на маскированный сигнал относительно ответа в тишине.

Влияние маскировки на компоненты N1 и P2. В широком временнóм интервале от 90 до 300 мс наблюдалось увеличение латентности и снижение амплитуды ВП по сравнению с ответом в тишине. В отношении комплекса N1P2 этот результат можно считать ожидаемым, поскольку предъявление сигнала на фоне уже звучащего маскера увеличивает общую интенсивность стимуляции всего на 6 дБ, и данное слуховое событие закономерно вызывает меньшую реакцию, чем включение сигнала интенсивностью 45 дБ в тишине. Как известно, при предъявлении звуковых стимулов на фоне шума амплитуда и латентность ВП зависят не столько от абсолютной интенсивности стимула, сколько от соотношения сигнал-шум (signal to noise ratio, SNR) [23]. В недавней работе [24] было показано, что амплитуда комплекса N1P2 слуховых ВП зависит только от разности уровней звуковой стимуляции в момент ее изменения, а зависимость от абсолютных значений уровня звукового стимула наблюдалась только для позднего компонента ВП во временнóм диапазоне 370–430 мс. В работе [18] также наблюдалось подавление компонентов N1 и P2 при маскировке, но оно не сопровождалось их запаздыванием, наоборот, латентность этих волн становилась меньше в условиях маскировки. Это расхождение вероятно связано с методическими различиями в исследованиях. В цитированной работе маскер и сигнал включались строго одновременно, а само исследование проведено в условиях активной локализации тестового сигнала.

Основной результат нашего исследования состоит в том, что были обнаружены проявления пространственного освобождения от маскировки в амплитуде и латентности компонентов N1 и P2 при систематическом изменении взаимного расположения сигнала и маскера. Аналогичные эффекты при латерализации сигнала относительно маскера описаны в работах [2, 14]. Как и у этих авторов, в настоящем исследовании самое сильное подавление вызванного ответа происходило при совпадении пространственного положения сигнала и маскера, т.е. при их расположении в одном и том же месте субъективного слухового пространства. Максимальная маскировка наблюдалась независимо от того, где находились маскер и сигнал: слева, справа или у средней линии головы (угловое расстояние между сигналом и маскером 0 град, рис. 1 и 3). Разнесение сигнала и маскера на 90 град во всех сочетаниях приводило к эффекту освобождения от маскировки, выражавшемуся в частичном восстановлении амплитуды N1 и P2 по сравнению с совпадающим положением сигнала и маскера. Важно заметить, что восстановление амплитуды N1 и P2 при увеличении углового расстояния от 0 до 90 град было статистически достоверным во всех сочетаниях, тогда как сокращение их латентности достигало уровня значимости только в половине случаев (рис. 3, пунктир). Следовательно, амплитуда ВП оказалась более чувствительной к разнесению сигнала и маскера на 90 град, чем латентность.

Примечательно, что дальнейшее увеличение углового расстояния между латерализованным сигналом и маскером от 90 до 180 град не сопровождалось дальнейшим снижением уровня маскировки: амплитуда и латентность N1 и P2 не изменялись (рис. 3, левая часть). Постоянство уровня маскировки при больших угловых расстояниях было ранее описано в психофизическом исследовании различения тональных сигналов на фоне шума [25]. Механизм этого явления пока не ясен. Согласно нашим данным, маскер, расположенный по центру головы, вызывает меньший ответ по сравнению с его боковым положением. При расположении сигнала около левого или правого уха, угловое расстояние 90 град подразумевает действие именно центрального маскера. Вполне возможно, что различия в эффективности маскера могут приводить к выравниванию уровней маскировки, когда сигнал, латерализованный на одной стороне, сочетается с маскером, расположенным в центре и на противоположной стороне головы. Выраженное освобождение от маскировки при разнесении на 90 град может вызываться совместным действием двух факторов: увеличения расстояния от маскера до сигнала и уменьшения эффективности центрального маскера по сравнению с латеральным.

Однако предположение о большей эффективности латерализованного маскера основано на различиях ответов на маскер в интервале волны N1, тогда как постоянство уровня маскировки при переходе от 90 к 180 град наблюдается также и для амплитуды P2. Скорее всего, пространственный фактор освобождения от маскировки имеет в своей основе совокупность процессов, разделение которых потребует дополнительных исследований.

Влияние маскировки на компонент N2. Компонент N2 обсуждается в литературе преимущественно в связи с процессами нисходящего контроля (торможение реакции, конфликт реакций и мониторинг ошибок) и некоторыми аспектами внимания [26]. Так как внимание наших испытуемых было направлено на чтение книги, можно предположить, что предъявление сигнала в тишине вызывало непроизвольное переключение внимания и активацию механизмов торможения дальнейшей обработки нерелевантной сенсорной информации, что и отражалось в формировании волны N2 в реакции на сигнал в тишине. Появление же дополнительного сигнала на фоне маскера было значительно менее заметным событием, не требующим дополнительного торможения и вызывающим меньший компонент N2. Статистически значимые изменения величины N2 наблюдались в основном при максимальном подавлении ответа, наступавшем при совпадении положений сигнала и маскера (рис. 3). Только в случае центрального расположения сигнала было значимое различие амплитуды N2 при сравнении ответа в тишине и при действии маскера, отстоящего на 90 град от сигнала. В то же время при действии маскера любой локализации волна N2 развивалась позже, чем в тишине, причем запаздывание начиналось фактически уже на восходящей ветви компонента P2.

Запаздывание волны N2 нашло свое отражение и в разностном потенциале (рис. 4). Разностный компонент N2d отчетливо выражен и имеет пиковую латентность около 260 мс, что несколько меньше латентностей волны N2 в исходных ВП. Наличие отчетливого компонента N2d с латентностью 260 мс в разностном потенциале описано в работе [18]. Его появление авторы связывают с началом процессов различения тестового сигнала, звучащего на фоне нескольких маскеров, расположенных в горизонтальной плоскости. Обращает на себя внимание диаметральное расхождение между реакциями, полученными вблизи латентности 260 мс в нашей работе и в работе [18]. Сравнивая наше исследование и эту работу, необходимо учитывать упомянутые выше принципиальные методические отличия. Кроме того, в работе [18] вычисляли разностный потенциал как “ВП с маскером минус ВП без маскера” и получали ответ противоположной полярности по сравнению с приведенным на рис. 4. В соответствии с этим, полученный ими разностный потенциал отражал активность, которая прибавилась к исходному ответу при одновременном включении сигнала и маскера.

В нашем исследовании сигнал подавался на 770 мс позже маскера, чтобы отделить друг от друга ответы на сигнал и на маскер, а разностные кривые вычисляли как “ВП без маскера минус ВП с маскером”. Соответственно, разностные кривые являлись показателем той части активности, которая в условиях маскировки либо подавлена, либо запаздывает по сравнению с ответом в тишине. В частности, появление компонента N2d в разностной кривой обусловлено тем, что в ответе на стимул в тишине присутствовала волна N2, а в условиях маскировки ее практически не было.

ЗАКЛЮЧЕНИЕ

Пространственная маскировка сигналов в условиях пассивного прослушивания отражалась в характеристиках компонентов N1 и P2 ВП. Предъявление сигнала на фоне маскера приводило к заметному снижению амплитуды и увеличению латентности N1 и P2 по сравнению с его изолированным предъявлением. При этом амплитуда ВП оказалась более чувствительным показателем углового разнесения сигнала и маскера, чем латентность. Пространственное освобождение от маскировки проявлялось как рост амплитуды и уменьшение латентности волн N1 и P2 при увеличении углового расстояния между сигналом и маскером от 0 до 90 град. Дальнейшее увеличение углового расстояния между латерализованным сигналом и маскером (от 90 до 180 град) не сопровождалось нарастанием величины освобождения от маскировки. Совокупность полученных результатов указывает на то, что механизмы пространственной маскировки функционируют уже на предсознательном этапе анализа сложных слуховых сцен. Дальнейшие исследования маскировки могут быть направлены на раздельное изучение пространственных факторов, влияющих на суммарный ответ в интервалах волн N1 и P2.

Этические нормы. Все исследования проведены в соответствии с принципами биомедицинской этики, сформулированными в Хельсинкской декларации 1964 г. и ее последующих обновлениях, и одобрены локальным биоэтическим комитетом Санкт-Петербургского государственного университета (Санкт-Петербург).

Информированное согласие. Каждый участник исследования представил добровольное письменное информированное согласие, подписанное им после разъяснения ему потенциальных рисков и преимуществ, а также характера предстоящего исследования.

Финансирование работы. Работа выполнена при поддержке РНФ (грант № 22-25-00033).

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией данной статьи.

Список литературы

  1. Yost W.A. The cocktail party effect: 40 years later / Localization and Spatial Hearing in Real and Virtual Environments // Eds. Gilkey R., Anderson T. Erlbaum Press, Mahwah, NJ, 1997. P. 329.

  2. Альтман Я.А., Вайтулевич С.Ф. Слуховые вызванные потенциалы человека и локализация источника звука. СПб.: Наука, 1992. 136 с.

  3. Litovsky R.Y. Spatial release from masking // Acoust. Today. 2012. V. 8. P. 18.

  4. Альтман Я.А. Пространственный слух. СПб.: Институт физиологии им. И.П. Павлова РАН, 2011. 311 с.

  5. Perrott D.R. Concurent minimum audible angle: A reexamination of the concept of auditory spatial acuity // J. Accoust. Soc. Am. 1984. V. 75. № 4. P. 1201.

  6. Divenyi P.L., Oliver S.K. Resolution of steady-state sounds in simulated auditory space // J. Acoust. Soc. Am. 1989. V. 85. № 5. P. 2042.

  7. Yost W.A., Brown C.A. Localizing the sources of two independent noises: Role of time varying amplitude differences // J. Acoust. Soc. Am. 2013. V. 133. № 4. P. 2301.

  8. Best V., van Schaik A., Carlile S. Separation of concurrent broadband sound sources by human listeners // J. Acoust. Soc. Am. 2004. V. 115. № 1. P. 324.

  9. Salminen N.H., Tiitinen H., May P.J.C. Auditory Spatial Processing in the Human Cortex // Neuroscientist. 2012. V. 18. № 6. P. 602.

  10. Ahveninen J., Kopčo N., Jääskeläinen I.P. Psychophysics and neuronal bases of sound localization in humans // Hear. Res. 2014. V. 307. P. 86.

  11. Tanis D.C., Teas D.C. Evoked potential correlates of interaural phase reversals // Audiology. 1974. V. 13. № 5. P. 357.

  12. Edwards J.D., Henderson D., Nodar R.H. The averaged evoked response threshold for monaural and binaural masked signals // JASA. 1971. V. 49. P. 112.

  13. Yonovitz A., Thompson C.L., Lozar J. Masking level differences: auditory evoked responses with homophasic and antiphasic signal and noise // J. Speech Hear. Res. 1979. V. 22. № 2. P. 403.

  14. Вайтулевич С.Ф., Мальцева Н.В. Отражение бинаурального освобождения от маскировки в длиннолатентных слуховых вызванных потенциалах человека // Физиология человека. 1987. Т. 13. № 2. С. 196. Va$\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{\iota } $tulevich S.F., Mal’tseva N.F. [Reflection of the effect of binaural release from masking in human long-latency auditory evoked potentials] // Fiziologiia Cheloveka. 1987. V. 13. № 2. P. 196.

  15. Whiting K.A., Martin B.A., Stapells D.R. The Effects of Broadband Noise Masking on Cortical Event-Related Potentials to Speech Sounds /ba/ and /da/ // Ear Hear. 1998. V. 19. № 3. P. 218.

  16. Martin B.A., Stapells D.R. Effects of Low-Pass Noise Masking on Auditory Event-Related Potentials to Speech // Ear Hear. 2005. V. 26. № 2. P. 195.

  17. Billings C.J., McMillan G.P., Penman T.M., Gille S.M. Predicting perception in noise using cortical auditory evoked potentials // J. Assoc. Res. Otolaryngol. 2013. V. 14. № 6. P. 891.

  18. Lewald J., Getzmann S. Electrophysiological correlates of cocktail-party listening // Behav. Brain Res. 2015. V. 292. P. 157.

  19. Lewald J., Hanenberg C., Getzmann S. Brain correlates of the orientation of auditory spatial attention onto speaker location in a “cocktail-party” situation // Psychophysiology. 2016. V. 53. № 10. P. 1484.

  20. Atienza M., Cantero J.L., Escera C. Auditory information processing during human sleep as revealed by event-related brain potentials // Clin. Neurophysiol. 2001. V. 112. № 11. P. 2031.

  21. Szalárdy O., Tóth B., Farkas D. et al. Neuronal correlates of informational and energetic masking in the human brain in a multi-talker situation // Front. Psychol. 2019. V. 10. P. 786.

  22. Delorme A., Sejnowski T., Makeig S. Enhanced detection of artifacts in EEG data using higher-order statistics and independent component analysis // Neuroimage. 2007. V. 34. № 4. P. 1443.

  23. Billings C.J., Tremblay K.L., Stecker G.C., Tolin W.M. Human evoked cortical activity to signal-to-noise ratio and absolute signal level // Hear Res. 2009. V. 254. № 1–2. P. 15.

  24. Somervail R., Zhang F., Novembre G. et al. Waves of change: brain sensitivity to differential, not absolute, stimulus intensity is conserved across humans and rats // Cereb. Cortex. 2021. V. 31. № 2. P. 949.

  25. Ebata M., Sone T., Nimura T. Improvement of Hearing Ability by Directional Information // J. Acoust. Soc. Am. 1968. V. 43. № 2. P. 289.

  26. Folstein J.R., Van Petten C. Influence of cognitive control and mismatch on the N2 component of the ERP: a review // Psychophysiology. 2008. V. 45. № 1. P. 1520.

Дополнительные материалы отсутствуют.