Физиология человека, 2022, T. 48, № 4, стр. 57-68

Латентность вызванного потенциала как показатель интегрирования акустической информации о движении звука

В. В. Семенова 1***, Л. Б. Шестопалова 1, Е. А. Петропавловская 1, Д. А. Саликова 1, Н. И. Никитин 1

1 ФГБУН Институт физиологии имени И.П. Павлова РАН
Санкт-Петербург, Россия

* E-mail: semenovavv@infran.ru
** E-mail: irvama@gmail.com

Поступила в редакцию 15.11.2021
После доработки 15.03.2022
Принята к публикации 18.03.2022

Полный текст (PDF)

Аннотация

Исследовались характеристики специфического электрофизиологического ответа на начало движения звукового стимула (motion-onset response, MOR). Праворуким испытуемым дихотически предъявляли стимулы с отсроченным началом движения, используя линейное нарастание межушной задержки для создания эффекта движения. Были измерены амплитуда и латентность компонентов вызванных потенциалов cN1 и cP2 в широком диапазоне скоростей. Показано, что латентность компонента cN1 линейно возрастает с увеличением времени смещения стимула на градус азимута, тогда как латентность cP2 остается практически постоянной. Временнóй интервал, характеризующий окно интеграции движущихся стимулов, составил приблизительно 140–180 мс. Латентность cN1 можно рассматривать в качестве основного электрофизиологического коррелята процессов интеграции информации о движении звука как отдельном слуховом событии.

Ключевые слова: пространственный слух, движение звукового стимула, вызванные потенциалы, motion onset response (MOR).

Восприятие человеком движущихся источников звука остается предметом многочисленных нейрофизиологических исследований. В течение многих лет чувствительность слуховой системы человека к движению звуковых стимулов изучалась в основном психофизическими методами. Показателем пространственной разрешающей способности слуха для неподвижных сигналов служит минимальный различимый угол (minimum audible angle, MAA), а для движущихся – минимальный различимый угол движения (minimum audible movement angle, MAMA). С ростом скорости движения стимула MAMA линейно возрастает, при этом время обнаружения движения источника звука, определяемое как время достижения MAMA, с увеличением скорости сокращается [15]. В основе ухудшения пространственного различения с ростом скорости стимула лежит ее инерционность, т.е. свойство обнаруживать смещение источника звука не мгновенно, а лишь по прошествии некоторого промежутка времени, необходимого для интеграции акустической информации. Имеющиеся в литературе значения времени интеграции для слуховой системы человека варьируют в широких пределах в зависимости от способа его оценки и от вида звуковой стимуляции. При изучении граничных условий возникновения ощущения движения в условиях дихотической стимуляции время интеграции составляло 80–150 мс [4, 6]. При определении пространственной разрешающей способности слуха (МАМА) в свободном звуковом поле этот временнóй промежуток достигал нескольких сотен миллисекунд [3, 7].

Изучение нейрональных механизмов слуховой обработки движущихся стимулов путем анализа электроэнцефалограммы (ЭЭГ), в том числе слуховых вызванных потенциалов, позволяет получить новую информацию относительно временны́х характеристик реакции на движение. Чтобы исследовать ответ на движение (motion-onset response, MOR) отдельно от неспецифического ответа на включение звука, используют прием разнесения во времени момента включения стимула и начала его движения (т. н. парадигма отсроченного движения). Ответ на начало движения состоит из раннего негативного (cN1) и последующего позитивного компонентов (cP2), и рассматривается в качестве электрофизиологического коррелята процесса локализации движущегося стимула [810]. Потенциал MOR имеет большую латентность, чем ответ на включение (не менее 140 мс после начала движения), и локализован преимущественно в полушарии, контралатеральном направлению движения звука [11]. Влияние скорости стимула на параметры MOR было описано в работах S. Getzmann и S. Getzmann, J. Lewald, а также в нашем предыдущем исследовании [10, 12, 13]. Установлено, что амплитуда компонентов cN1 и cP2 монотонно увеличивается с ростом скорости движения, а их латентность уменьшается.

Соответствие между психофизическими и электрофизиологическими временны́ми показателями процесса локализации движущихся стимулов изучено недостаточно подробно. Первоначально исследования на эту тему были проведены в области зрительного восприятия, где была показана взаимосвязь между характеристиками зрительных вызванных ответов на начало движения стимула и параллельными психофизическими измерениями [14]. Авторам удалось продемонстрировать одинаковую зависимость латентности вызванного потенциала и времени реакции от когерентности стимула, моделировавшей степень его пространственной динамики. Впоследствии было показано, что латентность зрительного вызванного ответа на начало движения и время реакции уменьшаются с ростом скорости движения, причем оба показателя могут быть аппроксимированы одной и той же отрицательной степенной функцией [15]. Авторы высказали предположение, что обнаружение движения происходит после того, как вызванный ответ достигает определенной критической величины.

Исследования локализации звуковых стимулов показали, что характеристики потенциала MOR также тесно коррелируют со временем реакции при субъективном различении движущихся сигналов [10, 16]. В нашей недавней работе, выполненной психофизическим методом с использованием отсроченного движения, было показано, что время обнаружения движения является линейной функцией от времени смещения стимула на градус азимута [5]. На основании имеющихся данных можно предположить, что латентность MOR может быть объективным показателем процесса временнóй интеграции пространственной информации в слуховой системе при движении источника звука. Если латентность MOR линейно зависит от времени смещения на градус, как и время обнаружения движения, это будет аргументом в пользу данной гипотезы.

Насколько известно из литературы, потенциал MOR регистрируется при движении стимула со скоростями не ниже 60 град/с [9, 10, 12, 1620], тогда как на психофизическом уровне человек способен различать гораздо более медленное движение [2, 2127]. Мы предполагаем, что это расхождение может объясняться соотношением временнóго интервала, который требуется для формирования вызванного ответа, и времени, за которое движущийся звуковой стимул смещается на минимально различимый угол (MAМA).

Таким образом, цель настоящего исследования – определить временнóй интервал, характеризующий процесс интеграции пространственной информации при генерации MOR. Исследовалась зависимость компонентов потенциала MOR от скорости движения звуковых стимулов, создаваемых за счет изменения межушной задержки.

Задачи работы состояли в определении граничных условий формирования MOR при измерении амплитуды и латентности компонентов cN1 и cP2 в широком диапазоне скоростей, в том числе при минимальной скорости, позволяющей достоверно идентифицировать MOR, а также установить зависимость латентности MOR от времени смещения стимула на градус азимута.

МЕТОДИКА

Условия эксперимента и испытуемые. В экспериментах принимали участие 13 праворуких испытуемых с нормальным слухом в возрасте от 19 до 41 г. (средний возраст 26.1 ± 1.8 лет, 2 мужчин и 11 женщин).

До начала экспериментов все испытуемые прошли стандартную процедуру аудиометрии. Испытуемые располагались в кресле внутри экранированной звукоизолированной камеры. Звуковые сигналы предъявляли испытуемым дихотическим способом; при этом испытуемые читали книгу по своему выбору.

Стимулы. Дихотические звуковые сигналы предъявляли с помощью звукоизлучателей Etymotic ER-2 (Etymotic Research Inc., США). Звуководы излучателей фиксировали в слуховых проходах с помощью ушных вставок, которые обеспечивали подавление внешних шумов на 30 дБ. Неравномерность амплитудно-частотных характеристик звукоизлучателей в диапазоне 0.1–10 кГц составляла ±3 дБ. Интенсивность звуковых сигналов устанавливали на уровне 50 дБ над порогом слышимости испытуемого. Сигналами служили отрезки белого шума полосой 100–1300 Гц, синтезированные цифровым способом с частотой дискретизации 96 кГц. Сигналы преобразовывались в аналоговую форму при помощи многоканальной звуковой карты Gina24 (Echo Audio, США). Длительность всех звуковых посылок составляла 2000 мс, не считая фронтов нарастания и спада длительностью по 10 мс, сглаженных косинусоидальной функцией.

Пространственное положение сигналов задавалось величиной межушной задержки (ΔT) между бинаурально предъявляемыми сигналами. Стимулы синтезировали на основе одного и того же исходного сигнала путем линейного сдвига отсчетов на участке движения в соответствии с заданной величиной ΔT. Затем производили передискретизацию и сплайн-интерполяцию отсчетов. Для создания эффекта движения на одно из ушей подавали преобразованный сигнал, а на другое – исходный сигнал.

Движущиеся стимулы состояли из трех последовательных участков: начального участка с нулевой межушной задержкой длительностью 1000 мс, последующего участка линейного нарастания межушной задержки от 0 до ±800 мкс длительностью 250, 375, 600 или 1000 мс, и конечного участка с постоянной межушной задержкой ΔT = = ±800 мкс, длящийся до окончания сигнала общей длительностью 2000 мс (рис. 1). В случае самого медленного нарастания ΔT в течение 1000 мс конечный стационарный фрагмент отсутствовал. Данные стимулы вызывали сначала ощущение неподвижного звукового образа по средней линии головы, а затем плавного движения звукового образа влево или вправо от средней линии головы. Расчетные угловые скорости движения стимулов, вычисленные на основе соотношения “800 мкс ↔ 90°”, составили 360, 240, 150 и 90 град/с соответственно. Такое соотношение использовали в связи с тем, что ΔT = 800 мкс обеспечивает полную латерализацию звукового сигнала у большинства испытуемых [4]. Помимо движущихся стимулов, в эксперименте также использовали неподвижный стимул с ΔT = 0 мкс, вызывающий ощущение локализации звукового образа по средней линии головы.

Рис. 1.

Вызванные потенциалы в парадигме отсроченного движения. А – схематическое представление звуковых стимулов, моделирующих движение звука за счет изменений межушной задержки (ΔT). Б – гранд-усредненные вызванные ответы (motion onset response, MOR) на начало движения стимула (N = 13). По оси абсцисс – время от момента начала движения. а – 360 град/с, б – 240 град/с, в – 150 град/с, г – 90 град/с, д – неподвижный стимул.

Процедура эксперимента. На предварительном этапе каждого эксперимента у всех испытуемых измеряли пороги слышимости обоих ушей. Интенсивность сигналов устанавливали на уровне 50 дБ над порогом слышимости каждого уха испытуемого. Все серии, составленные для 4 разных скоростей движения, состояли из 120 стимулов, из которых 40 были неподвижными, а 40 левосторонних и 40 правосторонних перемещали влево или вправо от средней линии головы в квазислучайном порядке. В пределах одной серии использовали только одну скорость движения, серии с разными скоростями движения стимула предъявляли также в квазислучайном порядке.

Сигналы предъявляли с интервалом 4000 мс. Каждый цикл предъявления состоял из предстимульной паузы длительностью 1000 мс, сигнала длительностью 2000 мс (варианты описаны выше) и постстимульной паузы длительностью 1000 мс. Длительность каждой серии составляла 8 мин. Через каждые 25–30 мин слушателю предоставляли перерыв. Серии с каждой из скоростей движения повторяли по шесть раз, так что для каждого из экспериментальных условий накапливалось 240 предъявлений.

Регистрация ЭЭГ. Регистрацию ЭЭГ проводили при помощи хлорсеребряных электродов, в 32 точках по международной системе 10–20, с заменой точек отведения PO3/PO4 на C5/C6. Дополнительные (вне шлема) электроды располагали на мочках ушей и на носу. Горизонтальную и вертикальную электроокулограммы регистрировали электродами, установленными над правым глазом и под левым глазом. Регистрацию ЭЭГ осуществляли с помощью цифрового энцефалографа (Active Two, BIOSEMI, Голландия) и специально разработанной программы, обеспечивающей фильтрацию сигналов и запись на жесткий диск компьютера. ЭЭГ оцифровывали в полосе 0–102 Гц с частотой дискретизации 2048 Гц. Затем частоту дискретизации понижали до 512 Гц для уменьшения объема данных.

Анализ данных. Непрерывную запись ЭЭГ разбивали на эпохи длительностью 4000 мс. Эпохи, содержащие нестереотипные артефакты, удаляли вручную на основе визуального поиска избыточных изменений потенциала на нескольких каналах (в среднем около 2% эпох). После этого вычисляли потенциал на каждом канале относительно усредненного потенциала всех электродов, и фильтровали в полосе 0.5–45 Гц. Затем проводили коррекцию ЭЭГ относительно базовой линии по предстимульному участку длительностью 1000 мс. Оставшиеся артефакты удаляли при помощи метода анализа независимых компонент (ICA), основанного на алгоритме infomax и реализованного в модуле EEGLab среды MATLAB [28]. Алгоритм оптимизирован для выявления движений глаз, морганий и нарушений контакта кожи с электродами. После устранения артефактов ЭЭГ восстанавливали. В качестве референтного служил усредненный потенциал электродов на мочках ушей. Для получения вызванных потенциалов ЭЭГ дополнительно фильтровали в полосе 2–30 Гц. Затем проводили коррекцию ЭЭГ относительно базовой линии по участку длительностью 200 мс перед началом движения. В среднем для каждого испытуемого в каждом из условий было отобрано приблизительно одинаковое количество эпох (235 ± 1), пригодных к последующему анализу.

Записи ЭЭГ в каждом из 32 каналов усредняли отдельно по каждому типу стимулов для каждого испытуемого. Затем индивидуальные записи ЭЭГ усредняли по 24 фронто-центральным электродам (Fz, Cz, Fp1, AF3, F3, F7, FC1, FC5, C3, C5, T7, CP1, CP5, Fp2, AF4, F4, F8, FC2, FC6, C4, C6, T8, CP2, CP6), а также по всей группе испытуемых для получения гранд-усредненных потенциалов. Для оценки реакции на начало движения звука измеряли индивидуальные величины пиковых латентностей и средних амплитуд MOR в окне шириной 50 мс, центрированном на пиках компонентов cN1 и cP2 гранд-усредненного потенциала.

Измеренные таким образом величины подвергали предварительному дисперсионному анализу с целью оценки влияния направления движения. Индивидуальные средние величины MOR (N = 13) сравнивали при помощи 2-факторного дисперсионного анализа (repeated measures ANOVA, rmANOVA) с факторами “Скорость” (90, 150, 240 и 360 град/с) и “Направление” (влево, вправо). Фактор “Направление” не оказал значимого влияния на исследуемые переменные, поэтому реакции на левосторонние и правосторонние стимулы объединяли. Окончательные сравнения были проведены с помощью однофакторного дисперсионного анализа (rmANOVA) с фактором “Скорость” (90, 150, 240 и 360 град/с). При отклонении данных от сферичности применяли поправку к степеням свободы Гринхауза-Гайссера. При проведении множественных сравнений применяли поправку Бонферрони. Все сравнения проводили с уровнем значимости p < 0.05.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Звуковая стимуляция вызывала два раздельных ответа на включение стимула и на его движение. Ответы на включение звука состояли из классических негативного и позитивного компонентов N1 и P2. Реакция на начало движения стимула (MOR) состояла из негативного компонента cN1 и позитивного компонента cP2. Реакция на движение стимула была получена для скоростей движения звукового стимула 90, 150, 240 и 380 град/с.

Амплитуда и латентность компонентов потенциала MOR обладали выраженной зависимостью от скорости движения стимула (рис. 1, табл. 1), что соответствует литературным данным [10, 29]. Достоверность формирования MOR в каждом из экспериментальных условий подтверждали при помощи одностороннего t-теста относительно нуля для выборок индивидуальных средних значений (N = 13) амплитуды MOR в окне шириной 50 мс, центрированном на пике гранд-усредненной кривой. При скоростях движения 150, 240 и 360 град/с MOR был идентифицирован с высокой значимостью (p < 0.001), а при движении стимула со скоростью 90 град/с получена только пограничная значимость (p = 0.06).

Таблица 1.  

Пиковая латентность компонентов MOR и угловое смещение стимула за время, равное латентности пика волны cN1

Скорость, град/с Латентность cN1, мс Латентность cP2, мс Угловое смещение, град Латентность N1, мс
  90   208 ± 12  267 ± 11 10 ± 1 101 ± 4
150 180 ± 8 271 ± 8 12 ± 1 101 ± 5
240 161 ± 4 258 ± 7 14 ± 1 101 ± 5
360 155 ± 4 260 ± 6 20 ± 1 100 ± 5

Примечание: рядом со значениями указаны величины стандартных ошибок. В первом столбце указаны скорости движения стимула. В последнем столбце для сравнения приведены латентности компонента N1 вызванного потенциала (пояснения см. в тексте).

Дисперсионный анализ (rmANOVA, “Скорость”: 90, 150, 240 и 360 град/с) амплитуд компонентов cN1 и cP2 подтвердил значимый эффект скорости (F(2.09, 25.12) = 19.28, p < 0.001 для cN1 и F(2.75, 32.99) = 4.80, p < 0.01 для cP2). Последующие попарные сравнения реакций на соседние значения скоростей показали значимые различия только для компонента cN1 при скоростях 150 и 240 град/с (p < 0.01). Однако сравнение реакций на не соседние значения подтверждает достоверное увеличение амплитуды со скоростью на уровне значимости p < 0.05. Амплитуды волны cP2 значимо различались только при сравнении минимального и максимального значения (p < < 0.01). Зависимости величины компонентов MOR от скорости движения, приведенные на рис. 2, также иллюстрируют более сильное влияние скорости на cN1, чем на cP2.

Рис. 2.

Зависимость амплитуды компонентов MOR от скорости движения стимула. По оси абсцисс – расчетные величины скорости. Вертикальные черточки показывают стандартную ошибку среднего. Звездочками обозначены статистически значимые различия между соседними величинами амплитуд (** – p < 0.01).

Дисперсионный анализ (rmANOVA, “Скорость”: 90, 150, 240 и 360 град/с) пиковых латентностей компонентов cN1 и cP2 также выявил значимый эффект скорости (F(1.63, 19.60) = 10.27, p < < 0.01) для cN1, но не для cP2 (p > 0.05). Согласно попарным сравнениям, значимость эффекта скорости для латентности cN1 достигалась только при сравнении реакций на не соседние значения скоростей. Зависимости латентности компонентов MOR от скорости движения приведены на рис. 3 вместе с данными, имеющимися в литературе.

Рис. 3.

Латентность компонентов MOR как функция скорости движения стимула, по данным разных авторов. Стимулы перемещались влево или вправо от средней линии головы. Разными маркерами обозначены разные условия звуковой стимуляции. Ромбы – дихотическая стимуляция с межушными различиями по времени (ΔT) и/или интенсивности (ΔL), кружки – акустическая виртуальная реальность, крестики – свободное звуковое поле. Маркеры соединены сплошной линией в случаях, когда результаты получены в одной и той же работе. Пунктирные линии со стрелками – временнóе окно интеграции, измеренное по D.W. Chandler и D.W. Grantham, 1992 [3] (пояснения см. в тексте). 1 – данные настоящей работы (ΔT), 2 – S. Getzmann, J. Lewald, 2010 (ΔT) [16], 3 – S. Getzmann, J. Lewald, 2010 (ΔL) [16], 4 – C.F. Altmann et al., 2017 (ΔT и ΔL) [20], 5 – K. Krumbholz et al., 2007 (ΔT) [9], 6 – S. Getzmann, 2009 (HTRF) [10], 7 – S. Getzmann, J. Lewald, 2010 (HTRF) [16], 8 – R. Grzeschik et al., 2010 (HTRF) [17], 9 – S. Getzmann, J. Lewald, 2012 (свободное поле) [12], 10 – S. Getzmann, J. Lewald, 2010 (свободное поле) [16].

Так как латентность cP2 не зависела от скорости, все дальнейшие вычисления выполнялись на основании латентностей cN1.

Исходя из расчетных величин скорости, можно оценить величину углового смещения стимула от центрального положения по формуле (1). Чтобы отделить вклад процессов специализированного анализа динамических изменений от вклада процессов проведения информации от периферических рецепторов до слуховой коры, отражающихся в латентности волны N1, время смещения следует вычислять как разность латентностей компонентов cN1 и N1 (табл. 1).

(1)
$S = {{({\text{лат}}\,\,{\text{cN}}1 - {\text{лат}}\,\,{\text{N}}1){v})} \mathord{\left/ {\vphantom {{({\text{лат}}\,\,{\text{cN}}1 - {\text{лат}}\,\,{\text{N}}1){v})} {1000,}}} \right. \kern-0em} {1000,}}$
где S (град) – угловое смещение стимула, лат cN1 (мс) – пиковая латентность cN1, лат N1 (мс) – пиковая латентность N1, v (град/с) – скорость движения звукового стимула. Полученные для каждой скорости расчетные значения углового смещения приведены в табл. 1. Линейная зависимость смещения от скорости стимула проиллюстрирована на рис. 4. Наименьшее смещение, при котором возникал MOR, наблюдалось при наименьшей из использованных скорости движения (90 град/с) и составило 10 град.

Рис. 4.

Угловое смещение звуковых стимулов как функция скорости движения. Черные кружки с вертикальными черточками – величины смещения, рассчитанные на основе экспериментальных данных, и их стандартные ошибки. Уравнение выражает линейную аппроксимацию данных. Маркер в форме ромба показывает величину смещения, на 25% превосходящую минимальное значение, которая использована для определения окна интеграции (пояснения см. в тексте).

Для оценки оптимального времени интеграции при формировании MOR был использован алгоритм, описанный в работе D.W. Chandler и D.W Grantham и вычислено угловое смещение, на 25% превышающее минимальный сдвиг в 10° [3]. Оно составило 1.25 × 10° = 12°. Линейная связь углового смещения и скорости (рис. 4) позволяет вычислить скорость, соответствующую смещению стимула на 12°. Эта скорость составила 158 град/с. Соответствующая ей латентность cN1 может рассматриваться как оптимальное время обработки параметров движения стимула при формировании вызванного ответа на движение. Исходя из зависимости латентности от скорости, приведенной на рис. 3, можно оценить оптимальное время интеграции как, приблизительно, 180 мс после начала движения.

Далее для каждой скорости движения было вычислено время смещения стимула на один градус азимута t (мс/град) по формуле (2):

(2)
$t = {{1000} \mathord{\left/ {\vphantom {{1000} {{v},}}} \right. \kern-0em} {{v},}}$
где v (град/с) – скорость движения звукового стимула. Эти величины обратно пропорциональны скорости: чем выше скорость, тем меньше время, за которое стимул смещается на один градус. На рис. 5 представлена латентность компонентов MOR как функция времени смещения на градус. Зависимость латентности cN1 от времени смещения на градус оказалась практически строго линейной (линейная регрессия, R 2 = 1.0). Экстраполяция этой зависимости к нулю (свободный член уравнения регрессии, рис. 5) дает минимальную возможную латентность cN1, которая теоретически должна наблюдаться при мгновенном перемещении стимула. Данная величина, полученная по нашим экспериментальным данным, составила 136 мс.

Рис. 5.

Пиковая латентность компонентов MOR как функция времени смещения стимула на градус азимута. По оси абсцисс – время смещения стимула на один градус (мс), по оси ординат – пиковая латентность компонентов ВП на начало движения (мс). Вертикальные черточки показывают стандартную ошибку среднего. Уравнения выражают линейную аппроксимацию данных.

Латентность cP2 практически не зависела от времени смещения на градус. Линейная регрессия показала незначительный угол наклона и более низкий коэффициент детерминации, чем для cN1 (рис. 5, линейная регрессия, R 2 = 0.4).

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Характеристики MOR, полученные в настоящей работе, в целом соответствуют известным в литературе данным. Сопоставление результатов разных работ (рис. 3) показывает, что латентность обоих компонентов MOR сокращается с ростом скорости стимула, но у негативной волны cN1 этот эффект носит выраженный характер. При стимуляции в свободном звуковом поле или акустической виртуальной реальности латентности MOR оказываются несколько меньше, чем при использовании межушных различий по времени.

Временнóе окно интеграции. Важнейший теоретический вопрос состоит в том, каким образом на основании параметров потенциала MOR можно оценить временнóе окно, характеризующее интеграцию пространственной информации. Ощущение движения источника звука возникает при смещении источника на минимальный различимый угол. Как только это событие произошло, запускаются нейрональные процессы, аналогичные процессам генерации компонента N1 после включения стимула [30, 31]. В результате формируется волна cN1, латентность которой относительно момента старта движения оказывается существенно больше латентности компонента N1 относительно включения сигнала (табл. 1). Принципиально важный результат проведенного исследования состоит в том, что удалось уточнить характер зависимости латентности cN1 от скорости движения.

Связь временны́х характеристик восприятия со скоростью движения стимула носит фундаментальный характер. Результаты основополагающих работ, исследовавших восприятие движения звука психофизическими методами, свидетельствуют, что минимальная (пороговая) длительность стимула, достаточная для распознавания движения, связана со скоростью стимула убывающей функцией, близкой к гиперболе [2, 3, 27]. Аналогичная зависимость от скорости стимула была обнаружена при исследовании зрительного восприятия как для латентности вызванного ответа на начало движения, так и для времени реакции [15]. Наше недавнее психофизическое исследование не только подтвердило, что время обнаружения движения (время достижения МАМА) сокращается с ростом скорости движения звука, но и показало, что оно является линейной функцией времени смещения стимула на градус азимута [5]. Согласно результатам настоящей работы, латентность cN1 также линейно нарастает с увеличением времени смещения на градус, тогда как латентность cP2 остается практически постоянной (рис. 5), что подтверждается отсутствием статистически значимого эффекта скорости. Подтверждение линейной зависимости латентности cN1 от времени смещения стимула на градус азимута является принципиально важным результатом, указывающим на сходство механизмов обнаружения движения на предсознательном уровне (формирование волны cN1) и при осознанном различении (время достижения МАМА) [5]. Это позволяет рассматривать латентность cN1 в качестве основного электрофизиологического показателя интеграции динамической пространственной информации.

В пользу такого вывода свидетельствует и концепция поэтапной обработки движущихся звуковых стимулов, согласно которой анализ положения начальной точки траектории движения отражается, главным образом, в параметрах волны cN1, тогда как обработка информации о направлении движения (к центру или к периферии) длится дольше и проявляется в характеристиках позитивной волны cP2 [10, 11, 32, 33]. В то же время имеются экспериментальные свидетельства в пользу того, что формирование волны cN1 также связано с активацией источников потенциала, чувствительных к направлению движения стимула, наряду с популяциями нейронов, чувствительных к любым пространственным изменениям [19]. Кроме того, характеристики компонента cN1 практически не зависят от направленности внимания [34, 35]. Учитывая вышеизложенное, оценку временнóго окна, в котором интегрируется информация о параметрах движения, целесообразно производить на основании латентности компонента cN1.

Упомянутые выше линейные функции позволяют оценить минимальные значения временны́х показателей восприятия движения, получив свободный член уравнения регрессии. Этим способом в работе В.В. Семеновой и др. было определено время, необходимое для психофизического обнаружения мгновенного перемещения стимула [5]. Оно составило 10 мс и интерпретировалось как минимальное время интеграции высоких скоростей движения звука. Аналогичным образом, минимальная возможная латентность cN1, которая может наблюдаться при мгновенном перемещении стимула, определяется экстраполяцией к нулю линейной зависимости латентности cN1 от времени смещения на градус (рис. 5). Расчетная величина минимальной латентности составила 136 мс, что находится в полном соответствии с экспериментальными данными другой нашей работы по регистрации MOR, в которой использовалось мгновенное перемещение стимула [13]. Округляя эту величину, можно сделать следующее обобщение: характеристики компонента cN1 отражают интеграцию пространственной информации для высоких скоростей движения звука, которая происходит в течение 140 мс после начала движения.

Однако, помимо специализированного анализа динамических изменений, это время включает в себя неспецифические процессы проведения информации от периферических рецепторов до слуховой коры. По данным магнитоэнцефалографии (МЭГ), информация о самом отчетливом акустическом событии – включении сигнала – распространяется до разных областей слуховой коры за время от 20 до 80 мс [36]. Волна N1 с латентностью пика около 100 мс преимущественно отражает активацию planum temporale и определяется не характеристиками стимула, а наступлением нового слухового события [30]. Предполагая, что процесс распространения информации о событии вносит одинаковый вклад (порядка 100 мс) в латентность волн N1 и cN1, можно сделать вывод, что обработка движения требует дополнительно как минимум 40 мс. Эта величина находится в соответствии со временем запаздывания локализации, вычисленным по измерениям смещения воспринимаемого положения начальной точки траектории движения звука [37], а также с оптимальным временем интеграции пространственной информации, полученным в нашем психофизическом исследовании [5]. В последней работе было показано, что за время порядка 40 мс стимулы, движущиеся со скоростями от 90 град/с и выше, успевают сместиться на угловое расстояние, соответствующее МАМА для этих скоростей. При более медленном движении для достижения МАМА требуется более 40 мс.

D.W. Chandler и D.W Grantham предложили считать, что оптимальное время интеграции соответствует смещению стимула, на 25% превосходящему МАА [3]. Применив этот критерий и используя полученную в нашем эксперименте зависимость латентности cN1 от скорости (рис. 3), мы оценили время, в течение которого в основном завершается накопление информации о движении стимула при формировании MOR. Это временнóе окно составило приблизительно 180 мс после начала движения. Оценка направления движения продолжается на более позднем этапе и отражается в характеристиках компонента cP2 [11].

Чем медленнее движется стимул, тем больше времени требуется для оценки его движения. На это указывает наличие зависимости латентности cN1 от скорости. Максимальная полученная нами латентность cN1 при медленном движении стимулов составила 208 мс. В настоящем исследовании самое медленное движение моделировалось линейным изменением межушной задержки ΔT от 0 до 800 мкс в течение 1000 мс, что соответствовало расчетной скорости 90 град/с. При скоростях выше 90 град/с статистическая проверка достоверности обнаружения cN1 показывала высокие уровни значимости, но при 90 град/с значимость снизилась до пограничной (p = 0.06). Экстраполяция полученной амплитудной зависимости cN1 (рис. 2) показывает, что при скоростях ниже 90 град/с величина cN1 становится близка к нулю, так что именно по этой причине в работах разных авторов при регистрации MOR традиционно использовались достаточно большие угловые скорости и смещения. В связи с этим экспериментальная оценка верхней границы окна интеграции для MOR в настоящее время отсутствовала.

Пространственное окно интеграции. При исследованиях восприятия движения звука психофизическими методами мерой разрешающей способности слуховой системы служит величина MAMA, в то время как пределом обнаружения смещения стимула является минимально различимый угол для неподвижного стимула (MAA). Теоретически величину МАА можно получить, выполнив линейную экстраполяцию зависимости MAMА от скорости стимула [3]. В нашей работе [5] величины МАМА были измерены психофизически на той же выборке испытуемых, на которой проведено настоящее исследование. Экстраполяция зависимости МАМА от скорости позволила оценить величину МАА, которая составила около 4°.

Сходную оценку можно получить исходя из данных настоящей работы для разных скоростей движения стимула (рис. 4). Экстраполяция представленной на рис. 4 зависимости дает величину сдвига около 6°, которая находится в диапазоне значений МАА, полученных в большинстве психофизических работ [5, 26]. Однако MOR не может быть зарегистрирован при столь коротких траекториях. Согласно нашим данным, смещение самого медленного стимула за время, необходимое для обработки динамических признаков стимула (208 – 101 = 107 мс), составило 10°. Несомненно, такая оценка времени смещения весьма приблизительна; истинное время смещения стимула может быть больше, но точно определить его невозможно. Имея в виду эти ограничения, величину 10° можно считать наименьшим полученным в эксперименте углом смещения при формировании MOR.

Понятие окна пространственно-временнóй интеграции при формировании потенциала MOR помогает объяснить известный экспериментальный факт: потенциал MOR невозможно зарегистрировать при медленном движении стимула (менее 60 град/с), хорошо различимом на психофизическом уровне. Можно допустить, что стимул движется со скоростью 50 град/с. Через 180 мс после старта он сместится приблизительно на 50 × (180 – 100)/1000 = 4°. Если минимальный угловой сдвиг для генерации MOR составляет около 10°, то сдвиг в 4° не приведет к формированию потенциала. Тем не менее, по имеющимся данным, плавное смещение стимулов длительностью 100–200 мс на угловое расстояние менее 5° хорошо различимо в ходе активной локализации, а также вызывает негативность рассогласования при пассивном прослушивании [3841]. Таким образом, полученная в настоящей работе оценка пространственно-временнóй разрешающей способности потенциала MOR свидетельствует об ограниченных возможностях потенциала MOR в качестве показателя активности нервной системы при восприятии движения источника звука.

ЗАКЛЮЧЕНИЕ

Проведенное исследование показало, что латентность компонента cN1 линейно возрастает с увеличением времени смещения стимула на градус азимута, тогда как латентность cP2 остается практически постоянной. Это позволяет рассматривать латентность cN1 в качестве основного электрофизиологического коррелята процессов интеграции информации о движении звука как отдельном слуховом событии. Временнóй интервал, характеризующий окно интеграции пространственных признаков для движущихся стимулов, составил приблизительно 140–180 мс. Нижняя граница этого интервала отражает время, необходимое для обработки динамической пространственной информации о быстром движении, и превосходит время обработки информации о слуховом событии (показателем которого является латентность волны N1) примерно на 40 мс. Согласно психофизическим измерениям [5], этот временнóй промежуток соответствует времени, необходимому для достижения оптимального пространственного разрешения при восприятии движения стимула. Минимальное угловое смещение, при котором генерировался потенциал MOR, составило 10°. На данном этапе исследований можно сделать вывод о значительно более низкой пространственной разрешающей способности потенциала MOR по сравнению с психофизическими показателями.

Этические нормы. Все исследования проведены в соответствии с принципами биомедицинской этики, сформулированными в Хельсинкской декларации 1964 г. и ее последующих обновлениях, и одобрены локальным биоэтическим комитетом Санкт-Петербургского государственного университета (Санкт-Петербург).

Информированное согласие. Каждый участник исследования представил добровольное письменное информированное согласие, подписанное им после разъяснения ему потенциальных рисков и преимуществ, а также характера предстоящего исследования.

Финансирование работы. Работа выполнена при поддержке Госпрограммы 47 ГП “Научно-технологическое развитие Российской Федерации” (2019–2030), тема 0134-2019-0006, а также РФФИ (грант № 19-315-90 016).

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией данной статьи.

Список литературы

  1. Perrott D.R., Musicant A.D. Minimum audible movement angle: Binaural localization moving sound // J. Acoust. Soc. Am. 1977. V. 62. № 6. P. 1463.

  2. Grantham D.W. Detection and discrimination of simulated motion of auditory targets in the horizontal plane // J. Acoust. Soc. Am. 1986. V. 79. № 6. P. 1939.

  3. Chandler D.W., Grantham D.W. Minimum audible movement angle in the horizontal plane as a function of stimulus frequency and bandwidth, source azimuth, and velocity // J. Acoust. Soc. Am. 1992. V. 91. № 3. P. 1624.

  4. Альтман Я.А. Пространственный слух. СПб.: Институт физиологии им. И.П. Павлова РАН, 2011. 311 с.

  5. Семенова В.В., Шестопалова Л.Б., Петропавловская Е.А., Никитин Н.И. Константы восприятия отсроченного движения звуковых стимулов // Успехи физиологических наук. 2020. Т. 51. № 2. С. 55.

  6. Альтман Я.А. Локализация движущегося источника звука. Ленинград: Наука, 1983. 176 с.

  7. Saberi K., Hafter E.R. Binaural and spatial hearing in real and virtual environments / Eds. Gilkey R.H., Anderson T.R. NJ.: Erlbaum Publ., 1997. P. 315.

  8. Варфоломеев А.Л., Старостина. Л.В. Слуховые вызванные потенциалы человека при иллюзорном движении звукового образа // Рос. физиол. журн. им. И.М. Сеченова. 2006. Т. 92. № 9. С. 1046.

  9. Krumbholz K., Hewson-Stoate N., Schönwiesner M. Cortical response to auditory motion suggests an asymmetry in the reliance on inter-hemispheric connections between the left and right auditory cortices // J. Neurophysiology. 2007. V. 97. № 2. P. 1649.

  10. Getzmann S. Effect of auditory motion velocity on reaction time and cortical processes // Neuropsychologia. 2009. V. 47. № 12. P. 2625.

  11. Getzmann S. Auditory motion perception: onset position and motion direction are encoded in discrete processing stages // Eur. J. Neurosci. 2011. V. 33. № 7. P. 1339.

  12. Getzmann S., Lewald J. Cortical processing of change in sound location: Smooth motion versus discontinuous displacement // Brain Res. 2012. V. 1466. P. 119.

  13. Шестопалова Л.Б., Петропавловская Е.А., Семенова В.В., Никитин Н.И. Вызванные потенциалы на звуковые стимулы с отсроченным началом движения в условиях активного и пассивного прослушивания // Журн. высш. нервн. деят. им. И.П. Павлова. 2016. Т. 66. № 5. С. 565.

  14. Patzwahl D.R., Zanker J.M. Mechanisms of human motion perception: Combining evidence from evoked potentials, behavioural performance and computational modelling // Eur. J. Neurosci. 2000. V. 12. № 1. P. 273.

  15. Kreegipuu K., Allik J. Detection of motion onset and offset: Reaction time and visual evoked potential analysis // Psychol. Res. 2007. V. 71. № 6. P. 703.

  16. Getzmann S., Lewald J. Effects of natural versus artificial spatial cues on electrophysiological correlates of auditory motion // Hear. Res. 2010. V. 259. № 1–2. P. 44.

  17. Grzeschik R., Böckmann-Barthel M., Mühler R., Hoffmann M.B. Motion-onset auditory-evoked potentials critically depend on history // Exp. Brain Res. 2010. V. 203. № 1. P. 159.

  18. Grzeschik R., Böckmann-Barthel M., Mühler R. et al. Direction-specific adaptation of motion-onset auditory evoked potentials // Eur. J. Neurosci. 2013. V. 38. № 4. P. 2557.

  19. Grzeschik R., Lewald J., Verhey J.L. et al. Absence of direction-specific cross-modal visual-auditory adaptation in motion-onset ERPs // Eur. J. Neurosci. 2016. V. 43. № 1. P. 66.

  20. Altmann C.F., Ueda R., Bucher B. et al. Trading of dynamic interaural time and level difference cues and its effect on the auditory motion-onset response measured with electroencephalography // NeuroImage. 2017. V. 159. P. 185.

  21. Harris J.D., Sergeant R.L. Monaural/binaural minimum audible angles for a moving sound source // J. Speech Hear. Res. 1971. V. 14. № 3. P. 618.

  22. Altman J.A., Viskov O.V. Discrimination of perceived movement velocity for fused auditory image in dichotic stimulation // J. Acoust. Soc. Am. 1977. V. 61. № 3. P. 816.

  23. Saberi K., Perrott D.R. Minimum audible movement angles as a function of sound source trajectory // J. Acoust. Soc. Am. 1990. V. 88. № 6. P. 2639.

  24. Carlile S., Best V. Discrimination of sound source velocity by human listeners // J. Acoust. Soc. Am. 2002. V. 111. № 26. P. 1026.

  25. Getzmann S., Lewald J., Guski R. Representational momentum in spatial hearing // Perception. 2004. V. 33. № 5. P. 591.

  26. Schmiedchen K., Freigang C., Rübsamen R., Richter N. A comparison of visual and auditory representational momentum in spatial tasks // Atten. Percept. Psychophys. 2013. V. 75. № 7. 1507.

  27. Carlile S., Leung J. The perception of Auditory motion // Trends Hear. 2016. V. 20. P. 2 331 216 516 644 254.

  28. Delorme A., Sejnowski T., Makeig S. Enhanced detection of artifacts in EEG data using higher-order statistics and independent component analysis // Neuroimage. 2007. V. 34. № 4. P. 1443.

  29. Shestopalova L.B., Petropavlovskaia E.A., Semenova V.V., Nikitin N.I. Brain Oscillations evoked by sound motion // Brain Res. 2021. V. 1752. P. 147232.

  30. Näätänen R., Picton T.W. The N1 wave of the human electric and magnetic response to sound: A review and an analysis of the component structure // Psychophysiology. 1987. V. 24. № 4. P. 375.

  31. Nishihara M., Inui K., Motomura E. et al. Auditory N1 as a change-related automatic response // Neurosci. Res. 2011. V. 71. № 2. P. 145.

  32. Ducommun C.Y., Murray M.M., Thut G. et al. Segregated processing of auditory motion and auditory location: an ERP mapping study // NeuroImage. 2002. V. 16. № 1. P. 76.

  33. Sarrou M., Schmitz P.M., Hamm N., Rübsamen R. Sound frequency affects the auditory motion-onset response in humans // Exp. Brain Res. 2018. V. 236. № 10. P. 2713.

  34. Kreitewolf J., Lewald J., Getzmann S. Effect of attention on cortical processing of sound motion: An EEG study // NeuroImage. 2011. V. 54. № 3. P. 2340.

  35. Шестопалова Л.Б., Петропавловская Е.А., Семенова В.В., Никитин Н.И. Ритмическая активность мозга человека, связанная с движением звуковых стимулов // Журн. высш. нервн. деят. им. И.П. Павлова. 2020. Т. 70. № 5. С. 616.

  36. Inui K., Okamoto H., Miki K. et al. Serial and parallel processing in the human auditory cortex: a magnetoencephalographic study // Cereb. Cortex. 2006. V. 16. № 1. P. 18.

  37. Петропавловская Е.А., Шестопалова Л.Б., Вайтулевич С.Ф. Проявления инерционности слуховой системы при локализации движущихся звуковых образов малой длительности // Физиология человека. 2010. Т. 36. № 4. С. 34. Petropavlovskaya E.A., Shestopalova L.B., Vaitulevich S.F. Sluggishness of auditory perception during localization of short moving sound images // Human Physiology. 2010. V. 36. № 4. P. 399.

  38. Петропавловская Е.А., Шестопалова Л.Б., Вайтулевич С.Ф. Предсказательная способность слуховой системы при плавном движении и скачкообразном перемещении звуковых образов малой длительности // Журн. высш. нервн. деят. им. И.П. Павлова. 2011. Т. 61. № 3. С. 293.

  39. Альтман Я.А., Вайтулевич С.Ф., Варфоломеев А.Л. и др. Негативность рассогласования как показатель различительной локализационной способности слуховой системы человека // Физиология человека. 2007. Т. 33. № 5. С. 22. Al’tman Ia.A., Va$\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{\iota } $tulevich S.F., Varfolomeev A.L. et al. [Mismatch negativity as a characteristic of the distinguishing locating capacity of the human auditory system] // Fiziologiia Cheloveka. 2007. V. 33. № 5. P. 22.

  40. Альтман Я.А., Вайтулевич С.Ф., Петропавловская Е.А., Шестопалова Л.Б. Различение человеком динамических изменений пространственного положения звуковых образов (электрофизиологическое и психофизическое исследование) // Физиология человека. 2010. Т. 36. № 1. С. 83. Al’tman Ia.A., Va$\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\smile}$}}{\iota } $tulevich S.F., Petropavlovskaia E.A., Shestopalova L.B. [Discrimination of the dynamic properties of sound source spatial location in humans (electrophysiology and psychophysics)] // Fiziologiia Cheloveka. 2010. V. 36. № 1. P. 83.

  41. Altman J.A., Vaitulevich. S.Ph., Shestopalova L.B., Petropavlovskaia E.A. How does mismatch negativity reflect auditory motion? // Hear. Res. 2010. V. 268. № 1–2. P. 194.

Дополнительные материалы отсутствуют.