Физиология человека, 2023, T. 49, № 1, стр. 52-63

Локализация в горизонтальной плоскости коррелированных и некоррелированных звуковых сигналов в условиях маскировки

М. Ю. Агаева 1*, Е. А. Петропавловская 1

1 ФГБУН Институт физиологии имени И.П. Павлова РАН
Санкт-Петербург, Россия

* E-mail: agamu_1@mail.ru

Поступила в редакцию 11.01.2022
После доработки 17.05.2022
Принята к публикации 27.05.2022

Полный текст (PDF)

Аннотация

Исследовано влияние маскера на локализацию сигнала в условиях свободного звукового поля. Для создания сигнала и маскера были использованы шумовые посылки в диапазоне частот от 5 до 18 кГц. В случае коррелированных стимулов одна и та же шумовая посылка служила как маскером, так и сигналом. В случае некоррелированных стимулов сигнал и маскер создавались из двух различных шумовых посылок. Маскер всегда находился справа под углом 15 град. Сигнал предъявлялся в одном из трех положений слева: –18, –52, –86 град. Сигнал и маскер длительностью по 1 с предъявлялись либо одновременно, либо со сдвигом начала сигнала относительно начала маскера на задержку от 1 до 40 мс и на 1200 мс. Данные по локализации сигналов в условиях маскировки сравнивались с локализацией одиночного сигнала. Показано, что под действием маскировки воспринимаемое положение сигнала смещалось в сторону маскера, а воспринимаемое положение маскера – в сторону сигнала. Величина смещения уменьшалась с увеличением задержки между сигналом и маскером и с увеличением углового расстояния между ними. Взаимное влияние сигнала и маскера было сильнее выражено для коррелированных стимулов, чем для некоррелированных.

Ключевые слова: локализация звукового сигнала, маскировка, свободное звуковое поле.

В повседневной жизни довольно часто слушателю приходится локализовать источник звука на фоне посторонних мешающих (маскирующих) звуков. Маскировкой называется явление, заключающееся в ухудшении восприятия одного стимула (сигнала) в присутствии другого стимула (маскера) [1]. Для успешного определения положения источника сигнала слуховая система должна вычислить и отделить пространственные признаки сигнала от аналогичных характеристик маскера. Способность локализовать источник звука в пространстве основывается на трех акустических признаках: интерауральные различия по фазе или по времени для сигналов, содержащих низкие частоты, и интерауральные различия по интенсивности и по изменениям спектра для высокочастотных сигналов. Было показано, что при локализации высокочастотных сигналов слушатели могут также использовать бинауральные различия по времени для огибающей сигнала [24].

Несмотря на огромное число работ, посвященных изучению маскировки, вопрос о влиянии маскера на локализацию сигнала обойден стороной. Исследования, касающиеся локализации сигнала в условиях маскировки, единичны. В 1984 г. D.R. Perrott [5] измерял минимально различимый угол между источниками двух тонов, перекрывающихся во времени. Минимально различимый угол – это минимальное угловое расстояние, на котором слушатель может различить два источника звука (minimum audible angle, MAA). Эта величина характеризует пространственную разрешающую способность слуховой системы, точность локализации звуковых стимулов. Малые значения МАА (вплоть до 1 град) соответствуют высокой точности локализации. Согласно данным, полученным в работе [5], способность к локализации ухудшалась, если звуковые сигналы подавались одновременно и имели близкие частоты. При введении различий между стимулами по частоте появлялась зависимость величины МАА от места предъявления стимулов. МАА был меньше 10 град, если источники звука находились спереди от слушателя и около 30 град при расположении сбоку относительно средней линии головы испытуемого. Кроме того, что при уменьшении перекрытия двух звуковых стимулов во времени разрешающая способность улучшалась. Если рассматривать одновременно звучащие стимулы как сигнал и маскер, то полученные данные можно считать свидетельством того, что в условиях маскировки точность локализации источников звука ухудшалась.

В другом исследовании было показано влияние частотного состава сигнала на точность локализации в присутствии маскера [6]. В этой работе определялась способность локализовать сигнал (третьоктавный шум с центральной полосой 0.5 или 4 кГц) в присутствии постоянного белого шума – маскера. Шум с центральной полосой 0.5 кГц был больше подвержен маскировке, чем шум с центральной полосой 4 кГц [6].

Сходные результаты были получены в двух других работах. Локализация серии щелчков в присутствии широкополосного маскера была исследована в свободном звуковом поле [7]. Сигналы, содержащие высокие частоты, были меньше подвержены маскировке, чем содержащие низкие частоты. Ошибка локализации была минимальной, если маскер располагался прямо напротив головы испытуемого (0 град по азимуту) и максимальной при расположении маскера справа или слева относительно средней линии испытуемого (–90 или +90 град). В другой работе для серии щелчков в присутствии шума обнаружено увеличение точности локализации, если уровень соотношения сигнал–шум изменялся от –4 до +8 дБ [8].

Изложенные выше результаты были получены на человеке. При исследовании на животных (котах) также отмечена большая точность локализации в условиях маскировки для высокочастотных сигналов, чем для низкочастотных [9]. Однако разность в точности локализации сигналов, содержащих высокие и низкие частоты, была получена только при расположении маскера слева или справа (–90 или +90 град) [10]. Точность локализации ухудшалась для низкочастотного сигнала (серия шумовых посылок с частотой ниже 1.6 кГц) в отличие от высокочастотного (от 1.6 до 11 кГц). При расположении стимулов во фронтальной плоскости влияние маскера на локализацию низкочастотных и высокочастотных сигналов было сходным. Однако при изменении соотношения сигнал-шум от 0 до –9 дБ точность локализации ухудшалась [10].

Одним из частных случаев маскировки является эффект предшествования. В основе этого феномена лежит способность слуховой системы выделять прямой звук (звук, идущий непосредственно от источника) на фоне маскирующих акустических отражений (эхо-сигналы), идущих от различных поверхностей [1113]. Для эффекта предшествования характерно, что при коротких задержках от одной до нескольких миллисекунд между началами прямого и эхо-сигналов воспринимается только один звуковой образ, который локализуется в области прямого звука, т.е. дирекционные признаки прямого сигнала является преобладающими. В этом случае прямой сигнал является маскером по отношению к эхо-сигналу. Для неподвижных сигналов степень подавления эхо-сигнала и, следовательно, выраженность эффекта предшествования зависит как от временнóго (величина задержки), так и от пространственного разделения между прямым и эхо-сигналом [11, 12, 14, 15]. В отличие от звуковых стимулов, приходящих от разных источников звука, прямому и отраженному сигналу свойственна большая степень корреляции между собой.

В настоящей работе мы исследовали локализацию сигналов, содержащих частоты от 5 до 18 кГц, которые считаются наиболее устойчивыми к маскировке. Целью работы была оценка влияния пространственного и временнóго разделения сигнала и маскера на локализацию сигнала. В первой части исследования были использованы полностью коррелированные сигнал и маскер, что моделирует локализацию прямого и отраженного сигналов (эффект предшествования). Во второй части исследования в качестве сигнала и маскера использовались некоррелированные шумовые посылки с одинаковой огибающей. Такая комбинация стимулов моделирует звуки, приходящие от двух независимых источников со сходными частотно-временны́ми характеристиками. Сравнение результатов, полученных в этих двух условиях, позволит разделить влияние пространственных, временны́х и частотных характеристик на локализацию звуковых сигналов.

МЕТОДИКА

В экспериментах принимали участие 15 испытуемых (один мужчина и четырнадцать женщин с нормальным слухом в возрасте от 20 до 42 лет, средний возраст 29 лет). Перед экспериментом испытуемые проходили стандартную процедуру тональной аудиометрии. Различия в порогах слышимости, измеренные у каждого испытуемого на двух ушах, не превышали 5 дБ.

Исследование состояло из двух блоков, отличавшихся характеристиками звуковых стимулов. В первом блоке участвовало 12 чел., во втором 11 (из них 8 чел., участвовали и в первом и во втором блоке). Каждый блок состоял из 8 серий (6 основных и 2 контрольных) длительностью по 25–30 мин. В течение одного дня испытуемый принимал участие в 2–4 сериях. Между 1 и 2, а также между 3 и 4 сериями перерыв на отдых составлял 5 мин, после 2-ой серии перерыв на отдых был 30 мин. Таким образом, один испытуемый проходил один блок экспериментов за 2–4 дня в течение 1–2 нед. в удобном для него режиме.

Испытуемых располагали в комфортном кресле в анэхоидной камере (3 × 3 × 4.5 м). В камере была установлена полукружная поворотная дуга радиусом 1 м, на которой располагались 49 громкоговорителей (Visaton SC 5.9) с близкими частотными характеристиками. Различия амплитудно-частотных характеристик громкоговорителей не превышали +/– 4 дБ в полосе 0.2–18 кГц. Угловое расстояние между каждыми двумя соседними динамиками составляло 3.75 град. Дуга была установлена в горизонтальной плоскости. Испытуемого располагали в кресле таким образом, что его голова находилась в центре дуги, лицом к центральному громкоговорителю с угловыми координатами 0 град по азимуту относительно средней линии головы испытуемого и 0 град по элевации относительно межушной линии. Два крайних громкоговорителя, левый и правый, находились прямо напротив ушей слушателя, что соответствовало угловым координатам ±90 град (рис. 1, А). Голову испытуемого не фиксировали, но во время предъявления звуковых сигналов просили не двигаться и не менять положение головы относительно дуги.

Рис. 1.

Схема предъявления звуковых стимулов. А – схема расположения источников звука относительно испытуемого. Белые динамики показывают расположение сигнала. Серым цветом обозначено положение маскера. Б – схематичное представление порядка предъявления маскера и сигнала во времени. t – задержка начала предъявления сигнала относительно начала маскера.

Стимулы. В качестве звуковых стимулов использовали широкополосный шум с полосой пропускания 5–18 кГц, синтезированный цифровым способом с частотой дискретизации 44.1 кГц. Снизу частотная полоса определялась фильтром, характеристики которого были подобраны таким образом, чтобы на 5 кГц заглушение составляло 100 дБ, а на 6 кГц–0 дБ. Сверху частотная полоса сигнала была ограничена характеристиками громкоговорителей на 18 кГц.

В основных экспериментальных сериях каждый звуковой стимул состоял из двух шумовых посылок длительностью по 1 с с фронтами нарастания-спада по 8 мс. Временнáя задержка между включениями первой и второй посылок могла принимать значения 0, 1, 2, 3, 5, 8, 12, 18, 25, 40 или 1200 мс. Таким образом, шумовые посылки подавались либо одновременно, либо вторая сдвигалась относительно начала первой на величину задержки (рис. 1, Б). Далее первая шумовая посылка будет рассматриваться как маскер, а вторая – как сигнал.

В первом блоке экспериментов в качестве маскера и сигнала использовали одну и ту же шумовую посылку. В случае нулевой задержки коэффициент корреляции сигнала и маскера равнялся единице. Для второго блока экспериментов было синтезировано множество шумовых посылок с одинаковой полосой пропускания. Из них была выбрана пара посылок, у которых коэффициент корреляции Спирмена был минимальным (Ккор = = 0.0003). Далее одну посылку из этой пары использовали как маскер, а другую – как сигнал.

В естественных условиях обычно интенсивность отраженных сигналов (эхо-сигналов) меньше на 7—10 дБ, чем прямого [16], поэтому в наших экспериментах интенсивность маскера составляла 54 дБ УЗД (уровень звукового давления), а сигнала – 45.3 дБ УЗД. Акустические измерения проводили с помощью аппаратуры Брюэль и Къер (Дания) в точке расположения центра головы испытуемого.

В основных сериях в обоих блоках экспериментов маскер всегда предъявляли справа под углом 15 град относительно средней линии головы. Сигнал располагался слева относительно средней линии головы, в одном из трех положений: –86, ‒52 и –18 град по азимуту. Угловое расстояние между маскером и сигналом составляло 101, 68 и 34 град, соответственно.

Для того чтобы сравнить локализацию сигнала как в присутствии маскера, так и без него, в каждый блок экспериментов были включены две контрольные серии. В них испытуемым предъявляли сигналы, идущие только от одного источника, без маскера. Шумовой сигнал с частотой пропускания (5–18 кГц) длительностью 1 с и фронтами нарастания и спада – по 8 мс предъявляли в одном из 5 положений: –86, –52 и –18 град слева относительно средней линии головы, а также 15 и 34 град справа относительно средней линии головы. Интенсивность сигнала составляла 45.3 дБ УЗД. В псевдослучайном порядке предъявляли 5 положений сигнала, каждое из которых в течение серии повторялось 20 раз.

Процедура эксперимента. Каждый стимул, в основных сериях состоящий из двух шумовых посылок с определенной задержкой, а в контрольных – из одной шумовой посылки, предъявляли по 2 раза, после чего регистрировали ответ испытуемого. Ответы регистрировали при помощи графического планшета Genius G-pen 450, на рабочей поверхности которого была схематически изображена дуга. После прослушивания звуковых стимулов испытуемый должен был спроецировать на схему воспринимаемое положение сигнала и затем отметить его на ней, согласно инструкции. Угловые координаты выбранных точек определяли с помощью специально разработанной компьютерной программы.

В основных экспериментальных сериях испытуемые могли слышать либо сигнал и маскер, либо только маскер. Испытуемого просили отмечать положение второго (отсроченного) сигнала, если он его слышит. В случае если испытуемый слышал только маскер, он должен был указать положение маскера. В контрольных сериях испытуемый получал инструкцию определять положение единственного звучащего сигнала.

В начале каждой серии проводили тренировку, во время которой испытуемому предъявляли стимулы с более широким набором задержек: 1, 2, 3, 5, 8, 12, 18, 25, 40, 74, 150, 300, 600, 1200 мс. Тренировку всегда начинали с максимальной задержки 1200 мс. Все испытуемые при такой задержке слышали два последовательно звучащих стимула: первый – справа от средней линии головы, второй – слева. Затем задержку последовательно уменьшали до 0 мс. После тренировки переходили к основной части эксперимента, в которой временны́е задержки составляли 0, 1, 2, 3, 5, 8, 12, 18, 25, 40 и 1200 мс. Каждая из использованных задержек в пределах одной серии повторялась 12 раз. Стимулы с разными задержками чередовали в псевдослучайном порядке. Положение сигнала в пределах одной серии не меняли. Каждый блок экспериментов состоял из 6 основных серий, по две на каждое расположение тестового сигнала, и двух контрольных. Порядок серий внутри блока также был псевдослучайным.

Анализ данных. В контрольных сериях для каждого испытуемого было вычислено усредненное воспринимаемое положение сигнала в каждом из пяти возможных положений. В основных сериях, согласно речевым отчетам испытуемых, если они слышали сигнал на фоне маскера, то воспринимаемый сигнал локализовался в левой части акустического пространства, ближе к тому положению, где они его слышали при изолированном предъявлении. В случае если они слышали только маскер, то он воспринимался как расположенный в правой или центральной части акустического пространства. При нанесении на координатную плоскость ответы испытуемых располагали либо в области расположения маскера, либо в области расположения сигнала (рис. 2). Таким образом, опираясь на пространственное распределение ответов и речевые отчеты испытуемых, ответ испытуемого в каждой пробе был классифицирован либо как воспринимаемое положение сигнала, либо как воспринимаемое положение маскера. Для каждого типа стимулов, положения сигнала и значения задержки был вычислен процент ответов, в которых испытуемый слышал сигнал.

Рис. 2.

Воспринимаемое положение некоррелированных (А) и коррелированных (Б) звуковых стимулов в условиях маскировки для одного испытуемого. По оси абсцисс – время задержки в мс. По оси ординат – воспринимаемое положение звуковых стимулов в град. Воспринимаемое положение одиночных стимулов, полученное в контрольных сериях, обозначено буквами С (положение сигнала) и М (положение маскера).

Далее воспринимаемое положение сигнала и воспринимаемое положение маскера анализировали по отдельности. По ответам каждого испытуемого для каждого типа стимулов, положения сигнала и значения задержки было вычислено усредненное по всем пробам воспринимаемое положение сигнала и воспринимаемое положение маскера. Необходимо отметить, что в некоторых условиях (тип стимула и значение задержки) испытуемый во всех пробах мог слышать только маскер, и в таких условиях данные о воспринимаемом положении сигнала не могли быть получены. И, наоборот, в других условиях испытуемые всегда слышали сигнал на фоне маскера. В таких случаях отсутствуют данные о положении маскера. В промежуточных условиях среднее воспринимаемое положение сигнала и маскера вычисляли по тому количеству проб, которое было отнесено к соответствующему типу по итогам классификации, и это количество различалось в разных условиях.

Для сравнительной оценки было вычислено смещение (ΔX) – разность между воспринимаемым положением сигнала в присутствии маскера (XМ) и воспринимаемым положением сигнала, предъявленного из того же динамика в контрольных сериях (XО) по формуле:

$\Delta X = {{X}_{{\text{О}}}} - {{X}_{{\text{М}}}}.$

Аналогично вычисляли смещение воспринимаемого положения маскера относительно его одиночного предъявления в контрольных сериях.

Статистическую оценку данных проводили посредством трехфакторного дисперсионного анализа, где факторами были Тип стимулов (коррелированные и некоррелированные), Положение сигнала (–18, –52, –86 град) и Время задержки (0, 1, 2, 3, 5, 8, 12, 18, 25, 40 и 1200 мс). При проведении множественных сравнений применяли поправку Бонферрони. Все сравнения проводили с уровнем значимости p < 0.05.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

В условиях маскировки ответы испытуемых группировались либо в области расположения сигнала, либо в области расположения маскера. На рис. 2 приводится пример распределения ответов одного испытуемого в восьми экспериментальных сериях – для коррелированных и некоррелированных стимулов при двух расположениях сигнала относительно маскера (–86 и –18 град). У остальных испытуемых наблюдалась подобная картина.

Вероятность локализации сигнала. На основании пространственного распределения ответов было определено количество проб, в которых испытуемые локализовали сигнал, и была рассчитана вероятность его локализации в зависимости от положения, задержки и типа стимулов. Вероятность 100% соответствовала тому, что во всех пробах испытуемые локализовали только сигнал. Менее 100% – слушатели локализовали сигнал только в некоторой части проб. 0% – испытуемые совсем не локализовали сигнал, а локализовали только маскер. На рис. 3, А и Б представлены кривые вероятности локализации сигнала, усредненные по всей группе испытуемых в условиях маскировки для двух блоков экспериментов: коррелированных сигнала и маскера (рис. 3, А) и некоррелированных (рис. 3, Б), для каждого значения задержки и для каждого из трех положений сигнала.

Рис. 3.

Вероятность локализации сигнала: для коррелированных стимулов – А, В, Д, Ж, некоррелированных – Б, Г, ДЗ. А и Б – вероятность, рассчитанная по группе испытуемых, В–З – вероятность, рассчитанная для каждого испытуемого отдельно. По оси абсцисс – время задержки в мс. По оси ординат – вероятность локализации сигнала, рассчитанная в процентах, относительно общего количества проб. Ромбиками обозначена вероятность локализации сигнала при его расположении в положении –86 град, треугольниками – –52 град, и квадратами – –18 град. Вертикальные линии на А и Б – стандартная ошибка. На Б, В, Г, Д, У, Ж – черные жирные линии показывают вероятность, рассчитанную по группе испытуемых для каждого условия.

В случае коррелированных стимулов для задержек от 0 до 2 мс испытуемые не воспринимали сигнал и в подавляющем большинстве случаев показывали воспринимаемое положение маскера (из 12 испытуемых участвовавших в этом блоке, только у 1–2 чел. вероятность локализации сигнала могла достигать 10–20%). Вероятность обнаружения и локализации сигнала в среднем по группе составляла не больше 3% (рис. 3, А). Маскер полностью подавлял дирекционные признаки сигнала, и испытуемые не могли его локализовать (действие эффекта предшествования). С увеличением задержки вероятность обнаружения сигнала и определения его положения возрастала и достигала 100%, а количество проб, в которых испытуемые показывали положение маскера вместо сигнала, уменьшалось. Как видно из рис. 3, А, при задержках от 12 мс и выше испытуемые показывали положение сигнала приблизительно в 70% проб, а на долю ответов с локализацией маскера оставалось от 30% и меньше. Подобная картина наблюдалась для всех трех возможных положений сигнала относительно маскера. Однако, когда сигнал находился в положении – 86 град по азимуту, вероятность локализации сигнала была немного больше, чем для двух других его положений (рис. 3, А). Для положений сигнала –52 и –18 град кривые практически совпадают.

В случае некоррелированных стимулов полного подавления сигнала маскером не наблюдалось (рис. 3, Б). Максимальное подавление сигнала происходило при расположении сигнала на –18 град по азимуту (квадратные маркеры). В этом случае вероятность того, что испытуемый услышит сигнал и определит его положение, составляла 60–63% для задержек 0, 1 и 2 мс. Если сигнал был расположен на –52 град по азимуту (треугольники), вероятность получения ответа на сигнал была 69–80%. При предъявлении сигнала в положении ‒86 град (ромбики) вероятность его успешной локализации составляла 85–90% случаев. Все кривые с увеличением величины задержки возрастали. При задержках от 18 мс и выше кривые вероятности локализации сигнала находились в области 100%, а вероятность локализации маскера, соответственно, падала до нуля. На основании вышесказанного воспринимаемое положение сигнала в дальнейшем рассматривалось для задержек от 3 мс и выше, а воспринимаемое положение маскера – от 0 до 12 мс. Воспринимаемое положение сигнала при задержках 0, 1 и 2 мс для коррелированных стимулов и воспринимаемое положение маскера при задержках больше 12 мс для всех стимулов не вычислялось по причине недостаточного количества данных.

Если рассматривать данные отдельно по каждому испытуемому, то как видно из рис. 3, В, Д, Ж, распределение вероятностных кривых для коррелированных стимулов похоже для всех положений сигнала относительно маскера. В случае некоррелированных стимулов с уменьшением расстояния между сигналом и маскером (рис. 3, Г, Е, З) наблюдалось увеличение количества слушателей, у которых сигнал подавлялся в большей степени, и вероятность его локализации составляла 20–70%. Следовательно, возрастали межиндивидуальные различия. При самом дальнем положении сигнала от маскера только у одного испытуемого из одиннадцати при нулевой задержке вероятность локализации сигнала составляла 20% и возрастала с увеличением задержки (рис. 3, Г). Шесть испытуемых в этих условиях всегда слышали и локализовали сигнал, и их вероятностные кривые лежат на уровне 100% при любых задержках. Если сигнал был расположен на –52 град по азимуту, то при минимальной задержке вероятность локализации от 30 до 100% наблюдалась уже у троих испытуемых из одиннадцати (рис. 3, Е). Для сигнала в положении –18 град по азимуту только у двоих слушателей вероятность локализации сигнала оставалась в пределах от 80 до 100% (рис. 3, З), остальные индивидуальные кривые сместились в нижнюю часть графика у девяти человек.

Таким образом, вероятность локализации сигнала на фоне маскера зависела от всех трех параметров: 1) от задержки: с увеличением задержки вероятность локализации сигнала возрастала для обоих типов стимулов; 2) от типа стимулов: в случае коррелированных стимулов при минимальных задержках все испытуемые локализовали только маскер, для некоррелированных стимулов полного подавления сигнала маскером не наблюдалось; 3) от расположения сигнала: можно отметить тенденцию к уменьшению подавления восприятия сигнала с увеличением расстояния между сигналом и маскером.

Воспринимаемое положение сигнала. На рис. 4 показано усредненное по группе испытуемых смещение воспринимаемого положения коррелированного сигнала (рис. 4, А) и не коррелированного (рис. 4, Б) в условиях маскировки относительно его одиночного предъявления в контрольных сериях. Положительные значения по оси ординат показывают смещение в сторону противоположную нахождению маскера, а отрицательные – смещение в сторону маскера.

Рис. 4.

Смещение воспринимаемого положения сигнала: для коррелированных стимулов – А, некоррелированных – Б. По оси абсцисс – величина задержки в мс. По оси ординат – величина смещения в град. Отрицательные значения показывают смещение к маскеру, положительные – смещение от маскера (к левому уху). Звездочками обозначена степень достоверности отличий значений: * – p < 0.05 , ** – p < 0.01. Цвет звездочек соответствует различиям, полученным между разными положениями стимулов: –18 от –56 град (темно-серые звездочки) и –86 град (серые звездочки). Остальные обозначения см. рис. 3.

Как видно из рис. 4, смещение для двух типов сигналов довольно небольшое и составляет приблизительно 5 град и меньше. Кривые, отражающие смещение, лежат близко друг к другу. Однако если сигнал был расположен на –18 град по азимуту, то смещение было немного больше, чем при других положениях сигнала.

Сравнение величин смещения воспринимаемого положения для двух типов сигналов и трех их расположений для задержек от 3 до 1200 мс при помощи трехфакторного анализа не выявило значимых различий для фактора Тип стимулов. Значимые главные эффекты были получены для двух факторов: Положение сигнала и Время задержки (F(2, 431) = 6.875, p < 0.05), (F(7, 431) = 6.222, p < < 0.01, соответственно). Значимое взаимодействие было получено между факторами Положение сигнала и Время задержки (F(14, 46) > 1.74, p < < 0.05), а также между факторами Положение сигнала и Тип стимулов (F(2, 46) = 4.987, p < 0.01).

Для взаимодействия Положение сигнала × Тип стимулов попарные сравнения выявили достоверные различия (p < 0.05) между величинами смещения воспринимаемого положения сигнала для коррелированных и некоррелированных стимулов только в случае, если сигнал подавался из ближнего к маскеру динамика (–18 град). Достоверные различия между разными положениями сигнала были получены только для коррелированных стимулов. Смещение воспринимаемого положение сигнала, звучавшего из ближнего к маскеру динамика (–18 град), было достоверно больше (p < 0.05), чем при двух других возможных его положениях (–52 и –86 град). Достоверных различий между соответствующими величинами, полученными для некоррелированных стимулов, не было (p > 0.05). Иными словами, зависимость от Положения сигнала по-разному проявлялась для коррелированных и некоррелированных стимулов (фактор Тип стимулов). В связи с этим, для того чтобы рассмотреть взаимодействие факторов Положение сигнала и Время задержки, целесообразно будет привести результаты попарных сравнений для коррелированных и некоррелированных стимулов по отдельности, несмотря на то, что трехфакторное взаимодействие не достигало уровня значимости. В противном случае, усреднение результатов, полученных для коррелированных и некоррелированных стимулов, ослабит влияние фактора Положение сигнала.

Взаимодействие факторов Положение сигнала и Время задержки выражалось в следующем: только для коррелированных стимулов, и только в том случае, когда сигнал располагался ближе всего к маскеру, при задержках от 3 до 8 мс величины смещения воспринимаемого положения сигнала были достоверно больше (p < 0.05), чем при двух других положениях сигнала и при всех остальных значениях Времени задержки (рис. 4, А). Для некоррелированных стимулов достоверных различий в попарных сравнениях получено не было (p > 0.05).

Воспринимаемое положение маскера. На рис. 5 показано усредненное по всем испытуемым смещение воспринимаемого положения маскера для коррелированных (рис. 5, А) и некоррелированных стимулов (рис. 5, Б). Положительные значения по оси ординат показывают смещение воспринимаемого положения маскера в сторону сигнала относительно его положения при изолированном предъявлении, а отрицательные – смещение в сторону, противоположную нахождению сигнала. При одновременной подаче сигнала и маскера (задержка 0 мс) происходит бинауральное слияние – процесс, при котором подобные (но не полностью идентичные) звуки сливаются в единый звуковой образ. Как видно из рис. 5, А, для коррелированных стимулов при одновременной подаче маскера и сигнала характерно большое смещение звукового образа в сторону сигнала. Согласно устным отчетам испытуемых, они воспринимали один звуковой образ, который был расположен на дуге в области средней линии головы. Причем для сигналов, расположенных на ‒52 и –86 град, смещение слитного звукового образа составляло 14 и 15 соответственно. Наименьшее смещение 10 град было получено для сигнала –18 град.

Рис. 5.

Смещение воспринимаемого положения маскера: для коррелированных стимулов – А, некоррелированных – Б. По оси абсцисс – время задержки в мс. По оси ординат – величина смещения воспринимаемого положения маскера в град. Отрицательные значения показывают смещение от сигнала, положительные – смещение к сигналу (к правому уху). Звездочками обозначена степень достоверности отличий значений: * – p < 0.05, ** – p < 0.01, *** – p < 0.001. Цвет звездочек соответствует различиям, полученным при разных положениях стимула –18 град (черные звездочки) от –56 град (темно-серые звездочки) и –86 град (светло-серые звездочки). Остальные обозначения см. рис. 3.

Когда сигнал был расположен на –18 град по азимуту, а маскер на +15 град по азимуту, эти источники звука находились почти симметрично относительно средней линии головы. При одинаковой интенсивности стимулов испытуемые локализовали бы звуковой образ около средней линии головы, т.е. около 0 град по азимуту. Однако в наших экспериментах интенсивность маскера была выше интенсивности сигнала на 8.69 дБ (1 Нп). Следовательно, воспринимаемое положение звукового образа должна была сместиться в сторону маскера, что мы и наблюдали. При расположении сигнала на –52 и на –86 град по азимуту сигнал и маскер были расположены несимметрично относительно средней линии головы. Очевидно, что на локализацию звукового образа помимо фактора разной интенсивности между сигналом и маскером влияло и различное положение двух стимулов.

Если между стимулами вводилась задержка, смещение резко уменьшалось и составляло от 2 до 3 град для сигнала в положении –18 град. Для остальных положений сигнала смещение воспринимаемого положения маскера находилось в области нуля. Как видно из рис. 4, А, кривые, показывающие смещение воспринимаемого положения маскера для задержек от 1 до 8 мс, идут почти параллельно.

Для некореллированных стимулов максимальное смещение воспринимаемого положения маскера составляло 5–6 град для сигнала, расположенного на –18 град по азимуту (рис. 4, Б). При расположении сигнала на –52 град по азимуту воспринимаемое положение маскера сдвигалось на 2–3 град, а при нахождении сигнала на –86 град смещение составляло от 1 до 0 град. Кривые, показывающие смещение при задержках от 0 до 8 мс для трех положений сигнала, идут также практически параллельно. Величина смещения маскера для некоррелированных стимулов была больше, чем для коррелированных, для положений сигнала –18 и –52 град по азимуту.

Статистические сравнения были проведены при помощи трехфакторного дисперсионного анализа, где факторами (как и в предыдущем случае) были Тип стимулов, Положение сигнала (–18, –52, –86 град) и Время задержки (0, 1, 2, 3, 5, 8 мс). Согласно результатам анализа, для факторов Положение сигнала и Время задержки были получены значимые главные эффекты (F(2, 251) = 19.2, p < < 0.001, и F(5, 251) = 14.7, p < 0.001, соответственно). Для фактора Тип стимулов достоверных различий не обнаружено. Получено достоверное взаимодействие между факторами Тип стимулов и Положение сигнала (F(2, 251) = 5.34, p < 0.05) и Тип стимулов и Время задержки (F(5, 251) = 12.15, p < 0.001).

Согласно попарным сравнениям, при взаимодействии факторов Тип стимулов и Положение сигнала, воспринимаемое положение сигнала сильнее смещалось по направлению к маскеру при уменьшении расстояния между сигналом и маскером, но эта тенденция по-разному проявлялась для коррелированных и некоррелированных стимулов. Для коррелированных стимулов достоверные различия были получены только между сигналами, расположенными на –18 и –52 град (p < < 0.05), а для некоррелированных – как между положениями –18 и –52 град (p < 0.01), так и между положениями –18 и –86 град (p < 0.001). Величина смещения некоррелированных сигналов, расположенных на –18 град по азимуту, была достоверно больше, чем коррелированных (p < 0.01), а для сигналов в положении –86 град, наоборот, меньше (p < 0.05). Из рис. 5 видно, что различия между разными положениями сигнала в большей степени складываются благодаря ответам на некоррелированные стимулы, но в формирование такого соотношения вносят разный вклад результаты, полученные при разных значениях Времени задержки. По этой причине далее, вместо двухфакторного взаимодействия и Тип стимулов × × Время задержки, будут проанализированы результаты попарных сравнений для трехфакторного и Тип стимулов × Положение сигнала × Время задержки, несмотря на то, что оно не достигло уровня значимости.

При одновременном предъявлении сигнала и маскера (задержка 0 мс) смещение воспринимаемого положения маскера для коррелированных стимулов было достоверно больше, чем в случае некоррелированных, независимо от того, на каком расстоянии от маскера предъявлялся сигнал (степень достоверности различий показана звездочками на рис. 5, А). При введении задержки различия между коррелированными и некоррелированными стимулами в величине смещения воспринимаемого положения маскера исчезали (для положения сигнала –86 град) или меняли знак (для положений сигнала –52 и –18 град). Значения времени задержки, для которых эти различия достигали уровня достоверности (p < < 0.05), отмечены звездочками на рис. 5, Б. Также необходимо отметить, что для коррелированных стимулов воспринимаемое положение маскера при нулевой задержке достоверно отличалось от полученных при всех остальных задержках (p < < 0.01 для положения сигнала –18 град и p < 0.001 для двух других положений); достоверных различий в зависимости от Положения сигнала обнаружено не было. Для некоррелированных стимулов достоверных различий между разными Временами задержки выявлено не было, однако при двух задержках (2 и 5 мс) смещение воспринимаемого положения маскера было достоверно больше при положении сигнала –18 град, чем при положении –86 град.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Способность локализовать сигнал зависела от взаимного расположения сигнала и маскера, как в пространстве, так и во времени. Эти факторы влияли как на вероятность локализации сигнала (рис. 3), так и на величину смещения его воспринимаемого положения (рис. 4). Вероятность локализации сигнала возрастала с увеличением задержки, а при одинаковых задержках возрастала с увеличением углового расстояния между маскером и сигналом. Воспринимаемое положение маскера также смещалось в сторону сигнала (рис. 5). Взаимное влияние сигнала и маскера друг на друга было сильнее выражено для близко расположенных коррелированных стимулов, чем для некоррелированных и разнесенных в пространстве.

Максимальное смещение воспринимаемого положения сигнала наблюдалось при его расположении на –18 град, для остальных положений сигнала смещение было небольшое и имело схожий характер, как для коррелированных, так и некоррелированных стимулов. Таким образом, наибольшей маскировке был подвержен сигнал, расположенный ближе всего к маскеру. В какой-то степени это подтверждает данные исследования [17], где было показано, что уменьшение маскировки с угловым расстоянием происходило до тех пор, пока источники не были разнесены в пространстве на 60 град. После этого уровень маскировки оставался постоянным вплоть до разнесения источников на 150 град. Уровень маскировки при расстоянии между стимулами больше 60 град был на 8–10 дБ меньше, чем тот, который наблюдался при расположении источников сигнала и маскера в одном и том же месте. В нашем исследовании расстояние между сигналом и маскером составляло 33, 71 и 101 град, для расположений сигнала на –18, –52, –86 град соответственно. В случае коррелированных стимулов результаты, полученные для двух дальних положений сигнала, полностью совпадали как по критерию вероятности локализации сигнала, так и по величине смещения его воспринимаемого положения. В случае некоррелированных стимулов кривые, полученные для двух дальних положений стимула, могли незначительно различаться между собой, но в любом случае отличались от ближнего. Таким образом, наши результаты, полученные в задаче локализации коррелированных звуковых стимулов, подтверждают закономерности, полученные ранее методом порогов.

Смещение воспринимаемого положения, по-видимому, возникает вследствие того, что при близком положении сигнала и маскера характеристики передачи звукового давления становятся более похожими [1], и, следовательно, тем больше перекрываются нервные представительства, обрабатывающие сигнал и маскер в слуховой системе [18]. На перцептивном уровне это приводит к сдвигу субъективного положения сигнала в сторону расположения маскера, и наоборот, сдвигу маскера в сторону сигнала. В нашем случае, чем ближе сигнал находился к маскеру, тем большее наблюдалось смещение, и коррелированные стимулы при близком расположении сдвигались друг к другу сильнее, чем некоррелированные.

В целом полученное нами смещение как для коррелированных, так и для некоррелированных сигналов – небольшое. Полученный сдвиг может быть объяснен характером использованных стимулов. Как было описано выше, сигналы, содержащие высокие частоты, более устойчивы к маскировке. Для сигналов, содержащих низкие частоты, было показано, что оценка бинауральной разности по времени в большей степени зависит от начальной части сигнала [19]. При прямой последовательной маскировке именно начало сигнала больше подвержено маскирующему эффекту, и вследствие этого маскировка низкочастотных сигналов более эффективна [9]. В противоположность этому, для высокочастотных сигналов оценка бинауральной разности по интенсивности или оценка по спектру сигнала основывается в большей степени на более поздней части сигнала [9], вследствие чего эти сигналы более устойчивы к маскировке. Можно предположить, что в нашем исследовании при локализации сигнала у испытуемых больший вес имела последняя часть сигнала.

Следует отметить, что нами были получены сильные межиндивидуальные различия, особенно выраженные при локализации некоррелированных сигналов (рис. 3). Для коррелированных сигналов у всех испытуемых наблюдалась схожая картина: с увеличением задержки число проб, в которых испытуемый локализовал сигнал, увеличивалось, для всех расположений сигналов. На локализацию некоррелированных стимулов задержка влияла в большей степени, чем пространственное расположение. Число испытуемых, которые не могли локализовать сигнал в парадигме маскер–сигнал увеличивалось, при более близком расположении сигнала к маскеру (рис. 3, Е–З). Можно предположить, что подобные межиндивидуальные различия возникают за счет неопределенности ситуации.

Одно из возможных объяснений полученным межиндивидуальным различиям, несмотря на то, что сигнал и маскер различаются, состоит в том, что они имеют одинаковые огибающие. И чем ближе расположены стимулы, тем больше характеристики передачи звукового давления становятся похожими [1]. Слуховая система выделяет из двух сигналов, поступающих на правое и левое ухо, коррелированные между собой составляющие [1]. Оставшиеся некоррелированные части увеличивают неопределенность и ухудшают точность локализации. Если сигналы не содержат коррелированных частей или их мало, то каждый сигнал вызывает ощущение отдельного слухового объекта. Другими словами, слуховая система должна решить, что приходит от одного источника, а что – от разных источников. Неопределенность увеличивает межиндивидуальные различия, особенно в условиях маскировки [20].

Таким образом, можно заключить, что пространственное расположение маскера относительно сигнала для некоррелированных стимулов имеет больший вес по сравнению с задержкой звучания сигнала для локализации.

ЗАКЛЮЧЕНИЕ

Ухудшение локализации звуковых стимулов в условиях маскировки проявлялось в уменьшении вероятности получения ответа на сигнал в присутствии маскера и в искажении воспринимаемого положения звуковых стимулов (в тех случаях, когда сигнал был обнаружен и его положение определено). Воспринимаемое положение сигнала смещалось в сторону маскера, а положение маскера – в сторону сигнала. Подавление пространственных признаков сигнала было сильнее выражено для коррелированных стимулов, чем для некоррелированных, и уменьшалось с увеличением задержки между началом звучания маскера и сигнала, а также с увеличением углового расстояния между ними.

Этические нормы. Все исследования проведены в соответствии с принципами биомедицинской этики, сформулированными в Хельсинкской декларации 1964 г. и ее последующих обновлениях, и одобрены локальным биоэтическим комитетом Института физиологии им. И.П. Павлова РАН (Санкт-Петербург).

Информированное согласие. Каждый участник исследования представил добровольное письменное информированное согласие, подписанное им после разъяснения ему потенциальных рисков и преимуществ, а также характера предстоящего исследования.

Финансирование работы. Работа выполнена при поддержке Госпрограммы 47 ГП “Научно-технологическое развитие Российской Федерации” (2019–2030), тема 0134-2019-0006.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией данной статьи.

Список литературы

  1. Блауэрт И. Пространственный слух. М.: Энергия, 1979. С. 150.

  2. Middlebrooks J.C., Green D.M. Sound localization by human listeners // Annu. Rev. Psychol. 1991. V. 42. P. 135.

  3. Risoud M., Hanson J.N., Gauvrit F. et al. Sound source localization // Eur. Ann. Otorhinolaryngol. Head Neck Dis. 2018. V. 135. № 4. P. 259.

  4. Yost W.A., Pastore M.T., Dorman M.F. Sound source localization is a multisystem process // Acoust. Sci. Technol. 2020. V. 41. № 1. P. 113.

  5. Perrott D.R. Concurent minimum audible angle: A re-examination of the concept of auditory spatial acuity // J. Accoust. Soc. Am. 1984. V. 75. P. 1201.

  6. Abel S.M., Hay V.H. Sound localization. The integration of aging hearing loss and hearing protection // Scand. Audiol. 1996. V. 25. № 3. P. 3.

  7. Good M., Gilkey R.H. Sound localization in naise: The effect of signal-to-noiseratio // J. Accoust. Soc. Am. 1996. V. 99. P. 1108.

  8. Good M., Gilkey R.H., Ball J.M. The relation between detection in noise and localization in noise in free field, in Binaural and Spatial Hearing in Real and Virtual Environments / Eds. Gilkey R.H., Anderson T.R. Erlbaum, Hillasdale, NJ, 1997. P. 349.

  9. Gay Y., Ruhland J.L., Yin T.C.T. Effects of forward masking on sound localization in cats: basic findings with broadband maskers // J. Neurophysiol. 2013. V. 110. № 7. P. 1600.

  10. Lorenzi C., Gatehouse S., Lever C. Sound localization in noise in normal-hearing listeners // J. Acoust. Soc. Am. 1999. V. 105. № 3. P. 1810.

  11. Brown A.D., Stecker G.C., Tollin D.J. The precedence effect in sound localization // J. Assoc. Res. Otolaryngol. 2015. V. 16. № 1. P. 1.

  12. Brown A.D., Jones H.G., Thakkar T. et al. Evidence for a neural source of the precedence effect in sound localization // J. Neurophysiol. 2015. V. 114. № 5. P. 2991.

  13. Ege R., van Opstal A.J., Bremen P., van Wanrooij M.M. Testing the Precedence Effect in the Median Plane Reveals Backward Spatial Masking of Sound // Sci. Rep. 2018. V. 8. № 1. P. 8670.

  14. Stecker G.C., Moore T.M. Reverberation enhances onset dominance in sound localization // J. Acoust. Soc. Am. 2018. V. 143. № 2. P. 786.

  15. Baltzell L.S., Cho A.Y., Swaminathan J., Best V. Spectro-temporal weighting of interaural time differences in speech // J. Acoust. Soc. Am. 2020. V. 147. № 6. P. 3883.

  16. Litovsky R.Y., Colburn H.S., Yost W.A., Guzman S.J. The Precedence effect // J. Acoust. Soc. Am. 1999. V. 106 (4 Pt. 1). P. 1633.

  17. Ebata M., Sone T., Nimura T. Improvement of hearing ability by directional information // J. Acoust. Soc. Am. 1968. V. 43. № 2. P. 289.

  18. Carlile S., Leung J. The perception of Auditory Motion // Trends Hear. 2016. V. 20. P. 2331216516644254.

  19. Freyman R.L., Balakrishnan U., Zurek P.M. Lateralization of noise-burst trains based on onset and ongoing interaural delays // J. Acoust. Soc. Am. 2010. V. 128. № 1. P. 320.

  20. Ziegelwanger H., Majdak P., Kreuzer W. Numerical calculation of listener-specific head-related transfer functions and sound localization: Microphone model and mesh discretization // J. Acoust. Soc. Am. 2015. V. 138. № 1. P. 208.

Дополнительные материалы отсутствуют.