Журнал эволюционной биохимии и физиологии, 2019, T. 55, № 6, стр. 414-424

ПРОСТРАНСТВЕННАЯ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ ПРИ ЛОКАЛИЗАЦИИ ПРИБЛИЖЕНИЯ И УДАЛЕНИЯ ШИРОКОПОЛОСНОГО ИСТОЧНИКА ЗВУКА СО СНИЖЕННОЙ ДОЛЕЙ ВЫСОКИХ ЧАСТОТ В СПЕКТРЕ, ХАРАКТЕРНОЙ ДЛЯ ПРЕСБИКУЗИСА

А. П. Гвоздева 1*, И. Г. Андреева 1

1 Федеральное государственное бюджетное учреждение науки Институт эволюционной физиологии и биохимии им. И.М. Сеченова РАН
Санкт-Петербург, Россия

* E-mail: kukumalu@mail.ru

Поступила в редакцию 16.04.2019
После доработки 16.06.2019
Принята к публикации 24.06.2019

Полный текст (PDF)

Аннотация

Выполнена оценка порогов по расстоянию для удаляющихся и приближающихся звуковых образов со сниженной долей высоких частот в спектре сигнала, отражающей изменения восприятия при старении организма. Такое снижение может приводить к частичному выключению бинаурального высокочастотного механизма слуха и изменениям в оценке удаленности источников звука, расположенных на расстояниях от слушателя до 5 м, т.е. в условиях принятия решения о контакте (столкновении). Исследование выполнено в условиях свободного поля с применением модели движения источника звука. Движение формировали линейно меняющимися по амплитуде посылками шума, которые излучала пара динамиков, разнесенных в пространстве на 3 м. Пороги по расстоянию при оценке движущихся звуковых образов со сниженной долей высоких частот в спектре сигнала оказались в два раза меньше, чем без такого снижения. Полученные данные свидетельствуют о том, что при сохранении механизмов кодирования надпороговых сигналов уменьшение доли высоких частот в их спектре не ухудшает пространственную разрешающую способность по расстоянию.

Ключевые слова: возрастные нарушения слуха, локализация движения, моделирование движения, пресбикузис, признаки удаленности, пространственная разрешающая способность

ВВЕДЕНИЕ

Бинауральная система слуха выполняет задачи ориентации в пространстве и анализа акустических потоков информации из внешней среды. В отличие от бинокулярного зрения она позволяет удовлетворительно локализовать объект по всем направлениям в пространстве и тем самым обеспечивает безопасность организма. Вместе с тем бинауральный слух уступает бинокулярному зрению по пространственной разрешающей способности, в том числе он имеет относительно низкую точность в оценке расстояния: почти в два раза вариабельность оценки расстояния по слуху выше, чем с помощью зрения [1]. При разных диапазонах расстояния от слушателя до источника звука возникают различные систематические ошибки в оценке его удаленности. Расстояния от слушателя до источника звука в диапазоне от 1 до 4–5 м переоцениваются, а после 4–5 м наблюдается их недооценка, которая усиливается с увеличением расстояния [2]. Таким образом, после 4–5 м субъективное акустическое пространство сокращается, эта особенность восприятия получила название “акустического горизонта”. Разница в оценке слушателями расстояния до источника звука предполагает различие в механизмах слуховой локализации для удаленных объектов и для близко расположенных источников. Поскольку последние являются объектами для возможного взаимодействия, например, коммуникации, такое различие механизмов может иметь важное эволюционное значение для формирования акустического поведения.

В последние годы проверка описанной выше особенности локализации по удаленности проводилась неоднократно [3, 4]. Анализ литературных данных, выполненный в обзоре [5], показал, что упомянутые выше систематические ошибки в оценке расстояния происходят для различных типов стимулов, акустического окружения и при применении разных психофизических процедур. Причина, по которой возникают систематические ошибки в оценке расстояния, и существует так называемый акустический горизонт, до сих пор неясна.

Выделяют ряд акустических признаков локализации по расстоянию, причем количество признаков и их надежность могут существенно различаться в зависимости от звукового стимула, свойств окружающей среды и направления на источник звука [6]. Уровень звука рассматривают как монауральный признак удаленности, эффективный в большинстве случаев для разного акустического окружения и в широком диапазоне расстояний [79]. В условиях свободного поля уровень звука в месте прослушивания обратно пропорционален квадрату расстояния до его источника. Он снижается примерно на 6 дБ при удвоении расстояния [8]. Если полагать, что минимальное различие в расстоянии определяется дифференциальными порогами уровня звука, то разрешение по расстоянию должно составлять от 5% до 25% от эталонного расстояния в зависимости от типа стимулов. Для посылок белого шума дифференциальные пороги по расстоянию оказались равными 6% [7]. Для различных типов стимулов были получены пороги в диапазоне от 13% до 25% [2].

Другим монауральным признаком локализации по удаленности являются изменения спектра сигнала. Принято считать, что спектральный контур сигнала изменяется при расстояниях между источником звука и слушателем более 15 м [10] и в периперсональном пространстве в пределах 1 м [11, 12]. Для точной оценки расстояний в пределах 1 м необходимо наличие в сигнале спектральных компонент в области частот ниже 3 кГц [11], причем было показано, что важны низкочастотные составляющие спектра, а не его ширина [12]. Полагают, что в диапазоне 1–15 м спектральные компоненты не играют существенной роли при оценке расстояния, т.к. потеря энергии в высокочастотной области слишком мала, и изменения, возникающие в низкочастотной области спектра сигнала в результате дифракции, также оказываются незначительными.

Роль бинауральных признаков – межушных различий по времени и интенсивности, в оценке расстояния остается наименее изученной. Теоретическая работа [13] обосновала положение, согласно которому удаленность источников чистого тона может быть оценена при близких расстояниях с использованием межушных различий по интенсивности. Однако экспериментальная проверка показала, что слушатели не способны оценить расстояние до источников чистых тонов [14]. В последние два десятилетия большая часть работ, направленных на изучение локализации по удаленности, выполнялась с применением технологии виртуального акустического пространства [15, 16]. В условиях свободного поля при помощи этих моделей исследовали акустический параллакс, который заключается в том, что при малых расстояниях до источника углы, под которыми звуковые волны приходят на левое и правое уши слушателя (углы раскрытия), различаются [17]. Оценка различий в углах раскрытия при акустическом параллаксе оказывается около 5 градусов на расстоянии 1 м, тогда как слушатели способны различить азимутальные углы с точностью в 1 градус. Такой угол раскрытия достигается на расстояниях 4–5 м. Согласно нашей гипотезе, разница в оценке удаленности на расстояниях до 4–5 и после них обусловлена различной ролью бинауральных и монауральных механизмов пространственного слуха в локализации в данных диапазонах расстояний. Возрастное снижение слуха (пресбиакузис) характеризуется симметричной потерей слуха на высоких частотах, оно может приводить к нарушению функционирования высокочастотного бинаурального механизма и снижению избирательности при восприятии на расстояниях до 4–5 м, т.е. типичных для коммуникации. Целью данной работы была оценка пространственной разрешающей способности слуха для удаляющихся и приближающихся источников звука в указанном диапазоне расстояний при снижении доли высоких частот в спектре сигнала.

МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЙ

В исследовании приняли участие десять взрослых здоровых испытуемых с нормальным слухом (из них шесть женщин) в возрасте 25–44 лет. Состояние слуха оценивали при помощи тональной пороговой аудиометрии на клиническом аудиометре Pracitronic MA-31. Все испытуемые успешно прошли тест обнаружения паузы, что позволило сделать вывод об отсутствии у них центральных нарушений слухового анализа временной структуры звуковых стимулов.

Эксперименты проводили в условиях свободного поля, в звукоизолированной анэхоидной камере объемом 62.2 м3 (5 × 5 × 2.5 м). Ослабление уровня наружных шумов внутри камеры составляло не менее 40 дБ в диапазоне частот 0.5–16 кГц. Приближение и удаление источника звука моделировали, используя пару динамиков, которые располагали в камере фронтально (азимутальный угол равен 0° ) на расстояниях 1 и 4 м от испытуемого на уровне его головы. Для создания движущихся звуковых образов в динамики подавали последовательности коротких широкополосных шумовых посылок в диапазоне частот 0.125–8 кГц, амплитуда которых линейно увеличивалась на одном динамике и одновременно уменьшалась на другом динамике (рис. 1). При увеличении амплитуды шумовых посылок на ближнем динамике и ее уменьшении на дальнем у испытуемого возникала иллюзия приближения звукового образа. Удаление моделировали аналогичным образом, изменяя амплитуду на динамиках в обратном направлении. Последовательности шумовых посылок имели следующие параметры: длительность посылок – 22 мс, пауза между ними – 3 мс. Шумовые посылки имели трапециевидную огибающую с линейными фронтами нарастания/убывания амплитуды длительностью по 4 мс. Длительность последовательностей шумовых посылок равнялась 997 мс. С учетом задержки прихода звука от дальнего динамика продолжительность движущихся звуковых образов в месте прослушивания испытуемыми составляла 1 с. Нами было создано по пять звуковых образов, имитировавших приближение и удаление звукового источника. Отношение максимального уровня интенсивности к минимальному в начале и конце последовательности шумовых посылок составляло 3, 6, 9, 12 или 15 дБ на ближнем динамике и 2, 4, 6, 8 или 10 дБ на дальнем соответственно. Суммарный уровень интенсивности последовательностей в месте прослушивания изменялся от начала к концу звукового образа на 1, 2, 3, 4 или 5 дБ. Пересчет этих изменений интенсивности в проценты изменения расстояния проводили, применяя соотношение, приведенное в работе Колемана [6]:

(1)
$\Delta R = 1 - {{10}^{{( - \Delta I/20)}}},\quad {\text{при}}\quad \Delta I > 0,$
(2)
$\Delta R = {{10}^{{(\Delta I/{\text{ }}20)}}}--1,\quad {\text{при}}\quad \Delta I < 0,$
где ΔR – изменение расстояния до звукового образа, %, ΔI – изменение интенсивности сигнала в месте прослушивания, дБ. Согласно этим соотношениям, выбранный нами диапазон изменения интенсивностей позволял формировать приближение и удаление с относительными изменениями расстояния 11.5–44%. Так как траектория движения звуковых образов ограничивалась диапазоном расстояний от слушателя 1–4 м, то максимальное изменение расстояния в абсолютных единицах составляло не более чем 4 ⋅ 0.44 ≈ 2 м. Таким образом, при длительности звучания стимулов 1 с, скорость движения звуковых образов была не более 2 м/с.

Рис. 1.

Временная структура звукового стимула, создававшего иллюзию приближения звукового источника. 1 – сигнал на ближнем динамике, 2 – сигнал на дальнем динамике.

Для создания у испытуемых иллюзии неподвижного звукового источника применяли последовательности шумовых посылок с постоянной амплитудой на ближнем и дальнем динамиках. Максимальный уровень звукового давления, создаваемого каждым из одиннадцати звуковых образов (пятью приближающимися, пятью удаляющимися и одним неподвижным) в месте их прослушивания испытуемыми, составлял 65 ± 1 дБ. Эти звуковые образы использовались нами при оценке пространственной разрешающей способности слуха в контрольной серии эксперимента.

При моделировании потери слуха на высоких частотах, характерной для умеренной СНТ, была выполнена фильтрация широкополосных шумовых последовательностей из контрольной серии в соответствии с типичной аудиограммой при умеренной СНТ. Типичная аудиограмма, спектрограммы полученных после фильтрации шумовых последовательностей (моделей СНТ), а также спектрограммы последовательностей, к которым не применяли фильтрацию, показаны на рис. 2.

Рис. 2.

Аудиограмма, характерная для умеренной сенсоневральной тугоухости, (а); амплитудно-частотные спектры стимулов, применявшихся в работе (б).

а – по оси абсцисс – частота, Гц; по оси ординат – слуховой порог, дБ.

б – по оси абсцисс – частота, Гц; по оси ординат – амплитуда сигнала, дБ;

1 – широкополосные контрольные стимулы, 2 – стимулы со снижением доли высоких частот в спектре.

Воспроизведение звуковых стимулов осуществляли на ПК MicroXperts с использованием оригинальной компьютерной программы, созданной в среде Matlab. С компьютера цифровой сигнал поступал на звуковую карту (цифро-аналоговый преобразователь) AKAI EIE Professional (16 бит, частота дискретизации 44 100), после чего аналоговый сигнал направляли на усилитель мощности Neva Audio SA-3004, а затем – на два коаксиальных двухполосных динамика Klipsch R-3800-C, равномерность амплитудно-частотной характеристики которых составляла ±3 дБ в диапазоне частот 48 Гц–20 кГц. Акустические измерения проводили при помощи микрофона 4145, предусилителя 2639 и усилителя 2606 фирмы Брюль и Къер (Brüel & Kjær Sound & Vibration, Дания).

Во время эксперимента испытуемый сидел в кресле с подлокотниками и подголовником, его просили контролировать положение головы на подголовнике. Для фиксации головы испытуемый должен был смотреть в направлении динамиков. Перед началом эксперимента испытуемому для ознакомления с экспериментальной задачей предлагали прослушать несколько звуковых стимулов без снижения доли высоких частот в спектре. Его просили ответить на вопрос “Приближается или удаляется звуковой образ?” нажатием на одну из двух кнопок на пульте после окончания звучания стимула. После того, как испытуемый мог с уверенностью различать направление движения звуковых образов, имевших максимальный перепад амплитуды в месте прослушивания, переходили к основной части эксперимента. Испытуемый прослушивал контрольную серию из 110 стимулов, разделенных паузой 3 с (11 стимулов × 10 повторений в случайном порядке, который генерировали для каждого прослушивания заново). Затем испытуемому предлагали прослушать такую же по длительности серию стимулов, моделирующих восприятие при СНТ. После перерыва на отдых испытуемый прослушивал серии в обратном порядке: сначала серию с моделью СНТ, затем контрольную серию.

По результатам прослушивания строили индивидуальные и усредненные по группе психометрические кривые, отражавшие долю ответов “звуковой образ приближается” на все стимулы в данной серии: контрольной и с моделью СНТ. Для аппроксимации психометрических кривых использовали метод Нелдера–Мида, представляющий собой геометрический алгоритм нахождения максимума/минимума многопараметрических функций [18, 19]. Проводили аппроксимацию усредненных по группе психометрических кривых функцией вида:

(3)
$\Psi (x;\alpha ,\beta ,\gamma ,\lambda ) = \gamma + (1 - \gamma - \lambda )F(x;\alpha ,\beta ),$
где $F(x;\alpha ,\beta ) = 1 - \exp {{( - (x + 5){\text{/(}}\alpha + 5{\text{)}})}^{\beta }}$ – двухпараметрическая функция Вейбулла (Weibull); x – характеристика стимула, в нашем случае это изменение уровня звукового давления в точке прослушивания (от –5 до +5 дБ с шагом 1 дБ); α – коэффициент, определяющий смещение психометрической функции вдоль оси абсцисс; β – коэффициент наклона психометрической функции; γ – вероятность ошибок в ответах на удаляющийся стимул с максимальным перепадом амплитуды в месте прослушивания; λ – вероятность ошибок в ответах на приближающийся стимул с максимальным перепадом амплитуды в месте прослушивания. Результатом работы алгоритма был набор параметров α, β, γ и λ, при котором полученные экспериментальные значения психометрической кривой наилучшим образом описывались функцией вида Ψ(x; α, β, γ, λ). Используя полученную теоретическую психометрическую функцию, методом Монте-Карло проводили компьютерную симуляцию результатов 10 000 экспериментов. Для каждого из них вычисляли показатель отклонения (deviance) от теоретических значений. Оценку согласованности  (goodness-of-fit) усредненной по группе испытуемых психометрической кривой с полученной теоретической психометрической кривой проводили, сопоставляя показатель отклонения эмпирических данных от теоретических с распределением соответствующих показателей для симулированных экспериментов. В том случае, если показатель отклонения для эмпирических данных (усредненная по группе психометрическая кривая) попадал в 95% доверительный интервал распределения показателей отклонения для симулированных экспериментов, согласованность между эмпирическими данными и теоретической психометрической функцией считалась удовлетворительной [19].

Пороги восприятия приближения и удаления определяли на уровне вероятности ответов “звуковой образ приближается” 0.75 и 0.25, соответственно, фиксируя Ψ(x; α, β, γ, λ) = 0.75 и Ψ(x; α, β, γ, λ) = 0.25, присваивая коэффициентам α, β, γ и λ значения, полученные в результате аппроксимации, и решая уравнения относительно x. Погрешности в оценке величин порогов оценивали следующим образом: для результатов 10 000 симулированных экспериментов проводили аппроксимацию психометрических кривых методом Нелдера–Мида, в результате работы которого получали 10 000 наборов коэффициентов α, β, γ и λ. Используя эти коэффициенты, вычисляли такое же количество пороговых значений x(0.25) и x(0.75). Затем строили гистограммы распределения пороговых значений для симулированных экспериментов и вычисляли 95% доверительный интервал для пороговых значений x(0.25) и x(0.75). Полученные пороговые изменения уровня звукового давления в месте расположения головы испытуемого в дБ пересчитывали в проценты изменения расстояния, используя формулы (1) и (2). Достоверность различий суммарных вероятностей ответов на все стимулы между первым и вторым прослушиванием серий с одинаковым спектральным составом стимулов определяли с помощью непараметрического парного теста Вилкоксона. При представлении полученных индивидуальных и среднегрупповых данных в виде психометрических кривых использовали шкалу процентов изменения расстояния до звукового источника. Достоверность различий в отдельных точках психометрических кривых определяли с применением одностороннего биномиального критерия.

РЕЗУЛЬТАТЫ

Изменения уровня звукового давления в диапазоне ±5 дБ, которые достигались суперпозицией линейно изменяющихся по амплитуде сигналов с ближнего и дальнего динамиков в месте прослушивания, позволяли моделировать приближение и удаление звукового источника в пределах 44% изменения расстояния. В этом диапазоне нами были определены вероятности ответов испытуемых при оценке направления движения звуковых образов в случаях широкополосного спектра и при снижении доли высоких частот (модель сенсоневральной тугоухости – СНТ). Типичные индивидуальные данные, полученные в ответ на стимулы с разным спектральным составом, представлены на рис. 3 для четверых испытуемых. При максимальных изменениях расстояния испытуемые определяли направление движения с вероятностью не менее 0.9 во всех экспериментальных сериях. Неподвижный звуковой образ оценивался ими как приближающийся с вероятностью от 0.8 до 1, что свидетельствовало о смещении психометрических кривых влево и переоценке испытуемыми неподвижного сигнала как приближающегося. Равновероятная оценка приближения и удаления, которая может быть интерпретирована как неподвижный звуковой образ, наблюдалась при удалении звукового образа, т.е. увеличении расстояния от испытуемого на 11%. С увеличением расстояния до 21–29% снижение доли высоких частот в спектре сигнала приводило к повышению вероятности правильных ответов на удаляющиеся звуковые образы по сравнению с соответствующими оценками в контрольной серии. Эти различия в ответах на удаляющиеся сигналы разных типов могли быть вызваны как смещением психометрических кривых вдоль оси абсцисс, так и изменением их наклона.

Рис. 3.

Индивидуальные психометрические кривые, отражающие восприятие направления движения звуковых образов в контрольных сериях (слева) и при снижении доли высоких частот в спектре (справа).

По оси абсцисс – изменение расстояния до источника звука, %. Отрицательные значения соответствуют удалению источника, положительные значения соответствуют его приближению; по оси ординат – вероятность ответов “приближается”. 1 – данные первого прослушивания, 2 – данные второго прослушивания. Число измерений в каждой точке N = 10. Указаны порядковые номера испытуемых.

Смещение индивидуальных психометрических кривых вдоль оси абсцисс оценивали по показателю суммарной вероятности, который вычисляли как среднее значение индивидуальных вероятностей ответов “приближается” на все 11 стимулов отдельно в каждой из четырех серий (табл. 1). Суммарные вероятности оказались выше 0.5 для всех испытуемых во всех экспериментальных сериях и значительно варьировали: от 0.51 до 0.81, что указывало на смещение индивидуальных психометрических кривых влево вдоль оси абсцисс в большей или меньшей степени. Этот же показатель, усредненный по группе испытуемых, практически не различался в разных сериях и был достоверно выше 0.5 (p < 0.01). Это свидетельствовало о смещении среднегрупповых психометрических кривых влево во всех сериях и переоценке испытуемыми звуковых образов как приближающихся. Стандартное отклонение средней по группе суммарной вероятности, характеризующее вариабельность индивидуальных данных, оказалось выше в контрольных сериях по сравнению с сериями с моделью СНТ. Для оценки различий между всеми сериями выполняли попарное сравнение индивидуальных суммарных процентов. При сравнении результатов первого и второго прослушивания контрольной серии по группе испытуемых было обнаружено достоверное увеличение суммарной вероятности на 0.1 (p < 0.05, парный тест Вилкоксона). В повторных сериях с моделью СНТ средние суммарные вероятности были одинаковыми. При сопоставлении результатов контрольной серии и серии с моделью СНТ достоверных различий в суммарных вероятностях не было выявлено при первом прослушивании, а при втором – разница составила 0.08 (p < 0.05). Таким образом, суммарная вероятность оказалась информативным показателем для оценки различий в восприятии сигналов разных серий.

Таблица 1.

Суммарные вероятности ответов “приближается” на все стимулы контрольной серии и серии с моделью СНТ для каждого испытуемого в двух прослушиваниях

№ испыту-емого Контрольная серия Серия с моделью СНТ
1* 2 1 2
1 0.55 0.80 0.58 0.65
2 0.57 0.54 0.65 0.57
3 0.52 0.65 0.57 0.62
4 0.63 0.71 0.60 0.66
5 0.74 0.71 0.62 0.63
6 0.77 0.77 0.74 0.71
7 0.70 0.81 0.67 0.60
8 0.51 0.55 0.73 0.56
9 0.62 0.66 0.66 0.63
10 0.64 0.73 0.67 0.72
Среднее 0.63 ± 0.09 0.69 ± 0.09 0.64 ± 0.06 0.64 ± 0.05

Указаны среднегрупповые значения и стандартные отклонения.

* – номер прослушивания.

Особенности восприятия приближающихся и удаляющихся звуковых образов группой испытуемых в контроле и при снижении доли высоких частот оценивали по усредненным психометрическим кривым, аппроксимированным методом Нелдера-Мида (Nelder-Mead). Усредненные результаты контрольных серий и серий со снижением доли высоких частот их аппроксимация представлены на рис. 4–5, а расчетные коэффициенты приведены и в табл. 2. Аппроксимация данных была выполнена с достоверностью 95%. Ни одна из четырех функций, полученных в результате аппроксимации, не описывала удовлетворительно данные других серий. Таким образом, результаты аппроксимации позволили оценить основные характеристики психометрических кривых. Коэффициенты γ и λ, соответствующие средним по группе вероятностям ошибок в ответ на удаляющиеся и приближающиеся звуковые образы с максимальным изменением расстояния, были менее 0.1 во всех сериях. Таким образом, средние по группе показатели соответствовали представленным индивидуальным данным, и выбранный диапазон изменения расстояний позволял оценить пороги по расстоянию для приближающихся и удаляющихся звуковых образов. Используя расчетные данные, в дальнейшем определяли смещение психометрической кривой и пороги по расстоянию, соответствовавшие величинам смещения звукового образа в процентах, при которых испытуемые оценивали звуковой образ как приближающийся с вероятностью 0.25 и 0.75 для порога удаления и приближения соответственно.

Рис. 4.

Средние по группе из 10 испытуемых психометрические кривые, характеризующие восприятие направления движения звуковых образов в контрольных сериях: а – в первом прослушивании, б – во втором прослушивании.

По оси абсцисс – изменение расстояния, %. Отрицательные значения соответствуют удалению звукового образа, положительные значения соответствуют его приближению; по оси ординат – вероятность ответов “приближается” Точками обозначены экспериментальные данные, гладкая кривая – результат их аппроксимации. Указаны уровни 25 (порог для удаления), 50 и 75% ответов “приближается” (порог для приближения), а также проекции соответствующих им точек аппроксимированной психометрической кривой на ось абсцисс. Число измерений в каждой точке N = 100.

Рис. 5.

Средние по группе из 10 испытуемых психометрические кривые, характеризующие восприятие направления движения звуковых образов со снижением доли высоких частот в спектре: а – в первом прослушивании, б – во втором прослушивании. Обозначения см. в подписи к рис. 4.

Таблица 2.

Коэффициенты, полученные при аппроксимации усредненных по группе психометрических кривых во всех четырех экспериментальных сериях

Серия Коэффициенты функции Ψ(x; α, β, γ, λ)
α β γ λ
Контрольная, первое прослушивание –0.1 2.3 0.06 0.04
Контрольная, второе прослушивание –1.1 2.1 0.01 0.03
С моделью СНТ, первое прослушивание –0.6 4.1 0.02 0.04
С моделью СНТ, второе прослушивание –0.7 6.2 0.02 0.04

Согласно методике при оценке порогов в нашей работе применяли симметричный диапазон изменений расстояния, одинаковый шаг по расстоянию для движения звукового образа и одинаковое количество стимулов для приближения и удаления. В случае идеальной психометрической кривой неподвижный стимул должен был оцениваться равновероятно как приближающийся и как удаляющийся. Расчетные психометрические кривые позволили определить величину смещения относительно идеальной кривой. Смещение характеризует расчетный коэффициент α, соответствующий гипотетическому стимулу, который испытуемые характеризуют как приближающийся с вероятностью 0.66. Во всех экспериментальных сериях этот коэффициент имел отрицательные значения, что указывало на смещение психометрических кривых влево (табл. 2). Об этом же свидетельствовало смещение точки субъективного нуля, в которой звуковой образ оценивался равновероятно как приближающийся и удаляющийся, относительно субъективного нуля идеальной психометрической кривой, который всегда соответствует неподвижному стимулу. Во всех сериях и для всех испытуемых смещение точки субъективного нуля происходило как результат переоценки приближения звукового образа, когда даже слабо удаляющиеся образы оценивались испытуемыми как приближающиеся. Для контрольной серии при первом и втором прослушиваниях смещение по средним по группе данным составило 9 и 17%, для серии с моделью СНТ – 11 и 10% соответственно.

В функции Ψ(x; α, β, γ, λ) коэффициент β характеризует наклон психометрической кривой. Его значения для контрольных серий различались менее чем на 5%, тогда как в сериях с моделью СНТ эти коэффициенты увеличились по сравнению с контрольными сериями более чем на 100%. Повышение коэффициента β, т.е. увеличение наклона психометрических кривых, свидетельствовало о снижении порогов в сериях с моделью СНТ по сравнению с контрольными сериями. Поскольку для всех серий и всех испытуемых наблюдали смещение точки субъективного нуля, то определение порогов выполняли относительно этой точки. Используя расчетные данные для первого и второго прослушивания контрольной серии, получили пороги по расстоянию при приближении звукового образа 19 ± 3% и 14 ± 5%, при удалении – 15 ± 3% и 10 ± 5% (указано среднее значение и 95%-ный доверительный интервал). Несмотря на значительную разницу средних величин порогов, достоверные различия выявили только при сравнении по величине порогов при приближении (первое прослушивание) и при удалении (второе прослушивание) звукового образа. Вероятной причиной того, что различия не были выявлены, были относительно пологий ход психометрических кривых и широкие доверительные интервалы. Для серий с моделью СНТ пороги по расстоянию составили при приближении звукового образа 8 ± 3% и 5 ± 2%, при удалении – 8 ± 4% и 6 ± 3%. Таким образом, средние значения порогов для обоих направлений движения в контрольных сериях были примерно в два раза выше, чем в сериях с моделью СНТ.

Пороги по расстоянию при разных направлениях движения звукового образа и при повторных измерениях статистически не различались. При первом прослушивании контрольной серии пороги приближения и удаления были достоверно выше, чем соответствующие пороги в обоих прослушиваниях серий с моделью СНТ (p < 0.01 для всех сравнений). Во втором прослушивании контрольной серии порог для приближения оказался достоверно выше соответствующего порога только во втором прослушивании серии с моделью СНТ (p < 0.01), пороги по удалению не различались в обеих сериях.

Таким образом, при определении порогов по расстоянию был выявлен эффект смещения точки субъективного нуля, который свидетельствовал о переоценке околопороговых сигналов как приближающихся. Оценка порогов для приближающихся и удаляющихся звуковых образов выполнялась относительно точки субъективного нуля. Она показала, что пороги приближения и удаления не различались между собой как в контрольных сериях, так и в сериях с моделью СНТ. Вместе с тем средние величины порогов по расстоянию для сигналов контрольных серий были примерно вдвое выше, чем для сигналов серий с моделью СНТ.

ОБСУЖДЕНИЕ

Дифференциальные пороги по расстоянию в случае неподвижных источников звука могут быть оценены при парном сравнении стимулов, в то время как разрешающая способность для движущегося источника звука определяется по способности оценить направление его движения, т.е. способности сравнить положение начальной и конечной точки траектории. При прослушивании движущегося источника звука в течение некоторого времени, достаточного для формирования движущегося слухового образа, будут происходить процессы, приводящие к временной интеграции интенсивности. В результате этого процесса при медленном понижении интенсивности тонального стимула его громкость будет восприниматься как постоянная, а повышение интенсивности будет обнаруживаться легче, чем ее понижение [20, 21]. В условиях нашего эксперимента неподвижный звуковой образ длительностью 1 с представлял собой квазистационарную, не меняющуюся по амплитуде импульсную последовательность. Испытуемые оценивали его как приближающийся с вероятностью 0.64 и 0.79 в контрольных сериях, и с вероятностью 0.81 и 0.88 в сериях с моделью СНТ, т.е. в результате временной интеграции интенсивности неподвижный звуковой образ воспринимался испытуемыми как нарастающий по громкости.

Величина эффекта временной интеграции громкости была оценена бинаурально при диотической подаче в наушники тонального сигнала длительностью 1.25 с [22]. При монотонном снижении уровня интенсивности сигнала на 1 дБ его громкость воспринималась как постоянная. В нашем исследовании шумовая импульсная последовательность оценивалась равновероятно в обоих направлениях при моделировании изменения расстояния на 9–11%, что соответствовало изменению уровня интенсивности примерно на 1 дБ в месте расположения головы наблюдателя.

Без учета временной интеграции громкости традиционная оценка порогов по расстоянию относительно неподвижного звукового образа приводит к абсурдным результатам: во второй контрольной серии пороги составят 0 и 30% для приближения и удаления соответственно, а в сериях с моделью СНТ – 0 и 20% в первой серии, –5 и 17% – во второй (рис. 4–5). В случае оценки порогов относительно точки субъективного нуля, в которой приближающиеся и удаляющиеся звуковые образы оцениваются равновероятно, величины порогов по средним данным определяются в диапазоне от 6 до 14%. Этот результат близок к оценкам дифференциальных порогов по расстоянию для неподвижных источников белого шума, которые были равны 6% [7]. По данным других исследований значения порогов для неподвижных источников различных типов находятся в диапазоне от 13% до 25% [2].

Скорости движения звуковых образов в нашем исследовании были невысоки, по расчетным оценкам они составляли не более 2 м/с. Это обстоятельство могло стать причиной того, что дифференциальные пороги по расстоянию для движущихся звуковых образов были лишь немного больше по величине по сравнению с неподвижными источниками звука. Аналогичная ситуация была ранее выявлена для локализации по азимутальной координате. Пространственное разрешение по азимуту вблизи 0° для движущихся с небольшой скоростью широкополосных источников звука (10–20°/с) составило 5–6° [23]. Оно оказалось лишь немного выше, чем для неподвижных источников с тем же спектральным составом, для которых пороги были 1–3° [24]. Итак, результаты оценки разрешающей способности, выполненные в нашей работе, хорошо согласуются с данными, полученными ранее для неподвижных источников звука, и изменениями в порогах, наблюдаемыми при движении источников с небольшими скоростями.

В пожилом возрасте наблюдается общее снижение сенсорных функций, которое на начальной стадии выражается в повышении порогов слышимости в высокочастотной области, а также в изменении надпорогового кодирования – феномене усиленного нарастания громкости. Оба явления возникают как результат дегенерации улитки или сопутствующих структур внутреннего уха, а также, на более поздних стадиях заболевания, проводящих структур и центральных отделов слуховой системы [25]. Повышение порогов слышимости при умеренной тугоухости, которое моделировали в нашем исследовании с применением модели движения звукового источника – импульсной последовательности длительностью 1 с, не вызывало достоверных изменений порогов по расстоянию. Импульсные последовательности, моделирующие движение, воспринимаются как непрерывные движущиеся звуковые образы в результате временной интеграции интенсивности [26]. Вместе с тем показано, что в условиях дефицита времени, когда продолжительность движущегося звукового образа составляет не более 150 мс, снижение доли высоких частот в спектре сигнала приводит к значимому увеличению процента ошибок при определении направления движения [27]. Суммируя вышесказанное, можно сделать вывод, что при моделировании повышения порогов слышимости на высоких частотах у испытуемых с нормальным слухом показатели локализации приближающихся и удаляющихся звуковых источников ухудшаются только в тех случаях, когда длительность сигнала сравнительно невелика.

У пациентов с сенсоневральной тугоухостью 2–3 степени высокая вероятность ошибок при оценке приближения и удаления (выше 25%) сохранялась для движущихся звуковых образов продолжительностью до 400 мс [28]. Различия в пороговой длительности для испытуемых с нормальным слухом и пациентов с сенсоневральной тугоухостью могут указывать на дополнительную роль нарушений надпорогового кодирования как фактора, приводящего к снижению способности к локализации приближения и удаления при сенсоневральной тугоухости. Влияет ли этот фактор на пространственную разрешающую способность слуха при оценке приближения и удаления пациентами с сенсоневральной тугоухостью в отсутствие дефицита времени – остается открытым вопросом, требующим дальнейшего изучения.

Список литературы

  1. Anderson P.W., Zahorik P. Auditory/visual distance estimation: accuracy and variability. Front. Psychol. 5:1097. 2014.

  2. Simpson W.E., Stanton L.D. Head movement does not facilitate perception of the distance of a sound source. The Amer. J. of Psychol. 86: 151–159. 1973.

  3. Fontana F., Rocchesso D. Auditory distance perception in an acoustic pipe. ACM Transactions on Applied Perception 5:16. 2008.

  4. Parseihian G., Jouffrais C., Katz B.F.G. Reaching nearby sources: comparison between real and virtual sound and visual targets. Front. Neurosci. 8:269. 2014.

  5. Zahorik P., Brungart D.S., and Bronkhorst A.W. Auditory distance perception in humans: A summary of past and present research. Acta Acust. United Ac. 91: 409–420. 2005.

  6. Kolarik A., Moore B.C.J., Zahorik P., Cristea S., Pardhan Sh. Auditory distance perception in humans: a review of cues, development, neuronal bases, and effects of sensory loss. Atten. Percept. Psychophys. 78: 373–395. 2015.

  7. Ashmead D.H., LeRoy D., Odom R.D. Perception of the relative distances of nearby sound sources. Percept. Psychophys. 47: 326–331. 1990.

  8. Coleman P.D. An analysis of cues to auditory depth perception in free space. Psychol. Bull. 60: 302–315. 1963.

  9. Strybel T.Z., Perrott D.R. Discrimination of relative distance in the auditory modality: the success and failure of the loudness discrimination hypothesis. J. Acoust Soc. Am. 76: 318–320. 1984.

  10. Blauert J. Spatial Hearing: The Psychophysics of Human Sound Localization. MIT Press. Cambridge. 1997.

  11. Brungart D.S. Auditory localization of nearby sources. III. Stimulus effects. J. Acoust Soc. Am. 106: 3589–3602. 1999.

  12. Kopčo N., Shinn-Cunningham B.G. Effect of stimulus spectrum on distance perception for nearby sources. J. Acoust Soc. Am. 130: 1530–1541. 2011.

  13. Hartley R.V.L., Fry T.C. The binaural location of pure tones. Physic. Rev. 18: 431–442. 1921.

  14. Wightman E.R. and Firestone F.A. Binaural localization of pure tones. J. Acoust. Soc. Am. 2: 271–280. 1930.

  15. Brungart D.S., Rabinowitz W.M. Auditory localization of nearby sources. Head-related transfer functions. J. Acoust. Soc. Am. 106: 1465–1479. 1999.

  16. Kopčo N., Shinn-Cunningham B.G. Spatial unmasking of nearby pure-tone targets in a simulated anechoic environment. J. Acoust. Soc. Am. 114: 2856–2870. 2003.

  17. Kim H-Y., Suzuki Y., Takane Sh., Sone T. Control of auditory distance perception based on the auditory parallax model. Appl. Acoust. 62: 245–270. 2001.

  18. Nelder J.A., Mead R. A Simplex Method for Function Minimization. Comput. J. 4: 308–313. 1965.

  19. Wichmann F.A., Hill N.J. The psychometric function: I. Fitting, sampling, and goodness of fit. Percept. Psychophys. 63: 1293–1313. 2001.

  20. Rawdon-Smith A.F., Gridley G.C. An illusion in perception of loudness. Br. J. Psychol. 26: 191–195. 1935.

  21. Small A.M. Loudness perception of signals of monotonically changing sound level. J. Acoust. Soc. Am. 61: 1293–1297. 1977.

  22. Reinhardt-Rutland A.H. Asymmetrical perception of changing intensity in short tonal stimuli: duration of stimulus. J. Gen. Psychol. 123: 115–122. 1996.

  23. Chandler D.W., Grantham D.W. Minimum audible movement angle in the horizontal plane as a function of stimulus frequency and bandwidth, source azimuth, and velocity. J. Acoust. Soc. Am. 91: 1624–1636. 1992.

  24. Mills A.W. On the minimum audible angle. J. Acoust. Soc. Amer. 30 (4): 237–246. 1958.

  25. Moore B.C.J. Perceptual consequences of cochlear damage. Oxford University press. 1995.

  26. Андреева И.Г., Гвоздева А.П. Пороги непрерывного приближения звуковых источников с ритмическими структурами, характерными для биологически значимых сигналов. Ж. эвол. биохим. и физиол. 51: 29–36. 2015 [Andreeva I.G., Gvozdeva A.P. Perception thresholds of continuously approaching sound sources with rhythmic structures specific to biologically significant signals. J. Evol. Biochem. Physiol. 51: 29–36. 2015 (in Russ).]

  27. Андреева И.Г., Гвоздева А.П., Огородникова Е.А. Пороговая длительность звуковых сигналов для оценки приближения и удаления их источника при моделировании снижения высокочастотного слуха. Сенс. сист. 32: 277–284. 2018 [Andreeva I.G., Gvozdeva A.P., Ogorodnikova E.A. Threshold duration of sound signals for their sources approaching and withdrawing under condition of high-frequency hearing loss modeling. Sensory Systems. 32: 277–284. 2018 (in Russ).]

  28. Андреева И.Г., Бахтина А.В., Гвоздева А.П., Голованова Л.Е., Огородникова Е.А., Пименова В.М., Ситдиков В.М. Ориентация в пространстве по слуху и вестибулослуховые взаимодействия при легкой и умеренной степени сенсоневральной тугоухости. Авиакосм. экол. мед. 52(7)(спецвыпуск): 7–8. 2018 [Andreeva I.G., Bakhtina A.V., Gvozdeva A.P., Golovanova L.E., Ogorodnikova E.A., Pimenova V.M., Sitdikov V.M. Auditory spatial orientation and vestibular-auditory interaction in patients with the mild and moderate degrees of sensorineural hearing loss. Aerospace and Environmental Medicine. 52(7)(special issue): 7–8. 2018 (in Russ).]

Дополнительные материалы отсутствуют.