Сенсорные системы, 2020, T. 34, № 3, стр. 201-209

Различение акустических спектров с различной плотностью гребней

А. Я. Супин 1*, О. Н. Милехина 1, Д. И. Нечаев 1

1 Федеральное Государственное бюджетное учреждение науки Институт проблем экологии и эволюции им. А.Н. Северцова РАН
119071 Москва, Ленинский просп., 33, Россия

* E-mail: alex_supin@mail.ru

Поступила в редакцию 06.01.2020
После доработки 16.01.2020
Принята к публикации 20.05.2020

Полный текст (PDF)

Аннотация

Измеряли пороги различения звуковых сигналов с различной плотностью спектральных гребней в зависимости от исходной (стандартной) плотности. Измерения проводили с использованием адаптивной трехальтернативной процедуры с принудительным выбором при центральных частотах тест-сигнала 1, 2 и 4 кГц. Порог различения сигналов возрастал с увеличением стандартной плотности гребней. При стандартной плотности гребней от 2 до 10 цикл/окт пороги были практически одинаковыми для сигналов с центральными частотами 1, 2 или 4 кГц: от 0.06 цикл/окт при стандартной плотности 2 цикл/окт до 5–7 цикл/окт при стандартной плотности 10 цикл/окт. При центральных частотах 1 или 2 кГц сигналы не различались, если исходная плотность гребней превышала 10 цикл/окт; при центральной частоте 4 кГц различение было возможно при исходной плотности гребней 20 цикл/окт. Различение сигналов при центральной частоте 4 кГц и исходной плотности гребней более 10 цикл/окт может быть объяснено временным анализом, тогда как различение сигналов при исходной плотности гребней менее 10 цикл/окт согласуется с моделью частотного анализа, базирующегося на профиле возбуждения в слуховой улитке.

Ключевые слова: гребенчатые спектры, профиль возбуждения, временной анализ

ВВЕДЕНИЕ

Звуковые сигналы с гребенчатыми спектрами применяются для измерения способности слуховой системы к различению сложных звуковых стимулов. Отличительное свойство таких сигналов – периодическое чередование максимумов и минимумов спектральной амплитуды. Подобно многим естественным звукам сигналы с гребенчатыми спектрами имеют относительно сложную спектрально-временную структуру: более сложную спектральную структуру, чем чистые тоны, и более сложную временную структуру, чем короткие импульсы. В отличие от натуральных сигналов, гребенчатые спектры могут быть однозначно охарактеризованы ограниченным числом параметров, что делает возможным их использование в точных экспериментальных исследованиях. Помимо параметров, применимых к любым звукам (интенсивность, центральная частота и ширина спектра), гребенчатые спектры характеризуются плотностью, глубиной и фазой гребней.

Дифференциальные пороги по параметрам, характеризующим гребенчатую структуру спектра (плотность гребней, глубина и фаза), являются эффективными индикаторами разрешающей способности слуховой системы. К настоящему времени наибольшее распространение получила оценка разрешающей способности по максимальной различимой плотности гребней.

Первоначально способность к различению гребенчатой структуры спектра оценивалась по эффекту “тональности (высоты) повторений” (repetition pitch) (Bilsen, Ritsma, 1970; Yost, Hill, 1978; Yost, 1996; Yost et al., 1978; 1996). Тональность повторений возникает при действии звука с гребенчатым спектром, у которого частотные интервалы между гребнями одинаковы во всей спектральной полосе звука. Субъективная высота этой тональности соответствует звуковой частоте, которая равна частотному интервалу между гребнями спектра (хотя на самом деле такая частота в спектре звука может отсутствовать). Было показано, что тональность повторений ощущается при действии таких сигналов, у которых частотные интервалы между гребнями спектра не меньше 50 Гц, т.е. плотность гребней не превышает 20 цикл/кГц (Yost, Hill, 1978). Предел появления тональности повторений (20 цикл/кГц) может считаться пределом разрешения гребенчатой структуры спектра.

Недостатками рассмотренного метода можно считать то, что оценка разрешающей способности базируется на субъективной оценке испытуемого (его отчета о наличии тональности повторений), а также то, что не все варианты гребенчатых сигналов вызывают четкое ощущение тональности повторений. Эффект хорошо выражен только для широкополосных сигналов, у которых частотные интервалы между гребнями постоянны во всей частотной полосе. Чтобы избавиться от этих недостатков, был предложен метод оценки спектрального разрешения, основанный на различении гребенчатых сигналов, у которых различны фазы гребней, при том, что сигналы идентичны по всем остальным параметрам (Supin et al., 1994; 1997). Предполагалось, что различение таких сигналов возможно только в случае разрешения гребенчатой структуры их спектров. Было показано, что различение сигналов возможно, если плотность гребней, выраженная в относительных единицах (отношение центральной частоты гребня к частотному интервалу между соседними гребнями), составляла от 12.0 безразмерных единиц на частоте 1 кГц до 16.4 на частоте 8 кГц. В более распространенной в настоящее время метрике количества гребней на октаву это соответствует от 8.5 цикл/окт на частоте 1 кГц до 11.6 цикл/окт на частоте 8 кГц (Supin et al., 1998).

Сигналы с постоянными частотными интервалами между гребнями спектра не оптимальны для измерения спектральной разрешающей способности слуха. Частотный анализ звуков в слуховой улитке эквивалентен действию линейки частотно-избирательных фильтров, добротность которых мало меняется с частотой, т.е. полосы пропускания фильтров приблизительно частотно-пропорциональны. Из-за этого, если частотные интервалы между гребнями постоянны, соотношение ширины гребней спектра с полосами пропускания фильтров сильно меняется в пределах частотного диапазона слуха. В результате неясно, к какой части частотного диапазона должен быть отнесен найденный предел разрешения плотности гребней. Чтобы исключить эту неопределенность, были использованы сигналы с гребенчатыми спектрами, у которых интервалы между гребнями частотно-пропорциональны. Мерой плотности гребней у таких сигналов может быть либо отношение ff (безразмерная величина), где f – центральная частота гребня и δf – частотный интервал между соседними гребнями, либо количество гребней на октаву (цикл/окт).

Тест-сигналы с частотно-пропорциональной гребенчатой структурой спектра были использованы для измерения спектральной разрешающей способности слуха в нескольких вариантах. Один из вариантов предполагал различение между тест-сигналом, в котором несколько раз происходила реверсия фазы гребней (максимумы и минимумы спектральной амплитуды менялись местами на частотной шкале), и референтным сигналом, в котором при той же плотности гребней их фаза оставалась постоянной (Supin et al., 1998). В этом случае предел разрешения гребенчатой структуры в безразмерных единицах   ff составил от 11.2 на частоте 1 кГц до 14.2 на частоте 8 кГц (это соответствует 8 и 10.1 цикл/окт). Если и в тестовом, и в референтном сигналах фазы гребней были постоянными, но противоположными, разрешение было оценено как около 10 цикл/окт (Milekhina et al., 2018; Anderson et al., 2011; 2012).

Существенно отличные оценки спектрального разрешения были получены в том случае, если использовался референтный сигнал, спектр которого не имел гребенчатой структуры (“плоский” спектр). В этом случае различение тестового и референтного сигналов было возможно при плотности гребней в тестовом сигнале до 60 цикл/окт (Anderson et al., 2012), по меньшей мере, 26 цикл/окт (Nechaev et al., 2019) или 34 цикл/окт (Милехина и др., 2019), т.е. в разы больше, чем при различении двух сигналов, оба из которых имели гребенчатые спектры и отличались друг от друга только фазой гребней. Предполагалось, что столь значительное различие в оценках спектральной разрешающей способности происходит из-за разной степени участия двух механизмов частотного анализа, действующих в слуховой системе: спектрального и временного (Nechaev et al., 2019).

Помимо плотности гребней, спектральная разрешающая способность может быть охарактеризована пороговой глубиной гребней (спектральным контрастом). Порог спектрального контраста – не постоянная величина, он зависит от плотности гребней: чем выше плотность, тем выше порог. Кроме того, порог различения сигналов по спектральному контрасту зависит от примененного референтного сигнала. Два сигнала с гребенчатой структурой спектра различались при глубине гребней (эта величина определяется как относительное отклонение максимумов и минимумов спектральной амплитуды от среднего уровня между ними) около 0.1 (Supin et al., 1999). Различение межу гребенчатым и плоским спектрами было возможно при глубине гребней 5 дБ (Anderson et al., 2012).

Еще один параметр, по которому может оцениваться спектральная разрешающая способность слуха, – порог сдвига гребенчатого рисунка. В работе (Yost et al., 1978) была исследована чувствительность к сдвигам плотности гребней в широкополосном сигнале; однако при таком изменении плотности происходил и пропорциональный сдвиг каждого из гребней по частотной шкале. Порог сдвига был оценен в 3%. В исследовании, посвященном измерению порогов сдвига гребней в ограниченных по полосе спектрах с частотно-пропорциональными гребнями (Nechaev, Supin, 2013), порог сдвига зависел от плотности гребней, причем эта зависимость была немонотонной. При плотности гребней от 3.5 до 5 цикл/окт порог был минимальным и составлял от 1 до 1.1%; как при более низких, так и при более высоких плотностях гребней порог повышался. Предполагалось, что при высоких плотностях гребней порог повышается вследствие сглаживания профиля возбуждения, создаваемого в улитке сигналом с гребенчатым спектром, тогда как при низких плотностях порог повышается вследствие пологих перепадов спектральной амплитуды между минимумами и максимумами гребенчатого рисунка.

При всем разнообразии рассмотренных выше способов оценки спектральной разрешающей способности слуха с применением гребенчатых тест-сигналов, для всех этих способов имеется общее свойство. Различие между тестовым и референтным сигналами было одинаковым во всей частотной полосе сигналов. Во всей полосе фаза гребней двух сигналов была противоположной (рис. 1, а), либо фаза гребней различалась на одну и ту же процентную величину, либо один из сигналов имел гребенчатую, а другой – плоскую структуру спектра. Эта специфическая ситуация создавалась в экспериментальных условиях выбором соответствующих сигналов. Однако такая ситуация не обязательна для широкого круга естественных сигналов, у которых могут быть, в принципе, любые соотношения между максимумами и минимумами спектральной амплитуды. Чтобы установить, каковы возможности слуховой системы при различении таких звуков, необходимо использовать тестовые и референтные сигналы, в которых соотношение между спектральными гребнями варьирует в пределах частотной полосы.

Рис. 1.

Примеры частотных спектров с постоянным и непостоянным различием в положении спектральных гребней в частотной полосе сигнала.

а – спектры с противофазным положением гребней на частотной шкале. Оба спектра (1 и 2) имеют центральную частоту 2 кГц, ширину спектральной полосы 2 окт (от 1 до 4 кГц) и плотность гребней спектра 5 цикл/окт. Во всей спектральной полосе пики спектральной амплитуды одного спектра приходятся на те частоты, где у другого спектра имеются провалы. б – спектры имеют ту же центральную частоту и ширину спектральной полосы, что и спектры а, но у спектра 1 плотность гребней составляет 5 цикл/окт, а у спектра 2 – 7 цикл/окт. Соотношение положений пиков и провалов спектральной амплитуды варьирует в пределах спектральной полосы.

Относительно простой и доступный для анализа вариант такой ситуации – сигналы, у которых различается плотность гребней (рис. 1, б). В этом случае соотношение фаз гребней между двумя сигналами меняется в пределах частотной полосы от синфазного (на шкале частот максимум спектра одного сигнала совпадает с максимумом другого, а минимум – с минимумом) до противофазного (максимум одного сигнала совпадает с минимумом другого, и наоборот). Способность слуховой системы различать такие сигналы может быть охарактеризована минимальным (пороговым) различием плотности гребней. Эта характеристика разрешающей способности слуха не изучена. Требуется измерение порогов различения плотности гребней при такой постановке эксперимента, которая исключает сопутствующие факторы.

В данной работе были измерены пороги различения плотности гребней для сигналов с ограниченной частотной полосой и с частотно-пропорциональной плотностью гребней спектра. У таких сигналов взаимное положение максимумов и минимумов спектральной амплитуды варьирует в пределах частотной полосы, что и требуется для их использования в качестве модели различения сигналов с произвольными соотношениями спектральных амплитуд.

МЕТОДЫ

Испытуемые. Измерения выполнены на шести испытуемых (четверо мужчин и две женщины) в возрасте от 20 до 47 лет. Все испытуемые имели слуховые пороги не выше 15 дБ в диапазоне частот от 1 до 4 кГц, т.е. относились к категории нормально слышащих. Все испытуемые дали информированное согласие на участие в экспериментах с воздействием звуков интенсивностью не выше 70 дБ уровня звукового давления при ежедневной экспозиции не более 105 дБ относительно 20 мкПа2c.

Сигналы. Примененные сигналы имели гребенчатые спектры. Во всех случаях огибающая спектра представляла собой один двухоктавный период косинусоидальной функции от логарифма частоты. Центральная частота сигналов составляла 1, 2 или 4 кГц. Предъявляли два типа сигналов, которые ниже условно обозначены как тестовый и референтный.

В тестовом сигнале каждые 400 мс происходило изменение плотности гребней между двумя значениями, которые ниже условно обозначаются как стандартная и повышенная плотности (рис. 2, а). Сигнал содержал шесть чередующихся сегментов длительностью 400 мс каждый: три сегмента со стандартной плотностью гребней и три с повышенной плотностью. Таким образом, общая длительность сигнала составляла 2400 мс.

Рис. 2.

Спектры сигналов.

а – тестовый, б – референтный. На а: 1 – сигнал со стандартной плотностью гребней (в приведенном примере 5 цикл/окт). 2 – сигнал с повышенной плотностью гребней (7 цикл/окт). Плотность гребней в референтном сигнале (б) равна стандартной плотности в тестовом сигнале, т.е. 5 цикл/окт.

В референтном сигнале плотность гребней была постоянной и равной стандартной плотности в тестовом сигнале (рис. 2, б). Длительность референтного сигнала была равной длительности тестового сигнала, т.е. составляла 2400 мс.

Сигналы синтезировали цифровым способом с частотой стробирования 32 кГц. Для синтеза использовали программу, созданную в программной оболочке LabVIEW (National Instruments, США). Программа синтеза включала генерацию белого шума (гауссова последовательность чисел), который пропускали через фильтр, задающий как огибающую, так и гребенчатую структуру спектра.

При генерации тест-сигнала использовали два гребенчатых фильтра с различной плотностью гребней (у одного – стандартная, у другого – повышенная). Гауссову последовательность чисел попеременно подавали на 400 мс на вход одного или другого фильтра (шесть чередующихся сегментов); выходы фильтров суммировали.

При генерации референтного сигнала использовали один фильтр со стандартной плотностью гребней; гауссова последовательность чисел подавалась на его вход в течение 2400 мс. На выходе фильтра получали референтный сигнал.

Синтезированные сигналы переводили в аналоговую форму при помощи 16-битного цифроаналогового преобразователя в плате сбора данных NI-DAQ 6251 (National Instruments, США) и воспроизводили через головные телефоны HD580 (Sennheiser, Германия).

Процедура измерений. Во всех измерениях применена трехальтернативная процедура с принудительным выбором. Каждое предъявление содержало три сигнала, разделенных паузами длительностью 400 мс: один тестовый и два референтных сигнала. Порядок следования сигналов (тестовый сигнал следует первым, вторым или третьим) менялся от предъявления к предъявлению случайным образом (рис. 3). Задача испытуемого состояла в том, чтобы указать, какой из трех сигналов (т.е. тест-сигнал) отличался от двух других (т.е. референтных сигналов).

Рис. 3.

Примеры последовательностей предъявления тестового и референтного сигналов при трехальтернативной процедуре.

а – тест-сигнал первый в последовательности сигналов; б – тест-сигнал второй в последовательности. Амплитуды сигналов со стандартной и повышенной плотностью гребней представлены в относительных единицах, от 0 до 1. 1 – стандартная плотность гребней, 2 – повышенная плотность гребней.

В течение сеанса измерения стандартная плотность гребней, одинаковая для тестового и референтного сигналов, сохранялась постоянной от предъявления к предъявлению и могла принимать одно из следующих значений: 2, 3, 5, 7, 10, 15, 20, 30, 50 цикл/окт. Повышенная плотность гребней отличалась от стандартной на величину, обозначаемую ниже как разность плотности гребней (РПГ). РПГ, выраженная в цикл/окт, ступенчато менялась от предъявления к предъявлению, принимая значения x, 1.5x, 2x, 3x, 5x, или 7x, где x = = 10n, n – положительное или отрицательное целое число; например, 0.1, 0.2 … 0.7, 1, 2 … 7, 10, 20, 30 цикл/окт. Повышенную плотность меняли по адаптивной процедуре в варианте “два – вниз, один – вверх”: после двух подряд правильных определений тест-сигнала РПГ в следующем предъявлении уменьшали на один шаг; после каждой ошибки РПГ увеличивали на один шаг (рис. 4). Использованная процедура “два – вниз, один – вверх” приводит варьируемую переменную (в данном случае – РПГ) к значению, обеспечивающему обнаружение тест-сигнала с вероятностью 71% (Levitt, 1971), что близко к среднему значению (67%) между безошибочным обнаружением (100%) и случайным угадыванием одного варианта из трех возможных (33%).

Рис. 4.

Примеры варьирования РПГ в процессе адаптивной процедуры. Приведены три измерительных сессии при значениях стандартной плотности 2, 5 и 10 цикл/окт, как указано в легенде. Знаком “+” отмечены предъявления, в которых испытуемый правильно определял тест-сигнал; знаком “0” отмечены точки реверсии, горизонтальные пунктирные линии – пороги РПГ.

Адаптивную процедуру варьирования РПГ продолжали до получения десяти точек перегиба (переходов от увеличения РПГ к уменьшению и обратно). Среднее геометрическое значение этих точек принимали за порог РПГ в данном сеансе измерения. Полученное значение порога относили к стандартной плотности гребней, примененной в данном сеансе измерения.

От сеанса к сеансу стандартную плотность гребней меняли в соответствии с приведенной выше шкалой, от 2 до 30 цикл/окт; центральную частоту сигналов меняли от 1 до 4 кГц – всего 27 комбинаций. Для каждой комбинации центральной частоты и стандартной плотности гребней измерения повторяли трижды на каждом из шести испытуемых. Полученные 18 оценок порога РПГ (по три повторения на шести испытуемых) усредняли, и результат усреднения принимали за результирующую оценку порога РПГ для данной комбинации. По полученным результатам строили зависимости порога РПГ от стандартной плотности гребней для центральных частот сигналов 1, 2 и 4 кГц.

РЕЗУЛЬТАТЫ

Применимость адаптивной процедуры к измерению РПГ. Адаптивная процедура измерения порога действенна в том случае, если вероятность правильного ответа монотонно зависит от варьируемого параметра сигнала: сдвиг параметра в одном направлении увеличивает вероятность правильного ответа, сдвиг в противоположном направлении уменьшает вероятность. Тогда адаптивная процедура приводит варьируемый параметр к околопороговому значению. Сдвиг плотности гребней вызывает разнонаправленные изменения соотношений между гребнями тестового и референтного сигналов в разных участках их частотной полосы. Поэтому для порога РПГ не было априорной уверенности, что зависимость вероятности правильного ответа от РПГ действительно монотонна. Это положение требовало экспериментальной проверки.

Измерения показали, что при адаптивной процедуре вероятность двух подряд правильных ответов снижалась при уменьшении РПГ и повышалась при увеличении РПГ (рис. 4). В результате значение РПГ приводились к величине, которая могла быть принята за порог.

Как показывает рис. 4, полученные таким образом пороги РПГ зависели от стандартной плотности гребней: чем больше стандартная плотность, тем выше порог. Рисунок демонстрирует эту закономерность для стандартных плотностей 2, 5 и 10 цикл/окт.

Зависимость порога РПГ от стандартной плотности гребней. Полученная зависимость порога РПГ от стандартной плотности гребней представлена на рис. 5 для центральных частот сигнала 1, 2 и 4 кГц. При стандартной плотности не более 10 цикл/окт порог был практически одинаков для всех центральных частот сигнала. При стандартной плотности 2 цикл/окт порог составил 0.06 цикл/окт, т.е. в среднем испытуемые могли отличить сигнал с плотностью гребней 2 цикл/окт от сигнала с плотностью не менее 2.06 цикл/окт. С увеличением стандартной плотности гребней порог повышался. При стандартной плотности 10 цикл/кГц порог достигал 5–7 цикл/окт, также практически одинаково для всех центральных частот сигнала от 1 до 4 кГц. Иными словами, в среднем испытуемые могли отличить сигналы с плотностью гребней 10 цикл/окт от сигналов с плотностью не менее 15–17 цикл/окт. По данным дисперсионного анализа, никакие пары функций, полученных для частот 1, 2 и 4 кГц, не отличались друг от друга статистически достоверно (от P = 0.12 до P = 0.63).

Рис. 5.

Зависимость порога РПГ от стандартной плотности гребней.

а – для центральной частоты сигнала 1 кГц; б – 2 кГц; в – 4 кГц.

При увеличении стандартной плотности сверх 10 цикл/окт порог РПГ существенно зависел от центральной частоты. При центральных частотах 1 и 2 кГц пороги РПГ не определялись при стандартной плотности гребней более 10 цикл/окт (15, 20 и 30 цикл/окт), т.е. испытуемые не могли отличить сигнал со стандартной плотностью гребней 15, 20 или 30 цикл/окт от сигнала со сколь угодно более высокой плотностью гребней.

Однако при центральной частоте 4 кГц пороги РПГ определялись при стандартных частотах более 10 цикл/окт. При стандартной плотности 15 цикл/окт усредненный порог РПГ составил 8.8 цикл/окт, а при стандартной плотности 20 цикл/окт порог составил 23.3 цикл/окт, т.е. испытуемые могли отличить сигнал с плотностью гребней 20 цикл/окт от сигнала с плотностью 43.3 цикл/окт. При еще большей стандартной плотности (30 цикл/окт и более) порог на частоте 4 кГц не определялся. При частоте 4 кГц функция “стандартная плотность – РПГ” имела характерный перелом при стандартной плотности 10 цикл/окт: при более высоких плотностях рост порогов замедлялся по сравнению с меньшими плотностями.

ОБСУЖДЕНИЕ

Функция, описывающая зависимость порога РПГ от исходной (стандартной) плотности гребней спектра при центральной частоте 4 кГц, имела явную точку перелома (разрыв производной). При других частотах (1 или 2 кГц) такой разрыв не наблюдался. Это свойство функции заставляет предполагать участие двух механизмов, определяющих порог. Такое предположение будет соответствовать экспериментальным данным, если один из механизмов одинаково действует вне зависимости от частоты сигнала, обеспечивая практически одинаковые пороги РПГ при всех исследованных частотах (от 1 до 4 кГц), но только при плотностях гребней до 10 цикл/окт. Другой механизм определяет пороги РПГ при стандартных плотностях гребней выше 10 цикл/окт, но проявляется только при частоте сигнала 4 кГц.

“Кандидатами” на роль двух механизмов являются частотный и временной механизмы частотного анализа в слуховой системе. В принципе, разделение механизмов на частотной и временной условно, поскольку любой процесс может быть описан как в частотном, так и во временном выражении. Применительно к слуховой системе, под частотным анализом подразумевается разложение входного звукового сигнала на частотные составляющие путем пропускания через набор частотно-избирательных фильтров. При этом на наборе фильтров возникает некоторый профиль возбуждения (“внутренний спектр”), посылающий в слуховые нервные центры информацию о спектре сигнала (Zwicker, 1970). Под временным анализом подразумевается анализ структуры потока нервных импульсов, выполняемый слуховыми нервными центрами. В определенном диапазоне частот временная структура потока воспроизводит временную структуру звукового сигнала, что делает возможным передачу информации о частоте звука в слуховые нервные центры.

Вклады частотного и временного механизмов зависят от задачи различения (Anderson et al., 2012; Nechaev et al., 2019). При различении двух сигналов с одинаковой плотностью спектральных гребней, но с разными фазами гребенчатого рисунка преимущественную роль играет частотный механизм. Если один из сигналов имеет гребенчатый, а другой – плоский спектр, то основную роль играет временной механизм. Естественно допустить, что при различении сигналов с разной плотностью гребней два механизма частотного анализа также могут проявлять себя по-разному в зависимости от параметров сигнала.

Профиль возбуждения, создаваемый входным сигналом, может быть рассчитан сверткой спектра сигнала с формой частотно-избирательного фильтра (рис. 6). При действии входного сигнала с гребенчатым спектром профиль возбуждения (внутренний спектр) также имеет гребенчатую структуру, однако, вследствие интегрирования в полосах пропускания фильтров происходит сглаживание спектра, так что гребни имеют меньшую глубину, чем во входном сигнале. Степень сглаживания зависит от соотношения плотности гребней и добротности фильтров. При низкой плотности гребней (а) внутренний спектр (б) мало отличается от спектра сигнала и характеризуется относительно большой глубиной гребней. Поэтому даже небольшое изменение плотности гребней приводит к заметному изменению между внутренними спектрами и позволяет достичь порог различения. При высокой плотности гребней (в) глубина гребней внутреннего спектра мала (г). Поэтому для достижения порога различения требуется значительное повышение плотности гребней, при которой гребенчатый рисунок внутреннего спектра практически исчезает. При частотно-пропорциональном гребенчатом спектре плотность гребней (цикл/окт) одинакова во всей частотной полосе сигнала. Добротность слуховых фильтров также мало меняется в зависимости от частоты (Glasberg, Moore, 1990), поэтому соотношение плотности гребней и добротности фильтров мало меняется с частотой. От этого соотношения зависит степень сглаживания внутреннего спектра. Поэтому пороги различения, определяемые частотным механизмом, должны мало меняться с частотой. В данном исследовании это условие выполнялось для всех частот при плотности гребней до 10 цикл/окт. Можно принять, что в этом диапазоне параметров различение сигналов происходило по частотному механизму.

Рис. 6.

Моделирование различения спектров с разной плотностью гребней на основе частотного анализа.

а – спектры сигналов с плотностью гребней 2 цикл/окт (1, стандартная плотность) и 2.1 цикл/окт (2, повышенная плотность) (РПГ 0.1 цикл/окт); б – профили возбуждения, полученные сверткой спектров (а) с формой частотно-избирательного фильтра с добротностью 10; (3 – разность между профилями 1 и 2); в и г – то же, что (а) и (б) при стандартной плотности 10 цикл/окт и повышенной плотности 16 цикл/окт.

Временная организация сигналов с гребенчатыми спектрами проявляется в их автокорреляционной функции (АКФ), в которой присутствует задержанный сегмент. Задержка (мс) численно равна количеству гребней на единицу частоты (цикл/кГц). При одной и той же плотности гребней, выраженной в цикл/окт, задержка зависит от частоты: чем выше частота, тем короче задержка. Поэтому, в отличие от частотного механизма, временной механизм различения должен обеспечивать пороги, зависящие от частоты. При плотности гребней 20 цикл/окт, количество гребней на единицу частоты составляет 28, 14 и 7 цикл/кГц, и задержка АКФ составляет 28, 14 и 7 мс соответственно для центральных частот сигнала 1, 2 и 4 кГц (рис. 7). Если допустить, что предел задержек во временной организации сигналов, выявляемых слуховой системой, лежит между 14 и 7 мс (например, 10 мс), то при центральной частоте 4 кГц временная организация сигнала с плотностью гребней 20 цикл/окт может быть выявлена, и различение между этим сигналом и сигналом с более высокой плотностью возможно, тогда как при центральных частотах 1 или 2 кГц различение невозможно. Именно такой результат был получен в данном исследовании. Можно принять, что в диапазоне плотностей от 10 цикл/окт различение сигналов происходило по временному механизму.

Рис. 7.

АКФ сигналов с гребенчатыми спектрами при разной центральной частоте сигнала.

а – 1; б – 2; в – 4 кГц. 1 – стандартная плотность гребней, 20 цикл/окт; 2 – повышенная плотность гребней, 40 цикл/окт. Вертикальная пунктирная линия обозначает предполагаемый предел различения временной структуры 10 мс. При центральных частотах 1 и 2 кГц задержанные сегменты АКФ для обоих сигналов находятся за пределом различения; при частоте 4 кГц задержанный сегмент стандартного сигнала находится в пределах различения.

Таким образом, комбинация действий частотного и временного механизмов частотного анализа удовлетворительно объясняет полученные результаты. Частотный механизм обеспечивает различение сигналов с разной плотностью гребней, если хотя бы в одном из них плотность не превосходит 10 цикл/окт. При этом обеспечивается порог РПГ до 0.06 цикл/окт. В высокочастотной области слуха различение возможно при плотностях гребней, более высоких, чем 10 цикл/окт за счет участия временного механизма.

Работа поддержана РФФИ (грант 20-015-00054).

Список литературы

  1. Anderson E.S., Nelson D.A., Kreft H., Nelson P.B., Oxenham A.J. Comparing spatial tuning curves, spectral ripple resolution, and speech perception in cochlear implant users. J. Acoust. Soc. Am. 2011. V. 130. P. 364–375.

  2. Anderson E.S., Oxenham A.J., Nelson P.B., Nelson D.A. Assessing the role of spectral and intensity cues in spectral ripple detection and discrimination on cochlear-implant users. J. Acoust. Soc. Am. 2012. V. 132. P. 3925–3934.

  3. Bilsen F.A., Ritsma R.J. Some parameters influencing the perceptibility of pitch. J. Acoust. Soc. Am. 1970. V. 47. P. 469–475.

  4. Glasberg B.R., Moore B.C. J. Derivation of auditory filter shapes from notched-noise data. Hearing Res. 1990. V. 47. P. 103–138.

  5. Levitt H. Transformed up-down methods in psychoacoustics. J. Acoust. Soc. Am. 1971. V. 49. P. 467–477.

  6. Milekhina O.N., Nechaev D.I., Supin A.Ya. Estimates of frequency resolving power of humans by different methods: the role of sensory and cognitive factors. Human Physiol. 2018. V. 44. P. 357–363.

  7. Milekhina O.N., Nechaev D.I., Supin A.Ya. Rippled-spectrum resolution dependence on frequency: Estimates obtained by discrimination from rippled and nonrippled reference signals. J. Acoust. Soc. Am. 2019. V. 146. P. 2231–2239.

  8. Nechaev D.I., Milekhina O.N., Supin A.Ya. Estimates of ripple-density resolution based on the discrimination from rippled and nonrippled reference signals. Trends Hear. 2019. V. 23. P. 1–9.

  9. Nechaev D.I, Supin A.Ya. Hearing sensitivity to shifts of rippled-spectrum patterns. J. Acoust. Soc. Am. 2013. V. 134. P. 2913–2922.

  10. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M. B. Frequency resolving power measured by rippled noise. Hearing Res. 1994. V. 78. P. 31–40.

  11. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Frequency-temporal resolution of hearing measured by rippled noise. Hearing Rres. 1997. V. 108. P. 17–27.

  12. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Ripple density resolution for various rippled-noise patterns. J. Acoust. Soc. Am. 1998. V. 103. P. 2042–2050.

  13. Supin A.Y., Popov V.V., Milekhina O.N., Tarakanov M.B. Ripple depth and density resolution of rippled noise. J. Acoust. Soc. Am. 1999. V. 106. P. 2800–2804.

  14. Yost W. A. Pitch strength of iterated rippled noise. J. Acoust. Soc. Am. 1996. V. 100. P. 3329–3335.

  15. Yost W.A., Hill R. Strength of the pitches associated with ripple noise. J. Acoust. Soc. Am. 1978. V. 64. P. 485–492.

  16. Yost W.A., Hill R., Perez-Falcon T. Pitch and pitch discrimination of broadband signals with rippled power spectra. J. Acoust. Soc. Am. 1978. V. 63. P. 1166–1173.

  17. Yost W.A., Patterson R.D., Sheft S. A time domain description for the pitch strength of iterated rippled noise. J. Acoust. Soc. Am. 1996. V. 99. P. 1066–1078.

  18. Zwicker E. Masking and psychophysical excitation as consequences of the ear’s frequency analysis. Frequency Analysis and Periodicity Detection in Hearing. Ed. R. Plomp, G.F. Smoorenburg (Sijthoff, Leiden). 1970. P. 376–394.

Дополнительные материалы отсутствуют.