Российский физиологический журнал им. И.М. Сеченова, 2021, T. 107, № 11, стр. 1395-1407

Перцептивный анализ взрослыми речи детей с расстройствами аутистического спектра, синдром дауна, умственной отсталостью

Е. Е. Ляксо 1*, О. В. Фролова 1**, А. С. Николаев 1, А. С. Григорьев 1

1 Санкт-Петербургский государственный университет
Санкт-Петербург, Россия

* E-mail: lyakso@gmail.com
** E-mail: olchel@yandex.ru

Поступила в редакцию 13.08.2021
После доработки 13.09.2021
Принята к публикации 14.09.2021

Полный текст (PDF)

Аннотация

Голос человека может отражать незначительные нюансы настроения и состояния, которые улавливаются слуховой системой и распознаются на основании личного опыта, состояния слушателя и мотивации говорящего. Нарушения голоса и речи у детей, разная степень их выраженности в зависимости от заболевания позволяют сформулировать вопрос о том, какую информацию могут извлечь взрослые при прослушивании речи ребенка с атипичным развитием. Цель исследования – определить возможность распознавания взрослыми различной информации о детях по речи. В работе использован метод слухового перцептивного эксперимента. В исследовании приняли участие 685 слушателей (аудиторов). Создано 40 тестовых последовательностей, включающих речевой материал 260 детей в возрасте от 4 до 16 лет, типично развивающихся и детей с атипичным развитием: расстройствами аутистического спектра, синдромом Дауна, интеллектуальными нарушениями. Показано, что аудиторы при прослушивании образцов детской речи могут правильно распознавать пол детей и их психоневрологическое состояние, но испытывают трудности при определении эмоционального состояния детей, лексического значения речевого материала; плохо распознают возраст, в особенности детей с атипичным развитием. Выявлены корреляции между способностью взрослых правильно определять пол, возраст, психоневрологическое и эмоциональное состояние детей, организацией тестовых последовательностей и профессиональным опытом аудиторов.

Ключевые слова: детская речь, перцептивный анализ, возраст, пол, эксперимент

Голос человека может передать мельчайшие нюансы настроения и состояния, которые способна уловить слуховая система слушающего и распознать, опираясь на собственный опыт, текущее настроение и состояние сонастроенности (доминанту) с говорящим. В исследованиях по распознаванию речи широко применяется метод слухового перцептивного эксперимента [1], хотя он и представляет сложную задачу использования суждения слушателей для изучения человеческого голоса. Экспериментальные исследования проведены с целью определения приятности голоса [2, 3], возраста и пола говорящего [3], его роста и веса [2] на основе прослушивания образцов речи. Показано, что на восприятие речевого материала влияет возраст слушающего и говорящего [3], на определение значения сказанного – характеристики слуха [4]. Гендерная специфика имеет место при категоризации эмоций в голосовых проявлениях человека [5].

Исследования слухового восприятия включают в себя проблему распознавания слушателями особенностей речи людей с различными заболеваниями (например, болезнь Паркинсона [6], синдром Дауна (СД) [7, 8], расстройства аутистического спектра (РАС) [9]). В клинике инструментальным измерениям речи обычно предшествуют перцептивные данные [10].

Исследования, направленные на изучение восприятия взрослыми информации, содержащейся в характеристиках голоса и речи детей с нарушениями развития, имеют самостоятельное значение.

Наиболее яркие проявления нарушений речевого развития отмечаются у детей с РАС, СД и умственной отсталостью (УО).

Для пациентов с РАС характерны нарушения языка и речи, социально-эмоциональной сферы. Большинство исследователей сходятся в едином мнении в отношении существования специфических нарушений речи у людей с РАС, расхождения во мнениях касаются конкретных характеристик речи [например, 11–13]. Для детей с РАС описан широкий диапазон нарушений речи – от грубой задержки формирования до опережающего темпа развития. Выявлены особенности интонации, тембра, модуляций голоса, нарушение прагматики речи [14]. Фонологические нарушения речи выражены в большей степени, чем лексические, при общем низком уровне сформированности речи [15].

В пионерской работе Kanner [16] речь пациентов с РАС описывается как монотонная, механическая, с ровной, плоской интонацией. Другими исследователями показано, что речь детей с РАС характеризуется высокими значениями частоты основного тона и ее вариативностью – в речи 8–9-летних португальских детей [17], 4–10-летних билингвов (хинди–английский) [18], детей 6–11 лет с высокофункциональным аутизмом, говорящих на кантонском и мандаринском диалектах китайского языка [19], 4–6.5-летних израильских детей [12], русских детей и подростков 5–14 лет [4, 9]. Предполагается, что высокие значения диапазона частоты основного тона являются показателем задержки речевого развития детей с РАС [18]. Аномальную просодику выделяют в качестве основного признака речи пациентов с РАС [12, 20]. В нескольких исследованиях отмечено атипичное словесное и фразовое ударение [11]. Наряду с высокими значениями частоты основного тона и диапазона частоты основного тона описан атипичный спектр речевых сигналов [12].

СД – одна из форм геномной патологии. Особенности строения речевого аппарата детей с СД [21] обуславливают снижение разборчивости речи и четкости артикуляции [22], уменьшение разницы между значениями двух первых формантных частот кардинальных гласных [23, 24] по сравнению со сверстниками с типичным развитием (ТР). Люди с СД могут демонстрировать различные нарушения произношения [8]. Дети растягивают слова и ударные гласные, что влияет на постановку словесного ударения и, наряду с нечеткой артикуляцией, затрудняет распознавание речи ребенка [25]. Ребенок может говорить быстро и “глотать” окончания слов, говорить очень тихо и с назализацией, говорить медленно, заикаться, путать звуки в словах и повторять одно и то же слово много раз, правильно произносить слова, пропускать слоги в словах, менять местами звуки в слове и не договаривать окончания слов, заменять звуки в слове на более легкие для произношения [26].

Для детей с СД характерна задержка речевого развития, которая влияет на разные области: синтаксис, словарный запас, разборчивость речи [27]. Дети испытывают трудности в понимании предложно-именных, сложноподчиненных, инвертированных конструкций, отражающих коммуникативный аспект речи. Отмечаются индивидуальные различия, связанные с развитием артикуляционных навыков, словарным запасом и/или задержкой формирования синтаксической структуры высказывания [27].

Нарушения речи и голоса у детей, их разная степень выраженности позволяют поставить вопрос, какая информация о ребенке с атипичным развитием может быть доступна взрослым при прослушивании его речи. Решение этого вопроса важно для подбора персонала, работающего с детьми с атипичным развитием, организации процесса взаимодействия с детьми. Полученная информация может быть использована для более точной диагностики степени тяжести нарушений речи. Особое внимание к перцептивным характеристикам голоса обусловлено возможностью их применения для скрининга, диагностики и лечения.

Важная проблема – степень сложности речевого материала, используемого для прослушивания в перцептивных экспериментах. Влияет ли организация стимульного материала на характеристики восприятия?

Цель исследования – определить возможность распознавания взрослыми информации о детях с типичным и атипичным развитием при прослушивании их речи.

Первая задача заключалась в определении способности взрослых распознавать пол, возраст, эмоциональное состояние “комфорт–нейтральное–дискомфорт”, значение слов и/или фраз, психоневрологическое состояние детей “типичное развитие–нарушения развития” при прослушивании тестов, содержащих речевой материал.

Вторая задача состояла в оценке влияния организации речевого материала в тестах и опыта взаимодействия с детьми аудитора на восприятие информации о поле, возрасте и состоянии говорящего.

МЕТОДЫ ИССЛЕДОВАНИЯ

Аудиторы

В перцептивном эксперименте приняли участие 685 взрослых аудиторов (возраст: M = 22.8 лет, диапазон – 18–45.4 лет). У всех аудиторов слух в норме, пороги слуха – в пределах возрастной нормы. 545 информантов были носителями русского языка, 140 – иностранных языков (арабский, азербайджанский, узбекский, туркменский), им было предложено прослушать образцы речи русских детей. При отборе иностранных студентов не учитывался их родной язык; важной была информация о недостаточном владении русским языком – все носители иностранных языков изучали русский язык менее 1 года. Их результаты были подвергнуты перекрестному сравнению в последующих анализах.

Набор данных

Записи речи 260 детей были взяты из базы данных “AD_Child.Ru” [28] (табл. 1).

Таблица 1.  

Характеристика детей-участников исследования

Группа Количество Возраст, лет
Типичное развитие 120 4–16
Расстройства аутистического спектра 85 4–16
Синдром Дауна 37 5–12
Умственная отсталость легкой степени 18 5–12

Выбор детей-информантов обусловлен нарушением у них разных уровней организации речи, выступающих в качестве симптомов ведущего заболевания (РАС, СД) [22] или сопровождающих основное заболевание (УО) [29]. Записи речи типично развивающихся (ТР) детей использовались в качестве контроля. Запись речи детей осуществляли в ситуациях диалогов с родителями и экспериментатором с использованием цифрового магнитофона “Marantz PMD660” с внешним микрофоном “SENNHEIZER e835S”, запись поведения детей – с использованием видеокамеры “SONY HDR-CX560E”. Речевые файлы сохраняли в формате Windows PCM WAV, 44 100 Гц, 16 бит.

Тестовые последовательности для перцептивного эксперимента

Создано 30 тестовых последовательностей. Тесты различались по: типам и количеству образцов речи; количеству, полу, возрасту и психоневрологическому состоянию детей, чей речевой материал включен в тест. Речевой материал одних и тех же детей мог быть включен в разные тесты. Продолжительность тестовых последовательностей составляла от 10 до 25 мин. Каждый речевой сигнал в тестах повторялся один раз. Интервал между различными речевыми сигналами составлял 10 с. Для создания тестов, содержащих эмоциональную речь, три эксперта с профессиональным опытом анализа речи выбрали высказывания, которые были произнесены детьми в состоянии дискомфорта, комфорта и нейтральном состоянии (эксперты просматривали видео записи и опирались на подробный протокол записи).

Перцептивный эксперимент

Перед аудиторами стояли задачи: определить пол, возраст, психоневрологическое состояние ребенка и лексическое значение высказываний при прослушивании тестовых последовательностей. Тесты предъявляли группам аудиторов не более 10 человек в открытом поле. В специально разработанной анкете аудиторы отмечали информацию о себе: пол, возраст, наличие собственных детей и опыт взаимодействия с детьми (отсутствует, бытовой, профессиональный). При наличии профессионального опыта указывались квалификация и стаж работы по специальности. После прослушивания каждого речевого сигнала, аудиторы отмечали в анкете напротив номера сигнала вариант своего ответа в зависимости от поставленной задачи.

Аудиторы не проходили предварительного обучения, не знали о диагнозах, поле, реальном возрасте детей, так как в инструкции возраст не указывался или указывался только возрастной диапазон.

При распознавании эмоционального состояния ставили задачу определить состояние говорящего ребенка: комфорт–нейтральное (спокойное)–дискомфорт. Во время одной экспериментальной сессии аудиторы прослушивали один тест. Всего проведено 40 перцептивных экспериментов. Все перцептивные эксперименты проведены с двойным слепым контролем.

Статистический анализ данных проводился в программе “Statistica” с использованием непараметрических критериев: коэффициент корреляции Спирмена (р < 0.05), регрессионный и множественный регрессионный анализ. Все данные ранжированы по степени сложности с учетом следующих показателей: сложность тестовой последовательности (включен речевой материал детей с одним диагнозом/разными диагнозами), речевой материал, задание для аудиторов, опыт аудиторов (отсутствует, бытовой и профессиональный), родной язык аудиторов.

Все процедуры были одобрены Этическим комитетом Санкт-Петербургского государственного университета для исследований в области здравоохранения и человека (IRB00003875St.PetersburgStateUniversity IRB#1 – Behavioral), от родителей каждого ребенка-участника исследования получено письменное информированное согласие.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Определение пола, возраста, состояния и лексического значения высказываний аудиторами при прослушивании детской речи

При определении пола детей все группы аудиторов распознавали мужской пол лучше, чем женский (табл. 2). Русские и иностранные аудиторы лучше определяли пол ТР мальчиков, чем мальчиков с РАС. Иностранные аудиторы правильно распознавали пол по речи девочек с ТР, но не могли определить пол девочек с СД.

Таблица 2.  

Правильное распознавание пола, возраста, психоневрологического и эмоционального состояния детей разными группами аудиторов (%), количество тестов и аудиторов

Задание Количество тестов
(русских аудиторов)
Правильные ответы русских аудиторов Количество тестов
(иностранных аудиторов)
Правильные ответы иностранных аудиторов
Пол ТР-ж 12 (360) 61 3 (70) 91
ТР-м 12 (409) 81 5 (104) 92
РАС-ж 14 (352 ) 54 1 (21) 9.4
РАС-м 14 (489) 78 3 (55) 77.6
СД-ж 6 (105) 28.3 2 (34) 1.0
СД-м 8 (242) 77 2 (34) 68.5
УО-ж 4 (137) 49 1 (21) 69.8
УО-м 4 ( 137) 71.4 1 (21) 72.7
Возраст ТР 12 (409) 20 5 (104) 34.5
РАС 14 (489 17.8 3 (55) 12.4
СД 8 (242) 12.2 2 (34) 2.6
УО 2 (49) 9 3 (48) 18.9
Психоневрологическое состояние ТР 10 (352) 73 2 (34) 56.7
РАС 16 (540) 73.5 6 (84) 53
СД 8 (264) 78.5 2 (34) 64.9
Эмоциональное
состояние
ТР 6 (250) 49.4 5 (90) 39.8
РАС 3 (167) 61 4 (49) 54
СД 7 (364) 62.3    
Значение ТР 5 (230) 72.3    
РАС 4 (144) 47.9    
СД 2 (46) 24    

* ж – женский пол, м – мужской.

Возраст детей все группы аудиторов определяют плохо, указывая на более низкий возраст, чем реальный, при лучшем определении возраста ТР детей и худшем – детей с СД иностранными слушателями (указанный возраст на 4.4 ± 0.3 года ниже реального). Русские аудиторы указывали возраст ТР детей ниже реального на 1.0 ± ± 1.5 лет, детей с РАС – на 2.8 ± 2.1 лет, детей с СД – на 2.7 ± 1.4 года, детей с УО на 3.0 ± 1.4 года.

Русские и иностранные аудиторы правильно определяют речевой материал ТР детей как принадлежащий детям с типичным развитием; речевые сигналы детей с СД – как сигналы детей с нарушениями развития. Речевые сигналы детей с РАС русские аудиторы правильно относят к категории сигналов, принадлежащих детям с нарушениями развития, иностранные – справляются с заданием хуже.

При распознавании эмоционального состояния ребенка по его речевым сигналам показано, что русские аудиторы дают больше правильных ответов для детей с СД. Для детей с РАС (тесты слушали русские и иностранные аудиторы) большое число правильных ответов обусловлено практически однозначным распознаванием аудиторами дискомфортного состояния у детей с РАС.

Пол, эмоциональное и психоневрологическое состояние информанта, в меньшей степени – возраст, находят отражение в паралингвистической информации, поэтому эти задания были предложены для выполнения русским и иностранным слушателям. Задание на распознавание лексического значения речевого материала выполняли только русские аудиторы, так как для его выполнения требуется опора на лингвистическую информацию.

Аудиторы лучше определили значение речевого материала ТР детей, детей с РАС, хуже – детей с СД (табл. 2).

Влияние организации тестовых последовательностей на распознавание аудиторами информации о ребенке при прослушивании его речи

Регрессионный и множественный регрессионный анализ, проведенные по данным всех перцептивных экспериментов, выявили корреляции между возрастом, полом и вероятностью распознавания состояния детей аудиторами, организацией тестового материала и заданием для аудиторов.

На основе множественного регрессионного анализа показано, что правильное распознавание состояния ТР детей (как типичное развитие), детей с РАС и с СД (нарушение развития) связано с опытом аудитора (профессиональным) и его языком (русским), речевым материалом (слова, слова и фразы), включенным в тестовые последовательности. На распознавание психоневрологического состояния ТР детей и детей с РАС влияет задание для аудиторов (чем больше заданий, тем хуже распознавание); на распознавание состояния ТР детей и детей с СД дополнительное влияние оказывает количество детей, чей материал представлен в тесте (табл. 3).

Таблица 3.

Связь между организацией тестовых последовательностей, индивидуальными особенностями аудиторов и правильным распознаванием психоневрологического состояния детей с ТР, РАС и СД. Данные множественного регрессионного анализа*

R2 F Независимые переменные β SE B SE-B t p-
уровень
Зависимые переменные:
Психоневрологическое состояние детей
ТР                                                                                                                                                                   t(32)
0.553 (9, 32)
4.395
Количество детей –1.887 0.696 –4.866 1.796 –2.709 0.01
Речевой материал 0.638 0.308 8.086 3.9 2.073 0.046
Задание для аудиторов –2.101 0.567 –1.563 0.42 –3.716 0.001
Опыт аудитора –0.78 0.154 –6.834 1.348 –5.709 0.001
Язык аудитора 0.345 0.123 21.781 7.743 2.806 0.008
РАС                                                                                                                                                                 t(97)
0.697 (9, 97)
24.843
Речевой материал 0.319 0.092 6.175 1.795 3.439 0.001
Задание для аудиторов –0.694 0.11 –1.063 0.169 –6.302 0.001
Опыт аудитора 0.321 0.821 3.634 0.931 3.903 0.001
Язык аудитора 0.293 0.062 23.448 4.972 4.716 0.001
СД                                                                                                                                                                   t(28)
0.926 (9, 28)
38.884
Количество детей 1.22 0.428 10.391 3.651 2.846 0.008
Количество сигналов –0.418 0.083 –1.01 0.202 –4.996 0.001
Речевой материал 0.33 0.127 9.095 3.499 2.599 0.014
Опыт аудитора 0.238 0.067 4.24 1.208 3.508 0.001
Язык аудитора 0.298 0.053 37.778 6.942 5.586 0.001

* R2 – коэффициент корреляции; SE – стандартная ошибка; B – коэффициент регрессии.

Определение эмоционального состояния ТР детей и детей с РАС связано с заданием для аудиторов и количеством аудиторов, прослушивающих тесты. Выявлена отрицательная корреляция между сложностью задания для слушателей и распознаванием эмоционального состояния ТР детей; для детей с РАС более сложное задание для аудиторов связано с лучшим распознаванием эмоционального состояния по речи. Эмоциональное состояние детей с TР распознается лучше, если количество аудиторов, прослушивающих тест, меньше. Распознавание эмоционального состояния детей с РАС положительно связано с количеством речевых сигналов в тесте, речевым материалом (распознавание лучше, если речевой материал представлен вокализациями, а не словами и фразами), опытом аудитов и их родным языком (русским) (табл. 4).

Таблица 4.  

Связь между организацией тестовых последовательностей, индивидуальными особенностями аудиторов и правильным распознаванием эмоционального состояния детей с ТР и РАС. Данные множественного регрессионного анализа *

R2 F Независимые переменные β SE B SE-B t p-
уровень
Зависимые переменные:
Эмоциональное состояние детей
ТР                                                                                                                                                                 t(37)
0.795 (5, 37)
28.773
Задание –1.015 0.907 –0.573 0.052 –11.172 0.001
Количество
аудиторов
–0.775 0.091 –0.148 0.017 –8.482 0.001
РАС                                                                                                                                                              t(25)
0.996 (7, 25)
881.38
Количество сигналов 0.295 0.02 0.475 0.033 14.285 0.001
Речевой материал –0.803 0.03 –17.627 0.672 –26.202 0.001
Задание 3.427 0.139 1.92 0.078 24.591 0.001
Опыт аудитора 3.914 0.147 0.781 0.029 26.616 0.001
Язык аудитора 0.605 0.014 5.95 1.139 42.572 0.001

* R2 – коэффициент корреляции; SE – стандартная ошибка; B – коэффициент регрессии.

Определение лексического значения речевого материала ТР детей связано со степенью сложности речевого материала в тесте (R2 = 0.813, F(1, 9) = 39.068, β = 0.902, p < 0.001) – регрессионный анализ; для детей с РАС – с опытом аудиторов (R2 = 0.516, F(1, 8) = 8.512, β = 0.718, p < 0.01); речевым материалом (фразы) (R2 = 0.92, F(2, 7) = 40.631) (β = 0.553, p < 0.003), возрастом детей (β =0.539, p < 0.003) – множественный регрессионный анализ; для детей с СД – с речевым материалом в тесте (фразы) (R2 = 0.854, F(1, 4) = 320.33, β = 0.994, p < 0.001) и опытом аудиторов (R2 = 0.988, F(1, 4) = 320.33, β = 0.993, p < 0.001).

На определение возраста ТР детей оказывает влияние только задание, которое дается аудиторам; возраста детей с РАС – речевой материал в тесте, задание аудиторам, язык аудитора (русский) (табл. 5). Определение возраста детей с СД связано с речевым материалом детей (слов, так как ребенок произносит их более четко, чем фразы) (R2 = 0.272, F(1, 17) = 6.344, β = –0.522, p < 0.001).

Таблица 5.  

Связь между организацией тестовых последовательностей, индивидуальными особенностями аудиторов и правильным распознаванием возраста детей с ТР и РАС. Данные множественного регрессионного анализа*

R2 F Независимые переменные β SE B SE-B t p-
уровень
Зависимые переменные:
Возраст детей
ТР                                                                                                                                               t(17)
0.804 (7, 17)
9.985
Задание 1.488 0.636 1.815 0.776 2.339 0.02
РАС                                                                                                                                            t(50)
0.535 (7, 50)
8.217
Речевой материал 0.525 0.154 13.146 3.867 3.399 0.001
Задание 0.391 0.118 3.496 1.058 3.302 0.001
Язык аудитора 0.326 0.112 24.585 8.094 2.913 0.005

* R2 – коэффициент корреляции; SE – стандартная ошибка; B – коэффициент регрессии.

На определение пола ТР детей и детей с атипичным развитием влияют практически все факторы, анализируемые в данной работе (табл. 6).

Таблица 6.  

Связь между организацией тестовых последовательностей, индивидуальными особенностями аудиторов и правильным распознаванием пола детей с ТР, РАС и СД. Данные множественного регрессионного анализа*

R2 F Независимые переменные β SE B SE-B t p-
уровень
Зависимые переменные:
Пол детей
ТР-ж                                                                                                                                           t(30)
0.956 (9, 30)
73.024
Количество детей 1.795 1.192 9.02 0.964 9.361 0.001
Количество сигналов –0.423 0.177 –0.353 0.148 –2.39 0.02
Речевой материал 1.071 0.159 23.344 3.471 6.726 0.001
Задание –1.19 0.260 –3.374 0.483 6.99 0.001
Опыт аудитора 0.09 0.039 2.493 1.008   0.006
ТР-м                                                                                                                                           t(39)
0.96 (9, 39)
105.63
Количество сигналов 1.193 0.141 0.823 0.09 9.141 0.001
Речевой материал 0.974 0.083 15.837 1.354 11.696 0.001
Возраст детей 0.12 0.057 0.542 0.261 2.074 0.004
Количество аудиторов –0.455 0.054 –0.185 0.022 –8.396 0.001
Язык аудитора 0.176 0.039 7.747 1.725 4.492 0.001
РАС-ж                                                                                                                                        t(48)
0.906 (9, 48)
62.034
Кол-во детей 0.391 0.143 3.074 1.126 2.703 0.008
Речевой материал 0.837 0.067 29.056 2.350 12.36 0.001
Задание –0.841 0.071 –2.368 0.211 –11.77 0.001
Количество аудиторов 0.399 0.085 1.168 0.348 4.695 0.001
Язык аудитора 0.282 0.066 29.137 6.85 4.252 0.001
РАС-м                                                                                                                                        t(63)
0.73 (9, 63)
33.714
Количество сигналов 0.429 0.148 0.404 0.139 2.895 0.005
Речевой материал 1.021 0.097 12.468 1.179 10.578 0.001
Возраст детей –0.202 0.086 –0.894 0.383 2.336 0.022
Задание –0.904 0.099 1.117 0.11 –9.147 0.001
Количество аудиторов 0.241 0.103 0.274 0.117 2.334 0.022
СД-ж                                                                                                                                          t(22)
0.95 (7, 22)
59.688
Количество детей 0.788 0.116 –2.782 0.411 6.75 0.001
Количество аудиторов 0.301 0.132 0.019 0.008 2.29 0.03

* R2 – коэффициент корреляции; SE – стандартная ошибка; B –коэффициент регрессии; ж – женский пол, м – мужской пол.

Определение пола по речи девочек с РАС вызывает трудности при сложном задании для аудиторов, на определение мужского пола влияет задание для аудиторов и возраст детей – пол детей старшего возраста распознается по их речевым сигналам хуже, чем пол детей младшего возраста. Статистически значимые зависимости определены только для распознавания женского пола детей с СД (распознается хуже, чем пол ТР девочек и девочек с РАС) – на распознавание женского пола влияет количество детей, чей речевой материал представлен в тесте, и число аудиторов, прослушивающих тест.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Результаты проведенного исследования показали, что взрослые способны правильно распознавать пол детей, их психоневрологическое состояние, но испытывают затруднения при определении эмоционального состояния детей и лексического значения речевого материала, плохо распознают возраст, особенно возраст детей с атипичным развитием. Организация тестовых последовательностей и индивидуальные особенности аудиторов влияют на распознавание информации, содержащейся в голосе и речи детей. Результаты исследования в целом согласуются с результатами исследований других авторов [1, 7, 10].

Особенности распознавания аудиторами возраста детей с типичным и атипичным развитием могут быть обусловлены существованием разных траекторий развития. Результаты нашего исследования показали, что слушатели плохо распознают возраст детей по их речи, что касается даже ТР детей. В работе, посвященной восприятию возраста по речи 120 детей – мальчиков и девочек 8–18 лет [30], показано, что аудиторы лучше распознают возраст детей по предложениям, чем по изолированным гласным [30]. В другом исследовании [31] показано, что взрослые могут достаточно точно определить возраст по голосу детей (5 девочек и 5 мальчиков) 5–18 лет (±1.8 года), когда речевые высказывания представлены изолированными слогами, что, как предполагают авторы, объясняется различиями в акустических характеристиках речи. Результаты нашего перцептивного исследования показали, что определение возраста ТР детей связано только со сложностью задания для аудиторов и не зависит от речевого материала, включенного в тест. Речевой материал влияет на распознавание возраста детей с РАС – их возраст лучше распознается по фразам, чем по отдельным словам.

Наше мнение совпадает с позицией авторов статьи [31], которые отмечают, что определение возраста детей по речи является сложной задачей. Индивидуальные темпы созревания структур речевого тракта, изменения их конфигурации и размеров [32], становления речевого дыхания обуславливают значительные различия в характеристиках голоса детей одного возраста. Трудности при определении возраста детей с атипичным развитием также связаны с возрастной динамикой изменения структур речевого тракта [32] и усугубляются наличием заболевания в анамнезе ребенка.

Показано, что у детей с СД разборчивость речи улучшается с возрастом, особенно в возрасте от 4 до 16 лет [33], тогда как у ТР детей разборчивость речи повышается в основном в дошкольном возрасте. Развитие невербальных навыков детей с СД соответствует траектории общего интеллектуального развития ребенка, дефицит вербальных навыков со временем проявляется сильнее [34]. Систематический обзор данных не выявил существенных различий между детьми с СД и ТР по акустическим характеристикам речи, при этом исследования аэродинамических параметров показывают, что у детей с СД наблюдаются значительные нарушения в работе голосовых складок [35].

Сложности при распознавании возраста детей с РАС могут быть связаны с высокими значениями частоты основного тона [например, 12], что приводит к отнесению их речевых сигналов к младшему возрасту и классификации речевых сигналов мальчиков как сигналов девочек [4].

В исследовании установлено, что профессиональный опыт слушателей имеет значение для распознавания лексического значения речи и психоневрологического состояния ребенка. Наши результаты не полностью согласуются с данными [36] о том, что пол и опыт слушателя существенно не влияют на оценку разборчивости речи людей с нарушениями речи (дизартрия). Возможно, это связано с более яркими проявлениями нарушений речи при дизартрии, которые не наблюдаются у детей с атипичным развитием. Следует также учитывать специфику речи, обусловленную разными заболеваниями детей. Показано, что непрофессиональные слушатели могут отличать атипичных детей от типичных вне контекста ситуации взаимодействия, основываясь исключительно на разборчивости речи [37].

Представленное исследование моделирует ситуацию, с которой человек, разговаривающий по телефону, постоянно сталкивается в реальной жизни – выносит суждение о собеседнике без опоры на визуальный контекст.

Наше исследование позволяет говорить об идентификации нарушений развития по голосу человека при сложной и разнообразной организации речевого материала. Определение пола, возраста и состояния собеседника, в нашем исследовании – детей разного возраста с нарушениями развития, представляет практический интерес, поскольку может быть основой взаимодействия человека и компьютера при разработке игр и образовательных программ для детей с атипичным развитием.

Неинвазивный характер перцептивных исследований имеет значение для решения проблемы классификации голосов на соответствующие норме и патологические. Данные перцептивного анализа вносят вклад в формирование представлений о профиле нарушений голоса и речи у информантов с СД, РАС, УО, что имеет значение для будущих исследований в области клинической диагностики и лечения. Наши данные, впервые полученные на материале русского языка, могут стать основой для создания приложений для ранней диагностики нарушений развития ребенка.

Результаты исследования показали, что взрослые могут правильно распознавать пол и психоневрологическое состояние детей, однако испытывают трудности с определением эмоционального состояния и лексического значения речевого материала, плохо распознают возраст, в особенности возраст детей с атипичным развитием.

Речевой материал (слова, фразы, речевые конструкции), сложность теста, количество детей, чей речевой материал включен в тесты, связаны преимущественно с распознаванием пола и возраста детей; количество сигналов в тесте связано с определением пола и психоневрологического состояния; речевой материал связан с распознаванием лексического значения.

Индивидуальные особенности аудиторов: профессиональный опыт влияет на распознавание лексического значения речевого материала и психоневрологического состояния ребенка; родной язык слушателя влияет на распознавание эмоционального состояния ребенка. Эти результаты указывают на необходимость учета перечисленных факторов при проведении перцептивных экспериментов с детской речью.

Список литературы

  1. Gelfer MP (1988) Perceptual attributes of voice: Development and use of rating scales. J Voice 2: 320–326. https://doi.org/10.1016/S0892-1997(88)80024-9

  2. Bruckert L, Liénard JS, Lacroix A, Kreutzer M, Leboucher G (2006) Women use voice parameters to assess men’s characteristics. Proc Biol Sci 273: 83–89. https://doi.org/10.1098/rspb.2005.3265

  3. Goy H, Kathleen Pichora-Fuller M, van Lieshout P (2016) Effects of age on speech and voice quality ratings. J Acoust Soc Am 139(4): 1648. https://doi.org/10.1121/1.4945094

  4. Lyakso E, Frolova O, Grigorev A (2017) Perception and acoustic features of speech of children with autism spectrum disorders. Lecture Notes in Computer Science 10458:602–612. https://doi.org/10.1007/978-3-319-66429-3_60

  5. Lausen A, Schacht A (2018) Gender differences in the recognition of vocal emotions. Front Psychol 9: 882. https://doi.org/10.3389/fpsyg.2018.00882

  6. Verkhodanova V, Trckova D, Coler M, Lowie W (2020) More than words: Cross-linguistic exploration of Parkinson’s disease identification from speech. Lecture Notes in Computer Science 12335: 613–623. https://doi.org/10.1007/978-3-030-60276-5_59

  7. Jones HN, Crisp KD, Kuchibhatla M, Mahler L, Risoli ThJr, Jones CW, Kishnani P (2019) Auditory-perceptual speech features in children with Down syndrome. Am J Intellect Dev Disabil 124(4): 324–338. https://doi.org/10.1352/1944-7558-124.4.324

  8. O’ Leary D, Lee A, O’Toole C, Gibbon F (2020) Perceptual and acoustic evaluation of speech production in Down syndrome: A case series. Clin Linguist Phon 34(1–2): 72–91. https://doi.org/10.1080/02699206.2019.1611925

  9. Lyakso EE, Frolova OV (2020) Early development indicators predict speech features of autistic children. ICMI '20 Companion: Compan Publicati of the 2020 Int Confer on Multimodal Interaction 514–521. https://doi.org/10.1145/3395035.3425183

  10. Kent RD (2009) Perceptual sensorimotor speech examination for motor speech disorders. In: McNeil MR (ed) Clinical management of sensorimotor speech disorders. Thieme 19–29.

  11. Diehl J, Paul R (2013) Acoustic and perceptual measurements of prosody production on the profiling elements of prosodic systems by children with autism spectrum disorders. Appl Psycholinguist 34(1): 135–161. https://doi.org/10.1017/S0142716411000646

  12. Bonneh YS, Levanov Y, Dean-Pardo O, Lossos L, Adini Y (2011) Abnormal speech spectrum and increased pitch variability in young autistic children. Front Hum Neurosci 4(237): 1–7. https://doi.org/10.3389/fnhum.2010.00237

  13. Nakai Y, Takashima R, Takiguchi T, Takada S (2014) Speech intonation in children with autism spectrum disorder. Brain & Development 36: 516–522. https://doi.org/10.1016/j.braindev.2013.07.006

  14. Whyte EM, Nelson KE (2015) Trajectories of pragmatic and nonliteral language development in children with autism spectrum disorders. J Commun Disord 54: 2–14. https://doi.org/10.1016/j.jcomdis.2015.01.001

  15. Alqhazo MT, Hatamleh LS, Bashtawi M (2018) Phonological and lexical abilities of Jordanian children with autism. Appl Neuropsychol Child 9(2): 116–124. https://doi.org/10.1080/21622965.2018.1534690

  16. Kanner L (1943) Autistic disturbances of affective contact. Nervous Child 2: 217–250.

  17. Filipe MG, Frota S, Castro SL, Vicente SG (2014) Atypical prosody in Asperger syndrome: perceptual and acoustic measurements. J Autism Dev Disord 44(8): 1972–1981. https://doi.org/10.1007/s10803-014-2073-2

  18. Sharda M, Subhadra TP, Sahaya S, Nagaraja Ch, Singh L, Mishra R, Sen A, Singhal N, Erickson D, Singh N (2010) Sounds of melody — Pitch patterns of speech in autism. Neurosci Lett 478(1): 42–45. https://doi.org/10.1016/j.neulet.2010.04.066

  19. Chen F, Cheung CCh, Peng G (2021) Linguistic tone and non-linguistic pitch imitation in children with autism spectrum disorders: A cross-linguistic investigation. J Autism Dev Disord. https://doi.org/10.1007/s10803-021-05123-4

  20. Paul R, Augustyn A, Klin A, Volkmar F (2005) Perception and production of prosody by speakers with autism spectrum disorders. J Autism Dev Disord 35: 205–220. https://doi.org/10.1007/s10803-004-1999-1

  21. Kanamori G, Witter M, Brown J, Williams-Smith L (2000) Otolaryngologic manifestations of Down syndrome. Otolaryngol Clin North Am 33(6): 1285–1292. https://doi.org/10.1016/s0030-6665(05)70281-4

  22. Kent RD, Vorperian HK (2013) Speech impairment in Down syndrome: a review. J Speech Lang Hear Res 56: 178–210. https://doi.org/10.1044/1092-4388(2012/12-0148)

  23. Moura CP, Cunha LM, Vilarinho H, Cunha MJ, Freitas D, Palha M, Pais-Clemente M (2008) Voice parameters in children with Down syndrome. J Voice 22: 34–42. https://doi.org/10.1016/j.jvoice.2006.08.011

  24. Carl M., Kent RD, Levy ES, Whalen DH (2020) Vowel acoustics and speech intelligibility in young adults with Down syndrome. J Speech Lang Hear Res 63(3): 674–687. https://doi.org/10.1044/2019_JSLHR-19-00204

  25. Городный ВА, Ляксо ЕЕ (2018) Характеристика речи детей 6‒7 лет с расстройствами аутистического спектра и синдромом Дауна. Теорет и приклад лингвистика 2: 22‒37. https://doi.org/10.22250/2410-7190_2018_4_2_22_37

  26. Cleland J, Wood S, Hardcastle W, Wishart J, Timmins C (2010) Relationship between speech, oromotor, language and cognitive abilities in children with Down’s syndrome. Int J Lang Commun Disord 45(1): 83–95. https://doi.org/10.3109/13682820902745453

  27. Kaiser AP, Hester PP, McDuffie AS (2001) Supporting communication in young children with developmental disabilities. Ment Retard Dev Disabil Res Rev 7(2): 143–150. https://doi.org/10.1002/mrdd.1020

  28. Lyakso E, Frolova O, Kaliyev A, Gorodnyi V, Grigorev A, Matveev Y (2019) AD-Child.Ru: Speech corpus for Russian children with atypical development. Lecture Notes in Computer Sci 11658: 299–308. https://doi.org/10.1007/978-3-030-26061-3_31

  29. Polišenská K, Kapalková S, Novotková M (2018) Receptive language skills in Slovak-speaking children with intellectual disability: Understanding words, sentences, and stories. J Speech Lang Hear Res 61(7): 1731–1742. https://doi.org/10.1044/2018_JSLHR-L-17-0029

  30. Amir O, Engel M, Shabtai E, Amir N (2012) Identification of children’s gender and age by listeners. J Voice 26(3): 313–321. https://doi.org/10.1016/j.jvoice.2011.06.001

  31. Barreda S, Assmann PF (2018) Modeling the perception of children’s age from speech acoustics. J Acoust Soc Am 143(5): EL361–EL366. https://doi.org/10.1121/1.5037614

  32. Vorperian HK, Wang S, Chung MK, Schimek EM, Durtschi RB, Kent RD, Gentry LR (2009) Anatomic development of the oral and pharyngeal portions of the vocal tract: An imaging study. J Acoust Soc Am 125(3): 1666–1678. https://doi.org/10.1121/1.3075589

  33. Wild A, Vorperian HK, Kent RD, Bolt DM, Austin D (2018) Single-word speech intelligibility in children and adults with Down syndrome. Am J Speech Lang Pathol 27(1): 222–236. https://doi.org/10.1044/2017_AJSLP-17-0002

  34. Carvajal F, Iglesias J (2006) Judgements of facial and vocal signs of emotion in infants with Down syndrome. Dev Psychobiol 48(8): 644–652. https://doi.org/10.1002/dev.20173

  35. Krishnamurthya R, Ramani SA (2020) Aerodynamic and acoustic characteristics of voice in children with Down syndrome — A systematic review. Int J Pediatr Otorhinolaryngol 133:109946. https://doi.org/10.1016/j.ijporl.2020.109946

  36. Walshe M, Miller N, Leahy M, Murray A (2010) Intelligibility of dysarthric speech: perceptions of speakers and listeners. Int J Lang Commun Disord 43(6): 633–648. https://doi.org/10.1080/13682820801887117

  37. Redford MA, Kapatsinski V, Cornell-Fabiano J (2018) Lay listener classification and evaluation of typical and atypical children’s speech. Lang Speech 61(2): 277–302. https://doi.org/10.1177/0023830917717758

Дополнительные материалы отсутствуют.