Физиология человека, 2023, T. 49, № 4, стр. 30-40

Роль среднего мозга в восприятии тональных последовательностей и речи: анализ индивидуальных наблюдений

Л. Б. Окнина 1*, А. О. Канцерова 1, Д. И. Пицхелаури 2, В. В. Подлепич 2, Г. В. Портнова 1, И. А. Зибер 3, Я. О. Вологдина 12, А. А. Слезкин 14, А. М. Ланге 5, Е. Л. Машеров 2, Е. В. Стрельникова 1

1 ФГБУН Институт высшей нервной деятельности и нейрофизиологии РАН
Москва, Россия

2 ФГАУ НМИЦ нейрохирургии имени академика Н.Н. Бурденко Минздрава РФ
Москва, Россия

3 Национальный исследовательский институт “Высшая школа экономики”
Москва, Россия

4 ФГБОУ ВО Российский технологический университет (МИРЭА)
Москва, Россия

5 Сколковский институт науки и технологий
Москва, Россия

* E-mail: leliia@yandex.ru

Поступила в редакцию 25.05.2022
После доработки 10.11.2022
Принята к публикации 31.01.2023

Аннотация

Человеческая речь представляет собой сложную комбинацию звуков, слуховых событий. В настоящее время нет единого мнения о том, как происходит восприятие речи. Реагирует ли мозг на каждый звук в потоке речи отдельно или в звуковых рядах выделяются дискретные единицы, анализируемые мозгом как одно звуковое событие. В данном пилотном исследовании проанализированы ответы среднего мозга человека на простые звуки, комбинации простых тонов (“сложные” звуки) и лексические стимулы. Работа представляет собой описание единичных случаев, полученных в рамках интраоперационного мониторинга во время хирургического лечения опухоли глубинных срединно расположенных опухолей головного мозга или ствола мозга. В исследование включены данные регистрации потенциалов ближнего поля из среднего мозга у 6 пациентов (2 женщины, 4 мужчины). Были выделены S- и Е-комплексы, возникающие при начале и окончании звучания, а также S-комплексы, возникающие при смене структуры звука. Полученные данные позволяют предположить, что выделенные комплексы являются маркерами первичного кодирования звуковой информации и генерируются структурами нейронной сети, обеспечивающей восприятие и анализ речи.

Ключевые слова: средний мозг, вызванные потенциалы, восприятие речи, восприятие звуков, связанные с событиями потенциалы.

Список литературы

  1. Renals S., Hain T. Speech Recognition / The Handbook of Computational Linguistics and Natural Language Processing // Eds. Clark A., Fox C., Lappin S. Blackwells, 2010. Chapter 12. P. 299.

  2. Attneave F., Olson R.K. Pitch as a medium: a new approach to psychophysical scaling // Am. J. Psychol. 1971. V. 84. № 2. P. 147.

  3. Boruta L., Peperkamp S., Crabbé B., Dupoux E. Testing the Robustness of Online Word Segmentation: Effects of Linguistic Diversity and Phonetic Variation / Proceedings of the 2nd Workshop on Cognitive Modeling and Computational Linguistics. Portland. Oregon. USA, 2011. P. 1.

  4. Boruta L. A note on the generation of allophonic rules [электронный ресурс]. RT-0401. 2011. inria-00559270v1.

  5. Kuhl P.K. Early language acquisition: Cracking the speech code // Nat. Rev. Neurosci. 2004. V. 5. № 11. P. 831.

  6. Shea C., Curtin S. Discovering the relationship between context and allophones in a second language: evidence for distribution-based learning // Stud. Second Lang. Acquis. 2010. V. 32. № 4. P. 581.

  7. Kazanina N., Phillips C., Idsardi W. The influence of meaning on the perception of speech sounds // Proc. Natl. Acad. Sci. U.S.A. 2006. V. 103. № 30. P. 11381.

  8. Shahin K., Johnson K. Acoustic and Auditory Phonetics // Language. 1999. V. 75. № 4. P. 870.

  9. Micheyl C., Xiao L., Oxenham A.J. Characterizing the dependence of pure-tone frequency difference limens on frequency, duration, and level // Hear. Res. 2012. V. 292. № 1–2. P. 1.

  10. Oxenham A.J. How We Hear: The Perception and Neural Coding of Sound // Annu. Rev. Psychol. 2018. V. 69. № 1. P. 27.

  11. Lau B.K., Mehta A.H., Oxenham A.J. Superoptimal perceptual integration suggests a place-based representation of pitch at high frequencies // J. Neurosci. 2017. V. 37. № 37. P. 9013.

  12. Радионова Е.А. Опыты по физиологии слуха. Нейрофизиологические и психофизические исследования. СПб.: Ин-т физиологии им. И.П. Павлова, 2003. 256 с.

  13. Alavash M., Tune S., Obleser J. Modular reconfiguration of an auditory control brain network supports adaptive listening behavior // Proc. Natl. Acad. Sci. U.S.A. 2019. V. 116. № 2. P. 660.

  14. Столярова Э.И. Моделирование механизмов слуховой обработки речевых сигналов // Речевые технологии. 2010. № 2. С. 31.

  15. Hackett T.A., Barkat T.R., O’Brien B.M.J. et al. Linking topography to tonotopy in the mouse auditory thalamocortical circuit // J. Neurosci. 2011. V. 31. № 8. P. 2983.

  16. Guo W., Clause A.R., Barth-Maron A., Polley D.B. A Corticothalamic Circuit for Dynamic Switching between Feature Detection and Discrimination // Neuron. 2017. V. 95. № 1. P. 180.

  17. Moerel M., De Martino F., Formisano E. An anatomical and functional topography of human auditory cortical areas // Front. Neurosci. 2014. V. 8. P. 225.

  18. Herreras O. Local field potentials: Myths and misunderstandings // Front. Neural. Circuits. 2016. V. 10. P. 101.

  19. Nourski K.V., Steinschneider M., Rhone A.E. et al. Sound identification in human auditory cortex: Differential contribution of local field potentials and high gamma power as revealed by direct intracranial recordings // Brain Lang. 2015. V. 148. P. 37.

  20. Moses D.A., Mesgarani N., Leonard M.K., Chang E.F. Neural speech recognition: Continuous phoneme decoding using spatiotemporal representations of human cortical activity // J. Neural. Eng. 2016. V. 13. № 5. P. 056004.

  21. Частович Л.А. Физиология речи. Восприятие речи человеком. М.: “Книга по Требованию”, 2012. 386 с.

  22. Канцерова A.O., Окнина Л.Б. Пицхелаури Д.И. и др. Вызванные потенциалы среднего мозга, ассоциированные с началом и окончанием звучания простого тона // Физиология человека. 2022. Т. 48. № 3. С. 5. Kantserova A.O., Oknina L.B., Pitskhelauri D.I. et al. Evoked potentials of the midbrain associated with the beginning and end of a sound of a simple tone // Human Physiology. 2022. V. 48. № 3. P. 229.

  23. Tadel F., Baillet S., Mosher J.C. et al. Brainstorm: A user-friendly application for MEG/EEG analysis // Comput. Intell. Neurosci. 2011. V. 2011. P. 879716.

  24. Shen Y. Some Allophones Can Be Important // Language Learning. 1959. V. 9. № 1–2. P. 7.

  25. Richter C. Learning Allophones: What Input Is Necessary ? / Proceedings of the 42nd annual Boston University Conference on Language Development. United States. Boston (3–5 November 2017). Cascadilla Press, 2018. P. 659.

  26. Mitterer H., Reinisch E., McQueen J.M. Allophones, not phonemes in spoken-word recognition // J. Mem. Lang. 2018. V. 98. P. 77.

  27. Davis M.H., Sohoglu E., Peelle J.E., Carlyon R.P. Predictive top-down integration of prior knowledge during speech perception // J. Neurosci. 2012. V. 32. № 25. P. 8443.

  28. McClelland J.L., Elman J.L. The TRACE model of speech perception // Cogn. Psychol. 1986. V. 18. № 1. P. 1.

  29. Scott S.K., Johnsrude I.S. The neuroanatomical and functional organization of speech perception // Trends Neurosci. 2003. V. 26. № 2. P. 100.

  30. Poeppel D., Hickok G. The cortical organization of speech processing // Nat. Rev. Neurosci. 2007. V. 8. № 5. P. 393.

  31. Anwander A., Tittgemeyer M., Cramon D.Y. et al. Connectivity-based parcellation of Broca’s area // Cereb. Cortex. 2007. V. 17. № 4. P. 816.

  32. Frey S., Campbell J.S.W., Pike G.B., Petrides M. Dissociating the human language pathways with high angular resolution diffusion fiber tractography // J. Neurosci. 2008. V. 28. № 45. P. 11435.

Дополнительные материалы отсутствуют.