Журнал высшей нервной деятельности им. И.П. Павлова, 2019, T. 69, № 1, стр. 37-50

СВЯЗЫВАНИЕ ПРИЗНАКОВ В ЗРИТЕЛЬНОЙ МОДАЛЬНОСТИ ЗАВИСИТ ОТ ВНИМАНИЯ: АНАЛИЗ НЕГАТИВНОСТИ РАССОГЛАСОВАНИЯ

К. Э. Сайфулина 12*, И. Е. Лазарев 13, Е. Г. Чернышева 1, Б. В. Чернышев 12

1 Национальный исследовательский университет “Высшая школа экономики”
Москва, Россия

2 Московский государственный университет им. М. В. Ломоносова
Москва, Россия

3 Институт медико-биологических проблем РАН
Москва, Россия

* E-mail: kseniasayfulina@gmail.com

Поступила в редакцию 23.10.2017
После доработки 15.01.2018
Принята к публикации 05.03.2018

Полный текст (PDF)

Аннотация

Исследование посвящено разрешению вопроса, необходимо ли внимание для связывания признаков в зрительной модальности. Испытуемые выполняли задачу на различение зрительных стимулов – решеток Габора, характеризовавшихся двумя признаками: пространственной частотой и углом наклона. Детекция девиантных стимулов на фоне стандартных была возможна исключительно по сочетанию признаков, но не по отдельным признакам. Анализировали вызванные потенциалы при четырех экспериментальных условиях: селективное внимание к целевому стимулу; селективное игнорирование нецелевого стимула; распределенное внимание ко всем зрительным стимулам; межмодальное отвлечение внимания от зрительной модальности к слуховой модальности. Негативность рассогласования достоверно присутствовала только в случае внимания к зрительным стимулам – как селективного, так и распределенного. Полученные результаты показали, что связывание признаков происходило лишь при условии внимания к зрительным стимулам.

Ключевые слова: вызванные потенциалы, связывание признаков, негативность рассогласования, оддболл, зрительное восприятие

ВВЕДЕНИЕ

Сенсорное восприятие объектов окружающего мира и инициализация ответных адаптивных поведенческих реакций требует не только анализа множества отдельных признаков объектов, но и их интеграцию, обеспечивающую формирование в мозге целостных репрезентаций каждого объекта [Kahneman et al., 1992; Hommel, 1998; 2004; Schneegans, 2017]. К настоящему времени фундаментальные физиологические механизмы кодирования признаков сенсорных стимулов в целом известны [Bartels, Zeki, 1998; Livingstone, Hubel, 1988], однако поиск механизмов интеграции, или связывания признаков, остается актуальным до настоящего времени. Существенно, что до сих пор остается неясной степень вовлечения в механизм нисходящих процессов: в первую очередь, требуется ли для этого внимание [Treisman, 1996], или связывание реализуется исключительно за счет низкоуровневых сенсорных процессов.

Согласно теории интеграции признаков Э.Трейсман, восприятие объектов осуществляется в две стадии: на первой стадии признаки объекта обрабатываются мозгом по отдельности, автоматически, параллельно и независимо, для чего внимание не требуется; на второй стадии, для успешного осуществления которой необходимо внимание, происходит объединение этих признаков, в результате чего формируется целостный образ объекта [Treisman, Gelade, 1980]. Теория основана преимущественно на результатах поведенческих экспериментов: так, зрительный поиск заданного объекта среди других занимает больше времени в том случае, когда он отличается от остальных по сочетанию признаков, чем в случае его отличия по одному признаку; при недостатке внимания показано возникновение ложных конъюнкций – ошибочного связывания признаков разных объектов [Treisman, Gelade, 1980].

Согласно противоположной точке зрения, связывание признаков – это автоматический процесс, происходящий в мозге на ранних стадиях обработки сенсорного сигнала. Этот взгляд основан на результатах анализа негативности рассогласования (НР), которая считается нейрофизиологическим коррелятом ранних, предвнимательных процессов [Näätänen, 1990; Kimura et al., 2011; Michie et al., 2016]. В исследовании И. Винклера [Winkler et al., 2005] было показано возникновение негативности рассогласования в ответ на девиантный стимул, характеризующийся сочетанием признаков, в условиях межмодального отвлечения внимания. Это позволило сделать вывод о том, что внимание для связывания признаков не требуется. Необходимо отметить, что отвлекающая задача в эксперименте могла быть недостаточно сложной, и в действительности внимание испытуемых к девиантному стимулу не было исключено. Кроме того, в указанной работе не были проанализированы эффекты распределения внимания между целевыми и нецелевыми стимулами в пределах одного зрительного потока стимулов.

Цель настоящей работы состояла в том, чтобы исследовать влияние внимания на связывание признаков зрительных стимулов с помощью анализа НР. В исследовании мы реализовали экспериментальные условия с более глубокими манипуляциями направленностью внимания: 1) внимание направлено на определенное сочетание (конъюнкцию) признаков в зрительной модальности (селективное внимание); 2) внимание направлено на другое сочетание признаков в той же модальности, в то время как данное сочетание признаков подвергается игнорированию (внутримодальное отвлечение внимания); 3) внимание распределено для обработки всех стимулов в текущей модальности (распределенное внимание); 4) внимание отвлечено на решение задачи в другой модальности (межмодальное отвлечение внимания). Мы использовали последовательность зрительных стимулов, в которых девиантные (частые) стимулы отличались от стандартных (редких) стимулов исключительно по сочетанию признаков, а не по отдельным признакам. Ориентируясь на то, что феномен НР отличается высокой надежностью и стабильностью [Kimura et al., 2011] и хорошо выражен даже при сложных контекстных отличиях конкретного стимула от ряда предшествующих ему стимулов [Sussman et al., 2007], а также поскольку в использованных нами последовательностях девиантные стимулы можно выделить исключительно по сочетаниям признаков, но не по отдельно взятым признакам, в настоящей работе мы рассматривали НР как индикатор связывания признаков.

Мы предположили, что негативность рассогласования будет хорошо выражена лишь при условии наличия внимания к соответствующим девиантным стимулам (как селективного, так и, в меньшей мере, распределенного). При условии отсутствия внимания к девиантному стимулу негативность рассогласования будет отсутствовать вследствие того, что без должной интеграции признаков девиантность стимулов не может быть детектирована.

МЕТОДИКА

В эксперименте приняли участие 28 добровольцев в возрасте от 18 до 28 лет (среднее ± стандартное отклонение = 20.7 ± 2.8; 14 испытуемых женского пола) без неврологических и психических расстройств, с нормальным зрением и слухом. Все испытуемые получали инструкцию хорошо выспаться перед экспериментом и воздержаться от употребления стимуляторов, таких как крепкий кофе или чай. Все испытуемые сообщали о хорошем самочувствии перед началом эксперимента, к его выполнению приступали после подписания информированного согласия об участии.

В качестве зрительных стимулов использовали черно-белые решетки Габора размером 4.9°, с пространственной частотой 0.6°, 0.3° и углами наклона 45°, 0°, –45° и 90° (рис. 1 (а)). Стимулы предъявляли в центре экрана на сером фоне, время предъявления стимулов составляло 200 мс, в промежутках между предъявлением стимулов в центре экрана появлялся центральный фиксационный стимул (небольшой черный крест), испытуемые получали инструкцию смотреть в центр экрана. В качестве слуховых стимулов использовались семь гласных звуков русского языка ([a], [о], [у], [и], [ю], [е], [э]), записанные с помощью машинного преобразования текста в речь (IVONA Software, Польша). Длительность каждого звукового стимула составляла 350 мс.

Рис. 1.

Зрительные стимулы и схема процедуры эксперимента. (а) – зрительные стимулы (решетки Габора): левая редкая (ЛР), правая редкая (ПР), левая частая (ЛЧ), правая частая (ПЧ), горизонтальная редкая (ГР), вертикальная редкая (ВР). (б) – схема процедуры эксперимента. Последовательности зрительных и слуховых стимулов предъявлялись одновременно и независимо друг от друга.

Fig. 1. Visual stimuli and schematic illustration of the experimental procedure. (а) – visual stimuli (Gabor gratings): left low frequency (ЛР), right low frequency (ПР), left high frequency (ЛЧ), right high frequency (ПЧ), horizontal low frequency (ГР), vertical low frequency (ВР). (б) – schematic illustration of the experimental procedure. Sequences of visual and auditory stimuli were presented simultaneously and independently from each other.

Предъявление стимулов и регистрацию ответов испытуемых производили с помощью программы Presentation (Neurobehavioral systems, Inc., США).

Основная часть эксперимента включала четыре типа блоков, в которых применяли полностью идентичную процедуру предъявления зрительных и слуховых стимулов (последовательности зрительных и последовательности слуховых стимулов предъявляли во всех данных блоках параллельно и независимо на протяжении всей длительности блока – см. рис. 1(б)), а блоки различались исключительно инструкцией испытуемому.

В качестве зрительных стимулов использовались решетки Габора четырех видов, различавшиеся по сочетанию (конъюнкции) двух признаков (пространственной частоты и угла наклона): редкая решетка с левым наклоном (ЛР, пространственная частота 0.6°, угол наклона –45°), редкая решетка с правым наклоном (ПР, 0.6°, +45°), частая решетка с левым наклоном (ЛЧ, 0.3°, –45°), и частая решетка с правым наклоном (ПЧ, 0.3°, +45°) (рис. 1 (а)). Два стимула – ЛР и ПЧ – были стандартными (частыми), частота предъявления каждого из них в последовательности зрительных стимулов составляла 45%, два других – ЛЧ и ПР – были девиантными (редкими), частота предъявления каждого из них составляла 5%. Стимулы предъявлялись в псевдослучайной последовательности. Временной интервал между моментами начала предъявления зрительных стимулов варьировался псевдослучайным образом в пределах 800 ± 100 мс (равномерное распределение).

Во всех основных блоках эксперимента одновременно со зрительной стимуляцией производилась слуховая стимуляция – предъявляли семь гласных звуков русского языка в псевдослучайном порядке с интервалом 2200 мс.

Длительность каждого из блоков составляла 8 мин, каждый блок включал предъявление 565 зрительных стимулов и 205 слуховых стимулов.

Зрительный блок (ЗБ). Испытуемый получал инструкцию нажимать на кнопку в ответ на предъявление на экране лишь одного из двух девиантных (редких) стимулов, заданного инструкцией (рис. 1 (а)); во время зачитывания инструкции изображение одного целевого стимула и трех остальных стимулов предоставлялось испытуемому на экране. Каждый испытуемый выполнял два различных ЗБ, в которых значение целевого и нецелевого девиантного стимулов было противоположным (в одном блоке девиант ПР назначался целевым стимулом, а девиант ЛЧ – нецелевым, в другом блоке значение стимулов было инвертировано – ЛЧ назначался целевым стимулом, а ПР – нецелевым); порядок следования двух вариантов данного блока был контрбалансирован по группе испытуемых. Испытуемому давали инструкцию игнорировать слуховые стимулы.

Моторный блок (МБ). Испытуемому давали инструкцию нажимать на кнопку в ответ на все зрительные стимулы (без выполнения задачи различения стимулов), а слуховые стимулы игнорировать. МБ всегда располагался между двумя ЗБ, чтобы минимизировать влияние эффектов обучения в предшествующих блоках после инверсии значения целевого и нецелевого стимулов.

Слуховой блок (СБ). Испытуемый получал инструкцию выполнять слуховую задачу “2-back” – нажимать на кнопку в момент, когда слышит звук, который предъявлялся до этого одну позицию назад (например, при последовательном предъявлении [a], [о], [a] на вторую [a] испытуемый должен был нажимать на кнопку). Псевдослучайная последовательность была сгенерирована таким образом, чтобы такие сочетания возникали с частотой 1:3. Испытуемый получал инструкцию игнорировать зрительные стимулы, но при этом смотреть на экран таким же образом, как и в остальных блоках.

Порядок блоков был контрбалансирован по группе испытуемых. Испытуемым до начала эксперимента с равной вероятностью назначали одну из четырех последовательностей блоков: СБ-ЗБ1-МБ-ЗБ2; СБ-ЗБ2-MБ-ЗБ1; ЗБ1-MБ-ЗБ2-СБ; ЗБ2-M-ЗБ1-СБ, где ЗБ1 – зрительный блок с целевым стимулом ПР, ЗБ2 – активный зрительный блок с целевым стимулом ЛЧ, МБ – моторный блок, СБ – слуховой блок.

Также в процедуру эксперимента были включены контрольный блок “пассивный оддболл” и “обучающий блок”.

“Пассивный оддболл”. Дополнительный блок был самым первым в эксперименте, его длительность составляла 230 с. Зрительными стимулами служили решетки Габора вертикальной и горизонтальной ориентации и низкой пространственной частоты (рис. 1 (а)). Соотношение частот предъявления стандартного стимула и девиантного стимула составляло 9:1. Временной интервал между моментами начала предъявления стимулов составлял 1000 ± 50 мс. Время предъявления стимула на экране – 200 мс. Слуховой стимуляции не осуществлялось, испытуемый получал инструкцию пассивно смотреть на экран без каких-либо дополнительных задач. Назначение данного контрольного блока состояло в том, чтобы в условиях настоящего эксперимента подтвердить степень выраженности, пространственную локализацию и время генерации НР в ответ на девиантный стимул, отличающийся от стандартного лишь по одному признаку, а не по сочетанию признаков.

Обучающий блок перед слуховым блоком предназначался для обучения испытуемых и всегда предшествовал слуховому блоку; длительность равнялась 5 мин. Во время блока на экране не возникало зрительных стимулов, предъявлялись только слуховые. Если доля правильных ответов испытуемого была ниже 0.5, то выполнение блока проводилось повторно.

Запись электроэнцефалограммы производили при помощи электроэнцефалографа actiCHamp (Brain Products, Германия) и программного пакета PyCorder (Brain Products, Германия). Запись вели от 60 активных хлорсеребряных электродов actiCap (Brain Products, Германия), установленных в соответствии с международной системой 10-10. Референтом служили объединенные мастоидные электроды. Также устанавливали электроокулографические электроды для регистрации вертикальной и горизонтальной окулограммы. Сопротивление всех электродов было ниже 10 кОм.

Обработку производили в среде MATLAB (MathWorks Inc., USA) c использованием пакетов EEGLAB [Delorme, Makeig, 2004] и ERPLAB [Lopez-Calderon, Luck, 2014]. В ходе обработки использовались скрипты, обращающиеся к встроенным функциям указанных пакетов. Первичная обработка данных включала удаление из записей артефактов различной природы, не связанных с движениями глаз, а также интерполяцию каналов с недостаточно высоким качеством записи ЭЭГ по соседним каналам. Следующий этап обработки включал удаление артефактов от движений глаз при помощи метода независимых компонент (ICA). Фильтрацию записей ЭЭГ производили в диапазоне 0.1–30 Гц. При построении вызванных потенциалов (ВП) коррекцию нулевой линии производили по предстимульному интервалу длительностью 100 мс. ВП усредняли отдельно по каждому условию.

Дизайн эксперимента позволял анализировать ВП для четырех условий:

1) активное селективное внимание (ВП на целевые девиантные стимулы в активных зрительных блоках – цЗБ);

2) активное игнорирование с внутримодальным переносом внимания (нецелевые игнорируемые девиантные стимулы в активных зрительных блоках – нЗБ);

3) распределенное внимание в пределах зрительной модальности (ВП на девиантные стимулы в моторном блоке – МБ);

4) межмодальное отвлечение внимания (ВП на девиантные стимулы в “слуховом блоке” – СБ).

Для вычисления дифференциальных ВП, необходимых для выявления НР, для каждого испытуемого из усредненной амплитуды ВП на девиантные стимулы вычитали усредненную амплитуду ВП на стандартные стимулы (при этом в анализ брали только стандартные стимулы из эпох, непосредственно предшествующих девиантным стимулам соответственно схеме каждого из четырех условий, указанных выше).

Временной интервал для измерения негативности рассогласования 100–180 мс был выбран по данным литературы [Czigler, Csibra, 1990; Winkler et al., 2005; Farkas et al., 2015] и в соответствии с результатами визуального анализа ВП по наличию отрицательного отклонения на дифференциальных ВП (рис. 2 (а)).

Рис. 2.

Усредненные зрительные ВП для блока “пассивный оддболл”. (а) – усредненные ВП в затылочной области интереса (O1, O2, Oz); (б) – усредненная карта разностного ВП в интервале 100–180 мс.

Fig. 2. Grand-average visual ERPs for the “passive oddball” block. (а) – grand-average visual ERPs over the occipital area of interest (O1, O2, Oz); (б) – grand-average differential scalp map within 100–180 ms interval after stimulus onset.

Затылочная область интереса для измерения негативности рассогласования в электродах O1, Oz, O2 была выбрана на основании данных литературы [Kimura et al., 2011; Pazo-Alvarez et al., 2003; Winkler et al., 2005], а также на основании визуального анализа карт разностных потенциалов, показавшего наибольшую амплитуду негативной волны в затылочных электродах O1, Oz, O2 (рис. 2 (б)).

Для измерения компонента N2c был выбран временной интервал 250–300 мс и область интереса O1, Oz, O2 в соответствии с данными литературы [Luck, Kappenman, 2011] и по результатам визуального анализа ВП.

Компонент P300 анализировали во временном интервале 360–600 мс в теменной области интереса: электроды Pz, CPz, P1, P2, POz были выбраны на основании данных литературы [Polich, 2007], визуального анализа ВП и поскольку в нем наблюдалась максимальная выраженность этого компонента на целевой стимул.

Для каждого компонента ВП и каждого условия отдельно усредняли значения амплитуды по отведениям, вошедшим в зону интереса, и по всем моментам времени выбранных временных интервалов.

Достоверность наличия компонентов ВП того или иного компонента в каждом экспериментальном условии оценивали при помощи дисперсионного анализа амплитуды ВП на девиантный стимул и амплитуды ВП на стандартный стимул. Поправка Бонферрони для множественных сравнений осуществлялась путем умножения полученного p-значения на 4 (число экспериментальных условий).

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

В анализ включены результаты, полученные в эксперименте на 21 испытуемом; 7 испытуемых были исключены из анализа по причине недостаточно успешного выполнения экспериментальных задач и/или из-за недостаточного качества записи ЭЭГ/ВП.

Поведенческие результаты

В двух активных зрительных блоках (ЗБ) испытуемые давали 84.1 ± 12.3% правильных ответов (с целевым стимулом ПР 84.7 ± 11.9%; с целевым стимулом ЛЧ 83.5 ± 12.7%). При этом доля нажатий в ответ на предъявление нецелевого стимула из всех ошибочных нажатий суммарно составила 0.55% (в том числе 0.08% в ответ на нецелевой стимул ЛЧ и 0.47% в ответ на нецелевой стимул ПР). В моторном блоке (МБ) испытуемые отвечали на предъявление зрительного стимула в 86.5 ± 7.0% случаев. В слуховом блоке (СБ) при выполнении задачи “2-back” испытуемые отвечали правильно в 88.3 ± 11.3% случаев.

Негативность рассогласования

Негативность рассогласования в блоке “пассивный оддболл” присутствовала в затылочных отведениях и была выражена во временном интервале 100–180 мс (рис. 2).

Как видно на рис. 3 (а), негативное отклонение разностного ВП между девиантами и стандартами присутствует в пределах хотя бы части временного интервала 100–180 мс для всех условий, однако степень его выраженности сильно различается. Негативность рассогласования достоверно присутствовала во временном интервале 100–180 мс в условиях цЗБ (p < 0.01, поправка Бонферрони) и МБ (p < 0.01, поправка Бонферрони) и имела затылочную локализацию (рис. 3 (а); рис. 3 (б); рис. 4 (а)). В двух других условиях – нЗБ и СБ – достоверной негативности рассогласования не выявлено (p $ \gg $ 0.05, как с поправкой Бонферрони, так и без учета поправки) (рис. 3 (а); рис. 3 (б); рис. 4 (а)).

Рис. 3.

Усредненные зрительные ВП для девиантов, стандартов и разностные ВП для четырех условий: целевой стимул в активном зрительном блоке (цЗБ); нецелевой стимул в активном зрительном блоке (нЗБ); моторный блок (МБ); слуховой блок (СБ). (а) – усредненные ВП в затылочной области интереса (O1, O2, Oz); серыми прямоугольниками выделены интервалы 100–140, 140–180 и 250–300 мс; * – p < 0.05, ** – p < 0.01 (достоверная разница между ВП на девианты и стандарты в соответствующих интервалах, с поправкой Бонферрони). (б) – усредненные карты разностных ВП для четырех условий в интервале 100–180 мс, соответствующему времени генерации НР. (в) – усредненные карты разностных ВП для четырех условий, усредненная амплитуда в интервале 250–300 мс, соответствующего времени генерации N2c.

Fig. 3. Grand-average visual ERPs to deviants, standards, and differential waveforms for the four conditions: target stimulus within an active visual block (цЗБ); nontarget stimulus within an active visual block (нЗБ); motor block (МБ); auditory block (СБ). (а) – grand-average visual ERPs across the occipital area of interest (O1, O2, Oz); gray areas highlight intervals 100–140, 140–180, and 250–300 ms; * – p < 0.05, ** – p < 0.01 (significant difference between waveforms for deviants and standards within corresponding intervals, Bonferroni correction). (б) – grand-average differential scalp maps for the four conditions within 100–180 ms interval after stimulus onset corresponding to MMN time in interval; (в) – grand-average differential scalp maps for the four conditions within 250–300 ms interval after stimulus onset corresponding to N2c time interval.

Рис. 4.

Усредненные значения зрительного вызванного потенциала. (а) – НР (100–180 мс, затылочная область интереса – O1, O2, Oz); (б) – ранняя фаза НР (100–140 мс, затылочная область интереса – O1, O2, Oz); (в) – поздняя фаза НР (140–180 мс, затылочная область интереса – O1, O2, Oz); (г) – N2c (250–300 мс, затылочная область интереса – O1, O2, Oz); (д) – P300 (360–600 мс, теменная область интереса – Pz, CPz, P1, P2 и POz). Обозначения блоков как на рис. 3.

Fig. 4. Averaged ERPs. (а) – MMN (100–180 ms, occipital area of interest – O1, O2, Oz); (б) – early phase of MMN (100–140 ms, occipital area of interest – O1, O2, Oz); (в) – late phase of MMN (140–180 ms, occipital area of interest – O1, O2, Oz); (г) – N2c (250–300 ms, occipital area of interest – O1, O2, Oz); (д) – P300 (360–600 ms, parietal area of interest – Pz, CPz, P1, P2, POz). Block name abbreviations as in fig. 3.

Как видно на рис. 3 (а), разностный вызванный потенциал может быть разделен на две фазы – раннюю (100–140 мс) и позднюю (140–180 мс).

Ранняя фаза достоверно выражена в условии МБ (p < 0.01) и не выражена в условии цЗБ, а поздняя фаза выражена для цЗБ (p < < 0.01) и не выражена для МБ (p > 0.05) (рис. 3 (а); рис. 4 (б); рис. 4 (в)). Таким образом, в ответ на целевой стимул в ЗБ эффект наблюдался в более позднем временном интервале, чем в МБ. Для двух других условий – СБ и нЗБ – негативность рассогласования не была выявлена ни в одном из указанных временных интервалов (p $ \gg $ 0.05) (рис. 3 (а); рис. 4 (б); рис. 4 (в)).

Компонент N2c

В интервале 250–300 мс только в условии цЗБ было выявлено присутствие негативной волны N2c (p < 0.05), не выраженной во всех других условиях эксперимента (p $ \gg $ 0.05) (рис. 3 (а); рис. 4 (г)). Компонент имел затылочную локализацию (рис. 3 (в)).

Компонент P300

Компонент P300 был выражен в ответ на целевой стимул во временном интервале 360–600 мс, p < 0.0001 (рис. 5; рис. 4 (д)). В других условиях эксперимента P300 не выявлен (p $ \gg $ 0.05).

Рис. 5.

Компонент P300 усредненных зрительных ВП. (а) – усредненные ВП в теменной области интереса (Pz, CPz, P1, P2, POz); (б) – усредненная карта ВП на целевой стимул в интервале 360–600 мс. *** – p < < 0.0001 (достоверная разница между ВП на девианты и стандарты в соответствующих интервалах, с поправкой Бонферрони).

Fig. 5. P300 component of the grand-average visual ERP. (а) – grand-average visual ERPs in the parietal region of interest (Pz, CPz, P1, P2, POz); (б) – grand-average differential scalp maps for the target stimulus within 360–600 ms interval. *** – p < 0.0001 (significant difference between waveforms for deviants and standards within corresponding intervals, Bonferroni correction).

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Негативность рассогласования

Негативность рассогласования в нашем исследовании была выявлена в двух экспериментальных условиях, основанных на конъюнкции признаков: во-первых, при селективном внимании к заданному сочетанию признаков в зрительной модальности (условие цЗБ); во-вторых, при распределении внимания в пределах зрительной модальности (условие МБ). Также ожидаемым образом негативность рассогласования была хорошо выражена в условии “пассивный оддболл”, в котором девиантный стимул отличался от стандартного только по одному признаку. В условиях отвлечения внимания (нЗБ и СБ) НР была подавлена.

Временной интервал генерации негативности рассогласования в настоящем эксперименте совпадал с данными литературы – в ряде исследований (например, [Farkas et al., 2015]) в качестве временного интервала для негативности рассогласования использовался промежуток около 100–200 мс с момента предъявления стимула. В исследовании И. Винклера [Winkler et al., 2005], в котором были применены зрительные стимулы сходные со стимулами в настоящем исследовании, негативность рассогласования измеряли в интервале 108–148 мс – это почти совпадает со временем выраженности негативности рассогласования на девиантный стимул в условии МБ. В условии цЗБ негативность рассогласования на целевой стимул наблюдалась немного позже – в интервале 140–180, что отличается от указанного исследования И. Винклера; однако в указанном исследовании не анализировали целевые стимулы, и тем самым различие может быть обусловлено “целевостью” стимула. В литературе встречаются и другие временные интервалы НР – 100–250 мс [Kimura et al., 2009], 185–205 мс [Astikainen et al., 2008], около 130–190 мс [Czigler, Sulykos, 2010]; 200–250 [Nordby et al., 1996]. Разброс значений может быть связан с тем, что на время и амплитуду генерации НР могут влиять параметры стимулов – их цвет, пространственная частота и расположение [Stefanics et al., 2014].

Во всех блоках нашего эксперимента негативность рассогласования имела затылочную локализацию, что соответствует данным литературы [Winkler et al., 2005; Kimura et al., 2011; Pazo-Alvarez et al., 2003; Nordby et al., 2013; Wang et al., 2014]; есть свидетельства локализации методом МЭГ нейронных генераторов зрительной НР в затылочной коре [Susac et al., 2014].

Негативность рассогласования и внимание

В исследовании И. Винклера и соавт. [Winkler et al., 2005] было выявлено возникновение негативности рассогласования в ответ на конъюнкции признаков независимо от внимания, однако мы получили достоверные свидетельства генерации НР только в условиях внимания. Предположительно в указанном исследовании задача на отвлечение внимания могла быть недостаточно сложной и не вести к полному переключению внимания от зрительной модальности; задача, использованная в нашем эксперименте, была действительно сложной [Kirchner, 1958] и субъективно трудной для испытуемых – это подтверждается результатами опроса испытуемых после завершения эксперимента. Другое отличие нашей работы состоит в том, что мы анализировали ВП на целевые стимулы, что не было сделано в исследовании И. Винклера и соавт. из-за того, что авторы стремились избежать анализа временных интервалов, в которых потенциально могло наблюдаться перекрытие негативности рассогласования с другими эффектами, ассоциированными с фактором “целевости”. Как видно из полученных нами результатов (рис. 3 (а)), негативность рассогласования в пределах анализируемого нами интервала 100–180 мс не перекрывается с компонентом N2c, что позволило нам анализировать негативность рассогласования в ответ на целевые стимулы наравне с другими условиями. Как временной интервал, так и локализация негативной волны в ответ на сочетания признаков, были аналогичны таковым для НР в блоке “пассивный оддболл”, где природа негативной волны не вызывает сомнений.

Таким образом, полученные нами результаты показывают, что НР отражала связывание признаков девиантных стимулов и присутствовала только в ситуации наличия внимания к зрительным стимулам – селективного или распределенного. Причем в более трудных условиях селективного выделения одного из девиантных стимулов НР возникала позже, чем в условиях неселективной детекции стимулов.

Негативность рассогласования и механизмы анализа конъюнкции признаков в мозге

Возможность модуляции НР со стороны внимания противоречит значительному объему литературы, поскольку НР часто называют нейрофизиологическим коррелятом ранней, предвнимательной стадии обработки сенсорного сигнала, осуществляющейся на относительно низких уровнях сенсорных зон коры [Kimura et al., 2011; Garrido et al., 2009]. В пользу этого взгляда говорит наличие зрительной НР при отсутствии внимания к стимулам [Winkler, 2005; Czigler, Pató, 2009] – причем локализация и время генерации разностной НР в условиях отвлечения внимания аналогичны таковым в условиях наличия внимания [Harter, Guido, 1980; Czigler, Csibra, 1990; Kenemans et al., 1993; Torriente et al., 1999].

В указанных выше исследованиях, свидетельствующих в пользу независимости НР от внимания, девиантные стимулы отличались от стандартных только по одному признаку. Очевидно, в том случае, когда отличие девиантного стимула от стандартного не требует операции конъюнкции признаков, детекция девиантности осуществляется без участия внимания, а значит, негативность рассогласования в ответ на него действительно должна отражать автоматический, предвнимательный процесс. Это подтверждается данными экспериментов со зрительным поиском, демонстрирующих явление “pop-out в том случае, если целевой объект отличается от других по одному признаку, он обнаруживается мгновенно, а значит, при отсутствии направленного внимания [McElree, Carrasco, 1999].

Чем может отличаться обработка конъюнкций признаков от обработки одиночных признаков? Существует точка зрения, что уже на ранних этапах обработки сенсорного сигнала от сложных стимулов происходят рекурсивные взаимодействия между низкоуровневыми и высокоуровневыми локусами обработки сенсорных сигналов в коре больших полушарий [Bullier, 2001]; было высказано предположение, что подобные механизмы позволяют объяснить феномен связывания [Di Lollo, 2012]. Если для анализа сложных сенсорных сигналов требуется вовлечение высокоуровневых процессов уже на ранних этапах сенсорной обработки (до или во время генерации НР), то влияние внимания на данный процесс и вытекающая из этого модуляция амплитуды НР представляются закономерными. В настоящее время в литературе также сформировалось мнение, что рекурсивные процессы взаимодействия между уровнями всегда вовлечены в генерацию НР (для любых стимулов, в том числе для простых стимулов, не требующих конъюнкции), открывая путь для изучения механизмов модуляции НР со стороны внимания [Auksztulewicz, Friston, 2015].

Для интерпретации результатов, полученных в настоящей работе, необходимо рассмотреть с физиологической точки зрения, существует ли возможность связывания признаков на нижних уровнях сенсорной обработки в коре больших полушарий. Известно, что в зрительной коре существуют популяции нейронов, кодирующих сочетания признаков, а не отдельные признаки [Matthey et al., 2015]; они находятся на более высоких уровнях в зрительной системе по сравнению с популяциями, кодирующими отдельные признаки. С другой стороны, известно, что даже нейроны низкоуровневых сенсорных зон коры могут одновременно модулироваться несколькими физическими характеристиками стимула. В настоящем исследовании мы опирались на варьирование двух признаков стимулов – частоту пространственных решеток и их наклон; известно, что эти признаки входят в число определяющих разряд нейронов уже на нижнем уровне кортикальной обработки сенсорного сигнала – в первичной зрительной коре V1 [De Valois et al., 1982; Hubel, Wiesel, 1959]. Следовательно, мы можем ожидать, что уже на уровне V1 имеются все физиологические условия для объединения репрезентаций двух использованных нами признаков зрительных стимулов – так как на этом уровне потенциально осуществимо избирательное кодирование каждого из четырех стимулов в отдельности. Таким образом, свойства стимулов в настоящем эксперименте предрасполагали к детекции сочетаний признаков уже на уровне V1 – и к генерации НР независимо от внимания аналогично тому, как этот феномен описан для типичных экспериментальных условий девиантности по одному признаку. Однако, согласно полученным нами результатам, при отвлечении внимания негативность рассогласования на сочетания признаков не возникала. Учитывая надежность и стабильность феномена негативности рассогласования [Kimura et al., 2011], это с большей определенностью указывает на то, что при отсутствии внимания процесс связывания признаков действительно может быть подавлен. Это, в свою очередь, согласуется с идеей о распределенном рекуррентном механизме связывания, требующем двусторонних взаимодействий между различными иерархическими уровнями, т.е. неизбежного вовлечения относительно высоких уровней [Auksztulewicz, Friston, 2015; Bullier, 2001; Di Lollo, 2012], испытывающих выраженную модуляцию со стороны системы внимания.

В нашей работе зрительная НР в условии МБ проявилась в более раннем временном интервале, чем в условии цЗБ. Известно, что латентность генерации НР возрастает по мере увеличения сложности задачи [Kimura, Takeda, 2013]. В моторном блоке задача была проще, чем в зрительном: реагировать недифференцированно на все стимулы очевидно легче, чем выборочно на один стимул в последовательности других. Соответственно, можно предположить, что более сложная обработка девиантного стимула в условии цЗБ занимает больше времени.

Компоненты N2c и P300

Компонент N2c был выявлен в составе ВП на целевые стимулы (условие цЗБ), что находится в соответствии с известными свойствами данного компонента ВП, согласно литературе, он входит в семейство компонентов, возникающих в ответ на предъявление целевого стимула [Luck, Kappenman, 2011; Folstein, Van Petten, 2008]. Время генерации и локализация также соответствуют данным литературы [Folstein, Van Petten, 2008].

Компонент P300 был также выявлен только для целевого стимула (условие цЗБ), что соответствует литературным данным [Linden, 2005; Polich, 2007]. Временной интервал и теменная локализация также соответствовали литературным данным для P3b [Katayama, Polich, 1998; Comerchero, Polich, 1999]. В ответ на остальные стимулы не было выявлено ни P3b, который должен возникать в ответ на целевой стимул, ни P3a, который может возникать в ответ на нецелевой девиантный стимул [Polich, 2007].

Выраженность компонентов N2c и P300 исключительно только в условии цЗБ подтверждает обладание целевым стимулом помимо аспекта “девиантности” аспектом “целевости” в соответствии с инструкцией, которую давали испытуемым.

В литературе имеются указания на то, что связывание признаков может включать в себя два относительно самостоятельных уровня – ранний, сенсорный, и поздний, когнитивный, связанный с высокоуровневыми процессами внимания, сознания и принятия решения [Takegata et al., 2005; Chernyshev et al., 2016]. В то время как НР позволяет изучать ранний уровень, ВП семейства N2 и P3 при соответствующей организации эксперимента могут рассматриваться как корреляты процессов связывания на позднем, более высоком когнитивном уровне [Chernyshev et al., 2016]. Полное отсутствие указанных поздних компонентов в ответ на игнорируемый девиантный стимул (условие нЗБ) и в остальных условиях сниженного внимания к зрительным стимулам дополнительно подтверждает, что связывания признаков данного девиантного стимула не происходило не только на раннем сенсорном уровне, но и на позднем когнитивном уровне.

Возможно ли связывание признаков в отсутствие внимания

Если, согласно полученным нами результатам, принять, что связывание признаков действительно требует внимания, – как это и было изначально заявлено в теории интеграции признаков А. Трейсман [Treisman, Gelade, 1980] – то может возникнуть вопрос, каким же образом, несмотря на узкое бутылочное горлышко внимания, мозговые процессы обработки информации обеспечивают вполне приемлемое качество идентификации объектов, большинство которых не попадают в фокус внимания?

Представляется весьма вероятным существование двух разных механизмов, один из которых обеспечивает восприятие хорошо знакомых и значимых объектов, а другой – новых и/или не представляющих практического интереса [Colzato et al., 2006; Hommel, Colzato, 2009; Vanrullen, 2009; Velik, 2012]. Первый может работать на базе готовых целостных конъюнкций признаков, хранящихся в мозге и вызывающихся в ответ на вид знакомого объекта, – этот механизм не требует внимания к объекту для успешного его распознавания. Предположительно, быстрая рекурсивная обработка сенсорной информации в мозге [Bullier, 2001] позволяет выделять естественные категории объектов даже по сложным сочетаниям множественных признаков автоматически, без участия внимания [Evans, Treisman, 2005].

Второй же механизм задействуется в случае необходимости получить представление о незнакомых объектах в новой среде – “по запросу” и осуществляется только при наличии внимания к этим объектам [Vanrullen, 2009]. Очевидно, что процедура и стимульный материал настоящего эксперимента вовлекали второй механизм конъюнкции признаков.

ЗАКЛЮЧЕНИЕ

На основании полученных результатов мы можем заключить, что для связывания признаков на ранних этапах кортикальной сенсорной обработки внимание может быть необходимо, что противоречит данным, полученным в предыдущих исследованиях [Winkler et al., 2005], но подтверждает теорию интеграции признаков Э. Трейсман [Treisman, Gelade, 1980]. Отсутствие компонентов семейства N2 и P3 в условиях сниженного внимания к зрительным стимулам косвенно указывает на то, что связывания признаков вне фокуса внимания не происходило также и на более поздних этапах мозговой обработки сенсорных стимулов [Chernyshev et al., 2016].

В целом полученные результаты о зависимости НР в ответ на сочетания признаков от внимания хорошо согласуются с современными представлениями о распределенных мозговых механизмах сенсорного восприятия, основанные на взаимодействии нисходящих и восходящих потоков информации [Auksztulewicz, Friston, 2015; Bullier, 2001].

Исследование выполнено при поддержке РФФИ, грант № 15-06-10742.

Список литературы

  1. Astikainen P., Lillstrang E., Ruusuvirta T. Visual mismatch negativity for changes in orientation–a sensory memory-dependent response. European Journal of Neuroscience. 2008. 28 (11): 2319–2324.

  2. Auksztulewicz R., Friston K. Attentional Enhancement of Auditory Mismatch Responses: a DCM/MEG Study. Cerebral cortex. 2015. 25 (11): 4273–83.

  3. Bartels A., Zeki S. The theory of multistage integration in the visual brain. Proceedings of the Royal Society of London B: Biological Sciences. 1998. 265 (1412): 2327–2332.

  4. Bullier J. Integrated model of visual processing. Brain Research Reviews. 2001. 36: 96–107.

  5. Chernyshev B., Bryzgalov D., Lazarev, I., Chernysheva E. Distributed feature binding in the auditory modality: experimental evidence toward reconciliation of opposing views on the basis of mismatch negativity and behavioral measures. NeuroReport. 2016. 27 (11): 837–842.

  6. Colzato L.S., Raffone A., Hommel B. What do we learn from binding features? Evidence for multilevel feature integration. Journal of Experimental Psychology: Human Perception and Performance. 2006. 32 (3): 705.

  7. Czigler I., Csibra G. Event-Related Potentials in a Visual Discrimination Task: Negative Waves Related to Detection and Attention. Psychophysiology. 1990. 27 (6): 669–676.

  8. Czigler I., Csibra G. Event-Related Potentials in a Visual Discrimination Task: Negative Waves Related to Detection and Attention. Psychophysiology. 1990. 27 (6): 669–676.

  9. Czigler I., Pató L. Unnoticed regularity violation elicits change-related brain activity. Biological psychology. 2009. 80 (3): 339–347.

  10. Czigler I., Sulykos I. Visual mismatch negativity to irrelevant changes is sensitive to task-relevant changes. Neuropsychologia. 2010. 48 (5): 1277–1282.

  11. Delorme A., Makeig S. EEGLAB: an open source toolbox for analysis of single-trial EEG dynamics including independent component analysis // Journal of neuroscience methods. 2004. 134 (1): 9–21.

  12. De Valois R., Albrecht D., Thorell L. Spatial frequency selectivity of cells in macaque visual cortex. Vision research. 1982. 22 (5): 545–559.

  13. Di Lollo V. The feature-binding problem is an ill-posed problem. Trends in Cognitive Sciences. 2012. 16 (6): 317–321.

  14. Evans K., Treisman A. Perception of objects in natural scenes: is it really attention free? Journal of Experimental Psychology: Human Perception and Performance. 2005. 31 (6): 1476.

  15. Farkas K., Stefanics G., Marosi C., Csukly G. Elementary sensory deficits in schizophrenia indexed by impaired visual mismatch negativity. Schizophrenia research. 2015. 166 (1): 164–170.

  16. Folstein J., Van Petten C. Influence of cognitive control and mismatch on the N2 component of the ERP: a review. Psychophysiology. 2008. 45 (1): 152–170.

  17. Garrido M., Kilner J., Stephan K., Friston K. The mismatch negativity: a review of underlying mechanisms. Clinical neurophysiology. 2009. 120 (3): 453–463.

  18. Harter M., Guido W. Attention to pattern orientation: Negative cortical potentials, reaction time, and the selection process. Electroencephalography and clinical neurophysiology. 1980. 49 (5): 461–475.

  19. Hommel B. Event files: Evidence for automatic integration of stimulus–response episodes. Visual Cognition. 1998. 5 (1–2): 183–216.

  20. Hommel B. Event files: Feature binding in and across perception and action. Trends in Cognitive Sciences. 2004. 8 (11): 494–500.

  21. Hommel B., Colzato L., Van Den Wildenberg W. How social are task representations? Psychological Science. 2009. 20 (7): 794–798.

  22. Hubel D., Wiesel T. Receptive fields of single neurones in the cat’s striate cortex. The Journal of physiology. 1959. 148 (3): 574–591.

  23. Kahneman D., Treisman A., Gibbs B. The reviewing of object files: Object-specific integration of information. Cognitive Psychology. 1992. 24 (2): 175–219.

  24. Kenemans J., Kok A., Smulders F. Event-related potentials to conjunctions of spatial frequency and orientation as a function of stimulus parameters and response requirements. Electroencephalography and Clinical Neurophysiology/Evoked Potentials Section. 1993. 88 (1): 51–63.

  25. Kimura M., Katayama J., Ohira H., Schröger E. Visual mismatch negativity: new evidence from the equiprobable paradigm. Psychophysiology. 2009. 46 (2): 402–409.

  26. Kimura M., Schröger E., Czigler I. Visual mismatch negativity and its importance in visual cognitive sciences. Neuroreport. 2011. 22 (14): 669–673.

  27. Kimura M., Takeda Y. Task difficulty affects the predictive process indexed by visual mismatch negativity. Frontiers in human neuroscience. 2013. 7.

  28. Kirchner W. Age differences in short-term retention of rapidly changing information. Journal of experimental psychology. 1958. 55 (4): 352.

  29. Lopez-Calderon J., Luck S.J. ERPLAB: an open-source toolbox for the analysis of event-related potentials // Frontiers in human neuroscience. 2014. 8: 213.

  30. Linden D. The P300: where in the brain is it produced and what does it tell us? The Neuroscientist. 2005. 11 (6): 563–576.

  31. Livingstone M., Hubel D. Segregation of form, color, movement, and depth: anatomy, physiology, and perception. Science. 1988. 240 (4853): 740–749.

  32. Luck S., Kappenman E. The Oxford handbook of event-related potential components. Oxford: Oxford university press. 2011. 664 p.

  33. Matthey L., Bays P., Dayan P. A probabilistic palimpsest model of visual short-term memory. PLoS computational biology. 2015. 11 (1): e1004003

  34. McElree B., Carrasco M. The temporal dynamics of visual search: evidence for parallel processing in feature and conjunction searches. Journal of Experimental Psychology: Human Perception and Performance. 1999. 25 (6): 1517.

  35. Michie P., Malmierca M., Harms L., Todd J. Understanding the neurobiology of MMN and its reduction in schizophrenia. Biological psychology. 2016. 116: 1.

  36. Näätänen R. The role of attention in auditory information processing as revealed by event-related potentials and other brain measures of cognitive function. Behavioral and Brain Sciences. 1990. 13 (2): 201–233.

  37. Nordby H., Brønnick K.S., Hugdhal K. Processing of deviant visual events reflected by event-related potentials. Recent advances in event-related brain potentials research. 1996. 99–104.

  38. Pazo-Alvarez P., Cadaveira F., Amenedo E. MMN in the visual modality: a review. Biological psychology. 2003. 63 (3): 199–236.

  39. Polich J. Updating P300: an integrative theory of P3a and P3b. Clinical neurophysiology. 2007. 118 (10): 2128–2148.

  40. Schneegans S., Bays P. Neural architecture for feature binding in visual working memory. Journal of Neuroscience. 2017. 37 (14): 3913–3925.

  41. Stefanics G., Kremláček J., Czigler I. Visual mismatch negativity: a predictive coding view. Frontiers in human neuroscience. 2014. 8.

  42. Susac A., Heslenfeld D., Huonker R., Supek S. Magnetic source localization of early visual mismatch response. Brain topography. 2014. 27 (5): 648–651.

  43. Sussman E., Horváth J., Winkler I., Orr M. The role of attention in the formation of auditory streams. Attention, Perception, & Psychophysics. 2007. 69 (1): 136–152.

  44. Takegata R., Brattico E., Tervaniemi M., Varyagina O., Näätänen R., Winkler I. Preattentive representation of feature conjunctions for concurrent spatially distributed auditory objects. Cognitive Brain Research. 2005. 25 (1): 169–179.

  45. Torriente I., Valdes-Sosa M., Ramirez D., Bobes M. Visual evoked potentials related to motion-onset are modulated by attention. Vision research. 1999. 39 (24): 4122–4139.

  46. Treisman A. The binding problem. Current opinion in neurobiology. 1996. 6 (2): 171–178.

  47. Treisman A., Gelade G. A feature-integration theory of attention. Cognitive psychology. 1980. 12 (1): 97–136.

  48. Vanrullen R. Binding hardwired versus on-demand feature conjunctions. Visual Cognition. 2009. 17 (1–2): 103–119.

  49. Velik R. From simple receptors to complex multimodal percepts: a first global picture on the mechanisms involved in perceptual binding. Frontiers in psychology. 2012. 3.

  50. Wang W., Miao D., Zhao L. Automatic detection of orientation changes of faces versus non-face objects: a visual MMN study. Biological psychology. 2014. 100: 71–78.

  51. Winkler I. Interpreting the mismatch negativity. Journal of Psychophysiology. 2007. 21 (3–4): 147–163.

  52. Winkler I., Czigler I., Sussman E., Horváth J., Balázs L. Preattentive binding of auditory and visual stimulus features. Journal of Cognitive Neuroscience. 2005. 17 (2): 320–339.

Дополнительные материалы отсутствуют.