ВВЕДЕНИЕ

Система образования не может существовать без методов оценки эффективности. Данный контроль позволяет проводить анализ качества методов преподавания и своевременно вносить коррективы в систему обучения. Сама процедура контроля в том или ином виде существует на каждом этапе обучения. Классическим подходом является проверка усвоения знаний, навыков и умений, а также оценка и анализ психических и личностных качеств учащихся [1, 2], что позволяет в некоторой мере индивидуализировать подход при обучении. Важно заметить, что персонализация обучения стала возможной благодаря аналитике когнитивных способностей обучаемых. Тем не менее у традиционных подходов в этой сфере есть ряд ограничений, одним из которых является сложность создания индивидуальных методов тестирования.

Развитием классических подходов к оценке когнитивных характеристик человека является анализ активности головного мозга с применением устройств для регистрации электроэнцефалограмм (ЭЭГ). Сама технология не обладает высокой стоимостью, а данные могут анализироваться в режиме реального времени. У ЭЭГ есть две основные проблемы, которые ограничивают внедрение этой технологии на практике: долгий процесс подготовки (монтаж электродов) и необходимость использования специальных проводящих гелей. Однако данные барьеры уже являются частично преодолимыми за счет специальных шапочек для монтажа, технологий сухих электродов и портативных электроэнцефалографов [3]. Как следствие, возможности использования систем типа “интерфейсы мозг–компьютер”, основанных на регистрации ЭЭГ, в повседневной жизни значительно расширяются [4].

Известно много работ, посвященных исследованиям с помощью ЭЭГ особенностей когнитивных способностей [511], однако, большинство из них не подразумевает внедрения полученных результатов в процесс образования с помощью персонализированных интерфейсов. Одной из важных проблем здесь является отсутствие простых и надежных метрик для оценки когнитивной характеристик обучающегося [12]. В данной работе мы представляем новый биомаркер для оценки когнитивной нагрузки с помощью вычисления стандартного отклонения отношения стандартных ритмов мозга.

МЕТОДОЛОГИЯ

Для проведения исследования была собрана группа из 12 учеников второго класса без проблем со здоровьем. Добровольцы (и их представители – родители) были заранее ознакомлены с процедурой проведения эксперимента и возможными вызванными ей неудобствами, имели возможность задать интересующие вопросы и получить на них удовлетворительные ответы. Для каждого испытуемого его законный представитель заполнил и подписал бланк информированного согласия на участие в эксперименте. Все экспериментальные работы были проведены в соответствии с требованиями Хельсинской декларации и одобрены комиссией по этике АНО ВО “Университет Иннополис”. Участники исследования проходили тест Бурдона (корректурная проба) с помощью бланка с рядами кириллических букв. Бланк состоял из 20 строчек, в каждой из которых присутствовал случайный набор из 30 букв. В начале каждого ряда была обозначена буква, которую следует отмечать. В каждой строчке искомый символ встречался от одного до шести раз. Сам тест выполнялся на электронном планшете, где с помощью стилуса отмечались нужные буквы. При проведении теста записывалось время ответа и выбранная буква. Основной метрикой являлось среднее время ответа, которое высчитывалось независимо от правильности ответа. Таким образом, данная характеристика является показателем среднего количества просматриваемых символов за единицу времени, что также является одной из оцениваемых величин в практике [13]. Для записи ЭЭГ был использован энцефалограф actiCHamp, ЭЭГ записывалась с 31 канала с помощью электродов ActiCap с Ag/AgCl датчиками. Электроды размещались по международной схеме “10-10”, заземляющий электрод находился на лбу, один референсный электрод располагался в области правого сосцевидного отростка. Частота дискретизации сигналов ЭЭГ при записи составляла 250 Гц. Сигналы фильтровались полосовым фильтром от 0.16 до 70 Гц и режекторным фильтром 50 Гц для исключения шума от электросетей. Удаление артефактов производилось с помощью метода ICA.

Для получения частотно-временного спектра к сигналам было применено вейвлетное преобразование; в качестве материнского вейвлета был выбран вейвлет Морле [14]. Вейвлетное преобразование осуществлялось следующим образом:

(1)
$W(n,s) = \sum\limits_{n{\kern 1pt} ' = n - \left[ {\frac{{T(s)}}{h}} \right]}^{n + \left[ {\frac{{T(s)}}{h}} \right]} {{{x}_{{n{\kern 1pt} '}}}\psi {\kern 1pt} *} \left( {\frac{{(n{\kern 1pt} ' - n)h}}{s}} \right),$
где ψ* – материнский вейвлет Морле:

(2)
$\psi {\kern 1pt} *(\eta ) = {{\pi }^{{ - \frac{1}{4}}}}{{e}^{{2\pi i\eta }}}{{e}^{{ - \frac{{{{\eta }^{2}}}}{2}}}}.$

Вейвлетное преобразование было выполнено в частотном диапазоне 8–30 Гц, что соответствует диапазонам альфа и бета ритмов. Поскольку материнский вейвлет является комплексной функцией, к полученной комплексной поверхности было поэлементно применено следующее преобразование:

(3)
$\frac{1}{s}{{\left| {W(n,s)} \right|}^{2}}$
для оценки мощности сигнала на каждом временном масштабе s, где множитель 1/s вводили для нормировки вейвлетного спектра [14]. Во избежание краевых эффектов с обоих концов временных рядов было исключено по 125 точек (0.5 с).

Из частотно-временного вейвлетного спектра были рассчитаны усредненные по частоте энергии в альфа (8–15 Гц) и бета (15–30 Гц) диапазонах. Для вычисления предложенного биомаркера (средней дисперсии отношения ритмов) было проанализированы два подхода: 1) разделение временного ряда энергий в выбранных диапазонах на окна с выбранной шириной и 2) деление временного ряда на определенное количество окон. Это было сделано с целью подбора наиболее подходящей ширины окна. В окнах проводилось усреднение по времени. Получившийся ряд значений энергий в альфа-диапазоне был затем поэлементно поделен на энергии в бета-диапазоне, после чего было рассчитано стандартное отклонение значений получившегося ряда для всех окон. Данное число является характеристикой каждого участника эксперимента. Полученные значения были затем скоррелированы со значениями среднего времени ответа следующим образом:

(4)
${{r}_{{xy}}} = \frac{{\sum\limits_{i = 1}^n {({{x}_{i}} - \bar {x})({{y}_{i}} - \bar {y})} }}{{\sqrt {\sum\limits_{i = 1}^n {{{{({{x}_{i}} - \bar {x})}}^{2}}} } \sqrt {\sum\limits_{i = 1}^n {{{{({{y}_{i}} - \bar {y})}}^{2}}} } }},$
где n – количество участников эксперимента, xi – среднее время ответа участника с номером i, $\bar {x}$ – общее среднее время ответа, yi – среднее значение стандартного отклонения соотношения энергий в альфа- и бета-диапазонах участника с номером i, $\bar {y}$ – общее среднее отклонение.

Для проверки нулевой гипотезы, что данные не скоррелированы, была использована следующая функция плотности вероятности индекса r [15]:

(5)
$f(r) = \frac{{{{{(1 - {{r}^{2}})}}^{{n/2 - 2}}}}}{{B\left( {\frac{1}{2},\frac{n}{2} - 1} \right)}},$
где B – это β-функция. Важно заметить, что данная функция не является точным представлением плотности вероятности r. Вместо этого используется аппроксимация с помощью бета-распределения. Само тестирование проводилось следующим образом: с помощью функции (5) численно была рассчитана функция распределения вероятности, после чего были рассчитаны критические значения индекса r, соответствующие уровню значимости 0.05. Данные считались значимыми, если их индекс выше или ниже рассчитанного порогового значения при положительном и отрицательном значении индекса, соответственно. Данные на каждом канале электроэнцефалограммы тестировались отдельно друг от друга.

РЕЗУЛЬТАТЫ

Была обнаружена значимая корреляция между величиной дисперсии и средним временем, затрачиваемым на поиск одной буквы в корректурной пробе (рис. 1). Анализ распределения уровня значимости корреляции по каналам показал, что для данного типа задания ряд каналов оказывается значимым (см. светло-красные области на рис. 2), при этом минимумы p-значения располагаются на каналах центрально-теменной области, лобного полюса и правой височной доли. Было также исследовано влияние ширины окна по времени, либо количества окон, на которое разбивается время выполнения задания, на максимальный уровень значимости корреляции (см. рис. 3). Выявлено, что он существенно не зависит от длительности окна (по крайней мере, при 1 < tw < 50 с). Таким образом, наиболее удобным для реализации системы является выбор ширины окна tw, равным периоду оценки поведенческих характеристик при выполнении задания, поскольку в таком случае проще устанавливать корреляцию между величиной дисперсии и эффективностью решения задачи.

Рис. 1.

Точечный график данных дисперсии и среднего времени ответа при ширине окна 24 с и линейная регрессия для этих данных (красная линия). Значение r индекса = 0.65, p-значение = 0.0234.

Рис. 2.

Топограмма коэффициентов корреляции при размере окна 24 с.

Рис. 3.

Значимость корреляции при окнах с фиксированной шириной (слева) и при фиксированном количестве окон (справа).

Было также проведено изучение влияния нормировки ЭЭГ сигналов на фоновую активность на уровень корреляции. Выявлено, что нормировка ЭЭГ-данных на сигналы фоновой активности (тип нормировки – “относительное изменение”) делает корреляцию незначимой. Таким образом, более перспективной является работа с исходными ЭЭГ данными (после их предварительной обработки, направленной на удаление артефактов).

ОБСУЖДЕНИЕ

Результаты анализа распределений уровней значимости корреляции по каналам позволяют выделить оптимальную и минимально необходимую конфигурацию регистрирующих электродов, которая содержит наиболее значимую информацию о состоянии обучающегося. В нее, прежде всего, входят теменные электроды, центрально-теменные, а также электроды лобного полюса. Полученные результаты открывают возможности существенного уменьшения количества используемых электродов в интерфейсе мозг-компьютер, который может использоваться в образовательном процессе (от 2 до 8 электродов – в зависимости от требуемой точности работы системы). Это является принципиально важным при реализации алгоритма детектирования, работающего в реальном времени, поскольку существенно уменьшает объем обрабатываемых данных, а также удешевляет стоимость нейрогарнитуры и увеличивает скорость монтажа электродов.

Поскольку было обнаружено, что предложенная характеристика значимо коррелирует с основными показателями успешности и эффективности выполнения стандартизированных когнитивных заданий, ее можно использовать в качестве биомаркера когнитивного состояния обучающегося, связанного с решением поставленных задач и обучением. Мы предполагаем, что данный биомаркер отражает уровень составляющих когнитивного ресурса обучающегося (уровень внимания, когнитивная усталость, загруженность рабочей памяти и др.), определяющих эффективность выполнения им задания. Это открывает новые возможности для развития способов повышения эффективности процесса обучения, основанных на нормализации соотношения энергий мозговых ритмов (и, соответственно, дисперсии), вероятно, с помощью выполнения специальных упражнений в перерывах между заданиями, направленных на корректировку ритмов, или с использованием биологической обратной связи. Поскольку корректурная проба задействует многие элементарные когнитивные функции (например, визуальный поиск, рабочую память, распознавание и обработку букв и др.), полученные результаты могут быть перенесены на широкий класс различных когнитивных заданий.

При разработке эксперимента первоначально предполагалось использовать в качестве основной поведенческой метрики процент правильности выполнения задания каждым участником. Однако это оказалось сопряжено с некоторыми ограничениями, которые возникают из-за часто возникающей ситуации полностью правильного выполнения теста, вследствие чего растет смещение в экспериментальной выборке в сторону ситуации со 100% правильно выполненным заданием. Вместе с этим увеличение объема теста ведет к изменению уровня усталости со временем, что может негативно сказываться на результаты.

Важно заметить и то, что связь между скоростью решения теста и выбранной метрикой может быть результатом работы более сложных функциональных сетей, активирующихся в головном мозге при выполнении задания. Рассмотрение данного вопроса планируется в продолжении начатых исследований.

ЗАКЛЮЧЕНИЕ

Таким образом, выявлен универсальный биомаркер, основанный на вычислении дисперсии соотношения энергий альфа- и бета-ритмов в регистрируемых ЭЭГ-сигналах и отражающий уровень составляющих когнитивного ресурса обучающегося. На примере корректурной пробы показано, что данный биомаркер значимо коррелирует с основными показателями успешности и эффективности выполнения стандартизированных когнитивных заданий.

Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект № 19-29-14101). С.А.К. благодарит за поддержку Совет по грантам Президента Российской Федерации (проект № МД-590.2022.1.2).