Сенсорные системы, 2021, T. 35, № 1, стр. 30-37

Частотно-временные особенности движения глаз при использовании видеоокулографического интерфейса в задачах управления эргатическими системами

Я. А. Туровский 12*, А. В. Алексеев 1, И. Е. Лесных 1, Е. В. Мартыненко 1

1 Воронежский государственный университет
394018 Воронеж, Университетская площадь, д. 1, Россия

2 Институт проблем управления имени В.А. Трапезникова РАН
117997 Москва, ул. Профсоюзная, д. 65, Россия

* E-mail: yaroslav_turovsk@mail.ru

Поступила в редакцию 12.03.2020
После доработки 25.05.2020
Принята к публикации 15.07.2020

Полный текст (PDF)

Аннотация

Работа посвящена развитию представления о возможностях видеоокулографических интерфейсов в задачах управления. Представлены результаты исследования параметров движения глаз человека при помощи видеоокулографического интерфейса для управления объектом на плоскости. Показано, что в ходе проводимого эксперимента от попытки к попытке снижалось количество ошибок и число испытуемых, не осуществивших успешное управление, а также зависимость способности такого управления от темперамента человека и особенностей рабочей памяти. При высоких значениях рабочей памяти пользователи совершают, формируя управляющий паттерн, более резкие высокоамплитудные движения зрачком с периодом до 1.6 с, что в итоге приводит к большему числу ошибок управления и не достижению требуемого результата. В значительной степени полученные результаты связаны с горизонтальными, а не с вертикальными движениями глаз. Представленные результаты будут полезными для создания и применения интерфейсов человек-компьютер в цифровом мониторинге при управлении эргатическими системами и могут служить отправной точкой для разработки высокоскоростных окулографических интерфейсов с существенно более широким, по сравнению с существующим, функционалом.

Ключевые слова: окулографический интерфейс, эргатические системы, цифровой мониторинг, интерфейс человек-компьютер

ВВЕДЕНИЕ

На сегодняшний день в рамках решения широкого спектра задач активно разрабатывается большая группа интерфейсов для управления эргатическими (человеко-машинными) системами (Wolpaw, 2002; Martin, 2011; Zhu, 2010; Microsoft, 2009; Tobii, 2010). При этом принципы управления допускают использование, наряду с широко распространенными в качестве команд сигналы, зарегистрированные с мозга, движения глаз, мышц. Данные команды могут обеспечивать управление системами, реализующими как замещение утраченных пользователем функций, так и дополняющих и расширяющих набор этих функций у здорового оператора. Одной из таких эргатических систем, характеризующихся высокой скоростью и точностью работы, по сравнению с интерфейсом мозг-компьютер, является видеоокулографический интерфейс: близкое технологическое решение с так называемой eye-tracing реализацией (Oyekoya, 2004; Bissoli, 2019). Принцип работы данного устройства заключается в том, что видеоизображение, зафиксированное с глазного яблока, после обработки, связанной, как правило, с выделением зрачка и анализом траектории его движения, превращается в команды на устройства–эффекторы, например, персональный компьютер или самоходное шасси. Исследования продемонстрировали в целом успешность данной категории устройств: высокий процент пользователей (Туровский, 2017б), овладевающих техникой управления, низким влиянием на вегетативный гомеостаз (Туровский, 2018), связь с рядом мутаций (Туровский, 2019) и, в целом, достаточно удачную эргономику. Однако остается ряд вопросов, связанных с психологическими коррелятами овладений устройствами и стратегиями управления, в первую очередь изменения движений глаз, которые используют операторы для достижения целей.

Цель настоящего исследования – анализ связи ряда психофизиологических показателей операторской деятельности с частотно-временными характеристиками движения глаз при использовании видеоокулографического интерфейса.

МЕТОДИКА

Методология эксперимента основывается на ранних работах (Туровский, 2017б). Разработанная авторами компьютерная программа имитирует управление перемещением объекта на плоскости, тем самым программа обеспечивает обучение и тестирование освоения пользователем видеоокулографического интерфейса. Переход от управления самоходным шасси к управлению объектом на плоскости связан с необходимостью минимизировать изменение положения головы оператора, не используя в то же время ее фиксацию. Реализована интеграция аппаратной части видеоокулографического интерфейса с компьютером, настройка параметров видеорегистрации движения зрачка, калибровка движения глаз пользователя и, в дальнейшем, прохождение пользователем серии задач, сформированных экспериментатором. Испытуемому следует движениями глаз перемещать маркер по полю из одной области в другую, обходя препятствия, положение которых может изменять экспериментатор. Фиксируются координаты положения глаз, маркера, попадание маркера в целевые области и на препятствия.

В проведенных экспериментах приняли участие 40 добровольцев: 22 юноши и 18 девушек в возрасте от 19 до 23 лет, их медианный возраст составил 20 лет. Испытуемые не имели неврологической и психиатрической патологии, не принимали лекарств, влияющих на координацию движений и скорость принятия решения, имели нормальное или скорректированное до нормального зрение. Испытуемые находились перед экраном монитора (22”) на комфортном для себя расстоянии. Видеоокулографический интерфейс позволял на основе стандартной видеокамеры с извлеченным инфракрасным (ИК) фильтром получить более четкое по сравнению с камерой с оставленным ИК фильтром изображение области глаза. Для ИК камеры был изготовлен специальный держатель, который крепится на голове и предоставляет возможность изменения положения камеры, что позволяет осуществлять настройку изображения, поступающего с камеры независимо от формы головы, и удовлетворять требованиям удобства испытуемого. После проведения калибровки на экране монитора запускалось экспериментальное поле, представляющее собой область старта, прямоугольные границы ряда объектов и область цели. В инструкции, которая в устной и письменной форме излагалась испытуемому, запрещалось совмещать маркер с объектами, обозначенными черными прямоугольниками на экране. Совмещение маркера с таким объектом расценивалось как ошибка управления/промах, которая автоматически фиксировалась программой (рис. 1). Программа фиксировала и распознавала движение зрачка глаза в четырех направлениях: “вверх”, “вниз”, “влево”, “вправо”. Каждому испытуемому было предоставлено четыре попытки для прохождения эксперимента, длительностью 2 мин. Каждая новая команда могла генерироваться пользователем не чаще 1 раза в секунду, при регистрации положения зрачка 25 раз в секунду. Перед каждым экспериментом проводилась необходимая калибровка устройства.

Рис. 1.

Пример траектории движения пользователя от точки старта к точке финиша с ошибкой в виде попадания в области черных прямоугольников.

С использованием тестов Айзенка, Спилберга и теста на рабочую память были установлены психологические характеристики испытуемых. Тест на рабочую память реализован следующим образом: задавалась матрица размером 5 × 5 квадратов. В каждой попытке генерировалось выделение трех квадратов, последовательность которых нужно было запомнить и верно определить порядковый номер предъявления одного из них в конце каждой попытки (Войтов и др., 2015). Число попыток равнялось десяти.

Для оценки параметров движения глаз использовался с учетом особенностей генерации команд алгоритм дискретного вейвлет-преобразования с использованием вейвлета Хаара (Добеши, 2001). Для полученных значений каждого уровня вейвлет-преобразования (рис. 2) рассчитывались средние значения и среднеквадратическое отклонение всего временного ряда. Полученные значения интерпретируются как средние расстояния, пройденные зрачком за время эксперимента, при этом период изменения расстояния соответствует масштабу (или уровню) вейвлет-преобразования. Соответственно, среднеквадратическое отклонение данных временного ряда после вейвлет-преобразования – это усредненные значения перемещений зрачка от средней амплитуды перемещения за все время выполнения теста. Полученные значения будем называть, в соответствии с принятыми в вейвлет-анализе подходами, аппроксимирующими последовательностями (а-последовательности) и детализирующими последовательностями (b-последовательности). При этом непосредственно вейвлет-преобразование осуществлялось на данных, где частота дискретизации была искусственно снижена до 5 Гц. Таким образом, масштабы вейвлет-преобразования имели следующие периоды: 0.4, 0.8, 1.6, 3.2, 6.4, 12.8 с.

Рис. 2.

Результаты вейвлет-преобразования расстояния перемещения зрачка. Пояснения в тексте.

В статистическом анализе использовались методы дескриптивной статистики, критерии Крас-кела–Уоллиса, Манна–Уитни, Вилкоксона для парных случаев (Рунион, 1982; Гланц, 1998), при этом параметр α принимался равным 5%. Для анализа категориальных переменных использовались точный критерий Фишера и критерий χ2. Для статистического изучения связи между явлениями использовали непараметрический метод – коэффициент ранговой корреляции Спирмена. Учитывался эффект множественных сравнений.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Число испытуемых, не достигших цели в первой, второй, третьей и четвертой попытках, составило 70, 50, 47.5 и 45% соответственно (p < 0.05 при сравнении первого и последнего эксперимента). Этот факт демонстрирует эффективность обучения применению данного интерфейса для управления эргатической системой и, в общем, близок к результатам, полученным при управлении движущимися объектами (Туровский, 2017a). Число тех, кто дошел до цели, но не начал возвращаться к точке старта в первой, второй, третьей и четвертой попытках, составило 5, 7.5, 10 и 10% соответственно (p ≫ 0.05). Очевидным результатом было то, что пользователь, совершивший меньшее число ошибок при управлении маркером (совмещение маркера с областями экрана, запрещенными для совмещения на данном эксперименте), большее число раз достигал целевой области (p < 0.05). Корреляционным анализом выявлена взаимосвязь между результатами теста на экстраверсию (тест Айзенка) и результатами успешного выполнения испытания (p < 0.05, r = –0.39), что свидетельствует о том, что экстраверты хуже достигают цели, вероятно, это обусловлено большей концентрацией внимания интровертов.

Разделение выборки по результатам достижения или недостижения цели продемонстрировало следующую зависимость (табл. 1). При достижении цели среднеквадратическое отклонение как а-последовательностей, так и b-последовательностей были статистически ниже, чем для попыток, где цель не была достигнута. Аналогично средние значения а-последовательностей (аппроксимированных файлов) так же были ниже при достижении цели. Следовательно, зрачок пользователя проходил меньшие расстояния, а сам характер движений носил меньший размах при успешном достижении цели.

Таблица 1.

Значения расстояния перемещения зрачка (у. е.) для разных масштабов вейвлет-преобразования в зависимости от достижения цели. Среднее M ± m (СКО M ± m)

  Уровни
a-последовательность b-последовательность
Масштаб ВП 1 2 3 4 5 6 1 2 3 4 5 6
Не дошел до цели 3.67 ± 0.37 (14.08 ± 0.41) 3.63 ± 0.37 (9.60 ± 0.35) 3.59 ± 0.37 (6.40± 0.30) 3.56 ± 0.37 (4.35 ± 0.25) 3.53 ±
0.37 (3.04 ±
0.21)
3.52±
0.37 (2.19 ± 0.17)
–0.08 ± 0.06 (14.09 ±
0.38)
–0.10 ±
0.06 (9.91 ±
0.26)
0.04 ±
0.06 (6.78 ±
0.21)
–0.03 ± 0.06 (4.48 ±
0.18)
–0.02 ± 0.05 (2.98 ±
0.16)
0.04 ±
0.07 (2.00 ± 0.13)
Дошел до цели 2.74 ± 0.27**
(11.91 ± 0.33**)
2.68 ± 0.27** (8.04 ± 0.29**) 2.65 ±
0.27** (5.44 ± 0.24**)
2.63 ±
0.27** (3.75 ±
0.20*)
2.61 ±
0.27** (2.58 ±
0.16**)
2.59±
0.27** (1.86±0.13*)
–0.05 ± 0.05 (12.14 ±
0.29*)
0.01 ±
0.04 (8.27 ±
0.20**)
–0.08 ±
0.04 (5.68 ±
0.18*)
–0.06 ± 0.05 (3.82 ±
0.15*)
–0.08 ± 0.05 (2.61 ±
0.12*)
0.01 ±
0.05 (1.73 ± 0.10*)

Примечание: *** – p ≪ 0.001, ** – p < 0.01, * – p < 0.05 при различиях между достижением и не достижением цели.

При этом следует обратить внимание, что данная закономерность охватывала все исследуемые периоды. Данный результат может быть интерпретирован двояко. С одной стороны (Туровский, 2017б), по мере успешного овладения методикой управления размах движений зрачка уменьшается. С другой, возможна ситуация, что пользователь активно двигает глазом, пытаясь “найти” те положения, которые соответствуют успешному управлению, что, однако, по ряду причин не удается. В этом случае стратегия максимальной амплитуды движения глаз сохраняется, что и находит отражение в представленных данных.

Сравнение результатов вейвлет-преобразования в зависимости от ошибок управления показало, что для периодов 0.8, 1.6, 6.4 и 12.8 с наличие ошибок управления сопровождается значимо большими значениями среднеквадратического отклонения а-последовательностей (рис. 3). При этом для b-последовательностей таких зависимостей в большинстве случаев не наблюдалось. Таким образом, выявленное увеличение среднеквадратического отклонения отражает больший размах движений зрачка. Вероятно, большая амплитуда движений зрачка соответствует худшему управлению, что приводит к ошибке, и в то же время больший размах движений может отражать попытки пользователя выйти из зоны экрана, нахождение в которой интерпретируется как ошибка. Таким образом, показано, что высокоамплитудные движения глаз в исследуемых периодах являются маркерами неуспешного овладения видеоокулографическим интерфейсом и являются показателями наличия ошибок при его использовании. В то же время динамика результатов вейвлет-преобразования от попытки к попытке выявлена не была.

Рис. 3.

Различия среднеквадратического отклонения для аппроксимирующих значений (а-последовательность) в зависимости от наличия ошибок в управлении. Различия статистически значимы для: аp = 0.0466; бp = 0.0368; вp = 0.0090; гp = 0.0232.

Анализ параметров рабочей памяти с успешностью или неуспешностью достижения цели продемонстрировал взаимосвязь этих показателей (рис. 4). Можно было бы ожидать, что более высокие показатели рабочей памяти должны давать лучшие результаты управления. Действительно, в ходе работы с окулографическим интерфейсом пользователю нужно запоминать необходимые положения зрачка, генерирующие команды, и соотносить их с управлением курсором. Вероятно, низкий уровень рабочей памяти не позволяет пользователю запоминать необходимые для управления параметры, что должно сказаться на результате. Сравнение показателей рабочей памяти с ошибками в управлении показало значимые различия. Люди с низким значением теста на рабочую память (6–7 баллов) реже совершали ошибку управления (в двух случаях из 20). Люди с высоким значением теста на рабочую память (9–10 баллов) совершали ошибки управления значительно чаще, в 43 случаях из 105. Таким образом, высокие показатели рабочей памяти связаны с низкими показателями освоения окулографического интерфейса, т.е. результаты продемонстрировали противоположную динамику: с ростом результатов тестирования по рабочей памяти (что подразумевает лучшие показатели) качество управления снижается.

Рис. 4.

Доля достигнувших цели в зависимости от показателей рабочей памяти (p < 0.01).

Последовательности, представляющие собой результаты вейвлет-преобразования, продемонстрировавшие статистически значимые различия в зависимости от показателей рабочей памяти, представлены в табл. 2. Из таблицы следует, что высокие значения рабочей памяти оператора приводят к высоким значениям среднеквадратического отклонения расстояний, на которые перемещался зрачок. Поскольку установлено, что высокоамплитудные движения глаз являются маркерами неуспешного овладения окулографическим интерфейсом, то становится понятной связь большого числа ошибок и низкой точности работы окулографического интерфейса для операторов с высокими показателями рабочей памяти. Тем не менее физиологический механизм этой зависимости требует еще детального изучения. Можно предположить, что именно тот тест на рабочую память из большого числа существующих, который использовался в этой работе, обеспечивает столь парадоксальный результат.

Таблица 2.

Различия b-последовательностей в зависимости от характеристик рабочей памяти

Значения памяти  Уровни ВП
b1 b2 b3 b b
M* CKO** M CKO* M CKO*** M CKO** M CKO**
Средние (8) –0.09 ± 0.11 11.62 ± 0.63 0.11 ± 0.12 9.63 ± 0.55 –0.10 ± 0.17 7.31 ± 0.45 0.16 ± 0.17 6.01 ± 0.35 –0.33 ± 0.21 4.33 ± 0.24
Низкие (6,7) –0.01 ± 0.10 11.60 ± 0.56 -0.24 ± 0.16 10.57 ± 0.80 0.06 ± 0.15 7.81 ± 0.61 0.06 ± 0.20 6.66 ± 0.54 –0.10 ± 0.29 4.87 ± 0.44
Высокие (9,10) –0.19 ± 0.06 13.63 ± 0.37 0.03 ± 0.08 11.74 ± 0.35 0.005 ± 0.11 9.68 ± 0.30 –0.06 ± 0.14 7.32 ± 0.21 –0.04 ± 0.11 5.78 ± 0.19

Примечание: критерий Краскела–Уоллиса (*** – p ≪ 0.001, ** – p < 0.01, * – p < 0.05). М – среднее значение ряда, СКО – среднеквадратическое отклонение ряда.

Рассматривая не суммарное перемещение зрачка, а отдельно перемещения в проекциях на горизонтальные и вертикальные оси, получены следующие результаты (табл. 3). Для всех исследуемых периодов размах движений зрачка по горизонтальной оси существенно превосходил таковой для вертикальной оси. При этом различия в зависимости от достижения цели в детализированных последовательностях для периодов меньше 3.2 были достоверно значимы для горизонтального движения глаз, но отсутствовали для движения глаз по вертикали. Связи между характером движения зрачка в проекции на вертикальную и горизонтальную оси в зависимости от ошибок при выполнении команд установлено не было.

Таблица 3.

Проекции движения зрачка на ортогональные оси

Горизонталь Вертикаль
Среднее b1 –0.03 ± 0.09 Среднее b1 –0.02 ± 0.05
CКО b1 16.46 ± 0.46 СКО b1 10.06 ± 0.33***
Среднее b2 –0.07 ± 0.07 Среднее b2 –0.08 ± 0.05
СКО b2 9.84 ± 0.25 СКО b2 6.36 ± 0.19***
Среднее b3 –0.04 ± 0.07 Среднее b3 –0.02 ± 0.05
СКО b3 5.94 ± 0.15 СКО b3 3.88 ± 0.11***
Среднее b4 –0.08 ± 0.05 Среднее b4 –0.05 ± 0.04
СКО b4 3.29 ± 0.09 СКО b4 2.23 ± 0.07***
Среднее b5 –0.07 ± 0.04 Среднее b5 0.03 ± 0.03*
СКО b5 1.78 ± 0.05 СКО b5 1.25 ± 0.04***
Среднее a6 –0.05 ± 0.01 Среднее a6 –0.01 ± 0.01***
СКО a6 0.66 ± 0.02 СКО a6 0.54 ± 0.02***
Среднее b6 –0.02 ± 0.03 Среднее b6 0.02 ± 0.02
СКО b6 0.92 ± 0.03 СКО b6 0.71 ± 0.02

Примечание: критерий Краскела–Уоллиса (*** – p ≪ 0.001, ** – p < 0.01, * – p < 0.05).

Анализ влияния показателей рабочей памяти продемонстрировал, что только быстрые движения глаз в горизонтальной плоскости (0.4, 0.8 с) давали статистически значимые различия (p < 0.01), в то время как вертикальные движения глаз не продемонстрировали достоверных различий.

ЗАКЛЮЧЕНИЕ

Представлены результаты исследования параметров движения глаз человека при помощи видеоокулографического интерфейса для управления объектом на плоскости. Показано, что в ходе проводимого эксперимента от попытки к попытке снижались количество ошибок и число испытуемых, не осуществивших успешное управление, а также зависимость способности такого управления от темперамента человека и особенностей рабочей памяти. Показано, что при высоких значениях рабочей памяти пользователи совершают более резкие высокоамплитудные движения зрачком, формируя управляющий паттерн, что в итоге приводит к большему числу ошибок управления и не достижению требуемого результата. Таким образом, данные о психологических особенностях пользователя позволяют, в первом приближении, оценить его потенциал в аспекте освоения видеоокулографических интерфейсов. В значительной степени различия по указанным показателям связаны с движением зрачка вдоль горизонтальной оси, нежели в вертикальной. Наиболее значимые движения зрачка находятся в областях с периодом от 0.4 до 1.6 с. Полученные данные могут быть использованы для оптимизации расположения датчиков движения глаза и выборе оптимальной частоты дискретизации данных, что позволит снизить объем вычислений без существенной потери точности. Более медленные периодические компоненты в движении глаз мало связаны с особенностями управления окулографическим интерфейсом. Полученные результаты будут полезными для создания и применения интерфейсов человек-компьютер в цифровом мониторинге при управлении эргатическими системами и могут служить отправной точкой для разработки высокоскоростных окулографических интерфейсов с существенно более широким, по сравнению с существующим, функционалом.

Работа выполнена при финансовой поддержке РФФИ (грант 19-07-01037 А).

Список литературы

  1. Войтов В.К., Косихин В.В., Ушаков Д.В. Рабочая память как перспективный конструкт когнитивной психологии и методы его измерения. Моделирование и анализ данных. 2015. С. 57–78.

  2. Гланц С. Медико-биологическая статистика. М.: Практика, 1998. 459 с.

  3. Добеши И. Десять лекций по вейвлетам. М.: НИЦ “Регулярная и хаотическая динамика”, 2001. 464 с.

  4. Рунион Р. Справочник по непараметрической статистике. Современный подход. М.: Финансы и статистика, 1982. 198 с.

  5. Туровский Я.А., Алексеев А.В. Вариабельность сердечного ритма пользователей видеоокулографическим интерфейсом в процессе обучения управлением самоходным шасси. Вестник ВГУ. 2017a. № 1. С. 118–124.

  6. Туровский Я.А., Борзунов С.В., Вахтин А.А., Алексеев А.В., Мамаев А.В. Вариабельность сердечного ритма в ходе обучения пользователей применению интерфейсов человек-компьютер. Вестник ВГУ. 2018. № 2. С. 255–263.

  7. Туровский Я.А., Кургалин С.Д., Алексеев А.В. Анализ движения глаз человека при управлении самоходным шасси с использованием системы видеоокулографического интерфейса. Сенсорные системы. 2017б. Т. 31. № 1. С. 51–58.

  8. Bissoli A., Lavino-Junior D., Sime M., Encarnação L., Bastos-Filho T. A human–machine interface based on eye tracking for controlling and monitoring a smart home using the internet of things. Sensors. 2019. 859 p. https://doi.org/10.3390/s19040859

  9. Martin W.C. Upper Limb Prostheses: A review of the literature with a focus on myoelectric hands workSafeBC. Evidence-Based Practice Group. 2011. 90 p.

  10. Maikrocoft. http://www.microsoft.com/en-us/kinectforwindows 2009.

  11. Oyekoya O.K., Stentiford F.W.M. Eye tracking as a new interface for image retrieval. BT Technology Journal. 2004. P. 161–169. https://doi.org/10.1023/B:BTTJ.0000047130.98920.2b

  12. Tobii. http://www.tobii.com/en/eye-tracking-research/global/products/ 2010.

  13. Wolpaw J.R., Birbaumer N., McFarland D.J. Brain–computer interfaces for communication and control. Clinical Neurophysiology. 2002. V. 113. P. 767–791.

  14. Zhu D., Bieger J., Molina G. A Survey of Stimulation Methods Used in SSVEP-Based BCIs. Hindawi publishing corporation computational intelligence and neuroscience. 2010. Article ID 702357.

Дополнительные материалы отсутствуют.