Сенсорные системы, 2020, T. 34, № 1, стр. 57-63

Фильтрация ошибочных покадровых результатов в процессе локализации прямоугольных плоских объектов при видеосъемке с использованием согласования графа преобразований

Е. В. Емельянова 12*, Б. И. Савельев 2, К. Б. Булатов 23

1 Национальный исследовательский технологический университет “МИСиС”
119049 Москва, Ленинский проспект, д. 4, Россия

2 ООО “Смарт Энджинс Сервис”
117312 Москва, проспект 60-летия Октября, д. 9, Россия

3 Федеральный исследовательский центр “Информатика и управление” Российской академии наук
127051 Москва, Большой Каретный переулок, д. 19, Россия

* E-mail: e.emelianova@smartengines.ru

Поступила в редакцию 08.10.2019
После доработки 21.10.2019
Принята к публикации 29.10.2019

Аннотация

Детектирование прямоугольных объектов является важной частью распознавания документов и автоматизации документооборота. При этом в процессе детектирования может появляться выбросовый шум – ложноопределенные координаты расположения документа, негативно влияющий на общее качество детектирования объекта и дальнейшей обработки. В работе поставлена задача фильтрации такого шума при детектировании плоского прямоугольного объекта на кадрах видеопоследовательности путем построения единой системы координат. Предлагаемый метод основывается на согласовании графа оцененных проективных преобразований кадров с шаблонами и кадров между собой. В проведенных экспериментах использовался смоделированный выбросовый шум, применяющийся к некоторым кадрам видеопоследовательности. Для оценки качества работы алгоритма сравниваются результаты расположения объекта до и после модуля согласования графа с истинным расположением объекта. Данная оценка представлена на основе открытой базы данных MIDV-500 видеосъемки документов, удостоверяющих личность. На этом наборе данных продемонстрировано снижение накопленной ошибки по сравнению с результатами до использования согласования графа при вычислении проективных преобразований.

Ключевые слова: согласование графа преобразований, проективное преобразование, единая система координат, видеопоследовательность, детектирование объектов, накопленная ошибка

DOI: 10.31857/S0235009220010084

Список литературы

  1. Савельев Б.И., Мамай И.Б., Николаев Д.П., Арлазаров В.Л., Булатов К.Б., Скорюкина Н.С. Метод согласования графа проективных преобразований для задачи панорамирования плоских объектов. Тр. и-та системного анализа. 2018. Т. 68. № S1. С. 124–133.

  2. Хартсхорн Р. Основы проективной геометрии. М.: Мир, 1970. 160 с.

  3. Babu N., Soumya A. Character recognition in historical handwritten documents. Proceedings of the 2019 IEEE International Conf. Communic. and Signal Processing. 2019. P. 299–304.

  4. Fan B., Qingqun K., Tomasz T., Zhiheng W. Receptive fields selection for binary feature description. IEEE Transactions on Image Processing. 2014. V. 23. № 6. P. 2583–2595.

  5. Iglewicz B., Hoaglin D. How to Detect and Handle Outliers. The ASQC Basic References in Quality Control: Statistical Techniques. Eds F. Edward, P. Mykytka. 1993. 77 p.

  6. Kelson R.T., Andre M.S., Adelardo A.D. Optical Flow Using Color Information. ACM New York. NY, USA. 2008. P. 5–10.

  7. Lukoyanov A.S., Nikolaev D.P., Konovalenko I.A. Modification of YAPE keypoint detection algorithm for wide local contrast range image. Information technologies and nanotechnology. 2018. P. 1193–1204.

  8. Martin A.F., Robert C.B. Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography. Comm. of the ACM. 1981. V. 24. P. 381–395.

  9. Moreno-García C.F., Elyan E., Jayne C. New trends on digitisation of complex engineering drawings. Neural Computing and Applications. 2019. V. 31 (6). P. 1695–1712.

  10. Newman P., Ho K. SLAM-loop closing with visually salient features. IEEE Proc. of International Conference on Robotics and Automation. 2005. P. 635–642.

  11. Novack G.D., Lim M.C. Retinal Detachment: Patient Perspective and Electronic Health Records. American Journal of Ophthalmology. 2019. V. 208. P. 64–67.

  12. Olson D. L. Delen D. Advanced Data Mining Techniques. Springer, 1st edition. 2008. 138 p.

  13. Skoryukina N., Nikolaev D., Arlazarov V. 2D art recognition in uncontrolled conditions using one-shot learning. ICMV. 2018. P. 1–8.

  14. Skoryukina N., Nikolaev D.P., Sheshkus A., Polevoy D. Real time rectangular document detection on mobile devices. In Seventh International Conference on Machine Vision. 2015. V. 9445. P. 1–6.

  15. Turcot P., Lowe D.G. Better matching with fewer features: The selection of useful features in large database recognition problems. Computer Vision Workshops (ICCV Workshops). 2009. P. 2109–2116.

Дополнительные материалы отсутствуют.