Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 514, № 2, стр. 289-296

НЕЙРОСЕТЕВЫЕ МЕТОДЫ ВЫДЕЛЕНИЯ СОЧИНИТЕЛЬНЫХ СВЯЗЕЙ

А. И. Пределина 1*, С. Ю. Дуликов 2, А. М. Алексеев 13

1 Санкт-Петербургский государственный университет
Санкт-Петербург, Россия

2 “Яндекс”
Москва, Россия

3 Санкт-Петербургское отделение Математического института им. В.А. Стеклова РАН
Санкт-Петербург, Россия

* E-mail: a-predelina@mail.ru

Поступила в редакцию 04.09.2023
После доработки 15.09.2023
Принята к публикации 18.10.2023

Аннотация

Данная работа посвящена решению задачи выделения сочинительных связей в предложениях на английском языке нейросетевыми методами. Решение этой задачи позволяет устанавливать потенциально ценные связи и отношения между определенными частями предложения; в том числе поэтому выделение сочинительных связей – важный инструмент предобработки текстов. В настоящей работе апробирован ряд идей способов решения задачи в рамках подхода “одностадийных предсказаний” (one-stage detectors). Полученный в работе результат сопоставим по качеству и более чем в 3 раза превосходит по производительности наиболее современные методы выделения сочинительных связей.

Ключевые слова: обработка естественного языка, выделение сочинительных связей, машинное обучение, нейросетевые модели

Список литературы

  1. Spacy. https://github.com/explosion/spaCy, 2015.

  2. Noam Chomsky. On certain formal properties of grammars. Information and control. 1959. V. 2 (2). P. 137–167.

  3. Jessica Ficler, Yoav Goldberg. A neural network for coordination boundary prediction. In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. 1016. P. 23–32.

  4. Ruidan He, Wee Sun Lee, Hwee Tou Ng, Daniel Dahl-meier. An unsupervised neural attention model for aspect extraction. In Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Association for Computational Linguistics. Vancouver, Canada, 2017. P. 388–397.

  5. Zihang Jiang, Weihao Yu, Daquan Zhou, Yunpeng Chen, Jiashi Feng, Shuicheng Yan. Convbert: Improving BERT with span-based dynamic convolution. CoRR, abs/2008.02496, 2020.

  6. Diederik P Kingma, Jimmy Ba. Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980, 2014.

  7. Keshav Kolluru, Vaibhav Adlakha, Samarth Aggarwal, Soumen Chakrabarti, et al. Openie6: Iterative grid labeling and coordination analysis for open information extraction. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2020. P. 3748–3761.

  8. Loshchilov I., Hutter F. Decoupled weight decay regularization. In International Conference on Learning Representations, 2019.

  9. Raj Reddy. Speech understanding systems: A summary of results of the five-year research effort. Carnegie Mellon University, 1977.

  10. Itiroo Sakai. Syntax in universal translation. In Proceedings 1961 International Conference on Machine Translation of Languages and Applied Language Analysis, Her Majesty’s Stationery Office, London, 1962. P. 593–608.

  11. Hiroki Teranishi, Hiroyuki Shindo, Yuji Matsumoto. Coordination boundary identification with similarity and replaceability. In Proceedings of the Eighth International Joint Conference on Natural Language Processing (Volume 1: Long Papers), Taipei, Taiwan. Asian Federation of Natural Language Processing. 2017. P. 264–272.

  12. Hiroki Teranishi, Hiroyuki Shindo, Yuji Matsumoto. Decomposed local models for coordinate structure parsing. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers), Minneapolis, Minnesota, Association for Computational Linguistics. 2019. P. 3394–3403.

  13. Vasilkovsky M., Alekseev A., Malykh V., Shenbin I., Tutubalina E., Salikhov D., Stepnov M., Chertok A., Nikolenko S. Detie: Multilingual open information extraction inspired by object detection. In Proceedings of the 36th AAAI Conference on Artificial Intelligence, 2022.

  14. Розенталь Д.Э., Теленкова М.А. Словарь-справочник лингвистических терминов, издание третье, 1985.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления