Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 514, № 2, стр. 385-394

ПОЛУЧАЕМ ЛИ МЫ ПОЛЬЗУ ОТ КАТЕГОРИЗАЦИИ ПОТОКА НОВОСТЕЙ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ ЦЕН АКЦИЙ?

Т. Д. Куликова 1, Е. Ю. Ковтун 2*, С. А. Буденный 3

1 Национальный исследовательский университет Высшая школа экономики; Факультет компьютерных наук
Москва, Россия

2 Лаборатория искусственного интеллекта Sber AI Lab
Москва, Россия

3 Институт искусственного интеллекта AIRI
Москва, Россия

* E-mail: eykovtun@sberbank.ru

Поступила в редакцию 04.09.2023
После доработки 08.09.2023
Принята к публикации 18.10.2023

Аннотация

Машинное обучение широко применяется в задаче прогнозирования цен на акции публичных компаний. Для построения более точной прогностической модели необходимо учитывать не только исторические данные о ценах на акции, но и относящиеся к ним знания из внешнего мира. Такую ценную информацию может дать эмоциональная окраска финансовых новостей, связанных с компанией. Однако финансовые новости могут быть разделены на различные тематические группы, например, Macro (новости, относящиеся к теме “макроэкономика”), Market (новости о ситуации на различных рынках) или Product news (новости о продукте, который производит та или иная компания). В задачах исследования рынка обычно не принимается во внимание такая категоризация. В данной работе мы стремимся восполнить этот пробел и изучить эффект от учета разделения новостей на группы по тематическому признаку в задаче прогнозирования цен на акции публичных компаний. Сначала мы получаем индикаторы настроения финансовых новостей, затем классифицируем их поток на 20 заранее определенных тем с помощью предварительно обученной модели. Кроме того, мы проводим эксперименты с несколькими хорошо зарекомендовавшими себя моделями для прогнозирования временных рядов, включая темпоральную конволюционную сеть (Temporal Convolutional Network), D-линейную модель (D-Linear), трансформатор (Transformer) и темпоральный синтезирующий трансформатор (Temporal Fusion Transformer). Результаты нашего исследования показывают, что использование информации об эмоциональной окраске новостей из отдельных тематических групп способствует улучшению метрик работы моделей глубокого обучения по сравнению с подходом, когда рассматриваются все новости без какого-либо разделения.

Ключевые слова: Финансовые новости, Фондовый рынок, BERT, Тематическая классификация, Анализ эмоциональной окрашенности текста, Прогнозирование временных рядов, Глубокое обучение, Внешние данные

Список литературы

  1. Budennyy S., Kazakov A., Kovtun E., Zhukov L. New drugs and stock market: a machine learning framework for predicting pharma market reaction to clinical trial announcements. Scientific Reports. 2023. V. 13. № 1. P. 12817.

  2. Nikou M., Mansourfar G., Bagherzadeh J. Stock price prediction using deep learning algorithm and its comparison with machine learning algorithms. Intelligent Systems in Accounting, Finance and Management. 2019. V. 26. № 4. P. 164–174.

  3. Khan W., Ghazanfar M.A., Azam M.A., Karami A., Alyoubi K.H., Alfakeeh A.S. Stock market prediction using machine learning classifiers and social media, news. Journal of Ambient Intelligence and Humanized Computing. 2020. P. 1–24.

  4. Patel V., Patel A. C Clustering news articles for topic detection. 2018.

  5. Kelly S., Ahmad K. Estimating the impact of domain-specific news sentiment on financial assets. Knowledge-Based Systems. 2018. V. 150. P. 116–126.

  6. Mu G., Gao N., Wang Y., Dai L. A stock price prediction model based on investor sentiment and optimized deep learning. IEEE Access PP, 2023. https://doi.org/10.1109/ACCESS.2023.3278790

  7. Wang Z., Hu Z., Li F., Ho S.-B.L. Learning-based stock market trending analysis by incorporating social media sentiment analysis. 2021. https://api. semanticscholar.org/CorpusID:235526511

  8. Liu J.-X., Leu J.-S., Holst S. Stock price movement prediction based on stock- twits investor sentiment using finbert and ensemble svm. PeerJ Computer Science. 2023. V. 9. P. 1403. https://doi.org/10.7717/peerj-cs.1403

  9. Ji Z., W P., Ling C., Zhu P. Exploring the impact of investor’s sentiment tendency in varying input window length for stock price prediction. Multimedia Tools and Applications. 2023. V. 82. P. 1—35. https://doi.org/10.1007/s11042-023-14587-8

  10. zeroshot/twitter-financial-news-topic. https://huggingface.co/datasets/zeroshot/ twitter-financial-news-topic. Accessed: 2023-05-17

  11. finbert-tone-finetuned-finance-topic-classification. https://huggingface.co/nickmuchi/finbert-tone-finetuned-finance-topic-classification. Accessed:2023-05-17

  12. finbert-tone. https://huggingface.co/yiyanghkust/finbert-tone. Accessed: 2023-05-17

  13. Lea C., Flynn M., Vidal R., Reiter A., Hager G. Temporal convolutional networks for action segmentation and detection. 2016.

  14. Zeng A., Chen M., Zhang L., Xu Q. Are Transformers Effective for Time Series Forecasting? https://doi.org/10.48550/arXiv.2205.13504

  15. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L., Polosukhin I. Attention Is All You Need (2023).

  16. Lim B., Arik S., Loeff N., Pfister T. Temporal fusion transformers for inter-pretable multi-horizon time series forecasting. International Journal of Forecasting. 2021. V. 37. https://doi.org/10.1016/j.ijforecast.2021.03.012

  17. Temporal Fusion Transformer. https://unit8co.github.io/darts/generated_api/darts.models.forecasting.tft_model.html Accessed: 2023-05-17

  18. Historical financial news archive. https://www.kaggle.com/gennadiyr/ us-equities-news-data/tasks. Accessed: 2023-05-17

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления