Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 514, № 2, стр. 385-394
ПОЛУЧАЕМ ЛИ МЫ ПОЛЬЗУ ОТ КАТЕГОРИЗАЦИИ ПОТОКА НОВОСТЕЙ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ ЦЕН АКЦИЙ?
Т. Д. Куликова 1, Е. Ю. Ковтун 2, *, С. А. Буденный 3
1 Национальный исследовательский университет
Высшая школа экономики;
Факультет компьютерных наук
Москва, Россия
2 Лаборатория искусственного интеллекта Sber AI Lab
Москва, Россия
3 Институт искусственного интеллекта AIRI
Москва, Россия
* E-mail: eykovtun@sberbank.ru
Поступила в редакцию 04.09.2023
После доработки 08.09.2023
Принята к публикации 18.10.2023
- EDN: CWFYFQ
- DOI: 10.31857/S2686954323601926
Полные тексты статей выпуска доступны в ознакомительном режиме только авторизованным пользователям.
Аннотация
Машинное обучение широко применяется в задаче прогнозирования цен на акции публичных компаний. Для построения более точной прогностической модели необходимо учитывать не только исторические данные о ценах на акции, но и относящиеся к ним знания из внешнего мира. Такую ценную информацию может дать эмоциональная окраска финансовых новостей, связанных с компанией. Однако финансовые новости могут быть разделены на различные тематические группы, например, Macro (новости, относящиеся к теме “макроэкономика”), Market (новости о ситуации на различных рынках) или Product news (новости о продукте, который производит та или иная компания). В задачах исследования рынка обычно не принимается во внимание такая категоризация. В данной работе мы стремимся восполнить этот пробел и изучить эффект от учета разделения новостей на группы по тематическому признаку в задаче прогнозирования цен на акции публичных компаний. Сначала мы получаем индикаторы настроения финансовых новостей, затем классифицируем их поток на 20 заранее определенных тем с помощью предварительно обученной модели. Кроме того, мы проводим эксперименты с несколькими хорошо зарекомендовавшими себя моделями для прогнозирования временных рядов, включая темпоральную конволюционную сеть (Temporal Convolutional Network), D-линейную модель (D-Linear), трансформатор (Transformer) и темпоральный синтезирующий трансформатор (Temporal Fusion Transformer). Результаты нашего исследования показывают, что использование информации об эмоциональной окраске новостей из отдельных тематических групп способствует улучшению метрик работы моделей глубокого обучения по сравнению с подходом, когда рассматриваются все новости без какого-либо разделения.
Полные тексты статей выпуска доступны в ознакомительном режиме только авторизованным пользователям.
Список литературы
Budennyy S., Kazakov A., Kovtun E., Zhukov L. New drugs and stock market: a machine learning framework for predicting pharma market reaction to clinical trial announcements. Scientific Reports. 2023. V. 13. № 1. P. 12817.
Nikou M., Mansourfar G., Bagherzadeh J. Stock price prediction using deep learning algorithm and its comparison with machine learning algorithms. Intelligent Systems in Accounting, Finance and Management. 2019. V. 26. № 4. P. 164–174.
Khan W., Ghazanfar M.A., Azam M.A., Karami A., Alyoubi K.H., Alfakeeh A.S. Stock market prediction using machine learning classifiers and social media, news. Journal of Ambient Intelligence and Humanized Computing. 2020. P. 1–24.
Patel V., Patel A. C Clustering news articles for topic detection. 2018.
Kelly S., Ahmad K. Estimating the impact of domain-specific news sentiment on financial assets. Knowledge-Based Systems. 2018. V. 150. P. 116–126.
Mu G., Gao N., Wang Y., Dai L. A stock price prediction model based on investor sentiment and optimized deep learning. IEEE Access PP, 2023. https://doi.org/10.1109/ACCESS.2023.3278790
Wang Z., Hu Z., Li F., Ho S.-B.L. Learning-based stock market trending analysis by incorporating social media sentiment analysis. 2021. https://api. semanticscholar.org/CorpusID:235526511
Liu J.-X., Leu J.-S., Holst S. Stock price movement prediction based on stock- twits investor sentiment using finbert and ensemble svm. PeerJ Computer Science. 2023. V. 9. P. 1403. https://doi.org/10.7717/peerj-cs.1403
Ji Z., W P., Ling C., Zhu P. Exploring the impact of investor’s sentiment tendency in varying input window length for stock price prediction. Multimedia Tools and Applications. 2023. V. 82. P. 1—35. https://doi.org/10.1007/s11042-023-14587-8
zeroshot/twitter-financial-news-topic. https://huggingface.co/datasets/zeroshot/ twitter-financial-news-topic. Accessed: 2023-05-17
finbert-tone-finetuned-finance-topic-classification. https://huggingface.co/nickmuchi/finbert-tone-finetuned-finance-topic-classification. Accessed:2023-05-17
finbert-tone. https://huggingface.co/yiyanghkust/finbert-tone. Accessed: 2023-05-17
Lea C., Flynn M., Vidal R., Reiter A., Hager G. Temporal convolutional networks for action segmentation and detection. 2016.
Zeng A., Chen M., Zhang L., Xu Q. Are Transformers Effective for Time Series Forecasting? https://doi.org/10.48550/arXiv.2205.13504
Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L., Polosukhin I. Attention Is All You Need (2023).
Lim B., Arik S., Loeff N., Pfister T. Temporal fusion transformers for inter-pretable multi-horizon time series forecasting. International Journal of Forecasting. 2021. V. 37. https://doi.org/10.1016/j.ijforecast.2021.03.012
Temporal Fusion Transformer. https://unit8co.github.io/darts/generated_api/darts.models.forecasting.tft_model.html Accessed: 2023-05-17
Historical financial news archive. https://www.kaggle.com/gennadiyr/ us-equities-news-data/tasks. Accessed: 2023-05-17
Дополнительные материалы отсутствуют.
Инструменты
Доклады Российской академии наук. Математика, информатика, процессы управления