Доклады Российской академии наук. Математика, информатика, процессы управления, 2023, T. 514, № 2, стр. 333-342

“MTC Kion”: НАБОР ДАННЫХ ДЛЯ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ НА ОСНОВЕ НЕЯВНОГО ОТКЛИКА, КОНТЕКСТНЫХ ПРИЗНАКОВ И АНАЛИЗА ПОСЛЕДОВАТЕЛЬНОСТЕЙ

И. Сафило 1*, Д. Тихонович 2**, А. В. Петров 3***, Д. И. Игнатов 4

1 MTS, Национальный исследовательский университет “Высшая школа экономики”
Москва, Россия

2 МТС
Москва, Россия

3 University of Glasgow
Glasgow, United Kingdom

4 Национальный исследовательский университет “Высшая школа экономики”
Москва, Россия

* E-mail: irsafilo@gmail.com
** E-mail: daria.m.tikhonovich@gmail.com
*** E-mail: a.petrov.1@research.gla.ac.uk

Поступила в редакцию 30.05.2023
После доработки 15.10.2023
Принята к публикации 20.10.2023

Аннотация

Мы представляем новый датасет для построения рекомендаций фильмов и сериалов, собранный на основе данных реальных пользователей платформы потокового вещания фильмов и сериалов МТС Kion. В отличие от других популярных датасетов для рекомендаций фильмов, таких как MovieLens или Netflix, наш датасет основан на неявных взаимодействиях, полученных во время просмотров контента пользователями, а не на явных оценках, поставленных фильмам. Мы также предоставляем обширную дополнительную информацию, включая характеристики взаимодействий (такие как дата взаимодействия, продолжительность просмотра и процент просмотра), демографические данные пользователей и подробную мета-информацию о фильмах. Кроме того, мы описываем MTS Kion Challenge – онлайн-соревнование по построению рекомендательных систем на основе датасета Kion, и предоставляем обзор лучших решений от победителей соревнования.

Ключевые слова: рекомендательные системы, нейронные сети, неявный отклик, последовательные рекомендации, коллаборативная фильтрация

Список литературы

  1. Sivan Yogev Asela Gunawardana, Guy Shani. Evaluating Recommendation Systems. 2022. P. 547–601. https://doi.org/10.1007/978-0-387-85820-3_8

  2. James Bennett and Stan Lanning. The Netflix Prize. In Proc. KDD. 2007.

  3. Christopher JC Burges. 2010. From RankNet to LambdaRank to LambdaMart: An overview. Learning. 2010. V. 11. P. 23–581, 81.

  4. Maurizio Ferrari Dacrema, Paolo Cremonesi, and Dietmar Jannach. Are we really making much progress? A worrying analysis of recent neural recommendation approaches. In Proc. RecSys. 2019. P. 101–109.

  5. Mukund Deshpande and George Karypis. 2004. Item-based top-n recommendation algorithms. ACMTransactions on Information Systems (TOIS). 2004. V. 22. № 1. P. 143–177.

  6. Anna Veronika Dorogush, Vasily Ershov, and Andrey Gulin. 2018. CatBoost: gradient boosting with categorical features support. arXiv preprint arXiv:1810.11363 (2018).

  7. Andrey Gulin, Igor Kuralenok, and Dimitry Pavlov. Winning the transfer learning track of yahoo!’s learning to rank challenge with yetirank. In Proc. Learning to Rank Challenge. PMLR, 2011. P. 63–76.

  8. F Maxwell Harper and Joseph A Konstan. 2015. The MovieLens datasets: History and context. ACM Transactions on Interactive Intelligent Systems (TIIS). 2015. V. 5. № 4. P. 1–19.

  9. Balázs Hidasi, Alexandros Karatzoglou, Linas Baltrunas, and Domonkos Tikk. Session-based Recommendations with Recurrent Neural Networks. In Proc. ICLR. 2016.

  10. Wang-Cheng Kang and Julian McAuley. Self-attentive sequential recommendation. In Proc. ICDM. 2018. P. 197–206.

  11. Guolin Ke, Qi Meng, Thomas Finley, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, and Tie-Yan Liu. LightGBM: A highly efficient gradient boosting decision tree. In Proc. NeurIPS. 2017. P. 3146–3154.

  12. Maciej Kula. Metadata embeddings for user and item cold-start recommendations. arXiv preprint arXiv:1507.08439. 2015.

  13. Jiacheng Li, Yujie Wang, and Julian McAuley. Time interval aware selfattention for sequential recommendation. In Proceedings of the 13th international conference on web search and data mining. 2020. P. 322–330.

  14. Aleksandr Petrov and Craig Macdonald. Effective and Efficient Training for Sequential Recommendation using Recency Sampling. Proc. RecSys. 2022.

  15. Aleksandr Petrov and Craig Macdonald. A Systematic Review and Replicability Study of BERT4Rec for Sequential Recommendation. In Proc. RecSys. 2022.

  16. Aleksandr Petrov and Yuriy Makarov. Attention-based neural re-ranking approach for next city in trip recommendations. In Proc. WSDM WebTour. 2021. P. 41–45.

  17. Steffen Rendle, Christoph Freudenthaler, Zeno Gantner, and Lars Schmidt-Thieme. BPR: Bayesian personalized ranking from implicit feedback. In Proc. CUAI. 2009. P. 452–461.

  18. Steffen Rendle, Christoph Freudenthaler, and Lars Schmidt-Thieme. Factorizing personalized markov chains for next-basket recommendation. In Proc. WWW. 2010. P. 811–820.

  19. Steffen Rendle, Zeno Gantner, Christoph Freudenthaler, and Lars Schmidt-Thieme. Fast context-aware recommendations with factorization machines. In Proc. SIGIR. 2011. P. 635–644.

  20. Harald Steck, Linas Baltrunas, Ehtsham Elahi, Dawen Liang, Yves Raimond, and Justin Basilico. Deep learning for recommender systems: A Netflix case study. AI Magazine. 2021. V. 42. № 3. P. 7–18.

  21. Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, and Peng Jiang. BERT4Rec: Sequential recommendation with bidirectional encoder representations from transformer. In Proc. CIKM. 2019. P. 1441–1450.

  22. Jiaxi Tang and Ke Wang. Personalized top-n sequential recommendation via convolutional sequence embedding. In Proc. WSDM. 2018. P. 565–573.

  23. Wayne Xin Zhao, Shanlei Mu, Yupeng Hou, Zihan Lin, Yushuo Chen, Xingyu Pan, Kaiyuan Li, Yujie Lu, Hui Wang, Changxin Tian, et al. Recbole: Towards a unified, comprehensive and efficient framework for recommendation algorithms. In Proc. CIKM. 2021. P. 4653–4664.

Дополнительные материалы отсутствуют.

Инструменты

Доклады Российской академии наук. Математика, информатика, процессы управления