基于会话推荐系统最新长文综述,163篇参考文献,已被ACM Computing Surveys接收

标签: 会话 推荐系统 综述 | 发表时间:2021-05-23 12:37 | 作者:机器之心
出处:https://www.jiqizhixin.com/
一. 论文简介

本文给大家介绍一篇刚被 ACM 旗舰期刊 ACM Computing Surveys (CSUR) 接收的基于会话推荐系统 (Session-based Recommender Systems (SBRS)) 的综述长文。ACM Computing Surveys 是计算机学科最具影响力的期刊之一,其最新影响因子为 7.99,为中科院认定的一区 Top 期刊,CORE Rank A* 期刊,主要发表计算机科学领域较有代表性的综述论文。

文章题为《A Survey on Session-based Recommender Systems》,论文一作为麦考瑞大学博后Shoujin Wang,研究方向为数据挖掘,机器学习以及推荐系统 。这篇文章是基于会话的推荐系统方向的一篇较为系统全面的综述文章。全文共 39 页,包含 11 个 sections、4 幅插图、11 张表格和 163 篇该领域内有代表性的参考文献。该文基于作者长期的积累和思考,对基于会话推荐系统这一推荐系统子领域进行了全面而深入的梳理和总结。

该文对目前文献中存在的各种各样的对问题的定义进行了统一的形式化,系统地定义了基于会话推荐系统的场景,任务和基本问题以及基本方法。作者从数据特征的角度出发,系统分析了 session 数据所特有的基本特征,以及他们给推荐任务带来的挑战。然后系统而全面地对这一领域当前的进展进行了归纳总结,包括对方法的分类和比较,对每类方法基本思想和特征的阐述。梳理和总结了基于会话推荐系统的主要应用场景,代表性算法和公开的数据集,并提供了开源链接。最后分享了本领域的未来可能的研究方向。

该文由浅入深,语言力求通俗易懂,举例丰富,既有深入的理论分析,又有应用,算法和数据集,既适合科研工作者阅读,也适合工程人员阅读。作者希望该文能给相关的研究人员提供一个对该领域研究的主要问题以及涉及的各个方面、主要挑战和进展一个全面而综合的了解,同时给未来的研究提供一些启发。

论文预印版链接:
https://www.researchgate.net/profile/Shoujin-Wang/research
https://arxiv.org/abs/1902.04864

二. 论文解读

0. 摘要

在当今的信息过载和数字经济时代,推荐系统在消费、服务和决策制定等方面正发挥着日益重要的作用。近些年来,基于会话的推荐系统(session-based recommender systems (SBRSs)) ,作为推荐系统的一种新的范式,正在兴起。不同于其他传统的推荐系统,如基于内容的推荐系统和协同过滤推荐系统,通常建模用户的长期和静态的偏好,基于会话的推荐系统旨在捕获用户短期和动态的偏好来给用户提供更实时和精准的推荐服务。这些推荐服务能对用户不断发展和变化的会话上下文场景具有较好的敏感性。尽管基于会话的推荐系统已经被广泛研究,目前既没有对基于会话的推荐系统的一个统一的问题定义和陈述,也没有对基于会话的推荐系统的特征和挑战的一个深入阐述。通常,人们并不太清楚基于会话的推荐系统的挑战被解决到什么程度了,以及这一领域的总体研究概况是什么样的。

这篇全面综述通过深入探索和讨论基于会话的推荐系统所涉及的主体 (比如会话),行为(比如用户对物品的点击),以及他们的特性(比如会话的长度) 来解决上述问题。研究者提出了一个通用的基于会话的推荐系统的问题陈述,概括和总结了这一领域多样化的数据特征和挑战,并且定义了一个分类方法来对该领域内代表性的研究进行分类。研究者讨论了基于会话的推荐系统在现实场景中的主要应用领域,整理了典型的算法和常用的数据集。最后研究者讨论了在这个充满活力的研究领域内的新的研究机会。

1. 引言

推荐系统已经发展成为人们进行快速有效选择和决策的一个基本工具。它已经渗透到我们日常生活的方方面面,包括生活、工作、学习、娱乐、社交和商业运营。推荐系统的作用在数字经济中和信息日益过载的时代显得尤为重要,因为用户通常需要从大量的和快速增长的内容、产品和服务(统称为物品 (item))中选择他们所需要的。因此,各种各样的推荐系统研究领域兴起并取得了成功,比如基于内容的推荐系统,协同过滤推荐系统和混合型推荐系统

然而,这些推荐系统倾向于利用所有的用户与物品之间的交互信息来学习每个用户对物品的长期和静态的偏好。这种做法通常是建立在一个隐含的假设之上的,那就是一个用户的所有的历史交互行为对他当前的偏好是同等重要的。这可能与现实不相符合,主要原因有两点:
  • 首先,一个用户对物品的选择不仅依赖于他长期以来形成的偏好,而且依赖于他短期的最近的偏好和跟时间相关的上下文场景(比如他最近浏览或者购买过的物品)。这种短期偏好通常隐含在用户的最近发生的与物品的交互行为之中,而这类最近的交互行为通常仅占用户所有交互行为的很小一部分。

  • 其次,一个用户对物品的偏好通常是动态变化而非静止的,它会随着时间的推移而演变。

近些年来,为了弥补上述不足,基于会话的推荐系统 (session-based recommender systems (SBRSs)) 悄然兴起,并引起了越来越多的关注。不同于上述推荐系统,基于会话的推荐系统从用户在交易过程中产生的会话 (session) 数据来挖掘和学习用户的偏好。每一个会话包含在一段连续的时间段内发生的多个「用户–物品交互行为」,比如某用户在一次交易会话 (比如从登录电商平台的账号到退出账号这段时间)中购买了一篮子物品。通过将每一个会话作为最基本的输入数据单元,一个基于会话的推荐系统能够从一个用户的最近产生的会话中捕获他的短期偏好,以及从一个会话到另一个会话之间的偏好的变化,从而进行更精准和实时的推荐。

在本文中,研究者用基于会话的推荐系统来指代那些所有以 session 数据为中心来推荐当前会话里的下一个物品,接下来的所有物品以及下一个会话里的所有物品的推荐系统。这个定义包括了有些文献中的一些狭义的基于会话的推荐系统,它们只推荐当前会话里的下一个物品。

对于基于会话的推荐系统,文献中存在各种各样不同的工作。这些工作通常用不同的词语来描述,建立在不同的场景设置和假设之上,针对不同的应用领域。比如,Hidasi et al. 在匿名会话数据上建立了一个基于会话的推荐系统。他们通过假设会话内部的交互行为之间存在严格的先后顺序来预测用户接下来想要点击的物品或者想看的电影。Hu et al. 则在非匿名会话数据上建立了另一个基于会话的推荐系统来推荐用户下一个可能想购买的物品,他们没有假设会话内部存在严格的顺序。Jing et al. 则基于非匿名会话数据设计了一个基于会话的推荐系统来推荐用户想要听的下一首歌或者想看的下一部电影,他们假设会话内部存在顺序。

虽然基于会话的推荐系统广泛存在于各个领域并且很多相关的研究都已经开展了,但是在这个领域还存在很多的由不同的描述,假设,场景设置和应用领域导致的不一致性。而且,没有一个统一的框架可以对现有的工作进行分类,对于基于会话的推荐系统也还没有统一的问题陈述。更重要的是,没有人对基于会话的推荐系统的特征(包括问题和数据方面的), 挑战和研究进展进行系统的讨论,也没有人对代表性的和最先进的方法进行系统的分类。这些缺陷限制了基于会话的推荐系统的理论发展和实际应用。为了弥补上面提到的不同方面的缺陷,本文对基于会话的推荐系统提供了一个综合而系统性的概览和综述。

本文的主要贡献如下:
  • 研究者提供了一个统一的框架来对基于会话的推荐系统的相关工作进行分类,从而有效的缓解了这一领域内的不一致性。

  • 研究者首次为基于会话的推荐系统提出了一个统一的问题陈述,在该陈述中,一个基于会话的推荐系统是建立在以下几个正式的概念之上的:用户、物品、动作、交互和会话。

  • 研究者对会话数据的基本特征以及它给基于会话的推荐系统带来的挑战提供了一个综合的概览。据了解,这是该领域内的第一次这样的描述。

  • 研究者对基于会话的推荐系统的各类方法进行了系统的分类和比较,从而可以看出该领域的各个挑战被解决到什么程度了,以及该领域当前的进展如何。

  • 研究者对每一类方法简单介绍了主要的技术细节,从而给读者对基于会话的推荐系统的当前进展提供一个深入的了解。

  • 研究者分析和讨论了基于会话的推荐系统的主要的实际应用领域和场景、收集和整理了典型算法的开源代码和常用的公开数据集。

  • 最后,研究者讨论和分享了基于会话的推荐系统的一些开放的研究问题和可能的研究方向。

2. 相关工作

文献中存在各种不同的既关于基于会话的推荐系统,也关于序列推荐系统的研究。序列推荐系统是与基于会话的推荐系统紧密相关但不同的领域。即使在基于会话的推荐系统中也存在很多不同的子领域,比如下一个物品推荐、下一个购物篮推荐等。因此,很多用不同词语描述的不同的工作混杂在一块,导致整个领域内没有一个统一和一致的描述,很容易让人混淆。在这一节,研究者首先澄清基于会话的推荐系统和序列推荐系统的概念以及他们之间的差异,然后提出一个整体框架来统一组织基于会话的推荐系统内的各种不同研究,最后阐述这篇综述跟已有的相关综述之间的差异。

2.1 基于会话的推荐系统 vs. 序列推荐系统

2.2 统一组织基于会话的推荐系统相关工作的框架

根据推荐任务的不同,基于会话的推荐系统可以划分为对当前会话内下一个交互行为(通常是下一个物品)的推荐,对当前会话内剩余所有交互行为的推荐和对下一个会话的推荐。

2.3 相关的综述(详见原文)

3. 基于会话的推荐系统问题陈述

一个推荐系统可以看作一个系统,它包含多个基本主体:用户、物品、他们间的交互行为。这些基本的主体和行为构成会话的基本组成部分,而会话是基于会话的推荐系统的核心主体。因此研究者首先介绍这些主体和行为的定义及属性,然后在他们基础之上定义基于会话的推荐系统的研究问题。这些定义和属性将进一步用来对基于会话的推荐系统进行刻画和分类。
  • 3.1 用户以及用户的属性

  • 3.2 物品以及物品的属性

  • 3.3 行为以及行为的属性

  • 3.4 会话以及会话的属性

  • 3.5 基于会话的推荐系统的研究问题陈述

4. 特征和挑战

基于会话的推荐系统建立在会话数据之上,不同类型的会话数据通常具有不同的特征,这些特征本质上给基于会话的推荐系统带来了不同的挑战。本节首先描述根据会话 (session) 的属性所划分的不同类型的会话数据,然后讨论每一类会话数据的特征和挑战。
  • 4.1 与会话长度相关的特征和挑战

  • 4.2 与会话内部顺序相关的特征和挑战

  • 4.3 与行为类型相关的特征和挑战

  • 4.4 与用户信息相关的特征和挑战

  • 4.5 与会话数据结构相关的特征和挑战

5. 基于会话推荐系统方法的分类和比较

5.1 基于会话推荐系统方法的分类

根据采用的技术,基于会话推荐系统方法可以分为 3 大类:传统方法,基于嵌入表征学习的方法,基于神经网络的方法。这 3 大类又可以进一步分为 8 类。

5.2 不同类方法之间的比较

6. 传统的基于会话推荐系统方法

传统方法采用传统的数据挖掘或者机器学习技术来挖掘会话数据内部的相关性,从而进行会话推荐。传统方法主要包含 4 类:
  • 6.1 基于模式 / 规则挖掘的方法

  • 6.2 基于最近邻模型的方法

  • 6.3 基于马尔科夫链的方法

  • 6.4 基于生成式概率模型的方法

  • 6.5 传统方法之间的比较

7. 基于嵌入表征学习 (latent representation) 的方法
  • 7.1 基于潜在因子 (latent factor) 模型的方法

  • 7.2 基于分布式表征 (distributed representation) 的方法

  • 7.3 基于嵌入表征学习的方法间的比较

8. 基于深度神经网络的方法

  • 8.1 基于基本的深度神经的方法

  • 8.1.1 基于 RNN 的方法

  • 8.1.2 基于 MLP 的方法

  • 8.1.3 基于 CNN 的方法

  • 8.1.4 基于 GNN 的方法

  • 8.2 基于高级模型的方法

  • 8.2.1 基于注意力模型的方法

  • 8.2.2 基于记忆网络的方法

  • 8.2.3 基于混合专家模型的方法

  • 8.2.4 基于生成模型的方法

  • 8.2.5 基于强化学习的方法

  • 8.3 基于深度神经网络的方法间的比较

9. 基于会话推荐系统的应用,算法和数据集

9.1 基于会话推荐系统的应用

基于会话推荐系统已经被广泛应用于现实世界的各个领域和场景当中,来使客户和企业获利。下表总结了这些传统的和新兴的应用领域。

  • 9.2 开源算法和公开数据集

  • 9.2.1 开源算法整理

9.2.2 公开数据集整理

10. 展望和未来的研究方向

  • 10.1 考虑一般用户偏好的基于会话推荐系统

  • 10.2 考虑更多场景及上下文影响因素的基于会话推荐系统

  • 10.3 考虑跨域信息的基于会话推荐系统

  • 10.4 考虑更多用户行为模式的基于会话推荐系统

  • 10.5 考虑约束条件的基于会话推荐系统

  • 10.6 交互式的基于会话推荐系统

  • 10.7 在线或者流式的基于会话推荐系统


11. 结论

在本文中,研究者对当前的基于会话的推荐系统的最具代表性的工作进行了系统而广泛的调研。研究者提出了一个统一的框架来把这个领域内各种各样的工作归结为 3 大类,同时提出了一个统一的问题陈述来消除该领域内存在的各种不一致性,以减少读者的疑惑。研究者透彻地分析了会话数据的独有特征以及他们给基于会话的推荐系统所带来的挑战。研究者提出了一个分类机制来对现有的基于会话的推荐系统的方法进行分类,阐述了每一类方法的核心思想和一些关键的技术细节。此外研究者讨论了基于会话的推荐系统的实际应用领域和场景,收集和整理了一些典型的算法和数据集。最后研究者讨论了该领域一些可能的研究方向。关于基于会话的推荐系统的研究正方兴未艾,大量的新技术和新方法正在不断涌现出来。研究者希望这篇综述能给读者在关于这个领域的主要问题,关键挑战,最新进展以及主要方法和应用等方面带来一个综合而全面的了解。

相关综述文章:

[1] Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang
[2] Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019. Preprint version: https://www.researchgate.net/profile/Shoujin-Wang

部分参考文献:

Shoujin Wang, Longbing Cao, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Defu Lian. A Survey on Session-based Recommender Systems. ACM Computing Surveys (CSUR 2021), 1-39, (accepted).
Shoujin Wang, Liang Hu, Yan Wang, Xiangnan He, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao, Francesco Ricci, Philip S. Yu. Graph Learning based Recommender Systems: A Review. In Proceedings of the 30th International Joint Conference on Artificial Intelligence (IJCAI 2021 Survey Track), 1-9, 2021.
Shoujin Wang, Liang Hu, Yan Wang, Longbing Cao, Quan Z. Sheng, Mehmet A. Orgun. Sequential Recommender Systems: Challenges, Progress and Prospects. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019 Survey Track), 6332-6338, 2019.
Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Modeling Multi-Purpose Sessions for Next-Item Recommendations via Mixture-Channel Purpose Routing Networks. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), 6332-6338, 2019.
Shoujin Wang, Liang Hu, Longbing Cao, Xiaoshui Huang, Defu Lian, Wei Liu. Attention-based Transactional Context Embedding for Next-item Recommendation. In Proceedings of the 32nd AAAI Conference on Artificial Intelligence (AAAI 2018), 2532-2539, 2018.
Shoujin Wang, Liang Hu, Longbing Cao. Perceiving the Next Choice with Comprehensive Transaction Embeddings for Online Recommendation. In Proceedings of the 28th Joint European Conference on Machine Learning and Knowledge Discovery in Databases (ECML-PKDD 2017), 285-302, 2017.
Shoujin Wang, Liang Hu, Yan Wang, Quan Z. Sheng, Mehmet A. Orgun, Longbing Cao. Intention Nets: Psychology-inspired User Choice Behavior Modeling for Next-basket Prediction. In Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020),6259–6266, 2020.
Liang Hu, Longbing Cao, Shoujin Wang, et al. Diversifying Personalized Recommendation with User-session Context. In Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI 2017), 1858-1864, 2017.

相关 [会话 推荐系统 综述] 推荐:

基于会话推荐系统最新长文综述,163篇参考文献,已被ACM Computing Surveys接收

- - 机器之心
本文给大家介绍一篇刚被 ACM 旗舰期刊 ACM Computing Surveys (CSUR) 接收的基于会话推荐系统 (Session-based Recommender Systems (SBRS)) 的综述长文. ACM Computing Surveys 是计算机学科最具影响力的期刊之一,其最新影响因子为 7.99,为中科院认定的一区 Top 期刊,CORE Rank A* 期刊,主要发表计算机科学领域较有代表性的综述论文.

个性化推荐系统综述

- Tony - 所有文章 - UCD大社区
上个月写过一篇产品推荐的文章,详情请见《我所了解的产品推荐》,内容很泛,多为工作心得. 本周读了几篇相关的论文,收获颇多,分享点干货. 以下内容摘自《个性化推荐系统的研究进展》,该文发表于2009年1月的《自然科学进展》专题评述,作者是刘建国、周涛、汪秉宏. 我略去了具体的算法和许多公式,重点看原理、思路和比较.

Min-Hash和推荐系统

- - xlvector - Recommender System
前几年看Google News Recommendation的那篇Paper,对里面提到的MinHash的算法基本没有注意,因为之前的习惯都是只注意论文的模型那块,至于怎么优化模型一般都只是扫一眼. 不过最近看了大量的Google Paper,发现Google在实现一个算法方面确实有很多独到之处. 其实,Min-Hash是LSH(Locality Sensitive Hash)的一种,我之前对LSH的了解仅仅限于知道它能把两个相似的东西Hash成两个汉明距离接近的2进制数.

推荐系统实战

- - 博客园_首页
推荐算法:基于特征的推荐算法. 推荐算法准确度度量公式:. 其中,R(u)表示对用户推荐的N个物品,T(u)表示用户u在测试集上喜欢的物品集合. 集合相似度度量公式(N维向量的距离度量公式):. 其中,N(u)表示用户u有过正反馈的物品集合. 其中,S(u,k)表示和用户u兴趣最接近的K个用户集合;N(i)表示对物品i有过正反馈的用户集合;w(u,v)表示用户u和用户v的兴趣相似度;r(v,i)表示用户v对物品i的兴趣.

推荐系统杂谈

- - 后端技术杂谈 | 飒然Hang
推荐系统是近些年非常火的技术,不管是电商类软件还是新闻类app,都号称有精准的推荐系统能给你推送你最感兴趣的内容. 现象级的资讯类app“今日头条”就得益于此成为了势头非常猛的一款产品. 本文就针对推荐系统讲述一些相关概念和实践经验. 首先需要明确的就是推荐系统的目标,一般来说不外乎以下几个:. 用户满意性:首当其冲的,推荐系统主要就是为了满足用户的需求,因此准确率是评判一个推荐系统好坏的最关键指标.

推荐系统开源工具 – SVDFeature

- Roger - Resys China
SVDFeature是我们(上海交大Apex实验室)在参加KDDCUP 2011期间开发的. 通过这个工具,我们和港科大(HKUST)的联合小组InnerPeace在KDDCUP 2011中获得Track 1第三名,并创造单模型最好成绩. 在此分享给大家,并希望和大家有更多的交流. (1)基于feature的可扩展性 —— SVDFeature实现了我们的基础模型feature-based matrix factorization.

Reculike : 开源论文推荐系统

- votis - Resys China
今天这篇博文主要总结一下reculike的系统架构. 两周前我们宣布发布了reculike的alpha版. 本着分享的原则,今天在这儿介绍一下我们的各个模块的设计方法. 我们这个项目一开始叫paperlens,这是因为我们想学习业界的前辈movielens,开发一个源代码和数据都开源的系统. 关于数据的开源,我想当用户数达到一定程度后,每个月会dump一次我们所有的数据库(密码等隐私信息除外),放到网络上供大家下载.

推荐系统那些事儿1

- - 冰火岛
知识库:用户知识库,Item知识库,用户评分数据(显性和隐性)等.不同的业务背景不一样,譬如电商,社交网络,视频,app应用等. 协同过滤引擎:根据用户评分数据集,通过collaborative filtering方法,计算用户喜欢的top N item. 数据格式: userid, itemid,score.

下一代个性化推荐系统

- - 技术改变世界 创新驱动中国 - 《程序员》官网
本文结合技术及社会需求发展的大背景,讲述了当前推荐系统的价值及所面临的挑战,并指出了下一代个性化推荐系统的设计思路及需要注意的问题. 作为个性化推荐系统核心的协同过滤(Collabora-tive Filtering)算法,是Goldberg等人在1992年的一篇学术论文中最早提出的. 他们在这篇文章中提出一种方法,在一个新闻组中,根据 用户下载的新闻计算他们之间在口味上的相似程度,并利用这种相似程度为他们进一步推荐相关的新闻.

淘宝推荐系统的学习

- - 标点符
维基百科:推荐系统属于资讯过滤的一种应用. 推荐系统能够将可能受喜好的资讯或实物(例如:电影、电视节目、音乐、书籍、新闻、图片、网页)推荐给使用者. 推荐系统大体可分为两类,即个性化推荐和非个性化推荐. 好的推荐系统更像一个有经验的网站导购员. 不同点:搜索是通过用户主动输入的关键字进行查询. 推荐则是用户在浏览网站的过程中,不一定需要用户输入,根据当前网页的上下文进行个性化的信息输出.