跳转至

机器学习理论与应用

Chapter 1. 智能推荐系统中的机器学习

D202 星期二 17:45-20:30

1. 从信息时代到推荐时代

获取信息的方式发生变化,从通过搜索变化为一些直接的点击,通过推荐系统挖掘我们的需求。

不只是我们的日常生活,在一些意想不到的方面,例如美国总统选举,如何利用呢,通过数据分析的方式,可以对竞选的策略提供帮助,从而赢得一场选举。

对于情感分析,例如舆情分析与决策。通过点赞、转发来分析用户对于推文内容的看法,从而制定良好的竞选策略。

推荐系统的潜在风险:

  • 隐私泄露:推荐系统收集了日常生活中的大量数据,例如个人信息、购物清单、历史行程、浏览记录。
  • 自我决策能力缺失:生活中的很多决策都由推荐系统提供,在一些重要问题可能会缺乏自我判断和决策能力。
  • 导向性推荐:向用户推荐基于某种目的的信息,从而对用户产生导向性影响。

2. 经典推荐系统算法模型

2.1 协同过滤(CF)

参考用户之间的相似关系,或者参考商品之间的相似关系。

它的具体思想很简单:

计算某一个用户和其他用户的相似度,或者计算商品之间的相似度。

在社交网站上,也有一些朋友推荐,比如可以计算未成为朋友的得分情况,从而推荐最可能成为朋友的用户。

也可以对评分进行预测,在这种情境下,为了消除各个用户高低倾向的影响,会通过减去用户打分平均值的方法,来消除个体的偏差产生的影响。

它存在一些数据特性,例如:长尾分布。最活跃的用户可能占了少部分,大多数用户都没有这么活跃,因此呈现了数据上的长尾分布特征。

因此,它可能带来一些挑战。例如:我们构建的矩阵可能会非常稀疏。从物品的角度来说也是相似的。

2.2 基于内容的过滤(CBF)

它可能导致对用户的过度刻画。

2.3 基于个人信息的推荐系统(Demographic RS)

我们也可以根据个人特征进行推荐,这样可以处理冷启动问题。但是它的推荐是粗劣的,不太常用,至少不会单独使用。

2.4 基于知识的推荐系统

它可以通过知识进行精确的推荐,但是如果存在新的商品,那么此时的推荐会出现问题。

由于每一项算法都存在一些问题,真正商用的推荐系统往往混合了各项技术。混合方法:加入权重、模型切换、模型组合,等等。

例如:通过基于个人信息的推荐系统进行初始的粗粒度的推荐,当用户存在一些历史记录以后,就适合切换到基于内容的推荐中;再使用一段时间后,就可以参考与他相似的用户,就适合使用协同过滤的方式。当积累了用户的大量使用信息之后,就可以使用混合的方式,混合前面的各种模型,混合模型的推荐结果,此时的推荐内容就会比较丰富。

3. 推荐系统的数据表征

数据复杂性所面临的挑战。

如果无法充分理解数据,就可能推荐与品牌无关,甚至产生损害的推荐。

数据表征是机器学习的基础。

推荐系统中的复杂数据:

复杂数据可能包括多种数据类型、多数据来源、社会数据、多重标准等多个因素。

对于用户-物品评分矩阵,矩阵是比较大的,可以使用矩阵分解(SVD)的方法。表征评分表的方法:基于矩阵分解的隐因子表征。

还有一种数据,比如用户和用户之间的关系,对于邻接矩阵的方法表示网络,那么它的存储也是非常大的。我们仍然可以使用矩阵分解的方式,得到网络节点的表征。

我们还可以通过图神经网络(GNN)的方法进行数据表征。

现在最热门的方法,是 2017 年提出的 Transformer 架构,它可以统一所有数据表征,成为了主流的方法。

4. 推荐系统的应用案例

Netflix,从 DVD 租赁转型为媒体科技公司。

5. 推荐系统的终身学习

推荐持续受到时间和空间的影响。

时序推荐系统。

Session 对时序进行了划分。

跨域推荐系统。

比如对于一次旅行的计划,从物品的视角出发,包括购买机票、租车、订酒店,就出现了三种推荐的目标。例如,订廉价机票的用户一般也不会预定高价酒店。从物品间的相互关系角度,例如行程目的地、住处地点之间在地址上应该是相同的,等等。对于用户群体,例如家庭旅行和商务旅行是不一样的,对于社交关系,例如可以参考朋友在当地消费情况,为某一个人进行推荐。对于物理地点,例如在香港吃了中餐,可以推测出在悉尼可能喜欢吃海鲜。对于时间角度,例如可以通过近期交易,猜测用户的具体行为。对于具体时间角度,例如早餐的偏好可以帮助推荐晚餐偏好。

协同演化环境下基于多模态终身学习的跨领域推荐系统研究。

终身学习(持续学习):人类有能够将一个任务的知识用到另一个任务上的能力。

迁移学习。

多任务学习:在一个数据上展开多个任务进行学习。

强化学习:可以实现终身学习中的部分内容。

6. 推荐系统与时尚结合

通过 AI 技术理解时尚的变迁,可能更能把握时尚的潮流。

7. 大模型时代的推荐系统

对话推荐系统:捕获用户的动态偏好,并且基于用户的当前需求,通过多轮的实时交互。

联邦学习的方法,可以通过模型交换知识。本地数据不会给云上的大模型进行训练,而是与本地的模型参数进行交互。

跨域联邦混合专家(FL-MoE)大模型推荐系统。

8. 可控生成式推荐系统

基于大模型的 AIGC 技术日益成熟。

生成式个性化内容推荐。