定义
构造推荐系统的关键资源是用户历史行为数据,具体可分为两类:显式反馈和隐式反馈。其中,隐反馈是指不直接表现用户倾向的历史数据,如转发微博、浏览网站或购买商品等。2
基于隐反馈的推荐基于隐式反馈进行推荐的难点在于缺乏显式的负例,即我们明确地知道用户喜欢什么但不清楚用户不喜欢什么。目前,解决这一困难的主要思路是引入负例,有3 种策略:
1. 利用应用环境的特殊性,人为设置规则从而指定负例。
2. 从未选择的产品中随机抽样作为负例,这类策略假设未被用户选择的产品中绝大多数是用户不会去选择的,因此通过随机抽样得到的产品可以假定为负例。
3. 将所有未选择的产品都作为负例,但设置一个相对小的置信度(权值),这种策略希望借助于这一权值来控制这些引入的不确定负例的影响。
事实上,这些方法在引入负例的同时都无可避免地引入了噪声,因为无法保证这些引入的负例中不存在潜在的正例(用户在将来会选择的产品)。但对传统的推荐模型来说,引入负例又势在必行,因为只有这样才能利用“未选择”信息。本质上,无论是随机抽样还是设置权值,都是在利用“未选择”信息与控制引入噪声中寻求平衡。