将问题公式化

  • 讨论推荐系统的原因
  • 定义推荐系统问题

讨论推荐系统的原因

  1. 它是机器学习中的一个重要的应用,工业界非常重视,但是在学术界它占了很小的份额,很少受到关注。
  2. 学习机器学习中的大思想,特征学习的思想。

定义推荐系统问题

假使我们是一个电影供应商,我们有 5 部电影和 4 个用户,我们要求用户为电影打分。

前三部电影是爱情片,后两部则是动作片,我们可以看出 Alice 和 Bob 似乎更倾向与爱情片, 而 Carol 和 Dave 似乎更倾向与动作片。并且没有一个用户给所有的电影都打过分。我们希望构建一个算法来预测他们每个人可能会给他们没看过的电影打多少分,并以此作为推荐的依据。

下面引入一些标记:

  • $n_u$ 代表用户的数量
  • $n_m$ 代表电影的数量
  • $r(i,j)$: 如果用户j给电影i评过分,则$r(i,j) =1$
  • $y^(i,j)$ 代表用户 j 给电影 i 的评分
  • $m_j$ 代表用户 j 评过分的电影的总数