协同过滤(Collaborative Filtering)扫盲班(1)

这是一个关于协同过滤(Collaborative Filtering)的扫盲系列。虽不一定能解决实际问题,但协同过滤作为一种信息处理方式所起的作用将越来越大,那么现在就开始吧:

协同过滤的定义:

协同过滤(Collaborative Filtering)简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐使用者感兴趣的信息。个人透过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息。回应不一定局限于特别感兴趣的,特别不感兴趣信息的记录也相当重要。协同过滤又可分为评比(rating)或者群体过滤(social filtering)。后者成为电子商务当中很重要的一环,即根据某顾客以往的购买行为以及从具有相似购买行为的顾客群的购买行为去推荐这个顾客其“可能喜欢的品项”,也就是藉由社群的喜好提供个性化的信息、商品等的推荐服务。除了推荐之外,近年来也发展出数学运算让系统自动计算喜好的强弱进而使得过滤的内容更有依据,也许不是百分之百完全准确,但由于加入了强弱的评比让这个概念的应用更为广泛。除了电子商务之外尚有资讯检索领域、网络个人影音柜、个人书架等的应用等,豆瓣就是一个使用协同过滤的好例子。

协同过滤的本质及基本假设:

基于一组兴趣相同的用户进行推荐。它基于这样一个假设:为用户找到他真正感兴趣的内容的好方法是首先找到与他兴趣相似的用户,然后将这些用户感兴趣的内容推荐给此用户。

协同过滤的分类:

基于用户(User-based)、基于项目(Item-based)、基于模型(Modal-based)。

哪些地方用到了协同过滤

豆瓣、Amazon、Netfix等等内容或电子商务网站都采用协同过滤来给用户推荐内容。

其他你可能感兴趣的: