一、高估系统对用户需求的捕捉能力
我们都说,搜索引擎是满足用户主动需求的产品,而推荐系统则是满足用户隐含需求的产品。当用户明确需要什么信息,就把需求转化为检索词,丢到搜索引擎,搜索引擎帮用户找到它,而推荐系统则能良好的感知用户未明确陈述的需求,为其呈现信息。那么问题来了,既然推荐系统能够捕捉用户的需求,也就是说用户还没丢关键词给搜索引擎之前已然知道用户要什么,直接为用户呈现出信息不更好?还需要搜索引擎干嘛?!
当然更好,当然很好,只是做不到。
用户的需求是多变的,其中暗含着某些规律,但却不可能被完全的,彻底的捕捉到,例如用户浏览一个商品页面,可能他对网页上的产品感兴趣,可能他被网页上的代言吸引,可能他在为朋友准备礼物,可能他在为家人准备年货,也可能只是误操作罢了,这些细节被系统感知到的难度太大,所以我们无法知道用户下一步要去做什么,哪又如何推荐?
推荐系统有其边界,一切技术均有其边界,局限于当前技术成熟度,局限于数据,局限于现实世界与技术世界的距离。当产品经理不了解技术的边界,而技术人员则缺乏产品思维的时候,这种错误便容易发生。欢迎加入大数据学习交流分享群: 658558542 一起吹水交流学习()
二、不顾用户需求
系统良好的挖掘了用户的需求,但是如果不顾场景,带来的将是用户巨大的反感。例如,我们公认的基于社交网络进行各种类型的推荐都是非常好的推荐思路:你所熟悉的人的行为对你有着非常好的借鉴作用。这一点没错。但是一般而言,对商品的推荐还是要放在商品售卖网站,对电影的推荐也请放在电影票售卖网站(个人觉得这个推荐应该放在相关的网站中,比如用户在浏览产品的新闻的时候,也可以进行推荐。当然现在这种情况下的推荐多是广告)。浏览这些网站的用户,都带着强烈的隐含需求,但选错了地方,往往形成对用户的强制,安能不败。
三、将“推荐”理解为“推送” (这种情况更多的是广告)
不妨变主动变被动,当下无数的互联网产品都有一个“发现”模块,包括微信,Twiiter等大量产品。用户有需求的时候,会主动的找“推荐”,避免被打搅。而对于推荐系统,也避免对用户形成打扰,引起用户反感。欢迎加入大数据学习交流分享群: 658558542 一起吹水交流学习()
四、不顾用户需求的“个性化”程度
我们将推荐系统的目标进行简化,假设它要解决的是点击率/转化率预估问题。那么这些指标都与哪些因素有关?
平台的因素
本身的魅力
信息造成的差异
用户的群体偏好
用户的个性化偏好
五、总结
其中这几个因素,有一定的界限,其对应的技术选型也不同,如果只有平台的因素,点击率与转化率遵循Beta分布,只需要对这些值进行估计。而本身的魅力通过简单的历史信息统计便可得到。信息造成的差异,则可以通过典型的线性预估 属性特征进行处理。而如果有强烈的群体偏好,则可以在线性预估模型里面增加交叉特征,但是如果个性化需求极其强烈,那么协同过滤算法可能更加适合。
推荐系统的不同产品形态,其实就是“个性化”程度不同。没有太强个性化类型的,这样的推荐系统要解决的问题是“大家都喜欢什么?”,简单的统计便能搞定。对于多数广告类产品,个性化需求太难以捕捉,要解决的问题是“什么样的人喜欢什么样的结果?”那么线性模型属性特征交叉特征更加适合。但是对于大多数推荐产品,尤其是大平台的推荐产品,去探索“每个人喜欢什么东西?”的个性化推荐技术可能更加适合。而不同的产品,选型哪怕类似,却也或多或少隐含差异,例如社交网络中的一些推荐产品,基于图挖掘的推荐方式可能更加适合。
一句话,技术选型必须参照产品形态与用户需求。
结语
感谢您的观看,如有不足之处,欢迎批评指正。
如果有对大数据感兴趣的小伙伴或者是从事大数据的老司机可以加群:
658558542 ()
里面整理了一大份学习资料,全都是些干货,包括大数据技术入门,海量数据高级分析语言,海量数据存储分布式存储,以及海量数据分析分布式计算等部分,送给每一位大数据小伙伴,这里不止是小白聚集地,还有大牛在线解答!欢迎初学和进阶中的小伙伴一起进群学习交流,共同进步!
最后祝福所有遇到瓶颈的大数据程序员们突破自己,祝福大家在往后的工作与面试中一切顺利。