怎样把内容匹配给用户
如果我们把商品/视频都统称为一个网站的内容。
内容的推送、寻找、分类、筛选的方式有以下四种形式分类,或多或少的,同时并存。
一、用户自选
这一种方式用户具有最大的主动权,网站通过设计清晰的分类导航和站内搜索系统,让用户通过自己的意愿,在网站上寻找到他需要的内容信息。
优点:条理清晰,简便有效。
缺点:是否能找到精确的信息,一方面取决于用户对信息的归类方式和搜索关键词的组织,一方面取决于网站对信息的归类和关键词的组织。如果两方对同一内容的需求和理解不一致,,一个信息内容,网站归如A类别,用户认为B类别可以找到,那么一定是无功而返。那么这个信息应该打A,B两个Tag,归入两个类别。搜索也是同样的缘故,要在搜索的索引中将可能被用户查询的信息都提供完全。最后,大量的分类和冗杂的搜索信息积累下去,反而又从精确变成了模糊。
于是人们发现,各大搜索引擎上的关键词越来越长。
总结:作为最基础的方式,没有网站不会提供这个功能,至少都有对信息的分类导航。
二、审核匹配
审核是指对内容进行审核筛选,诸如通过评分体系,浏览量,点击率,时间和等等其他一些因素,给与大量同类信息进行排序和权重区分,来判断这个内容对用户的需要程度高低,在分类列表或者搜索结果里,将最可能的用户需求信息最先或者最明显陈列给用户。
优点:为第一种方式做补充,通过规则对信息进行排序和过滤,降低大多数用户的搜寻成本。
缺点:这是一种少数服从多数的匹配方式,即默认需要信息的用户是“大多数用户”,忽视和无视“少数用户”的需求。而评分体系也有体系的问题,让用户进行评分,并不会产生理想化分数,专业评分又缺乏民主性。
关于商品分数的问题,我在另外一篇文章里做过讨论——现有商品的评分体系不完美
另外,YouTube也得出了结论说,评分的分布并非理想化的。
总结:在这个匹配体系里,最大需求被最大满足,最小需求被无视,从损益综合来讲是最优解,但是当这个社会的个性化需求越来越强烈的时候,长尾上的用户需求就没有明显的顺序了,完全是一小撮用户有一小撮不同的需求,而且他们加起来就是一个不可忽视的长尾,怎么给他们推送内容信息呢。
三、个性化匹配
通过多维度的了解用户的偏好,对用户的信息需求进行匹配。喜欢喝果汁的人通过“苹果”这个词首先查看的是“苹果汁”相关信息,而一个“果粉”通过“苹果”这个词首先找到“苹果电脑”。怎样去定义一个用户个性维度,一般有两种方式。
一种叫做“物以类聚”:
是通过它喜欢的内容来预估。豆瓣在个性化匹配上做的很不错,它能给用户推非常精准的书籍,电影等等。所以豆瓣需要先了解你喜欢的是什么类型的内容,你需要不断的积累你喜欢的内容,它就越精准的将相似的内容给你。
另外一种是“人以群分”:
通过你的交际圈来预估。信息的传统流转途径就是通过“群分”的人来进行的,信息共享首先是在圈子和圈子内,兴趣相同的人之间传播,所以这是一个朴素的方法,通过互联网技术提高了传播效率。豆瓣也会告知用户他的好友在关注的东西和搜集的信息,最典型的还是类似开心网这样以人际关系为基础的SNS网站。你的朋友们显然比计算机算法更了解你,他们主动推荐给你,或者他们自己喜欢的信息,相信你也会感兴趣。
优点:更精准的匹配,也更加有效
缺点:马太效应(Matthew Effect),好的愈好,坏的愈坏,多的愈多,少的愈少。举一个例子来说明,我在Google Reader订阅了大量的UED相关的blog,结果它就自动推荐UED相关的blog给我,但是我已经订阅够了,我倒是很想看一些写八卦小文的订阅源,但是很难找到。我也不能通过”写八卦小文的订阅源“这个关键词找到合适的Blog。
总结:最精准,但是最容易走偏锋。
四、无差别推送
所谓无差别就是,管你是谁,都给你们传递一样的信息。
优点:省事,直接,干脆
缺点:容易被用户厌恶
总结:也有效果
大体上,我总结出来的就这四种方式,各有优劣,至于如何运用,在不同的情景则有不同的具体方式,这个多一些,那个多一些。