(1)今日头条——猜你想搜的
从产品形态而言,猜你想搜的七排两列默认展示20条推荐,可及时刷新,关键词太长的默认展示七个字,其余部分用省略号表示。提供屏蔽操作,可以隐藏起来不展示。
今日头条推荐方法是根据用户过去的行为记录来向用户推荐相似的资讯,采用基于内容的推荐,在对应子页面直接进行内容推荐,缺点是由于内容高度匹配,导致推荐结果的惊喜度较差,并且只有维度增加才能增加推荐的精度。
但是存在冷启动的问题,对新用户不能提供可靠的推荐结果,根据已有用户模型的数据,结合挖掘的各种榜单进行补足,对于新用户而言,软件无法通过用户搜索历史记录得到用户的搜索喜好。
“猜你想搜的”里面会放一些最近比较热门的新闻资讯。
下图可以发现,搜索历史记录为娱乐相关的剧或者明星资讯,但是“猜你想搜的”里面展示的还是最近比较热门的事件,与搜索历史无直接的联系。

(2)淘宝相关推荐——搜索发现
从产品形态而言,五排两列默认展示10条推荐,可及时刷新,提供屏蔽操作,可以隐藏起来不展示。
当删除之前的历史搜索记录,可以看到紧凑的三排两或三列展示推荐,推荐内容为之前搜索历史相关内容,可及时刷新,提供屏蔽操作,可以隐藏起来不展示。采用协同过滤进行推荐,假设“跟你喜好相似的人喜欢的东西你也很有可能喜欢”。
假设用户的搜索意图可以用一系列query来表征,那么同一个搜索意图在不同人之间的表达通常会不同,假设大量用户的搜索遵循某种规律,那么当某个个体出现的时候,我们可以按照这个规律来推荐出合适的query。
主要的任务就是找出和你品味最相近的用户,从而根据最近他的喜好预测你也可能喜欢什么。这种方法可以推荐一些内容上差异较大但是又是用户感兴趣的物品,很好的支持用户发现潜在的兴趣偏好。
如下左图所示,根据“历史搜索”口红,“搜索发现”将跟你喜好类似的用户可能搜索的故宫限量版口红和欧莱雅枫叶红推送给你。
但是也存在冷启动问题,无法向新用户推荐,系统刚刚开始时推荐质可能较量差。
电商行业也常常会使用到基于关联规则的推荐,即以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。
如下左图所示,“历史搜索”头发蓬松神器,“搜索发现”将当前兴趣进行收敛相应的会向你推荐多功能吹风机电吹梳,关联规则挖掘可以发现不同商品在销售过程中的相关性。
相比对每个推荐场景单独进行个性化推荐的策略,淘宝还加入基于强化学习框架,根据全链路的数据进行整合,同时响应多个异构场景的推荐请求。
挑选query的策略,按照query被搜索的频度来挑选。考虑当前query之前用户的搜索query,这些最近搜索的query可以当作用户搜索的上下文,作为我们挑选候选query的凭据。
采用基于CTR预估的相关query推荐,更多的考虑在展现相同机会的情况下,相关query可能获取更多的点击率,从搜索流量出发,可以带来更多的转化。
预估query的CTR,在模型中用到的如下特征:搜索词与推荐query相关的特征;搜索词与推荐query的类目相关特征;候选query静态分相关特征;推荐query的词性特征;推荐query对应的结果页面特征。
根据用户搜索内容的不同,能准确的对用户进行画像。
如下左图可以发现历史搜索大多为女生化妆品,所以搜索发现推送的也是女生用的化妆品或者衣服,右图可以发现历史搜索大多为运动鞋类和男装,所以搜索发现推送的也是男士用品。
淘宝的搜索发现中前面的搜索词为近期兴趣相关,后面的搜索词为用户比较久远的兴趣爱好相关,搜索词推荐范围包括商品、店铺以及大V,搜索发现内容丰富度较高,每次页面刷新推荐内容均会变化。
搜索发现与历史搜索有很大的联系但是不会出现重复内容,其中的“俏皮两件套法国小众”和“加拿大鹅 雪咒”两条记录是之前搜索过的,最近删除了历史记录,可以看出淘宝会记录一些已经删除的近期用户的喜好,然后推荐给用户。

五、分析总结1. 今日头条
根据分析可以发现,今日头条的内容推荐做的很好,如果长期观看其中的部分主题相关内容,则会优先推荐相关内容;
但是query推荐并没有做的很好,用户搜索的关键词并不会影响头条“猜你想搜的”里面推送的内容,“猜你想搜的”query推荐并不是真正的猜你想搜,而是系统经过计算推送出的一些实时热点事件。
而且其搜索框下方的三条信息是从“猜你想搜的”中选取的,默认搜索词又是下面这三数据的第一条数据,内容上存在一定的重复,除了点击的位置相较“猜你想搜的”靠上,没有什么明显的优势。
建议:可以将用户搜索的历史记录作进一步的分析,将“猜你想搜的”里面的热点内容根据用户的搜索兴趣进行排序,会增加进一步的点击量,不然“猜你想搜的”就只是一个热搜榜而已。
2. 淘宝
淘宝的默认搜索词会帮助用户更进一步的细化描述搜索意图,更快的找到自己喜欢的商品,省时省力的达到效果。
但是搜索发现中推荐的词会根据用户最新搜索词发生较大的波动,用户可能短期内买过一件商品之后很长时间不会再买同类的商品,从而导致不符合用户相关兴趣的query推荐词占据搜索发现的较多位置。
建议:可以结果用户的搜索需要和最近的成交订单结合进行推荐,如果用户已经购买了同类商品,那么就不要推荐同类商品了,可以基于同一个场景,进行不同类别物品的推荐。
如果用户近期搜索词相关性差距较大,则淘宝除了推荐搜索词相关内容,还会作进一步的预测推荐,但是这种推荐鲜果并不是很好,其中会出现一些与兴趣爱好完全不相关的词,这个方向还需要进一步优化。
3. 爱奇艺
爱奇艺默认词搜索相较淘宝内容的丰富度有待提高,如“爱情保卫战”、“赵川爱情保卫战”、“爱情保卫战赵川”,内容几乎重合,虽然及时刷新但是内容上并未有太多变化,而且默认搜索词并没有根据用户短期搜索的内容进行实时更新,多次刷新只有固定的七八个词。
“猜你想搜”也不会根据用户的最新搜索进行实时刷新内容,建议可以跟淘宝采用类似的策略,做到真正的与用户搜索相关。



















