搜索推荐到底该怎么做呢?是要照着老板说的做,还是根据用户反馈做?本文作者总结了搜推策略产品的十做十不做,并对其中的三点进行了分析,一起来看一下吧。
搜索推荐到底怎么做?按老板说的做,照竞品抄,根据用户反馈做、通过数据分析做?年京东、美团搜推经验,建议大家那些该做,那些不该做的,搜推策略产品十做十不做,但要根据具体情况定。
什么叫硬加权,就是给某个商品的排序直接从后面提到前面,这个叫硬加权。比如有运营来找你,说我这个东西这么好,怎么排序靠后呢,你得给我加权呀、或者是某个业务找到你,说我这个业务是今年公司重点,但流量不足呀,你得加权呀……
为什么不能硬加权,硬加权损效率呀!为什么损效率呀,用点黑话,是因为用户不Buy in呀,就是用户不点呀!
那为什么柔性智能化流量调控可以做呢?这有几个关键点,一个是前置的筛选分层,如果是电商就是精细化选品,看哪些品是预期可以多获得一些流量,也能承接得住的。
比如阿里今年双出了一个价格力加权,就是你这个商品优惠力度大,我可以多给你流量;再比如阿里的优质商家商品流量加权,也是说这个商品有一定的潜力,我多给他一些流量,应该也能承接的住;还有就是中间的赛马机制,效率好的晋升,效率差的汰换,同时要有运营诊断指导,为什么效率差,商品价格高、没什么评论积累、主图标题不清晰等。
当然还有很多,不一一展开说了。还有一个重要的点是,对于协同部门要疏不是堵,就是你给他提供抓手,可以让他有玩的东西,然后一点一点有轶序地玩。
乱七八糟标签不用做,但用户商品基础标签、营销标签、人群节日标签要做
什么叫乱七八糟的标签?就是一提起推荐,大家就说你是基于那些标签推荐的, 我们能不能在商品或内容上打些标签,然后你们用呀?我们之前打的标签你们用了吗,效果怎么样?你看我们还需要打什么标签……这里说明下,标签对于推荐来讲是重要的,但不是最重要的,尤其是在大数据量的情况下。所以,不要提到推荐,大家就认为标签做好了,推荐就做好了,推荐没做好,就是标签没做好。
回答什么是乱七八糟标签前,我先基于我的理解给大家科普下推荐原理。其实这也不能怪大家,早期推荐技术也没那么先进,然后数据量可能也不多,所以,大家就冷启的时候让你选兴趣点标签,推荐的时候根据文本标签推荐,模型上也是LR、GBDT一类的。
这就让没搞过搜推的人觉得,啊,推荐就是标签推荐,但他不知道,现在都是DNN了,都是基于用户行为推荐,基于II推荐,基于KNN,基于Embedding、Vector推荐,只有个别情况下,数据挖掘不到的,才会通过早期的文本标签做召回推荐。
举些例子吧,要不然,这么说,懂的人懂,不懂的人还是觉得推荐就是标签推荐,推荐没做好,就是没标签,或者标签不准,或者标签用得不好……那以电商为例,基本可以通过共购买,共点击等数据挖掘到相似或相关的商品。
比如你点击了小米的手机,那可能会推荐给你华为的手机,因为很多人点了小米后,也会点华为,甚至最后还购买了华为,这么说还是笼统,更细节是你点的是小米支持G的,G+G内存+存储的、英寸的、双摄的……那算法就通过大数据帮你找到的是华为PP,而不会找到Nokia。
那你这例子不还是说推荐就是基于标签推荐的吗?这里其实又涉及到了算法可解释的问题,通常业务会问,你这排序的逻辑是什么,为什么这么排,为什么这个排前面,那个排在后面?你看给我推了这个,你看我是这样的用户,我年薪百万,怎么不给我推那个?你这个推的多Low呀,一点都不高端……那算法同学呢,一般的回答就是,呃,这是算法推荐的,是DNN深度学习的,是黑盒的,是不可解释的,我们也不知道为什么这么推;产品经理呢一般会说:啊,你点过这些吧,这是根据你的行为和画像推荐的。
我先捞干的,理论上DNN深度神经网络是不可解释的,不像GBDT的树模型那样是可解释的,这说的是从模型的角度,什么Feature Important角度是不可解释的。但实际上任何模型也都是可解释的,因为人的选择是可解释的,人的购物决策和浏览内容的偏好是可解释的,只不过是你要根据不同人、不同时间、不同地点、不同场景、不同……太多了,这样就不好解释了,而且你还是要解释给不了解算法的人。
那这就变成,本来是可解释的也解释不清楚了,或者解释清楚了也听不清楚……大部分情况下,排序就两种结果:有用户行为的非新用户就是点什么推什么,无行为的新用户就是热门推荐。
就像行业里的头条、抖音、快手什么的,早期甚至现在都是你第一次打开就是美女、时效热点事件、当地特色内容等;然后你就一直看,算法就认为你喜欢,就一直找相似的推;然后你美味佳肴吃够了,偶尔也想来点粗粮,这时你就划掉那些美女了,或者自己搜索点什么,那算法就认为你喜欢上其他内容了,那就帮你找新的相似的内容。
但这些说的都是表面哈,我来讲点深度的。其实算法里有个概念叫特征,特征是什么呢?就是能表达这个商品或者内容好坏的东西,其实就像“白、富、美”就是表达一个女人的特征。那算法里一般用什么特征呢,比如内容类关键的就是点击量、点赞量、评论数、点击率、完播率、停留时长、好评率……然后这些特征呢,还有周期,比如天点击量、天点击量、小时点击量等。好这样估计有些人能理解推荐一些了。
为了多样性而做的多样性不做,但基于人群、用户行为、时令节日、空间等变化的多样性要做
一般推荐结果的多样性就是,连续Top N个结果是不同的,不同的维度一般是类目维度。这个是通俗的定义,如果要科学定义的话,其实是通过基尼系数、熵等来衡量的。
这里再多说一些多样性,仅是类目维度的多样性还不够,有些场景下需要下分到二、三、四级类、甚至是词维度,同时还可以根据图片、价格、商家、品牌、属性、作者等等很多维度不同的多样性。那大家如何理解多样性的呢?这里就会根据不同的屁股、不同的认知来理解了,抽象地讲没有感觉,我举些例子,做为推荐产品经理遇到比较多的情况应该是:
)老板觉得多样性不够
这里多吐槽一下,在互联网公司推崇扁平化、去官僚化的情况下,做为一个底层人员,仍然要面对很多层级的老板,而且这些老板们的想法还都不一样,想法不一样也就算了,关键是他们还不听一线人员的方案。一般打仗是在前线的人员,最清楚状况,最知道怎么打,且将在外,军令可有所不从,但你在互联网公司,你要敢不从,那你就等着走人吧。
那老板们都如何理解多样性呢,比如甲老板会说,这怎么每天都给我推差不多的内容,我们平台上不是有很多内容吗,我们那个主推的怎么没看见;乙老板会说,一样的内容推得太多了;丙老板会说我在其他平台上看到的内容,咱们这怎么没推呢……
)业务觉得多样性不够
业务经常是说,怎么没有我们品类的内容呢,怎么都是那个品类的内容呢?
)用户觉得多样性不够
很多用户是不愿意反馈的,一般也就反馈点什么推什么、看过买过还推。
前面虽然提到了什么叫多样性,但不够具体,所以,在如何做前,还是要定义清楚什么是多样性,做到什么样,大家能满意。这里先说那些不是多样性不够:
)不区分场景的多样性不是多样性问题
老板们不分任何时候,都想要多样性,这里有一个经典的场景,比如某个用户此刻想买个冰箱,或者是想了解某个事件,这时你非要为了多样性,再给他推荐个洗衣机、电视,虽然都是家装三件套,但这个用户可能不是新装修呀,有可能就是想换个冰箱,或者是给家里人买、或者是放到租房的地方,反正他不缺电视。
那你说想买上衣的时候,推荐裤子可以吧,这个场景看似成立,但不是适合所有用户;那这种跨品类的,组合式的推荐什么时候成立呢,这个要根据每个用户的意图强弱,行为丰富度等来动态判断。比如用户就是逛,就是什么都点,那基本上,你的推荐就可以发散一些,否则,有明确意图的,你就要帮他收敛,快速帮他找到他想要的,可能是他有一个价格心理,或者是一个属性风格的心理。
)行为与意图茅盾的不是多样性问题
什么意思呢?就是经常有些内部的人,他不是想看真的内容或者购买那个东西,而是没有目的地乱点、乱看,点着点着,自己也忘了都点过什么,然后算法基本会基于你最近的点击等行为进行推荐。且由于算法贪心的Point wise模式,推荐的内容确实会是相似的多,这样就会造成错觉,怎么给我推的内容都差不多?
这里的差不多,就是上面说的,算法会基于行为推荐类目相似、价格相似等的内容,但老板要看到的是不同价格段的都来点,或者其他想法,反正是有自己的想法。有时能代表用户,但更多时候是参杂着自己的意愿,以及平台的导向。
比如也会说咱们平台不是还有很多内容吗,这里其实你可以建议你的老板去内容库或者商品库里看全部内容,推荐算法不可能把全部分类都推出来,那和过去的货架式、陈列式没什么区别了。
我们继续说多样性如何做。做之前呢,要知道目标,做到什么标准算好,那这里基本上是需要定量和定性去衡量的,比如定量上要提升浏览深度、CTR、停留时长、不同品类的曝光占比等,不同业务可能不太一样,定性上是否明显的Badcase在减少等。
有了衡量标准后,就是具体策略了,这个策略也要从多层进行制定,基本上推荐要想优化一个问题,都是要全方面的调整,不可能有一个大招,就解决所有问题,那一般都是从数据、召回、排序、交互上去优化:
)数据
数据这不多说了,核心是三点,数据要全面、准确、实时;你要搞清楚人的画像和商品内容的画像,要不然无法进行准确的召回和匹配。
)召回
这里要多说一点,召回源是推荐最重要的部分,如果你只有一路相似召回,那你就没法做多样性。至少要按人群、时间、空间、场景等维度进行差异化的召回,比如新人召回热销、或者基于CF的召回;非新更多是基于用户行为的相似相关召回。
还有些人会深度将人群分得更细,比如阿里的八大人群。从时间上会基于平日、季节、节日、大促、热点、上新等进行召回;从空间上会基于LBS召回;场景上则会比较多,比如是用户动线购前、中、后等,用户需求的具体场景,比如办年货、吃火锅等。除了这些召回外,还有一些更偏算法的,比如KNN,KG,Base Model CF。
)排序
这里和多样性相关的应该是模型由Point wise调整为List Wise,以及通过MMR等进行打散的排序,还可能加入一些硬规则的M出N的排序,然后EE和生态排序也可以算到这里。
)交互
这里最重要的是,要实时捕捉用户的正负反馈,根据正反馈加强推荐,根据负反馈削弱推荐;同时要在产品交互形态上做到动态交互,既用户点击某个Item后回到列表页时,下一个如何进行动态的推荐;以及用户翻页时,要进行重新推荐,这里有些会使用端智能,但感觉端智能还是提升有限,最好还是进行服务端重新的推荐。
总结一下多样性的要点:
用户意图非常明确收敛时,不要做大力度的多样性;
用户意图发散时,要加强多样性;
要合逻辑地做多样性,不要为了多样性而多样性;
个人观点的体感不做,但大多数人的用户体验,敏感商品屏蔽等要做;
拍脑袋的功能不做,但通过数据分析、行业调研、ROI高的要先AB实验做;
前端样式变来变去的策略产品不做,但分人群等个性化的UE及方案等要做;
天天干预配置的运营、策略产品不做,但要提供工具给产品运营用;
天天帮研发找表、跑数的保姆不做,但跨部门协调、数据分析等要做;
左手导右手的不做,但如果能形成全局效率最大化的要做;
人情类的需求不做,但为了生存有选择性地做。
以上为个人观点,不代表任何机构。