字节跳动 今日头条
朋友您好,我是国文。
这篇文章的主题是:今日头条的内容推荐机制。
有的时候,你花了很多的时间和精力,去完成一个作品,最后的阅读量却十分惨淡,收益更不用说;
有的时候,你随手完成了一个作品,本来没有报太大希望,阅读量却蹭蹭涨上来了,最后获得了一笔不菲的收益。
当收益变低,你的更新积极性瞬间下跌;当收益回暖,你的更新积极性又回来了。
那么如何去做,才会让我们账号的阅读量较高,且维持稳定呢?
我们就要琢磨:目标用户、我们的内容、广告商和平台规则了。因此,深度学习今日头条的内容推荐机制,是非常有必要性的。
01
头条推荐系统的本质
推荐系统的本质,就是精准、个性化推荐。系统会给作品打标签,给用户打标签,推荐用户可能感兴趣的内容。
在头条有大量的创作者,这些创作者们创作的作品,包括图文、图片、图集、视频、小视频、音频、问答和微头条等题材,都会被系统纳入到内容池里,积累几十万甚至上百万的内容。
对于图文、问答和微头条等作品,系统会进行关键词提取;对于音视频作品,系统会利用AI技术进行识别。这样,内容作品就被打好了标签。
最后,系统会根据标签,对于内容和用户进行个性化匹配,这就是推荐系统的本质。
02
给用户匹配内容的时候
系统主要考量三个因素
这三个因素包括:内容、用户,以及用户对于内容感兴趣的程度。
关于内容,前面已经提到,系统会用关键词提取和AI技术识别,进行打标签,最后会被分类到多个领域,比如教育、体育、职场等等。
关于用户,主要是刻画用户画像,据此提供喜欢的内容。
刻画用户画像的维度有很多,比如:用户的年龄、历史浏览内容、环境特征等等。
每个维度都可以展开来获取数据,进行分析,比如环境特征来说,用户浏览某一个信息是在平时还是在周末,是在家浏览还是在坐车的时候浏览。
用户对于内容是否感兴趣,感兴趣的程度,主要通过用户动作来判断。
平台可以通过调研问卷,判断用户对于内容的态度,但是不可能每天都做调研,那么就只有一种方法:观察用户动作。
当一篇内容推荐给用户,如果ta不点击,那么就有可能是不感兴趣的;
如果ta点击阅读,但是很快就跳出,也不评论、点赞等,甚至会点一个不喜欢,系统就判定,内容打到了用户痛点,但是质量不高。
如果用户点击阅读,并且有点赞、评论、收藏等动作,甚至关注作者,那么系统就认为用户对内容感兴趣,且内容优质!
最后,系统综合各方因素,评估用户对于内容的满意度。给用户推荐最可能感兴趣的内容。
03
内容在推荐系统中的生命历程
审核+加权推荐冷启动+复核
创作者发布的内容进入到系统后,首先会经历审核环节,通过审核后系统会对内容进行一定的加权推荐,这个过程称为冷启动,冷启动完成后来到正常推荐。
内容推荐过程中,用户会对内容有反馈,据此触发复审,影响后续的推荐,以下来具体解读一下。
内容发布后,首先来到初审,符合规则的内容将通过审核开始推荐,而不符合规则的内容会被限制推荐,或者被退回,不予收录。
初审过程主要是判断内容是否符合国家有关法律规范,由机器和人工共同配合,进行审核。
一般情况下,初审的时间较短,基本可以控制到1分钟内;而逢年过节,或者迎来大型赛事、活动的时候,初审时间会有一定延长!
初审通过后,就来到冷启动环节。
对于新发表的内容,平台和系统不知道是否会火起来,因此会给它进行加权推荐,将它展示给可能喜欢的用户,加权后可能会展现(推荐)几千次。
根据用户的动作,可以看到哪些人群(不)喜欢这个作品。
内容达到几千次的展现后,系统会认为已经给足了机会,会撤销加权,冷启动流程结束。
经历了冷启动阶段后,系统已经收集到了基础的推荐效果数据,如果一篇内容的数据很好,系统会认为它是有潜质的,会加推,反之则会收紧推荐。
正常推荐过程中,系统会收到各种各样的用户行为,同时还能监测到很多数据异常,比如点击率高但是用户负面反馈数据也高,这个作品就会再次进入审核流程,进行复审。
复审过程中,系统会重点打击标题党、封面党、低俗虚假内容,停止推荐,优质内容继续推荐。
以上,就是本节课的全部内容,了解了头条号的内容推荐机制,接下来就该重新琢磨下,自己的账号定位、内容质量、创作和运营方法等问题。
在符合平台规则的前提下,争取创作更多优质的内容,加油!