本文给大家梳理一款搜索广告——竞价置顶。会阐述这款搜索广告的内部原理,让大家既能对搜索广告有个大概了解,也能了解到实际垂直行业,比如招聘行业是怎么用搜索广告做变现的。
目前市场上通用的搜索广告基本是竞价交易模式,不管是百度凤巢,google的adwords,还是淘宝直通车。
上次介绍了在招聘行业的搜索广告产品:刷新,刷新是按次数收费,并不是竞价交易模式。今天继续梳理另外一款搜索广告:竞价置顶。
我会阐述这款搜索广告的内部原理,让大家既能对搜索广告有个大概了解,也能了解到实际垂直行业,比如招聘行业是怎么用搜索广告做变现的。
简单来说,就是当你去搜索引擎上输入一些字进行查询,看到的广告。
比如下图,我用红框框出来的部分,一个求职者,在查询框输入查询词:销售经理。
点击搜索后,会看到一些销售职位的广告,如下图红框处,这些职位都是付费的竞价置顶广告。
竞价置顶说白了有点像选女团的过程。一系列的广告像一个个追梦的女孩一样,通过海选,明星教练的考核,最终选出X位学员成团出道。
广告也需要经历这一层层的考核,最终选出合适的广告,按照顺序展示给用户。
竞价置顶的决策过程,大概有个主要步骤,我会将这些决策过程尽量用通俗易懂的方式表达出来,以便大家一块探索搜索广告的内部原理。
我们知道每一个选秀节目在面对明星导师之前,会有海选招募报名。广告也有,广告这个过程叫查询理解。
具体有哪些步骤呢?
查询清洗,忽略停止词。比如我们会把查询中一些无意义的虚字自动忽略或过滤掉,来节省存储空间和提高搜索效率。例如”的”,“也”等。
分词:用户输入【产品经理】,我们需要将该查询进行分词处理,【产品经理】会分词为【产品】【经理】去进行查询。
查询扩展:查询扩展主要有种匹配模式:
精确匹配:指【用户查询词】与【广告主投放关键词】完全匹配。比如【用户查询词】为【产品】,【广告主投放关键词】必须是【产品】,这条广告才会触发。
短语匹配:指【用户查询词】完全包含【广告主投放关键词】。例如:【广告主投放关键词】为【产品经理】,【用户查询词】为【高级产品经理】或【资深产品经理】时,这条广告也会触发。
广泛匹配:当使用广泛匹配投放某个关键词的时候,当用户的查询词与广告主投放的关键词高度相关时,广告也能触发。比如【广告主投放关键词】为【销售经理】,当用户查询【销售代表】时,该广告也会触发。
因为广告主投放的关键词和用户查询的词并不一定完全match,为了尽可能多的触达用户,不错过一些可能,所以我们需要做查询扩展。
查询扩展的目的是给广告主自动地拓展相关的查询词,扩大广告主的采买流量。
当海选招募后,我们就需要找到符合招募要求的女孩。广告也是这样,我们需要在广告库里找到所有匹配用户查询词的广告。
比如:用户搜索“销售经理”,那我们需要找到所有符合/部分符合”销售经理“的广告职位。
例如下面这个表格:【销售经理】 与 【销售代表】 这两条广告都会选中,但【JAVA工程师】完全不相关,则不会选中。
那广告,与广告,哪个与用户查询更相关呢?我们凭直觉知道广告比广告更相关对吧。那如何衡量相关度呢?这时候就要介绍【倒排索引】了。
倒排索引就是用户帮我们计算相关度的,我们先建立倒排索引。
销售 ->[,]
经理 ->[]
代表 ->[]
比如【销售】,出现在个广告里,则对应两个广告ID:广告、广告
比如【经理】,只出现在个广告里,则对应个广告ID:广告
……
相关度:
相关度是衡量【用户查询】与【广告关键词】有多相关。
为了简化说明,我们给个简单的相分度得分公式——相关度得分 =【广告匹配查询的关键词个数】 / 【广告关键词总数】
还是用户搜索【销售经理】的例子,按照上面的公式,广告的相关分为,广告相关分为.,广告相关分为。
工业界并不这么做,工业界可能从广告的历史点击日志里,提取一些信息。比如针对这些查询,有哪些广告被点击,把这些信息全部提取出来,然后进行人工标注, 参考如下图。每个标签就会对应一个相关分,标签贴好后,就有一部分训练数据了,这个时候就可以做监督学习,或者用更多的feature来做监督学习。
我们来到了女团初选,这时候我们需要淘汰一批参选者,什么样的参选者被淘汰掉呢?没话题没故事的、没才艺没理想的、不漂亮身材没料的、没背景的……
广告也是这样,淘汰方面主要考虑两个点:
第一:广告的相关度够不够,相关度低的广告需要过滤。比如上面的JAVA工程师,与用户查询的【销售经理】完全不相关,展示出来了也没人点击,广告主得不到想要的效果,C端用户看到不相关的广告,影响体验。
第二:广告的出价够不够,出价低的广告需要过滤。块钱都不给我,你只给我块钱(小红帽脸),平台还要拿钱吃饭的……
经历初选后,就到了面向导师环节了,导师需要给参赛选手打分评级,广告也是这样,需要对广告打分排序,并最终选择TOPK个广告展示,K就是放置广告的条数。
选出来的广告按什么排序呢?我们一般靠两个维度来计算排序分。一个是广告本身的质量分,另外一个是广告主出的价格。
排序分 = 广告质量分 *广告出价
广告质量分怎么算呢?这是公司的机密,一般不会公布的,我们可以给出简单的公式表达下这个原理:广告质量分 = . *点击率 + . *相关度得分。
在一般按点击付费的竞价广告里,点击率是通过机器学习模型来计算的,其中.和.是点击率与相关度得分的权重。
我们为啥在前面要设计广告过滤呢?其实是为了避免有的选手实力不行,但背后有个有实力的金主爸爸,出价很高,把排序分提了上来。
当所有排序分算出来后,我们根据排序分将所有广告进行排序。比如我们展示条广告,则选择TOP的排序分。
广告排序出来了,但怎么收取广告主的费用呢?我们应该按照广告主的出价进行收费吗?并不是,我们按照第二高价来收费。
简单地说就是出价最高者拍得物品,但以第二高的出价额数作为成交价。
为什么要用第二高价呢?因为第二高价可以确保拍卖人拍出心理价格。因为如果按出价收费,那买方往往为了保障自己的利益,出价往往要略低于心理价格。使用第二高价时买方可能以心理价格或略高于心理价格出价。
在这里,我给出一个最终收费的公式,如下:最终收费 = (下一名质量分/当前质量分) *下一名出价 +
还是拿我们上面的例子来说,假设你现在排名第,出价,你下面一名广告出价,则实际成交价是,我们也就收你.
在我们实际应用中,并没给买方一个出价,而是给买方提供了价格区间,最低出价和最高出价。这样最大化保障了买方的利益,也节省了买方频繁登录系统,进行改价的时间成本。
比如买方出价为-,是买方的出价上限,我们会先拿去进行竞价,如果失败再+元去竞价,直到为止。
以上就是搜索广告:竞价置顶原理。因为时间关系,我没有总结广告主后台功能,包括推荐出价的规则,还有广告者购买的词包生成规则(我们并不是单卖的关键词,而是将关键词打为词包进行售卖),以及词包推荐规则等。
如果有兴趣,改天再开一篇,专门讲下这块。
作为产品经理,我们应该重点关注产品策略及机制设计,后续在产品层面应该怎么设计,来优化竞价置顶这款产品呢?
比如设计价格挤压?价格挤压是根据市场情况更主动地影响竞价体系向着需要的方向发展。简单来说,当竞价非常激烈,存在大量出价高但质量不高的广告时,可以通过调整质量权重来影响排序。
当竞价激烈程度不够时,可以提高出价的权重,来鼓励竞争。
比如像招聘行业,春战是高峰期,就可以加大广告质量的权重;平常淡季的时候,为了鼓励竞争,可以加大出价的权重。