数据营销时代,越来越多人开始接受用数据指导广告投放。但很多人并不知道,数据可以指导投放的前提是数据分析师/广告优化师能够正确的解读数据。
同样的数据,通过不同方式的解读,给投放带来的指导作用天差地别。
是帮助 广告主更好的实现KPI?还是把营销带入另一个无底深渊?本文将从数据分析的角度出发,聊聊各种数据分析乱象,旨在提醒诸位如何避免拿数据耍流氓的行为。
数据分析五大乱象
乱象一:数据本身造假
最常见也是最初级的耍流氓行为就是 数据造假。
比如,为了让广告主对投放工作表示满意,或者说服广告主继续投放广告,投放方会在结案报告里对数据做一些处理,从曝光量到点击量到点击率都做一遍美化,让广告主觉得这钱花得挺值,甚至愿意继续投。
此前国内某地产大腕就因为发现某一个视频平台曝光数据作假,一气之下把与他合作的线上平台统统查了个遍,闹得各个平台的经手人心惶惶,毕竟一年下来也能投好多万的广告,如果因为数据作假进了信用黑名单,以后再想合作就基本不可能了。
也正是因为数据作假越来越常态,更多的广告主开始监测广告投放。
那么没有对广告流量做监测的广告主该如何识别数据作假呢?
这里分两种情况:
一种,广告主本身并不懂数据分析,那么可以通过了解、分析一下行业的行情,看看和同行的数据相比,你的数据表现会不会太好、或者“超出想象”。
如果你拿到的数据非常好,最好能够让投放方给出对应的定向、创意等足以支撑数据表现那么好的理由,然后,再决定是否要继续投放。
另一种,是广告主本身懂数据分析,那么通过了解投放背景、根据指标之间的耦合关系等就可以识别出数据是否有问题。
所谓耦合关系,在数据分析领域指的是 各个数据指标间的关系并不是孤立的,比如如果落地页的停留时间非常短,那么你的落地转化率通常也不会好到哪里去,因为用户根本没看全你的落地页在说什么,点开落地页即有转化动作的用户基本不会出现在信息流广告里。
除了关注耦合关系,还可以参考其他的一些分析方法。比如通常来说,某些数据指标的取值分布是有规律可循的,像有些广告类目的访客高峰期可能是在上午的十点左右和下午的三点左右,晚上的访问高峰期在睡前九、十点钟,如果半夜三点流量莫名其妙的多起来,你就要注意了,分析看看这个异常现象是因何而起。
乱象二:指标定义不一
指标是说明总体数量特征的概念。很多公司都有自己的投放KPI指标体系,简单来说就是通过几个关键指标来衡量公司广告投放情况的好坏,比如点击率、曝光量、转化率、下载量、ROI 等,都是信息流广告的考核指标之一。
通常情况下,指标需要在一定的前提条件下进行汇总计算才能得出,诸如时间、地点、范围等都可以作为指标统计的前提条件,也就是我们常说的统计口径与范围。
举例来说,我们要统计某公司2017年的销售额,那么“销售额”就是指标,“某公司”、“2017年”都是统计的前提条件,对于这个指标的获取,需要我们把某公司2017年里每个月的销售流水加到一起才能得出,而最后统计得出的数额就是指标值。
在实际工作中,因为没搞清楚指标的定义而对指标值出现误判的情况经常出现。
比如我们经常在线下沙龙里听到同行在一起闲聊:“我们的平均获客成本只要120元。”
一起参加沙龙的朋友一听,心想你们好牛逼啊,“我们一个获客要400元啊!差距好大啊!你指点指点啊!”
指点了一番之后,获客成本400元的老兄才幡然醒悟,其实大家都是400元,只不过刚刚那位120元的老兄说的是销售线索的成本,而不是实际成交的订单成本。
120元和400元这两个指标值的差别,其实就是因为指标的前提条件,也就是口径和范围不统一造成的误会,如果不了解清楚就进行比较,那比较本身就没有意义。
再比如电商都有DAU(日活跃用户) MAU(月活跃用户)的指标,可是对于这两个指标每家电商的定义可能不一样,有的只要客户登录就算是活跃,而有的定义可能是买了才算活跃,要求更严的是买了以后确认收货才算是活跃用户。所以当我们谈论指标的时候,一定搞清楚大家对指标的定义是否一致,否则这样的比较和讨论就没有意义了。
乱象三:隐藏关键信息
这种情况通常出现在别人想要说服你接受某个指标的时候。
比如公司管理层要给广告投放定一个KPI指标,号称Bench marking (标杆管理)的方法开始被用起来。
Bench marking(标杆管理),又称“基准管理”,其本质是不断寻找最佳实践,以此为基准不断地“测量分析与持续改进”。 比如,优化师经常会听领导说,某家同行的ROI能做到1:10,你看我们公司也不比他们差,我们产品质量还比他们的好, 所以我们不能低于1:10——这种想法对吗?
我们说,这是典型的 只知其一不知其二其三的盲目跟风现象。
为什么? 因为我们 压根儿不知道同行的1:10是怎么投出来的,怎么跟进?怎么超越呢?
当我们要进行标杆管理的时候,起码得知道别人家的1:10是基于什么原因做到的,是做了大规模的促销?还是在用媒体组合拳抢占市场?像上述般不知道营销大背景,单看一个渠道的投放结果就盲目追随标杆是不足取的,这也会给优化师的工作带来巨大的困难。
项目内部自己定指标的时候也容易出现这种问题。比如某个生鲜电商APP公司在给客户发放大额优惠券时,投放信息流广告之后获得的下载率、注册率和订单转化率自然会比没发券时要好,但如果公司拿发券时的投放指标考核优化师日常投放工作的话,就是拿数据耍流氓了。
为什么呢?因为发券行为大多是短期营销刺激,在刺激退去之后,用户的响应概率自然会大幅度下降。如果某些投放指标的获得并非自然增长,而数据报告里却又对这些影响指标的关键因素只字未提,在隐藏了关键背景的背景下提出的指标要求,就属于典型的耍流氓行为。
这里面提到的 自然增长,是指没有营销因素刺激的情况下,生意本来的运营情况。
所谓 影响指标的关键因素,是指对某一个指标结果影响比重较大的因素,比如产品,品牌,价格、促销等都在某些背景条件下都属于关键指标。
我们认为,合理的定指标的基准是自然增长,也就是说把促销的因素排除在外之后再来评估指标才是合理而可行的。
再比如刚刚过去的双11,某一家天猫店说自己家的业绩是多么牛逼,一天卖出去六七百万的销售额,可他没告诉你的是,后续的退货率可能高达25%。
这里的退货率就是关键指标,因为卖多少出去固然重要, 更重要的是买家要确认接受你交付的货物才能算是真实成交——这种忽略了关键背景、只告诉你销售额的行为,同样也是一种耍流氓。
以我自己多年运营天猫的经验看, 某些类目,比如配饰,退货率20%以上都属于正常的。但你如果不知道,你就无法准确解读别人的牛逼,或许还会盲从,说“那么牛逼,我也去开个天猫店吧!”或者“那么牛逼,你能不能帮我来做运营啊!”之类的。
所以,当你看到一个指标特别好,或是特别差的投放的时候,要搞清楚相关的关键背景信息,否则就有可能产生误判,造成更多的损失。
乱象四:乱搞因果关系
我们先来看个调查:
某大数据显示,医院是排在心脏病、脑血栓之后的人类第三大死亡原因。
我就问你,看了这个调查,你还敢去医院吗?
实际上我们都知道,死于医院的原因是这些人本来就有病,碰巧在医院死亡,并非医院导致其死亡,医院和死亡建立的是一种相关关系,不存在因果关系。
所以,“医院是排在心脏病、脑血栓之后的人类第三大死亡原因”的这个结论很可笑,他混淆了因果和相关关系。
同样混淆的经典搞笑案例还有:
睡眠时间越短的人,收入越高(所以我们以后都不要睡觉了)
游泳溺亡的人越多,雪糕卖得越好(实际上是因为天热)
……
为什么会产生这两种关系的误读呢?
因为我们在做归因的时候,只看到了数据上变化关系,忽视了事物之间的本质联系。特别是做数据分析时,往往只看到数字,没看到过程,导致我们认为,某一问题的产生就是其中一个问题导致的,即因果关系。
一旦混淆了因果关系与相关关系,会直接影响我们的判断,做出错误的广告投放决策。比如信息流广告投放里常见的价格导致成交的因果关系问题。
我们曾对多个投放婚纱摄影广告的优化师做过访谈,询问他们为什么都会用“这样一套婚纱多少钱”的创意来做投放,他们的回答惊人的一致:“因为客户就关心价格啊,他们都会问价格,价格合适了就会成交啊!”
也就是说,在优化师和一线销售看来,价格是影响成交的唯一诱因,所以他们选择用价格这个方向做投放创意。
那么事实呢?
我们从常识出发,稍微有点消费经历的朋友都会知道,问价格是成交前的必经步骤,也确实是会因为价格合适才会有下一步的消费决策,但,你是因为价格才进店的吗?你进店只关心价格吗?你最后下单只是因为价格合适吗?
同样的,对婚纱摄影有兴趣的目标客户一进店、一接咨询电话就只问了价格吗?其他什么问题都没问吗?
并不是吧。他们还会关心 拍摄风格、拍摄场景、服装、妆容 等等,只是,用户关心的这些不一定以提问的形式表达出来,不提问不代表不关心。
所以,单纯认为最终的购买决策是由问价直接导致的是有问题的,归根结底,价格只是客户满意的一个部分,还有更多的的原因导致最后的成交,我们需要了解影响目标客户做决策的各个相关因素,针对性的去做创意。
乱象五:以局部论整体
我们说因变量的影响因素其实有很多,但分析师往往只看到其中一两个,就草率的认为因变量的变化就是某个或者某几个变量的变化造成的,通常来说,由这个做法得出的结论都是片面的。
比如在信息流广告投放中,经常会有朋友吐槽XX渠道效果好差,不如XX平台,刚上线就有咨询。撇除平台本身的一些差别,我们从广告投放规律来看这个问题,你会发现,效果好坏的评估需要考虑多个因素。
之前我在给一个电商项目做投放的时候,老板说明星店铺的广告ROI 比钻展还有其他直通车广告都要来得更硬朗,所以“把其他广告都撤了吧,把钱都砸到明星店铺上去!”
那么我们应该听话的把所有广告费都花到明星店铺上吗?
我们用一个例子来说明,假设我想买个手机:
1、午休的时候我在公司电脑上打开京东网站看了一圈各个品牌手机的介绍;
2、回家的路上我在公交车站台等车看到了VIVO的全面屏手机广告,才知道是明星鹿晗代言的;
3、坐车的时候我用头条刷资讯,刷到了一条VIVO手机的测评,于是点击进去看看;
4、看完测评没多久,我在头条刷到了VIVO的广告,时间关系,没有点进去看;
5、双11前,我上淘宝搜了一下VIVO全面屏,从明星店铺的广告入口进入到落地页之后,发现全面屏手机在大促,于是点击进去,下单,付款等收货。
这5步是一个典型的购买历程。从产生兴趣到信息搜寻到备选品牌评估,最后到购买决策,我同时受了好几个广告的影响,但并没有为这些广告买单,直到通过点击明星店铺广告,我才有了消费。那么,是不是其他广告都没有必要存在?步步高公司可以把除了明星店铺之外的广告全部撤销呢?
当然不是。我最终的购买,是之前多个广告对我共同影响的结果。
这也是我们常说的 多渠道归因(Attribution Modeling),即,消费者的购买决策并不单单受到最后一个媒介广告的影响,媒介和媒介之间是有交互关系的。
做过电商投放的朋友大都有这样的经验,就是去掉了那些看似ROI不高的渠道以后,以为能省下不少广告费,却发现原来ROI好的那几个渠道也莫名其妙的不好了,这其实就是各个渠道在触发用户转化时扮演的角色不同:
有些广告是用来打品牌认知基础的,
有些广告是强化品牌认知作为助攻的,
有些广告是促进销售引导转化的,
……
孤立的评价哪个渠道效果好或者不好,是不符合消费者购买的行为规律的。
那么同样的,当你在评价信息流某个或某些个平台效果不好、但其他渠道效果好的的时候,可以试着从多渠道归因的角度综合考量,看看效果不好的那个平台有没有可能是触发最后购买决策的某一根稻草,如果经过分析,确定这个效果不好的平台不能为你的绩效带来任何帮助,再考虑是不是要取消投放,不要单单凭转化不好这点就草率的做决定。
数据分析三大建议
建议一:切勿预设立场
数据解读最起码的要求是不能预设立场。
举个非常常见的例子,比如我们办公室的小姑娘刚来应聘的时候,看到我用的手机是白色,开的车也是白色的,就问我,“是不是男生喜欢白色?我看到很多男生都是用白色的手机,开白色的车。”
我们说这个姑娘的结论就是 典型的可获得性偏见。也就是,当你预设了某个立场之后,你就会忍不住关注那些与自己想法相关的事、物、人,比如这个姑娘,当有了一个预设的想法之后,不自觉的会关注用白色手机、开白色车的人,看看是不是男的,如果是男的,符合自己的设想,甚至还会非常自嗨的说“果然如此”。
而事实上,当你这么想的时候,你的数据分析已经出现了方向性的偏差。
更麻烦的是,绝大部分情况下,我们可能自己都没意识到,自己只看了那些自己想看的事、物、人。
同样的,在做数据分析时,如果预设了某个立场,就有可能只统计自己想统计的,然后用来证明自己已有的观点。
但数据分析的精髓并不在于用数据证明自己的既有观点,而是从数据里发现洞察,为KPI增长找到方向和突破点。
作为使用数据的营销人、广告优化师、数据分析师,应该具有严谨负责的态度,保持中立的立场,客观的评价数据分析工作中存在的问题。
建议二:善用上帝视角
我们说,数据分析是生意的一部分,当我们用营销视角来看待数据分析的作用时,我们就能提纲挈领的理解数据是怎么回事了。
比如很多销售导向型的信息流广告转化不好,那数据分析师要做的,不是直接钻到点击率曝光量这些投放数据里埋头苦干,而是先要识别当下这个广告行为有效的前提是什么?
也就是我们常说的,埋头赶路的同时,别忘了抬头看天。
我们拿常见的二类电商投放广告做销售这个营销行为举例,比如一个皮鞋代工厂老板奔着销售目的投了几万块钱的信息流广告,期间优化过多次,但也没有什么用,最终的销售数据非常惨淡,这是为什么呢?
单从投放本身看,他似乎已经把所有可能的情况都测试了一遍,然而并没有什么用。
但如果站在营销的视角去分析,这个问题就很好回答。
我们说大部分销售导向性的广告只做了一步,就是把货铺到消费者面前,在生产力落后的时代,比如计划经济凭票供应那会儿,铺到消费者面前或许就足以触发购买了。
但是现在很多产业,比如我们举例的皮鞋行业,产能整体过剩,商家竞争的战场已经从货架转移到了消费者心智,那么这个时候,我们仅仅做到把货铺到消费者面前这一步是远远不够的。因为你的竞品在你出现之前就已经把货铺到了消费者脑袋里,也就是说,早在你到达之前,你的竞品们已经在消费者的心智里完成了预售——消费者已经买了他们,为什么还要买你呢?
注:杜江铺货理论
铺货到脑:建立品牌,抢占心智
铺货到手:构建渠道,方便购买
铺货到嘴:优化体验,促成口碑
所以,当我们理解了铺货理论以后,就能很好的解释,为什么皮鞋广告的转化数据不好,因为转化的关键并不在当下这个营销行为里,老板需要做的,是去调研分析,看看皮鞋这个品类还有那些分化的机会,通过开创并主导一个新品类来抢占市场机会。
建议三:做个敏感的人
正如本文开头所说的,数据可以指导投放的前提是数据分析师/广告优化师能够正确的解读数据。
数据既定的情况下, 限制数据发挥作用的主要因素,就是分析者对数据的解读能力。比如前文所说的混淆了因果关系和相关关系的情况,以局部视角诠释整体格局的误区,等等。
所以我常说,如果你想做数据分析,你最好是一个敏感的人:要对数据变化敏感、更要对数据变化背后的原因敏感。
比如我们经常看到各大互联网APP在推广初期疯狂补贴的行为,有的靠补贴获得了大量的用户,企业发展随着用户量的增长越走越顺,比如滴滴打车。而有的在补贴之后没多久却销声匿迹了,那这背后的原因是什么呢?
如果你单单从推广初期的转化漏斗图上去分析,你除了会更加茫然,并不会有太多的收获,因为从漏斗图上看,后续发展得好的APP和后续发展得差的APP在获取用户的初期,情况是很类似的:
但如果追着深挖用户初次使用APP之后的行为反应,就会发现更有价值的洞察。
比如,后续发展得好的APP,他的很多用户都会自发转介绍,为APP带来更多的用户加入,而后续发展得差的APP,他的转介绍情况、跟风使用情况都非常差:
如果你先于其他同行发现了这个问题,你就可以先于他们分析这个数据,看看差是怎么导致的,好又是怎么回事,继而合理的运用这些洞察来指导接下来的营销推广活动,以促成更高效的市场渗透。
所以说,更多时候,数据分析师更像是福尔摩斯,保持敏感的好奇心,凡事多问几个为什么:
为什么是这样的结果?
为什么不是那样的结果?
导致这个结果的原因是什么?
为什么结果不是预期的那样?
……
如此就能比别人更快、更准确的找到突破点,继而顺藤摸瓜,找到数据背后的商业真相。
最后,借用乔布斯的名言,“stay hungry, stay foolish”,希望更多如我一般的数据分析师,在探寻真相,发现商业洞察的路上越走越顺。