我在做数据分析的时候,经常提醒自己,要多想一想,为什么做这个数据分析?不要陷入使用工具的泥潭而不能自拔,不要为了做图表而做图表,不要为了写报告而写报告。
数据分析的工具只是实现目标的手段,我们可以利用工具去解决实际问题,特别是解决那些对业务有关键影响的问题,用数据去让业务发展得更好。
不要只是把数据做成图表,就直接提交上去,要站在业务的角度去思考,如何才让业务发展得更好,用客观的、合乎逻辑的方式说明:
()客观情况是什么?What
()为什么会是这样?Why
()将来应该怎么做?How
日本的数据分析实战专家「柏木吉基」写过一本书:《如何用数据解决实际问题》,我觉得书中有些相关的知识值得学习。
. 解决问题,你需要「流程」
首先,有了流程,才能避免见到数据就立即动手,却总是在原地打转的情况。
解决问题的流程,从「明确目标」开始,然后找到「原因」,知道下一步需要采取哪些行动。
比如说,为了提高发货效率,可以整理从「接到订单」、到「确认库存」、再到「联系顾客」和「提示发货」、最后到「发货」的流程图,分析每一个阶段的效率情况。
再比如说,为了防止利润继续减少,可以用「杜邦分析法」,针对关键指标进行假设分析。为了防止销售业绩继续下滑,可以用「 P 营销理论」的框架,从产品、渠道、促销、价格的角度提出假设,找到问题的关键点。
对领导布置的任务,不要就事论事地只看任务本身,要留意「任务背后的诉求」,试着从高出自己一两个级别的水平进行思考,避免自己的视野过于狭窄,培养自己扩展思路的能力。
对于只看数据分析报告的老板来说,他们看重的不是数据分析的方法和工具,而是结论。老板不是要看数据分析师的「炫技」,而是要看数据分析师提出的建议能否解决实际的问题。
. 分解数据,找到「问题的关键」
在明确目标并大致把握现状之后,开始进入提出假设、确定问题关键的阶段。
那么,具体应该如何找到「问题的关键」呢?
比如说,销售额可以分解为销售数量与平均单价的乘积,销售数量可以分解为新客户的购买数量和老客户的购买数量,对于老客户,再次选择「回头客」比例作为「客户忠诚度」,从产品、用户年龄、职业、性别、时间等维度进行对比分析,最终找到影响问题的关键。
这里再举一个例子,林骥以前用 Excel 做过一个动态杜邦分析模型,其中体现盈利能力的指标:销售净利率 = 净利润 / 销售收入,净利润 = 销售收入 - 全部成本 + 其他利润 - 所得税,这样把关键指标一层一层地进行分解,结合对比思维,如果某个数据的变化比较异常,那么就可以进一步深入地进行分析,从而找到关键的影响因素。
点击文章最上方的蓝字「林骥」进入公众号后台,发送「杜邦」两个字,可以获得该文件的下载链接。
. 采用交叉视点,锁定「原因」
在实际工作中,很多情况是,虽然通过细致入微地分析,我们知道了现状,但是,到了锁定原因的阶段,却又用主观的见解,来代替客观的事实。
能否用数据说话,会导致后面的工作方法截然不同。
在解决实际问题的过程中,知道「是什么」固然重要,但更重要的是,还要知道「为什么」和「怎么办」。很多数据分析工作,一直停留在「是什么」这个阶段,是因为思维被限制在单个维度的范围之内。
为了打开数据分析的思路,我们可以运用「相关思维」,找到对最终目标具有关键影响的原因。
比如说,针对「销售额」这个目标,找出「顾客满意度」、「降价」、「产品质量」等可能影响的因素,分析这些因素与目标的相关程度,从而得知对销售额产生剧烈影响的原因。需要主要的是,相关关系并不等于因果关系。
. 制定对策,要依据「方程式」
了解相关程度的大小,对锁定原因非常有效,但是只靠相关分析,却无法知道这个原因对目标产生的影响有多大。
领导可能会问:那么具体要采取哪些措施,要做到何种程度呢?
相关分析归根到底还只是知道「为什么」,而并不知道「怎么做」。
通过回归分析,可以将 个数据之间的相关关系,表现为具体的公式。
比如说,为了提高某设施的使用率,假设使用人数与使用满意度之间存在相关关系,下一年度使用人数的目标为 人,根据历史数据进行回归分析,可以得出下面的回归方程式:
= . * 使用满意度 + .
从而计算出,使用满意度 = (-.)/. = 分,我们在散点图中也能看出这个结果。
如果只是提出「提高使用满意度」的口号,我们还是无法采取具体的行动。于是,接下来要关注与使用满意度高度相关的「使用方便程度」,它是提高使用满意度的更进一步原因。
类似地,对「使用满意度」与「使用方便程度」进行回归分析,再用回归方程式反向计算出,想要使用满意度达到 分,就要让使用方便程度的分数达到约 分,从而比较明确地回答了上面「要做到何种程度」的问题。
. 用数据讲故事
解决问题的故事,可以总结为:明确目的或问题 ➡️ 大致把握现状 ➡️ 锁定问题的关键 ➡️ 锁定原因 ➡️ 研究及实施对策,这就像医生为患者看病并开出处方的过程。
有些人做的数据分析报告,会密密麻麻地写满详细的文字或图表,让人抓不到重点,看不到关键的结论和建议,不知道到底想要说明什么。这种「面面俱到」的做法,还是放弃为好。
我们在用数据讲故事的时候,应该把主要的时间和精力,用来思考核心信息是什么?看报告的人想要知道什么?