| 内容整理自数据分析、大数据分析和人工智能,侵删
近 5 年,市场对于数据分析方向的人才需求一直逐年攀升,不局限于大数据岗位,各行各业也都包含其中,掌握 Python 语言、拥有数据分析思维早已成为职场人一个加分项。
还记得年初疫情爆发的时候,有网友在B站发布了对疫情传播整体预估的视频。作者只简单地通过更改不同的数据参数(包括医院、政府、群众等的行为),十分具象地向观众展示出了如果大家不做好防控和隔离、医院承受能力不足、物资不够等情况下,会对疫情的传播速率和结果有多大的影响,这个视频点击量非常大,甚至被央视转发。
目前,数据科学确实广泛应用在各个领域,在分析各类现象整理、产品分析、趋势预测、运营策略等方面,尤其被大家青睐。
事实确实如此,以产品分析为例,一个产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。数据说到底,就是这样一个工具——通过数据,我们可以衡量产品,可以了解产品,可以在数据驱动下改进产品。
但每每听到别人提起数据分析,都说感觉特别难、无处下手,只会盲目找资料也抓不住知识的重点。数据分析和数据处理本身确实是一个非常大的领域,但还是有比较基础且实用的部分,尤其在日常产品工作中可以发挥比较大作用。
| 数据趋势分析
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化原因进行分析。
趋势分析,最好的产出是比值。在趋势分析的时候需要明确几个概念:环比,同比,定基比。
环比是指本期统计数据与上期比较,例如2019年2月份与2019年1月份相比较,环比可以知道最近的变化趋势,但是会有些季节性差异。
为了消除季节差异,于是有了同比的概念,例如2019年2月份和2018年2月份进行比较。
定基比更好理解,就是和某个基点进行比较,比如2018年1月作为基点,定基比则为2019年2月和2018年1月进行比较。
比如:2019年2月份某APP月活跃用户数2000万,相比同年1月份,环比增加2%,相比去年2月份,同比增长20%。
趋势分析另一个核心目的则是对趋势做出解释,对于趋势线中明显的拐点,发生了什么事情要给出合理的解释,无论是外部原因还是内部原因。
| 数据对比分析
数据的趋势变化独立地看,其实很多情况下并不能说明问题,比如如果一个企业盈利增长10%,我们并无法判断这个企业的好坏,如果这个企业所处行业的其他企业普遍为负增长,则5%很多,如果行业其他企业增长平均为50%,则这是一个很差的数据。
对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。
一般而言,对比的数据是数据的基本面,比如行业的情况,全站的情况等。有的时候,在产品迭代测试的时候,为了增加说服力,会人为的设置对比的基准,也就是A/B test。
比较试验最关键的是A/B两组只保持单一变量,其他条件保持一致。比如测试首页改版的效果,就需要保持A/B两组用户质量保持相同,上线时间保持相同,来源渠道相同等。只有这样才能得到比较有说服力的数据。
| 数据细分分析
在得到一些初步结论的时候,需要进一步地细拆,因为在一些综合指标的使用过程中,会抹杀一些关键的数据细节,而指标本身的变化,也需要分析变化产生的原因。这里的细分一定要进行多维度的细拆。常见的拆分方法包括:
◼ 分时:不同时间短数据是否有变化
◼ 分渠道:不同来源的流量或者产品是否有变化
◼ 分用户:新注册用户和老用户相比是否有差异,高等级用户和低等级用户相比是否有差异
◼ 分地区:不同地区的数据是否有变化
◼ 组成拆分:比如搜索由搜索词组成,可以拆分不同搜索词;店铺流量由不用店铺产生,可以分拆不同的店铺
细分分析是一个非常重要的手段,多问一些为什么,才是得到结论的关键,而一步一步拆分,就是在不断问为什么的过程。
趋势、对比、细分,基本包含了数据分析最基础的部分。无论是数据核实,还是数据分析,都需要不断地找趋势,做对比,做细分,才能得到最终有效的结论。
但想要在数据科学、数据分析领域深入耕耘,或者快速上手,那么IBM数据科学应用工程师训练营推荐给你!
IBM 数据科学工程师训练营,将采用封闭式营地学习模式,由浙大教授将带领学生们一同完成数据科学训练,让你在最快时间取得 IBM 数据科学应用专业证书!