数据分析到底是分析了什么?怎么才能快速上手?

时间:2020-11-20 相关资料下载
| 内容来自果壳,侵删



随着大数据时代的来临,大家对数据的了解有了翻天覆地的变化。在我们的平时日子和作业中,数据无处不在,繁杂的数据中隐藏着很多的联系。


假如不对这些数据进行有用的剖析和处理,将会对大家的日子和作业产生极大的负面影响,由此数据分析就应运而生了。

数据分析,是当今的热门行业之一,任何行业中都能看到它的身影。尤其是移动互联网兴起后,这个行业变得更加重要起来。一是因为许多工作都离不开数据,二是因为专职的数据分析岗位的薪资也十分可观。



那数据分析该怎么做呢?

一般而言分成7个步骤:①明确需求 →  ②确定思路 → ③处理数据 → ④分析数据 → ⑤展示数据→ ⑥撰写报告  → ⑦效果反馈。




| 01、明确需求


明确需求,就是搞清楚你要干什么。初级数据分析以被动型为主,即别人发现了问题,你来分析数据。而中高阶数据分析则需要你主动沟通,获取对方想得到的东西。


需求的核心内容主要有5个方面:分析目的、分析主体、分析口径、分析思路、完成时间。


| 02、确定思路


确定思路,是数据分析的“灵魂”所在。需要从分析目的出发全面、深入拆解分析维度,确定分析方法,最终形成完整的分析框架。没有分析思路怎么办?3个方法:


套用经典:常用 “套路”有AARRR分析、RFM分析、5W2H分析等。

指标体系:利用公司内部已形成的指标体系,找到合适的切入角度。


总结提炼:通过学习公司历史分析报告,请教同事,不断运用总结,提炼出自己的分析框架。



| 03、处理数据



数据从哪来?来源可以分为内部及外部,内部来源主要是现有的报表,数据库,而外部的主要可以通过网页爬虫、调查问卷、国家统计局等来获得,无论从哪里获得要保证数据的统一、有效。

怎么处理?主要是4种操作:

数据收集:也就是从数据来源中收集、提取出分析的相关数据;

数据清洗:观察数据是否存在异常值、空值等,若存在,可剔除或用合理值代替,常用的代替值是平均值、中位数、众数;

数据计算:通过数学公式等用已有数据计算出自己需要的其他数值,如:日均值、总销售额;

数据转化:将数据转化成分类数据也就是离散型数据,俗称“标签化”。



| 04、分析数据


分析数据是重中之重的工作,它是从分析目的出发,按照分析思路,运用适当的分析方法或分析模型,使用分析工具,对处理过的数据进行分析,提取出有价值的信息。


如何开展具体的分析呢?可以将现有的分析方法、分析模型进行结合,去对数据进行整合分析。像基础的分析方法对比分析,结构分析、分类分析等,高级分析方法聚类分析、回归分析、决策树分析等,分析模型AARRR分析,RFM分析,A/B测试等。

用什么工具?入门的话,就是 Excel、SQL,进阶的话是 Python、R。


| 05、展示数据


展示数据也称为“数据可视化”,是以简单、直观的方式传达出数据包含的信息,增强数据的‘易读性’,让阅读者轻而易举的就看出数据表达的内容。


俗话说的好“文不如表,表不如图”,所以展示数据一般用图表进行展示,常用图表有表格、柱状图、折线图、条形图、散点图、饼图。

这些图表是不是很熟悉?在 Excel、PPT是不是制作过?Excel、PPT是最基础、常用的图表展示工具,当然,也有专业的展示工具如Power  BI、Tableau。


| 06、撰写报告


撰写报告是指以文档形式输出分析结果,其内容是通过数据全方位的科学分析来展现运营情况,能够为决策者提供强有力的决策依据,从而降低运营风险,提高盈利。


怎么写报告?常用的报告形式有PPT、Word、Excel:

PPT:制作耗时较长,但其美观度强,大型汇报一般都是以PPT载体;

Word:分析报告主要是用于文字较多、正式的邮件附件;

Excel:常用于内部的交流报告,制作时间较短。


| 07、效果反馈


进行效果反馈时,需要一定的载体来进行呈现,目前通用的2种反馈形式:


监控报表:反馈时间间隔比较短、重复频次高的反馈,比如日报、周报;

分析报告:反馈时间将较长或一个执行周期情况,比如XX月分析报告、XX公司年总结报告。


一般在效果反馈后会回到需求沟通,与他人沟通反馈效果情况,比如是否有异常、异常原因、下一步动作等,这就形成了闭环分析。


如果你也对数据分析感兴趣,或者你是一位刚入门的新人,那么推荐你参加 IBM 数据科学应用工程师训练营助你在最快时间获得 IBM 数据科学应用专业证书,一起来探索数据的奥秘吧!



相关资料下载
暂无资料
热门推荐 /Popular recommendation
返回顶部