1.3 数据分析的步骤

虽然不同行业、不同领域的数据分析或多或少存在一些差异,但数据分析的大体步骤却是基本一致的。数据分析可分为以下几个步骤,如下图所示。

1.3.1 明确目的

明确目的是确保数据分析过程有效性的首要条件,可以为数据的获取、处理和分析提供清晰的目标。例如,希望通过数据分析发现用户地消费行为有哪些特征、商品如何定价、店铺在哪个时间段进行营销活动比较有效等。

明确目的是管理者的职责,管理者可以根据公司的决策明确目的,以便于获取相关的数据并进行数据处理和分析。

1.3.2 获取数据

有目的地获取数据可以确保数据分析的过程更有效,而在获取数据之前,我们需要明确自己想要获取什么数据,数据的获取渠道或者获取方法是什么,以便保证后期的数据分析正常进行。此外,还要将获取的数据以适当的格式保存下来,以便于后续的处理。

下面介绍几种常见的数据获取方法。

1.免费下载开源数据

互联网是数据的海洋,是获取各种数据的主要途径。例如国家统计数据,各地方政府公开数据,上市公司的年报、季报,研究机构的调研报告,以及各种信息平台提供的零散数据,等等。根据需要可以免费下载这些数据。

2.网络采集数据

网络采集数据就是通过爬虫软件编写的程序自动以及定时地从网页或App采集大量所需的数据,但在网络采集数据时需要考虑数据的合规性及用户隐私的保护。

3.市场调查

市场调查也是一种数据来源的有效途径,可分为线上市场调查和线下市场调查。线上市场调查是一种借助互联网工具快捷获取所需数据的一种方法。调查者通过各大问卷网站、论坛和贴吧发起问卷调查,或者通过网络媒体、行业KOL(key Opinion Leader,关键意见领袖)等渠道付费发布问卷调查,收集反馈数据。线下市场调查是一种比较传统的数据获取方法。调查者通过实地调查的方式收集现场的人和物的最新数据信息,还能通过察言观色对现场用户反馈和收集的数据进行适当的调整,使数据更趋近准确。

4.获取内部数据

内部数据指的是个人或企业以前整理出来的数据文件或者数据库,使用者可以直接获取这些数据信息再次利用。我们在工作中需要对产生的数据进行保存归档,这样今后查阅和再次分析数据的时候,无须做重复的数据获取工作。

5.外部购买数据

市场数据很难收集或者既想节省时间又想获取可靠的数据,那么可以选择到专业机构购买数据服务。许多公司和平台专门收集和分析数据,可以直接从那里按需购买数据和相关服务。这是常用的数据获取方法之一。

1.3.3 处理数据

数据的处理也称数据的清洗。在大多数情况下,我们通过多种渠道获取到数据,其格式未必是一致的,需要进行统一,不同格式的数据在处理步骤上也不一样。另外,数据中可能存在缺失值、重复值等。对于重复值,一般做删除冗余处理;对于缺失值,一般进行填充处理。

1.3.4 分析数据

处理好数据后,就可以通过合适的方法或者工具对其进行分析,将数据转化为信息,以便实现我们最初确定的分析目标。