- 商业分析思维与实践:用数据分析解决商业问题
- 傅一行
- 1429字
- 2025-03-27 18:51:23
1.2 大数据的三层认知
如今,大数据已不仅仅是一个简单概念,其内涵和外延都得到了很大的扩展。其实,大数据是一个很宽泛的概念,要想系统而全面地了解大数据,可以从如下三个层面来进行,如图1-2所示。

图1-2 大数据三层认知
1.第一层:理论层
这一层,主要是从理论上来认识大数据,理论认知是最基础的层面。什么是大数据?大数据有什么特征?大数据的核心价值是什么?
更重要的是,要理解大数据思维模式,思考为什么大数据能够支撑商业决策,它是通过什么方式做到的,以及从数据到决策的过程到底发生了什么,需要什么技能和思维逻辑。站的角度再高一点,也应思考一个企业或组织究竟应该确定什么样的大数据战略方向。
2.第二层:技术层
这一层,指的是大数据技术,包括大数据平台技术和大数据分析技术等。技术是大数据价值体现的手段和前进的基石。这里讲的技术,重点是指大数据系统技术,涉及云计算、分布式处理技术、分布式存储技术等,术语Hadoop、Storm、Spark等就属于这个层面的概念。
那么,什么时候才需要关注这方面的内容呢?就是当公司的数据规模大得用单台计算机无法处理的时候,此时,就需要使用上百、上千台电脑来构建一个集群系统(大数据平台),利用大量的电脑共同来对海量数据进行存储、计算和分析。当然,如果公司的数据量很小,就没有必要去组建一个云平台。
3.第三层:应用层
应用层,这是最高一层,数据应用才是大数据的最终价值体现。
所有的数据,不管是大数据还是小数据,目的就是解决业务问题并最终达成商业目标。所以,任何大数据都应该以应用为导向(而不仅是以技术为导向)。例如,数据分析、数据挖掘、机器学习等都属于应用技术的范畴。这些应用技术,不管是大公司还是小公司都需要掌握。比如,商业智能(BI),就是利用企业大数据来指导企业决策,让决策更科学、管理更高效、营销更精准。
而智慧城市,其核心依然是大数据。所谓智慧城市,就是要使城市管理变得更加智慧。但如何使城市管理变得智慧呢?举一个很简单的例子,就拿城市街道上红绿灯的控制来说,目前在城市的很多路口都部署有红绿灯,但每个红绿灯的时长控制基本上是固定的,比如绿灯120秒后就变成了红灯。那么,为什么是120秒而不是100秒呢?这个固定的120秒是否合理呢?绿灯的时长,应该由哪些因素来决定才最合理?当然是人流量或车流量。人流量和车流量多,绿灯时间应该变得长一些;人流量和车流量少,绿灯时间应该变得短一些。然而,人流量和车流量会随着时间的改变而改变,比如上午8:00—9:00人流量和车流量会多一些,而10:00—11:00会少一些。所以,红绿灯时长设置,需要利用大数据对人流量和车流量进行分析,然后准确地探知该路口人流量和车流量的规律,进而设置合适的时长。
在上述应用场景中,所部署的传感器和摄像头只负责采集数据及传递控制信息,而真正的判断和决策则由大数据系统来进行。所以,智慧城市的核心依然是大数据的应用,把大数据用在提升城市公共设施的服务效率和服务水平上,就是智慧城市。
目前,大数据应用得最成熟的领域是市场营销领域,特别是精准营销。几乎所有公司都要面临市场和营销的竞争,而用大数据来提升营销的精准性则成为提升品牌竞争力的核心了。
应用层,是最能体现大数据价值的一层。要想使得数据产生应用价值,就得学会数据分析技术。这一层也需要用到技术,这里把它叫作应用技术,或者分析技术(分析方法、分析模型、机器学习、数据建模等),需要采用合适的数据分析方法和分析模型,以及合适的分析工具,提取数据中包含的有用业务信息,进而支撑业务决策,最终实现商业目标。