- NoSQL数据库原理
- 侯宾
- 578字
- 2025-03-29 00:36:49
1.2.5 数据可视化
大数据带动了“用数据说话”的理念,即利用数据来展示状态、证明结论和辅助决策等。利用文字描述数据结果,存在不够直观、不易解读等问题,利用适合的图表来展示结果,则显得直观、生动且重点鲜明。
良好的数据可视化方案既需要对数据和业务进行深入理解,也需要样式、色彩甚至动画等的良好设计。可视化从形式上可以大致分为统计图形和主题图两类。对于统计图形,主要通过柱状图、散点图等方式展示数据和指标,目前存在很多工具可以简化实现,例如常用的MS Excel,Python语言的扩展包matplotlib,基于JavaScript的图表工具Echarts和D3.js等。对于主题图,则通过更加个性化的方式来展示数据态势和数据关系等。举一个简单的示例。
《中华人民共和国国民经济和社会发展第十三个五年规划纲要》(简称“十三五”规划)全文共有64000多个汉字,利用Python语言对其进行词频统计和分析,并利用图形展示分析结果,如图1-7所示。

图1-7 “十三五”规划中出现最频繁词语在“十二五”规划中出现的次数
对比图展示了“十三五”规划中出现最频繁词语在“十二五”规划中出现的次数,即展示了数据之间的关系。可以很直观地看出“创新”一词,在“十三五”规划中出现次数较多、词频排名靠前,但在“十二五”规划中则出现次数较少。
词云图则可以看作是一种主题图,展示的是数据的态势而非直观的数据结果。这种可视化方式可以增强数据结论的趣味性和冲击力,如图1-8所示。

图1-8 “十三五”规划纲要词云图