加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

数据可视化进程不完全指南

发布时间:2018-09-10 04:48:40 所属栏目:教程 来源:钟家福
导读:9月15日技能沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖切磋精准运维! 数据集如同天下汗青状态的快照,能辅佐我们捕获不绝变革的事物,而数据可视化则是将伟大数据以简朴的情势展示给用户的良能本领(或前言)。团结小我私人信中所学与现实事变所学,对数
副问题[/!--empirenews.page--] 9月15日技能沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖切磋精准运维!

数据集如同天下汗青状态的快照,能辅佐我们捕获不绝变革的事物,而数据可视化则是将伟大数据以简朴的情势展示给用户的良能本领(或前言)。团结小我私人信中所学与现实事变所学,对数据可视化进程做了一些总结形本钱文供列位看客"消遣"。

数据可视化进程不完全指南

小我私人觉得数据可视化处事贸易说明的经典进程可浓缩为:从营业与数据出发,颠末数据说明与可视化形成陈诉,再跟踪营业调解回到营业,是个经典闭环。

数据可视化进程不完全指南

本文主题为数据可视化,将重点讲授与数据可视化相干的环节,也即上图中蓝色的环节。

一、领略 DATA

举办 DATA 试探前,我们需先团结营业去领略 DATA,这里保举运用 5W1H 法,也即在拿到数据后问自身以下几个题目:

  • Who: 是谁汇集了此数据? 在企业内也许更存眷是来自哪个营业体系。
  • How: 是怎样收罗的此数据? 尽也许去相识具体的收罗法则,收罗法则是影响后续说明的重要身分之一。如:数据来自埋点,来自后端照旧前端差别很大,来自后端则多是及时的,来自前端则需更近一步相识数据在什么收集状态会上传、无收集状态下又是如那里理赏罚的。
  • What: 是关于什么营业什么事? 数据所描写的营业主题。
  • Why: 为什么汇集此数据? 我们想从数据中相识什么,着实也就是我们此次说明的方针。
  • When: 是何时段内的营业数据?
  • Where: 是何区域范畴内的营业数据?

通过答复以上几个题目,我们能快速相识:数据来历是什么?它的可信度有几多?它在描写何时产生的奈何的营业(题目)?我们为什么要汇集此数据?等等。从而快速相识数据与营业开展近一步的试探与说明。

二、试探 DATA

之前的文章中,我们曾经分享过怎样快速地试探 DATA ( 「怎样成为一名数据说明师:数据的起源认知」 ),个中有谈到怎样通过诸如均匀数/中位数/众数等描写统计、通过相相关数统计快速试探 DATA 的要领。本文首要讲授可视化,以是将从可视化的角度去先容怎样通过可视化要领举办数据试探。

在试探、研究阶段,更重要的是要从差异的角度去调查数据,并慢慢深入到对营业更重要的工作上。在这个阶段,我们不必去过多地追求图表美化,而应该尽也许快速地实行更多个角度。下面我们按照数据/主题范例的差别分隔叙述:

1. 分类数据的试探

在营业说明中,我们经常将人群、所在和其他事物举办分类,分类能为我们带来布局化,能让我们快速把握信息。

在分类数据可视化中,我们最多行使的是条形图;但当试图调查分类中的比例时,我们也许也会选择饼图、瀑布图;当不只体谅一级分类还体谅子分类时辰,我们也许会选择树形图。通过对分类数据的可视化,我们能快速地获取最大、最小值,同时也能利便地相识到数据集的范畴,由于它在必然水平上还反应了数据漫衍特性。下图展示了可视化分类数据的一些选择:

a. 条形图,用长度作为视觉体现,利于直接较量。

数据可视化进程不完全指南

b. 行使饼图、柱形堆叠图、瀑布图等,能在分类数据中比拟占比环境。

数据可视化进程不完全指南

c. 行使树形图,能在展示一级分类的子类统计,可实现维度的又一层下钻。

数据可视化进程不完全指南

2. 时序数据的试探

营业说明中,我们经常体谅事物跟着时刻的变革趋势,以及数据随时刻变革的纪律(时刻周期下的纪律)。以是,对时序数据的试探,首要有两种模式:其一为跟着时刻线索向右延长的时序图,诸如:折线图、会萃面积图等;其二为按照时刻周期,统计汇总的柱形图、日历图、径向图等。

a. 用于调查事物随时刻线索变革的试探。

数据可视化进程不完全指南

b. 用于发明事物随时刻周期变革纪律的试探。

数据可视化进程不完全指南
数据可视化进程不完全指南

3. 空间数据的试探

空间数据试探首要是祈望揭示可能发明营业变乱在区域漫衍上的纪律,即地区模式。环球数据凡是凭证国度分类,而海内数据则凭证省份去分类,对付省份数据则凭证市、区分类,以此类推,慢慢向细分条理下钻。空间数据试探最常用为等值热力求,如下:

数据可视化进程不完全指南

4. 多元变量的试探

数据试探进程中,偶然辰我们必要比拟多个个别多个变量,从而探求数据个别间的差别可能数据变量间的相关。在这种环境下,我们保举行使散点图、气泡图,可能将多个简朴图表组合天生“图矩阵”,通过比拟“图矩阵”来举办多元变量的试探。个中,散点图友善泡图得当变量相对较少的场景,对付变量5个及以上的场景我们更多地是保举“图矩阵”。

a. 变量相对较少(5个以下)的场景我们回收散点图与气泡图。

数据可视化进程不完全指南

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读