技术人最不该忽视可视化数据分析!
副问题[/!--empirenews.page--]
在这个“大家都是数据说明师”的期间,阿里的同窗险些都在参加数据的收罗、加工与斲丧。数据可视化作为毗连“加工——斲丧”的重要一环,其质量至关重要。优越的可视化能促成卓越洞见,糟糕的内容则让全部的全力失去意义。本日,阿里高级产物司理沉砂为我们具体先容数据可视化器材以及怎样选择有用图表。 一、媒介 我地址的阿里企业数据化打点规模,数据可视化程度东倒西歪,尤其是在讲述PPT和报表建造环节...本日,不深度切磋详细营业题目,仅给出一些可视化通用提议。 通过文章你可以得到的提议:
二、数据可视化器材 在这里起首我想说下数据可视化追求的三个方针:精确、清楚、优雅。切合这三项的图表被称为高效的数据可视化: 精确:精准地反馈数据的特性信息(既不漏掉也不冗余,不造成读者疏漏&误读细节)清楚:获取图表特性信息的时刻越短越好优雅:雅观(不是酷炫)、和谐(沟通场景的图表遵循同一类型)。 除此之外,这三项的重要性也有相对序次:精确>清楚>优雅,原则上我们该只管往这三个方面靠拢。 题目来了,怎样挑选随手的器材辅佐告竣方针呢? 着实该当分环境来看,高效的数据可视化按照目标差别,大抵分为两种范例(来自Cole Nussbaumer Knaflic的视频采访): 表明型
试探型
各人在开始下手前,不妨先想一下本身是哪种意图,凡是环境下鱼和熊掌不行兼得,数据的机动调动和精致表达固然不抵牾,但很难分身。这就促成了我们可用的器材都有必然的方向性,简朴易上手的BI器材可以辅佐我们快速完成可视化,但有也许内容差能人意。一些专业的图表代码库理论上可以针对任何细节举办调解,可是服从和门槛存在明明劣势。 原则上器材没有孰优孰劣(究竟上许多器材两方面都做得很好),只是相对而言。笔者对常见种类的典范代表器材做了一个定性评估(小我私人意见): 这里我将Excel与Tableau高亮了出来,Tableau作为业界最闻名的BI软件,轻易上手,可视化结果也很是棒,有助于你说明试探数据。而Excel是一款被大大都人严峻低估的产物,它可以很利便实现种种图表微调,画出大度的数据图。 假如你没什么倾向性,Excel很适相助为你深入研究的第一款数据可视化器材。 三、选择有用的图表 3.1 可视化流程 抛开一些专业理论,简朴来讲,我们建造图表的步调分为3步: 1. 选摘要通报的数据信息2. 探求可视化要领3. 实现要领并完美细节 对付步调1,首要思量数据自己的信息与作者自身的洞察信息,列清晰这些信息,有助于你选择吻合的可视化要领。下文我会报告一些常用的要领论常识,但不是简朴给出你要选择柱形图or饼图。至于详细的图表选用指南可以Google一下。 3.2 视觉编码 起首看两张图: 因为行使了视觉编码(颜色)通报信息,人们更轻易领略原数据的特性了。 又好比平凡的柱形图,我们行使了柱子的“高度”和“相对位置”通报了两组数据信息,而柱形图每每比没举办编码的表格数据更轻易领略。 我们要来认识两个重要观念:“视觉编码”&“视觉通道”。假如把人类大脑看做是一个信息解码体系,那么可视化就是对信息(数据)的编码进程,信息通过视觉编码后,将内容通过眼睛通报至大脑,大脑解码信息并获取常识。 那么图形的视觉通道有这么多,该怎样选择吻合的视觉通道映射数据呢?这里必要通过数据的范例以及视觉通道的示意力举办综合判定,基本的学术理论有具体声名,这里我做一下简朴先容。 ★ 数据范例 一样平常我们数据分为“种别型”、“有序型“和“数值型”三类,苹果、香蕉属于种别,几月几号属于有序,利润5000属于数值。在许多可视化商用器材的观念中,将”有序、种别型“的数据称为维度,”数值型“的数据称之为怀抱(指标)。 维度和怀抱所合用的视觉通道是有庞大差此外,譬喻颜色的色调合用于维度,但不合用于怀抱。选择正确的视觉通道,令信息通报更有服从。 ★ 数据通道的示意力 在浙大传授陈为的著作《数据可视化》(陈为 沈则潜 陶煜波. 数据可视化[M]. 电子家产出书社, 2013)中,行使4个指标作为评判一个通道的示意力尺度:
深度领略这些尺度,有助于我们大白一些可视化图表修改提议背后的深条理缘故起因。 这组丈量数据回收科学的要领反应了一些建造履历的公道性,好比:
可疏散性汇报我们不能无穷制的行使多种视觉通道,每增进一种通道来映射数据,都必要考量对已有编码方法的影响,尤其是尺寸(size)出格影响其他视觉通道的结果。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |