数据可视化进程不完全指南
所谓可视化,着实就是按照数据,用标尺、坐标系、各类视觉体现以及配景信息描写举办组合来示意数据。下图为可视化组件的“框架图”: ![]() a. 视觉体现 可视化最根基的情势就是简朴地将数据映射成图形,大脑可以在数字与图形间往返切换从而探求模式。以是我们必需选择吻合的视觉体现来担保数据的本质没有在大脑地往返切换中丢失,而且尽也许让大脑能轻松得到信息。 ![]() 从上到下,对人脑而言视觉体现清楚水平逐渐低落。 位置 行使位置作视觉体现时,大脑是在较量给定空间可能坐标系中数值的位置。它的上风在于占用空间会少于其他视觉体现,但劣势也很明明,我们很难去分辨每一个点代表什么。以是,应用位置作为视觉体现首要用于发明趋势纪律可能聚集漫衍纪律,散点图是位置作为视觉体现的典范运用。 长度 行使长度作为视觉体现,大脑的领略模式是条形越长,绝对值越大。利益很是明明人眼对付长度的“感觉”每每是最精确的。条形图是长度作为视觉体现的最常见图表。 角度 行使角度作为视觉体现,大脑的领略模式为两向量怎样相交,相交角度是否大于90度或180度。角度作为视觉体现的最常见图表式饼图。 偏向 行使偏向作为视觉体现,大脑的领略模式为坐标系中一个向量的偏向。在折线图中表现为斜率,在迁移图中表现为箭头所指偏向。 外形 行使外形作为视觉体现,对大脑而言每每代表着差异的工具可能种别。可用于在散点图中区分差异聚集。 面积/体积 行使面积/体积作为视觉体现,面积大则绝对值大。必要留意的一点是,用面积表现2倍相关时,应该是面积乘倍而不是边长乘倍。 色相与饱和度 差异的颜色凡是用来暗示分类数据,每个颜色代表一个分组;差异的色相通畅用来暗示持续数据,常见模式是颜色越深代表数值越大。 b. 坐标系
c. 标尺 标尺的重要性在于与坐标系一路抉择了图形的投影方法。
d. 配景信息 配景信息,所指即我们在领略 DATA 通过 “5W1H” 法答复的题目。包罗数据配景与营业配景。 根基的原则是,假如信息在图形元素中没有获得奇妙地体现,我们久必要通过标注坐标轴、注明怀抱单元,添加特殊声名等要领来汇报读者图表中每一个数据及其视觉体当代表什么。 2. 美化,让可视化更为清楚 在研究阶段,我们重点实行从各类差异的角度切入去调查数据,没有过多地思量表达是否精确,图形是否雅观。 但,当我们盼望到筹备将说明陈诉泛起给营业方或率领时,必需对可视化图表举办优化使其是清楚易读的。不然,我们很也许要挨批了。 ![]() 上图为,数据可视化与实际天下的毗连相关。清楚易读的可视化必然是在尽也许地镌汰读者从可视化图表领略转换为实际天下的难度。而加强数据较量、公道注解引导、镌汰读者领略步调是告竣这一目标的良能本领,下面为各人具体睁开先容: a. 加强数据较量,低落大脑举办信息较量的难度 当我们在阅读可视化图表时,我们的大脑会天然地举办较量从而获守信息。加强数据较量,可有用低落信息较量难度,使大脑更轻易抓住要害信息,镌汰模凌两可,使大脑获守信息更具确定性。 成立视觉条理,用精明的颜色突出数据,淡化其他元素 有条理感的图表更易读,用户能更快地抓住图表中的重点信息。相反,扁平图则穷乏活动感,读者相对较难领略。成立视觉条理,我们可以用精明的颜色突出表现数据,并淡化其他元素使其作为配景,淡化元素可回收浅色系或虚线。 散点图的方针是为探求纪律与模式,拟合数据线是下图的要害。弱化数据点、强化拟合趋势线使其形成光鲜的2个条理。 ![]() 高亮表现重点内容 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |