加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

技术人最不该忽视可视化数据分析!

发布时间:2019-09-03 17:56:11 所属栏目:教程 来源:阿里技术
导读:在这小我私人人都是数据说明师的期间,阿里的同窗险些都在参加数据的收罗、加工与斲丧。数据可视化作为毗连加工斲丧的重要一环,其质量至关重要。优越的可视化能促成卓越洞见,糟糕的内容则让全部的全力失去意义。本日,阿里高级产物司理沉砂为我们具体先容数

4. 颜色在上下文必要保持同一法式,譬喻之前的图用“绿色”代表香港,下面的图就不该该行使“黄色”可能“赤色”,“猜测数据”行使绿色,“现实数据”行使蓝色,保持秩序,减轻用户认知负荷;

5. 颜色能比其他视觉通道更能引起留意,也就意味着更轻易使人疲惫。确保你行使的颜色是“有序”的,五彩斑斓、明暗跳跃的色彩序列并不行取;

6. 计划之前,可以参照一些品牌计划手册,一样平常被叫做visual manual。阿里险些每个BU城市有相同的原料,可以找你们的UED同窗要。行使品牌色更轻易得到方针人群的青睐。可是也不是全部的品牌色都合用,行使前该当思索下结果。

7. 留意你行使颜色的场所,究竟上因为各国文化和宗教信奉的差异,沟通色彩在差异人群中的情绪性子很纷歧样。好比中国人喜好赤色,可是不见得西方国度喜好。尚有医院和金融业,也是典范的颜色敏感行业,给炒股的老板看图表不要用绿色作为主色调......

8. 放弃酷炫,我们看数据不是为了酷炫。

★ 统计图表选择保举

这个网上资料一抓一大把,选择图表前,着实更多的是要想清晰你的数据想通报的目标。数据说明纷纷咋咋,总结起来,不过乎4个目标:比拟、聚焦、归纳、演绎。基于这些初始目标出发,我们再选择实例化它。

下图是一张广为传播的图表提议:

技强人最不应忽视可视化数据说明!

四、筹备数据

4.1 为可视化调解数据布局

一样平常来讲,建造数据图表前,或多或少有一系列数据的收罗加工环节,以团体开拓同窗认识的ODPS为例,简朴来讲如下图流程所示:

技强人最不应忽视可视化数据说明!

大都数据客栈为了满意必然的计划类型、维护手段与结实性,不会应承数仓上层应用做定制化侵入计划,而种种应用所必要的数据名目不尽沟通,在可视化规模,为最后的图表建造,对数据举办一些调解非经常见,出格是行使BI软件举办制图,包罗不只限于以下调解:

★ 1.队列转换

好比为了举办数据比拟说明的簇状柱图,差异器材共同交互时,有差异的配置要领。必要对表中的队列数据举办机动转换,以切合软件要求。

技强人最不应忽视可视化数据说明!

★ 2.可读性转换

原表数据中,很也许只有"ID"、"XXX编码"、英文内容等特性数据,为了我们最后的可视化加工结果,为了图表易于解读,我们必要更多的特殊数据举办关联处理赏罚,好比:

  • 找到这张“究竟表”的关联“维表”,拿到ID背后的中文名称、姓名等信息;
  • 将英文翻译成对应中文,好比将male与female转换成“男”跟“女”;
  • 找到“短名称”、“昵称”等易于识此外数据;
  • 从时刻数据字段中转换出“季度”、“财年”、“周”、“买卖营业日”等契合营业场景的时刻范例字段。

★ 3.针对营业场景的转换

此类转换必要团结必然的详细场景,一样平常来讲,原始表只提供原始数据,详细场景提供数据转换法则,典范的譬喻:

  • 将“年数”分段,原始表只记任命户的生日,后期加工成“18~24岁”、“25~30岁”等范畴字段值,这类加工有助于用户解读和构建可视化内容。
  • 新顾主、老顾主。“新”与“老”都是跟着时刻推移的相对观念,不太会存储在数仓的原始数据表中,用户必要按照当前说明的时刻窗口,自助加工出新老顾主的界说字段。

4.2 剔除非常数据

原始数据中,难免混入非常数据,我们把错误数据(脏数据、测试数据)和不公道数据统称为非常数据。这些数据不剔除,会直接影响可视化最终的揭示结果,从而影响说明结果和决定效能。我们在建造图表前,必然要做这一环的处理赏罚。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读