加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

大数据分析师学习入门,10个数据可视化技巧

发布时间:2019-10-14 14:12:08 所属栏目:教程 来源:加米谷大数据
导读:我必需对你说真话:当我进修数据科学时,我完全低估了画图的重要性。没错,当时统统都一团糟:我从新开始进修 python、认识了全部也许的算法、领略了全部对象背后的数学道理,可是我的画图能力很糟糕。 为什么会这样?我们老是在做同样的工作。你知道的:pa

假设此刻我们行使 subplots,我们有几个图表,个中一个是位于 ax[0] 位置的 seaborn 的 barplot。在这种环境下,在条形图中每个条上获取注释的代码要伟大一些,但很轻易实现:

  1. for p in ax[0].patches: 
  2.  
  3. ax[0].annotate(“%.2f” % p.get_height(), (p.get_x() + p.get_width() / 2., p.get_height()),  
  4. ha=’center’, va=’center’, fontsize=12, color=’white’, xytext=(0, -10), textcoords=’offset points’ 

对付图表中的每个「patch」或条形图,直到「ha」参数获取条形图的位置、高度和宽度为止,以便将值注开释在正确的位置。以相同的方法,我们还可以指定注释的对齐方法、字体巨细和颜色,而「xytext」参数指示我们是否要在某个 x 或 y 偏向移动注释。在上面的例子中,我们将在 y 轴上向下移动注释文本。

5.行使差异颜色区分标签

在某些环境下,在一段时刻或一系列的值中,我们也许丈量了差异种类的物体。譬喻,假设我们丈量 6 个月以来狗和猫的体重。在尝试竣事时,我们想画出每只动物的体重,别离用蓝色和赤色区分猫和狗。为此,在大大都传统画图中,我们可以行使参数「hue」为元素提供颜色列表。

举个例子:

  1. weight = [5,4,8,2,6,2] month = [‘febrero’,’enero’,’abril’,’junio’,’marzo’,’mayo’] animal_type = [‘dog’,’cat’,’cat’,’dog’,’dog’,’dog’] hue = [‘blue’,’red’,’red’,’blue’,’blue’,’blue’] sns.scatterplot(x=month, y=weight, hue=hue); 
大数据说明师进修入门,10个数据可视化能力

6.改变散点图中点的巨细

行使上面的沟通示例,我们还可以行使从 1 到 5 的刻度暗示图表中动物的巨细。将此特殊指标添加到画图中的一个好选择是修改散点图的巨细,通过「size」参数将巨细指定给新的附加向量,并行使「size」调解它们之间的相关:

  1. size = [2,3,5,1,4,1]  
  2. sns.scatterplot(x=month, y=weight, hue=hue, size=size, sizes= (50,300)); 
大数据说明师进修入门,10个数据可视化能力

趁便说一下,假如如上图所示,图例使画图更难阅读,你可以将「legend」参数配置为 false。

7.在数据中包括一行以表现阈值

在实际糊口中的很多环境下,数据高于或低于某个阈值也许是题目提醒信号或错误告诫。假如要在画图中清晰地表现,可以行使以下呼吁添加一行:

  1. ax[0].axvline(32,0,c='r') 

加在那边?

  • ax[0] 将是我们要在个中插入行的图表
  • 32 将是绘制线的值
  • c = 'r' 暗示图表将是赤色的

假如我们行使的是 subplots,那么将 axvline 添加到响应的 axe 就很简朴,如上面的示例所示。可是,假如不行使 subplots,则应执行以下操纵:

  1. g=sns.scatterplot(x=month,y=weight,hue=hue,legend=false)  
  2. g.axvline(2,c='r')  
  3. plt.show() 
大数据说明师进修入门,10个数据可视化能力

8.多 Y 轴画图

这大噶?鲱简朴,但也是最有效的能力之一。

偶然我们只必要在图表中添加更多信息,除了在画图的右 y 轴上添加新的怀抱之外,没有其他要领可以绕过它:

  1. ax2=ax[0].twinx() 

此刻可以添加任何要将「ax」参数指向「ax2」的图表

  1. sns.lineplot(x=month, y=average_animal_weight, ax=ax2 

请留意,这个例子再次假设你行使的是 subplots。假如没有,你应该遵循与前一点沟通的逻辑:

  1. g = sns.scatterplot(x=month, y=weight, hue=hue, legend=False)  
  2. g.axvline(2,c=’r’)  
  3. ax2 = g.twinx()  
  4. sns.lineplot(x=month, y=average_animal_weight, ax=ax2, c=’y’)  
  5. plt.show() 
大数据说明师进修入门,10个数据可视化能力

请留意,要使其事变,你应该为两个图表中的 x 轴配置始终沟通的数据。不然,它们就不匹配了。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读