加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

50种常用的matplotlib可视化,再也不消担忧模子背着我乱跑了

发布时间:2019-01-18 05:44:51 所属栏目:教程 来源:机器之心
导读:数据说明与呆板进修中常必要大量的可视化,因此才气直观相识模子背地里都干了些什么。而在可视化中,matplotlib 算得上是最常用的器材,岂论是对数据有个预先的整体相识,照旧可视化猜测结果,matplotlib 都是不行缺失的模块。最近 Machine Learning Plus
副问题[/!--empirenews.page--]

数据说明与呆板进修中常必要大量的可视化,因此才气直观相识模子背地里都干了些什么。而在可视化中,matplotlib 算得上是最常用的器材,岂论是对数据有个预先的整体相识,照旧可视化猜测结果,matplotlib 都是不行缺失的模块。最近 Machine Learning Plus 的作者先容了 50 种最常用的 matplotlib 可视化图表,而本文扼要先容了这篇文章,具体的 50 种可视化必要查阅原文。

可视化图表

50 种可视化图原地点:

https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python

先容

该表格首要先容了 7 种差异的 matplotlib 可视化种别,读者可按照目标选择差异的图。譬喻,假如你想要绘制两个变量之间的相关,查察下面 Correlation 部门;可能假如你想展示某个变量的动态变革,查察下面的 Change 部门。

  • 一个瑰丽的图表应该:
  • 提供精确、有需求的信息,不歪曲究竟;
  • 计划简朴,获取时不会太艰辛;
  • 美感是为了支持这些信息,而不是为了袒护这些信息;
  • 不要提供过分富厚的信息与过分伟大的布局。

如下所示为 7 种差异范例的可视化图表:协相干性首要描写的是差异变量之间的彼此相关;毛病首要揭示出差异变量之间的不同;排序首要是一些有序的条形图、散点图或斜线图等;漫衍就是绘制概率与统计中的漫衍图,包罗离散型的直方图和持续型的概率密度漫衍图等。后头尚有变量的时序变革图和种别图等常见的可视化制图种别。

可视化

可视化

设置

在绘制这 50 种可视化图之前,我们必要设置一下依靠项以及通用设定,虽然后头有一些独立的美图会修改通用设定。假如读者看中了某种可视化图,那么用这些设置再加上对应的可视化代码就能嵌入到我们本身的项目中。

如下所示 pandas 与 numpy 首要用于读取和处理赏罚数据,matplotlib 与 seaborn 首要用于可视化数据。个中 seaborn 着实是 matplotlib 上的一个高级 API 封装,在大大都环境下行使 seaborn 就能做出很有吸引力的图,而行使 matplotlib 能建造更具特色的图。

  1. # !pip install brewer2mpl 
  2. import numpy as np 
  3. import pandas as pd 
  4. import matplotlib as mpl 
  5. import matplotlib.pyplot as plt 
  6. import seaborn as sns 
  7. import warnings; warnings.filterwarnings(action='once') 
  8.  
  9. large = 22; med = 16; small = 12 
  10. params = {'axes.titlesize': large, 
  11.           'legend.fontsize': med, 
  12.           'figure.figsize': (16, 10), 
  13.           'axes.labelsize': med, 
  14.           'axes.titlesize': med, 
  15.           'xtick.labelsize': med, 
  16.           'ytick.labelsize': med, 
  17.           'figure.titlesize': large} 
  18. plt.rcParams.update(params) 
  19. plt.style.use('seaborn-whitegrid') 
  20. sns.set_style("white") 
  21. %matplotlib inline 
  22.  
  23. # Version 
  24. print(mpl.__version__)  #> 3.0.0 
  25. print(sns.__version__)  #> 0.9.0 

制图表示

前面列出了 7 大类共 50 种差异的可视化图,但我们无法逐一先容,因此我们从协相干性、毛病、漫衍、时序变革和群组图中各选择了一个示例,它们能展示差异数据在差异环境下的可视化需求。

1. 相干图(Correllogram)

如有两种变量,且它们的值为离散的,那么二维相干图可以暗示两个变量全部也许组合之间的相干性。虽然假如是单变量,那么自身全部也许的组合也可以构成一个相干图:

  1. # Import Dataset 
  2. df = pd.read_csv("https://github.com/selva86/datasets/raw/master/mtcars.csv") 
  3.  
  4. # Plot 
  5. plt.figure(figsize=(12,10), dpi= 80) 
  6. sns.heatmap(df.corr(), xticklabels=df.corr().columns, yticklabels=df.corr().columns, cmap='RdYlGn', center=0, annot=True) 
  7.  
  8. # Decorations 
  9. plt.title('Correlogram of mtcars', fontsize=22) 
  10. plt.xticks(fontsize=12) 
  11. plt.yticks(fontsize=12) 
  12. plt.show() 

50种常用的matplotlib可视化,再也不消担忧模子背着我乱跑了

2. 面积图(Area Chart)

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读