加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

官方调研重磅宣布,Pandas或将重构?

发布时间:2019-10-25 07:52:17 所属栏目:教程 来源:呆鸟
导读:为指引 Pandas 将来开拓偏向,Pandas 官方团队于 2019 年夏搞了一次调研,这次调研历时 15 天,共有 1250 条反馈数据。问卷数据生涯在 data 文件夹的 2019.csv.zip 文件里。 这里又学一招,原本 pandas 可以直接从压缩文件里读取数据文件,原文用的是 .gz

Pandas 增进新扩展范例的速率较慢。种别型(Categorical)是最常用的,另外,可空整数(Nullable Integer)与带时区的 Datetime 也很常用。

  1. sns.countplot(y='您常用的扩展数据范例是什么?',  
  2.               data=split_and_explode(df['您常用的扩展数据范例是什么?']),  
  3.               color='k').set(title="您常用的扩展数据范例是什么?",  
  4.                              ylabel="")  
  5. sns.despine(); 

官方调研重磅宣布,Pandas或将重构?

我们还提出了一些题目,用以相识用户最想要的成果。

  1. sns.countplot(y='您此刻最想看到的改造是什么?',  
  2.               data=df,  
  3.               color='k').set(title="您此刻最想看到的改造是什么?",  
  4.                              ylabel="")  
  5. sns.despine() 

官方调研重磅宣布,Pandas或将重构?

  1. common = (df[df.columns[df.columns.str.startswith("急切想要的成果")]]  
  2.           .rename(columns=lambda x: x.lstrip("急切想要的成果  [").rstrip(r"]")))  
  3. counts = (  
  4.     common.apply(pd.value_counts)  
  5.     .T.stack().reset_index()  
  6.     .rename(columns={'level_0': '题目', 'level_1': "重要水平", 0: "存眷数目"})  
  7. )  
  8. order = ["无关紧急", "还算有效", '至关重要']  
  9. g = (  
  10.     sns.FacetGrid(counts, col="题目", col_wrap=2,  
  11.                   aspect=1.5, sharex=False, height=3)  
  12.     .map(sns.barplot, "重要水平", "存眷数目", orderorder=order)  

官方调研重磅宣布,Pandas或将重构?

一眼就能看出来,优化大局限数据集的处理赏罚手段是各人最想要的,以后图还能视察出:

  1.  Pandas 文档应该加大力大举度推广处理赏罚大局限数据集的支持库,如 Dask, vaex、 modin。
  2.  从对原生字符串数据范例与更少的内部复制需求来看,优化内存服从也是要值得一做的工作。

紧接厥后的优化需求是整数缺失值,这个成果着实已经在 Pandas 0.24 时已经推出了,但还不是默认方法,与其余 pandas API 的兼容性也有待优化。

与 NumPy 对比,pandas 略显激进。在即将推出 1.0 版里,我们将废弃许多成果,并对许多 API 举办雷霆万钧的改变,亏得大部门人都能接管这样的改变。

  1. df['Pandas 能满意您的需求吗'].value_counts(normalize=True).apply(pct_format)  
  1. 是    94.89%  
  2. 否     5.11%  
  3. Name: Pandas 能满意您的需求吗, dtype: object 

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读