加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

还在抱怨Pandas运行速度慢?这几个方法会颠覆你的看法

发布时间:2019-01-04 07:02:11 所属栏目:教程 来源:知乎
导读:媒介 当各人谈到数据说明时,说起最多的说话就是Python和SQL。Python之以是得当数据说明,是由于它有许多第三方强盛的库来帮忙,pandas就是个中之一。pandas的文档中是这样描写的: 快速,机动,富有示意力的数据布局,旨在使相关或标志数据的行使既简朴又

在这一点上,如故有机能晋升,但它本质上变得越发边沿化。行使Pandas,它可以辅佐维持“条理布局”,假如你乐意,可以像在此处一样举办批量计较,这些凡是排名从最快到最慢(最机动到最不机动):

  1. 行使向量化操纵:没有for轮回的Pandas要领和函数。
  2. 将.apply要领:与可挪用要领一路行使。
  3. 行使.itertuples:从Python的荟萃模块迭代DataFrame行作为namedTuples。
  4. 行使.iterrows:迭代DataFrame行作为(index,Series)对。固然Pandas系列是一种机动的数据布局,但将每一行构建到一个系列中然后会见它也许会很昂贵。
  5. 行使“element-by-element”轮回:行使df.loc或df.iloc一次更新一个单位格或行。

还在诉苦Pandas运行速率慢?这几个要了解倾覆你的观点

行使HDFStore防备从头处理赏罚

此刻你已经相识了Pandas中的加快数据流程,接着让我们切磋怎样停止与最近集成到Pandas中的HDFStore一路从头处理赏罚时刻。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读