加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

一行代码将Pandas加快4倍

发布时间:2020-01-14 17:51:04 所属栏目:移动互联 来源:站长网
导读:副问题#e# 固然Pandas的成果很是强盛,可是对付大数据集来说,确实是很慢的。 固然 panda 是 Python 顶用于数据处理赏罚的库,但它并不是真正为了速率而构建的。相识一下新的库 Modin,Modin 是为了漫衍式 panda 的计较来加快你的数据筹备而开拓的。 Pandas是处

the data with Modinimport modin.pandas as pds = time.time()df =  

pd.read_csv("esea_master_dmg_demos.part1.csv")e =  

time.time()print("Modin Loading Time = {}".format(e-s)) 

为了丈量速率,我导入了time模块,并在read_csv()之前和之后安排了一个time()。panda 将数据从 CSV 加载到内存必要 8.38 秒,而 Modin 必要 3.22 秒。这是 2.6 倍的加快。对付只修改 import 语句来说,这不算太寒酸!

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读