加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

进修Python进程中,注重这8个小细节,让你在大数据规模事半功倍

发布时间:2018-09-22 18:28:17 所属栏目:大数据 来源:51CTO
导读:每小我私人城市碰着这个题目。 进修数据科学的进程,从来就不是一帆风顺的。在写代码的时辰,你是否也常常不得不重复搜刮统一个题目,统一个观念,乃至统一个语法布局的特征呢?对,你不是一小我私人在战斗。 我也一向在同样的环境里挣扎着。 固然碰着题目上 Stack

获取 Pandas 数据表工具的 shape 属性,你将得到一个元组,元组的第一个元素是数据表的行数,第二个元素是数据表的列数。想想 Python 里这两个元素的下标吧,前面一个是 0,后头一个是 1,对差池?以是对付 axis 参数,0 就是前面的行数,1 就是后头的列数,怎么样,好记吧?

06、 用 Concat、Merge 和 Join 来归并数据表

假如你认识 SQL,这几个观念对你来说就是小菜一碟。不外不管奈何,这几个函数从本质上来说不外就是归并多个数据表的差异方法罢了。虽然,要时候记取什么环境下该用哪个函数也不是一件轻易的事,以是,让我们一路再回首一下吧。

concat() 可以把一个或多个数据表按行(或列)的偏向简朴堆叠起来(看你传入的 axis 参数是 0 照旧 1 咯)。

I3MJNjJ

merge() 将会以用户指定的某个名字沟通的列为主键举办对齐,把两个或多个数据表融合到一路。

E7VvI3y

join()和 merge() 很相似,只不外 join() 是按数据表的索引举办对齐,而不是按某一个沟通的列。当某个表穷乏某个索引的时辰,对应的值为空(NaN)。

euARNjR

有必要的话,你还可以查阅Pandas 官方文档 ,相识更具体的语礼貌则和应用实例,认识一些你也许会遇到的非凡环境。

07、 Apply 函数

你可以把 apply() 看成是一个 map() 函数,只不外这个函数是专为 Pandas 的数据表和 series 工具打造的。对初学者来说,你可以把 series 工具想象成相同 NumPy 里的数组工具。它是一个一维带索引的数据表布局。

apply() 函数浸染是,将一个函数应用到某个数据表中你指定的一行或一列中的每一个元素上。是不是很利便?出格是当你必要对某一列的全部元素都举办名目化或修改的时辰,你就不消再一遍各处轮回啦!

这里就举几个简朴的例子,让各人认识一下根基的语礼貌则:

zA7Rvuy

08、 数据透视表(Pivot Tables)

最后也最重要的是数据透视表。假如你对微软的 Excel 有必然相识的话,你或许也用过(或听过)Excel 里的“数据透视表”成果。Pandas 里内建的 pivot_table() 函数的成果也差不多,它能帮你对一个数据表举办名目化,并输出一个像 Excel 事变表一样的表格。现实行使中,透视表将按照一个或多个键对数据举办分组统计,将函数传入参数 aggfunc 中,数据将会按你指定的函数举办统计,并将功效分派到表格中。

下面是几个 pivot_table() 的应用例子:

22YfUjM

总结

以上就是我在自学进程中常常碰着的几个题目,及其领略要领。就我小我私人来说,把这些观念写下来,并用尽也许简朴的语句描写它们,再分享给各人的整个进程,也让我越发深入的领略和把握这些技能。

最后,我但愿,或者往后你和数据科学中这些难以捉摸的要领、函数以及观念斗智斗勇的时辰,本日看到的一些常识能派上点用场。

相干阅读:

五个技能能力助力优化大数据说明

大数据Hadoop入门必要填的坑

大数据与数据发掘的相对绝对相关

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读