这8个Python小细节,让你在大数据规模如鱼得水 -
为了快速利便地天生 numpy 的数组,你必然得认识 arange() 和 linspace() 这两个函数。这两个函数别离有本身的特定用法,不外对我们来说,它们都能很好地天生 numpy 数组(而不是用 range() ),这在数据科学的说明事变上然则相等好用的。 arange() 函数凭证指定的步长返回一个等差数列。除开始和竣事值之外,你还可以自界说步长和数据范例。请留意,给定的竣事值参数是不会被包括在功效内的。 输出的是一个数组工具: array([3, 5]) linspace() 函数的用法也很相同,不外有一点小小的差异。 linspace() 返回的是将给定区间举办多少中分往后的中分点构成的数列。以是你传入的参数包罗开始值、竣事值,以及详细几多中分。linspace() 将这个区间举办中分后,把开始值、竣事值和每个中分点都放进一个 NumPy 数组里。这在做数据可视化以及绘制坐标轴的时辰都很有效。 输出的是一个数组工具: array([ 2.0, 2.25, 2.5, 2.75, 3.0]) 05、Pandas 中坐标轴(axis 参数)的意义 在 Pandas 里要筛掉某一列,或是在 NumPy 矩阵里要对数据求和的时辰,你也许已经碰着过这个 axis 参数的题目。假如你还没见过,那提前相识一下也无妨。好比,对某个 Pandas 表这样处理赏罚: 在我真正领略之前,我根基上每次要用到 drop 的时辰,都得去从头查询一下哪个 axis 的值对应的是哪个,多到我本身都数不清了。正如上面这个示例,你或许已经看出,假如要处理赏罚列,axis 要设成 1,假如处理赏罚行,axis 要设成 0,对吧。但这是为什么呢?我最喜好的一个表明(可能是我怎样记着这一点的)是这样的: 获取 Pandas 数据表工具的 shape 属性,你将得到一个元组,元组的第一个元素是数据表的行数,第二个元素是数据表的列数。想想 Python 里这两个元素的下标吧,前面一个是 0,后头一个是 1,对差池?以是对付 axis 参数,0 就是前面的行数,1 就是后头的列数,怎么样,好记吧? 06、用 Concat、Merge 和 Join 来归并数据表 假如你认识 SQL,这几个观念对你来说就是小菜一碟。不外不管奈何,这几个函数从本质上来说不外就是归并多个数据表的差异方法罢了。虽然,要时候记取什么环境下该用哪个函数也不是一件轻易的事,以是,让我们一路再回首一下吧。 concat() 可以把一个或多个数据表按行(或列)的偏向简朴堆叠起来(看你传入的 axis 参数是 0 照旧 1 咯)。 merge() 将会以用户指定的某个名字沟通的列为主键举办对齐,把两个或多个数据表融合到一路。 join()和 merge() 很相似,只不外 join() 是按数据表的索引举办对齐,而不是按某一个沟通的列。当某个表穷乏某个索引的时辰,对应的值为空(NaN)。 有必要的话,你还可以查阅Pandas 官方文档 ,相识更具体的语礼貌则和应用实例,认识一些你也许会遇到的非凡环境。 07、Apply 函数 你可以把 apply() 看成是一个 map() 函数,只不外这个函数是专为 Pandas 的数据表和 series 工具打造的。对初学者来说,你可以把 series 工具想象成相同 NumPy 里的数组工具。它是一个一维带索引的数据表布局。 apply() 函数浸染是,将一个函数应用到某个数据表中你指定的一行或一列中的每一个元素上。是不是很利便?出格是当你必要对某一列的全部元素都举办名目化或修改的时辰,你就不消再一遍各处轮回啦! 这里就举几个简朴的例子,让各人认识一下根基的语礼貌则: 08、数据透视表(Pivot Tables) (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |