一文看懂怎么用Python做数据分析
行使 merge 函数对两个数据表举办归并,归并的方法为 inner,将两个数据表中共有的数据匹配到一路天生新的数据表。并定名为 df_inner。
![]() 除了 inner 方法以外,归并的方法尚有 left,right 和 outer 方法。这几种方法的不同在我其他的文章中有具体的声名和比拟。
配置索引列 完成数据表的归并后,我们对 df_inner 数据表配置索引列,索引列的成果许多,可以举办数据提取,汇总,也可以举办数据筛选等。 配置索引的函数为 set_index。
![]() 排序(按索引,按数值) Excel 中可以通过数据目次下的排序按钮直接对数据表举办排序,较量简朴。Python 中必要行使 ort_values 函数和 sort_index 函数完成排序。 ![]() 在 python 中,既可以按索引对数据表举办排序,也可以看拟定列的数值举办排序。起首我们按 age 列顶用户的年数对数据表举办排序。 行使的函数为 sort_values。
![]() Sort_index 函数用来将数据表按索引列的值举办排序。
![]() 数据分组 Excel 中可以通过 VLOOKUP 函数举办近似匹配来完成对数值的分组,可能行使“数据透视表”来完因素组。响应的 python 中行使 where 函数完成数据分组。 Where 函数用来对数据举办判定和分组,下面的代码中我们对 price 列的值举办判定,将切合前提的分为一组,不切合前提的分为另一组,并行使 group 字段举办标志。
![]() 除了 where 函数以外,还可以对多个字段的值举办判定后对数据举办分组,下面的代码中对 city 列便是 beijing 而且 price 列大于便是 4000 的数据标志为 1。
![]() 数据排列 与数据分组相反的是对数值举办排列,Excel 中的数据目次下提供“排列”成果。在 python 中行使 split 函数实现排列。 ![]() 在数据表中 category 列中的数据包括有两个信息,前面的数字为种别 id,后头的字母为 size 值。中间以连字符举办毗连。我们行使 split 函数对这个字段举办拆分,并将拆分后的数据表匹配回原数据表中。
![]()
![]() 05 数据提取 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |