加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-26 16:27:58 所属栏目:教程 来源:程序员ACE
导读:常碰着两类伴侣。一类是会爬虫但不知道怎样进一步做数据说明的,一类是泛泛用 Excel 做说明但不太会用 Python 说明的。假如和你很像,那下面这篇体系长文会很得当你,提议先保藏。 Excel 是数据说明中最常用的器材,本文通过 Python 与 excel 的成果比拟介

Excel 数据目次下提供了“筛选”成果,用于对数据表按差异的前提举办筛选。Python 中行使 loc 函数共同筛选前提来完成筛选成果。共同 sum 和 count 函数还能实现 excel 中 sumif 和 countif 函数的成果。

一文看懂怎么用 Python 做数据说明

行使“与”前提举办筛选,前提是年数大于 25 岁,而且都市为 beijing。筛选后只有一条数据切合要求。

  1. #行使“与”前提举办筛选 
  2. df_inner.loc[(df_inner['age'] > 25) & (df_inner['city'] == 'beijing'), ['id','city','age','category','gender']] 
一文看懂怎么用 Python 做数据说明

行使“或”前提举办筛选,年数大于 25 岁或都市为 beijing。筛选后有 6 条数据切合要求。

  1. #行使“或”前提筛选 
  2. df_inner.loc[(df_inner['age'] > 25) | (df_inner['city'] == 'beijing'), ['id','city','age','category','gender']].sort 
  3. (['age']) 
一文看懂怎么用 Python 做数据说明

在前面的代码后增进 price 字段以及 sum 函数,按筛选后的功效将 price 字段值举办求和,相等于 excel 中 sumifs 的成果。

  1. #对筛选后的数据按price字段举办求和 
  2. df_inner.loc[(df_inner['age'] > 25) | (df_inner['city'] == 'beijing'), 
  3. ['id','city','age','category','gender','price']].sort(['age']).price.sum() 
  4.   
  5. 19796  

行使“非”前提举办筛选,都市不便是 beijing。切合前提的数据有 4 条。将筛选功效按 id 罗列办排序。

  1. #行使“非”前提举办筛选 
  2. df_inner.loc[(df_inner['city'] != 'beijing'), ['id','city','age','category','gender']].sort(['id']) 
一文看懂怎么用 Python 做数据说明

在前面的代码后头增进 city 列,并行使 count 函数举办计数。相等于 excel 中的 countifs 函数的成果。

  1. #对筛选后的数据按city罗列办计数 
  2. df_inner.loc[(df_inner['city'] != 'beijing'), ['id','city','age','category','gender']].sort(['id']).city.count() 

尚有一种筛选的方法是用 query 函数。下面是详细的代码和筛选功效。

  1. #行使query函数举办筛选 
  2. df_inner.query('city == ["beijing", "shanghai"]') 
一文看懂怎么用 Python 做数据说明

在前面的代码后增进 price 字段和 sum 函数。对筛选后的 price 字段举办求和,相等于 excel 中的 sumifs 函数的成果。

  1. #对筛选后的功效按price举办求和 
  2. df_inner.query('city == ["beijing", "shanghai"]').price.sum() 
  3. 12230 

这是第三篇,先容第 7-9 部门的内容,数据汇总,数据统计,和数据输出。

一文看懂怎么用 Python 做数据说明

07 数据汇总

第七部门是对数据举办分类汇总,Excel 中行使分类汇总和数据透视可以按特定维度对数据举办汇总,python 中行使的首要函数是 groupby 和 pivot_table。下面别离先容这两个函数的行使要领。

分类汇总

Excel 的数据目次下提供了“分类汇总”成果,可以按指定的字段和汇总方法对数据表举办汇总。Python 中通过 Groupby 函数完成响应的操纵,并可以支持多级分类汇总。

一文看懂怎么用 Python 做数据说明

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读