加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-26 16:27:58 所属栏目:教程 来源:程序员ACE
导读:常碰着两类伴侣。一类是会爬虫但不知道怎样进一步做数据说明的,一类是泛泛用 Excel 做说明但不太会用 Python 说明的。假如和你很像,那下面这篇体系长文会很得当你,提议先保藏。 Excel 是数据说明中最常用的器材,本文通过 Python 与 excel 的成果比拟介

在前面的基本上增进第二个列名称,漫衍对 city 和 size 两个字段举办计数汇总。

  1. #对两个字段举办汇总计数 
  2. df_inner.groupby(['city','size'])['id'].count() 
  3. city size 
  4. beijing A 1 
  5. F 1 
  6. guangzhou A 1 
  7. shanghai A 1 
  8. B 1 
  9. shenzhen C 1 
  10. Name: id, dtype: int64 
  11.  
  12. Read more: http://bluewhale.cc/2017-04-21/use-python-for-data-analysis-like-excel-3.html#ixzz5rvDL89Gn 

除了计数和求和外,还可以对汇总后的数据同时按多个维度举办计较,下面的代码中按都市对 price 字段举办汇总,并别离计较 price 的数目,总金额僻静均金额。

  1. #对city字段举办汇总并计较price的合计和均值。 
  2. df_inner.groupby('city')['price'].agg([len,np.sum, np.mean]) 
一文看懂怎么用 Python 做数据说明

数据透视

Excel 中的插入目次下提供“数据透视表”成果对数据表按特定维度举办汇总。Python 中也提供了数据透视表成果。通过 pivot_table 函数实现同样的结果。

一文看懂怎么用 Python 做数据说明

数据透视表也是常用的一种数据分类汇总方法,而且成果上比 groupby 要强盛一些。下面的代码中设定 city 为行字段,size 为列字段,price 为值字段。别离计较 price 的数目和金额而且按行与罗列办汇总。

  1. #数据透视表 
  2. pd.pivot_table(df_inner,index=["city"],values=["price"],columns=["size"],aggfunc=[len,np.sum],fill_value=0,margins=True) 
一文看懂怎么用 Python 做数据说明

08 数据统计

第九部门为数据统计,这里首要先容数据采样,尺度差,协方差和相相关数的行使要领。

数据采样

Excel 的数据说明成果中提供了数据抽样的成果,如下图所示。Python 通过 sample 函数完成数据采样。

一文看懂怎么用 Python 做数据说明

Sample 是举办数据采样的函数,配置 n 的数目就可以了。函数自动返回参加的功效。

  1. #简朴的数据采样 
  2. df_inner.sample(n=3) 
一文看懂怎么用 Python 做数据说明

Weights 参数是采样的权重,通过配置差异的权重可以变动采样的功效,权重高的数据将更有但愿被选中。这里手动配置 6 条数据的权重值。将前面 4 个配置为 0,后头两个体离配置为 0.5。

  1. #手动配置采样权重 
  2. weights = [0, 0, 0, 0, 0.5, 0.5] 
  3. df_inner.sample(n=2, weights=weights) 
  4.  
  5. Read more: http://bluewhale.cc/2017-04-21/use-python-for-data-analysis-like-excel-3.html#ixzz5rvCvwN2y 
一文看懂怎么用 Python 做数据说明

从采样功效中可以看出,后两条权重高的数据被选中。

一文看懂怎么用 Python 做数据说明

Sample 函数中尚有一个参数 replace,用来配置采样后是否放回。

  1. #采样后不放回 
  2. df_inner.sample(n=6, replace=False) 
一文看懂怎么用 Python 做数据说明
  1. #采样后放回 
  2. df_inner.sample(n=6, replace=True) 
一文看懂怎么用 Python 做数据说明

描写统计

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读