加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-26 16:27:58 所属栏目:教程 来源:程序员ACE
导读:常碰着两类伴侣。一类是会爬虫但不知道怎样进一步做数据说明的,一类是泛泛用 Excel 做说明但不太会用 Python 说明的。假如和你很像,那下面这篇体系长文会很得当你,提议先保藏。 Excel 是数据说明中最常用的器材,本文通过 Python 与 excel 的成果比拟介

行使 merge 函数对两个数据表举办归并,归并的方法为 inner,将两个数据表中共有的数据匹配到一路天生新的数据表。并定名为 df_inner。

  1. #数据表匹共同并,inner模式 
  2. df_inner=pd.merge(df,df1,how='inner') 
一文看懂怎么用 Python 做数据说明

除了 inner 方法以外,归并的方法尚有 left,right 和 outer 方法。这几种方法的不同在我其他的文章中有具体的声名和比拟。

  1. #其他数据表匹配模式 
  2. df_left=pd.merge(df,df1,how='left') 
  3. df_right=pd.merge(df,df1,how='right') 
  4. df_outer=pd.merge(df,df1,how='outer') 

配置索引列

完成数据表的归并后,我们对 df_inner 数据表配置索引列,索引列的成果许多,可以举办数据提取,汇总,也可以举办数据筛选等。

配置索引的函数为 set_index。

  1. #配置索引列 
  2. df_inner.set_index('id') 
一文看懂怎么用 Python 做数据说明

排序(按索引,按数值)

Excel 中可以通过数据目次下的排序按钮直接对数据表举办排序,较量简朴。Python 中必要行使 ort_values 函数和 sort_index 函数完成排序。

一文看懂怎么用 Python 做数据说明

在 python 中,既可以按索引对数据表举办排序,也可以看拟定列的数值举办排序。起首我们按 age 列顶用户的年数对数据表举办排序。

行使的函数为 sort_values。

  1. #按特定列的值排序 
  2. df_inner.sort_values(by=['age']) 
一文看懂怎么用 Python 做数据说明

Sort_index 函数用来将数据表按索引列的值举办排序。

  1. #按索引列排序 
  2. df_inner.sort_index() 
一文看懂怎么用 Python 做数据说明

数据分组

Excel 中可以通过 VLOOKUP 函数举办近似匹配来完成对数值的分组,可能行使“数据透视表”来完因素组。响应的 python 中行使 where 函数完成数据分组。

Where 函数用来对数据举办判定和分组,下面的代码中我们对 price 列的值举办判定,将切合前提的分为一组,不切合前提的分为另一组,并行使 group 字段举办标志。

  1. #假如price列的值>3000,group列表现high,不然表现low 
  2. df_inner['group'] = np.where(df_inner['price'] > 3000,'high','low') 
一文看懂怎么用 Python 做数据说明

除了 where 函数以外,还可以对多个字段的值举办判定后对数据举办分组,下面的代码中对 city 列便是 beijing 而且 price 列大于便是 4000 的数据标志为 1。

  1. #对复合多个前提的数据举办分组标志 
  2. df_inner.loc[(df_inner['city'] == 'beijing') & (df_inner['price'] >= 4000), 'sign']=1 
一文看懂怎么用 Python 做数据说明

数据排列

与数据分组相反的是对数值举办排列,Excel 中的数据目次下提供“排列”成果。在 python 中行使 split 函数实现排列。

一文看懂怎么用 Python 做数据说明

在数据表中 category 列中的数据包括有两个信息,前面的数字为种别 id,后头的字母为 size 值。中间以连字符举办毗连。我们行使 split 函数对这个字段举办拆分,并将拆分后的数据表匹配回原数据表中。

  1. #对category字段的值依次举办排列,并建设数据表,索引值为df_inner的索引列,列名称为category和size 
  2. pd.DataFrame((x.split('-') for x in df_inner['category']),index=df_inner.index,columns=['category','size']) 
一文看懂怎么用 Python 做数据说明
  1. #将完身排列后的数据表与原df_inner数据表举办匹配 
  2. df_inner=pd.merge(df_inner,split,right_index=True, left_index=True) 
一文看懂怎么用 Python 做数据说明

05 数据提取

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读