加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-26 16:27:58 所属栏目:教程 来源:程序员ACE
导读:常碰着两类伴侣。一类是会爬虫但不知道怎样进一步做数据说明的,一类是泛泛用 Excel 做说明但不太会用 Python 说明的。假如和你很像,那下面这篇体系长文会很得当你,提议先保藏。 Excel 是数据说明中最常用的器材,本文通过 Python 与 excel 的成果比拟介

Colums 函数用来单独查察数据表中的列名称。

  1. #查察列名称 
  2. df.columns 
  3.   
  4. Index(['id', 'date', 'city', 'category', 'age', 'price'], dtype='object') 

查察前 10 行数据

Head 函数用来查察数据表中的前 N 行数据,默认 head()表现前 10 行数据,可以本身配置参数值来确定查察的行数。下面的代码中配置查察前 3 行的数据。

  1. #查察前3行数据 
  2. df.head(3) 
一文看懂怎么用 Python 做数据说明

查察后 10 行数据

Tail 行数与 head 函数相反,用来查察数据表中后 N 行的数据,默认 tail()表现后 10 行数据,可以本身配置参数值来确定查察的行数。下面的代码中配置查察后 3 行的数据。

  1. #查察最后3行 
  2. df.tail(3) 
一文看懂怎么用 Python 做数据说明

03 数据表洗濯

第三部门是对数据表中的题目举办洗濯。首要内容包罗对空值,巨细写题目,数据名目和一再值的处理赏罚。这里不包括对数据间的逻辑验证。

处理赏罚空值(删除或添补)

我们在建设数据表的时辰在 price 字段中存心配置了几个 NA 值。对付空值的处理赏罚方法有许多种,可以直接删除包括空值的数据,也可以对空值举办添补,好比用 0 添补可能用均值添补。还可以按照差异字段的逻辑对空值举办推算。

Excel 中可以通过“查找和替代”成果对空值举办处理赏罚,将空值同一替代为 0 或均值。也可以通过“定位”空值来实现。

一文看懂怎么用 Python 做数据说明

Python 中处理赏罚空值的要领较量机动,可以行使 Dropna 函数用来删除数据表中包括空值的数据,也可以行使 fillna 函数对空值举办添补。下面的代码和功效中可以看到行使 dropna 函数后,包括 NA 值的两个字段已经不见了。返回的是一个不包括空值的数据表。

  1. #删除数据表中含有空值的行 
  2. df.dropna(how='any') 
一文看懂怎么用 Python 做数据说明

除此之外也可以行使数字对空值举办添补,下面的代码行使 fillna 函数对空值字段填凑数字 0。

  1. #行使数字0填凑数据表中空值 
  2. df.fillna(value=0) 

我们选择添补的方法来处理赏罚空值,行使 price 列的均值来添补 NA 字段,同样行使 fillna 函数,在要添补的数值中行使 mean 函数先计较 price 列当前的均值,然后行使这个均值对 NA 举办填

充。可以看到两个空值字段表现为 3299.5

  1. #行使price均值对NA举办添补 
  2. df['price'].fillna(df['price'].mean()) 
  3.   
  4. 0    1200.0 
  5. 1    3299.5 
  6. 2    2133.0 
  7. 3    5433.0 
  8. 4    3299.5 
  9. 5    4432.0 
  10. Name: price, dtype: float64 
一文看懂怎么用 Python 做数据说明

整理空格

除了空值,字符中的空格也是数据洗濯中一个常见的题目,下面是破除字符中空格的代码。

  1. #破除city字段中的字符空格 
  2. df['city']=df['city'].map(str.strip) 

巨细写转换

在英笔墨段中,字母的巨细写不同一也是一个常见的题目。Excel 中有 UPPER,LOWER 等函数,python 中也有同名函数用来办理巨细写的题目。在数据表的 city 列中就存在这样的题目。我们将 city 列的全部字母转换为小写。下面是详细的代码和功效。

  1. #city列巨细写转换   
  2. df['city']=df['city'].str.lower() 
一文看懂怎么用 Python 做数据说明

变动数据名目

Excel 中通过“配置单位格名目”成果可以修改数据名目。Python 中通过 astype 函数用来修改数据名目。

一文看懂怎么用 Python 做数据说明

Python 中 dtype 是查察数据名目标函数,与之对应的是 astype 函数,用来变动数据名目。下面的代码中将 price 字段的值修改为 int 名目。

  1. #变动数据名目 
  2. df['price'].astype('int') 
  3.   
  4. 0    1200 
  5. 1    3299 
  6. 2    2133 
  7. 3    5433 
  8. 4    3299 
  9. 5    4432 
  10. Name: price, dtype: int32 

变动列名称

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读