加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-26 16:27:58 所属栏目:教程 来源:程序员ACE
导读:常碰着两类伴侣。一类是会爬虫但不知道怎样进一步做数据说明的,一类是泛泛用 Excel 做说明但不太会用 Python 说明的。假如和你很像,那下面这篇体系长文会很得当你,提议先保藏。 Excel 是数据说明中最常用的器材,本文通过 Python 与 excel 的成果比拟介

Excel 中通过选中单位格并查察开始菜单中的数值范例来判定数据的名目。Python 中行使 dtypes 函数来返回数据名目。

一文看懂怎么用 Python 做数据说明

Dtypes 是一个查察数据名目标函数,可以一次性查察数据表中全部数据的名目,也可以指定一列来单独查察。

  1. #查察数据表各列名目 
  2. df.dtypes 
  3.   
  4. id                   int64 
  5. date        datetime64[ns] 
  6. city                object 
  7. category            object 
  8. age                  int64 
  9. price              float64 
  10. dtype: object 
  11. #查察单列名目 
  12. df['B'].dtype 
  13.   
  14. dtype('int64') 

查察空值

Excel 中查察空值的要领是行使“定位前提”成果对数据表中的空值举办定位。“定位前提”在“开始”目次下的“查找和选择”目次中。

一文看懂怎么用 Python 做数据说明

Isnull 是 Python 中检讨空值的函数,返回的功效是逻辑值,包括空值返回 True,不包括则返回 False。可以对整个数据表举办搜查,也可以单独对某一罗列办空值搜查。

  1. #搜查数据空值 
  2. df.isnull() 
一文看懂怎么用 Python 做数据说明
  1. #搜查特定列空值 
  2. df['price'].isnull() 
  3.   
  4. 0    False 
  5. 1     True 
  6. 2    False 
  7. 3    False 
  8. 4     True 
  9. 5    False 
  10. Name: price, dtype: bool 

查察独一值

Excel 中查察独一值的要领是行使“前提名目”对独一值举办颜色标志。Python 中行使 unique 函数查察独一值。

一文看懂怎么用 Python 做数据说明

Unique 是查察独一值的函数,只能对数据表中的特定罗列办搜查。下面是代码,返回的功效是该列中的独一值。相同与 Excel 中删除一再项后的功效。

  1. #查察city列中的独一值 
  2. df['city'].unique() 
  3.   
  4. array(['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '], dtype=object) 

查察数据表数值

Python 中的 Values 函数用来查察数据表中的数值。以数组的情势返回,不包括表头信息。

  1. #查察数据表的值 
  2. df.values 
  3.   
  4. array([[1001, Timestamp('2013-01-02 00:00:00'), 'Beijing ', '100-A', 23, 
  5.         1200.0], 
  6.        [1002, Timestamp('2013-01-03 00:00:00'), 'SH', '100-B', 44, nan], 
  7.        [1003, Timestamp('2013-01-04 00:00:00'), ' guangzhou ', '110-A', 54, 
  8.         2133.0], 
  9.        [1004, Timestamp('2013-01-05 00:00:00'), 'Shenzhen', '110-C', 32, 
  10.         5433.0], 
  11.        [1005, Timestamp('2013-01-06 00:00:00'), 'shanghai', '210-A', 34, 
  12.         nan], 
  13.        [1006, Timestamp('2013-01-07 00:00:00'), 'BEIJING ', '130-F', 32, 
  14.         4432.0]], dtype=object) 

查察列名称

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读