一文看懂怎么用Python做数据分析
Colums 函数用来单独查察数据表中的列名称。
查察前 10 行数据 Head 函数用来查察数据表中的前 N 行数据,默认 head()表现前 10 行数据,可以本身配置参数值来确定查察的行数。下面的代码中配置查察前 3 行的数据。
![]() 查察后 10 行数据 Tail 行数与 head 函数相反,用来查察数据表中后 N 行的数据,默认 tail()表现后 10 行数据,可以本身配置参数值来确定查察的行数。下面的代码中配置查察后 3 行的数据。
![]() 03 数据表洗濯 第三部门是对数据表中的题目举办洗濯。首要内容包罗对空值,巨细写题目,数据名目和一再值的处理赏罚。这里不包括对数据间的逻辑验证。 处理赏罚空值(删除或添补) 我们在建设数据表的时辰在 price 字段中存心配置了几个 NA 值。对付空值的处理赏罚方法有许多种,可以直接删除包括空值的数据,也可以对空值举办添补,好比用 0 添补可能用均值添补。还可以按照差异字段的逻辑对空值举办推算。 Excel 中可以通过“查找和替代”成果对空值举办处理赏罚,将空值同一替代为 0 或均值。也可以通过“定位”空值来实现。 ![]() Python 中处理赏罚空值的要领较量机动,可以行使 Dropna 函数用来删除数据表中包括空值的数据,也可以行使 fillna 函数对空值举办添补。下面的代码和功效中可以看到行使 dropna 函数后,包括 NA 值的两个字段已经不见了。返回的是一个不包括空值的数据表。
![]() 除此之外也可以行使数字对空值举办添补,下面的代码行使 fillna 函数对空值字段填凑数字 0。
我们选择添补的方法来处理赏罚空值,行使 price 列的均值来添补 NA 字段,同样行使 fillna 函数,在要添补的数值中行使 mean 函数先计较 price 列当前的均值,然后行使这个均值对 NA 举办填 充。可以看到两个空值字段表现为 3299.5
![]() 整理空格 除了空值,字符中的空格也是数据洗濯中一个常见的题目,下面是破除字符中空格的代码。
巨细写转换 在英笔墨段中,字母的巨细写不同一也是一个常见的题目。Excel 中有 UPPER,LOWER 等函数,python 中也有同名函数用来办理巨细写的题目。在数据表的 city 列中就存在这样的题目。我们将 city 列的全部字母转换为小写。下面是详细的代码和功效。
![]() 变动数据名目 Excel 中通过“配置单位格名目”成果可以修改数据名目。Python 中通过 astype 函数用来修改数据名目。 ![]() Python 中 dtype 是查察数据名目标函数,与之对应的是 astype 函数,用来变动数据名目。下面的代码中将 price 字段的值修改为 int 名目。
变动列名称 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |