加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

数据洗濯预处理赏罚入门完备指南

发布时间:2019-02-23 07:50:27 所属栏目:教程 来源:机器之心编译
导读:数据预处理赏罚是成立呆板进修模子的第一步(也很大噶?鲱重要的一步),对最终功效有抉择性的浸染:假如你的数据集没有完成数据洗濯和预处理赏罚,那么你的模子很也许也不会有用就是这么简朴。 人们凡是以为,数据预处理赏罚是一个很是死板的部门。但它就是「做好筹备」

不必要在测试集长举办拟合,只举办调动。

  1. sc_y = StandardScaler() 
  2. y_train = sc_y.fit_transform(y_train) 

对付哑变量而言,是否必要举办缩放?

对付这个题目,有些人以为必要,有些则以为不必要。这取决于你对模子可表明性的垂青诚度。将全部数据缩放至统一量纲当然有甜头,但弱点是,这丢失了表明每个视察样本归属于哪个变量的便捷性。

对付 Y 呢?假如因变量是 0 和 1,那么并不必要举办特性缩放。这是一个具有明晰相干值的分类题目。但假如其取值范畴很是大,那么谜底是你必要做缩放。

恭喜你,你已经完成了数据预处理赏罚的事变!

通过少量的几行代码,你已经明确了数据洗濯和预处理赏罚的基本。毫无疑问,在数据预处理赏罚这一步中,你可以插手许多本身的设法:你也许会想怎样添补缺失值。思索是否缩放特性以及怎样缩放特性?是否引入哑变量?是否要对数据做编码?是否编码哑变量……有很是多必要思量的细节。此刻,你已经完全相识了这些,可以亲身下手试试了,筹备数据吧!

原文链接:

https://towardsdatascience.com/the-complete-beginners-guide-to-data-cleaning-and-preprocessing-2070b7d4c6d

【本文是51CTO专栏机构“呆板之心”的原创译文,微信公家号“呆板之心( id: almosthuman2014)”】

戳这里,看该作者更多好文

【编辑保举】

  1. 仅需六步,从零实现呆板进修算法
  2. 黑客慌了!一文全面解读收集安详中的呆板进修
  3. 怎样缔造可信赖的呆板进修模子?先要领略不确定性
  4. 呆板进修竞争着实是一场数据上的竞争
  5. 还在为数据洗濯抓狂?这里有一个简质朴用的洗濯代码集
【责任编辑:赵宁宁 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读