数据洗濯预处理赏罚入门完备指南
不必要在测试集长举办拟合,只举办调动。
对付哑变量而言,是否必要举办缩放? 对付这个题目,有些人以为必要,有些则以为不必要。这取决于你对模子可表明性的垂青诚度。将全部数据缩放至统一量纲当然有甜头,但弱点是,这丢失了表明每个视察样本归属于哪个变量的便捷性。 对付 Y 呢?假如因变量是 0 和 1,那么并不必要举办特性缩放。这是一个具有明晰相干值的分类题目。但假如其取值范畴很是大,那么谜底是你必要做缩放。 恭喜你,你已经完成了数据预处理赏罚的事变! 通过少量的几行代码,你已经明确了数据洗濯和预处理赏罚的基本。毫无疑问,在数据预处理赏罚这一步中,你可以插手许多本身的设法:你也许会想怎样添补缺失值。思索是否缩放特性以及怎样缩放特性?是否引入哑变量?是否要对数据做编码?是否编码哑变量……有很是多必要思量的细节。此刻,你已经完全相识了这些,可以亲身下手试试了,筹备数据吧! 原文链接: https://towardsdatascience.com/the-complete-beginners-guide-to-data-cleaning-and-preprocessing-2070b7d4c6d 【本文是51CTO专栏机构“呆板之心”的原创译文,微信公家号“呆板之心( id: almosthuman2014)”】 戳这里,看该作者更多好文 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |