没有美满的数据插补法,只有最得当的
发布时间:2018-10-25 04:37:04 所属栏目:教程 来源:大数据文摘
导读:大数据文摘出品 编译:张秋玥、胡笳、夏雅薇 数据缺失是数据科学家在处理赏罚数据时常常碰着的题目,本文作者基于差异的情境提供了响应的数据插补办理步伐。没有美满的数据插补法,但总有一款更得当当下环境。 我在数据整理与试探性说明中碰着的最常见题目之一
可以或许用于数据插补的呆板进修要领有许多,好比XGBoost与Random Forest,但在这里我们接头KNN要领,由于它被普及应用。在本要领中,我们按照某种间隔怀抱选择出k个“邻人”,他们的均值就被用于插补缺失数据。这个要领要求我们选择k的值(最近邻人的数目),以及间隔怀抱。KNN既可以猜测离散属性(k近邻中最常见的值)也可以猜测持续属性(k近邻的均值)。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐
热点阅读