没有美满的数据插补法,只有最得当的
发布时间:2018-10-25 04:37:04 所属栏目:教程 来源:大数据文摘
导读:大数据文摘出品 编译:张秋玥、胡笳、夏雅薇 数据缺失是数据科学家在处理赏罚数据时常常碰着的题目,本文作者基于差异的情境提供了响应的数据插补办理步伐。没有美满的数据插补法,但总有一款更得当当下环境。 我在数据整理与试探性说明中碰着的最常见题目之一
按照数据范例的差异,间隔怀抱也不尽沟通:
KNN算法最吸引人的特点之一在于,它易于领略也易于实现。其非参数的特征在某些数据很是“不通俗”的环境下很是有上风。 KNN算法的一个明明弱点是,在说明大型数据集时会变得很是耗时,由于它会在整个数据齐集搜刮相似数据点。另外,在高维数据齐集,最近与最远邻人之间的不同很是小,因此KNN的精确性会低落。
在上述要领中,多重插补与KNN最为普及行使,而因为前者更为简朴,因此其凡是更受青睐。 相干报道:https://towardsdatascience.com/how-to-handle-missing-data-8646b18db0d4 【本文是51CTO专栏机构大数据文摘的原创文章,微信公家号“大数据文摘( id: BigDataDigest)”】 戳这里,看该作者更多好文 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐
热点阅读