【Kaggle入门级比赛top5%排名履历分享】— 说明篇
发布时间:2018-08-17 13:12:49 所属栏目:教程 来源:佚名
导读:技能沙龙 | 邀您于8月25日与国美/AWS/转转三位专家配合切磋小措施电商拭魅战 Kaggle作为公认的数据发掘比赛平台,有许多果真的优越项目,而个中作为初学者入门的一个好的项目就是:泰坦尼克号生还者猜测。 也许这个项目许多几何伴侣也传闻过,也许许多伴侣也做过
调查到Pclass1相对付2和3的Fare较量高,由于职位高,财产多。可是Pclass1中有几个大于500的非常值存在,看一下这些非常数据。 ![]() 这些非常值中,有两个名字一样的Cardeza,又看到Parch都为1,SibSp都为0,Fare,Cabin,Embarked,Ticket都一样,可展望二人是伉俪。其它两小我私人的Embarked,Ticket,Fare也都一样,这声名这个大于500的Fare也许不是非常值。后头我们会对这些举办特性工程来非凡看待。 ![]() ![]() 这是上述7个特性的彼此关联图的汇总,对角线为特性自身的kde漫衍。对付不利便可视化的Name,Cabin,Ticket将在特性工程中进一步举办处理赏罚并发掘这些数据中到底有什么信息长短常有代价的。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐
热点阅读