“数据说明岗亭”雇用环境说明!| Execl版
发布时间:2019-04-28 07:49:47 所属栏目:教程 来源:佚名
导读:为了操练Excel手艺,以及实践数据说明的流程。我用Web Scraper爬取了出息无忧4月16日世界宣布的约2500条数据说明的地位信息,对数据说明岗亭的雇用环境举办简朴的说明。整个进程分为五个步调:明晰目标,调查数据,洗濯数据,说明进程,得出结论。 Web Scr
呈现了文本与数字瓜代的环境, 给每个单位格做一次数字运算,所有转换为数字。最后获得同一单元和名目标最高薪水和最低薪水 我们简朴取最高薪和最低薪的均匀数作为该岗亭薪资。这是数据来历的缺陷,由于我们并不能知道应聘者现实能拿几多,这是薪水计较的偏差。 适才说用均值添补缺失值,均值计较为9.3,对avgsalary为0的项举办添补。薪资项的处理赏罚就完成了。 然后是info项,info项的名目相同 以 ‘ | ’ 为脱离符排列,但有的单元在此处填写了学历要求,有的单元没有,而是把学历要求写在JD中。导致education项中有一部门的数据错位为雇用人数。 我把薪资小于5千/月的添补为大专要求,小于15千/月的添补为本科要求,大于15千/月的添补为硕士要求,不外这样偏差应该会很是大! 然后是city列,用数据透视表统计各都市呈现的次数,降序。将小于10个雇用岗亭的都市同一归入“其他都市”标签。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |