加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

用R说话说明与猜测员工去职

发布时间:2018-09-30 17:00:54 所属栏目:教程 来源:佚名
导读:【新品产上线啦】51CTO播客,随时随地,碎片化进修 在尝试室搬砖之后,继承我们的kaggle数据说明之旅,这次数据也是答主在kaggle上选择的较量火的一份关于人力资源的数据集,存眷点在于员工去职的说明和猜测,依然照旧从数据读取,数据预处理赏罚,EDA和呆板学

按照前面的特性说明,本次答主并没有认为有很好的特性来提取,就直接扔进算法内里计较去了,计较出来的夹杂矩阵的环境结果照旧杠杠的:

  1. Confusion Matrix and Statistics 
  2.  
  3.           Reference 
  4. Prediction   no  yes 
  5.        no  3429    5 
  6.        yes   28 1010 
  7.                                            
  8.                Accuracy : 0.9926           
  9.                  95% CI : (0.9897, 0.9949) 
  10.     No Information Rate : 0.773            
  11.     P-Value [Acc > NIR] : < 2.2e-16        
  12.                                            
  13.                   Kappa : 0.9791           
  14.  Mcnemar's Test P-Value : 0.0001283        
  15.                                            
  16.             Sensitivity : 0.9919           
  17.             Specificity : 0.9951           
  18.          Pos Pred Value : 0.9985           
  19.          Neg Pred Value : 0.9730           
  20.              Prevalence : 0.7730           
  21.          Detection Rate : 0.7668           
  22.    Detection Prevalence : 0.7679           
  23.       Balanced Accuracy : 0.9935           
  24.                                            
  25.        'Positive' Class : no    

acc=0.9926,recall=0.9951,precision=0.9730,根基都是逆天的数据了,看来kaggle的数据集已经洗濯的很棒了,rf算法也是一如既往地给力。最后贴出ROC曲线的图

用R说话说明与猜测员工去职

写在最后

本次说明着实并没有许多的能力可言,答主的ggplot2程度也碰着了瓶颈期,后期必要不绝增强,并且只会调包不懂算法后头的道理更是不行以的,以是最近在逐步把概率论,线性代数,照旧统计学捡起来,虽然R说话的数据说明实践照旧不会停下来的,答主英语还不错,可以和尝试室的老外传授“忽悠”几句,也算是有了不少的前进。

道阻且长,各人共勉~~~

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读