加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

怎样办理呆板进修树集成模子的表明性题目

发布时间:2019-10-23 02:40:04 所属栏目:建站 来源:SAMshare
导读:【大咖·来了 第7期】10月24日晚8点寓目《智能导购对话呆板人实践》 01 呆板进修模子不行表明的缘故起因 前些天在偕行交换群里,有个话题一向在群里热烈地接头,那就是 怎样表明呆板进修模子 ,由于在风控规模,一个模子假如不能获得很好的表明一样平常都不会被通过

这个数据集有这些特性:'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT'

  1. # visualize the training set predictions  
  2. shap.force_plot(explainer.expected_value, shap_values, X) 

output:

怎样办理呆板进修树集成模子的表明性题目

上图可以看出每个特性之间的彼此浸染(输出图是可以交互的)。

可是为了领略单个特征怎样影响模子的输出,我们可以将该特征的SHAP值与数据齐集全部示例的特征值举办较量。因为SHAP值代表了模子输出中的一个特征的变革,下面的图代表了猜测的房价跟着RM(一个地区中每栋屋子的均匀房间数)的变革而变革的环境。

单一RM值的垂直色散暗示与其他特性的彼此浸染。要辅佐显现这些交互依靠相关,dependence_plot 自动选择 另一个特性来着色。好比行使RAD着色,突显了RM(每户均匀房数)对RAD的值较高地域的房价影响较小。

  1. """建设一个SHAP图用于展示 单一特性在整个数据集的示意环境,每个点代表一个样本"""  
  2. shap.dependence_plot("RM", shap_values, X) 

output:

怎样办理呆板进修树集成模子的表明性题目

为了获得整体程度上每个特性的重要度环境,我们可以画出全部特性对付全部sample的SHAP值,然后按照SHAP值之和来降序排序,颜色代表特性重要度(赤色代表高,蓝色代表低),每个点代表一个样本。

  1. """画出全部特性的重要度排序图"""  
  2. shap.summary_plot(shap_values, X) 

output:

怎样办理呆板进修树集成模子的表明性题目

我们也可以只是表现SHAP值的全部样本的均值,画出bar图。

  1. shap.summary_plot(shap_values, X, plot_type="bar") 

output:

References

[1] A Unified Approach to Interpreting Model Predictions

http://papers.nips.cc/paper/7...

[2] Consistent Individualized Feature Attribution for Tree Ensembles

https://arxiv.org/pdf/1802.03...

[3] Interpretable Machine Learning

https://christophm.github.io/...

[4] shap 官方文档

https://github.com/slundberg/...

本文由博客一文多发平台 OpenWrite 宣布!

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读