怎样办理呆板进修树集成模子的表明性题目
这个数据集有这些特性:'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT'
output: 上图可以看出每个特性之间的彼此浸染(输出图是可以交互的)。 可是为了领略单个特征怎样影响模子的输出,我们可以将该特征的SHAP值与数据齐集全部示例的特征值举办较量。因为SHAP值代表了模子输出中的一个特征的变革,下面的图代表了猜测的房价跟着RM(一个地区中每栋屋子的均匀房间数)的变革而变革的环境。 单一RM值的垂直色散暗示与其他特性的彼此浸染。要辅佐显现这些交互依靠相关,dependence_plot 自动选择 另一个特性来着色。好比行使RAD着色,突显了RM(每户均匀房数)对RAD的值较高地域的房价影响较小。
output: 为了获得整体程度上每个特性的重要度环境,我们可以画出全部特性对付全部sample的SHAP值,然后按照SHAP值之和来降序排序,颜色代表特性重要度(赤色代表高,蓝色代表低),每个点代表一个样本。
output: 我们也可以只是表现SHAP值的全部样本的均值,画出bar图。
output: References [1] A Unified Approach to Interpreting Model Predictions http://papers.nips.cc/paper/7... [2] Consistent Individualized Feature Attribution for Tree Ensembles https://arxiv.org/pdf/1802.03... [3] Interpretable Machine Learning https://christophm.github.io/... [4] shap 官方文档 https://github.com/slundberg/... 本文由博客一文多发平台 OpenWrite 宣布!
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |