加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

怎样评估呆板进修模子的机能

发布时间:2020-09-27 00:06:13 所属栏目:创业 来源:网络整理
导读:您可以成天实习有监视的呆板进修模子,可是除非您评估其机能,不然您永久无法知道模子是否有效。这个具体的接头回首了您必需思量的各类机能指标,并对它们的寄义和事变方法提供了直观的表明。 为什么必要评估? 让我从一个很是简朴的例子开始。 罗宾和山姆

为了领略这一点,让我们看这个例子:当您在百度中查询时,它返回40个页面,可是只有30个相干。可是您的伴侣汇报您,该查询共有100个相干页面。以是它的精度是30/40 = 3/4 = 75%,而召回率是30/100 = 30%。因此,在这种环境下,精度是“搜刮功效的有效水平”,召回率是“功效的完成水平”。

ROC和AUC

吸取器事变特征曲线(ROC):

它是   通过从模子给出的概率得分的反向排序列表中获取多个阈值而计较出的 TPR(真正率)和FPR(假正率)之间的相关图 。

怎样评估呆板进修模子的机能

此刻,我们怎样绘制ROC?

为了答复这个题目,让我带您回到上面的表1。仅思量M1模子。您会看到,对付全部x值,我们都有一个概率得分。在该表中,我们将得分大于0.5的数据点分派为种别1。此刻,以概率分数的降序对全部值举办排序,并以便是全部概率分数的阈值逐一取值。然后,我们将得到阈值= [0.96,0.94,0.92,0.14,0.11,0.08]。对应于每个阈值,猜测种别,并计较TPR和FPR。您将得到6对TPR和FPR。只需绘制它们,您将得到ROC曲线。

留意:因为最大TPR和FPR值为1,因此ROC曲线下的面积(AUC)在0和1之间。

蓝色虚线下方的地区是0.5。AUC = 0暗示模子很差,AUC = 1暗示模子美满。只要您模子的AUC分数大于0.5。您的模子很故意义,由于纵然是随机模子也可以得分0.5 AUC。

很是重要:   纵然是从不服衡的数据集天生的哑模子,您也可以得到很高的AUC。因此,在处理赏罚不服衡的数据集时请务必警惕。

留意:   只要维持次序,AUC与数值概率分数无关。只要全部模子在按照概率得分排序后给出沟通次序的数据点,全部模子的AUC都将沟通。

对数丧失

该机能怀抱搜查数据点的概率得分与截至得分的毛病,并分派与毛病成比例的处罚。

对付二进制分类中的每个数据点,我们行使以下公式计较对数丧失:

个中p =数据点属于种别1的概率,y是种别标签(0或1)。

假设某些x_1的p_1为0.95,某些x_2的p_2为0.55,而且切合1类前提的截至概率为0.5。然后两者都切合种别1的前提,可是p_2的对数丧失将比p_1的对数丧失大得多。

怎样评估呆板进修模子的机能

从曲线中可以看到,对数丧失的范畴是[0,无限大]。

对付多种别分类中的每个数据点,我们行使以下公式计较对数丧失:

怎样评估呆板进修模子的机能

假如x(o,c)属于种别1,则y(o,c)=1。别的观念沟通。

测定系数

用 R 2 暗示   。 在猜测测试集的方针值时,我们会碰着一些偏差(e_i),这是猜测值与现实值之间的差。

假设我们有一个包括n个条目标测试集。众所周知,全部数据点都有一个方针值,譬喻[y1,y2,y3…….yn]。让我们将测试数据的猜测值设为[f1,f2,f3,……fn]。

通过行使以下公式计较   残差平方 和,即全部偏差(e_i)平方的总和,   个中fi是第i个数据点的模子的猜测方针值。

怎样评估呆板进修模子的机能

取全部现实方针值的均匀值:

然后计较与测试集方针值的方差成正比的   总平方和 :

怎样评估呆板进修模子的机能

假犹如时调查两个平方和的公式,则可以看到独一的区别是第二项,即y_bar和fi。平方总和在某种水平上给我们一种直觉,即它仅与残差平方和沟通,但猜测值为[,,,…….,n次]。是的,您的直觉是正确的。假设有一个很是简朴的均值模子,无论输入数据怎样,均能每次猜测方针值的均匀值。

此刻我们将R²暗示为:

正如您此刻所看到的,R²是一种怀抱,用于将模子与很是简朴的均值模子举办较量,该均值模子每次均返回方针值的均匀值,而与输入数据无关。较量有4种环境:

环境1:SS_R = 0

(R²= 1)美满的模子,完全没有错误。

环境2:SS_R> SS_T

(R²<0)模子乃至比简朴的均值模子差。

环境3:SS_R = SS_T

(R²= 0)模子与简朴均值模子沟通。

环境4:SS_R <SS_T

(0 <R²<1)模子还可以。

因此,简而言之,您应该很是相识您的数据集和题目,然后您始终可以建设一个夹杂矩阵,并搜查其精确性,精度,召回率,并绘制ROC曲线,并按照必要找出AUC。可是,假如您的数据集不服衡,请不要行使精确性作为怀抱。假如您想对模子举办更深入的评估,以使概率分数也获得权重,请选择对数丧失。

请记着,请务必评估您的实习!

 

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读