今日头条算法原理(全文)
五、内容安详最后要先容今天头条在内容安详上的一些设施。头条此刻已经是海内最大的内容创作与分发凭条,必需越来越重视社会责任和行业率领者的责任。假如1%的保举内容呈现题目,就会发生较大的影响。 因此头条从创建伊始就把内容安详放在公司最高优先级行列。创立之初,已经专门设有考核团队认真内容安详。其时研发全部客户端、后端、算法的同窗一共才不到 40 人,头条很是重视内容考核。 此刻,今天头条的内容首要来历于两部门,一是具有成熟内容出产手段的PGC平台 一是UGC用户内容,如问答、用户评述、微头条。这两部门内容必要通过同一的考核机制。假如是数目相对少的PGC内容,会直接举办风险考核,没有题目会大范畴保举。UGC内容必要颠末一个风险模子的过滤,有题目的会进入二次风险考核。考核通事后,内容会被真正举办保举。这时假如收到必然量以上的评述可能举报负向反馈,还会再回到复审环节,有题目直接下架。整个机制相对而言较量健全,作为行业领先者,在内容安详上,今天头条一向用最高的尺度要求本身。 分享内容辨认技能首要鉴黄模子,诅咒模子以及低俗模子。今天头条的低俗模子通过深度进修算法实习,样本库很是大,图片、文本同时说明。这部门模子更注重召回率,精确率乃至可以捐躯一些。诅咒模子的样本库同样高出百万,召回率高达95%+,精确率80%+。假如用户常常出言不讳可能不妥的评述,我们有一些处罚机制。 泛低质辨认涉及的环境很是多,像假消息、黑稿、题文不符、问题党、内容质量低等等,这部门内容由呆板领略长短常难的,必要大量反馈信息,包罗其他样本信息比对。今朝低质模子的精确率和召回率都不是出格高,还必要团结人工复审,将阈值进步。今朝最终的召回已到达95%,这部门着实尚有很是多的事变可以做。头条人工智能尝试室李航先生今朝也在和密歇根大学共建科研项目,设立谎言辨认平台。 以上是头条保举体系的道理分享,但愿将来获得更多的提议,辅佐我们更好改造事变。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |