加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

今日头条算法原理(全文)

发布时间:2018-02-22 12:53:14 所属栏目:建站 来源:今日头条
导读:副问题#e# 注:本文首要分享了今天头条保举体系概览以及内容说明、用户标签、评估说明,内容安详等道理。 本日,算法分发已经是信息平台、搜刮引擎、赏识器、交际软件等险些全部软件的标配,但同时,算法也开始面对质疑、挑衅和误解。今天头条的保举算法,

下面我将简朴先容在上述算法方针的基本上怎样对着实现。

今天头条算法道理(全文)

前面提到的公式y = F(Xi ,Xu ,Xc),是一个很经典的监视进修题目。可实现的要领有许多,好比传统的协同过滤模子,监视进修算法Logistic Regression模子,基于深度进修的模子,Factorization Machine和GBDT等。

一个优越的家产级保举体系必要很是机动的算法尝试平台,可以支持多种算法组合,包罗模子布局调解。由于很难有一套通用的模子架构合用于全部的保举场景。此刻很风行将LR和DNN团结,前几年Facebook也将LR和GBDT算法做团结。今天头条旗下几款产物都在相沿统一套强盛的算法保举体系,但按照营业场景差异,模子架构会有所调解。

今天头条算法道理(全文)

模子之后再看一下典范的保举特性,首要有四类特性会对保举起到较量重要的浸染。

  • 第一类是相干性特性,就是评估内容的属性和与用户是否匹配。显性的匹配包罗要害词匹配、分类匹配、来历匹配、主题匹配等。像FM模子中也有一些隐性匹配,从用户向量与内容向量的间隔可以得出。

  • 第二类是情形特性,包罗地理位置、时刻。这些既是bias特性,也能以此构建一些匹配特性。

  • 第三类是热度特性。包罗全局热度、分类热度,主题热度,以及要害词热度等。内容热度信息在大的保举体系出格在用户冷启动的时辰很是有用。

  • 第四类是协同特性,它可以在部门水平上辅佐办理所谓算法越推越窄的题目。协同特性并非思量用户已有汗青。而是通过用户举动说明差异用户间相似性,好比点击相似、乐趣分类相似、主题相似、乐趣词相似,乃至向量相似,从而扩展模子的试探手段。

今天头条算法道理(全文)

模子的实习上,头条系大部门保举产物回收及时实习。及时实习省资源而且反馈快,这对信息流产物很是重要。用户必要举动信息可以被模子快速捕获并反馈至下一刷的保举结果。我们线上今朝基于storm集群及时处理赏罚样本数据,包罗点击、揭示、保藏、分享等举措范例。模子参数处事器是内部开拓的一套高机能的体系,由于头条数据局限增添太快,相同的开源体系不变性和机能无法满意,而我们自研的体系底层做了许多针对性的优化,提供了完美运维器材,更适配现有的营业场景。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读