加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

?专访 | 今日头条2016 Byte Cup大赛实战经验分享:要充分挖掘模

发布时间:2021-01-01 17:40:09 所属栏目:大数据 来源:网络整理
导读:呆板之心原创 作者:杜夏德 今天头条技能副总裁杨震原在 2016 Byte Cup 天下呆板进修角逐颁奖典礼上说,「我们祈望颠末算法办理问与答的匹配功率疑问。这个疑问纵然是小幅的改进,也会影响到数以百万计的用户。」 克日,由今天头条与中国人工智能学会及 IEEE


?专访 | 今天头条2016 Byte Cup大赛拭魅战履历分享:要充实发掘模

图:第二名天穹战队代表钱乾


钱乾:就我小我私人来说,一开始介入角逐不要出格浮躁,不要一上手做到必然水平就想着要去做融合 ensemble,一开始就是要把数据看得出格清晰,到底这些数据代表了什么,潜匿了什么代价,包罗怎么去做一些特性工程上的对象。这些对象偶然辰是必要灵感,但偶然辰通过必然的说明本领是能看出来的。角逐时必然要先弄清这些工作再去思量后续的一些步调。

?

庞亮:角逐就是一个乐趣吧,偶然刻就可以介入。借着角逐去实现本身的 Idea,看看它们的示意到底怎么样。并且只有在快竣事的时辰也许会较量忙,前面的进程不会占用你太多时刻。

?

钱乾:我们做到必然水平往后就没有再动过了。

?

呆板之心:叨教第一名从始至终的思绪是什么样的?你们是怎么思索题目的?


?专访 | 今天头条2016 Byte Cup大赛拭魅战履历分享:要充实发掘模

图:第一名 BrickMover 队代表庞亮


庞亮:我们第一个思绪是把传统的模子先做一遍,我们试过 XGBoost 与 FM、尚有 SVDfeature 这三个的比拟,发明这个题目自己就是一个传统的保举题目,像 XGBoost 这些都不奏效。然后我们就往谁人偏向走,你就要去改造模子自己。由于常用的模子各人都有,你能做到,别人也能做到,你能调参,别人也能调参,以是你就要深入到模子自己上去发掘它剩下的一些信息,然后按照你发掘到的对象来举办改造,好比说 SVD++,这个是已经成型的模子,你发明 SVD++自己很有结果,那就再继承往下挖嘛。我们有三小我私人嘛,每小我私人都有本身的分工,我这边是调剂参数和 SVD++这一块,有一个同窗是认真挖新的模子,好比说 deep learning 方面的模子,他会去搜刮新的 paper,假若有源码实现的最好,假如没有,就 balance 一下,看看最后实现起来怎么样,假如太伟大就放弃了。尚有一个同窗专门攻 blending 这一块,做几个模子的融合。


不外他也是后头才做的 Blending,之前也在调解 SVDfeature 这块,我本身还试了一下新的模子。

?

郝磊:你们的模子融合是怎么融合的?

?

庞亮:我们把全部的分数拿来融合一下,就是功效融合,也就是线性模子嘛。然后用了 cross validation。

?

整体的思绪有几个步调:起首是说明数据,数据拿来之后,你必要把全部的漫衍都相识一遍,包罗内部门布和特性漫衍。在专业一点就是你要画出两两 feature 之间的相干性。第二就是把不须要的 feature 和 item 给去掉,做好数据洗濯事变。洗濯完之后再用模子。先用基本模子,看一下结果,再用伟大的模子,再较量一下这两个模子的差别到底有多大。假如伟大模子示意欠好就没须要用它了,直接在基本模子上加 feature 就可以了,这样你只要做 feature engineering 就可以了,完了之后就是 blending。

?

?呆板之心角逐进程中专业给你们带来了哪些辅佐?

?

钱乾:对我来说就是编写代码的手段。像 SVD SVD++ MIF 我们都试验了一下,可是没有现成的模子,我们就必需从新开始,把这些对象写下来,照旧较量检验编程功底的。


郭正肖:我没有太多,就是一些基本的线性代数。我学的是图形学,对向量的领略会有些差异,我思量的是空间上的。并且我是计较机技能配景,更多方向工程。可是介入完角逐之后有了履历就知道要多去看 paper,看看别人是怎么做的。


?专访 | 今天头条2016 Byte Cup大赛拭魅战履历分享:要充实发掘模

第三名西电战队代表郭正肖(中)

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读