刷百度相关搜索和下拉框的技术原理
对付单个用户来说搜刮后继词简直定性是不足的,好比搜刮科比,可是一看到旁边有人我就立即改变搜刮培训,那么这两个词是没有相干性子的。那么就插手统计法则去掉一些杂质,好比某个词B只有呈此刻5个用户的沟通的搜刮词A的后继词中才算一个A的后继词,尚有其他的一些法则,这么下来,日记就酿成了。 key:A succeed:A1,A2,A3..... 用户协同过滤道理: 当搜刮用户日记足够多的环境,可以把拥有沟通搜刮记录的用户聚合起来,通过协同过滤算法,获取更多的相干性的词。通过下面协同过滤算法同样可以把加索尔保举给NBA了。 A用户:篮球 后继词 男篮 女篮 B用户:NBA 后继词 男篮 科比 C用户:男篮角逐 后继词 男篮 加索尔 从搜刮词算法实现: 假如一个要害词搜刮词功效,跟其它一个,乃至几个要害词搜刮出来的功效许多交集,那么这些要害词很也许也是语义相干的词。 从搜刮日记来看例子: key:搜刮词 time:搜刮时刻 cookie:用户cookieid result:a,b,c,d,e(前5个搜刮功效) 这次,我们只用key和result两项,轻微处理赏罚下来往后就酿成了 key:搜刮词A result:a,b,c,d,e(前5个搜刮功效) key:搜刮词B result:a,f,c,g,m(前5个搜刮功效) (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |