加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据“喂养”红利下,知识图谱如何走上新道路?

发布时间:2018-04-12 16:00:54 所属栏目:大数据 来源:站长网
导读:大数据期间的到来,为人工智能的飞速成长带来亘古未有的数据盈利。在大数据的喂养下,人工智能技能得到了亘古未有的长足前进。其盼望突出表此刻以常识图谱为代表的常识工程以及深度进修为代表的呆板进修等相干规模。跟着深度进修对付大数据的盈利耗损殆尽

应用 1 问答体系。天然说话问答是人机交互的重要情势。深度进修使得基于问答语料的天生式问答成为也许。然而今朝大大都深度问答模子如故难以操作大量的常识实现精确答复。Yin 等人针对简朴究竟类题目,提出了一种基于 encoder-decoder 框架,可以或许充实操作常识图谱中常识的深度进修问答模子[4]。在深度神经收集中,一个题目的语义每每被暗示为一个向量。具有相似向量的题目被以为是具有相似语义。这是联络主义的典范方法。另一方面,常识图谱的常识暗示是离散的,即常识与常识之间并没有一个渐变的相关。这是标记主义的典范方法。通过将常识图谱向量化,可以将题目与三元组举办匹配(也即计较其向量相似度),从而为某个特定题目找到来自常识库的最佳三元组匹配。匹配进程如图 1 所示。对付题目 Q:“How tallis Yao Ming?”,起首将题目中的单词暗示为向量数组 HQ。进一步探求能与之匹配的常识图谱中的候选三元组。最后为这些候选三元组,别离计较题目与差异属性的语义相似度。其由以下相似度公式抉择:

这里,S(Q,τ) 暗示题目Q 与候选三元组τ 的相似度;xQ 暗示题目的向量( 从HQ计较而得),uτ 暗示常识图谱的三元组的向量,M是待进修参数。

图1 基于常识图谱的神经天生问答模子

应用 2 保举体系。本性化保举体系是互联网各大交际媒体和电商网站的重要智能处事之一。跟着常识图谱的应用日益普及,大量研究事变谊识到常识图谱中的常识可以用来完美基于内容的保举体系中对用户和项目标内容(特性)描写,从而晋升保举结果。另一方面,基于深度进修的保举算法在保举结果上日益优于基于协同过滤的传统保举模子[5]。可是,将常识图谱集成到深度进修的框架中的本性化保举的研究事变,还较为少见。Zhang 等人做出了这样的实行。作者充实操作了布局化常识(常识图谱)、文本常识和可视化常识(图片)[6]等三类典范常识。作者别离通过收集嵌入(network embedding)得到布局化常识的向量化暗示,然后别离用SDAE(Stacked Denoising Auto-Encoder)和层叠卷积自编码器(stackedconvolution-autoencoder)抽取文本常识特性和图片常识特性;并最终将三类特性融合进协同集成进修框架,操作三类常识特性的整合来实现本性化保举。作者针对影戏和图书数据集举办尝试,证明白这种融合深度进修和常识图谱的保举算法具有较好机能。

常识图谱作为深度进修的束缚

Hu 等人提出了一种将一阶谓词逻辑融合进深度神经收集的模子,并将其乐成用于办理情绪分类和定名实体辨认等题目[7]。逻辑法则是一种对高阶认知和布局化常识的机动暗示情势,也是一种典范的常识暗示情势。将种种人们已蕴蓄的逻辑法则引入到深度神经收集中,操作人类意图和规模常识对神经收集模子举办引导具有异常重要的意义。其他一些研究事变则实行将逻辑法则引入到概率图模子,这类事变的代表是马尔科夫逻辑收集[8],可是鲜有事变能将逻辑法则引入到深度神经收集中。

Hu 等人所提出的方案框架可以归纳综合为“teacher-student network”,如图 2 所示,包罗两个部门 teacher network q(y|x) 和 student network pθ(y|x)。个中 teacher network 认真将逻辑法则所代表的常识建模,student network 操作反向撒播要领加上teacher network的束缚,实现对逻辑法则的进修。这个框架可以或许为大部门以深度神经收集为模子的使命引入逻辑法则,包罗情绪说明、定名实体辨认等。通过引入逻辑法则,在深度神经收集模子的基本上实现结果晋升。

7

图2 将逻辑法则引入到深度神经收集的“teacher-student network”模子

其进修进程首要包罗如下步调:

操作 soft logic 将逻辑法则表达为 [0, 1] 之间的持续数值。 基于后验正则化(posterior regularization)要领,操作逻辑法则对 teacher network 举办限定,同时担保 teacher network 和 student network 只管靠近。最终优化函数为:

大数据         个中,ξl,gl是败坏变量,L 是法则个数,Gl 是第 l 个法则的 grounding 数。KL 函数(Kullback-Leibler Divergence)部门担保 teacher network 和student network 习得模子尽也许同等。后头的正则项表达了来自逻辑法则的束缚。

对 student network 举办实习,担保 teacher network 的猜测功效和 student network 的猜测功效都只管地好,优化函数如下:

大数据         个中,t 是实习轮次,l 是差异使命中的丧失函数(如在分类题目中,l 是交错熵),σθ 是猜测函数,sn(t) 是 teacher network 的猜测功效。

一再 1~3 进程直到收敛。 竣事语

跟着深度进修研究的进一步深入,怎样有用操作大量存在的先验常识,进而低落模子对付大局限标注样本的依靠,逐渐成为主流的研究偏向之一。常识图谱的暗示进修为这一偏向的试探奠基了须要的基本。近期呈现的将常识融合进深度神经收集模子的一些开创性事变也颇具开导性。但总体而言,当前的深度进修模子行使先验常识的本领如故异常有限,学术界在这一偏向的试探上如故面对庞大的挑衅。这些挑衅首要表此刻两个方面:

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读