加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

能在文本精准检测地点和号码,谷歌是怎么做到的

发布时间:2018-08-11 20:47:26 所属栏目:运营 来源:网易科技报道
导读:(原问题:Google explains how AI powers Android Pie’s Smart Linkify) 网易科技讯 8月10日动静,据海外媒体报道,谷歌本周宣布了最新版的移送操纵体系Android Pie,个中的亮点成果之一就是Smart Linkify。这是一个应用措施编程接口,可在文本中检测到

(原问题:Google explains how AI powers Android Pie’s Smart Linkify)

能在文本精准检测地点和号码,谷歌是怎么做到的

网易科技讯 8月10日动静,据海外媒体报道,谷歌本周宣布了最新版的移送操纵体系Android Pie,个中的亮点成果之一就是Smart Linkify。这是一个应用措施编程接口,可在文本中检测到地点、电话号码和其他相同信息并挪用可点击链接。固然这听起来很炫酷,但究竟上统统都是人工智能在背后浸染的功效。

“在文本中辨认出电话号码和地点每每是一个困难,”谷歌人工智能软件工程师卢卡斯齐卡(Lukas Zilka)在一篇博客文章中写道。“这不只是由于人们在编写文本时有许多变革,并且文本中的组合代表什么样的信息也常常是迷糊其词(譬喻:’确认号码:857-555-3556’并不是一个电话号码,纵然它回收了相同于电话号码的情势)。”

齐卡表明说,Smart Linkify是对现有Android Linkify API的改造,其底层由两个紧凑的、低耽误的前馈神经收集构成——由称为节点的简朴处理赏罚单位层构成的呆板进修算法——个中借用了前版移动操纵西戎Android Oreo的智能文本选择成果。

这两个神经收集都依靠第三个模子天生的数据。该模子从收集中提取电话号码、地点、产物、所在和贸易名称,并随机添加“文本上下文”和短语(譬喻“确认号码”和“ID”)。谷歌人工智能团队针对拉丁笔墨说话(英语、德语、波兰语和捷克语)行使一种算法,而针对日语、韩语、泰语、阿拉伯语和俄语等语类别离行使了完全差异的算法。

能在文本精准检测地点和号码,谷歌是怎么做到的

整个处理赏罚进程是这样的:要说明的文本被拆分为单词,然后从这些单词中天生全部也许的最大长度子序列。然后,体系中的第一个神经收集为每个子序列分派一个值(在0到1之间),暗示它对本身的身份(譬喻给定的一串数字是暗码照旧电话号码)的置信度。

得分最低的子序列从列表中删除,然后第二个神经收集参与,按范例对子序罗列办分类——即电话号码、地点或非实体信息。

“(收集)必要知道实体周围的上下文(除了实体自己的文本字符串之外)。在呆板进修中,这是通过将这些部门暗示为单独的特征来实现的。”齐卡暗示,“现实上输入文本被拆分成几部门,别离馈送到神经收集。”

能在文本精准检测地点和号码,谷歌是怎么做到的

为此,单词被转换成n-gram模子(偶然也称为N元模型,是大词汇持续语音辨认中常用的一种说话模子),这种技能“将(词汇)暗示为必然长度的全部字符子序列的荟萃”。而一个神经收集辨识这些单词是否以大写字母开头——这是邮政地点的一个明显特性。

在实践中,假设句子“约翰应该在周二打电话1- 800-9444-9494”这句话,Smart Linkify起首会将“John应该拨打”与“1- 800-9444-9494”分隔,然后将“John应该拨打”和“1-800-944-9494”分类为非实体电话号码和电话号码,最后在收集赏识器或应用措施中通过这个电话号码建设一个可点击的链接。

在智妙手机硬件的限定下,这种事变对人工智能团队来说是一个特另外挑衅。他们通过量化(一种将持续范畴的值转换为有限范畴离散值的压缩技能)以及在辖档徒个神经收集之间共享某些数值暗示等其他技能来办理这个题目。

在不久的未来,这个团队但愿为日期和时刻建设呆板进修模子——尤其是辨认文本中的非正式短语,如“下周四”或“三周后”。

“我们信托这种架构可以扩展到其他设惫亓?文本注释题目,我们等候看到新的用例,”齐卡写道。(晗冰)

王凤枝 本文来历:网易科技报道 责任编辑:王凤枝_NT2541

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读