加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

基于语音识此外IVR体系的计划与实现

发布时间:2017-07-21 23:55:56 所属栏目:站长百科 来源:佚名
导读:跟着春节的邻近,智妙手机僻静板电脑成为互赠礼品的最佳选择,尤其是今朝很是火爆的应用SIRI增加了购置指数。跟着智妙手机僻静板电脑的日益遍及,移动装备安详越来越被用户重视。那么谁能提供智妙手机僻静板电脑最安详的操纵体系呢?

  因为呼吁节制语法方法可以限定识此外词汇量,而且这种辨认技能不必要对措辞人事先举办实习,因此在现实应用中具有较高的鲁棒性和较高的辨认服从。本体系的辨认词汇包罗:“车辆信息查询”、“驾驶证信息查询”和26个英笔墨母10个数字,我们起首编写了包括这些特定词汇的语法文件。

  在行使接口函数前,起首挪用CoInitialize(NULL)初始化COM工具,然后建设语音辨认引擎、语礼貌则上下文和辨认语法,并挪用函数LoadCmdFromFile装载文法辨认法则。微软辨认引擎是通过SAPI由变乱触发来关照上层的应用措施。可以挪用SetInterest来注书籍身感乐趣的变乱。体系默认的变乱为SPEI_RECOGNITION,该变乱表白当前已有辨认功效返回,这时上层应用措施可以通过挪用ISpRecoResult接口的GetText要领得到辨认功效。

  微软辨认引擎的语音输入有多种方法,凡是都是通过声卡直接输入,也可以通过其他语音输入流。本体系的语音数据是从语音卡取得的及时数据,将其存入内存,然后通过挪用ISpAudioPlug的SetData要领将其送入辨认引擎。

  4.3 体系实现的难点息争决方案

  车牌的辨认词汇中包括10个数字和26个英笔墨母,这些词汇的发音有很多是沟通或临近的,好比:E和1,R和2,T和7,D和B,M和N,X和S。这些词汇在辨认时很轻易发生误识,有的乃至完全不能辨认。假如单从算法上来思量,是很难办理这些题目的。因此我们思量从体系的流程出发,当用户以为辨认有误时,可以输入辨认错误的位数,然后体系按照用户的输入,提供几个备选功效,供用户选择,这样极大的进步了体系辨认率。

  然而Microsoft Speech SDK 5.1在呼吁节制语法方法下是不提供多选的,只有在听写方法下才提供多选,可是听写方法下的词汇量又无法限定。对此我们的设法是这样的:当体系辨认出功效往后,将有用语音段生涯起来,而且把辨认功效从呼吁节制方法下的词汇量中移除,然后将生涯有用语音段再次送入辨认引擎,当体系辨认出功效往后,再次一再以上步调,直到辨认出给定个数的功效。

  5 操纵要领

  用户用清楚、天然的语调说出需查询信息的种别,如:车辆信息查询、驾驶证信息查询,体系辨认模块辨认出功效后,转入响应的信息查询模块。当用户必要查询车辆信息时,起主要求用清楚、较迟钝的语调说出车牌号,体系辨认模块辨认出功效后,通过TTS将功效播放给用户。这时用户可以输入车牌号码中辨认错误的位数,体系按照用户的输入提供7个备选功效让用户举办选择。用户选择确认无误后,体系将功效递交给靠山数据库举办查询,并将检索到的信息播放给用户。

  6 试验功效及说明

  对付信息类此外辨认因为其词汇量少,音节较多,以是辨认率很高,到达了100%。可是对付字母和数字的组合辨认,因为其词汇量较多,音节简朴,并且有大量沟通和临近的词汇,很轻易受到噪声的滋扰,以是辨认率不是很抱负。然而,当我们提供七个备选功效后,纵然在有必然噪音的情形下,体系的辨认率达也能到达96%以上。由此表白该体系是不变的和适用的。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读