百度CTO王海峰:百度大脑升级至5.0 核心算法再获重大突破
在7月3日召开的百度AI开拓者大会上,百度CTO王海峰博士带来了一段传统与科技碰撞的出色演示——机器臂倒盖碗茶。这个机器臂既会茶艺绝活儿,还能说会道。固然演示进程简短,背后却融合了呆板人视觉、语音、天然说话处理赏罚等多种人工智能技能,也展示了百度AI技能储蓄的宽度和技能打磨的深度。 中国AI平台再次进级!王海峰方才公布,百度大脑进级至5.0,形成了包罗基本层、感知层、认知层、平台层和AI安详五大部门的焦点架构。百度大脑5.0成为软硬件一体的AI大出产平台,焦点算法再获重大打破,发布端到端AI计较架构,并实现了AI计较、计较架构与应用场景的创新融合。而安详一向都贯串AI技能研发的始终,已经融合在百度大脑的全部模块中。 语音-SMLTA中英混输 百度语音技能部高级总监高亮在开拓者大会现场说了一段Rap:Hello Everyone,中英殽杂说是我们的everyday work,Explore技能的depth和scope是我们的responsibility……这段中英混合的话被百度输入法流通、精准、实时地辨认出来!这背后是百度大脑流式多级的截断留意力模子(SMLTA),它能让语音辨认速率大幅晋升,精确率提15%-20%,是基于流式留意力的语音辨认线上处事。 及时假造形象 浦发银行的数字人是怎么“炼”成的?它现实上是团结语音和视觉技能,呆板自动合成的假造形象。王海峰先容,及时合成假造形象技能,起首必要对语音信号和视频信号举办及时辨认与领略,再通过唇动天生,以及语音、面部和肢体的合成,及时合成一个假造形象。这波操纵背后,是百度大脑多项AI技能手段的浮现。 视频语义领略 王海峰展示了关于中百姓间艺术的音乐记载片《大河唱》中的片断,影片中的脚色、人物相关、音乐种类、取景地、影片主题等信息,都被精准理会。这背后是基于常识图谱的视频语义领略技能。 焦点算法重磅进级 百度大脑语音、视觉、说话和常识等焦点算法法再度重磅进级,宣布6大技能打破。包罗先辈流式多级的截断留意力模子(SMLTA)友善势威风凛凛迁徙的语音合成技能;常识加强的语义领略框架ERNIE和基于常识图谱的视频语义领略技能;业界高精确、低时延的呆板同传技能。值得存眷的是,在说话方面,百度大脑推出常识加强的语义领略框架——ERNIE,再次全面革新了中文天然说话处理赏罚使命结果,逾越谷歌BERT。 远场语音交互芯片“鸿鹄”宣布 继客岁开拓者大会宣布“昆仑”芯片后,本年,王海峰宣布了一款新的芯片——远场语音交互芯片“鸿鹄”。鸿鹄芯片行使了HiFi4自界说指令集,双核DSP焦点,均匀功耗仅100mW。这款芯片是按照车规级尺度打造,将为车载语音交互、智能家具等场景带来庞大的便利。 百度飞桨与华为麒麟芯片相助 王海峰与华为斲丧者BG软件总裁王成录博士连系公布,百度飞桨与华为麒麟芯片告竣深度相助。中国人本身的深度进修平台将运行在中国人自研的先辈芯片上,两大国货之光将充实验展各自在软、硬件方面的上风,走出中国智能之路!
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |