CCR2017在沪召开 搜狗COO茹立云:AI敦促五项焦点图像技能取得打破
10 月12- 15 日,中华医学会第 24 次世界放射学学术大会(CCR 2017)在上海世博中心拉开帷幕,聚积了海表里一流的专家学者及业内人士共 6000 余人,齐集展示和交换了中国影像医学的汗青传承与超过式成长。搜狗公司COO茹立云受邀出席此次大会,以“人工智能在图像规模的盼望”为题,分享了人工智能敦促图像技能取得的五项重大打破,并指出人工智能技能在医疗规模应用远景辽阔,将来将能施展更大浸染。 (搜狗公司COO茹立云出席CCR2017 并颁发主题演讲) 跟着移动互联网及交际收集的成长,图片成为首要的信息载体,在这种环境下,计较机的图像辨认技能就显得尤为重要。茹立云先容, 21 世纪初,图像的检索根基上是由人工去界说特性,在呆板上做简朴的匹配。人工智能技能的成长,让呆板对图像中内容的领略手段实现了全面晋升。详细而言,面临一张图片时,呆板会最先判定“图像里有什么”,精准辨认图像中的内容;其次判定“图像中物体在哪儿”,以精准定位物体的位置;最后会对“图像内容表达什么”举办智能语义说明。 “呆板对图像领略手段的晋升,则直接敦促了OCR笔墨辨认、识图搜刮、人脸辨认、图文翻译、图像天生这五大图像技能的打破。个中,前三项技能首要用于办理‘图像里有什么’和‘图像中物体在哪儿’的题目,后两项则对应办理‘图像内容表达什么’的题目。”茹立云指出,并逐一先容了这五大技能打破的详细成长环境。 在笔墨辨认方面,其方针是检测并辨认图像中的笔墨。“传统笔墨检测要领步调繁琐、人工计划流程多,且无法应对伟大配景和低质量笔墨。现有技能浮现了深度进修模子的端到端的特点,镌汰了中间环节,从而能低落辨认错误率。图片中的笔墨无论是印刷体、手写体可能混合在伟大配景中,都能被呆板精确读出来。”茹立云还以搜狗翻译APP最新推出的“菜单翻译”成果为例,展示了笔墨辨认技能的详细应用。这项成果基于搜狗领先的图像辨认技能,对付用户从恣意角度扫描的中英文菜单,均可精确辨认,并在原菜单的对应位置标识出响应的翻译功效。 (图:“菜单翻译”成果翻译前后比拟截图) 识图搜刮则旨在办理图像分类、查找沟通图、相似图等题目。茹立云暗示,当前的识图搜刮技能,以深度进修算法更换了人工计划,有用晋升了沟通图和相似图搜刮功效的质量。“如搜狗图片的照相购物成果,用户只需将喜好的衣服照相上传,可能从手机里上传相看护片,体系即可对上传照片举办快速处理赏罚,并与数据库中上亿张商品图片举办高速比对,为用户找到沟通和临近的商品。再如搜狗图片的‘识狗’、‘识花’成果,用户只需上传相看护片,即可直接辨认出狗可能花的种类。”茹立云举例说。 人脸辨认方面,他指出,在深度进修以及大数据的驱动下,人工智能在人脸识此外某些方面已远超人类的辨认手段。而且,人脸识此外现实应用场景也已日趋成熟,已经越来越多地应用到了机场安检、人流监控、疑犯查找、身份认证等场景下。譬喻市肆的监控器,就可以操作人脸辨认技能,对常常进出店肆的熟客举办针对性营销,将能更好晋升销量。 图文翻译技能,其目标是使呆板精确领略图像背后的语义。“传统的图像辨认技能,只能大致辨认出图像中的根基内容,如图像中有一小我私人。而人工智能支持下的图文翻译技能,不只能汇报你图片中有一小我私人,还能判别出这小我私人的性别、他手上拿的对象、他周围有什么物体等更过细的内容。”茹立云说,这项技能的打破,也能给人带来极大便利,譬喻瞽者伴侣早年只能通过声音可能笔墨转化成的声音来获守信息,此刻还能把图片信息转化成的声音,让他更好相识视觉化的天下。 而人工智能技能成长到更高阶段,则是图像天生技能,今朝这一技能也已被普及应用到了人脸合成、图像修复、气魄威风凛凛迁徙等方面。“譬喻图像修复方面,AI能通过深度进修,将带马赛克可能画面遮挡的图片修复成完备图片,再如利害照片上色酿成彩色照片,等等。”茹立云举例说。 回到大会焦点话题——影像医学规模,茹立云指出,将来图像AI在医疗规模的应用远景将会很是辽阔,首要包罗三方面:起首是帮助诊断,人工智能可以进修更多医学影像方面的数据,进一步帮助大夫诊断决定;其次是疗效评估,对付肿瘤等重大疾病,可依据AI大数据说明,在治疗前判定治疗方案对患者的疗效;再次是预后猜测,科学猜测患者保留期,提取患者特性,成立模子,定量说明,给出预后猜测。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |