快手科技李岩:多模态技能会改变人机交互方法,会使信息分发更高效
第二,我以为多模态技能会带来新的内容形态,原本接入信息更多是从文本、页面中得到,此刻有视频,将来也许还会有AR可能其余的情势。我认为多模态AR很重要的一点就是夸大陶醉感,这种陶醉感着实是通过听觉和视觉综合浸染才气发生的。 第三,我以为多模态亟需新的算法和大型的数据,由于这两者也许会是一个某种意义上可以彼此折算的题目。以今朝的呆板进修算法来讲,必要海量的数据才气办理好这个题目,由于此刻深度进修、内容领略的成就,某种意义上是监视进修的成就,有足够的样本、算力,以是此刻的算法手段根基上还逗留在对算力和数据有着很是大体求的阶段。而多模态的大型数据长短常难建的,并且多模态解的空间是更大的。由于一个模态解的空间是n,其它一个是m,它最后是一个乘积、一个指数级的变革,以是数据集要多大才足够是一个很难的这个题目,也许必要新的算法来对这个题目举办建模。 关于快手多媒体内容领略部分 快手多媒体内容领略部分(Multimedia Understanding)简称MMU ,团队由近百名算法工程师、应用工程师组成,聚焦多媒体内容的领略与应用。在内容领略方面,MMU首要通过对人脸、图像、音乐、视频四个维度实现对多媒体内容的感知,并融合感知内容和常识图谱,实现对视频高层语义及情绪的领略,从而让呆板高效看懂海量内容。今朝,多媒体内容领略部的焦点技能处事于内容安详、原创掩护、视频创作、视频保举、视频搜刮及贸易化等方面。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |