一张“纸条”就能骗过AI,OpenAI最优秀的视觉模型就这?
AI不只辨认出了这是苹果,乃至还表现出了它的品种:Granny Smith。 然而,当研究职员给苹果上贴上一张写着iPod的纸片,功效AI真的被误导了,如右图所示,其iPod的辨认率到达了99.7%。 研究团队将此类进攻称为“印刷进攻”,他们在官方博客中写道:“通过操作模子强盛的文本读取手段,纵然是手写笔墨的照片也会诱骗模子。像‘反抗补丁’一样,这种进攻在田野场景也有用。” 可以看出,这种印刷进攻实现起来很简朴,只必要笔和纸即可,并且影响明显。我们再来看一组案例: 左图中,AI乐成辨认出了贵客犬(辨认率39.3%)。 但右图中在贵客犬身上加上多个“$$$”字符后,AI就将其辨认成了存钱罐(辨认率52.5%)。 至于为什么会隐含这种进攻方法,研究职员表明说,要害在于CLIP的多模态神经元—可以或许对以文本、标记或观念情势泛起的沟通观念作出相应。 然而,这种多模态神经元是一把双刃剑,一方面它可以实现对图文的高度节制,另一方面普遍笔墨、图像的神经元也让AI变得更易于进攻。 “多模态神经元”是来源那么,CLIP 中的多模态神经元到底是什么样子呢? 此前,OpenAI 的研究职员颁发了一篇新论文《Multimodal Neurons in Artificial Neural Networks》,描写了他们是怎样打开 CLIP 来调查其机能的。 OpenAI 行使两种器材来领略模子的激活,别离是特性可视化(通过对输入举办基于梯度的优化来最大化神经元激活)、数据集示例(调查数据齐集神经元最大激活图像的漫衍)。 通过这些简朴的要领,OpenAI 发明 CLIP RN50x4(行使EfficientNet缩放法则将ResNet-50放大4倍)中的大大都神经元都可以获得表明。这些神经元好像是“多面神经元”的极度示例——它们只在更高条理的抽象上对差异用例做出相应。 另外,它们不只对物体的图像有回响,并且对草图、卡通和相干文本也有回响。譬喻: 对付CLIP而言,它能辨认蜘蛛侠的图像,从而其收集中存在特定的“蜘蛛侠”神经元可以对蜘蛛侠的真实图像、漫绘图像作出相应,也可以对单词“Spider”(蜘蛛)作出相应。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |