加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

知道如何理解生物视觉和计算机视觉的区别吗

发布时间:2021-05-24 02:05:39 所属栏目:大数据 来源:互联网
导读:从人工智能技能的早期开拓开始,科学家就在空想可以或许缔造出可以看到外部天下的计较机。因为视觉这一成果对付人们的事变和糊口起着至关重要的浸染,因此破解计较机

从人工智能技能的早期开拓开始,科学家就在空想可以或许缔造出可以“看到”外部天下的计较机。因为视觉这一成果对付人们的事变和糊口起着至关重要的浸染,因此破解计较机视觉的暗码成为了开拓通用人工智能的首要步调之一。

 

可是,就像人工智能中必要实现的很多方针一样,计较机视觉的实现提及来轻易做起来难。麻省理工学院的科学家在1966年的夏日启动了一个“夏日视觉打算”, 旨在建设一个可以或许辨认图像中物体和配景地区的计较机体系,打算在两个月的时刻完成,但要实现这些方针,必要的时刻远远不止两个月。究竟上,直到2010年往后,图像分类器和工具检测器才变得足够机动和靠得住,可以在主流应用中行使。

 

在已往的几十年中,呆板进修和神经科学的成长辅佐计较机视觉取得了长足的前进。可是要建设一个像人类一样调查天下的人工智能体系,尚有很长的路要走。

 

哈佛医学院传授Gabriel Kreiman在其所著的《生物和计较机视觉》一书描写了人类和动物如那里理赏罚视觉数据以及在计较机上复制这些成果方面取得的盼望。

 

Kreiman编著的这本书有助于领略生物学和计较机视觉之间的差别。该书具体先容了数十亿年的演变如作甚人类和动物提供了伟大的视觉处理赏罚体系,以及怎样研究它开拓更好的计较机视觉算法。另外,还接头了当代计较机视觉体系与生物视觉体系的区别。

 

在此扼要列出这本著作的一些首要内容。

 

硬件差别

生物视觉运行在有机经元和皮层细胞上,而计较机视觉运行在晶体管和电子电路上

 

在《生物和计较机视觉》一书的简介中,Kreiman写道:“我对生物神经与计较电路之间的接洽感想出格欢快。生物视觉是数百万年进化的产品。而研究职员开拓计较模子时,可以从生物学中进修和相识怎样办理视觉题目,并将这些办理方案作为成立更好算法的灵感。”

 

究竟上,对视觉皮层的研究一向是计较机视觉和人工智能的灵感源泉。但在实现视觉的数字化成果之前,科学家必需降服生物视觉和计较机视觉之间庞大的硬件鸿沟。生物视觉在皮层细胞和有机神经元彼此毗连的收集上运行。而在另一方面,计较机视觉运行在由晶体管构成的电子芯片上。

 

架构差别

最近几十年来,深度进修规模开展了大量的创新事变,这辅佐计较机仿照了生物视觉的某些成果。受到动物视觉皮层研究的开导,卷积层在查找视觉数据中的模式方面很是有用。池化层有助于归纳综合卷积层的输出,并使其对视觉图案的位移不太敏感。卷积层和池化层堆叠在一路,可以从发明细小图案(物体的棱角和边沿等)到伟大的工具(面部、椅子、汽车等)。

 

可是,人工神经收集的高级架构与人们对哺乳动物视觉皮层的相识之间如故存在不匹配。

 

Kreiman说:“不幸的是,层这个术语有点暗昧。在计较机科学中,人们行使层来暗示差异的处理赏罚阶段(层首要相同于大脑地区)。在生物学中,每个大脑地区包括六个皮质层。我以为六层布局(其连通性与微电路相同)很是要害。人们还不清晰应该在神经收集中包括该电路的哪些方面。”

 

另外,正如Kreiman在《生物学和计较机视觉》一书中夸大的那样,大脑中的信息向多个偏向移动。光信号从视网膜移到下颞叶皮层,再移到视觉皮层的V1、V2和其他层。但每一层也向它的上一层提供反馈。在每一层中,神经元互相交互并转达信息。全部的彼此浸染和彼此接洽都有助于大脑弥补视觉输入的空缺,并在信息不完备时举办揣度。

 

对比之下,在人工神经收集中,数据凡是是单向移动的。卷积神经收集是一种“前馈收集”,这意味着信息只从输入层转达到更高层和输出层。

 

尚有一种叫做“反向撒播”的反馈机制,可以辅佐更正错误和调解神经收集的参数。但反向撒播算法计较劲大,而且仅用于神经收集的实习。今朝还不清晰反向撒播是否直接对应于皮质层的反馈机制。

 

另一方面,将较高层的输出与前一层的输入相团结的递归神经收集在计较机视觉中的应用还很有限。

 

 

Kreiman说,“当前的人工智能架构无法做到这一点。全部这些都将必要动态(人们并没有当即意识到这统统,而且凡是行使更多成果来领略图像)和自上而下的信号的整合。”

 

说话和知识等规模自己对付人工智能社区是一些庞大挑衅。但这些题目可否单独办理,并与愿景一路整合,照旧整合自己才是办理全部题目的要害,这尚有待调查。

 

Kreiman说:“在某个时辰,我们必要深入到认知的其他方面,很难想象假如不涉及说话和逻辑,怎样整合认知。我但愿在将来的几年,将更多的说话和逻辑融入到视觉模子中(可能反过来也将视觉融入到说话模子中),这将会有令人欢快的重大盼望。”

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读