加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

60年技术简史,带你读懂AI的前世今生

发布时间:2019-07-11 06:19:09 所属栏目:建站 来源:佚名
导读:人类的进化成长史就是一部人类制造和行使器材的汗青,差异的器材代表了人类的进化程度。从石器期间、铁器期间、蒸汽期间、电气期间再到此刻的信息期间,我们行使越发先辈便捷的器材来改变出产和糊口。 器材的目标是延长和拓展人类的手段,我们跑得不快,但

谁人时辰要实习较深的神经收集长短常tricky的工作,因此也有相同Glorot等人的《Understanding the difficulty of training deep feedforward neural networks》,各人在行使深度进修器材时也许会碰着Xavier初始化要领,这个要领的作者正是Xavier Glorot。谁人时辰能把超参数选好从而可以或许实习好的模子是一种”黑科技”,我记得尚有一本厚厚的书《Neural Networks: Tricks of the Trade》,专门先容各类tricks。

深度卷积神经收集

深度进修受到各人的存眷很大一个缘故起因就是Alex等人实现的AlexNet在LSVRC-2012 ImageNet这个角逐中取得了很是好的后果。从此,卷积神经收集及其变种被普及应用于各类图像相干使命。从2012年开始一向到2016年,每年的LSVRC角逐城市发生更深的模子和更好的结果。

Alex Krizhevsky在2012年的论文《ImageNet classification with deep convolutional neural networks》开启了这段”深度”竞争之旅。

2014年的冠军是GoogleNet,来自论文《Going deeper with convolutions》,它提出了Inception的布局,通过这种布局可以实习22层的深度神经收集。它同年的亚军是VGGNet,它在模子布局上并没有太多调动,只是通过一些能力让卷积收集变得更深(18层)。

2015年的冠军是ResNet,来自何恺明等人的论文《Deep residual learning for image recognition》,通过引入残差布局,他们可以实习152层的收集,2016年的文章《Identity Mappings in Deep Residual Networks》对残差收集做了一些理论说明和进一步的改造。

2016年Google的Szegedy等人在论文《Inception-v4, inception-resnet and the impact of residual connections on learning》里提出了融合残差毗连和Incpetion布局的收集布局,进一步晋升了辨认结果。

下图是这些模子在LSVRC角逐上的结果,我们可以看到跟着收集的加深,分类的top-5错误率在逐渐降落。

60年技能简史,带你读懂AI的宿世此生

图:LSVRC角逐

方针检测和实例支解

前面的模子首要思量的是图片分类使命,方针检测和实例支解也是计较机视觉非经常见的使命。把深度卷积神经收集用到这两个使命上长短常天然的工作,可是这个使命除了必要知道图片里有什么物体,还必要精确的定位这些物体。为了把卷积神经收集用于这类使命,必要做许多改造事变。

虽然把CNN用于方针检测很是天然,最简朴的就是先对方针行使传统的要领举办定位,可是定位结果欠好。Girshick等人在2014年在论文《Rich feature hierarchies for accurate object detection and semantic segmentation》提出了R-CNN模子,行使Region Proposal来发生大量的候选地区,最后用CNN来判定是否是方针,但由于必要对全部的候推举办分类判定,因此它的速率很是慢。

60年技能简史,带你读懂AI的宿世此生

图:R-CNN

2015年,Girshick等人提出了Fast R-CNN,它通过RoI Pooling层通过一次计较同时计较全部候选地区的特性,从而可以实现快速计较。可是Regional Proposal自己就很慢,Ren等人在同年的论文《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》提出了Faster R-CNN,通过行使Region Proposal Networks(RPN)这个收集来更换原本的Region Proposal算法,从而实现及时方针检测算法。为了办理方针物体在差异图像中差异尺寸(scale)的题目,Lin等人在论文《Feature Pyramid Networks for Object Detection》里提出了Feature Pyramid Networks(FPN)。

60年技能简史,带你读懂AI的宿世此生

图:Fast R-CNN

60年技能简史,带你读懂AI的宿世此生

图:Faster R-CNN

由于R-CNN在方针检测使命上很好的结果,把Faster R-CNN用于实例支解是很天然的设法。可是RoI Pooling在用于实例支解时会有较量大的毛病,缘故起因在于Region Proposal和RoI Pooling都存在量化的舍入偏差。因此何恺明等人在2017年提出了Mask R-CNN模子。

60年技能简史,带你读懂AI的宿世此生


图:Mask R-CNN

从这一系列文章我们可以看到深度进修应用于一个更伟大场景的进程:起首是在一个伟大的进程中部门行使深度神经收集,最后把全部的进程End-to-End的用神经收集来实现。

另外,Redmon等人《You only look once: Unified, real-time object detection》提出了YOLO模子(包罗后续的YOLOv2和YOLOv3等),Liu等人也提出的SSD: Single Shot MultiBox Detector模子,这些模子的目标是为了保持精确率不降落的前提下怎么加速检测速率。

天生模子

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读