ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构

- -

欢迎交流与转载，文章会同步发布在公众号：机器学习算法全栈工程师(Jeemy110). 卷积神经网络在视觉识别任务上的表现令人称奇. 好的CNN网络是带有上百万参数和许多隐含层的“庞然怪物”. 事实上，一个不好的经验规则是：网络越深，效果越好. AlexNet，VGG，Inception和ResNet是最近一些流行的CNN网络.

深度残差网络ResNet初探

- - IT瘾-geek

微软亚洲研究院 Kaiming He 博士在 2015 年凭借深度残差网络 Deep Residual Network (DRN) 在 Imagenet 比赛的识别、检测和定位三个任务、以及 COCO 比赛的检测和分割任务上都获得了冠军. 论文《 Deep Residual Learning for Image Recognition》获得 2016 CVPR best paper，ResNet因此声名大噪，很大程度上引发了 deep network 的革命.

tensorflow提取VGG特征 - weixin_38208741的博客 - CSDN博客

- -

vgg-16一种深度卷积神经网络模型，16表示其深度. 模型可以达到92.7%的测试准确度. 它的数据集包括1400万张图像，1000个类别. 一个简单的演示，提取VGG的pool5层特征，存储为.mat文件. 在我们的实际项目中，一般不会直接从第一层直接开始训练，而是通过在大的数据集上（如ImageNet）训练好的模型，把前面那些层的参数固定，在运用到我们新的问题上，修改最后一到两层，用自己的数据去微调（finetuning）,一般效果也很好.

使用dlib中的深度残差网络(ResNet)实现实时人脸识别 - supersayajin - 博客园

- -

opencv中提供的基于haar特征级联进行人脸检测的方法效果非常不好，本文使用dlib中提供的人脸检测方法（使用HOG特征或卷积神经网方法），并使用提供的深度残差网络（ResNet）实现实时人脸识别，不过本文的目的不是构建深度残差网络，而是利用已经训练好的模型进行实时人脸识别，实时性要求一秒钟达到10帧以上的速率，并且保证不错的精度.

ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构

为什么CNN模型战胜了传统的计算机视觉方法？

AlexNet

VGG16

GoogLeNet/Inception

ResNet

总结

相关 [resnet alexnet vgg] 推荐：