图像识别经典论文汇总（按年份排，并附论文和模型链接）图像识别毕业论文难吗

发表时间：2023-07-13 21:26:04

图像识别经典论文汇总（按年份排，并附论文和模型链接）

1998年：LeNet

《Gradient-basedLearningAppliedtoDocumentRecognition》

论文：http://lushuangning.oss-cn-beijing.aliyuncs.com/CNN%E5%AD%A6%E4%B9%A0%E7%B3%BB%E5%88%97/Gradient-Based_Learning_Applied_to_Document_Recognition.pdf卷积神经网络的开山之作

2012年：AlexNet

《ImageNetClassificationwithDeepConvolutionalNeuralNetworks》

论文：https://dl.acm.org/doi/10.1145/3065386首次将卷积神经网络和深度学习应用于大型图像识别，提出来dropout层，为后来的BN层提供了灵感

2014年：R-CNN

《Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation》

首次将目标检测和卷积神经网络结合起来，并应用到工业级别。R-CNN、fast-CNN、faster-CNN将目标的分割和识别合二为一。https://zhuanlan.zhihu.com/p/64694855https://blog.csdn.net/v1_vivian/article/details/78599229

2015年：SPPNet

《SpatialPyramidPoolinginDeepConvolutionalNetworksforVisualRecognition》

论文：https://arxiv.org/abs/1406.4729借鉴了特征金字塔

2015年：GoogLeNetInceptionV1V2V3V4

V1：《Goingdeeperwithconvolutions》V2：《BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift》V3：《RethinkingtheInceptionArchitectureforComputerVision》(2015年)

V1:https://link.csdn.net/?target=https%3A%2F%2Fieeexplore.ieee.org%2Fdocument%2F7298594V2:https://arxiv.org/pdf/1502.03167.pdfV3:https://arxiv.org/pdf/1512.00567.pdf更深的网络，直接解决计算和梯度递减问题

2015年：批量标准化

GoogLeNetV2：《BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift》

论文：https://arxiv.org/pdf/1502.03167.pdf后来的网络逐渐开始使用BN层

2015年：VGGNet

《VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition》

论文：[https://arxiv.org/abs/1409.1556](https://arxiv.org/abs/1409.1556）模型：https://worksheets.codalab.org/worksheets/0xe2ac460eee7443438d5ab9f43824a819使用了更深的网络，提出来预训练和权重初始化的重要性。开启了3*3的卷积时代，大大减少了参数量

2016年：ResNet

《DeepResidualLearningforImageRecognition》

论文：https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1512.03385.pdf

2016年：Xception

《Xception:DeepLearningwithDepthwiseSeparableConvolutions》

论文：https://arxiv.org/abs/1610.02357超越了ResNet和InceptionV3

2016年：Inception与ResNet结合的尝试

《Inception-v4,Inception-ResNetandtheImpactofResidualConnectionsonLearning》

论文：https://arxiv.org/pdf/1602.07261.pdf

2017年：ResNet的改进ResNetV2

《IdentityMappingsinDeepResidualNetworks》

论文：https://arxiv.org/abs/1603.05027对ResNet的改进

2017年：ResNet的一次改进DenseNet

《DenselyConnectedConvolutionalNetworks》

论文：https://link.csdn.net/?target=https%3A%2F%2Fopenaccess.thecvf.com%2Fcontent_cvpr_2017%2Fhtml%2FHuang_Densely_Connected_Convolutional_CVPR_2017_paper.html模型：https://link.zhihu.com/?target=https%3A//github.com/liuzhuang13/DenseNet

2017年：ResNet的一次重大改进ResNext

《AggregatedResidualTransformationsforDeepNeuralNetworks》

论文：https://arxiv.org/pdf/1611.05431.pdf模型：https://github.com/facebookresearch/ResNeXt

2017年：MobileNet

《MobileNets:EfficientConvolutionalNeuralNetworksforMobileVisionApplications》

论文：https://arxiv.org/abs/1704.04861注意有V1，V2，V3

2017年：NASNet

《LearningTransferableArchitecturesforScalableImageRecognition》

论文：https://arxiv.org/abs/1707.07012

2017年：SENet

《Squeeze-and-ExcitationNetworks》

论文：https://arxiv.org/abs/1709.01507模型：https://github.com/hujie-frank/SENet引入注意力机制的卷积神经网络

2017年：ShuffleNet

《ShuffleNet:AnExtremelyEfficientConvolutionalNeuralNetworkforMobileDevices》

论文：https://arxiv.org/abs/1707.01083#:~:text=We%20introduce%20an%20extremely%20computation-efficient%20CNN%20architecture%20named,to%20greatly%20reduce%20computation%20cost%20while%20maintaining%20accuracy.V1，V2版本

2018年：BagofTricks

《BagofTricksforImageClassificationwithConvolutionalNeuralNetworks》

论文：https://arxiv.org/abs/1812.01187一些分类的常用技巧

2019年：EfficientNet

《EfficientNet:RethinkingModelScalingforConvolutionalNeuralNetworks》

论文：https://arxiv.org/abs/1905.11946v5

2020年：ECA

《ECA-Net:EfficientChannelAttentionforDeepConvolutionalNeuralNetworks》

论文：https://arxiv.org/abs/1910.03151注意力机制

2020年：RegNet

《DesigningNetworkDesignSpaces》

论文：https://arxiv.org/abs/2003.13678

2020年：GhostNet

《GhostNet:MoreFeaturesfromCheapOperations》

论文：https://arxiv.org/abs/1911.11907

2020年

https://blog.csdn.net/fendouaini/article/details/109280085

2021年：EfficientNetV2

《EfficientNetV2:SmallerModelsandFasterTraining》

论文：https://arxiv.org/abs/2104.00298

2021年：ResNet-RS

《RevisitingResNets:ImprovedTrainingandScalingStrategies》

论文：https://arxiv.org/pdf/2103.07579.pdf

2021年

有一些数据处理的论文。https://zhuanlan.zhihu.com/p/354936159

2022年：ConvNext

《AConvNetforthe2020s》

论文：https://arxiv.org/abs/2201.03545

2022年

图像处理https://zhuanlan.zhihu.com/p/478286484

遇到没见过的持续更新。。。

做一个人脸识别相关的毕业设计

本文旨在简单聊一下做一个与人脸识别相关的本科毕业设计，希望不是挖坑文。

背景：普通本科毕业设计大多是构建网站（购物、管理系统、论坛），相对来说老师看的也审美疲劳，当然如果买毕设的话价格会相对便宜。

本文不会过多涉及或者一开始会极少出现具体代码，毕竟只是简单探讨或是启发一下阅读者的思路，而非教程。

人脸识别的技术方法网上一搜一大堆，具体项目则是要和各类实际情况结合，比如某种情景下的人的统计，通过人脸识别进行考勤，识别特定人物等。

相关技术方法：Python、OpenCV、dlib

大体思路：

一.获取照片

这一步这一使用本地的图片，也可以通过摄像头拍摄照片，后者会与识别时使用的照片更为契合。

1. 具体方法

OpenCV调用摄像头获取图像并进行基础的处理（灰度等），Dlib进行特征获取，这里可以使用官方的识别模型或检测器。

例如shape_predictor_68_face_landmarks.dat dlib_face_recognition_resnet_model_v1.dat

可以直接从网上下载，一些用法和介绍可以见dlib官网介绍 http://dlib.net/

这是dlib官方训练好的模型，准确率较高，并且文档也较为丰富。

随后提取特征并可以存储在CSV文件中，方便之后使用。

2. 大体流程

二、识别

1.具体方法

此间的大致方法也是cv获取图像，调用模型处理并且和上面计算出的特征进行欧氏距离，比较一定阈值就判为识别成功。完成了识别后后续操作则根据项目来。

这里用到的模型是128维人脸识别模型，同样由Dlib官方提供。dlib_face_recognition_resnet_model_v1

理论上认为0.5的阈值就可以达到一个颇为理想的数值，但是考虑到现实情况较为恶劣的光照，所以可以调低了些。

2.大致流程

三、界面

1.具体方法，Python提供了Pyqt、tkinter等较为不错的库，如果考虑到风格或是个人习惯的话也可以用别的库来写界面，例如PyQt等，但是注意PyQt安装时可能会出现一定的问题，一定要对应好版本。

四、实践思路

那么具体实践肯定不能就做一个识别界面，扫一下告诉是谁，这样一点也没有意义。结合到具体生产实践中去，这就是我们所说的落地，也可以看作是毕业设计的加分项。

具体人脸识别的应用大概有这些，仅仅是思路，希望能给读者一些启发：考勤系统，门禁系统，识别特定目标人物，锁，等等。

具体demo可以github上搜索facerecognition等相关关键词

类似的：https://github.com/ageitgey/face_recognition

https://github.com/search?q=face+recognition

总结：本文初稿旨在简单探讨一个要求较低的设计项目的思路，虽然网上都有现成的代码和demo，但是结合这项技术还是较能做出一个一般院校中新颖的设计作品。

https://github.com/coneypo/Dlib_face_recognition_from_camera

这是一个很优秀的demo，极力推荐，博主可谓业界良心了

欢迎评论探讨

图像识别经典论文汇总（按年份排，并附论文和模型链接） 图像识别毕业论文难吗