图像识别经典论文汇总(按年份排,并附论文和模型链接)
1998年:LeNet《Gradient-basedLearningAppliedtoDocumentRecognition》
论文:http://lushuangning.oss-cn-beijing.aliyuncs.com/CNN%E5%AD%A6%E4%B9%A0%E7%B3%BB%E5%88%97/Gradient-Based_Learning_Applied_to_Document_Recognition.pdf卷积神经网络的开山之作
2012年:AlexNet《ImageNetClassificationwithDeepConvolutionalNeuralNetworks》
论文:https://dl.acm.org/doi/10.1145/3065386首次将卷积神经网络和深度学习应用于大型图像识别,提出来dropout层,为后来的BN层提供了灵感
2014年:R-CNN《Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation》
首次将目标检测和卷积神经网络结合起来,并应用到工业级别。R-CNN、fast-CNN、faster-CNN将目标的分割和识别合二为一。https://zhuanlan.zhihu.com/p/64694855https://blog.csdn.net/v1_vivian/article/details/78599229
2015年:SPPNet《SpatialPyramidPoolinginDeepConvolutionalNetworksforVisualRecognition》
论文:https://arxiv.org/abs/1406.4729借鉴了特征金字塔
2015年:GoogLeNetInceptionV1V2V3V4V1:《Goingdeeperwithconvolutions》V2:《BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift》V3:《RethinkingtheInceptionArchitectureforComputerVision》(2015年)
V1:https://link.csdn.net/?target=https%3A%2F%2Fieeexplore.ieee.org%2Fdocument%2F7298594V2:https://arxiv.org/pdf/1502.03167.pdfV3:https://arxiv.org/pdf/1512.00567.pdf更深的网络,直接解决计算和梯度递减问题
2015年:批量标准化GoogLeNetV2:《BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift》
论文:https://arxiv.org/pdf/1502.03167.pdf后来的网络逐渐开始使用BN层
2015年:VGGNet《VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition》
论文:[https://arxiv.org/abs/1409.1556](https://arxiv.org/abs/1409.1556)模型:https://worksheets.codalab.org/worksheets/0xe2ac460eee7443438d5ab9f43824a819使用了更深的网络,提出来预训练和权重初始化的重要性。开启了3*3的卷积时代,大大减少了参数量
2016年:ResNet《DeepResidualLearningforImageRecognition》
论文:https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1512.03385.pdf
2016年:Xception《Xception:DeepLearningwithDepthwiseSeparableConvolutions》
论文:https://arxiv.org/abs/1610.02357超越了ResNet和InceptionV3
2016年:Inception与ResNet结合的尝试《Inception-v4,Inception-ResNetandtheImpactofResidualConnectionsonLearning》
论文:https://arxiv.org/pdf/1602.07261.pdf
2017年:ResNet的改进ResNetV2《IdentityMappingsinDeepResidualNetworks》
论文:https://arxiv.org/abs/1603.05027对ResNet的改进
2017年:ResNet的一次改进DenseNet《DenselyConnectedConvolutionalNetworks》
论文:https://link.csdn.net/?target=https%3A%2F%2Fopenaccess.thecvf.com%2Fcontent_cvpr_2017%2Fhtml%2FHuang_Densely_Connected_Convolutional_CVPR_2017_paper.html模型:https://link.zhihu.com/?target=https%3A//github.com/liuzhuang13/DenseNet
2017年:ResNet的一次重大改进ResNext《AggregatedResidualTransformationsforDeepNeuralNetworks》
论文:https://arxiv.org/pdf/1611.05431.pdf模型:https://github.com/facebookresearch/ResNeXt
2017年:MobileNet《MobileNets:EfficientConvolutionalNeuralNetworksforMobileVisionApplications》
论文:https://arxiv.org/abs/1704.04861注意有V1,V2,V3
2017年:NASNet《LearningTransferableArchitecturesforScalableImageRecognition》
论文:https://arxiv.org/abs/1707.07012
2017年:SENet《Squeeze-and-ExcitationNetworks》
论文:https://arxiv.org/abs/1709.01507模型:https://github.com/hujie-frank/SENet引入注意力机制的卷积神经网络
2017年:ShuffleNet《ShuffleNet:AnExtremelyEfficientConvolutionalNeuralNetworkforMobileDevices》
论文:https://arxiv.org/abs/1707.01083#:~:text=We%20introduce%20an%20extremely%20computation-efficient%20CNN%20architecture%20named,to%20greatly%20reduce%20computation%20cost%20while%20maintaining%20accuracy.V1,V2版本
2018年:BagofTricks《BagofTricksforImageClassificationwithConvolutionalNeuralNetworks》
论文:https://arxiv.org/abs/1812.01187一些分类的常用技巧
2019年:EfficientNet《EfficientNet:RethinkingModelScalingforConvolutionalNeuralNetworks》
论文:https://arxiv.org/abs/1905.11946v5
2020年:ECA《ECA-Net:EfficientChannelAttentionforDeepConvolutionalNeuralNetworks》
论文:https://arxiv.org/abs/1910.03151注意力机制
2020年:RegNet《DesigningNetworkDesignSpaces》
论文:https://arxiv.org/abs/2003.13678
2020年:GhostNet《GhostNet:MoreFeaturesfromCheapOperations》
论文:https://arxiv.org/abs/1911.11907
2020年https://blog.csdn.net/fendouaini/article/details/109280085
2021年:EfficientNetV2《EfficientNetV2:SmallerModelsandFasterTraining》
论文:https://arxiv.org/abs/2104.00298
2021年:ResNet-RS《RevisitingResNets:ImprovedTrainingandScalingStrategies》
论文:https://arxiv.org/pdf/2103.07579.pdf
2021年有一些数据处理的论文。https://zhuanlan.zhihu.com/p/354936159
2022年:ConvNext《AConvNetforthe2020s》
论文:https://arxiv.org/abs/2201.03545
2022年图像处理https://zhuanlan.zhihu.com/p/478286484
遇到没见过的持续更新。。。
做一个人脸识别相关的毕业设计
本文旨在简单聊一下做一个与人脸识别相关的本科毕业设计,希望不是挖坑文。
背景:普通本科毕业设计大多是构建网站(购物、管理系统、论坛),相对来说老师看的也审美疲劳,当然如果买毕设的话价格会相对便宜。
本文不会过多涉及或者一开始会极少出现具体代码,毕竟只是简单探讨或是启发一下阅读者的思路,而非教程。
人脸识别的技术方法网上一搜一大堆,具体项目则是要和各类实际情况结合,比如某种情景下的人的统计,通过人脸识别进行考勤,识别特定人物等。
相关技术方法:Python、OpenCV、dlib
大体思路:
一.获取照片
这一步这一使用本地的图片,也可以通过摄像头拍摄照片,后者会与识别时使用的照片更为契合。
1. 具体方法
OpenCV调用摄像头获取图像并进行基础的处理(灰度等),Dlib进行特征获取,这里可以使用官方的识别模型或检测器。
例如shape_predictor_68_face_landmarks.dat dlib_face_recognition_resnet_model_v1.dat
可以直接从网上下载,一些用法和介绍可以见dlib官网介绍 http://dlib.net/
这是dlib官方训练好的模型,准确率较高,并且文档也较为丰富。
随后提取特征并可以存储在CSV文件中,方便之后使用。
2. 大体流程
二、识别
1.具体方法
此间的大致方法也是cv获取图像,调用模型处理并且和上面计算出的特征进行欧氏距离,比较一定阈值就判为识别成功。完成了识别后后续操作则根据项目来。
这里用到的模型是128维人脸识别模型,同样由Dlib官方提供。dlib_face_recognition_resnet_model_v1
理论上认为0.5的阈值就可以达到一个颇为理想的数值,但是考虑到现实情况较为恶劣的光照,所以可以调低了些。
2.大致流程
三、界面
1.具体方法,Python提供了Pyqt、tkinter等较为不错的库,如果考虑到风格或是个人习惯的话也可以用别的库来写界面,例如PyQt等,但是注意PyQt安装时可能会出现一定的问题,一定要对应好版本。
四、实践思路
那么具体实践肯定不能就做一个识别界面,扫一下告诉是谁,这样一点也没有意义。结合到具体生产实践中去,这就是我们所说的落地,也可以看作是毕业设计的加分项。
具体人脸识别的应用大概有这些,仅仅是思路,希望能给读者一些启发:考勤系统,门禁系统,识别特定目标人物,锁,等等。
具体demo可以github上搜索facerecognition等相关关键词
类似的:https://github.com/ageitgey/face_recognition
https://github.com/search?q=face+recognition
总结:本文初稿旨在简单探讨一个要求较低的设计项目的思路,虽然网上都有现成的代码和demo,但是结合这项技术还是较能做出一个一般院校中新颖的设计作品。
https://github.com/coneypo/Dlib_face_recognition_from_camera
这是一个很优秀的demo,极力推荐,博主可谓业界良心了欢迎评论探讨