博舍

图像识别经典论文汇总(按年份排,并附论文和模型链接) 图像识别毕业论文难吗

图像识别经典论文汇总(按年份排,并附论文和模型链接)

1998年:LeNet

《Gradient-basedLearningAppliedtoDocumentRecognition》

论文:http://lushuangning.oss-cn-beijing.aliyuncs.com/CNN%E5%AD%A6%E4%B9%A0%E7%B3%BB%E5%88%97/Gradient-Based_Learning_Applied_to_Document_Recognition.pdf卷积神经网络的开山之作

2012年:AlexNet

《ImageNetClassificationwithDeepConvolutionalNeuralNetworks》

论文:https://dl.acm.org/doi/10.1145/3065386首次将卷积神经网络和深度学习应用于大型图像识别,提出来dropout层,为后来的BN层提供了灵感

2014年:R-CNN

《Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation》

首次将目标检测和卷积神经网络结合起来,并应用到工业级别。R-CNN、fast-CNN、faster-CNN将目标的分割和识别合二为一。https://zhuanlan.zhihu.com/p/64694855https://blog.csdn.net/v1_vivian/article/details/78599229

2015年:SPPNet

《SpatialPyramidPoolinginDeepConvolutionalNetworksforVisualRecognition》

论文:https://arxiv.org/abs/1406.4729借鉴了特征金字塔

2015年:GoogLeNetInceptionV1V2V3V4

V1:《Goingdeeperwithconvolutions》V2:《BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift》V3:《RethinkingtheInceptionArchitectureforComputerVision》(2015年)

V1:https://link.csdn.net/?target=https%3A%2F%2Fieeexplore.ieee.org%2Fdocument%2F7298594V2:https://arxiv.org/pdf/1502.03167.pdfV3:https://arxiv.org/pdf/1512.00567.pdf更深的网络,直接解决计算和梯度递减问题

2015年:批量标准化

GoogLeNetV2:《BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift》

论文:https://arxiv.org/pdf/1502.03167.pdf后来的网络逐渐开始使用BN层

2015年:VGGNet

《VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition》

论文:[https://arxiv.org/abs/1409.1556](https://arxiv.org/abs/1409.1556)模型:https://worksheets.codalab.org/worksheets/0xe2ac460eee7443438d5ab9f43824a819使用了更深的网络,提出来预训练和权重初始化的重要性。开启了3*3的卷积时代,大大减少了参数量

2016年:ResNet

《DeepResidualLearningforImageRecognition》

论文:https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1512.03385.pdf

2016年:Xception

《Xception:DeepLearningwithDepthwiseSeparableConvolutions》

论文:https://arxiv.org/abs/1610.02357超越了ResNet和InceptionV3

2016年:Inception与ResNet结合的尝试

《Inception-v4,Inception-ResNetandtheImpactofResidualConnectionsonLearning》

论文:https://arxiv.org/pdf/1602.07261.pdf

2017年:ResNet的改进ResNetV2

《IdentityMappingsinDeepResidualNetworks》

论文:https://arxiv.org/abs/1603.05027对ResNet的改进

2017年:ResNet的一次改进DenseNet

《DenselyConnectedConvolutionalNetworks》

论文:https://link.csdn.net/?target=https%3A%2F%2Fopenaccess.thecvf.com%2Fcontent_cvpr_2017%2Fhtml%2FHuang_Densely_Connected_Convolutional_CVPR_2017_paper.html模型:https://link.zhihu.com/?target=https%3A//github.com/liuzhuang13/DenseNet

2017年:ResNet的一次重大改进ResNext

《AggregatedResidualTransformationsforDeepNeuralNetworks》

论文:https://arxiv.org/pdf/1611.05431.pdf模型:https://github.com/facebookresearch/ResNeXt

2017年:MobileNet

《MobileNets:EfficientConvolutionalNeuralNetworksforMobileVisionApplications》

论文:https://arxiv.org/abs/1704.04861注意有V1,V2,V3

2017年:NASNet

《LearningTransferableArchitecturesforScalableImageRecognition》

论文:https://arxiv.org/abs/1707.07012

2017年:SENet

《Squeeze-and-ExcitationNetworks》

论文:https://arxiv.org/abs/1709.01507模型:https://github.com/hujie-frank/SENet引入注意力机制的卷积神经网络

2017年:ShuffleNet

《ShuffleNet:AnExtremelyEfficientConvolutionalNeuralNetworkforMobileDevices》

论文:https://arxiv.org/abs/1707.01083#:~:text=We%20introduce%20an%20extremely%20computation-efficient%20CNN%20architecture%20named,to%20greatly%20reduce%20computation%20cost%20while%20maintaining%20accuracy.V1,V2版本

2018年:BagofTricks

《BagofTricksforImageClassificationwithConvolutionalNeuralNetworks》

论文:https://arxiv.org/abs/1812.01187一些分类的常用技巧

2019年:EfficientNet

《EfficientNet:RethinkingModelScalingforConvolutionalNeuralNetworks》

论文:https://arxiv.org/abs/1905.11946v5

2020年:ECA

《ECA-Net:EfficientChannelAttentionforDeepConvolutionalNeuralNetworks》

论文:https://arxiv.org/abs/1910.03151注意力机制

2020年:RegNet

《DesigningNetworkDesignSpaces》

论文:https://arxiv.org/abs/2003.13678

2020年:GhostNet

《GhostNet:MoreFeaturesfromCheapOperations》

论文:https://arxiv.org/abs/1911.11907

2020年

https://blog.csdn.net/fendouaini/article/details/109280085

2021年:EfficientNetV2

《EfficientNetV2:SmallerModelsandFasterTraining》

论文:https://arxiv.org/abs/2104.00298

2021年:ResNet-RS

《RevisitingResNets:ImprovedTrainingandScalingStrategies》

论文:https://arxiv.org/pdf/2103.07579.pdf

2021年

有一些数据处理的论文。https://zhuanlan.zhihu.com/p/354936159

2022年:ConvNext

《AConvNetforthe2020s》

论文:https://arxiv.org/abs/2201.03545

2022年

图像处理https://zhuanlan.zhihu.com/p/478286484

遇到没见过的持续更新。。。

做一个人脸识别相关的毕业设计

本文旨在简单聊一下做一个与人脸识别相关的本科毕业设计,希望不是挖坑文。

背景:普通本科毕业设计大多是构建网站(购物、管理系统、论坛),相对来说老师看的也审美疲劳,当然如果买毕设的话价格会相对便宜。

本文不会过多涉及或者一开始会极少出现具体代码,毕竟只是简单探讨或是启发一下阅读者的思路,而非教程。

人脸识别的技术方法网上一搜一大堆,具体项目则是要和各类实际情况结合,比如某种情景下的人的统计,通过人脸识别进行考勤,识别特定人物等。

 

相关技术方法:Python、OpenCV、dlib

 

大体思路:

一.获取照片

这一步这一使用本地的图片,也可以通过摄像头拍摄照片,后者会与识别时使用的照片更为契合。

    1. 具体方法

    OpenCV调用摄像头获取图像并进行基础的处理(灰度等),Dlib进行特征获取,这里可以使用官方的识别模型或检测器。

例如shape_predictor_68_face_landmarks.dat     dlib_face_recognition_resnet_model_v1.dat

可以直接从网上下载,一些用法和介绍可以见dlib官网介绍  http://dlib.net/

这是dlib官方训练好的模型,准确率较高,并且文档也较为丰富。

随后提取特征并可以存储在CSV文件中,方便之后使用。

 

   2. 大体流程

     

 

二、识别

   1.具体方法

     此间的大致方法也是cv获取图像,调用模型处理并且和上面计算出的特征进行欧氏距离,比较一定阈值就判为识别成功。完成了识别后后续操作则根据项目来。

这里用到的模型是128维人脸识别模型,同样由Dlib官方提供。dlib_face_recognition_resnet_model_v1

理论上认为0.5的阈值就可以达到一个颇为理想的数值,但是考虑到现实情况较为恶劣的光照,所以可以调低了些。

   2.大致流程

  

三、界面

1.具体方法,Python提供了Pyqt、tkinter等较为不错的库,如果考虑到风格或是个人习惯的话也可以用别的库来写界面,例如PyQt等,但是注意PyQt安装时可能会出现一定的问题,一定要对应好版本。

四、实践思路

那么具体实践肯定不能就做一个识别界面,扫一下告诉是谁,这样一点也没有意义。结合到具体生产实践中去,这就是我们所说的落地,也可以看作是毕业设计的加分项。

具体人脸识别的应用大概有这些,仅仅是思路,希望能给读者一些启发:考勤系统,门禁系统,识别特定目标人物,锁,等等。

 

具体demo可以github上搜索facerecognition等相关关键词

类似的:https://github.com/ageitgey/face_recognition

https://github.com/search?q=face+recognition

总结:本文初稿旨在简单探讨一个要求较低的设计项目的思路,虽然网上都有现成的代码和demo,但是结合这项技术还是较能做出一个一般院校中新颖的设计作品。

https://github.com/coneypo/Dlib_face_recognition_from_camera

这是一个很优秀的demo,极力推荐,博主可谓业界良心了

欢迎评论探讨

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇