博舍

CVPR 2023文档图像分析与识别相关论文22篇分类简介 图像识别的论文怎么写的好一点

CVPR 2023文档图像分析与识别相关论文22篇分类简介

CVPR2020文档图像分析与识别相关论文22篇简介

    今年CVPR与STR(场景文字识别)或DAR(文档图像分析与识别)相关的论文共22篇,相比于去年(CVPR2019,17篇)增加了5篇,表明此领域的研究热度在持续增加。致力于场景文字检测、场景文字识别、文本数据合成、手写文字分析与识别、文档图像版面分析、文本VQA等十个类别(标*的论文表示该论文方法的代码已开源,共有9篇论文的代码已经开源,另外1篇论文公开了数据集)。

CVPR2020论文PDF全文已经可在官方网站下载,链接如下:

http://openaccess.thecvf.com/CVPR2020.py

百度网盘下载地址如下:

链接:https://pan.baidu.com/s/1_uGK-nuwewrmKRXh6nxRCw

提取码:dsys

    

1、场景文字检测(2篇)01、DeepRelationalReasoningGraphNetworkforArbitraryShapeTextDetection*

02、ContourNet: Taking aFurtherStepTowardAccurateArbitrary-ShapedSceneTextDetection*

2、场景文字识别(4篇)03、SCATTER:SelectiveContextAttentionalSceneTextRecognizer

04、TowardsAccurateSceneTextRecognitionWithSemanticReasoningNetworks

05、SEED: SemanticsEnhancedEncoder-DecoderFrameworkforSceneTextRecognition*

06、OnVocabularyRelianceinSceneTextRecognition

3、端到端文字检测+识别(1篇)07、ABCNet:Real-TimeSceneTextSpottingWithAdaptiveBezier-CurveNetwork*

4、场景文字识别对抗攻击(1篇)08、WhatMachinesSeeIsNotWhatTheyGet:FoolingSceneTextRecognitionModelsWithAdversarialTextImages

5、文本数据合成/数据增广/风格迁移/场景文字编辑(5篇)09、ScrabbleGAN:Semi-SupervisedVaryingLengthHandwrittenTextGeneration

10、LearntoAugment:JointDataAugmentationandNetworkOptimizationforTextRecognition*

11、UnrealText: SynthesizingRealisticSceneTextImagesFromtheUnrealWorld*

12、SwapText: ImageBasedTextsTransferinScenes

13、STEFANN: SceneTextEditorUsingFontAdaptiveNeuralNetwork*

6、文档图像处理(去阴影、碎片文档重构)(2篇)14、BEDSR-Net: ADeepShadowRemovalNetworkFromaSingleDocumentImage (文中提到:本文数据集及代码将开源)

15、Fast(er)ReconstructionofShreddedTextDocumentsviaSelf-SupervisedDeepAsymmetricMetricLearning

7、手写文字分析与识别(2篇)16、SequentialMotifProfilesandTopologicalPlotsforOfflineSignatureVerification

17、OrigamiNet:Weakly-Supervised,Segmentation-Free,One-Step,FullPageTextRecognitionbylearningtounfold*

8、文档图像版面分析(1篇)18、Cross-DomainDocumentObjectDetection:BenchmarkSuiteandMethod

9、文本VQA(3篇)19、OntheGeneralValueofEvidence,andBilingualScene-TextVisualQuestionAnswering (数据集已公开)

20、Multi-ModalGraphNeuralNetworkforJointReasoningonVisionandSceneText

21、IterativeAnswerPredictionWithPointer-AugmentedMultimodalTransformersforTextVQA

10、其它(1篇)

    下面这篇论文严格来说是并不是OCR或DAR领域的论文(属于计算机视觉及图像处理基础化技术的论文),但鉴于MSER曾经是文字检测领域最重要的方法之一,故小编也把此文列入。

22、FastMSER*

原文地址:https://mp.weixin.qq.com/s/nvNRuaJPpCiwMxBb7_FePg

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇