手写文字识别
尊敬的合作伙伴:
为贯彻落实国务院相关部署要求,着力整治骚扰电话扰民问题,工信部新发布《综合整治骚扰电话专项行动方案》、《关于推进综合整治骚扰电话专项行动的工作方案》等方案对整治骚扰电话进行相关指导。讯飞开放平台在此基础上更新服务协议,请各位合作伙伴认真阅读并遵守:《讯飞开放平台用户服务协议》。
科大讯飞坚持源头技术创新,智能语音技术持续处于先进地位,并且积极打造围绕讯飞智能语音技术的产业生态,通过讯飞开放平台将语音能力开放给第三方合作伙伴。为促进社会稳定和维护平台的可持续发展,对于利用讯飞技术进行违规运营和操作的任何合作伙伴,平台将严格依据服务协议进行终止合作并追究相关法律责任。讯飞开放平台期待与合作伙伴们携手共进,共同维护平台运营秩序,用人工智能建设美好世界。
讯飞开放平台
2018年11月9日
手写汉字识别的发展综述
一、手写汉字识别的研究背景与现状在上个世纪60年代,美国IBM公司开始进行了对印刷体汉字的模式识别研究工作,1996年Casey和Nag用模板匹配法成功的识别出了1000个印刷体汉字,在全球范围内,汉字识别开始展开了。而就在这个时候,研究界对手写汉字识别也掀起了高潮。因为汉字在日语中占有一定的地位,手写体汉字识别(HCCR)在一开始是由日本率先尝试研究的,在80年代,国内开始了对手写汉字的研究,因为汉语作为我们的母语,汉字主要在我国广泛使用,对汉字的种类、内涵、造字原理国内的掌握情况较透彻,所以关于手写汉字识别的深入研究主要集中在国内。手写体汉字识别由于数据采集方式不同可以划分为脱机手写体汉字识别和联机手写体汉字识别两大类。联机手写汉字识别所处理的手写文字是书写者通过物理设备(如数字笔、数字手写板或者触摸屏)在线书写获取的文字信号,书写的轨迹通过定时采样即时输入到计算机中。而脱机手写文字识别所处理的手写文字是通过扫描仪或摄像头等图像捕捉设备采集到的手写文字二维图片。由于识别的对象不同,使得这两类手写识别技术所采用的方法和策略也不尽相同。前者的识别对象是一系列的按时间先后排列的采样点信息,而后者则是丢失了书写笔顺信息的二维像素信息,由于没有笔顺信息,加之由于拍照扫描设备在不同光照、分辨率、书写纸张等条件下,数字化会带来一定的噪声干扰,一般来说,脱机手写文字识别比联机手写文字识别更加困难。手写汉字识别是一个极具挑战性的模式识别及机器学习问题,主要表现在:1)书写方式随意,不规正,无法达到印刷体要求;2)汉字字符级别比较繁杂,极具变化特点;3)诸多汉字在外形上相似,容易混淆;4)要求具备庞大的训练数据,但采集困难,特别是随意性、无约束性手写,对应数据库的构建显得力不从心。可见,手写汉字识别进步空间较大,需要综合各项技术,增加训练样本数据,提升识别率。一般而言,传统的手写中文单字识别系统主要包括数据预处理、特征提取和分类识别三部分。然而,近些年来,传统的手写汉字识别框架进展并不明显,原地踏步,急需寻找其它的解决方案。而深度学习正满足了手写汉字识别革新需求。实践证明,在深度学习技术协助下,联机HCCR、脱机HCCR的识别率都大为提升,同原有的识别技术相比进步非常明显。
二、深度学习模型典型的深度学习结构包括:1.深度置信网络(DBN)[1],2006年,Hinton等人在长期研究后,推出了DBN。DBN极具创造性,囊括了无监督逐层训练理念,对神经网络隐藏层进行了丰富,壮大了训练方法。在DBN结构下,模型参数的初始解更加合理。利用无监督逐层训练,还能够进行层次性学习。2.CNN的最早雏形理念是由Fukushima在1980年首次提出,LeCun等将反向传播算法(Back-propagation,BP)用于卷积结构,提出了层与层之间局部连接且具有多层结构的卷积神经网络模型[2]。作为前馈神经网络,CNN非常适用于处理大型图像。在CNN架构中,设计有特征提取层、映射层。LeCun在卷积结构中应用反向传播算法,使卷积神经网络模型结构层次不断增加。在新结构层中,可看到交替的卷积聚合层。2012年,Krizhevsky加深了CNN,在Dropout、ReLU技术下,取得了ImageNet比赛的胜利[3]。3.2007年,Ranzato对深度学习结构进行了创新,得到层叠自动编码机架构。这样,原来的RBM由AE(自动编码机)取代,神经网络结构共2层,具有无监督特点。4.同SAE、CNN、DBN不同的是,RNN中的输出结果受到不同时期输入影响,此类神经网络具有存储记忆功能。也就是说,当前、过去输入,以及未来可能存在的输入都会对输出进行重建。在训练时,RNN也会生成反向传播算法,即BPTT。但是,在记忆时间上是短暂的,无法长期保存。近年来还涌现出不少别的深度学习模型,其中一类值得关注的模型是深度强化学习(DRN)[4],例如GoogleDeepMind团队2015年提出的深度Q网络(DQN),其在模拟人的智能及在线强化学习方面表现出优异的性能。
三、基于深度学习的手写汉字识别1.基于CNN的端到端的识别方法
2012年,多列CNN模型(MCDNN)由IDSIA实验室推出,同样具有“端-端”特点。MCDNN中,需要对CNN网络进行GPU训练,并平均集成CNN输出;以图像的形式转换联机、脱机手写样本,并通过CNN训练。在训练时,拒绝特征选择、提取,识别结果便是CNN输出结果。MCDNN在脱机及联机中文识别均取得了当时最先进水平的识别结果。
2.结合领域知识的CNN识别方法
虽然以MCDNN为代表的端到端的CNN模型设计简单,也取得了优异的识别性能,但端到端的方法一个不足之处在于其没有很好地利用要手写文字的一些先验领域知识,例如联机时序信息、领域相关的数据生成技术、方向变换特征等,而这些领域信息是无法通过CNN网络自动学习而获取的。下面将介绍近年来传统领域知识和CNN相结合的手写汉字识别方法。
数据生成技术:为了避免在训练过程中出现过拟合以及提升CNN模型的识别性能,除了采用Dropout等一些经典的方法之外,获取充足的训练样本是保障CNN等模型获得高性能的前提。但很多时候我们获得的训练样本是十分有限的,因此,数据增加技术是一种非常重要的提升CNN系统鲁棒性及推广能力的技术。2)方向变换特征:Graham等人不仅对稀疏CNN模型进行了研究,也对CNN输入层开展了全新的知识路径积分特征分析[5]。经实践,新技术能够提取联机时序信息特征,准确度比较高。在知识路径中,还加入了特征图。为此,同MCDNN法相比,识别CASIA-OLHWDB数据集的操作显得更为方便,速度更快,准确性更高。3.其他改进的CNN识别方法
在手写汉字识别领域,为了进一步提升深度学习模型的性能,研究人员除了加大模型深度和宽度及将传统领域知识与深度模型相结合之外,还对深度学习的网络结构和训练方法进行了各种改进。例如,CNN中常见最大值聚合操作的大小和步长一般都是整数,Graham[6]对此提出了更一般化的分数最大值聚合方法。除此之外,研究者对深度模型的样本训练方式也做出了改进。Yang等[7]从心理学对人的记忆遗忘规律的研究中受到启发,提出DropSample样本训练技术。另外,文献[8]提出了两种改进的CNN模型用于脱机手写汉字识别:RelaxationCNN(R-CNN)及AlternatelytrainingCNN(ART-CNN)。
4.基于其他深度模型的识别方法
拥有多个隐层的全连接神经网络一般可以统称为DNN,例如含有多个隐藏层的多层感知器神经网络,传统的多层神经网络的训练容易过拟合、容易陷入局部最优,而且随着层数加深会出现梯度弥散等问题。2014年,Du等[9]将传统方法和DBN方法结合,使用了三种分类器:原型距离、DNN和Bottleneck特征分类器。原型分类器由聚类算法构建,使用基于最大样本分离边界的最小分类误差准则进一步改进,是一个小型且高效的分类器。两个主流的深度神经网络CNN和DBN相比较而言,CNN不需要预训练,则相比于DBN的逐层预训练要省时,同时CNN因为加入卷积操作,能够更好处理图像信息,DBN则主要处理一维的数据,因此在手写体汉字识别中,CNN比DBN略胜一筹。此外,SAE等其他深度模型在大类别手写中文文字识别中的成功应用报道尚不多见。
5.基于RNN/LSTM的文本行识别方法
如前文所述,采用深度学习等技术之后,目前手写单字符识别问题已经在某种程度上获得了较好的解决,但相对单字符识别而言,含序列信息的手写文本行识别仍然是此领域还未解决的难点问题之一。针对此问题,一个有极大潜力的解决办法是应用深度学习方法中回归神经网络(RNN)模型,特别是LSTM和BLSTM等模型,由于对序列数据有很好的建模能力,因此它们更适合于解决诸如包含时序先后顺序信息的文字行识别问题。
四、总结、讨论与展望本文简要回顾了手写体汉字识别的研究背景,介绍了传统手写汉字识别系统中各个主要步骤所涉及到主要技术,指出当前研究的主要困难及所面临的挑战。然后介绍了CNN、RNN、LSTM、SAE、DBN等几种主要的深度学习模型。在此基础上,详细综述及分析了近年来采用基于深度学习的方法在联机及脱机手写体汉字识别的最新进展,总结了各种深度学习模型在手写体汉字识别的研究现状。手写体汉字识别经历了四十多年的长足发展,在单字和文本行识别性能上有了很大的提高,特别是以CNN为代表的一系列深度学习模型的出现,手写单字符中文识别问题已经基本上得到了很好解决,无论是联机还是脱机手写中文字符识别,目前基于CNN及其改进模型的方法均取得了接近甚至是超过人眼识别性能的高识别率。然而,在手写汉字识别领域,仍然很多值得研究的问题有待解决,例如:1)手写文本行识别问题:目前基于深度学习模型的联机及脱机手写文本行识别的成功报道很少。对于联机中文手写文本行识别,目前最好的识别率指标均才达到95%左右,而脱机手写文本行识别最好的指标仅为90%左右[10],特别是以整行为单位来评价识别率,行级别的识别率将会很低,仍然有很大的提升空间。可以说联机及脱机手写文本行识别仍然是未解决的难题。2)无约束的手写文字识别问题:其中一个值得关注的研究问题是旋转无关的手写识别问题,根据2010年发布的国家标准GB/T18790-2010“联机手写汉字识别系统技术要求与测试规程”,手写输入软件及设备必须要能识别±45度的手写样本,然而目前市场上的绝大部分主流输入法产品均无法满足此要求。尽管一些研究人员注意到此问题,并开展了不少前期探索工作,但总体而言,此问题仍然远未得到有效解决。相信深度学习新技术的出现,将为解决此问题提供崭新的思路及技术手段。另外,目前的研究工作绝大部分局限于解决简单的问题,例如单字符识别或简单的文本行识别,对于联机手写重叠文本行识别、混合手写单字/文本行/重叠以及来自整屏任意无约束书写的手写汉字识别的研究工作仍然鲜有报道,这是一个值得研究的课题。3)超大类别手写汉字识别问题:目前手写汉字识别研究报道所能识别的文字类型基本上以国标一级字库3755类汉字为主,针对实际应用场景下要能识别10000个以上类别的实用化手写识别研究的报道还不多,且缺乏公开的超大类别(例如支持GB8010-2000标准的27533类)训练及测试数据集。在如此大类别的情况下,如何研究一个处理速度快、模型参数足够小的可实用化的基于深度学习的解决方案将变得极具挑战性。因此,超大规模数据集的构建、针对各种深度学习模型的快速算法、深度学习模型的参数压缩技术等问题仍然需要研究人员的继续探索及解决。此外,超大类别还有一个很大的应用是古籍文献及手稿的内容识别及检索,中国古籍的字符类别超过3万类,而且有更多的变体字和相似字,如何解决训练样本不足的问题以及如何设计超大类别分类器都是值得关注的问题。4)新的深度学习模型在手写汉字识别中的应用研究:目前在手写汉字识别领域能取得比传统方法明显好的深度学习模型主要是基于CNN及其各种改进方法,其他的深度学习模型如DBN、RNN、LSTM/BLSTM/MDLSTM以及深度强化学习(DRN)模型在大类别手写汉字识别中的研究工作开展得还不多,各种深度学习模型之间的相互联系及融合应用的研究并不深入,我们十分期待其他的深度学习模型以及未来能有更新更好的针对文字识别的深度模型能提出来,并在手写汉字识别领域能取得突破性进展,从而促进此领域的研究及发展。5)自然场景中的文字检测与识别:近年来,随着大量的互联网图片爆炸式增长,自然场景中的文字检测及识别成为文字识别乃至计算机视觉领域一个极其重要和广受关注的热点研究课题,深度学习理论及技术的出现和发展为解决这一极具挑战的难题提供了很好的解决方案,近年来已经出现了大量研究成果[11]。但与传统的MSER框架的方法相比,深度学习的方法处理速度慢、模型参数存储量大等也亟待解决。此外,目前绝大多数研究工作是针对英文语言,针对中文的自然场景文字检测及识别的研究报道还不多见,而自然场景图像中的手写汉字检测及识别方面的研究工作开展的还很少,要解决这些问题任重而道远。总体而言,深度学习为解决手写汉字识别提供了新的理念及技术,近几年来也在此领域诸多方面取得了大量的研究成果,但仍然有不少研究问题值得进一步研究。
参考文献[1]HintonGE,SalakhutdinovRR.Reducingthedimensionalityofdatawithneuralnetworks.Science,2006,313(5786):504-507[2]LeCunY,BoserB,DenkerJS,HendersonD,HowardRE,HubbardW,JackelLD.Backpr-opagationappliedtohand-writtenzipcoderecognition.NeuralComputation,1989,1(4):541-551[3]RussakovskyO,DengJ,SuH,KrauseJ,SatheeshS,MaSA,HuangZH,KarpathyA,KhoslaA,BernsteinM,BergAC,LiFF.ImageNetlargescalevisualrecognitionchallenge.InternationalJournalofComputerVision,2015,115(3):211-252[4]LittmanML.Reinforcementlearningimprovesbehaviourfromevaluativefeedback.Nature,2015,521(7553):445-451[5]GrahamB.Spatially-sparseconvolutionalneuralnetworks.arXiv:1409.6070,2014.[6]GrahamB.Fractionalmax-pooling.arXiv:1412.6071,2014.[7]YangWX,JinLW,TaoDC,XieZC,FengZY.DropSample:anewtrainingmethodtoenhancedeepconvolutionalneuralnetworksforlarge-scaleunconstrainedhandwrittenChinesecharacterrecognition.arXiv:1505.05354,2015.[8]WuCP,FanW,HeY,SunJ,NaoiS.Handwrittencharacterrecognitionbyalternatelytrainedrelaxationconvolutionalneuralnetwork.In:Proceedingsofthe14thInternationalConferenceonFrontiersinHandwritingRecognition.Crete,Greece:IEEE,2014.291-296[9]DuJ,HuJS,ZhuB,WeiS,DaiLR.Astudyofdesigningcompactclassi¯ersusingdeepneuralnetworksforonlinehandwrittenChinesecharacterrecognition.In:Proceedingsofthe22ndInternationalConferenceonPatternRecognition.Stockholm,Sweden:IEEE,2014.2950-2955[10]MessinaR,LouradourJ.Segmentation-freehandwrittenChinesetextrecognitionwithLSTM-RNN.In:Proceedingsofthe13thInternationalConferenceonDocumentAnalysisandRecognition.Tunis:IEEE,2015.171-175[11]JaderbergM,VedaldiA,ZissermanA.Deepfeaturesfortextspotting.In:Proceedingsofthe13thEuropeanConferenceComputerVision.Zurich,Switzerland:Springer,2014.512-528
在线高精度手写文字识别
1、如果图片方向正常,请不要选择“自动识别”,因为方向存在一定概率识别错了,从而造成整页乱码
2、PDF不能为长图片型PDF,否则可能会失败。
3、如果图片为长图片,建议先使用“长图片分割”功能先切割再转换
4、如果PDF有打开密码,请务必正确输入
5、收费转换拥有更好的转化效果和无次数限制
6、如果你有大量格式一样的图片需要准确识别处理,请联系邮箱客服(网站底部)
7、准确选择语言能提升识别率,例如:文档只包含数字则建议只勾选“数字”,其他都取消。
联机(脱机)手写汉字识别
1.知识了解1.1汉字识别的两类主流方法Onlinerecognition:联机识别,基于笔画轨迹Offlinerecognition:脱机识别,基于图像(联机手写汉字识别所处理的手写文字是书写者通过物理设备(如数字笔、数字手写板或者触摸屏)在线书写获取的文字信号,书写的轨迹通过定时采样即时输入到计算机中.而脱机手写文字识别所处理的手写文字是通过扫描仪或摄像头等图像捕捉设备采集到的手写文字二维图片。)
1.2样本——来源于同一个人的书写a:onlinecharactersamplesb:offlinecharactersamples联机识别能得到笔画的顺序、点的坐标等动态信息,而脱机识别则无法得到这些动态信息,这也导致在同种方法下,一般来说脱机识别的准确率小于联机识别。也就是说脱机手写文字识别比联机手写文字识别更加困难
1.3后文方法所用的数据库
训练数据库来源于CASIA测试数据库来源于ICDAR竞赛
1.4传统的手写中文单字识别系统(主要有三部分)数据预处理:样本归一化、平滑去噪、整形变换、伪样本生成、添加虚拟笔画(对联机数据)等。特征提取:结构特征,主要对汉字结构、笔画或部件进行分析来提取统计特征,例如方向特征,对脱机HCCR而言,Gabor特征及Gradient特征是目前比较好的两种方向特征提取方法。对联机HCCR而言,8方向特征是目前最有效的特征之一。分类识别:最常用的模型包括改进的二次判决函数(MQDF)、支持向量机(SVM)、隐马尔科夫模型(HMM)、鉴别学习二次判决函数(DLQDF)和学习矢量量化(LVQ)等。注:对手写字符而言,目前最好的特征基本上都是统计特征2.脱机手写汉字识别2.1脱机手写识别——方法比较
脱机方法的比较:传统的方法与人工识别有较大的差距。通过三场比赛(图中红框部分),识别准确率逐渐提高。。第八行的方法首次超越了人类识别的准确率。而且通过对10个模型的集成,精度进一步提高到96.74%(第10行)。富士通团队通过使用适当的样本生成(局部和全局失真)、多监督训练和多模型集成进一步改进了他们的系统:单个网络(第11行)的准确率达到96.58%,5个网络的综合,准确率提高到96.79%(第12行),是除论文方法外脱机HCCR最好的结果。
2.2Gabor-GoogLeNet 19层网络利用Gabor进行特征提取,获取8个方向的Gabor特征图;将8个Gabor特征映射添加到输入层和原始图像中,从而构造N×N×9的输入层阵列(N×N表示输入图像的尺寸,此处取120)模型特点是使用了inception结构inception结构组成:1×1,3×3,5×5卷积,以及5×5的maxpooling;这个结构很好地利用了网络中的计算资源,并且在不增加计算负载的情况下,增加网络的宽度和深度。CNN-Voting-5首先将原始图像进行变形局部变形:结合三维(X,Y,Z)随机变形技术进行大规模的数据生成,除文字模式图像上的X坐标、Y坐标外,将各像素的灰度值作为Z坐标的参数,生成各种变形模式全局变形:首先在一定范围内随机生成一个仿射变换,然后将该变换应用于原图像生成新的样本。投放进CNN模型投票,选出结果投票策略(1)在模型的输出中,如果某个类的投票比其他类多,那么这个类就是最终结果(2)如果排名靠前的类拥有相同的票数,那么这些类的置信度就会被加起来,置信度最高的类就是最终的结果3.联机手写汉字识别3.1联机手写体识别样本图:脱机手写汉字。每种颜色代表一个笔画,数字代表书写顺序。
3.2联机手写体识别——方法比较方法中较优的几种方法,以及论文(2018年)方法之间的比较。
人工识别传统方法神经网络3.3传统方法——DFE+DLQDFDFE:鉴别特征提取方法(DiscriminativefeaturelearningDLQDF:鉴别学习二次判决函数(Discriminativelearningquadraticdiscriminantfunction)获取directMaps,8×32×32的张量通常在每一张图上,提取8*8个点,特征维数为512通过GaussianBlurring来减小笔触位置变化的影响Box–Coxtransformation进行特征转换,目的在于增加数据的高斯性传统的方法也遵循了深度神经网络的设计思想高斯模糊可以看作是一个卷积模板,这是预先定义的,而不是从数据中学习。虽然Box-Cox变换不同于神经网络中广泛使用的激活,但它是一种非线性激活。然后,有一个完全连接的层和一个分类层。3.4传统方法与深度学习深度学习与传统方法相比,特征提取和分类都可以在深度学习模型中自动完成。深度学习模型可以看作是一个黑盒子,只需要输入图像就可以得到识别结果。相比之下,传统的分类方法通常需要人工特征设计和分类器的人工调优。3.5神经网络——PRCNN,VO-3UWarwick(PRCNN):字符以三维数组的形式进行编码将数组输入12层卷积神经网络网络结构:150C3-MP2-300C2-MP2-450C2-MP2-600C2-MP2-750C2-MP2-900N-3755N.训练数据集:CASIAOLHWDB1.0-1.2VO-3: 基于MyScript技术采用b-spline近似法对输入笔画进行规范化,提取动态和静态信息相结合的特征 将特征向量输入一个简单的多层感知器训练数据集:CASIA-OLHWDB1.0-1.13.6深度学习——directMap-ConvNet预处理:
形状规范化:伪2D双矩归一化(pseudo2Dbi-momentnormalization,P2DBMN)方向分解:将局部笔画方向(由两个相邻点构成的线段)分解成8个方向,然后生成每个方向的featuremap为笔触增加0.5的权重生成directmaps模型:
总共11层网络特点在于加入了adaptation层 3.7深度学习RNN预处理:(1)移除多余的点(2)坐标标准化
Tcos,Tdist为两个超参数。预处理之后,96个点减少为44个点且(0,0)坐标对应的是字符中心。这将使每个点更有信息,有利于RNN建模。RNN模型
均值化层全连接层结合LSTM/GRU全连接层和均值化层均采用dropout策略结合LSTM/GRU,实验结果表明GRU优于LSTM,针对论文设计的神经网络来说。集成策略(1)在只有一个子序列的情况下,该算法的准确率低于全序列。 (2)随着集合中随机采样的子序列越来越多,分类准确率逐渐提高
集成策略结论(1)一个子序列低于全序列是因为有信息丢失 (2)结果验证了使用drop进行基于集合的序列分类的有效性。 (3)论文将这6种学习算法组合得到最优结果
3.8方法比较:DirectMap+convNet(CNN),RNN总结近几年,基于传统的“预处理+特征提取+分类器”的手写汉字识别框架似乎并没有特别大的研究新进展,很少看到在识别性能上获得突破性进展的研究报道。但是,随着深度学习的兴起,我们注意到深度学习对手写汉字识别难题带来了新的活力和极其有效的解决方法。特别是2011年起,连续两届的ICDAR手写汉字识别比赛的获胜者都是采用基于深度学习或神经网络的方法。在2013年的ICDAR手写汉字比赛中,来自富士通公司的团队采用改进的CNN网络,获得了脱机手写汉字识别的第一名,识别率达94.77%;而来自英国华威大学的Graham利用深度稀疏卷积神经网络的方法,获得了联机手写汉字识别第一名,其识别率提升到97.39%。而在前文提到的最新的文章中,其方法更是使得脱机识别率达97.37%,而联机识别率高达98.15%。无论是联机还是脱机HCCR,基于深度学习的方法所取得的结果,均大幅度领先传统的方法,显示出深度学习的强大潜力。目前手写识别中,深度学习方法相比于传统方法,能达到更高的识别率,但是其训练和测试时间较长,字典存储偏大等问题,仍待进一步研究改进。
参考文献[1]Paliwal,M.S.A.K.,BidirectionalRecurrentNeuralNetworks.IEEETRANSACTIONSONSIGNALPROCESSING,1997:p.2673–2681.[2]FeiYin,Q.W.X.Z.,ICDAR2013ChineseHandwritingRecognitionCompetition.201312thInternationalConferenceonDocumentAnalysisandRecognition,2013:p.1464–1470.[3]Liu,C.,etal.,OnlineandofflinehandwrittenChinesecharacterrecognition:Benchmarkingonnewdatabases.PatternRecognition,2013.46(1):p.155-162.[4]C.Wu,W.F.Y.H.,HandwrittenCharacterRecognitionbyAlternatelyTrainedRelaxationConvolutionalNeuralNetwork.201414thInternationalConferenceonFrontiersinHandwritingRecognition,2014:p.291-296.[5]Salakhutdinov,N.S.G.H.,Dropout:ASimpleWaytoPreventNeuralNetworksfromOverfitting.JournalofMachineLearningResearch,2014.[6]ZhuoyaoZhong,L.J.Z.X.,HighPerformanceOfflineHandwrittenChineseCharacterRecognitionUsingGoogLeNetandDirectionalFeatureMaps.ICDAR,2015:p.846-850.[7]L.Chen,S.Wang,W.Fan,J.SunandS.Naoi,“Beyondhumanrecognition:ACNN-basedframeworkforhandwrittencharacterrecognition,”20153rdIAPRAsianConferenceonPatternRecognition(ACPR),KualaLumpur,2015,p.695-699.[8]Xu-YaoZhang,Y.B.C.L.,OnlineandOfflineHandwrittenChineseCharacterRecognition:AComprehensiveStudyandNewBenchmark.PatternRecognition,2017:p.348–360.[9]Zhang,X.,etal.,DrawingandRecognizingChineseCharacterswithRecurrentNeuralNetwork.IEEETransactionsonPatternAnalysisandMachineIntelligence,2018.40(4):p.849-862.
@Tinkbellxiao,个人觉得原文作者总结的很完整,对本人帮助很大。
原文地址:https://blog.csdn.net/qq_35337126/article/details/84639815
另:如需下载联机手写汉字数据集,点击此处,有详细的下载总结。Icanresisteverythingexcepttemptation.