关于文字识别的发展简史
原标题:关于文字识别的发展简史本文是一篇专业性很强的文章,系统的为您介绍文字识别的发展历史:首先文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分。下面请跟随笔者一起来看下它的发展历程。
文字识别简介文字识别,俗称光学字符识别,英文全称是OpticalCharacterRecognition(简称OCR),它是利用光学技术和计算机技术把印刷体或手写体文字进行读取识别,转化成计算机和人都能够识读的格式。此间OCR技术是关键一环。OCR技术中,印刷体的文字识别是最成熟的一个,因其开展最早。早在1929年就被欧美国家利用来处理大量的报刊杂志、文件和单据报表等。经过40多年的发展和完善,文字识别技术更加成熟,逐步实现了信息处理的“电子化”。而我国的印刷体汉字识别研究是从上世纪70年代末起步的,至今己有近三十年的发展历史,大致可以分成如下三个阶段:1)探索阶段(1979一1985)在对数字、英文、符号识别研究的基础上,自上世纪70年代末,国内就有少数单位的研究人员对汉字识别方法进行了探索,发表了一些论文,研制了少量模拟识别软件和系统。这个阶段漫长,成果不多,但是却孕育了下一个阶段的丰硕果实。2)研发阶段(1986~1988)1986年初到1988年底,这三年是汉字识别技术研究的高潮期,也是印刷体汉字识别技术研究的丰收期。总共有11个单位进行了14次印刷体汉字识别的成果鉴定,这些系统对样张识别能达到高指标:可以识别宋体、仿宋体、黑体、楷体,识别的字数最多可达6763个,字号从3号到5号,识别率高达99.5%以上,识别速度在286微机条件下能够达到10~14字/秒,但对真实文本识别率大大下降,这是由于以上系统对印刷体文字形状变化(如文字模糊、笔划粘连、断笔、黑白不均、纸质质量差、油墨反透等等)的适应性和抗干扰性比较差造成的。但是这三年研制的识别系统为印刷体汉字识别系统的实用化打下了基础,是识别系统从研制到实用化必经的过程。3)实用阶段(1989一至今)印刷体汉字识别(文字识别)自1986年掀起高潮以来,清华大学电子工程系、中国科学院计算所智能中心、北京信息工程学院、沈阳自动化研究所等多家单位分别研制并开发出了实用化的印刷体汉字识别系统。尤其是由清华大学电子工程系研制的清华TH一OCR产品和由汉王集团开发的尚书OCR产品,它们始终都处于技术发展的最前沿,并占据着最大的市场份额,代表着印刷体汉字识别技术的发展潮流。目前,印刷体汉字识别技术的研究热点已经从单纯的文字识别转移到了表格的自动识别与录入,图文混排和多语种混排的版面分析、版面理解和版面恢复,名片识别,金融票据识别和古籍识别等内容上。并且出现了许多相关的识别系统,如:中安未来科技推出的名片识别系统、身份证识别系统和“慧视”屏幕文字图像识别系统等等。这些新的识别系统的出现,标志着印刷体汉字识别技术的应用领域得到了广阔的扩展。中安未来科技OCR识别工作流程概述OCR识别系统,其目的很简单,把影像作转换,使影像内的图形继续保存、有表格的则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。OCR识别流程剖析1.图像输入、预处理:2.图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。预处理:主要包括二值化,噪声去除,倾斜较正等3.二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进行处理,只保留前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。4.噪声去除:对于不同的文档,我们对燥声的定义可以不同,根据燥声的特征进行去燥,就叫做噪声去除5.倾斜较正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。6.版面分析:将文档图片分段落,分行的过程就叫做版面分析,由于实际文档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。7.字符切割:由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,这就需要文字识别软件有字符切割功能。8.字符识别:这一研究,已经是很早的事情了,比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。9.版面恢复:人们希望识别后的文字,仍然像原文档图片那样排列着,段落不变,位置不变,顺序不变的输出到word文档,pdf文档等,这一过程就叫做版面恢复。10.后处理、校对:根据特定的语言上下文的关系,对识别结果进行较正,就是后处理。目前的OCR识别技术早已成功应用于生活的方方面面:像小区出入口的车牌识别一体机、银行开户使用的银行卡识别、名片管理时的名片识别工具等等。OCR识别技术正在影响着我们的生活。返回搜狐,查看更多
责任编辑:人工智能的作用及意义是什么
伴随着大数据的发展,人工智能的时代已经越来越近,但目前人工智能仍处于起步阶段,无论是理论研究还是实际应用,都离人工智能还有很大的距离。因此,现在的人工智能通常都要求特定的使用场景和一系列的先决条件。但随着人工智能的不断发展和代理的逐步应用,这必然是一种趋势。如今,人工智能产品在运输、物流、教育、安全等领域已得到广泛应用,并发挥了一定作用,特别是在解决低端劳动力短缺问题方面,人工智能已成为低端制造业可持续发展的重要替代品。接下来小编就给大家介绍一下人工智能的作用及意义是什么,一起来看看吧。
迅捷转换器2.824条点评咨询产品免费试用解决用户选型困难的好软件,有各维度的信息客户案例暂无合作品牌暂无人工智能的作用及意义是什么? AI时代会给整个社会带来怎样的变化?可从以下三个角度进行分析和预测:第一,从工作的角度来看,智能时代的人类将从事更有意义的工作;随着人工智能的不断发展,人们的就业机会也将不断提升,随着人们从事更有意义、更有创造性的工作,大量具有单调重复、科技含量低、危险系数高等特点的就业机会将被人工智能产品逐步取代。 二是从学习的角度来看,人工智能将在教育领域得到普及。AI的发展会给教育领域带来深刻的变化,之后人工智能会对教育领域的许多基础知识进行讲解。AI和教育的结合可以从深层解决因材施教的问题,同时也能轻易发现学习的薄弱环节,从而显著提高学习效率。当前,人工智能与教育融合已开始进入落地并产业化的阶段。 从生活的角度来看,人工智能技术将为人类提供更加舒适的生存环境。当前,智能小区、智能家庭已具备产业化的基础,随着物联网、云计算和人工智能等技术的不断发展,人工智能将进一步改善人们的居住环境。AI给人类带来的变化将是全方位的、深刻的,人工智能的发展也将推动整个社会劳动力结构的升级,进而推动人才结构的升级,因此,要跟上人工智能时代的发展步伐,必须不断学习人工智能方面的知识。 AI已经以某种形式或其它方式融入了日常生活。它具有巨大的潜力,可以推动在这个数据驱动的世界中的创新和重大改进。来自预测分析、聊天机器人、自动驾驶汽车和网络安全的人工智能随处可见。 这在几乎所有部门都是可行的。在很多方面,我们都采用了人工智能服务。网络犯罪和破坏的风险正成倍增长,因为我们越来越多地陷入虚拟世界,并变得由技术驱动。在现代社会中,网络安全是最重要的问题之一。互联网攻击和网络犯罪时有发生,影响到世界各地的个人、企业和政府机构。企业必须处理其数字资产的安全威胁(包括硬件、软件、数据和基础设施)。史无前例的网络安全需求至关重要。 在提高网络安全性方面,欺诈检测、恶意软件检测、入侵检测、网络评分风险和用户/机器行为分析是5个最高的AI用例。 人工智能和ML解决方案重新定义了组织如何处理网络安全,并确保当用户控制了他们的数据和隐私时,用户会得到信任。 像谷歌、亚马逊、Facebook、苹果这样的大公司,已经在人工智能工具方面投入巨资,以应对网络威胁和数据泄漏。 有以下几种方法可以使AI和ML在改善网络安全方面发挥重要作用: 危险检测 AI和高级的机器学习算法可以帮助组织识别威胁、入侵和恶意行为。用AI软件探测威胁绝非新鲜事,因为大部分的网络安全公司都采用AI算法来自动调查和确定攻击指标。及时发现偏差和行为变化可以帮助组织以明智的方式更快地作出反应。 互联网安全: 许多基于AI的入侵检测软件在网络层上被使用,以确保更好的网络安全。因为AI工具可以自己学习和识别模式,所以他们可以很快的观察到数以百计的物体,包括文件、IP地址、钓鱼链接、访问者和大量的数据。人工智能比人类探测到的更快,因为人类不能探测到数以百万计的站点和地址。实时性的探测和自动化流程可以帮助企业快速、有效地作出反应。 防御袭击: 公司可以使用AI来减少DDoS和钓鱼攻击的风险。按照传统方法,发现违规行为并采取行动作出反应可能要花费数天甚至数月。利用基于AI的安全方法,企业可以建立一种自动有效的方法,在攻击发生前加以预防,而不是在攻击可能造成损害后采取行动。人工智能算法通过编程,可以在几秒钟内处理大量数据,而这对于人类来说是不可能的。AI工具被广泛应用于异常检测——一种识别稀有和可疑的观测、项目或事件的方法,这与大多数数据不同。 预计分析: AI能帮助用户分析他们的行为。借助于AI的这一功能,算法可以自我学习用户行为,并创建相关使用、时间和平台的模式。这种方式包括登录时间,IP,地址,输入,滚动模式,以及时间。基于AI的工具能够持续监测和实时监测数据,并能在数据或行为中即时检测异常情况,从而降低潜在损害的可能性。 现在有各种先进的AI工具和解决方案可用于研究、预测、扫描和连续检查组织各个层次的漏洞。能够在认证、网络和分析级别部署AI工具。如果与人类网络分析员共同使用,而不是单独使用,这些工具会越来越好,并能为保护数据、网络和资源提供最佳效果。在处理大量数据和数分钟内确定罕见的活动或场景时,人类不能和AI相比。还可能会给AI程序提供错误的输入,或者以导致意外中断的错误方式对它进行编程。人工智能可以随着时间的推移被学习,并发现它与传统行为的不同之处。深度学习和机器学习算法能够识别模式和变化,并逐步理解它们。人工智能的自我学习能力可以帮助安全团队快速发现常规网络流量的差异。以上就是小编为大家介绍的人工智能的作用及意义是什么,希望对您有帮助。