人工智能:计算机视觉、图像处理、模式识别、机器学习之间的关系
人工智能:计算机视觉、图像处理、模式识别、机器学习之间的关系
什么是人工智能呢?人工智能,是由人类设计并在计算机环境下实现的模拟或再现某些人智能行为的技术。一般认为,人类智能活动可以分为两类:感知行为与思维活动。模拟感知行为的人工智能研究的一些例子包括语音识别、话者识别等与人类的听觉功能有关的“计算机听觉”,物体三维表现的形状知识、距离、速度感知等与人类视觉有关的“计算机视觉”,等等。模拟思维活动的人工智能研究的例子包括符号推理、模糊推理、定理证明等与人类思维有关的“计算机思维”,等等。
人工智能领域:机器学习深度学习图像算法图像处理语音识别图像识别算法研究
从图像处理和模式识别发展起来的计算机视觉研究对象之一是如何利用二维投影图像恢复三维景物世界。计算机视觉使用的理论方法主要是基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。计算机视觉要达到的基本目的有以下几个:
(1)根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;
(2)根据一幅或多幅二维投影图像计算出目标物体的运动参数;
(3)根据一幅或多幅二维投影图像计算出目标物体的表面物理特性;
(4)根据多幅二维投影图像恢复出更大空间区域的投影图像。
计算机视觉要达到的最终目的是实现利用计算机对于三维景物世界的理解,即实现人的视觉系统的某些功能。
在计算机视觉领域里,医学图像分析、光学文字识别对模式识别的要求需要提到一定高度。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。
人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。
机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。
为了达到计算机视觉的目的,有两种技术途径可以考虑。第一种是仿生学方法,即从分析人类视觉的过程入手,利用大自然提供给我们的最好参考系——人类视觉系统,建立起视觉过程的计算模型,然后用计算机系统实现之。第二种是工程方法,即脱离人类视觉系统框框的约束,利用一切可行和实用的技术手段实现视觉功能。此方法的一般做法是,将人类视觉系统作为一个黑盒子对待,实现时只关心对于某种输入,视觉系统将给出何种输出。这两种方法理论上都是可以使用的,但面临的困难是,人类视觉系统对应某种输入的输出到底是什么,这是无法直接测得的。而且由于人的智能活动是一个多功能系统综合作用的结果,即使是得到了一个输入输出对,也很难肯定它是仅由当前的输入视觉刺激所产生的响应,而不是一个与历史状态综合作用的结果。
不难理解,计算机视觉的研究具有双重意义。其一,是为了满足人工智能应用的需要,即用计算机实现人工的视觉系统的需要。这些成果可以安装在计算机和各种机器上,使计算机和机器人能够具有“看”的能力。其二,视觉计算模型的研究结果反过来对于我们进一步认识和研究人类视觉系统本身的机理,甚至人脑的机理,也同样具有相当大的参考意义。
在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。
计算机视觉(computervision),用计算机来模拟人的视觉机理获取和处理信息的能力。就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。
图像处理(imageprocessing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。基本内容图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像处理一般指数字图像处理。
模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。
机器学习(MachineLearning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。
人类研究计算机的目的,是为了提高社会生产力水平,提高生活质量,把人从单调复杂甚至危险的工作中解救出来。今天的计算机在计算速度上已经远远超过了人,然而在很多方面,特别是在人类智能活动有关的方面例如在视觉功能、听觉功能、嗅觉功能、自然语言理解能力功能等等方面,还不如人。
这种现状无法满足一些高级应用的要求。例如,我们希望计算机能够及早地发现路上的可疑情况并提醒汽车驾驶员以避免发生事故,我们更希望计算机能帮助我们进行自动驾驶,目前的技术还不足以满足诸如此类高级应用的要求,还需要更多的人工智能研究成果和系统实现的经验。
转载时请以超链接形式标明文章原始出处和作者信息及本声明http://www.blogbus.com/shijuanfeng-logs/216968430.html
人工智能中的图像识别技术
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达伴随着图像处理技术的飞速发展,推动了图像识别技术的产生和发展,并逐渐成为人工智能领域中重要的组成部分,并广泛地运用于面部识别、指纹识别、医疗诊断等等领域中,发挥重要作用。
这也给学生思考课题给了更多的空间,今天小编就来浅谈热门课题方向中图像识别技术,希望给学生更多的启发!
图像识别技术概述
图像识别技术的含义
图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。一般工业使用中,采用工业相机拍摄图片,然后再利用软件根据图片灰阶差做进一步识别处理。
在具体应用实践中,特别识别除了要弄清识别的对象具有是什么样的物体外,还应该明确其所在的的位置和姿态。当前图像识别已经被广泛应用到各个领域中,例如交通领域中的车牌号识别、交通标志识别、军事领域中的飞行物识别、地形勘察、安全领域中的指纹识别、人脸识别等。
图像识别技术的原理
图像识别原理主要是需处理具有一定复杂性的信息,处理技术并不是随意出现在计算机中,主要是根据一些医学研究人员的实践,结合计算机程序对相关内容模拟并予以实现。该技术的计算机实现与人类对图像识别的基本原理基本类似,在人类感觉及视觉等方面只是计算机不会受到任何因素的影响。人类不只是结合储存在脑海中的图像记忆进行识别,而是利用图像特征对其分类,再利用各类别特征识别出图片。计算机也采用同样的图像识别原理,采用对图像重要特征的分类和提取,并有效排除无用的多余特征,进而使图像识别得以实现。有时计算机对上述特征的提取比较明显,有时就比较普通,这将对计算机图像识别的效率产生较大影响。
图像识别技术的过程
由于图像识别技术的产生是基于人工智能的基础上,所以计算机图像识别的过程与人脑识别图像的过程大体一致,归纳起来,该过程主要包括4个步骤:
1是获取信息,主要是指将声音和光等信息通过传感器向电信号转换,也就是对识别对象的基本信息进行获取,并将其向计算机可识别的信息转换;
2是信息预处理,主要是指采用去噪、变换及平滑等操作对图像进行处理,基于此使图像的重要特点提高;
3是抽取及选择特征,主要是指在模式识别中,抽取及选择图像特征,概括而言就是识别图像具有种类多样的特点,如采用一定方式分离,就要识别图像的特征,获取特征也被称为特征抽取;
4是设计分类器及分类决策,其中设计分类器就是根据训练对识别规则进行制定,基于此识别规则能够得到特征的主要种类,进而使图像识别的不断提高辨识率,此后再通过识别特殊特征,最终实现对图像的评价和确认。
图像识别技术的常见形式
首先图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。
文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别,应用非常广泛。
数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。
物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。
随着计算机及信息技术的迅速发展,图像识别技术的应用逐渐扩大到诸多领域,尤其是在面部及指纹识别、卫星云图识别及临床医疗诊断等多个领域日益发挥着重要作用。通常图像识别技术主要是指采用计算机按照既定目标对捕获的系统前端图片进行处理,在日常生活中图像识别技术的应用也十分普遍,比如车牌捕捉、商品条码识别及手写识别等。随着该技术的逐渐发展并不断完善,未来将具有更加广泛的应用领域。
基于神经网络的图像识别技术
目前,基于神经网络的图像识别是一种比较新型的技术,是以传统图像识别方式为基础,有效融合神经网络算法。在此,神经网络主要是指人工神经网络,换而言之就是本文中的神经网络不是动物体的神经网络,而主要是指人类采用人工模拟动物神经网络方式的一种神经网络。针对基于神经网络的图像识别技术,目前,在基于神经网络的图像识别技术中,遗传算法有效结合BP神经网络是最经典的一种模型,该模型可在诸多领域中进行应用。诸如智能汽车监控中采用的拍照识别技术,若有汽车从该位置经过时,检测设备将产生相应的反应,检测设备启动图像采集装置,获取汽车正反面的特征图像,在对车牌字符进行识别的过程中,就采用了基于神经网络和模糊匹配的两类算法。
基于非线性降维的图像识别技术
采用计算机识别图像是基于高维形式的一种识别技术,不管原始图片的分辨率如何,该图片产生的数据通常都具有多维性特征,这在一定程度上增大了计算机识别的难度。为使计算机的图像识别性能更为高效,采用随图像降维方法就是一种最直接而有效的方法。一般情况下,可对降维划分为非线性降维与线性降维两类,比如最普遍的线性降维方式就是主成分分与线性奇异分析等,该方式的特点是简单、理解更容易等,再对数据集合采用线性降维方式处理求解的投影图像使该数据集合的低维最优。
在信息技术中作为近年来新兴的图像识别技术已广泛应用于众多应用领域,随着信息技术的日新月异,图像识别技术也得到十分迅猛的发展。在众多社会领域中,有效应用图像识别技术将使社会与经济价值得到充分发挥。
小编相信,通过本次的科普,很多同学都对图像识别有了更深的理解,希望可以拓宽同学们的思路,利用人工智能的图像识别技术解决更多问题,造福社会,造福世界!
下载1:OpenCV-Contrib扩展模块中文版教程在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。下载2:Python视觉实战项目52讲在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。下载3:OpenCV实战项目20讲在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。交流群欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~