视觉智能识别技术的应用瓶颈,主要面临哪些困境
同语音智能识别技术瓶颈相比较,视觉智能识别技术应用瓶颈似乎更多,难度也更大。就应用基本原理而言,两者一致,均是通过对相关信息实时采集、存储来实现智能识别的。然而在具体操作过程中,两者却存在较大差别,因为视觉智能识别技术主要针对的是各种图像的设备,如指纹识别、人脸识别等。而在这些图像识别中,也存在着一些应用瓶颈。
2.1人脸识别技术
该技术主要是通过对人脸几个关键部位进行识别、分析,并通过采集几个表情作为其存储数据,来进行对比、识别分析。但目前为止,关于自动人脸识别研究已经取得了一些可喜成就,但就其实际应用而言,仍存在着一些较难解决的问题,如人脸的非刚体、发型的变化与表情、化妆的多样性以及环境光照复杂性等,都给人脸识别带来了较大困难。即便是大量来自生理学、神经认知科学与自模式识别、心理学以及计算机视觉等众多领域的专家们经过40多年对自动人脸识别技术的深入研究,仍被很多问题困扰着,得不到有效的解决办法。换个角度来想,即便是人类自己,即使每天都在根据他人面孔来区别亲人、朋友、同事与陌生人,但有时候也很难准确叙述出自己为什么能对他们进行区分,特别是对于双胞胎,虽然可区别他们,但却说不出如何区分、鉴别。可想而知,人都如此,更何况同人类视觉系统存在较大差异的图像采集设备,而且从某种意义上来说,计算机智能识别技术同人脑相比,还是存在一定差距的。为此,若要想计算机能够像人一样自动、准确识别人脸,必然需要不同领域研究者们的继续努力。
2.2指纹识别技术
众所周知,每个人的指纹都是不同的,指纹可以说是一个人独有的特征,而“指纹识别”,指的就是通过对这些指纹纹路图案、断点与交叉点的识别来实现身份的识别,有着唯一性、终生不变性与可获得性、防欺骗性等特点,现实生活中,人们多用指纹识别技术来设置密码,用以保护个人信息[3]。但是,在看到其优点的同时,也需看到,一个人的指纹其实很容易留在各处,通过复制这些指纹痕迹来进行相关操作,将在一定程度上影响到系统正确判断,故该识别技术其实也存在着一定危险性。而且,虽然系统已经识别了已有指纹,然而实际上一些人与群体的指纹其实特征不是很明显,有时较难成像,进而无法进行指纹识别。如在“签到打卡机”上,若是录入指纹手指出现破皮、损伤情况,是比较难识别的,而这也在一定程度上影响到指纹识别技术的应用。
总的来说,虽然人脸识别与指纹识别技术已经被广泛应用于各领域中,特别是密码设置中,但在实际应用中,问题仍是有的,而这也正表示视觉智能识别技术仍有着较大研究、发展空间,需要投入更多精力去解决这些瓶颈,用以推动计算机人工智能识别技术的发展。
人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:人脸识别的十个关键技术组成及原理http://www.duozhishidai.com/article-14161-1.html生物识别技术的人脸识别还是屏幕指纹,我们应该选谁?http://www.duozhishidai.com/article-3911-1.html人脸识别技术,具体是怎么剖析的http://www.duozhishidai.com/article-3760-1.html
多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站
从图像识别多样化的应用场景,看计算机视觉的未来价值
图像识别技术本身的原理并不复杂,信息的处理是这一技术的关键点所在。近年来,由于深度学习的发展,大大提高了图像识别的准确率,深度学习通过大量图像数据信息特征的积累与分析,可自动完成特征提取和图像匹配等任务。
但目前深度学习技术过分依赖大数据,只有在拥有大量特征数据下才可做精准的图像识别,那么如何在有限的数据下继续利用深度学习完成物体识别任务便是科学界值得关注与研究的问题。
图像识别多样化的应用场景
近期上映的国产电影中如《心理罪》、《战狼》,大多镜头都展现出人工智能中的图像识别技术,如《战狼》中,当雇佣军使用无人机潜入工厂时,利用人脸识别的无人机手控追踪射击片中主角“冷锋”一幕,就体现了基于图像的人脸识别技术在安全领域的应用。
根据平安证券的《通信行业人工智能图像识别专题报告》,图像识别分为生物识别、物体与场景识别和视频识别。
据估算,到2020年,生物识别技术市场规模将达到250亿美元,5年内年均增速约14%。其中,人脸识别增速最快,将从2015年的9亿美元增长到2020年的24亿美元。
图像识别作为人工智能研究的重要分支,占据着极为重要的地位。随着我国计算机技术与信息技术的不断发展,人工智能中的图像识别技术的应用范围不断扩展。
图像识别可能应用的场景整理如下:
1.安全领域:指纹识别、人脸识别等,代表项目如Face++、依图科技、深醒科技等。
据不完全统计,在人工智能通用应用层下,图像识别的热度仅次于语音识别,其中人脸识别层面更是广泛应用于金融、公共安全、军事、航空航天、工业、教育、医疗等行业。
此外,从36K“鲸准”APP数据来看,在人工智能企业中有接近三分之一的企业提供人脸识别的产品或服务。
备注:IT桔子数据显示,「人脸识别」是人工智能「视觉与图像」领域中最热门的应用,今年2月,《麻省理工科技评论》发布「2017全球十大突破性技术」榜单,来自中国的技术「刷脸支付」位列其中。这是该榜单创建16年来首个来自中国的技术突破。
(图片来源:IT桔子)
2.军事领域:地形勘察、飞行物识别等,代表项目全悉科技。
在军事方面图像处理和识别主要应用场景为通过对侦察照片的判读,进行目标识别并追踪。
在战争中,发现敌方的飞行物并不困难,难点在于能否识别飞行物。作为远距离探测,光线强弱、隐蔽范围等因素都是对图像识别技术能否顺利落地的考验。
3.交通领域:车牌号识别、无人驾驶、交通标志识别等,代表项目纵目科技、TuSimple(图森科技)、驭势科技等。
自IBM、英伟达、Uber、Google、Apple相继打入无人驾驶市场,各家公司不惜重金投入技术研发层面,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。
此外,高昂的生产成本也导致无人驾驶很难商用。据了解,去年完成测试的百度无人车的成本奇高,仅一台车载雷达就耗资70万元。
(图片来源:IT桔子)
4.医疗领域:心电图、B超、健康管理、营养学等,代表项目智影医疗、图玛深维等。
(图片来源:健康界)
AI医疗类项目,多围绕大数据、云计算及人工智能等技术创建基于数字图像处理系统下的医疗诊断辅助工具。
具体场景可以是各类医学图像分析诊断、病例图像分析以及超声波图像处理、心电图分析等方面。依托前沿的科技,不仅降低了医疗成本,还极大程度提升了医疗质量及效率。
6.生活领域:智能家居、购物、智能测肤等,代表项目Yi+、木薯科技、肌秘等。
所谓科技改变生活,当人工智能以迅雷不及掩耳之势闯入大众视野后,人们的衣食住行也在发生着锦上添花的变化。
服装行业因强物理属性特征,如色彩、纹理、形状等,往往无法用精准的文字进行描述,因此,图像识别技术的应用便显得尤为重要。
通过用心仪服装图像做检索条件,能够更加客观而准确的检索到相似度较高的目标商品,在提高用户购物体验的同时,也使得服装企业在电子商务领域得到进一步发展。
其实,当时尚界遇到人工智能,还有更多的想象空间。结合人工智能以垂直领域和细分场景做切入口,重点布局美妆、服装等行业,具备可持续不断挖掘商机的价值。
备注:在2017年的秋冬纽约时装周,腾讯优图大显身手。他们借助人工智能的人脸识别与图像处理技术,发布了《AI+时尚:中国95后流行色报告》,报告中通过对2016年QQ空间相册的千亿公开照片和唯品会95后服装销售大数据进行分析,得到了属于中国95后的流行色“95度黑”。和常规的RGB值为0/0/0的黑色不同,这种RGB值为22/20/24的黑并不是太饱和,像95后的性格一样,带着一份酷酷的神秘感。
计算机同样渴望“明亮双眸”
计算机视觉是赋予计算机一双“眼睛”的科学技术,通过摄影镜头完成对目标识别、跟踪和匹配等工作。
近些年,基于深度学习的发展,计算机视觉在人工智能和深度学习的大背景下方兴未艾,与此同时,当越来越多的应用场景被挖掘出来时,也意味着计算机视觉的发展前景将无比广阔。
当计算机视觉技术作为一种开放性信号,蓬勃发展之时,经典问题得以解决,新的问题也会不断涌现,如何寻找新的技术突破口?现有技术间如何融合?技术如何突破瓶颈并实现质的飞跃?等诸如此类问题都是计算机视觉技术发展到后期所必须面临的命题。
此外,计算机视觉发展的另一个重要趋势是应用于识别真实世界中较为复杂的图像内容。
据科学统计,人类对世界的感知80%来自视觉。计算机如何像人眼一样,甚至是高于人眼的识别力,是技术不断深挖的关键点。
就目前资本市场热度来看,计算机视觉仅次于深度学习,图像识别、人脸识别、视频识别三大方向最受资本青睐。
尽管人工智能的资本市场已被炒的火热,但创业者还应保有冷静的分析,技术固然是核心,切实可行的应用场景及准确切入市场需求也不容忽视。
最后用微软创始人比尔盖茨再次肯定计算机视觉的发展前景,“IT的发展很让人激动,近期最大的事情是视觉识别(computervision),该领域发展非常快。原来我们的机器人是瞎子,以后几乎和人具备一样的视觉,这样的机器人可以用在工厂、办公室、在野外等等各种工作环境。”
编辑:阿鲸
返回搜狐,查看更多