人工智能基础
本课程推荐教材及与课程学习目标对应关系如下:
1. 授课教材:《人工智能》丁世飞编著电子工业出版社 2020年第三版ISBN:9787121363955。
(1)教材特点:《人工智能导论(第3版)》主要阐述人工智能的基本原理、方法和应用技术。全书共13章,除第1章讨论人工智能基本概念、第13章讨论人工智能的争论与展望外,其余11章按照“基本智能+典型应用+计算智能”三个模块编排内容。一个模块为人工智能经典的三大技术,分别为知识表示技术、搜索技术和推理技术,主要包括知识表示、确定性推理、搜索策略、不确定性推理;第二个模块为人工智能的典型应用领域,包括机器学习、支持向量机和专家系统;第三个模块为计算智能与群智能,包括神经计算、进化计算、模糊计算和群智能。
本课程主要选用了本教材的第一稿模块,即知识表示技术、搜索技术和推理技术中相关的内容。
(2)使用方法:本教材对应课程学习目标1-5,可以做到对课程内容前半部分的全覆盖,请同学们学习完视频之后,一定要详细阅读教材中的对应部分,并针对课后习题进行联系,能够有效提高学习质量;
2、本课程参考了大量网络上的课程。对应课程学习目标6-8,包括:
https://stanford-cs221.github.io/spring2021/
https://cse.iitkgp.ac.in/~dsamanta/courses/da/
百度飞桨师资培训的机器学习和深度学习的内容。
https://easyai.tech
此外还有参考百度百科、B站、以及知乎和CSDN等各类科技网站。
在此表示感谢!
6大人工智能应用关键技术,终于有人讲明白了
导读:我国《人工智能标准化白皮书(2018年)》中也给出了人工智能的定义:“人工智能是利用数字计算机或者由数字计算机控制的机器,模拟、延伸和扩展人类的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统。”
人工智能的核心思想在于构造智能的人工系统。人工智能是一项知识工程,利用机器模仿人类完成一系列的动作。根据是否能够实现理解、思考、推理、解决问题等高级行为。
在未来,人工智能应用主要会体现如下几大核心技术特点。
作者:达观数据
来源:大数据DT(ID:hzdashuju)
01机器人流程自动化(RoboticProcessAutomation,RPA)
RPA(RoboticProcessAutomation,机器人流程自动化)的定义:通过特定的、可模拟人类在计算机界面上进行操作的技术,按规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作。
与大家通常所认为的具备机械实体的“机器人”不同,RPA本质上是一种能按特定指令完成工作的软件,这种软件安装在个人计算机或大型服务器上,通过模拟键盘、鼠标等人工操作来实现办公操作的自动化。
▲图1-1RPA是未来办公创新和发展的趋势
RPA也被形象地称为数字化劳动力(DigitalLabor),是因为其综合运用了大数据、人工智能、云计算等技术,通过操纵用户图形界面(GUI)中的元素,模拟并增强人与计算机的交互过程,从而能够辅助执行以往只有人类才能完成的工作,或者作为人类高强度工作的劳动力补充。
自2015年以来,人工智能技术和RPA在同一时间大幅度发展和进步,恰好相辅相成,汇合在了一起。自然而然地,RPA和AI两者的结合运用,带来了一股非常独特的智能化应用的发展潮流,我们称之为智能RPA技术,或者IPA技术(IntelligentProcessingAutomation),即智能流程自动化技术(如图1-2所示)。
▲图1-2智能RPA的构成:RPA+AI=IPA
换句话说就是,RPA是基础,需要与其他技术手段整合在一起,方能实现IPA及其优势。
商业社会对流程自动化的功能的期望将与日俱增,将机器学习等AI技术运用到RPA中,将人工智能功能集成到产品套件中,以提供更多类型的自动化功能,已经成为未来RPA发展的主流趋势。
02光学字符识别(OpticalCharacterRecognition,OCR)
OCR技术是指利用电子设备(例如扫描仪或数码相机)将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。通俗地说就是,对文本资料进行扫描,然后对图像文件进行分析处理,以获取文字及版面信息的技术。
OCR技术一般可分为如图3-1所示的5个阶段。
▲图3-1OCR技术的5个阶段
下面具体说明OCR的识别流程。
1.图像处理
针对图像的成像问题进行修正。常见的图像预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正、二值化处理等。
2.文字检测
检测文本所在位置、范围及其布局,通常还包括版面分析和文字行检测等。文字检测解决的主要问题是哪里有文字,文字的范围有多大。
文字检测采用的处理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。
3.文字识别
在文本检测的基础上,对文本内容进行识别,将图像中的文本信息转化为计算机可识别和处理的文本信息。文字识别主要解决的问题是每个文字是什么。
文字识别常采用的处理算法包括:CRNN、AttentionOCR、RNNLM、BERT。
4.文本抽取
从文字识别结果中抽取出需要的字段或要素。
文本抽取常采用的处理算法包括:CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。
5.输出
输出最终的文字识别结果或者文本抽取结果。
03机器学习/大数据分析
机器学习/大数据分析是一种用于设计复杂模型和算法并以此实现预测功能的方法,即计算机有能力去学习,而不是依靠预先编写的代码。它能够基于对现有结构化数据的观察,自行识别结构化数据中的模型,并以此来输出对未来结果的预测。
机器学习是一种通过“监督”和“无监督”学习来识别结构化数据中的模式(例如日常性能数据)的算法。监督算法是指在根据自己的输入做出预测之前,会从输入和输出的结构化数据集来进行学习。无监督算法是指观察结构化数据,并对已识别的模式提供相关见解。
机器学习和高级分析可能会改变保险公司的游戏规则,例如,在提高合规性、降低成本结构,以及从新的见解中获得竞争优势。高级分析已经在领先的人力资源部门中得到了广泛应用,主要用于确定和评估领导者和管理者的核心品质,以便更好地预测行为、规划职业发展道路和下一任领导岗位归属。
04自然语言生成(NaturalLanguageGeneration,NLG)
计算机具有与人一样的表达能力和写作能力,它遵循某种规则,将从数据中观察到的信息转换成高质量的自然语言文本。例如,自动识别会议邮件中的主题、数字地名、人名地址并生成行程表备忘录,或者识别出合同条款的关键内容并将摘要的重点生成列表。
关于自然语言生成及自然语言处理的详细介绍,请阅读《详解自然语言处理5大语义分析技术及14类应用(建议收藏)》
05智能工作流(SmartWorkflow)
智能工作流是一种用于流程管理的软件工具,其中集成了由人和机器共同执行的工作,允许用户实时启动和跟踪端到端流程的状态,以便于管理不同组之间的切换,包括机器人与人类用户之间的切换,同时还能提供瓶颈阶段的统计数据。
随着社会和科技的不断进步,各个领域都开始逐步朝着自动化、智能化的方向快速发展。工作流相关技术的研究也越来越受重视,并广泛地应用于制造业、软件开发、银行金融、生物医学等不同领域。
工作流不但能够自动化地处理相关的活动和任务,减少人机交互处理过程中带来的潜在错误,而且能够精确化每一个处理步骤,最大化地提高生成效率,并且将工作流应用到动态、可变且灵活的应用场景当中。
近年来,在大数据、人工智能的背景下,工作流中的业务流程日趋复杂,所面临的环境和数据也日趋复杂,由需求分析引起的业务过程重新建模或由维护升级引起的过程模式变更和改进也变得越来越频繁。
在这种动态多变的复杂环境下,如何快速识别出任务,然后快速高效并有针对性地处理工作流问题,已成为目前工作流任务研究的关键问题。
RPA软件机器人在工作过程中,也会遇到很多类似的情况。工作流的复杂多变,会导致RPA作业流程的复杂多变,使其无法做到自适应,这将会大大影响RPA软件机器人的作业效率。
因此,需要通过智能工作流的技术,实现动态地调整RPA里的任务设定,以及RPA业务流程的自动变更和自动升级,在智能工作流的指导下实现自适应作业模式。
实现智能工作流的方法有很多,比如,美国J.H.Holland教授提出的基于遗传算法的工作流调度,PandeyS等提出的基于粒子群优化算法的启发式算法(PSO)可用于不同资源的智能调度。除此之外,还有很多基于自然界和仿生学的智能算法,比如,混合蛙跳算法、布谷鸟搜索算法、蝙蝠算法、人工蜂群算法等。
目前比较常见的方法是实现一种基于智能规划的工作流处理模式,该模式不再是单纯地将不同的活动当作对彼此没有影响的单独事件,而是有针对性地考虑多个事件的共同影响。
该模式充分考虑了工作流和智能规划之间的相似之处,通过智能规划推导出不同工作流任务之间的内在逻辑关系,并从其他的渠道和外部信息中充分挖掘潜在的关系。
逐步改进传统工作流中的问题,使用全新的智能规划的手段,从表面动作中挖掘出潜在的信息,过滤噪声数据,进而实现流程的自动修正,最后,通过前面得出的结论,有针对性地修改之前的RPA作业流程,实现自适应性的作业模式和作业过程。
06认知智能体(CognitiveAgent)
认知智能体是一种结合了机器学习和自然语言生成的技术,并在此基础上加入情感检测功能以做出判断和分析,使其能够执行任务,交流沟通,从数据集中学习,甚至根据情感检测结果作出决策。换句话说,机器会像人一样产生“情感共鸣、精神共振”,真正成为一个完全虚拟的劳动力(或者智能体)。
在客服领域,英国某汽车保险公司通过使用认知智能体技术,将客户转化率提高了22%,验证错误率降低了40%,整体投资回报率达到了330%。
当然,德勤、安永等咨询公司也坦然表示,就现阶段许多企业的流程管理与系统的基础能力来看,仍存在着大量的基础建设工作有待开展。而打造智能流程自动化所需的部分核心技术(例如认知智能体等)也还停留在雏形阶段。
智能包含三个方面,分别是计算智能、感知智能和认知智能。
在计算智能方面,计算机的速度早已远远超过人工的效率。
在感知智能方面,随着OCR、NLP等技术的发展,目前也已经能够实现很多的效果。
但是在认知智能方面,即使在某些特定领域,自然语言的处理也已经可以得到比人工更好的成绩,但是在某些领域,特别是知识理解、知识推理、知识判断等方面,还有很多需要逐步积累、逐步完善的地方。
按照机器能否产生自我认知和机器人的适用范围,人工智能分为弱人工智能和强人工智能,其中弱人工智能里的机器没有自我意识,不具备真正的推理和独立解决问题的能力,通常只适用于解决特定条件下的某种问题。当前人工智能的研究主要在弱人工智能领域。
而在强人工智能方面,机器具有一定的自我意识,能够通过学习拓展功能。对于当前不具备的功能或者当前不了解的知识,能通过自行学习获得。
当前条件下,全面的强人工智能还面临技术能力、社会伦理等多方面的挑战,但是在某些领域的特定场景下,具备认知智能能力和学习能力的人工智能软件,不仅能够优化作业流程、快速响应、覆盖更多不同的情况,同时还能够最大限度地避免技术风险和应用风险,是一个非常有价值的研究方向。
认知智能有很多种定义,其中,复旦大学肖仰华教授曾经提到过,所谓让机器具备认知智能是指让机器能够像人一样思考,而这种思考能力具体体现在如下几个方面。
第一,机器具备能够理解数据、理解语言进而理解现实世界的能力。
第二,机器具备能够解释数据、解释过程进而解释现象的能力。
第三,机器具备推理、规划等一系列人类所独有的认知能力,也就是说认知智能需要解决推理、规划、联想、创作等一系列复杂任务。
智能体是指驻留在某一环境下,能够持续自主地发挥作用,具备驻留性、反应性、社会性、主动性特征的计算实体。根据著名人工智能学者,美国斯坦福大学Hayes-Roth教授的理论“智能体能够持续执行三项功能:感知环境中的动态条件、执行动作影响环境、进行推理以解释感知信息、求解问题和决定动作”。
从前面的定义我们可以看出,认知智能体能够感知到环境中的动态条件,然后根据这些条件执行相应的动作来影响现有的环境,同时其还能够用推理来解释感知信息,求解相关问题,决定后续动作。
将认知智能体与RPA相结合,我们能够得到一个具备认知智能的机器人,它可以根据所涉及的应用系统和其他环境的变化动态感知下一步需要做的事情,同时执行相应的动作来影响对应的环境信息,实现智能录入、智能监控、智能文档处理和辅助判定。
与此同时,认知智能体通过RPA技术在处理业务的同时,还能够学习到相关的经验和知识,逐步掌握识别重点的能力。
认知智能体的研究包含了多种不同的方法,近年来,随着分布式人工智能、信息科学和网络科学的不断发展,面向动态环境下的分布式协同决策已经成为认知智能体的一个重要的研究方式。这种方式在以多无人机系统、多机器人系统为代表的典型无中心式多智能体系统中得到了广泛的应用。
与此同时,受限于自身设计,智能体对所在环境和系统常呈现出信息的部分可观测特征,而有限的智能体之间的交互和外部的约束也使得获得全局信息需要付出极高的代价。
同时,无中心式的多智能体系统在应用中呈现出了与社会网络相类似的自组结构和相应的复杂网络特征,即网络中单个智能体通常仅能连接/交互所在局部网络中的小部分智能体,传统的集中式协同模型则不再适用。
此外,类似于社会网络中人与人之间的有限信息交换便可大大提升个体的决策效率,同样的方法能否应用到相应的研究当中,也处于不断的尝试过程中。
关于作者:达观数据,中国智能RPA领域的龙头企业,独立开发了全套“RPA+AI”系统,拥有核心知识产权。达观智能RPA产品是业界不依赖微软底层开发框架、未使用第三方开源框架的RPA产品。
本文摘编自《智能RPA实战》,经出版方授权发布。
延伸阅读《智能RPA实战》
点击上图了解及购买
转载请联系微信:DoctorData
推荐语:这是一部从实战角度讲解“AI+RPA”如何为企业数字化转型赋能的著作,从基础知识、平台构成、相关技术、建设指南、项目实施、落地方法论、案例分析、发展趋势8个维度对智能RPA做了系统解读,为企业认知和实践智能RPA提供全面指导。
划重点????
干货直达????
西安交大送大一新生这本书,你读过吗?12本有趣有料的科普书盘点
终于有人把AI、BI、大数据、数据科学讲明白了
监督学习、非监督学习、强化学习都是什么?终于有人讲明白了
一条SQL引发的“血案”:与SQL优化相关的4个案例
更多精彩????
在公众号对话框输入以下关键词
查看更多优质内容!
PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作
大数据 | 云计算 | 数据库 | Python | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 | 1024 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都完成了这个神操作
????
人工智能的基本技术包括哪些
你知道人工智能的基本技术包括哪些吗?人工智能ai是当前科技领域最热门的技术,也是众多业界和业界人士关注的焦点。但我们每天都在关注着人工智能的投融资行情,人工智能独角兽企业的动态,科技巨头们在人工智能领域的布局,人工智能技术研发的状况,等等,很少有静下心来去梳理,但要想对人工智能有更深入、更长远的关注,首先要对人工智能产业链有一个更清晰的了解。接下来小编就给大家介绍一下人工智能的基本技术包括哪些,一起来看看吧。
眼神科技00条点评咨询产品免费试用解决用户选型困难的好软件,有各维度的信息客户案例5合作品牌20人工智能的基本技术包括哪些?
人工智能的基本技术包括Al技术、底层硬件(Al芯片,视觉传感器)、应用领域(智能家居,智能硬件,机器人,自动驾驶,工业应用)的人工智能产业链,让大家对人工智能产业有一个全面而清晰的了解。
当前AI技术主要有5个方面:大数据、计算机视觉、语音识别、自然语言处理和机器学习。
1、大数据
大数据,或称为海量数据,是指需要一个全新的处理模式,以获得更强的决策力、洞察力和流程优化能力,从而使信息资产达到高增长率和多样化。即能够从各种类型的数据中快速地获取有价值的信息,是一种大数据技术。海量数据是智能升级和进化的基础,有了海量数据,海量数据就能不断模拟演练,不断向真正的人工智能靠拢。 机器视觉、语音识别、自然语言处理、机器学习、大数据等五项技术相互补充,相互关联,同时各方面的应用也各有侧重。不难看出,这五项技术中,人工智能技术的复杂性以及技术进步所要克服的重重困难。
2、计算机视觉
顾名思义,计算机视觉就是使计算机具有人眼所能观察和识别的能力,再进一步说,就是用摄像机和计算机代替人眼对目标进行识别、跟踪和测量,再进一步做图形处理,使计算机处理的图像更适合于人眼所看到或传输到仪器进行检测。
那么计算机视觉与人工智能有何关联?
计算机视觉是一门科学,研究与之相关的理论和技术,旨在建立人工智能系统,从图像或多维数据中获取“信息”。目前,计算机视觉主要停留在图像信息的表达和目标识别方面,人工智能则更加重视推理和决策。
现在的计算机视觉主要应用于安全摄像机,交通摄像机,无人驾驶,无人机,金融,医疗等领域。代表公司有传统的大公司,如海康威视、大华股份,还有商汤科技、云从科技、依图科技和旷视科技等独角兽企业,还有思岚科技、速感科技、阅面科技、云天励飞、Yi+、图漾信息、码隆科技、格灵深瞳、Insta360等初创企业。
3、语音识别
语音识别技术是指通过机器识别和理解过程,将语音信号转换成相应的文字、指令等的高科技技术。从特征提取、模式匹配判据和模型训练三个方面对语音识别技术进行了研究。语音识别是人机交互的基础,它主要解决了让机器听清楚人说什么的难题。现在最成功的人工智能是语音识别技术。
目前,语音识别主要应用于汽车联网、智能翻译、智能家居、自动驾驶等领域,其中以科大讯飞和云知声、普强信息、声智科技、GMEMS通用微科技等具有代表性的新公司应运而生。天然语言、自然语言处理主要包括自然语言理解和自然语言产生两个方面,实现人与人之间的自然语言通信,就是使计算机既能理解自然语言文本,又能用自然语言文本表达特定的意图、思想等,前者称为自然语言理解,后者称为自然语言产生。
在计算机科学和人工智能领域,自然语言处理是一个重要发展方向。天然语言处理的最终目的是用自然语言与计算机交流,这样,人们就可以使用他们最熟悉的语言来使用计算机,而不再需要花费大量的时间和精力去学习各种不太自然和习惯的计算机语言。对于某些应用而言,具有相当自然语言处理能力的实际系统已经出现。
典型的例子有:自然语言界面的多语种数据库和专家系统,各种机器翻译系统,全文信息检索系统,自动文摘系统等。在国内BAT、京东、科大讯飞都有涉及自然语言处理的业务,此外还有爱特曼,出门在外询问,思必驰,蓦然认知,三角兽科技,森亿智能,义学教育,智齿客服等新兴企业涌现。
4、机器学习
人工智能的核心是机器学习,机器学习让机器拥有与人一样的学习能力,专门研究计算机如何模拟或实现人的学习行为,从而获得新的知识或技能,重组已有的知识结构,使其不断提高自身的性能。
机器学习已经得到了非常广泛的应用,例如:数据挖掘,计算机视觉,自然语言处理,生物特征识别,搜索引擎,医疗诊断,发现信用卡诈骗,证券市场分析,DNA序列排序,语音和手写识别,战略性游戏和机器人应用。我国机器学习企业有优必选、图灵机器人、李群自动化等。极智嘉科技公司,Rokid等。
人工智能的五个核心数据技术:计算机视觉、机器可学习、自然发展语言信息处理、机器人和语音识别,将成为一个独立的子产业。它是指计算机从图像和活动场景中识别对象的能力——计算机视觉信息技术可以利用由图像数据处理和其它技术组成的序列,把图像分析的工作任务分解成企业管理的小任务。以上就是小编为大家介绍的人工智能的基本技术包括哪些,希望对您有帮助。
人工智能的五大核心技术
计算机视觉、机器学习、自然语言处理、机器人和语音识别是人工智能的五大核心技术,它们均会成为独立的子产业。计算机视觉 计算机视觉是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉技术运用由图像处理操作及其他技术所组成的序列,来将图像分析任务分解为便于管理的小块任务。比如,一些技术能够从图像中检测到物体的边缘及纹理,分类技术可被用作确定识别到的特征是否能够代表系统已知的一类物体。 计算机视觉有着广泛的应用,其中包括:医疗成像分析被用来提高疾病预测、诊断和治疗;人脸识别被Facebook用来自动识别照片里的人物;在安防及监控领域被用来指认嫌疑人;在购物方面,消费者现在可以用智能手机拍摄下产品以获得更多购买选择。 机器视觉作为相关学科,泛指在工业自动化领域的视觉应用。在这些应用里,计算机在高度受限的工厂环境里识别诸如生产零件一类的物体,因此相对于寻求在非受限环境里操作的计算机视觉来说目标更为简单。计算机视觉是一个正在进行中的研究,而机器视觉则是“已经解决的问题”,是系统工程方面的课题而非研究层面的课题。因为应用范围的持续扩大,某些计算机视觉领域的初创公司自2011年起已经吸引了数亿美元的风投资本。 机器学习 机器学习指的是计算机系统无须遵照显式的程序指令,而只依靠数据来提升自身性能的能力。其核心在于,机器学习是从数据中自动发现模式,模式一旦被发现便可用于预测。比如,给予机器学习系统一个关于交易时间、商家、地点、价格及交易是否正当等信用卡交易信息的数据库,系统就会学习到可用来预测信用卡欺诈的模式。处理的交易数据越多,预测就会越准确。 机器学习的应用范围非常广泛,针对那些产生庞大数据的活动,它几乎拥有改进一切性能的潜力。除了欺诈甄别之外,这些活动还包括销售预测、库存管理、石油和天然气勘探,以及公共卫生等。机器学习技术在其他的认知技术领域也扮演着重要角色,比如计算机视觉,它能在海量图像中通过不断训练和改进视觉模型来提高其识别对象的能力。现如今,机器学习已经成为认知技术中最炙手可热的研究领域之一,在2011~2014年这段时间内就已吸引了近10亿美元的风险投资。谷歌也在2014年斥资4亿美元收购Deepmind这家研究机器学习技术的公司。
自然语言处理 自然语言处理是指计算机拥有的人类般的文本处理的能力。比如,从文本中提取意义,甚至从那些可读的、风格自然、语法正确的文本中自主解读出含义。一个自然语言处理系统并不了解人类处理文本的方式,但是它却可以用非常复杂与成熟的手段巧妙处理文本。例如,自动识别一份文档中所有被提及的人与地点;识别文档的核心议题;在一堆仅人类可读的合同中,将各种条款与条件提取出来并制作成表。以上这些任务通过传统的文本处理软件根本不可能完成,后者仅针对简单的文本匹配与模式就能进行操作。 自然语言处理像计算机视觉技术一样,将各种有助于实现目标的多种技术进行了融合。建立语言模型来预测语言表达的概率分布,举例来说,就是某一串给定字符或单词表达某一特定语义的最大可能性。选定的特征可以和文中的某些元素结合来识别一段文字,通过识别这些元素可以把某类文字同其他文字区别开来,比如垃圾邮件同正常邮件。以机器学习为驱动的分类方法将成为筛选的标准,用来决定一封邮件是否属于垃圾邮件。 因为语境对于理解“timeflies”(时光飞逝)和“fruitflies”(果蝇)的区别是如此重要,所以自然语言处理技术的实际应用领域相对较窄,这些领域包括分析顾客对某项特定产品和服务的反馈,自动发现民事诉讼或政府调查中的某些含义,自动书写诸如企业营收和体育运动的公式化范文,等等。机器人 将机器视觉、自动规划等认知技术整合至极小却高性能的传感器、制动器以及设计巧妙的硬件中,这就催生了新一代的机器人,它有能力与人类一起工作,能在各种未知环境中灵活处理不同的任务。例如,无人机、可以在车间为人类分担工作的“cobots”等。 语音识别 语音识别主要是关注自动且准确地转录人类的语音技术。该技术必须面对一些与自然语言处理类似的问题,在不同口音的处理、背景噪声、区分同音异形/异义词(“buy”和“by”听起来是一样的)方面存在一些困难,同时还需要具有跟上正常语速的工作速度。语音识别系统使用一些与自然语言处理系统相同的技术,再辅以其他技术,比如描述声音和其出现在特定序列与语言中概率的声学模型等。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。比如Domino抯Pizza,最近推出了一个允许用户通过语音下单的移动APP。 上述5项技术的产业化,是人工智能产业化的要素。人工智能将是一个万亿级的市场,甚至是10万亿级的市场,将会为我们带来一些全新且容量巨大的子产业,比如机器人、智能传感器、可穿戴设备等,其中最令人期待的是机器人子产业。 机器人应用的分法有很多种,从应用层面可以粗略地分为以下几个类别。第一个类别是工业级机器人,像富士康这种公司已经运用得很好了,因为劳工成本越来越高,用工风险越来越高,而机器人则可以解决这些问题。第二个类别是监护级机器人,它可以在家里和医院里作为病人、老人或孩子的护理,帮助他们做一定复杂程度的事情。中国对监护级机器人需求其实更迫切一些,因为中国人口红利在下降,同时老龄化又不断地上升,这两个矛盾,机器人都可以帮助解决。因此,这个领域的需求在民用市场占比很大。第三个类别就是探险级机器人,用来采矿或者探险等,大大避免了人所要经历的危险。此外还有用来打仗的军事机器人等。 网络媒体BusinessInsider预测,机器人将在许多岗位上取替人类:电话营销员、校对员、手工裁缝师、数学家、保险核保人、钟表修理师、货运代理商、报税员、图像处理人员、银行开户员、图书馆员、打字员等。因为它们的价格竞争力惊人。麦肯锡全球研究院的研究表明,当中国制造业工资每年增长10%~20%时,全球机器人的价格每年下调10%,一台最便宜的低阶机器人只需花费美国人年平均工资的一半。国际研究机构顾能预测:2020年机器人将导致全球新一波失业潮。 同时,人工智能技术的发展还将让许多旧产业获得改头换面式的新生,其中最典型的是汽车产业。汽车产业已存在上百年了,其间的变革也是非常大的,但驾驶汽车的始终是人,可最近几年,随着谷歌等公司的大力投入,机器或者说某种自动化的系统已经有望取代人来驾驶汽车,从而形成一个市场容量巨大的新产业,即无人驾驶汽车产业。这个产业的规模也将是万亿级甚至是10万亿级的。而且,这个产业还将与新能源产业叠加、融合在一起,形成“车联网+能联网+互联网+电动汽车”的复合产业——未来,我们会把插电式汽车和氢燃料汽车作为发电厂使用,从而使新能源汽车成为电网的一部分,成为新能源的供给者,与现在一些装有太阳能发电系统的房屋是太阳能的供给者一样。 毫无疑问,与互联网一样,智能技术会向几乎所有旧产业渗透。华泰证券在一份人工智能产业的研究报告中提及了九大行业:生活服务O2O、医疗、零售业、金融业、数字营销业、农业、工业、商业和在线教育。实际上,将获得新生的旧产业还有许多,如军事、传媒、家居、医疗健康业、生命科学、能源、公共部门……甚至包括受VR/AR(虚拟现实与增强现实)技术发展影响而产生的虚拟产业。