自动驾驶技术发展的5个阶段和现状
来源:智车科技
摘要:自动驾驶的级别从L1到L5(SAE),清晰而直观,是大家讨论自动驾驶行业的一个基准。但是,它也很容易误导人。让人以为自动驾驶的技术会一级一级获得突破,最终迎来一辆L5级别的汽车,可以带我们到任何地方去。
业界第一款具备真正意义上的自动驾驶能力的量产车——全新奥迪A82017年7月才姗姗来迟。作为整个自动驾驶的第一个量产玩家,奥迪尽管已经走在了行业最前沿,但目前实现的还是3级的自动驾驶,也就是说这是一种在限定环境条件下,需要驾驶员始终有接管能力的自动驾驶,距离无限条件无需接管的自动驾驶还有相当长的路要走。
回头看历史,猛然发觉第一届DARPA自动驾驶挑战赛已经是十年前的事了。对比互联网产业,十年前支付宝还没有手机支付业务,而微信根本还没诞生,再看现在,支付宝和微信已经全面占领了我们的生活。为什么汽车工业的动作慢如蜗牛?自动驾驶到底难在哪里?
事实上,早在车企开始宣传“世界上第一款量产L3级别汽车”的时候,我们就应该揭穿他们的把戏。
自动驾驶的级别从L1到L5(SAE),清晰而直观,是大家讨论自动驾驶行业的一个基准。但是,它也很容易误导人。让人以为自动驾驶的技术会一级一级获得突破,最终迎来一辆L5级别的汽车,可以带我们到任何地方去。
醒醒吧,真实的技术部署从来不会按这样的“计划方案”发展。而且,这个行业里的公司“怎么说的”和“怎么做的”完全不是一回事。你能听到很多人,在画一张同样的大饼:我们在研发自动驾驶,我们将率先发布某个级别的汽车,我们将推出最先进的自动驾驶汽车叫车服务。
不要轻易相信他们说的话。看看这些公司实际是怎么做的,你就能明白,这个行业里最有代表性的三家公司分别是英特尔的Mobileye、特斯拉和Google的Waymo,他们才真正代表了自动驾驶技术部署的三种实际路线。
如果你熟悉SAE自动驾驶技术级别定义中的L5,你就知道我们说的是,在所有场景下都可以工作、永远都不需要人干预的自动驾驶汽车。换言之,人只能作为乘客,驾驶的任务完全交给汽车。
它与L4的唯一区别就是,L4能适应的场景依然是有限的,而L5“没有限制”。
看明白了吗?从L4到L5,不过是一种典型的“线性”思维类推出来的结果,与古人想要速度更快的马,没有什么区别。在实际的技术部署中,首先是我们大部分人等不到这种汽车出现的那天;其次等它出现的时候,或许地球上更流行的是飞行汽车或者其他新型的私人交通工具。
我们看看实际的技术部署会是什么样的。例如,有一种收垃圾的自动驾驶汽车,它只能在限定的范围内工作,就是到固定的地点收完垃圾,然后把垃圾集中放到固定的地方,接着自己回停车场充电,等待第二天执行同样的任务,全程不需要人干预。请问这种汽车我们称之为L4,还是L5有什么区别吗?
再比如,一种自动驾驶的货车,大部分路程都在高速公路上,完全自动驾驶,只有在出高速之后的一小段市内路程,需要人来“监督”继续驾驶到卸货的地方。请问这种汽车我们称之为L3,还是L4有什么区别吗?
现在,很多公司展开的自动驾驶测试已经表明,不同地方的技术难度是不一样的。高速公路比城市环路简单,城市环路比开放的城市道路简单,开放的城市道路也比胡同或小县城电动自行车穿梭其中的环境要简单。所以,当我们讨论自动驾驶的时候,本身就应该把地点等因素考虑进去,而不是简单地类推出一辆终极的、无所不能的L5汽车。
稍微开一下脑洞,很有可能的场景是,当我们向系统输入目的地之后,系统会告诉我们,“今天的路程全程不用你来管,放心睡觉吧”。或者会告诉我们,“今天大部分的路都不用你管,但有一小段我没十足把握,到时候需要你帮忙”……自动驾驶的三种实际部署路线自动驾驶领域的很多公司在展开研究、在讲他们的故事,但是谈到“看得见、摸得着”的实际部署路线,最有代表性的就是Mobileye、特斯拉和Waymo这三家公司。
用上边的流程图,我们看下这三种实际技术部署路线的区别。
首先,Mobileye+传统车企走的是“谨小慎微,但求无过”的实际部署路线。从2017年就开始宣传,号称全球首款L3级别量产车的奥迪A8,今年上市后的真实情况是什么样的呢?就是连ACC自适应巡航这样的功能,都只在最顶配车型上提供。更别说传说中L3级别的TrafficJamPilot功能,实际情况是全系都没有,需要选装才行,然后在大部分国家连选配都不能选。
就在这几天上市的福特福克斯2018款,也号称支持L2级别的Co-Pilot360智能辅助驾驶系统,“入门车型配了顶级科技配置”。实际情况呢?同样连最顶配车型也没有包括ACC自适应巡航在内的Co-Pilot360系统,而且只有最顶配车型才能选装。换言之,传统车企宣传自己的技术很厉害,但实际上却不怎么敢让你用。
对这种情况,汽车之家的创始人李想,在微博上曾有过评价:“传统汽车品牌和特斯拉在辅助驾驶/自动驾驶上最大的区别是:传统汽车品牌的消费者连用都不敢用,所以特别特别特别的安全。特斯拉的车主们每天辅助驾驶/自动驾驶的使用总时长,估计够所有其它汽车品牌一个月使用时长的总和。”
接下来就聊特斯拉的路线,这家明星公司可以说是走在“急于求成、蒙眼狂奔”的路上。与传统车企不同,特斯拉视自动辅助驾驶技术为核心竞争力,所以为所有车型都预装了各种传感器硬件,但车主仍然需要花钱“激活”相应的功能,包括“增强版自动辅助驾驶”和“全自动驾驶能力”两个套装。
特斯拉在行业中被普遍认为,过度宣传了自家的自动驾驶技术能力,尤其是被称为“全自动驾驶能力”的套装,对车主的误导性极强。就算不讨论之前特斯拉的两次广受关注的Autopilot致死事故(国外撞上了大货车,国内追尾道路清扫车),最近特斯拉撞上公路隔离带致死事故,也足以给特斯拉盖上“急于求成、蒙眼狂奔”的帽子。
最近的开启Autopilot撞上隔离带致死事件之后,一位车主“以身试法”实地还原了当时的场景,发现特斯拉的Autopilot系统确实应付不了当时的情况,没有正确地识别出前方的车道已经消失,需要转到另一个车道。但是如果采用Waymo的技术方案(事先给环境建模、激光雷达和计算机视觉互为冗余等),这种情况就很有可能避免。
最后就是Waymo的“胆大心细、步步为营”路线。Waymo的车,准确的说是Waymo与克莱斯勒、捷豹合作特别定制自动驾驶汽车,是普通人现阶段根本买不起的,因为它装配了定制化的芯片和传感器,尤其是激光雷达传感器目前价格比车还贵。Waymo的方案是提前为自动驾驶车要运行的环境建模,比一般意义上的高精地图包含更多更多的环境细节信息,然后通过计算机视觉与激光雷达的算法融合,形成自动驾驶的策略和算法基础。对于特斯拉装上隔离带的情况,Waymo的优势在于它本身就应该会知道那个车道是不通的,而不需要通过计算机视觉临时来判断(再做反应可能就来不及了)。
“胆大心细”,“胆大”说的是Waymo已经开始在部分地区,邀请真实用户上路体验自己的车;“心细”说的是Waymo也只敢在自己掌握完整环境数据的地区,开展这类服务。步步为营,则说的是Waymo在美国的各个地区、各种极端环境下展开测试,通过攻克一城一寨的方式,逐步扩大技术能适应的能力范围。
三种路线的未来变数对于三种自动驾驶实际技术部署路线,行业中的人也有不同的看法。如果我们极端化描述(仅为了方便理解)这三种实际技术部署路线,总结起来就是有三种变数:
一、(可能性49%)计算机视觉突飞猛进,不依赖激光雷达和提前环境建模就能做到足够好的自动驾驶。特斯拉胜。
二、(可能性49%)激光雷达和提前环境建模成本大幅下降,便宜到所有车都可以装配。Waymo胜。
三、(可能性2%)计算机视觉没有突飞猛进,激光雷达和提前环境建模成本也没有大幅下降,自动驾驶老出问题陷入困境,ADAS回潮。
Mobileye+传统车企胜。不管怎么说,自动驾驶行业正处在黎明前的黑暗中。带我们冲破黑暗的,一定不是那些迫不及待、率先发布L5级别自动驾驶汽车的公司。
先来一张各大车企自动驾驶技术的分级图,大致了解一下目前已经量产的自动驾驶技术哪家强。
自动驾驶从L2到L5是一个相对漫长的过程,现已发布的量产车型中有处于L3的奥迪A8、处于L2.5的Tesla、还有处于L2的凯迪拉克CT6等。那么每一级别之间具体的区别和需要克服的难点到底又有哪些?那就一级一级细细道来。按照国际惯例,谈论自动驾驶级别时必须上一张SAE的分级图。
下面我用给大家解释一下各个级别到底代表着什么样的技术哪些指标能立刻区分汽车属于哪个Level为什么Level越高,对技术的要求越高
SAELevel0:NoAutomation(无自动化)
准确来说,现在我们已经很难看到Level0的汽车了。要么早已报废,要么法规都禁止其上路了。无自动化意味着诸如ABS(自动防抱死)这种现在看来最基本的配置都没有。极端一点,你可以认为Level0的车就是四个轮子加一个沙发。@吉利
SAELevel1:DriverAssistance(驾驶员辅助)
生活中常见的车基本都属于Level1。Level1称为驾驶员辅助系统,所有在驾驶员行驶过程中,对行车状态有干预的功能都叫驾驶员辅助,都属于Level1。比如最基本的ABS,以及在ABS基础上升级而来的ESP,还有高速路段常用的定速巡航、ACC自适应巡航功能及LKA车道保持辅助。大家买车时,在底盘功能介绍中看到的各种英文缩写,或多或少都是属于SAE规定的Level1。
SAELevel2:PartialAutomation(部分自动化)
Level2和Level1最明显的区别是系统能否同时在车辆横向和纵向上进行控制。如果一个车辆能同时做到ACC+LKA(自适应巡航+车道保持辅助),那么这辆车就跨进了Level2的门槛。
2018款的凯迪拉克CT6拥有的半自动驾驶系统“SuperCruise”就是典型的Level2级别。该车并不具备主动超车的功能。即目前的SuperCruise仅能实现单一车道内的加减速。再来说说自动驾驶话题下不得不提的特斯拉。特斯拉过度夸大了他们系统所具备的能力。为什么称Tesla目前的AutoPilot为Level2.5?
因为特斯拉具备换道功能。驾驶员在确保安全的情况下,拨动转向灯杆,车辆即可依据该信号实现换道。也就是说,特斯拉的换道操作并不是全自动的,而是把这一块对环境感知的需求交给了人。特斯拉收到变道信号后会由车判断是否可安全变道后才会执行。比如前后车距离太近、实线都不会变道的。
(重点来了!敲黑板)难点:Level1~Level21.汽车横向控制和纵向控制配合的舒适性单独的横向控制(车道保持)或纵向控制(ACC等)技术已经十分成熟,那么两者同时控制时,如何将舒适性做到最优,这就是当前遇到的挑战。
通知驾驶员接管车辆的时机选择Level2的系统并不具备较高级别的自动驾驶功能,需要驾驶员实时监控并做好接管的准备。如何以最友好的和最恰当的交互方式通知驾驶员接管车辆,而不影响到驾驶员的心情,需要人机交互攻城狮费尽心思。
SAELevel3:ConditionalAutomation(有条件自动驾驶)
有条件自动驾驶是指在某些特定场景下进行自动驾驶。比如全新奥迪A8在他们的宣传视频中就限定了十分常见的场景——堵车,该功能叫作TrafficJamPilot(交通拥堵巡航),功能描述如下:当车速小于或等于60公里/小时,用户可以启动道路拥堵状况下的自动驾驶功能。
在当地法律允许的情况下,车辆会完全接管驾驶任务,直到系统通知用户再次接管。这也是目前在全球范围内,在实现量产的车型中拥有的最高级别的自动驾驶能力。引用出处:全球首款自动驾驶量产车奥迪A8背后的AudiAI。
仔细想想,这些功能特斯拉通过升级软件也能实现,为什么只有AudiA8敢宣称自己达到L3呢?因为L3相比L2最大的进步在于——不需要驾驶员实时监控当前路况,只需要在系统提示时接管车辆即可。这对于自动驾驶技术来说是一个很大的跨越,这也意味着自动驾驶系统代替人类成为了Driver&monitor。
驾驶员变为乘客,而乘客是不需要实时监控当前路况的。传感器感知技术NTSB最近刚发布的,去年五月特斯拉撞卡车交通事故的宣判结果——特斯拉Autopilot的功能限制是导致2016年5月交通致死事故的主要原因,这里的功能缺陷实际上就是传感器感知的缺陷。AutoPilot1.0的硬件配置很难处理特殊工况,比如交叉路口。图为特斯拉因传感器感知缺陷未正确识别卡车所导致的事故。
正是因为传感器感知缺陷这种客观因素的存在,整车厂做自动驾驶时就显得尤为保守,要么增加传感器以加强感知能力,比如全新奥迪A8加的四线激光雷达;要么就通过监视驾驶员的面部状态,确保驾驶员实时观测着前方路况,比如凯迪拉克CT6。
目前中国还是不允许自动驾驶车在开放及高速道路测试的,所以在法规正式发布之前,自动驾驶还只能到封闭的试车场中测试。这一点国外走在前列。
SAELevel4:HighAutomation(高度自动驾驶)
无论是国外的Waymo、Uber还是国内的BaiduL4事业部做的都是Level4自动驾驶技术的研究。它们的自动驾驶汽车有一个很明显的共同点,就是头上顶着一个大大的激光雷达。如下。
激光雷达提供了极高精度和极其丰富的感知信息,这使自动驾驶车自如处理极端工况成为可能。激光为主,视觉为辅,再加上车上各种功能冗余的传感器及高精度电子地图,在开放道路上实现A点到B点的自动驾驶不再遥远。
难点:Level3~Level4
1.传感器成本激光雷达的成本短期内还降不下来,这也是L4自动驾驶汽车还未普及的重要原因之一。Waymo在今年年初宣布将激光雷达成本降低90%,希望低成本激光传感器早日到来。
2.极高鲁棒性的自动驾驶算法及稳定的计算平台
Level4的自动驾驶算法准确性和精确性需要达到,甚至超过人类的认知水平,这就需要的是极具鲁棒性的算法和稳定的计算平台。确保自动驾驶汽车即使遇到突发情况也能较好应对。
3.高精度地图采集资质这一项难点国外并不存在,但是国内确实是一个很大的壁垒(国防考虑)。除了大家耳熟能详的BAT有地图测绘资质外,国内有测绘资质的图商寥寥无几。
近几年随着自动驾驶的发展,想在国内发展自动驾驶技术,图商说不定会成为稀缺资源。可以的话,推荐大家自己去调研国内有测绘资质的几家图商,买点他们的股票,看涨。
4.乘坐人员接纳度
现在让你去乘坐一辆没有方向盘,随时都无法接管的汽车,心里多少会有些忐忑吧。因此人类的接纳程度也是自动驾驶普及的一个大难点,需要时间建立信任。
Level5:FullAutomation(完全自动驾驶)
LEVEL5:车企看看就好
Level5全自动驾驶(无人驾驶),没有使用条件限制,无需监控和控制,甚至没有方向盘等控制机构。是汽车驾驶自动化系统研发的终极目标。研发难度极大,成本极高,需要非常强大的感知和决策能力,全天候工作。
之前,Level5研发的领头羊就是Google,Google把互联网软件公司的优势发挥的淋漓尽致,但同时也看到,经历了这么多年的研发,Google的无人驾驶小车依然“步履蹒跚”。
传统主机厂在研发Level2-3之后,也逐渐重视Level4和5,有车企的底子和供应商支持,进展神速!赶超Google我认为是迟早的事…Level5难度首先来自于感知,虽然有多种传感器,比如360度激光雷达和摄像头,但这些传感器输出大量原始数据。
普通人看摄像头和激光雷达的数据很容易识别出里面的内容,但电脑就很困难。普通的模式识别识别率会很快达到瓶颈,这时候就需要深度学习,需要大量的数据进行训练,而当今深度学习以及人工智能并没有给识别工作带来质的飞跃。很多显而易见的场景,电脑就是认不出来。同时当数据量增多时,计算的时间也会延长,系统响应变慢,这就导致这些无人车只能低速行驶。
另一大难题是决策控制。主流方式是专家系统,把所有的经验进行总结,归纳为代码。但驾驶场景万万千千,极难穷尽,遇到没见过的场景干脆就没响应了。于是另一种方式,人工智能成为解决问题的唯一希望。但纯靠人工智能进行决策控制还处于“扯淡”阶段,同样需要大量数据进行训练,而这种训练又不像训练人类驾驶员,能够互动沟通,讨论自身问题。
训练这个系统就像对牛弹琴,让牛看你弹个千百遍,然后说,牛,该你了!牛会怎么弹其实你是不知道的,同样这个训练后的人工智能系统到底做出啥响应也是不确定的,一旦出错,你还没法回溯(就像你没法问牛你为啥这么弹)。
最佳的方式似乎是结合专家系统和人工智能,但如果结合又是难点。说到Level5,不得不说,未必是所有主机厂的最终选择。其成本极高,带来的客户收益未必比L2高太多。
所有很多主机厂都说不会研发没有方向盘的无人驾驶车,驾驶是每个爱车人的权利。这类车更多的是未来出行或者交通的新方向,而且只要限制车的行驶区域,比如封闭的校园或场馆,限制行进速度,这些降级的Level5还是应该很快就能面试的。如果让Level5真像人类驾驶员一样开车,恐怕要很久很久了。
人工智能的历史、现状和未来
如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。世界主要发达国家均把发展人工智能作为提升国家竞争力、维护国家安全的重大战略,力图在国际科技竞争中掌握主导权。习近平总书记在十九届中央政治局第九次集体学习时深刻指出,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。错失一个机遇,就有可能错过整整一个时代。新一轮科技革命与产业变革已曙光可见,在这场关乎前途命运的大赛场上,我们必须抢抓机遇、奋起直追、力争超越。
概念与历程
了解人工智能向何处去,首先要知道人工智能从何处来。1956年夏,麦卡锡、明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,首次提出“人工智能(ArtificialIntelligence,简称AI)”这一概念,标志着人工智能学科的诞生。
人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。
人工智能充满未知的探索道路曲折起伏。如何描述人工智能自1956年以来60余年的发展历程,学术界可谓仁者见仁、智者见智。我们将人工智能的发展历程划分为以下6个阶段:
一是起步发展期:1956年—20世纪60年代初。人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。
二是反思发展期:20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如,无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入低谷。
三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。
四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。
五是稳步发展期:20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年国际商业机器公司(简称IBM)深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念。以上都是这一时期的标志性事件。
六是蓬勃发展期:2011年至今。随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长的新高潮。
现状与影响
对于人工智能的发展现状,社会上存在一些“炒作”。比如说,认为人工智能系统的智能水平即将全面超越人类水平、30年内机器人将统治世界、人类将成为人工智能的奴隶,等等。这些有意无意的“炒作”和错误认识会给人工智能的发展带来不利影响。因此,制定人工智能发展的战略、方针和政策,首先要准确把握人工智能技术和产业发展的现状。
专用人工智能取得重要突破。从可应用性看,人工智能大体可分为专用人工智能和通用人工智能。面向特定任务(比如下围棋)的专用人工智能系统由于任务单一、需求明确、应用边界清晰、领域知识丰富、建模相对简单,形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。人工智能的近期进展主要集中在专用智能领域。例如,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,人工智能程序在大规模图像识别和人脸识别中达到了超越人类的水平,人工智能系统诊断皮肤癌达到专业医生水平。
通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。目前,虽然专用人工智能领域已取得突破性进展,但是通用人工智能领域的研究与应用仍然任重而道远,人工智能总体发展水平仍处于起步阶段。当前的人工智能系统在信息感知、机器学习等“浅层智能”方面进步显著,但是在概念抽象和推理决策等“深层智能”方面的能力还很薄弱。总体上看,目前的人工智能系统可谓有智能没智慧、有智商没情商、会计算不会“算计”、有专才而无通才。因此,人工智能依旧存在明显的局限性,依然还有很多“不能”,与人类智慧还相差甚远。
人工智能创新创业如火如荼。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷调整发展战略。比如,谷歌在其2017年年度开发者大会上明确提出发展战略从“移动优先”转向“人工智能优先”,微软2017财年年报首次将人工智能作为公司发展愿景。人工智能领域处于创新创业的前沿。麦肯锡公司报告指出,2016年全球人工智能研发投入超300亿美元并处于高速增长阶段;全球知名风投调研机构CBInsights报告显示,2017年全球新成立人工智能创业公司1100家,人工智能领域共获得投资152亿美元,同比增长141%。
创新生态布局成为人工智能产业发展的战略高地。信息技术和产业的发展史,就是新老信息产业巨头抢滩布局信息产业创新生态的更替史。例如,传统信息产业代表企业有微软、英特尔、IBM、甲骨文等,互联网和移动互联网时代信息产业代表企业有谷歌、苹果、脸书、亚马逊、阿里巴巴、腾讯、百度等。人工智能创新生态包括纵向的数据平台、开源算法、计算芯片、基础软件、图形处理器等技术生态系统和横向的智能制造、智能医疗、智能安防、智能零售、智能家居等商业和应用生态系统。目前智能科技时代的信息产业格局还没有形成垄断,因此全球科技产业巨头都在积极推动人工智能技术生态的研发布局,全力抢占人工智能相关产业的制高点。
人工智能的社会影响日益凸显。一方面,人工智能作为新一轮科技革命和产业变革的核心力量,正在推动传统产业升级换代,驱动“无人经济”快速发展,在智能交通、智能家居、智能医疗等民生领域产生积极正面影响。另一方面,个人信息和隐私保护、人工智能创作内容的知识产权、人工智能系统可能存在的歧视和偏见、无人驾驶系统的交通法规、脑机接口和人机共生的科技伦理等问题已经显现出来,需要抓紧提供解决方案。
趋势与展望
经过60多年的发展,人工智能在算法、算力(计算能力)和算料(数据)等“三算”方面取得了重要突破,正处于从“不能用”到“可以用”的技术拐点,但是距离“很好用”还有诸多瓶颈。那么在可以预见的未来,人工智能发展将会出现怎样的趋势与特征呢?
从专用智能向通用智能发展。如何实现从专用人工智能向通用人工智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的重大挑战。2016年10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》,提出在美国的人工智能中长期发展策略中要着重研究通用人工智能。阿尔法狗系统开发团队创始人戴密斯·哈萨比斯提出朝着“创造解决世界上一切问题的通用人工智能”这一目标前进。微软在2017年成立了通用人工智能实验室,众多感知、学习、推理、自然语言理解等方面的科学家参与其中。
从人工智能向人机混合智能发展。借鉴脑科学和认知科学的研究成果是人工智能的一个重要研究方向。人机混合智能旨在将人的作用或认知模型引入到人工智能系统中,提升人工智能系统的性能,使人工智能成为人类智能的自然延伸和拓展,通过人机协同更加高效地解决复杂问题。在我国新一代人工智能规划和美国脑计划中,人机混合智能都是重要的研发方向。
从“人工+智能”向自主智能系统发展。当前人工智能领域的大量研究集中在深度学习,但是深度学习的局限是需要大量人工干预,比如人工设计深度神经网络模型、人工设定应用场景、人工采集和标注大量训练数据、用户需要人工适配智能系统等,非常费时费力。因此,科研人员开始关注减少人工干预的自主智能方法,提高机器智能对环境的自主学习能力。例如阿尔法狗系统的后续版本阿尔法元从零开始,通过自我对弈强化学习实现围棋、国际象棋、日本将棋的“通用棋类人工智能”。在人工智能系统的自动化设计方面,2017年谷歌提出的自动化学习系统(AutoML)试图通过自动创建机器学习系统降低人员成本。
人工智能将加速与其他学科领域交叉渗透。人工智能本身是一门综合性的前沿学科和高度交叉的复合型学科,研究范畴广泛而又异常复杂,其发展需要与计算机科学、数学、认知科学、神经科学和社会科学等学科深度融合。随着超分辨率光学成像、光遗传学调控、透明脑、体细胞克隆等技术的突破,脑与认知科学的发展开启了新时代,能够大规模、更精细解析智力的神经环路基础和机制,人工智能将进入生物启发的智能阶段,依赖于生物学、脑科学、生命科学和心理学等学科的发现,将机理变为可计算的模型,同时人工智能也会促进脑科学、认知科学、生命科学甚至化学、物理、天文学等传统科学的发展。
人工智能产业将蓬勃发展。随着人工智能技术的进一步成熟以及政府和产业界投入的日益增长,人工智能应用的云端化将不断加速,全球人工智能产业规模在未来10年将进入高速增长期。例如,2016年9月,咨询公司埃森哲发布报告指出,人工智能技术的应用将为经济发展注入新动力,可在现有基础上将劳动生产率提高40%;到2035年,美、日、英、德、法等12个发达国家的年均经济增长率可以翻一番。2018年麦肯锡公司的研究报告预测,到2030年,约70%的公司将采用至少一种形式的人工智能,人工智能新增经济规模将达到13万亿美元。
人工智能将推动人类进入普惠型智能社会。“人工智能+X”的创新模式将随着技术和产业的发展日趋成熟,对生产力和产业结构产生革命性影响,并推动人类进入普惠型智能社会。2017年国际数据公司IDC在《信息流引领人工智能新时代》白皮书中指出,未来5年人工智能将提升各行业运转效率。我国经济社会转型升级对人工智能有重大需求,在消费场景和行业应用的需求牵引下,需要打破人工智能的感知瓶颈、交互瓶颈和决策瓶颈,促进人工智能技术与社会各行各业的融合提升,建设若干标杆性的应用场景创新,实现低成本、高效益、广范围的普惠型智能社会。
人工智能领域的国际竞争将日益激烈。当前,人工智能领域的国际竞赛已经拉开帷幕,并且将日趋白热化。2018年4月,欧盟委员会计划2018—2020年在人工智能领域投资240亿美元;法国总统在2018年5月宣布《法国人工智能战略》,目的是迎接人工智能发展的新时代,使法国成为人工智能强国;2018年6月,日本《未来投资战略2018》重点推动物联网建设和人工智能的应用。世界军事强国也已逐步形成以加速发展智能化武器装备为核心的竞争态势,例如美国特朗普政府发布的首份《国防战略》报告即谋求通过人工智能等技术创新保持军事优势,确保美国打赢未来战争;俄罗斯2017年提出军工拥抱“智能化”,让导弹和无人机这样的“传统”兵器威力倍增。
人工智能的社会学将提上议程。为了确保人工智能的健康可持续发展,使其发展成果造福于民,需要从社会学的角度系统全面地研究人工智能对人类社会的影响,制定完善人工智能法律法规,规避可能的风险。2017年9月,联合国犯罪和司法研究所(UNICRI)决定在海牙成立第一个联合国人工智能和机器人中心,规范人工智能的发展。美国白宫多次组织人工智能领域法律法规问题的研讨会、咨询会。特斯拉等产业巨头牵头成立OpenAI等机构,旨在“以有利于整个人类的方式促进和发展友好的人工智能”。
态势与思考
当前,我国人工智能发展的总体态势良好。但是我们也要清醒看到,我国人工智能发展存在过热和泡沫化风险,特别在基础研究、技术体系、应用生态、创新人才、法律规范等方面仍然存在不少值得重视的问题。总体而言,我国人工智能发展现状可以用“高度重视,态势喜人,差距不小,前景看好”来概括。
高度重视。党中央、国务院高度重视并大力支持发展人工智能。习近平总书记在党的十九大、2018年两院院士大会、全国网络安全和信息化工作会议、十九届中央政治局第九次集体学习等场合多次强调要加快推进新一代人工智能的发展。2017年7月,国务院发布《新一代人工智能发展规划》,将新一代人工智能放在国家战略层面进行部署,描绘了面向2030年的我国人工智能发展路线图,旨在构筑人工智能先发优势,把握新一轮科技革命战略主动。国家发改委、工信部、科技部、教育部等国家部委和北京、上海、广东、江苏、浙江等地方政府都推出了发展人工智能的鼓励政策。
态势喜人。据清华大学发布的《中国人工智能发展报告2018》统计,我国已成为全球人工智能投融资规模最大的国家,我国人工智能企业在人脸识别、语音识别、安防监控、智能音箱、智能家居等人工智能应用领域处于国际前列。根据2017年爱思唯尔文献数据库统计结果,我国在人工智能领域发表的论文数量已居世界第一。近两年,中国科学院大学、清华大学、北京大学等高校纷纷成立人工智能学院,2015年开始的中国人工智能大会已连续成功召开四届并且规模不断扩大。总体来说,我国人工智能领域的创新创业、教育科研活动非常活跃。
差距不小。目前我国在人工智能前沿理论创新方面总体上尚处于“跟跑”地位,大部分创新偏重于技术应用,在基础研究、原创成果、顶尖人才、技术生态、基础平台、标准规范等方面距离世界领先水平还存在明显差距。在全球人工智能人才700强中,中国虽然入选人数名列第二,但远远低于约占总量一半的美国。2018年市场研究顾问公司CompassIntelligence对全球100多家人工智能计算芯片企业进行了排名,我国没有一家企业进入前十。另外,我国人工智能开源社区和技术生态布局相对滞后,技术平台建设力度有待加强,国际影响力有待提高。我国参与制定人工智能国际标准的积极性和力度不够,国内标准制定和实施也较为滞后。我国对人工智能可能产生的社会影响还缺少深度分析,制定完善人工智能相关法律法规的进程需要加快。
前景看好。我国发展人工智能具有市场规模、应用场景、数据资源、人力资源、智能手机普及、资金投入、国家政策支持等多方面的综合优势,人工智能发展前景看好。全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。在我国未来的发展征程中,“智能红利”将有望弥补人口红利的不足。
当前是我国加强人工智能布局、收获人工智能红利、引领智能时代的重大历史机遇期,如何在人工智能蓬勃发展的浪潮中选择好中国路径、抢抓中国机遇、展现中国智慧等,需要深入思考。
树立理性务实的发展理念。任何事物的发展不可能一直处于高位,有高潮必有低谷,这是客观规律。实现机器在任意现实环境的自主智能和通用智能,仍然需要中长期理论和技术积累,并且人工智能对工业、交通、医疗等传统领域的渗透和融合是个长期过程,很难一蹴而就。因此,发展人工智能要充分考虑到人工智能技术的局限性,充分认识到人工智能重塑传统产业的长期性和艰巨性,理性分析人工智能发展需求,理性设定人工智能发展目标,理性选择人工智能发展路径,务实推进人工智能发展举措,只有这样才能确保人工智能健康可持续发展。
重视固本强基的原创研究。人工智能前沿基础理论是人工智能技术突破、行业革新、产业化推进的基石。面临发展的临界点,要想取得最终的话语权,必须在人工智能基础理论和前沿技术方面取得重大突破。我们要按照习近平总书记提出的支持科学家勇闯人工智能科技前沿“无人区”的要求,努力在人工智能发展方向和理论、方法、工具、系统等方面取得变革性、颠覆性突破,形成具有国际影响力的人工智能原创理论体系,为构建我国自主可控的人工智能技术创新生态提供领先跨越的理论支撑。
构建自主可控的创新生态。我国人工智能开源社区和技术创新生态布局相对滞后,技术平台建设力度有待加强。我们要以问题为导向,主攻关键核心技术,加快建立新一代人工智能关键共性技术体系,全面增强人工智能科技创新能力,确保人工智能关键核心技术牢牢掌握在自己手里。要着力防范人工智能时代“空心化”风险,系统布局并重点发展人工智能领域的“新核高基”:“新”指新型开放创新生态,如产学研融合等;“核”指核心关键技术与器件,如先进机器学习技术、鲁棒模式识别技术、低功耗智能计算芯片等;“高”指高端综合应用系统与平台,如机器学习软硬件平台、大型数据平台等;“基”指具有重大原创意义和技术带动性的基础理论与方法,如脑机接口、类脑智能等。同时,我们要重视人工智能技术标准的建设、产品性能与系统安全的测试。特别是我国在人工智能技术应用方面走在世界前列,在人工智能国际标准制定方面应当掌握话语权,并通过实施标准加速人工智能驱动经济社会转型升级的进程。
推动共担共享的全球治理。目前看,发达国家通过人工智能技术创新掌控了产业链上游资源,难以逾越的技术鸿沟和产业壁垒有可能进一步拉大发达国家和发展中国家的生产力发展水平差距。在发展中国家中,我国有望成为全球人工智能竞争中的领跑者,应布局构建开放共享、质优价廉、普惠全球的人工智能技术和应用平台,配合“一带一路”建设,让“智能红利”助推共建人类命运共同体。
(作者:中央人民政府驻香港特别行政区联络办公室副主任、中国科学院院士)