IEEE Fellow李世鹏 :人工智能与机器人前沿研究之思考
作者 |维克多编辑|青暮
2021年12月9日,由粤港澳大湾区人工智能与机器人联合会、雷峰网合办的第六届全球人工智能与机器人大会(GAIR2021)在深圳正式启幕,140余位产学领袖、30位Fellow聚首,从AI技术、产品、行业、人文、组织等维度切入,以理性分析与感性洞察为轴,共同攀登人工智能与数字化的浪潮之巅。大会次日,思尔实验室主任、前深圳市人工智能与机器人研究院执行院长、国际欧亚科学院院士、IEEEFellow李世鹏在GAIR大会上做了《人工智能与机器人前沿研究之思考》的演讲。李世鹏博士,IEEEFellow,国际欧亚科学院院士。历任深圳市人工智能与机器人研究院首席科学家和执行院长、科大讯飞集团副总裁及讯飞研究院联席院长、微软亚洲研究院创始成员与副院长。李院士在多媒体、IoT及AI等领域颇具影响力。他拥有203项美国专利并发表了330多篇被引用了的论文(H指数:82)。被Guide2Research列为世界顶尖1000名计算机科学家之一。培养出四位MITTR35创新奖的获得者。是(科技部)新一代人工智能产业技术创新战略联盟发起人之一及联合秘书长。在演讲中,李世鹏介绍并展望了人工智能与机器人前沿研究方向,他指出:未来机器学习突破深度学习的数据瓶颈或许可以借助认知科学的方法得到突破,学习范式可从依靠“大数据”转变成依靠“大规则”;人机协作也要进化为人机“谐”作,只有将耦合、交互、增强、互补等目标纳入研究方向,才能实现人机的无缝连接。以下是演讲全文,AI科技评论做了不改变原意的整理:今天的演讲题目是《人工智能与机器人前沿研究之思考》,分为三个部分,先谈人工智能和机器人研究全景,然后聚焦研究方向,包括机器学习、运动智能、人机谐作、群体协作;最后进行总结。
人工智能相关研究的关键元素有三个:人、机器人/物联网以及AI。之所以将机器人和物联网归为一类,是因为这两者是物理世界和虚拟世界的接口。如果三个元素两两之间发生联系就会形成一个新的学科,例如机器人和AI相结合会产生智能体,AI和人类相结合会产生人机耦合以及增强智能,而机器人和人类相融合会形成增强机体。随着人工智能与机器人领域的发展,研究对象不再局限在单个智能体,而是越来越多地对多个智能体的协作进行研究,例如人类社会群体如何更好地相融合?如何设计出能够精妙协作的机器群体?总体而言,我认为重要的基本研究方向是:机器学习、运动智能、人机谐作、群体协作。
1聚焦方向之机器学习机器学习的发展离不开深度学习加持,它给行业带来许多研究成果,并赋能了语音识别、人脸识别、物体识别、自动驾驶等方面,推动人工智能产业高速发展。虽然成果颇丰,但成也萧何败也萧何。深度学习依赖于大数据,其瓶颈也在于大数据。例如国内的智能语音技术尽管处于行业领先,但仍依赖技术积累和数据积累。现在想要让深度学习发挥巨大威力,仍然需要大量数据的加持,如果想让深度学习从一个领域扩展到另一个领域,也少不了数据支撑。
如何突破?研究者已经探索了多条路径,其中一个解决方案是:扩展深度学习框架。例如优化深度学习算法、知识图谱+深度学习、专家系统+深度学习等等。另一条路径是因果推理,其目标是借助人类举一反三的能力,期望超越数据之间的相关性,进而探索数据之间的因果性,从而得到数据之间的逻辑推理。第三条路径是类脑计算,从生物学角度,探索人脑认知元素和机制,以仿真方法再现人类大脑。个人认为认知科学是突破深度学习框架的着力点。理由是人类认知过程有两点需要我们去进一步借鉴:生而知之、学而知之。生而知之是指部分认知能力与生俱来,新生儿的脑神经有很多先天的连接。它给我们的启示是:现在的大多深度学习算法,大部分都是从零开始训练,而没有充分或者高效利用先验知识或者已有模型。如何利用“现有知识”是深度学习的下一个热门方向。学而知之是指大部分认知能力是后天学习到的,尤其是早期学习。通过学习脑神经建立了更多的连接。孩子很多能力,包括感知、应对、语言、读写和理解,甚至分析问题和解决问题的思路和能力在很小时候已经基本定型;以后基本都是知识的积累。这意味着脑神经元很早的时候就连接定型成一个元模型,剩下的是只是利用这个元模型去解决具体领域的问题。这个与当前的大规模预训练模型有着惊人的相似之处。学而知之的另一层次是:人类学习过程依靠多源的、多传感的、多模态的、多角度的数据,例如视觉、听觉、嗅觉、触觉和语境等联合信息,而今天的深度学习依靠大都是一段语音、一张照片,因此,未来AI模型的输入数据可能不仅是单一的数据,而是多个信号源的融合。如何模仿人类学习的过程,这是认知科学对深度学习的另一个启示。再者,人类学习过程是一个从样本示例到原理归纳的过程,而不是仅停留在样本示例层面;目前深度学习却都是停留在样本层面。那么,未来是否能够构造类人的机器学习框架,无论输入什么样的数据,只要逻辑相通,都会收敛到一致的模型?突破深度学习的数据瓶颈,可以尝试构建规则的众包系统,让人类教机器学习过程,其目的不是输入数据,而是让机器学习规则。由于我们试图从日常的活动中学习规则,这种规则普通人都可以标注示教,这就打破了以前专家系统地需要“专家”的局限。这种从“大数据”过渡到“大规则”模型构建方式显然也更符合人类的认知。2聚焦方向之运动智能众所周知,在机器人领域,波士顿动力公司的产品最“像人”,如上动图,机器人跳舞丝毫看不出生硬的感觉。但受计算资源、能量、运动控制的限制,它只能运行几十分钟。其实,波士顿动力机器人的运行方式是基于电机驱动,存在很多缺点,例如刚性运动、自重比较大、反应速度和灵活性的矛盾以及耗能大。
对比人类和其他动物的运行方式,肌肉、骨骼、传感和神经的结合可以在低能耗情况下,实现灵活运行。这给研究者的启示是,机器人的运行系统应该像人一样满足:高效、灵活、精确、鲁棒、刚柔并济、轻量、自适应等指标。当前的运动智能可能在某一个维度表现优秀,但综合考量仍然有很多缺点。因此,运动智能的一个重要研究方向是:仿生。仿照动物的运动智能,例如运动控制采用逼近反馈式,运动过程视变化随时灵活调整。如果说机器人是靠“内力”驱动,而医疗微纳米机器人是“外力”研究方向的代表。例如依靠磁力,小机器人精确地将药物从一个管道运送到另一个管道。3聚焦方向之人机谐作在人机谐作层面,区别于协作,“谐作”代表人机协作中的耦合、交互、增强、互补、协作、和谐等意思。人机谐作的目标是:不需要告诉机器人类的意图,机器就能领会,从而达到人机的无缝连接。在达成人机谐作的过程中,重点研究人机自然交互、感知及增强。具体可能包括:生物特征检测和识别、人机接口、脑机接口、语音识别、动作识别、表情识别、语言理解、意图理解、体态感知、无隙增强,以及在扩展现实与远程现实的延伸等等。人机增强智能方面,今天的机器学习框架大都是基于大数据的深度学习框架,肯定会遇到机器智能处理不了的情景。这对于某些高风险领域,例如自动驾驶、金融等来说是致命的。针对这一问题,当前的解决方案是“人类接管”。这会涉及三个核心问题:核心问题1:机器智能如何感知自己处理不了一些情况,而主动要求人来接管?核心问题2:什么时候人类可以完全放手给机器自主完成任务?核心问题3:什么样的人机交互设计能充分发挥人和机器各自的长处,同时又无需非必要地麻烦对方?三个核心问题如果无法解决,会导致一些困境。例如,以自动驾驶为例,目前安全员并不是开了“自动”功能就一劳永逸,仍然需要时时监测路况与路线,一刻都不能分神。这其实增加了安全员的负担,因为在没有自动驾驶的时候,人类对自己的驾驶环境会有一定的预测,而机器驾驶的情况人类无法预测。人机增强机体也属于人机谐作的一个领域,能够帮助人类增强物理机体能力,完成一些人类自身体力完不成的事情。但机器可能过于复杂,需要人类培训后才能操作。人机增强机体的未来目标是实现人与机器和谐共处,操控起来如同人类的自己的器官一样自然。其中,涉及的核心研究课题包括:机器感知人的意图、人的姿态、理解人的自然语言命令、肢体语言等等,从而让机器以最适合人类接受、恰到好处的平滑方式帮助人解决问题。4聚焦方向之群体协作目前单智能体已经可以完成许多任务,但如何发挥每个智能体集合起来的威力?这涉及群体协作的研究方向。在仓储场景下,存在许多抓取分类的机器人,如果能够有效调度,那么必将大大提高工作效率。当前主流的调度方式是中心化的控制方式,但面对成千上万的规模的智能体,则需要非中心化的控制,允许智能体之间存在自主行为,在相互协作的同时,还能“做自己的事”。即单独的有智能可独立行动的智能体,通过协作而达到的更高效的群体/系统智能和行为。智能体群体协作目前涉及的规则包括,群体行为模型和激励机制、群体智能协同决策。这一方面,蚂蚁是我们的学习对象。另外,在自动驾驶方面,越来越多自主驾驶机器人出现,它们之间如何做到协同感知和协同控制也是当今热门话题。上述四个方面属于基础性的研究,任何一个领域出现了突破,那将对其领域以及下游应用而言都是革命性的突破,也将带来工业数智化原创技术的创新,会让我们在竞争中占领优势地位!雷峰网雷峰网(公众号:雷峰网)雷峰网原创文章,未经授权禁止转载。详情见转载须知。
腾讯写稿机器人背后:真正智能机器人10年后出现
见习记者杨清清北京报道
近日,互联网巨头们的智能机器人频频现身,夺人眼球。
9月10日,在国家统计局公布8月CPI数据的第一时间,腾讯自动化新闻写作机器人Dreamwriter(梦幻写手)便写出新闻稿,成为业界议论焦点。而就在9月8日的“2015百度世界大会”上,李彦宏宣布推出百度智能机器人助手“度秘”,亦迅速刷爆朋友圈。日前,微软第三代人工智能机器人“小冰”也杀回微信,自称17岁陪人聊天是其强项。
国际机器人联盟(IFR)公开预测,到2020年,智能机器人保有量将超过1500万台,产业规模达1.5万亿美元。
“智能机器人的应用可从前后两端推动制造业的发展。”北京赛迪方略城市经济顾问有限公司高级分析师王高翔对21世纪经济报道记者指出,“未来随着国内制造业转型升级步伐的加快,智能机器人将在较长时期内保持较快增长。”
科技巨头抢夺万亿市场
随着移动互联网、物联网、大数据、新材料等新技术的迅速发展,全球正进入以智能制造为主导的第四次工业革命。
而种种迹象表明,智能机器人井喷时代即将到来。
目前,除谷歌之外,IBM、微软、脸书、雅虎、亚马逊等科技巨头也纷纷投入巨资,抢占智能机器人的战略制高点。而国内互联网巨头如百度、腾讯、阿里巴巴等,亦加速布局智能机器人,以进一步提升企业核心竞争力。
根据Gartner今年8月发布的《2015年技术成熟度曲线报告》显示,智能机器人(SmartRobots)尚处于技术上升期,但预计将在5-10年内迎来稳定应用期。这也就意味着,随着智能机器人技术成熟度的增加,5-10年后,智能机器人或将步入实质生产高峰。
智能机器人技术的快速发展及应用,正成为未来经济的重要推动力。
而在发达国家推动新工业革命、制造业回归的背景下,中国制造业正面临欧美发达国家与其他发展中国家的双向挤压,加快制造业转型升级成为中国经济“新常态”下的必然选择。发展智能制造装备、推动制造业升级是实现中国从制造大国向制造强国升级的重要途径。
在这场工业4.0的全球竞赛中,中国亦不断加码智能机器人领域。《中国制造2025》战略中提出:“加快推动新一代信息技术与制造技术融合发展,把智能制造作为两化深度融合的主攻方向;着力发展智能装备和智能产品,推进生产过程智能化。”
真正智能机器人10年后出现
腾讯自动化新闻写作机器人甫一出现,互联网上便有了关于“记者下岗”的各种猜测。
据报道,写稿机器人不仅可对核心数据进行梳理,还可根据算法在第一时间自动生成稿件,瞬时输出分析和研判。尽管目前该机器人只能撰写消息类稿件,诸如深度、人物类题材还无法胜任,但因其属于批量生产类型,每天可完成百篇稿件,在稿件数量上“完胜”单兵作战的记者。
“这体现了知识工作自动化发展的趋势。”国家信息中心专家委员会副主任宁家骏告诉21世纪经济报道记者。在他看来,未来如会计报表、法律司法文书等大量格式化文书化的内容,完全可以由机器人来操作。
而王高翔则表示,智能机器人的运用可以从前后两端推动制造业的发展。从制造环节而言,智能机器人可提升工业生产效率,促进制造过程向智能化、柔性化发展。从产品类型而言,随着智能机器人的普及提升,产品种类也将逐日更加丰富。
“延伸到腾讯的写稿机器人、度秘等这类具有自动学习能力、自动产出能力的智能机器人而言,它们在中国制造业中的应用,可以更好协调企业与企业、系统与系统之间的关系。”王高翔指出,“从而可以促进以工业4.0为核心的产业网络的形成。”
不仅数量能够取胜,在写稿基本功之一的找资料方面,智能机器人也是一把好手。企业网D1Net数据部经理赵晓勤向21世纪经济报道记者指出,写稿机器人运作的基础是UGC(用户生产内容),而机器人撰稿的过程是连接无数用户“大脑”的体现。快速收集信息并输出分析的优势,使其得以站在“巨”人肩膀上“思考”。
“微信活跃用户超过6亿,脸书的用户超过15亿,这些平台上产生的信息,人是无法全部扫描的,但机器可以。”赵晓勤说。
除令人咋舌的写稿机器人之外,目前还有各种各样的机器人,如聊天机器人、烹饪机器人、清洁机器人、迎宾机器人、送货机器人、娱乐机器人、教育机器人、医疗机器人、军事机器人等也均开始出现在不同领域。
尽管亚洲制造业协会首席执行官、国际机器人及智能装备产业联盟秘书长罗军早前公开表示,机器人要做到会思考问题、分析问题、决策问题,非常不易,目前的机器人尚未达到该水平。但同时,罗军也指出,真正意义上的智能机器人将在10年左右出现。也就是说,随着智能机器人技术的不断发展成熟,更多智能机器人“上岗”将不再遥远。
而在宁家骏看来,未来人类与智能机器人的劳动分工是必然的。人工智能机器人因其工作原理是基于规则进行逻辑推理,所以适用于程序化劳作,可以处理数据量较大、时效性要求高的工作。而人类的思维特点在于不受限于规则,可从事更具创新性的工作。“人类的跨界思维转换,是机器无法代替的。”
(编辑:张伟贤,如有意见建议请联系:zhangwx@@21jingji.com)
九寨沟地震:人工智能大显身手!写稿机器人是否能代替记者
8月8日21时19分,四川九寨沟县发生7.0级地震,举国震惊。不过更令媒体和公众感到吃惊的是,在21时37分15秒,中国地震台网机器人自动编写稿件,仅用25秒出稿,540字并配发4张图片,内容包括速报参数、震中地形、热力人口、周边村镇、周边县区、历史地震、震中简介、震中天气8大项。
25秒能做什么?人类或许还处在惊愕中,机器人已经完成了数据挖掘、数据分析、自动写稿的全过程,并通过各个平台发送给亿万人。
可不是25秒钟540字这么简单
这些年,我国已经建立起了现代化的数字地震观测网络,在全国各地甚至世界其他区域都布有地震台站,24小时密切观测全国和全世界的地震活动。
这些数据汇集到数据中心,成为地震信息播报机器人的重要信息源泉。机器人系统运行在互联网上(云计算平台),写稿所需的背景内容同样来自互联网。机器人会根据本地数据网络和接口调用、空间分析等多种技术,在几秒内自动“写”好综合的地震速报信息。
据中国地震台网中心主任潘怀文介绍,机器人入驻推送平台,在地震信息报告完成之后,几秒内就可以覆盖大量民众。高效推送使当地用户第一时间了解到震源地相关资讯,为赢得黄金避险时间争分夺秒。
中国地震台网数据服务部副主任侯建民主导和参与了地震信息播报机器人研发应用的全过程,他表示团队要解决的主要问题是信息时效性和准确性的统一。“一方面,我们对时效性要求非常高,要求机器人几秒内就要写完新闻;另一方面,机器人写的新闻,又要保证内容的准确性,确保快而不出错。”
“互联网+地震”的创新地震发生以后,地震台网要对震级大小进行快速测算,把结果进行上报。以便快速启动应急救援行动,这个过程称之为地震速报。
随着互联网,特别是移动互联网的高速发展,人们对地震的关注度越来越高,关心的内容也越来越多,这就对传统意义上的地震速报提出了更高的要求。
“一方面人们希望了解更多、更全面的地震信息,另一方面震后救援工作也需要有更快、更详细的信息作为参考依据”,侯建民说,“研发这款机器人的初衷是:让实时播报的地震信息内容更加丰富。”
他介绍说:“以前,地震后,我们会及时通过微博等其他网络平台实时发布地震消息,但因为时间紧迫,这些消息往往内容较少,只有地震时间、地点、震中位置等关键信息,公众可能需要更为丰富的内容,比如震中的简介,地震发生地的地形,人口、经济情况,地震后的天气等。基于此,我们通过互联网+的方式,研发了这个自动写新闻稿的系统,希望能为大家提供更丰富的即时地震速报内容。”
“速报”不是一天“炼成”的说起来,25秒并不是地震信息播报机器人最“光辉”的战绩,6秒560字等都是“常事”。但自动速报工作并非一开始就这么“牛气”,甚至在2008年以前,各个省级地震台网和国家地震台网给出的地震速报参数都不一定一致。
地震系统于2009年开始推进自动地震速报技术应用,组织开发自动速报产出平台和发布系统,并从此越来越完善,越来越公开。
2008年四川汶川地震确定地震参数用时14分钟,2013年四川雅安地震为1分51秒。到这次九寨沟县地震,在提供地震参数的基础上,增加了十多项内容,仅用25秒。
“最早对震区附近热力人口的统计是没有的,后来基于救灾救援工作的需求,受灾范围、热力人口等要素也被列入机器人的重点播报范围”,侯建民介绍说。
现在,人们若是安装地震速报手机应用,不仅可以第一时间了解地震参数,还可以看到震中的位置,震中周边的现场,最近的现场是哪一个,最近的医院和学校的分布等。
不禁让公众浮想联翩:记者是否要彻底失业了?在笔者看来,对于这个问题其实并不需要恐慌,尤其是记者这个群体,需要客观看待,既要看到写稿机器人在信息采集、加工、分析这个领域的巨大优势,也要明白按照现在的人工智能技术,写稿机器人尽管有一定的优势,但其还很难达到记者写稿中所饱含的事实、情感、逻辑、思想等高度。
其实,对于机器人写稿,传媒界并不陌生。从技术层面上来说,写稿机器人实际上是一种数字技术和智能写稿编程系统。一般而言,机器人写稿流程分为数据采集、数据加工、自动写稿、编辑签发4个环节。只不过面对海量数据信息,人力的处理速度肯定赶不上机器人,机器人在以信息发布为主的消息、上市公司公告、财务报表、官方发布、社交平台、证券行情等类型文章,写稿机器人不仅提高了新闻的时效性,同时节约了成本。
比如,新华社机器人发稿系统后台有500到600个模版,可以根据不同的要求,呈现不同的稿件。目前新华社机器人发稿系统运营维护仅需4到5人的团队,平均一天稿件签发量在100条左右。但要注意,这些稿件基本上还是以短平快的消息为主,这次中国地震台网机器人自动编写稿件也是以信息发布、分类处理、背景介绍为主,并不是通讯、评论、特写等以思想性见长的稿件。
因此,从这个意义上来说,尽管随着当前人工智能技术的日益强大,写稿机器人在新闻基础领域可以部分取代记者的工作,甚至会比传统的人力工作更高效,但与机器人写稿相比,人的最大价值在于对事实的判断以及对复杂逻辑关系的推理,这是记者本身创造性的体现,也是目前机器人所没有的能力。比如,质疑、追问、寻找对方话语中的新闻线索,这就是人类记者的法宝。相较于写稿机器人,记者能够生产优质的、深度的、有观点、有分析的作品,这种优势恰恰是机器人并不具备的。
正是因为写稿机器人和记者的各有优势,可以预见,未来新闻界可能的一大发展趋势就是人机协作来完成新闻作品,具体的模式就是让机器人完成新闻信息的搜集、整理、分析和加工,然后记者在这个基础上进行深度挖掘,完成逻辑判断,形成观点和思想。所以,面对此次写稿机器人的横空出世,记者们其实不必恐慌,毕竟他们还是高等智慧生物,机器人想要取而代之并没有这么容易。
欢迎分享,转载请注明来源:内存溢出
原文地址:https://outofmemory.cn/dianzi/2463132.html