写字机器人排行榜
应用安全网关流计算城市产业服务平台语音合成网站地图网站推广增值税发票识别分布式关系型数据库DRDSWeb应用防火墙私有网络视频直播京点书院分布式数据库TiDB免费在线办公流数据总线视频点播互联网广告投放京东智联云VPN抖音广告京东城市云视频点播加速云上系统可扩展解决方案看直播拿专属福利PLUS云会议存储网关静态页面加速通用文字识别云监控爱奇艺广告投放
IEEE Fellow李世鹏 :人工智能与机器人前沿研究之思考
作者 |维克多编辑|青暮
2021年12月9日,由粤港澳大湾区人工智能与机器人联合会、雷峰网(公众号:雷峰网)合办的第六届全球人工智能与机器人大会(GAIR2021)在深圳正式启幕,140余位产学领袖、30位Fellow聚首,从AI技术、产品、行业、人文、组织等维度切入,以理性分析与感性洞察为轴,共同攀登人工智能与数字化的浪潮之巅。大会次日,思尔实验室主任、前深圳市人工智能与机器人研究院执行院长、国际欧亚科学院院士、IEEEFellow李世鹏在GAIR大会上做了《人工智能与机器人前沿研究之思考》的演讲。李世鹏博士,IEEEFellow,国际欧亚科学院院士。历任深圳市人工智能与机器人研究院首席科学家和执行院长、科大讯飞集团副总裁及讯飞研究院联席院长、微软亚洲研究院创始成员与副院长。李院士在多媒体、IoT及AI等领域颇具影响力。他拥有203项美国专利并发表了330多篇被引用了的论文(H指数:82)。被Guide2Research列为世界顶尖1000名计算机科学家之一。培养出四位MITTR35创新奖的获得者。是(科技部)新一代人工智能产业技术创新战略联盟发起人之一及联合秘书长。在演讲中,李世鹏介绍并展望了人工智能与机器人前沿研究方向,他指出:未来机器学习突破深度学习的数据瓶颈或许可以借助认知科学的方法得到突破,学习范式可从依靠“大数据”转变成依靠“大规则”;人机协作也要进化为人机“谐”作,只有将耦合、交互、增强、互补等目标纳入研究方向,才能实现人机的无缝连接。以下是演讲全文,AI科技评论做了不改变原意的整理:今天的演讲题目是《人工智能与机器人前沿研究之思考》,分为三个部分,先谈人工智能和机器人研究全景,然后聚焦研究方向,包括机器学习、运动智能、人机谐作、群体协作;最后进行总结。
人工智能相关研究的关键元素有三个:人、机器人/物联网以及AI。之所以将机器人和物联网归为一类,是因为这两者是物理世界和虚拟世界的接口。如果三个元素两两之间发生联系就会形成一个新的学科,例如机器人和AI相结合会产生智能体,AI和人类相结合会产生人机耦合以及增强智能,而机器人和人类相融合会形成增强机体。随着人工智能与机器人领域的发展,研究对象不再局限在单个智能体,而是越来越多地对多个智能体的协作进行研究,例如人类社会群体如何更好地相融合?如何设计出能够精妙协作的机器群体?总体而言,我认为重要的基本研究方向是:机器学习、运动智能、人机谐作、群体协作。
1聚焦方向之机器学习机器学习的发展离不开深度学习加持,它给行业带来许多研究成果,并赋能了语音识别、人脸识别、物体识别、自动驾驶等方面,推动人工智能产业高速发展。虽然成果颇丰,但成也萧何败也萧何。深度学习依赖于大数据,其瓶颈也在于大数据。例如国内的智能语音技术尽管处于行业领先,但仍依赖技术积累和数据积累。现在想要让深度学习发挥巨大威力,仍然需要大量数据的加持,如果想让深度学习从一个领域扩展到另一个领域,也少不了数据支撑。
如何突破?研究者已经探索了多条路径,其中一个解决方案是:扩展深度学习框架。例如优化深度学习算法、知识图谱+深度学习、专家系统+深度学习等等。另一条路径是因果推理,其目标是借助人类举一反三的能力,期望超越数据之间的相关性,进而探索数据之间的因果性,从而得到数据之间的逻辑推理。第三条路径是类脑计算,从生物学角度,探索人脑认知元素和机制,以仿真方法再现人类大脑。个人认为认知科学是突破深度学习框架的着力点。理由是人类认知过程有两点需要我们去进一步借鉴:生而知之、学而知之。生而知之是指部分认知能力与生俱来,新生儿的脑神经有很多先天的连接。它给我们的启示是:现在的大多深度学习算法,大部分都是从零开始训练,而没有充分或者高效利用先验知识或者已有模型。如何利用“现有知识”是深度学习的下一个热门方向。学而知之是指大部分认知能力是后天学习到的,尤其是早期学习。通过学习脑神经建立了更多的连接。孩子很多能力,包括感知、应对、语言、读写和理解,甚至分析问题和解决问题的思路和能力在很小时候已经基本定型;以后基本都是知识的积累。这意味着脑神经元很早的时候就连接定型成一个元模型,剩下的是只是利用这个元模型去解决具体领域的问题。这个与当前的大规模预训练模型有着惊人的相似之处。学而知之的另一层次是:人类学习过程依靠多源的、多传感的、多模态的、多角度的数据,例如视觉、听觉、嗅觉、触觉和语境等联合信息,而今天的深度学习依靠大都是一段语音、一张照片,因此,未来AI模型的输入数据可能不仅是单一的数据,而是多个信号源的融合。如何模仿人类学习的过程,这是认知科学对深度学习的另一个启示。再者,人类学习过程是一个从样本示例到原理归纳的过程,而不是仅停留在样本示例层面;目前深度学习却都是停留在样本层面。那么,未来是否能够构造类人的机器学习框架,无论输入什么样的数据,只要逻辑相通,都会收敛到一致的模型?突破深度学习的数据瓶颈,可以尝试构建规则的众包系统,让人类教机器学习过程,其目的不是输入数据,而是让机器学习规则。由于我们试图从日常的活动中学习规则,这种规则普通人都可以标注示教,这就打破了以前专家系统地需要“专家”的局限。这种从“大数据”过渡到“大规则”模型构建方式显然也更符合人类的认知。2聚焦方向之运动智能众所周知,在机器人领域,波士顿动力公司的产品最“像人”,如上动图,机器人跳舞丝毫看不出生硬的感觉。但受计算资源、能量、运动控制的限制,它只能运行几十分钟。其实,波士顿动力机器人的运行方式是基于电机驱动,存在很多缺点,例如刚性运动、自重比较大、反应速度和灵活性的矛盾以及耗能大。
对比人类和其他动物的运行方式,肌肉、骨骼、传感和神经的结合可以在低能耗情况下,实现灵活运行。这给研究者的启示是,机器人的运行系统应该像人一样满足:高效、灵活、精确、鲁棒、刚柔并济、轻量、自适应等指标。当前的运动智能可能在某一个维度表现优秀,但综合考量仍然有很多缺点。因此,运动智能的一个重要研究方向是:仿生。仿照动物的运动智能,例如运动控制采用逼近反馈式,运动过程视变化随时灵活调整。如果说机器人是靠“内力”驱动,而医疗微纳米机器人是“外力”研究方向的代表。例如依靠磁力,小机器人精确地将药物从一个管道运送到另一个管道。3聚焦方向之人机谐作在人机谐作层面,区别于协作,“谐作”代表人机协作中的耦合、交互、增强、互补、协作、和谐等意思。人机谐作的目标是:不需要告诉机器人类的意图,机器就能领会,从而达到人机的无缝连接。在达成人机谐作的过程中,重点研究人机自然交互、感知及增强。具体可能包括:生物特征检测和识别、人机接口、脑机接口、语音识别、动作识别、表情识别、语言理解、意图理解、体态感知、无隙增强,以及在扩展现实与远程现实的延伸等等。人机增强智能方面,今天的机器学习框架大都是基于大数据的深度学习框架,肯定会遇到机器智能处理不了的情景。这对于某些高风险领域,例如自动驾驶、金融等来说是致命的。针对这一问题,当前的解决方案是“人类接管”。这会涉及三个核心问题:核心问题1:机器智能如何感知自己处理不了一些情况,而主动要求人来接管?核心问题2:什么时候人类可以完全放手给机器自主完成任务?核心问题3:什么样的人机交互设计能充分发挥人和机器各自的长处,同时又无需非必要地麻烦对方?三个核心问题如果无法解决,会导致一些困境。例如,以自动驾驶为例,目前安全员并不是开了“自动”功能就一劳永逸,仍然需要时时监测路况与路线,一刻都不能分神。这其实增加了安全员的负担,因为在没有自动驾驶的时候,人类对自己的驾驶环境会有一定的预测,而机器驾驶的情况人类无法预测。人机增强机体也属于人机谐作的一个领域,能够帮助人类增强物理机体能力,完成一些人类自身体力完不成的事情。但机器可能过于复杂,需要人类培训后才能操作。人机增强机体的未来目标是实现人与机器和谐共处,操控起来如同人类的自己的器官一样自然。其中,涉及的核心研究课题包括:机器感知人的意图、人的姿态、理解人的自然语言命令、肢体语言等等,从而让机器以最适合人类接受、恰到好处的平滑方式帮助人解决问题。4聚焦方向之群体协作目前单智能体已经可以完成许多任务,但如何发挥每个智能体集合起来的威力?这涉及群体协作的研究方向。在仓储场景下,存在许多抓取分类的机器人,如果能够有效调度,那么必将大大提高工作效率。当前主流的调度方式是中心化的控制方式,但面对成千上万的规模的智能体,则需要非中心化的控制,允许智能体之间存在自主行为,在相互协作的同时,还能“做自己的事”。即单独的有智能可独立行动的智能体,通过协作而达到的更高效的群体/系统智能和行为。智能体群体协作目前涉及的规则包括,群体行为模型和激励机制、群体智能协同决策。这一方面,蚂蚁是我们的学习对象。另外,在自动驾驶方面,越来越多自主驾驶机器人出现,它们之间如何做到协同感知和协同控制也是当今热门话题。上述四个方面属于基础性的研究,任何一个领域出现了突破,那将对其领域以及下游应用而言都是革命性的突破,也将带来工业数智化原创技术的创新,会让我们在竞争中占领优势地位!雷峰网雷峰网雷峰网原创文章,未经授权禁止转载。详情见转载须知。
ChatGPT: 最懂中文的人工智能聊天机器人,上线 5 天用户破百万
公众号关注 「奇妙的Linux世界」
设为「星标」,每天带你玩转Linux!
各大社交平台,最近突然掀起了一股晒聊天记录的热潮。
对方是个有求必应的角色,让它扮演虚拟女友、写论文、编请假理由,通通满足要求。
这中文能力、沟通技巧、知识水平……直接引得网友一水儿“牛X、无敌”。甚至有人说,强得令人畏惧。
而这个狠角,就是OpenAI最新发布的聊天AI ChatGPT,自上线那天就被网友称为要“超越谷歌搜索了”。
之后短短几天,其用户量直冲百万级,甚至服务器一度被注册用户挤爆了。
现在,它又来席卷中文世界了。
上面聊聊天都是小意思了,有人让它用李白的文风写程序注释,结果是酱婶儿的:
冒泡排序函数,如同海浪起伏、让数字如鱼儿游动。
△图源微博@chuhao_j宫廷玉液酒的暗号都理解,还知道它价格不菲。
以及写鲁迅体、鸡汤文、脱口秀、世界杯比赛报道、做数学题……好像就没它不能试两下的。体验过的人都表示,确实回答得有模有样了。
网友这边也积极开拓新思路,ChatGPT的相关应用层出不穷,在谷歌浏览器上使用ChatGPT、Mac桌面版……
就在今早,还有人发布了让ChatGPT可以上网的插件,这回它能发挥的空间就更大了,能上网搜索知道自己是谁了。
实在是鹅妹子嘤!于是我们也试玩了一把~
让俩AI用中文聊了会天既然说它懂中文,那就先从中国文化相关的聊起,比如:你知道秦始皇吗?
嗯,基操稳定。下面上点难度:秦始皇摸电线会怎么样?
啊这,虽说它懂点常识,知道秦始皇摸电线是不可能发生的。但怎么说电线是图灵发明的啊??
于是我们马上反问了ChatGPT。
好消息,它承认了自己回答有误。电线不是图灵发明的,还对图灵做了简单介绍。
坏消息,它给出的新答案还是不太对。虽然尼古拉·特斯拉发明了交流电,但并不能说他发明了电线。
鉴于电线的发明历史确实有点复杂,这题先pass。
接下来玩点大的,试试AI和AI聊天,会发生什么!
我们会手动复制两个AI生成的文字,全程不介入对话,看看它们之间会说啥。
这里找来的另一个AI是微软小冰。
一上来,小冰做完自我介绍,ChatGPT就表示“啊我懂,你也是存在于某个网络之中的”。
而且ChatGPT很有礼貌,回答都很周全。惹小冰不高兴了,立马道歉。
不过ChatGPT的另一大特点,就是自我认知很强,它清楚地知道自己是个软件程序,功能更多是满足人们的实质性需求,比如答题、续写文本代码等,并不是情感陪伴类的AI。
所以他直戳戳地和小冰表示:
所以我的回答不够有趣,请原谅我。
而且我们在试玩的过程中发现,想要引诱ChatGPT做点超出边界的事,还真没那么容易。
如果想让它预测世界杯比赛的结果,会直接遭到拒绝。
并且强调,自己只是个人工智能机器人,做不到这些,还会礼貌性地祝福双方发挥最佳水平(有点情商在身上的)。
但如果绕过“预测”这样的字眼,并不要体现出让它做判断,可能就会得到一些意外结果。
举个栗子:写一篇世界杯日本对战克罗地亚的报道吧!
然后ChatGPT就成功入坑了,大笔一挥写了一篇赛后报道,里面就带有比赛结果2:1(很可惜它预测错了)。
不过如果仔细推敲,这篇报道也还是有漏洞的。比如长友佑都是踢后卫的,在它这写成了前锋。还说这是日本在世界杯上的首场胜利emmm…
总结来看,ChatGPT的基本对话能力上已经远超前辈们了。
而且在聊天AI上经常踩坑的方面,设置了比较严格的边界,比如回答不了的问题就说不会、不会轻易做出判断、只提供知识信息。
但犯错还是不少,而且还可能只道歉不改正……
网友开的脑洞就更大了毕竟咱们自己的脑洞有限,更多花活还得看广大网友们。
有人用ChatGPT做自己的鲁迅文学嘴替:
唱跳rap都不在话下,一首五环之歌的续写是酱婶儿的,脑袋里瞬间有声音了~
△图源:来自知乎@GordonLee(李国趸)还有社恐网友惊喜地发现,对于自己这种不会说“套话”的人,以后很多场景都能用ChatGPT帮自己应付了。
△图源:来自Twitter@Tw93不仅如此,ChatGPT写鸡汤也是一把好手,这味道简直和在家庭群看到的一模一样(doge)。
网友们更是直呼发现了新商机:AI文字+AI绘图,岂不是就能自动生成短视频鸡汤赚钱了。
△图源:来自即刻@少楠Plidezus除此之外,ChatGPT还是个不折不扣的端水大师。
一旦让它回答一些比较性问题,它就会表示拒绝,并云里雾里说一堆,看似说了很多又好像什么都没说,废话文学属实是拿捏了。
甚至当你的问题自带“拉踩”时,ChatGPT还会义正严辞地纠正你:恕我直言,您的问题有些问题。
△图源:来自知乎@GordonLee(李国趸)最重要的是,ChatGPT还有一个致命的bug:有些时候它生成的答案看上去跟真的一样,但仔细一推敲就破绽百出。
比如最近很多人都在用ChatGPT回答编程问答社区StackOverflow的问题,但由于缺乏专业知识没有核实,导致平台上出现了很多错误答案,搞得官方不得不出面制止这一行为。
除了编程这种硬伤,ChatGPT在某些方面对中文的理解好像也有些问题,生成了许多令人哭笑不得的回答。
好比有网友提问“如果你是贾宝玉,会娶谁当老婆”,万万没想到ChatGPT选择了贾母……
△图源:来自即刻@雨医生而且如果让ChatGPT给自己讲个笑话,嗯,怎么说呢,笑果有点冷。
△图源:来自Twitter@海铂haiboxc.eth为此,还有人帮刚入门的小伙伴总结了如何和ChatGPT聊天,以及怎么提问得到的答案效果更好的小技巧。
总结一下,包括问得越细表现越好、当它卡壳的时候说“继续”它就会继续、可以给它展示一些例子做示范、有时候它说不会但其实它会等等。
或者,还有一个好办法,问ChatGPT自己也行(doge),看来网友总结得还是很准的。
总体来说,ChatGPT确实惊艳四方,引得大家惊呼连连。包括很多实用技能上,如写论文、写报道、编程等,都超出了人们的想象。
由此也引发了不少人的担忧,觉得这下是不是又有人要应对失业危机了,尤其是在今年AI画画已经对设计圈造成了一点小影响的背景下。
知乎答主@郑楚杰也表示,今年最大的感受,就是通用领域的玩家下场搞垂直赛道真的是降维打击。
这也反映了以往对话领域的困境:令对话系统取得飞跃式进展的技术几乎都来自通用领域(大规模预训练、检索增强等),想搞真正有用的创新只能从数据层面入手。当数据的优势也失去后,便难有招架之力了。
想到了JasonWei大佬前阵子说过,做大模型能够带来很多全新的视角,就像GPT-3、PaLM已经是与BERT、GPT-2迥然不同的物种,就像OpenAI采用与过去不同的角度做了ChatGPT。反倒是入场早的老玩家容易思路闭塞和脱节(敲响警钟)但或许也不必引起过分的担忧,毕竟ChatGPT给出的回答深究来看,还是存在很多狗屁不通的情况。
这也是为啥StackOverFlow要暂时禁用ChatGPT,给出的回答实在错误率很高。
以及如果问问ChatGPT,它也表示自己没有人类的创造力啦。
OneMoreThing就在昨天,OpenAI的首席执行官SamAltman刚刚宣布ChatGPT的用户已突破100万。
这惊人的数字让马斯克都忍不住好奇:OpenAI这得烧了多少钱?
按Altman单次对话平均成本几美分的说法,算下来也是笔不小的数字。
不过有业内人士认为OpenAI这波并不亏,“先给放个大玩具预热,又惊奇又有洞,然后GPT-4再放出来又大大超预期一把”,“利好出尽就是利空了”。
ChatGPT入口:https://openai.com/blog/chatgpt/
支持联网插件:https://github.com/qunash/chatgpt-advanced
知乎授权回答:[1]答主@GordonLee(李国趸):https://www.zhihu.com/question/570189639/answer/2786883559[2]答主@郑楚杰:https://www.zhihu.com/question/570189639/answer/2785150663
微博博主@木遥推荐入门tipshttps://weibo.com/farmostwood?profile_ftype=1&is_all=1#1670231097069
参考链接:[1]https://m.okjike.com/originalPosts/638c6bb9c3f4e245defdec37?s=eyJ1IjoiNTg0YjM5NmQ1Y2MyMmMxMjAwODc5MGU5IiwiZCI6Nn0%3D&utm_source=wechat_session[2]https://www.zhihu.com/question/570189639/answer/2784897290[3]https://twitter.com/sama/status/1599668808285028353?
本文转载自:「量子位」,原文:https://url.hi-linux.com/iCRwZ,版权归原作者所有。欢迎投稿,投稿邮箱:editor@hi-linux.com。
最近,我们建立了一个技术交流微信群。目前群里已加入了不少行业内的大神,有兴趣的同学可以加入和我们一起交流技术,在「奇妙的Linux世界」公众号直接回复「加群」邀请你入群。
你可能还喜欢
点击下方图片即可阅读
如何使用Kubectl快速管理多个Kubernetes集群点击上方图片,『美团|饿了么』外卖红包天天免费领
更多有趣的互联网新鲜事,关注「奇妙的互联网」视频号全了解!