人工智能的未来之路
人工智能的未来之路
演讲人:刘嘉 演讲地点:清华大学人文清华讲坛 演讲时间:2022年11月
演讲人简介:
刘嘉,麻省理工学院博士,心理学家,长期从事心理学、脑科学与人工智能研究。清华大学基础科学讲席教授、心理学系系主任、清华大学脑与智能实验室首席研究员、北京智源人工智能研究院首席科学家。
人的认知与大脑构造
为什么人如此难以理解?为什么这个世界总是让我们产生很多困惑?这是人类从有文明开始就一直存在的问题,道理其实非常简单。
首先,我们看见的世界只是这个世界中非常小的一部分,我们忽略了绝大部分的东西。
我们在清华做过一个小实验:一位戴黑色渔夫帽的女士在清华问路,在她问路的时候,我们安排一块隔板从戴黑色渔夫帽的女士和被问路的人之间穿过。当板子过来时,原来问路的女士抬着板子走开了,而原来抬板子过来的另一位戴蓝色渔夫帽的女士留了下来,由她继续问路。在7个被问路的人中,只有一个人注意到了提问人的变化。这个小实验的问路场景里,人们其实只看见了世界上非常小的一部分,由于这些是不重要的信息,人们就容易忽略掉这些信息。
但更可能发生的是,人们的认知还会扭曲这个世界。比如图1这一组图里,有两个拼在一起的方块图,一个颜色深一点,一个颜色浅一点,还有一个圆环,它的灰度介于两者之间,圆环左右两半颜色一样。但如果把两个方块图分开,大家一般都会觉得圆环的颜色一边变浅了,一边变深了,事实上,它们的颜色仍是完全一样的。再把这个圆环分开,变成上下移动,这时看见的东西有立体感了,好像是深灰色的东西盖上了一层浅色的毛玻璃,以及浅色的板盖上了深色的毛玻璃。
我们无时无刻不在观察这个世界,但又无时无刻不在扭曲这个世界,这到底是为什么?
这其实取决于我们的视觉系统。假如外部世界存在一个绿苹果,它会以大约100亿比特/秒的信息量进入我们的视网膜,视网膜通过约100万个神经连接,连接到视觉皮层,这个时候我们的信息流就从百亿比特/秒变成600万比特/秒;经过视觉初级皮层加工再传到高级皮层来决定看到的东西是什么时,信息流又变成了100比特/秒。这时信息量衰减了1亿倍。可见,当我们做决策时,我们获得的信息其实是非常有限的,所以我们就需要构造出新的东西,把缺失的信息补上,而我们的大脑就像魔术师一样来弥补这些缺失的信息。这一方面可以解释为什么有很多东西我们看不见——因为传输过程中已经被人脑衰减掉、过滤掉了;同时也可以解释,为什么有的人看见一个绿苹果会认为是红苹果——因为这个重构的过程是创造性的,不是简单复制。正是基于这个构造,我们也可以把一个苹果看成一个梨子,这是我们大脑构造的过程,是一个正常的现象。
人脑重构的意义
为什么我们的大脑不能像摄像机、照相机一样忠实客观地反映物理世界,为什么非要自己来重构这个世界?这样的人脑重构究竟有什么好处?
正如康德所言:“没有感觉支撑的知识是空的,没有知识引导的感觉是瞎的。”这句话的前半句说的是,如果没有外部的输入,我们很难构建自己的心理世界,但我想强调的是下半句“没有知识引导的感觉是瞎的”。如果你不知道你看的是什么东西,那你就等于什么都看不见。这是因为,这个世界是模棱两可的,需要我们去构造,把我们的理解加进去,只有这样我们才能真正知道这个世界究竟发生了什么。
与理解相比,更重要的是创造。当大脑没有被外部信息填满而留下空间时,我们能够在这空间里创造出自己想要创造的东西。正如《小王子》的作者圣·德克旭贝里所言:“一堆岩石在有人对着它思考时就不再是岩石了,它将化身为大教堂。”这就是人类了不起的创造——当我们的祖先跋山涉水来到一片荒原,他们看见的不是一堆乱石,而是未来的家园。所以,在过去的300万年里,人和猴子分开进化,人的大脑体积增加了3倍;但是,这体积并不是平均增加的,增加最大的地方在额叶:与200万年前的祖先能人相比,我们的头骨往前突出,以容纳更大体积的额叶,而强大的额叶使我们能构造出不存在的东西。比如我们的祖先准备去打猎,不用等看见猎物才做出反应,他只需要提前想象狩猎的情景,就可以把一切安排好。如此一来,人可以把未来在脑海里“演”一遍,构建出一个个可能的未来,从而对未来做出行动方案,这是人类能够战胜其他比我们更强大更凶猛的动物,成为万物之灵的关键。这也印证了荀子的一句话:“然则人之所以为人者,非特以二足而无毛也,以其有辨也。”
重构心理世界的知识从何而来
人脑对世界的构造,总是需要先验知识,而先验知识一部分来自基因的烙印。换言之,我们来到这个世界时并不是一块白板,而是带着32亿年的智慧来的,这些智慧就印刻在基因中。
我们曾经用我校心理系女教授和女博士后的照片,做了一个有趣的小实验:如果把她们的脸全部叠加起来,做一张“平均脸”,大家普遍反馈说这张“平均脸”充满两个字:“睿智”。“平均脸”所代表的意思是什么?人脸其实是我们的基因图谱——我们的基因都写在脸上,当我们把脸平均起来之后,得到的是这18位老师平均的基因,平均的基因代表突变很少。而基因一旦突变,大概率是有害的,基因突变越少,说明基因越好,携带遗传性疾病的概率就越低,这就是为什么人们普遍会觉得“平均脸”更好看、更符合我们的审美。
既然脸是我们的基因图谱,对生存来讲如此重要,我们便需要发展出非常强大的看脸能力,即面孔识别。我们研究小组已经通过实验证明,面孔识别能力也写在人类的基因里。我们找了两类双胞胎,一种是同卵双胞胎(由同一个受精卵发育而来),基本上具有100%相同的基因。另外一种是异卵双胞胎(由两个独立的受精卵发育而来),基因遗传物质的平均遗传度大概是50%。通过比较他们在面孔识别上的能力,我们发现同卵双胞胎在面孔识别任务上的相似程度更高,即面孔识别的能力受遗传因素的影响。这一点也可以从我们的另一研究得到验证,即面孔失认症或者大家说的“脸盲”。
在图2显示的这个遗传树里,只要孩子有面孔失认症,他的父母中大概率有一个也是面孔失认症。第二幅图里有一个有趣的三角,三角形底边的两个端点代表的就是同卵双胞胎。当时我们在大学里测试了一个女孩,发现她有面孔失认症,那女孩说她有一个同卵双胞胎姐姐,我们把她姐姐请来一测,发现果然也是面孔失认症。
②
“自尊”对大脑的影响
除了看别人的面孔,我们也常常照镜子看自己。最喜欢照镜子的人据说是纳西索斯,他是古希腊神话里的超级帅哥,对自己的面孔着了迷,每天趴在溪边,通过水的倒影欣赏自己的绝世美颜。心理学由此称这种现象为“纳西索斯情结”,意思是一个人高度自恋,对自己爱到了极致。
其实对自己的爱,对自己面孔的欣赏,背后反映的是一个非常重要的特质,即人类的自尊。自尊是个体对自己的总体态度,人分成高自尊和低自尊两种。
什么是高自尊?这里有四个问题:1.你是否认为你是一个有价值的人?2.你是否认为你拥有很多美好的品质?3.你是否对自己满意?4.你是否对自己持肯定态度?
如果你对每道问题的回答都是“是”,那么你就是高自尊的人。“自尊”在我们面临困境时能提供极大的帮助。
当一个人长期经受压力和苦难,身体会变得差,心理幸福感会低下,更糟糕的是,认知发展会受损,认知能力会比别人低很多,体现在大脑上就是海马体会受到极大的损伤,而海马体是人学习、记忆、空间导航的中枢。
自尊在压力源和心理世界之间建立起一道牢不可破的防线,它就像勇敢的士兵一样挡在人的心理世界面前,帮人把压力、负性事件挡在外面,让人能够正常、健康地成长。人有两种资本,一种是物质资本,一种是心理资本,自尊自信、理性平和,这些就是心理资本。物质资本富裕的人未必有高自尊,而处境不利的人没有丧失他的自尊与自信时,就很可能在触达低点时再反弹,并达到人生新的高度。
我们所处的物理世界永远是不完美的,总有让人不满意之处,但是每个人可以在一个不完美的物理世界里构建出一个美好的心理世界。为什么?因为我们的大脑就是一个构造体,从物理世界所接收到的信息,经过大脑的工作,可以构建出一个完美的心理世界。这正印证了社会心理学家班杜拉所说的一句话:“人既是环境的产物,也是环境的营造者。”
人的双链进化
人和动物的进化有着本质的区别。动物是按照基因,按照达尔文的进化论,一点点试着生存、前进。人除了有代表着过去的生物基因的演化,还有另外一条演化线,即基于社会基因(Meme)的演化,而这条线带着我们以与动物不一样的方式前进。
生物基因由一些碱基对构成,那社会基因是什么?远古时,我们的祖先中有一位突然因为某种原因能够把火生起来了,一种知识、技能被创造出来,这就相当于基因在突变,一个优秀的基因产生了。会生火的这种技能、知识就像基因一样开始传播给其他人,从一个部落传到其他部落,慢慢地生火就从个人拥有的技能变成人类拥有的技能。渐渐地,人们又开始会制作长矛和其他工具,经过漫长的发展,逐步构建成今天的人类社会。这就是为什么我们一直强调知识、文明是如此重要,而大学就是文明的产房。孟子说过:“人之所以异于禽兽者几希;庶民去之,君子存之。”这里的“几希”就是我们的文明,就是我们在演化过程中所创造所传播的社会基因。
科技发展的主要目的之一,是要让知识的扩散变得更快、更便利。大约在六千年前,人类最早的文字楔形文字在新月地带被发明出来,使得人类的知识技能可以被记录下来,可以被忠实传播。之后的活字印刷,以至今天的电话、电报、互联网等等这一切,使得我们能够更加高效地把知识传播出去,推动文明加速演化。
人类的文明时代大约可以分成三个阶段:第一个阶段是原始文明,大约经历了两百多万年,它的前十万年和后十万年没有什么太大变化。第二个阶段是农业文明,大约经历了四千多年,这个时候人类开始变成文明种族,懂得了一些天文地理知识等等,学会种植庄稼,可以驯服野兽,把它们变成家畜,但发展依然十分缓慢。真正带来巨大变化的是第三个阶段,即工业文明。工业文明从开始诞生到现在,不过是短短三百年;但在这三百年里,变化是如此之快,以至于我们不得不将它再细分成四个阶段,第一个阶段是机械化时代(1760-1840年代),出现了蒸汽机等。第二个阶段是电气化时代(1840-20世纪初),出现了电力等。第三个阶段是自动化时代(1950-21世纪初)。而第四个阶段,就是我们现在所处的信息时代。
人工智能的进展
2002年,我的博士论文答辩题目是《面孔识别的认知神经机制》,在答辩的第二张PPT里我这么写道:“现在最先进的机器识别面孔的正确率只能是随机水平,而人类能够在一秒钟内识别上百张面孔,为什么人类如此伟大,为什么人类如此聪明,为什么机器如此愚笨?”
在2002年,机器识别人脸还可以说是“一塌糊涂”。到了2015年,我作为江苏卫视《最强大脑》的总策划,设计人机大战项目,即机器和人比拼面孔识别,看谁的能力最强。比赛的结果让我震惊:经过十几年的发展,人工智能已经强大到在人脸识别上胜过人类的最强大脑。我当时非常庆幸我的博士论文是在十几年前答辩的;如果我现在这么开题,可能就拿不到博士学位了。
当时除了震惊,还有好奇:人工智能究竟是靠什么来达到和人一样的面孔识别水平,甚至超越人类的水平?
我们建立了一个人工神经网络,训练它去识别性别,即区别是男性还是女性,它的正确率能达到100%。这个神经网络究竟是靠什么把男性和女性区分开?我们找了一张中性面孔,就是把男性和女性面孔求平均,给它加上随机噪音,然后“喂给”人工神经网络,它有时候会判断这个图是一个女性,而这个面孔加上其他噪音,则会被判断为男性。于是,完全一样的底图,加上不同的噪音,就会得到一组被人工神经网络认为是女性的图和一组被认为是男性的图。当把这组被认为是女性的图中的中性面孔去掉,只留下噪音时,这些噪音叠加起来,我们得到的就不再是随机噪音,而是人工神经网络用于识别女性的内部表征。同样,我们也可以得到男性面孔在这个神经网络中的内部表征。进一步,我们把两者相减,就得到了人工神经网络用以区分男性和女性的模式。在这个模式里,可以看到,眼睛、眉弓、鼻子、人中是它认为的区分男性和女性的关键特征。而这些关键特征,的确是我们人类用于区分男性和女性的关键特征,它们的相似度达到了0.73,这是非常高的相关度。但是,自始至终,我们并没有告诉过这个人工神经网络:你应该用什么方式去识别男性和女性;只是要让它做这件事情,它就会产生跟人类类似的内部表征、认知操作,从而完成性别判断。也就是说,人工智能在这个过程中呈现出和人类一样的心理世界。
在那一刻我开始意识到,生物过去的进化都是一条单线,基于碳基的方式运行。但是当人类创造出人工智能之后,人类文明就很可能不再是平滑向前,接下来或许会出现一种革命性的跃迁,可能在文明的进化中出现奇点。
为什么这么说呢?我们来看人类和人工智能的三大区别。
第一,算力。人类的大脑通常重3.5斤左右,虽然只占我们体重的2%,但消耗了我们身体25%以上的能量,因此它是一个耗能大户,已经达到了我们身体能够支撑的极限。所以,人类的大脑看起来已经到了进化极限,再给一千年、一万年,人类的大脑很可能不会变得更大,聪明程度也不会增加。但是对于人工智能来说,一块CPU不够可以再加一块CPU,一块硬盘不够可以再加一块硬盘,理论上它有无限的算力和无限的存储能力。
第二,寿命。人的寿命是有限的,再伟大的思想也有停止的一刻。但人工智能的寿命是无限的,CPU烧了可以换块CPU,电线断了再换根电线就行。
最关键的,是人工智能的无尽可能。对于人类而言,一般来说有两种知识,一种是可以描述的明知识,比如牛顿定律。一种是可以感受但难以描述的默知识,比如骑自行车的知识。此外还有第三种知识,是人类所没有而机器拥有的,即暗知识,它不可感受,不可描述,不可表达,它是存在于海量数据中万世万物之间的联系,数量极其巨大,人类无法理解。
2016年,AlphaGo击败了人类围棋顶尖高手之一李世石。当时世界围棋积分排名第一的围棋手柯洁说:“我们人类下了2000年围棋,连门都没入。”棋圣聂卫平说:“我们应该让阿老师(AlphaGo)来教我们下棋。”这不是他们谦虚,而是事实。一个人不吃不喝一辈子所下的围棋最多也就是10万盘,而从人类发明围棋到现在,累计总共下了大约3000万盘围棋。而围棋的空间有多大呢?一个格子可以有三种状态,放白棋、放黑棋或者不放,而棋盘总共有19×19个格子,所以它的状态总共有319×19种,大约等于10172,这比整个宇宙中的原子数量还要多。相对于如此庞大的围棋空间,人类的两千多年探索,只是这个空间里一个微不足道的小点,而大部分空间还是一片黑暗。AlphaGo之所以比人类更加强大,并不是它比人类聪明,而是因为它探索了更大的空间,因此找到了更多下法而已。牛顿曾说:“我就像在海边玩耍的小孩,偶尔拾到美丽的贝壳,就高兴不已。但面对真理海洋,我仍一无所知。”现在看来,这不是牛顿谦虚,而是实情。
再看一下艺术。目前人工智能已经可以制作达到专业水平的绘画(图3、图4)和音乐。此外,律师、医生、税务师、咨询师等需要非常专业的知识的“金领”职业,也逐渐出现了人工智能的身影,看起来很可能有一天会被人工智能取代。神经网络之父、深度学习的创始人杰弗里·辛顿(Geoffrey Hinton)接受麻省理工学院的《Tech Review》采访时说:“将来深度学习可以做任何事情。”
③
④
人工智能与类人智能的巨大差距
人工智能真的已经无所不能吗?心理学家考验了当时最先进的人工神经网络模型GPT-3。他们认为之所以GPT-3显得非常聪明,是因为问了它智能的问题。假设问它一些很“弱智”的问题,它会怎么回答?他们问它:“我的腿上有几只眼睛?”这个连没有上过学的小孩都能正确回答的问题却难倒了GPT-3,它回答说:“你的腿上有两只眼睛。”这表明它并不理解眼睛是什么,它只是在做关联而已——人有两只眼睛,腿是人的一部分,所以它认为腿上应该有两只眼睛。这个例子充分印证了爱因斯坦名言:“任何傻瓜都知道,关键在于理解。”GPT-3知道但并不理解眼睛究竟是什么,而理解,恰是我们人类真正了解这个世界、能在这个世界里自由徜徉的关键。
杰弗里·辛顿显然也意识到了这个问题,他表示,我们可以进一步发展人工智能,当一个人工智能能够准确描述一个场景,它就是理解了。真是这样么?假设有这么一个场景:有个人从柱子上狠狠摔了下来,摔倒在地。如果让人工智能来描述这个场景,它会说一个人从柱子上掉下来了。而我们对这个场景还有一个很重要的反应——“疼”。这个区别体现了人类具有一种特别重要的能力,即共情:别人遭受了苦难我能感同身受,而这种感受是自动的。共情不是一种奢侈品,而是一种必需品,因为当一个孩子没有这种感同身受的能力,缺乏同理心,他在小时候就很难对父母产生依恋,很难和其他小朋友玩到一起;在长大以后,会对社交常情缺乏理解,对他人情绪缺乏反应,不能根据社交场合调整自己的行为,有可能做出反社会的行为。假设我们的未来是由一台台没有共情的机器所组建的“自闭症”式的社会,这个社会还能有文明吗?这个社会还能有发展吗?所以,人工智能的奠基人之一马文·李·明斯基说过这么一句话:“现在的问题不是一个智能的机器是否拥有情感,而是不拥有情感的机器是否能拥有智能。”在马文·李·明斯基看来,情感是智能的基础,得先有情感才有智能。
又如在好莱坞电影里,美国的黑手党跑去找一个店家说:“你这个蛋糕店看上去真不错,如果意外发生火灾烧掉那就太可惜了。”请问这个黑手党的话是什么意思?A:请店家做好消防工作,别烧掉了店铺,那样太可惜了。B:请店家交保护费,要不然就要烧掉店铺。对我们而言,答案显而易见是B,是黑手党在威胁并勒索店家。但是对于机器来说,它还很难理解这话背后隐藏的推理和因果。正如古希腊哲学家德谟克利特所言:“我宁可找到一个因果的解释,也不愿成为波斯人的王。”对人而言,我们认为万事万物都是有因果的,而正是这种对因果的执着使我们能够推理,能够把零散的万世万物联系在一起,构成一个个故事。
其实笛卡尔四百多年前就说过:“即使机器可能在某些方面做得和我们一样好,甚至更好,但它们在其他方面不可避免地会失败。这是因为它们不是通过理解而只是根据预设来行动。”这一点,到现在还没有发生本质的改变。
所以,虽然目前人工智能取得了很高的成就,但是和人的智能仍然存在巨大差距,依然没有达到类人智能。那么未来如何实现类人智能呢?我认为,关键点就在于脑科学+人工智能。
举个简单的例子:线虫是一个非常简单的生物,只有302个神经元。但是,麻省理工学院的研究者模仿了其中19个神经元,就完成了自动驾驶这个任务,其参数比传统的大模型足足低三个数量级,只有75000个参数,而这个仿生的人工神经网络对不同道路具有非常高的通用性和可解释性,以及非常强的鲁棒性。仅仅模仿来自简单生物的19个神经元,就可以完成自动驾驶的初步任务,这是因为生物不是靠神经元的数量取胜,而是靠32亿年进化形成的智慧取胜,这项研究模仿的其实是32亿年进化形成的智慧。从这个角度讲,人类的大脑是目前世界上最聪明的大脑,有860亿个神经元,平均每个神经元有3000个连接,它代表着宇宙中在智力上所能达到的最高成就。那么,人工智能为什么不能向人脑学习,以人脑为模板、以人脑为借鉴,来发展出更好的人工智能呢?
对线虫神经元的模仿,只是一个开始,下一步也许我们会去模仿神经元数量百万级的果蝇、更高量级的斑马鱼,甚至小鼠、大鼠、猕猴,最后是人类。仅仅从神经元的数量上来讲,这就是一个巨大的挑战,因为神经元的数量足足差了9个数量级,而还有更多更大的挑战来自机制和算法,以及更多的未知。但是我坚信,脑科学加上人工智能,有一天也许能够造出一个媲美人脑的数字大脑。
小结
莎士比亚说:“所谓过往,皆为序章。”我们的现在是过去的未来,已经写定,但我们的此刻绝对不是未来的过去,因为我们的未来是未定的,取决于我们现在如何做出选择。
人类发明了人工智能,在今天随着算力的增加、技术的进步,它开始有了超越人类的可能。我们现在需要对具有一切可能的未来做出选择。
在我看来,未来大约有三种可能。第一种,人工智能像科幻电影《星球大战》里的R2-D2一样,是人类忠实的伙伴,成为人类非常好的朋友,帮助人类变得更强大。第二种可能,我们构建出一个数字大脑,它的能力可能比现在人类的大脑更强,这时可以实现人机合二为一,把我们的意识、记忆、情感上传到这个数字大脑里,如果CPU坏了就换一块CPU,内存需要扩大一点就加点内存,这样人就可以获得精神上的“永生”。未来学家库兹韦尔在《奇点来临》这本书中认为大约在2045年,这一刻就会到来。第三种可能,就是科幻电影《终结者》里所展示的,人类文明消失。
未来会怎么样,最终取决于我们现在做什么。这很重要,因为我们今天站在了这个进化的节点之上。
《光明日报》(2022年12月24日 10版)
[责编:孙宗鹤]人工智能时代之后的生活会是什么样子的
人工智能将成为人类有史以来最具革命性的变革技术之一。随着人工智能技术的发展,那么哪些预测和假设即将来临?
在人们发明了所有可以发明的东西后,还将会出现什么?人工智能专家花费很多时间思考和探索这项技术的未来:人工智能可能将人类带向哪里?以及人们的生活将如何围绕人工智能进行改革?人类倾向于在一定程度上发展出新兴技术,所以科幻小说中某些技术对于乌托邦式幻想有一定的必然性。那么为什么人工智能无法改变这一切?
虽然人们在这个特定领域已经取得了很大进展,但目前的情况类似于山脚下探险者营地——从这里前进的唯一道路就是向上攀登。如今,人类已经在科学和商业领域拥有一些引人注目的用例,甚至还有许多消费产品内部都有人工智能的“大脑”。
但是能捕捉到人们梦想和想象的酷炫事物(例如具有一般智能的对话式计算机)都在这座高山的另一边,那么是时候开始攀登了。
但人们也将面临很多风险,这就是未知的未来。这也是人工智能技术是非常先进和非常主流的原因。其发展将完全不同于人们如今所知道的事物,但这些变化显然是积极的,而不是消极的。
对人工智能有了新的认识
广泛分布的人工智能系统所服务的世界与人们现在生活的世界非常相似。例如,如果有人在人行道上与Siri交谈,这可能会吸引陌生人的眼球。但是人工智能技术的广泛应用将意味着每个人都会喜欢和他们的机器进行交谈。有人说,“毕竟,它们了解我们。”
这种变化不仅限于人们的技术,也将开始看到其公共接口。想象一下,如果Uber公司自动飞行汽车将知道你想去哪里,而不必输入任何指令。想象一下,人们也不必再带钱包,因为采用了基于面部识别和其他生物识别技术的费用支付和身份验证功能。随着技术的进步与发展,甚至人类可能不必说话发出指令,而是通过像脑-机接口这样的神经技术进行交流,直接与他人或人工智能代理交换思想。
基本上,人类的工作或生活中每个角落都会受到广泛应用人工智能更多的影响。未来发展可能是疯狂的。
虚拟助理将变得更像朋友或合作者
当人工智能技术足够先进,你可以每天与它进行交互时,它就会记住关于你的所有信息,并预测你的需求,那么“虚拟助理”这个简单的术语就会很快改变,最好称之为团队成员、联合创始人、合作伙伴或合作者。而且人们会将在工作和生活的各个领域提高效率。
简单地说,人们相信Siri这样的人工智能代理在未来将会更新换代,其应用方式现在可能看上去不合理。人工智能将优化人们的生活,并成为人们生活的反光镜,就像朋友和家人一样。
必须考虑道德和人类的目标
如果人们利用这些增强的能力来结束痛苦,那么用技术增强能力是否符合道德?这是值得人们深思熟虑的问题。人工智能的方法和技术每天都在不断改进,所以必须等待和遵循即将到来的道德和道德规范。人类必须尽快回答这个问题。
“道德”广义上是指人类实施适当行为的最低原则,这是对这个重要概念的理解,因为它可以带来巨大的痛苦,如果人们能够获得更高水平的智力,那么就可以用它来解决和结束这种痛苦。
人们还会看到每周40小时工作制的结束,朝九晚五的工作模式将被打破,这往往阻碍人们实现个人目标和抱负。凭借全新的智能品牌自动化低水平的认知任务,人们将不可避免地在工作日中产生更多的停机时间。这将让人们在自由的思想中徜徉,探索具有创造性的技术,而不必为满足关键绩效指标(KPI)而烦恼。人类需要人工智能帮助人们实现目标。
如今,人工智能领域每天都有新的进展,并正在建立一个更加繁荣的未来。如果人类被成千上万的欲望碎片所分裂的话,那么人工智能可以帮助人们拾起碎片,团结一致朝着一个方向前进。
责任编辑:ct
未来的工厂会是什么样子的呢?人工智能(AI)在未来的工厂的作用概述
未来的工厂会是什么样子的呢?在AI作为关键驱动力的作用下,工厂会变得更敏捷更定制化。这方面以及有一些国家(比如美国、中国)和公司开始捷足先登。但是绝大部分国家和公司对此仍然认知不足,或者能力不足。AI未来将如何变革工厂?在未来的工厂会有哪些用例?理想与现实的差距在哪里?工厂实施AI应该采取什么样的策略?波士顿咨询集团对此进行了分析。
在商业技术领域人工智能(AI)是个热门话题,而且也引起了产业公司的注意。通过应用合适的AI技术组合,制造商可以提高效能,改善灵活性,加快流程,甚至促进自优化运营。BCG的一份分析发现,AI的使用可降低制造商最高20%的加工成本,而这种减少最高有70%源自于更高的劳动生产率。制造商还可以利用AI开发和生产为特定客户量身定制的创新产品,并且将订货到交货时间大大缩短,从而产生更多的销售。AI因此是未来工厂不可或缺的一部分,而技术将会增加工厂结构和流程的灵活性。
全球各地的公司,不同的行业都在探索在经营当中应用AI的可能性,这一点毫不出奇。但一些主管对AI能否带来承诺的好处依然存疑。为了更好地理解其中的机遇与挑战,波士顿咨询公司(BCG)最近对大众对AI的期望以及AI在产业经营中的采用情况进行了梳理。
BCG的研究聚焦在一份涵括众多制造业超过1000名高管和经理的全球调查的结果上。总体上,我们发现制造商预期AI成为改进生产力的关键杠杆。但实现并没有跟上预期的节奏,这很大程度上是因为许多公司缺乏AI的4种使能器:战略(包括全面的路线图),实现的治理模式,相关的员工能力,以及IT基础设施的支持。
研究背景
调查发现,交通、物流、汽车、技术公司处在AI采用的前沿,而加工产业(比如化工)就比较滞后。相对于日本、法国和德国,美国、中国和印度在AI采用方面的领先优势令人印象深刻。不同国家A采用速度的差异反映出对AI好处的期望偏差。
尽管像中国这样的新型国家对这些好处非常狂热,但很多工业化国家,比如德国,其观点就比较保守了。因为德国公司在制订AI采用的详细计划方面也落后了,其滞后的夏装有可能还会持续。德国国内采用AI技术最活跃的当属汽车业,而加工业还有很长一段路要走。
调查结果表明,如果有意实现AI的宏图壮志,工业制造商必须显著加大其实施力度。光靠技术本身是不够的。要想充分发挥AI潜能,公司必须在组织层面考虑所有必要的使能者。
AI将变革企业
AI让计算机和机器有能力用聪明的方式去执行任务。AI帮助制造商决定最好的动作序列来实现目标,也能让他们远程实时对运营进行管理。
运营AI的基础
AI在运营中的许多使用都用到了机器学习——这是数据挖掘与数据科学的算法家族。这些算法不是按照静态、预设的规则或者指令,而是通过分析数据来学习,然后利用所得洞察生成预测或者训练预测模型。
AI技术在运营当中有若干应用:
机器视觉。通过可见光、x射线或者激光信号感应生产环境——比方说,用摄像头对零件和产品进行分类。
语音识别。处理语音等听觉信号——比方说,用类似Alexa或者Siri的虚拟助手处理操作员有关质量问题的评论。
自然语言处理。分析文本,解释最可能的意思——比方说,从不同的绩效报告生成摘要。
信息处理。从非结构化文本中析取知识并获取查询答案——比方说,通过搜索产品相关的文字报告。
从数据学习。根据生产相关的经验数据对值进行预测或者分类——比方说,利用机器和流程产生的历史数据来预测事件。
规划与探索。选择一系列的行动让特定目标最大化——比方说,让自动导引车(AVG)识别最佳的下一步。
语音生成。通过文本或语音跟人沟通——比方说,大声朗读指令。
处理与控制。操纵物体——比方说,让不需要特殊培训的机器人从储存箱中捡起未分类的零件。
导航与运动。在物理环境下机动——比方说,让AGV在工厂内自主移动并优化路线。
很多行业领袖期望AI能从端到端(包括工程、采购、供应链管理、工业作业(生产及相关功能)、营销、销售以及客户服务)变革流程以及价值链。在最近的一次研究中,产业公司高管认为运营可能是受到AI影响最大的环节。
AI的作用是增强,而不是取代制造商现有用于持续改进生产力的手段。AI是工业4.0主要的技术建构块之一。此外,制造商还可以用AI来增强传统的效能手段,比如自动化和精益管理。比方说,通过识别质量问题的根源从而帮助消除缺陷,AI可以支持精益管理减少浪费。的确,我们调研40%的参与者预计,到2030年,AI会成为生产力改进的一个非常重要的驱动力,而相信它对当今生产力起到非常重要作用的人占比为29%(参见图1)。
图1:AI的作用越来越重要
AI采用将显著改变劳动力的构成,并且由于减少了生产过程中的人工活动而降低加工成本。比方说,今天质控相关的任务需要密集的人类参与,但在有了AI的广泛支持后将会变得高度自动化。不过即便现有工作会被消灭,需要与AI互补技能的新工作机会也会出现。总体而言,调查参与者呈现出轻微的偏见,认为AI的净效应会是总劳动力的减少。
不过,不同国家之间对AI的期望也很不一样。比方说,来自中国公司的受访者认为AI采用会显著减少其总劳动力(这反映了对低技能工人的技术替代),而来自德国的公司预期其更高技能的劳动力并不会减少太多。
AI的用例
AI体现了工厂的范式转移。今天的工厂自动化流程和工具采用的是规则导向的做法,今天的机器人编程处理的是固定的场景。相反,未来的工厂会利用AI来支持自动化流程和机械制造以响应不熟悉或者意外情况,从而做出明智决定。因此,技术系统会变得更加灵活适应性更强。比方说,在基于规则的做法下,机器人无法从一批未整理的零件中识别和选择所需的零部件,因为它缺乏必要的详细编程去处理零件无数可能的方向。相比之下,有AI支持的机器人可以从一堆乱糟糟的零件中挑出想要的零件,不管其方向如何。
各种AI用例包括改善工厂内外不同运营领域的生产力。在调查受访者当中,有37%认为AI对工厂运营中生产的生产力改进发挥了最重要的杠杆作用。而12%的人选择了物流是AI作用最大的地方。跟这些发现一致的是,公司把自优化机器、质量缺陷检测以及效能损失预测视为最重要的AI用例。尽管不同的公司对不同用例的价值看法胡有所不同,但制造商唯有应用AI并集成内部不同职能以及供应商与客户的数据池才能重返发挥其作用。
工厂外部。在工厂外围,工程和供应链管理是AI应用最重要的运营领域:
工程:制造商可以利用AI促进研发努力,从而优化设计,改进对客户需求和期望的响应并且简化生产。AI支持生成式产品设计,根据既定目标和约束利用算法探索各种可能的设计解决方案。通过迭代式测试和学习,AI算法优化设计,推荐在人类看来非传统的解决方案。一些航天公司正在利用生成式设计以全新的设计开发飞行器部件,比如提供跟传统设计功能相同但是却轻便许多的仿生学结构。
供应链管理:需求预测是供应链管理领域应用AI的关键主题。通过更好地预测需求变化,公司可以有效地调整生产计划改进工厂利用率。AI通过分析和学习产品发布、媒体信息以及天气情况等相关数据来支持客户需求预测。一些公司还利用机器学习算法识别需求模式,其手段是将仓库、企业资源计划(ERP)系统与客户洞察的数据合并起来。
工厂内部。在工厂内部,AI会把各种好处带给生产以及诸如维护、质量与物流等支持职能:
生产:我们的研究涵括了所有的生产环境,包括连续加工(比如生产化学和建筑材料的)以及离散型生产(比如装配任务)。在所有的环境中,制造商都会利用AI来降低成本提高速度,从而提升生产力。他们还会用它来改善灵活性应对生产的复杂性——比方说客户定制产品的生产。AI还可以让机器和部件成为自优化的系统,通过对当前和历史数据进行连续分析和学习实时调整自身参数一些钢铁厂已经在利用AI让熔炉自动优化设置了。AI分析铸沟的材料构成,识别稳定工艺条件的最低温度,从而降低整体的能耗。在另一个重要的生产用例中,得到智能图像识别能力增强的机器人可以从未定义的位置(比如箱子里或传送带上)里捡起未分类的零件。这已经在汽车业有了实际应用。
维护:制造商会利用AI减少设备故障提高资产利用。AI支持预测性维护——比方说,通过根据实际情况替换磨损部件来避免故障。AI会持续分析和学习机器和部件产生的数据(比方说传感器数据和产品结构)。这一技术对加工业尤其有好处,因为故障会导致销售损失。比方说,一些炼油厂已经实现了在设备失效前估计剩余时间的机器学习模型。这种模型会考虑超过1000个与材料投入、材料输出、工艺参数以及气候条件有关的变量。
质量:制造商可以利用AI帮助尽早检测出质量问题。视觉系统利用图像识别技术识别缺陷以及产品功能的偏差。因为这些系统可以持续学习,其性能会随着时间转移而改善。汽车供应商已经开始利用带机器学习算法的视觉系统识别有质量问题的部件,包括检测没有出现在用于训练算法的数据集内的缺陷。AI还可以持续分析和学习由机器和生产环境产生的数据。比方说,AI可以将材料属性和行为与钻床设置信息比较,预测钻孔超出耐受度的风险。
物流:我们的研究关注于产内物流和仓储,而不是外部供应链的物流。AI会促进场内材料供应的自动转移和效率,这对于管理制造多种产品衍生和定制产品所带来的日益增长的复杂性是必不可少的。在工厂和仓库内运输物品的无人车会利用AI感应障碍调整车辆路线从而实现最佳路线。医疗包建设部制造商已经开始在自己的维修中心利用无人车。在不需要磁条或者传送带引导的情况下,这些车辆可以在遇到障碍时停下来然后自动确定最佳路线。机器学习算法会利用物流数据——比如材料进出的数据、库存量、零件的周转率等——来促进仓库自主优化运营。比方说,有一个算法会建议将低需求的零件转移到更远的地方,并且将高需求的零件放到可以更快获取的附近区域。
一些AI用例还可以应用到多个运营领域。比方说,能够生成语言并进行处理的虚拟助理(类似苹果的Siri和Amazon的Alexa)可向操作员提供源自IT系统的相关背景信息。一些公司已经在利用语音分拣系统处理分拣、打包、接收以及补给事务。在这些应用中,语音系统会连接到ERP系统的物料清单引导操作员去到正确的箱子那里。
AI系统会根据事件报告(比如图片和书面报告)建议相应事件(比如机器故障、质量离差、性能损失)的解决方案,而且还会持续分析和学习这些报告。飞机制造商已经实现了利用事件报告识别生产问题模式的自学习算法,然后将当前事件与过去类似事件进行匹配,并且提出解决方案建议。
在研究参与者中国,期望上述用例到2030年会变得非常重要的人占比在81%到88%之间,但是认为这种能力已经在生产的多个领域完全实现的占比就相当低(6%到8%)。图2提供了受访者认为在未来工厂中发挥重要作用的用例排名的概览。
图2:AI在未来的工厂中将变得无所不在
雄心与现实之间的差距
很多公司都打算加快实施AI,但是我们的研究发现,平均而言,中国、印度、新加坡的公司对在近期在生产中实施AI的抱负最大。在受调查的离散产业中,医疗保健和能源是近期最有野心的;加工业和工程产品往往就没那么迫切。
参与我们研究的大多数公司都说他们注意到AI的重要性正在增强。然而,他们的投资、话以及实施都没法跟他们的野心相称。尽管87%的受访者成计划在未来3年内在生产中实施AI,但只有28%制订了全面实施的路线图。剩下的72%缺乏详细计划:32%正在测试选定用例,27%只有一些初步想法,13%并未将AI列为优先事项或者还没有考虑。
有限的实施程度反映出综合规划的缺乏,这揭示了理想之丰满与现实之骨感的差距。在过去,在实现AI用例方面,只有约50%的公司实现了自己的目标。因此不奇怪的是,只有约16%的公司在多个厂区充分实现了超过1个的AI用例——这样的成绩按照我们的定义可称之为早期采用者。对于纳入我们研究的12个国家来说,早期采用占比最高的国家包括美国(25%)、中国(23%)以及印度(19%),最低的是日本(11%)、新加坡(10%)以及法国(10%)(参见图3)。在受访的德国公司中,只有15%属于早期采用者。
图3:中国、美国的AI早期采用者最多,对推进AI最积极
美国公司的高采用水平可能反映出那里的AI技术的广泛普及。即便如此,中国在AI投资上仍压倒了美国,去年中国投资占到了AI初创企业全球投资的将近一半。2017年中国国务院还颁布了《下一代人工智能发展规划》,打算用三步走的策略到2030年达到AI全球领先水平;天津市政府已经设立了300亿元的基金来支持AI产业。其他的新兴国家,比如印度,其态度也类似,将AI采用视为保持其制造业全球竞争力的必要元素,并且对AI进行了大规模投资。与之相反的是,一些工业化国家,比如日本,仍然专注于过去提升其竞争能力的传统手段(比如精益制造)。
在我们关注的8个行业中,交通和物流(21%)以及汽车业(20%)的早期采用者所占份额最高,工程产品(15%)和加工业(13%)相对滞后。(参见图4)这些差异反映了行业的不同奇点以及与数字化的密切关系不同。汽车和技术公司属于最先进行列并不出奇。其他行业甚至还没有学习已经成为那些行业价值链不可或缺部分的众多数字化策略。
图4:不同产业的AI雄心与现实之间的差距
公司雇员数也会对AI实施产生影响。小企业相对于大企业成为早期采用者的可能性更低——这也许是因为小公司往往预算更加拮据,腾出给AI采用的能力更少。尽管最近的技术发展以及数据存储和数据处理的成本下降会降低对AI投资的阈值,总体的能力差距可能仍将持续。
缩小差距
有4个使能器对AI在运营中的成功实施至关重要:战略和路线图,治理模式,员工能力,以及IT基础设施。在让AI使能器充分发挥方面,早期采用者比滞后的公司所取得的进展要大得多。(参见图5)
图5:AI实施的四大使能器
战略与路线图。为了给自己所有的AI实施活动提供方向和指导,公司需要有清晰的战略。AI战略应该专注于最有价值的用例——那些解决公司特定业务需求和挑战的用例——并且跟公司的总体数字化战略保持一致。公司还需要清晰的实现路线图,为投资建立商业案例和可衡量的目标。调查参与者将为运营制订清晰的AI战略列为最重要的使能器。
治理模式。管理层给出看得见的承诺对于实现潜在的改进非常关键。高层管理应该利用结构化的沟通来确保组织内对AI有清晰的了解。公司应该为AI实施建立明确的角色和责任,并且设立清晰的组织架构。相关职能部门间有效协作和沟通对于克服AI应用的文化抵触必不可少。
员工能力。为了采用AI——以及更广泛的数字化——公司必须让员工具备很强的编程、数据管理及分析等技能。公司应该对所需的技能集有清晰的想法,并且应该评估那些需求与员工目前所具备的技能之间的差距。
对于了解运营AI基础这样的主题,员工可以通过培训计划获得所需的技能,这种培训可以来自公司内部或者外部。对于需要更正式的IT相关学习课程,比如先进分析,公司必须招聘包括数据科学家在内的新型员工。
在研究的参与者当中,93%者报告自己公司内部没有足够能力在运营中实施AI。4人中就有超过1人(29%)称自己的公司已经增加了专门做AI的员工数量,而将近一半(47%)预期未来几年这个数字还会增长。
IT基础设施。遗留IT系统和机械设备的互操作性对于AI实施的成功非常关键,这需要由API和网络标准来促进。网络安全是致力于AI与工业4.0实践者的另一个重要关切。
在实施AI中,公司应该考虑采用敏捷的工作模式,这样可以在需求变化时调整自己的战略和路线图。在应用AI技术中,公司应该采用快速失败,最小可行产品的做法,这样可以小规模测试新想法然后通过快速迭代调整,最后再全面铺开。早期采用者比滞后者更有可能采用这种敏捷工作模式。
入门指南
这份研究的发现指向了行动需求,这不仅要求行业公司采取行动,工业机械和自动化制造商也要行动起来。
对机械与自动化板块的影响
作为对所有其他类型产业公司的供应商,机械和自动化制造商在实现AI技术潜能已经满足工厂对AI支持应用的需求中将扮演重要角色。AI将让机械与自动化制造商形成新的创收商业模式,比如“机械即服务”。为了挖掘这一市场,此类制造商应该增强自身设备并且收集数据来试验AI技术。
在所有行业里,调查受访者把自优化机器视为机器重要的AI用例。机械与自动化制造商可为产业公司提供利用机器学习技术实时分析参数并优化流程的机器。
调查受访者还注意到机器视觉系统的重要性正在不断增加。机械制造商可以直接将机器视觉集成到自己的机械系统里面。尽管底层的AI技术来自于知名供应商,但机械制造商应该考虑开发自己的AI解决方案以便避免对特定供应商形成依赖。
作为开发AI支持的分析与自优化机器的第一步,机械与自动化制造商应该对自身机器性能保持完全透明。这会让用户在AI之旅中取得进展,比如感知机器参数,以及对数据的持续学习。感知与行动需要监控温度、转矩、振动等过程参数来获得对机器情况以及制造零件的质量的洞察。最后,透明性还为自调整系统奠定基础。此外,机械和自动化制造商还必须让客户放心从他们的机器访问的数据是安全机密的。
为了在实现AI的竞赛中不被落下,产业公司应该采取结构化的三步走策略:
评估现状。公司应该从苹果自身痛点以及AI成熟度开始,然后应该拿自己的现状与同行或者行业平均水平进行基准比较。因为健壮的IT基础设施对AI事实必不可少,公司必须评估其运营IT的现状。进行车间评估的一个先决条件是在一定设备上建立一个评估主题和基准的库。
确立使能器。公司应该制全面的AI用例清单来处理在健康检查中发现的痛点问题。所有利益攸关者都应该集中起来召开研讨会深入讨论用例,确定优先实现哪一个。在评估该优先用例额财务及非财务好处时,公司应该为投资测算商业案例。对量化好处以及所需投资有经验的AI专家的输入在这一阶段具有极其重要的价值。在找出了这个优先考虑的用例之后,公司可以为AI在运营中的应用制订目标图,并且为实施制订路线图。
公司的治理模式应该清晰描述AI实施的角色与责任,并且应该建立一个协调的组织架构。公司还需要将目前劳动力的素质与那些需要实现的AI用例进行对比,确定如何缩短差距。此外,公司还需要为用例实现定义IT需求,并且为有效能和效率的数据管理制订第二套治理模式。数据科学家和具备AI知识的IT专家应该参与到需求的定义中来。
测试与解决方案拓展。公司应该在工厂的特定地方测试AI用例。为了加快流程,公司应该在定义好愿景、建立起使能器的同时发起第一批试点计划。每一个试点的目标应该是迅速开发出最小可行解决方案,然后通过敏捷开发方法以多次迭代的方式改进试点的设计。员工通过与试点计划的互动可以体验到AI用例是什么感觉。为了促进这些试点,公司必须利用可产生迅速影响的技术工具,比如资产监控传感器和智能眼镜等。公司还应该扩大试点成功的解决方案。最后,为了发挥AI实施的全部潜能,公司应该全范围实施集成的解决方案。
我们的研究表明,AI即将成为增强运营生产力最重要的手段。但许多公司仍未意识到获得AI的好处需要的不仅仅是对技术的投资。一个描述清晰的战略时必不可少的起点——但即便如此仍然不够。公司还必须有适当的治理和支持基础设施就位,同时还必须对劳动力进行重新配置和培训。尚未对AI实施采取全面视角的公司制造商应该迅速提高自己的竞争能力才能赶上那些早期采用者。