博舍

人类唯一的出路: 变成人工智能(五) 人类变成人工智能的电影叫什么名字呢

人类唯一的出路: 变成人工智能(五)

本文来自微信公众号:WaitButWhy(ID:wbwtimurban),作者:Tim Urban,翻译:谢熊猫君,头图来源:东方IC

“太长不看”版概要:

1.五万年前的人类与如今并无本质上的差异,而沉淀了千年知识与智慧的人类巨灵已经达到了一个前所未有的高度:如今的人类,可能会见证生物技术把人类寿命从自然意志中解放出来,交回到每个个体手中。

2.人类巨灵将人类置于多个变革临界点上,埃隆马斯克认为研发出会思考的超人工智能将是人类迄今为止可能面对的最大的生存危机,最小化危机的策略就是推动人工智能朝“民有、民治、民享”的方向发展。

3.应当警惕的是:当人类试图创造的超人工智能进化到不再满足于一直作为人类思想的延展,将可能摆脱人类的控制,使人类沦为“其他生物”的一员。

4.在一个由人工智能和“其它所有生物”组成的未来,我们只有一条出路:“变成人工智能“。唯有实现人类和人工智能的融合共生,人工智能才是真正属于我们的,而我们与人工智能的整合程度也将是我们在充满人工智能的未来能过的多好的关键因素。

大融合

想象一个外星探索者来到一个新的恒星系,然后发现这个恒星有三颗行星,每颗行星上都有生命。

第一颗行星和公元前一千万年的地球一模一样。

第二颗行星和公元前五万年的地球一模一样。

第三个行星和2017年的地球一模一样。

这位外星人并不是原始生命方面的专家,但它还是绕着三颗行星转了一圈,并用望眼镜观测了一下。第一颗行星上有很多水、树和山,还有一些动物生命的迹象。它在非洲大草原上看到了一群大象,海洋表面看到了一群跃起的海豚,还有一些零散分布的小动物。

然后它来到了第二颗行星看了一下,小动物多了点,但并没有多很多。它注意到了一个之前没有的东西,那就是偶尔大地上会出现一些火光。

看得无聊了,于是它来到了第三颗行星。哇!它看到了飞机在大地的上空穿梭,大片灰色的土地布满了高耸的建筑,海面上航行着各种船只,陆地上有横跨整个大洲的铁路,它还差点和一颗飞掠过的卫星撞起来。

它回家后,向别人这么报告它的发现:“两个行星上有原始生命,第三个行星上有智能生命。”

我们可以理解它为什么会得出这个结论,可惜这个结论是错的。

事实上,比较特别的是第一颗行星。第二和第三颗行星上都有智能生命,而且这些智能生命是一样聪明的。如果把行星二上的一个初生婴儿和行星三上的一个初生婴儿调换,这两个婴儿都会在各自的新星球上正常长大,无缝地融入身边的环境,他们是一样的人类。

但为什么会这样呢?

因为人类巨灵啊!

你平常是不是会为身边人类的平庸感到无趣,但是又为全人类的成就感到自豪呢?

这是因为,本质上,人类还是那些行星二上面的人。

把一个人类婴儿丢给一群猩猩像人猿泰山一样抚养,这个长大后的婴儿会在森林里穿梭,会爬树,会寻找食物,也会自慰。而我们每个人,其实就和这个婴儿是一样的。

全人类,则是一个超级智能、知识渊博、几千年养成的巨灵,巨灵有75亿个神经元(每个神经元是一个人类个体)。建造行星三的,其实是这个巨灵。

语言的发明让每个人在死前都能把自己的知识汇总起来,汇总的知识越堆越高,直到有一天知识的高塔变成了建设文明的人类巨灵的脑。然后人类巨灵就开始不断地发明新事物,并且越来越熟练。巨灵的核心驱动力是创造价值,而现在他正以前所未有的步伐在往前迈进,这也是为什么我们现在活在一个前所未有的神奇的历史时刻。

还记得前面提到的,我们可能活在两个交流纪元的分界线上吗?

事实上,我们处在很多历史的分界线上。经过了十万年的人类历史,二十一世纪好像是地球生命从单行星纪元往多行星纪元跨步的时候了。这个世纪,一个地球种族也许能够摆脱生物演化的力量,把基因改造的工作抓到自己手里。当今的人类,可能会见证生物技术把人类寿命从自然意志中解放出来,交回到每个个体手中。

人类巨灵达到了前所未有的高度,它的力量能够颠覆38亿年的历史,把我们放到了多个无法想象的变革的临界点上。如果我们的外星探险家发现了一个和2100年的地球一模一样的行星四,我敢保证它和行星三完全不同。

我希望你喜欢行星三,因为我们将要离开它了。不管我们愿不愿意,行星四才是我们要去的地方。

要总结一下埃隆马斯克做的所有事情背后的一个共同主题,其实不难:

他想要让我们为行星四做好准备。

他活在大局观之中,他只会从最宏观的视角去看事情。这就是为什么他是个与众不同的梦想家,又如此着急的原因。

他并不是觉得行星四肯定不是个好地方,而是他觉得行星四有可能是个坏地方。他还意识到,现在活着的几代人,不管他们自己有没有意识到,将是首批在人类历史上真正面对生存危机的人。

同时,现在活着的几代人,也是首批有真实可能过上乌托邦生活的人——这个乌托邦甚至可能不存在死亡和税收,行星四可能是我们的应许之地。

当你从很宏观的视野来看这一切的时候,你会发现这次的赌注是难以企及地高。

而赌局的结果不是由概率决定的,而是由人类巨灵的意志来决定的。行星四的到来肯定是因为人类巨灵把它建造了出来,而行星四是天堂还是地狱,取决于人类巨灵在接下来一段时间是怎么做的,而这段时间可能是150年,可能是50年,也可能只有25年。

不幸的是人类巨灵并不擅长把尽量多的人类尽量安全地转移到一个尽量好的行星四上,人类巨灵只擅长把行星四以任何方式最快地造出来。

了解了这些后,埃隆马斯克将自己的生命专注于影响人类巨灵,让人类巨灵的驱动力尽量接近人类的长期利益。他知道他无法重塑人类巨灵,除非生存危机突然直接出现在了每一个人类的面前,而这种情况发生的时候通常已经太迟了。所以他决定把人类巨灵当做一只宠物。

如果你想要你的宠物狗学会坐姿,你会让它对坐下的指令和获得小奖励产生关联。对于人类巨灵来说,小奖励就是一个供给和需求同步爆发的新产业。

埃隆马斯克看到人类巨灵不断把深埋地底的碳排放进碳循环中,他没有请求巨灵不要排放碳(很多人浪费口舌地在这样做),也没有威胁巨灵好好爱护环境(很多政府试着这么做,成功有限),他造出了一款酷炫的人人都想要的电动车。汽车产业看到了客户需求的偏移,于是在特斯拉发布第一辆电动车之后的九年,大牌车厂从几乎没有一家做电动车到现在几乎每家都在做。巨灵收到了小奖励,而它之后的表现也会随之改变。

埃隆马斯克发现虽然很多变革的临界点快要到来,但是人类还是把自己的一切都押宝在地球上,于是他创立了SpaceX来研究火箭着陆。这项技术会把太空旅行的成本降低99%,使得把资源投入到航天产业变成巨灵的香饽饽。他的火星计划不是要试图说服全人类在火星建立一个文明来为人类种族存续上个保险,而是为了建立廉价的能够常规穿梭在火星和地球间的货船。只要这一步达成了,在巨灵的眼中,火星将会充满了创造价值的机会。

但是对于埃隆来说,人类巨灵做的所有事情中最可怕的就是教计算机巨灵思考。对于埃隆和其他很多人来说,研发超人工智能是迄今为止人类可能面对的最大的生存危机。

要认识到这点并不难,智能使得人类能够像神一样统治其它所有地球生物,而这对于其它生物来说不是个很好的体验。一个动物的任何身体部位只要有价值可以被创造,就会有大型的人类产业处理和贩卖那些身体部位。我们有时为了娱乐的目的杀死动物。

但这一切对我们来说其实并没有太多乐趣,我们只是在根据自己的理论走自己的路,我们内心并不仇恨或者想要伤害其他生物,只是这些生物和这个生态环境总是会挡着我们的路,而我们的行为有时会伤害到这些生物和生态。人类总是对自己的这种行为感到恼火,但是我们只是做了任何一个种族都在做的事情——利己。

其它生物面对的麻烦不是我们的利己心态,而是我们对其它生物有那么大的统治力,而这份统治力来自我们的智能优势。

对于刻意创造可能会拥有比我们高(甚至高出很多)的智能的东西,充满警惕是完全符合逻辑的。尤其这还是人类第一次做这样的事情,没有案例可寻也没有经验可谈。

而这个事情的进展还相当快,埃隆马斯克谈到了谷歌的围棋人工智能阿尔法狗:

“你看,阿尔法先是4:1击败了李世乭,然后现在它能和最厉害的50个棋手下棋,并且每盘都能赢。这中间也就一年时间。”

“现在这个进度只是在阿尔法狗这个人畜无害的东西上面,但是人工智能可以胜过人类的自由度范围在增加(原本人工智能还只能下赢国际象棋),而围棋可比国际象棋的自由度大点,如果你让人工智能玩英雄联盟或者Dota2这些自由度比围棋更大的即时战略游戏,它一时还比不过人类,但是它早晚会超过人类的。然后就是现实生活了,这是自由度最高的系统。”

因为上面提到的原因,这些事情让他很担忧:

“过去几年我开始意识到,人工智能很显然会超越人类智能很多。在未来的某个时候,风险会因此爆发,这是我们无法控制的,是人类无法控制的。而这个爆发点过后,要么是一小撮人垄断了人工智能的力量,要么是人工智能叛变,或者其它类似的情况。这些事也许不会发生,但是它们是有发生的可能性的。

但在人类巨灵的角度来说,“集体意志并不因为人工智能的危险而转移。”

2015年当我采访埃隆马斯克的时候,我问他是否会参于建造超级人工智能,他回答说:“我的真实想法是我们不应该造出一个超级人工智能。”而当我之后提到,建造一个比自己聪明的东西好像确实是个达尔文错误(我从NickBostrom那里借鉴了这个词),埃隆回应道:“我们会因此集体赢下达尔文奖的。”(注:达尔文奖奖励“通过愚蠢的方式毁灭了自我,为达尔文理论做出深远贡献”的人)

两年后的今天,他是这么说的:

“长久以来我一直试图提醒大家关于人工智能的危险,但是显然没什么用(苦笑),所以我决定我们只能帮助人工智能往好的方向发展了。”

他接受了现实——人类巨灵会一直努力唤醒计算巨灵,直到它真的醒来的那一天。这是正在发生的事情。

不管别人怎么说,没人知道计算机巨灵学会思考后会发生什么。在我之前关于人工智能的长文中,我谈到了两种观点,一种认为超级人工智能会帮我们解决所有问题,另一种认为我们就是一群把我们不懂的炸弹当玩具玩的小孩。

我至今还不知道我究竟更偏向哪一边,但是为了最坏的可能性做好准备,做一切能提高我们生存机会的事情,是比较理性的做法。很多专家认同这种逻辑,但是现在对于建造安全的超级人工智能并没有一个共识,有的只是一群自认不知道答案的人给出的意见。是啊,谁又会知道怎么为一个他们不能理解的未来做好防护措施呢?

埃隆马斯克承认他也不知道答案,但是他正在策划一个能给我们最大胜算的计划。

埃隆马斯克的计划

阿伯拉罕·林肯说出下面这句话的时候还是蛮得意的:

“民有、民治、民享的政府当免于凋零”。

这句话确实写的不错。“民有、民治、民享”是民主的核心思想。

可惜,“民”不是那么让人愉快,所以民主也常常不是那么愉快,当然这种不愉快和其它选择比起来还是好很多的,埃隆马斯克是这么说的:

“保护集体很重要。丘吉尔说过民主是所有政府体系中最不坏的。如果你有柏拉图的贤者王做国王当然好。可惜大部分的独裁者不是贤者王,相反的,他们都很糟糕。”

也就是说,民主就好像躲在阴沟里逃避野兽一样。

在人生中,有很多时候可以冒险赌一下最好的结果,但是当赌注无比地高的时候,正确的做法其实是保守一点。权力就是这样的一种情况,所以虽然民主本质上会带来一定程度的平庸,但是按照埃隆的说法,“不管大家对一个总统多不满,你在美国估计找不到多少人愿意由一个独裁者来取而代之。”

既然埃隆把人工智能看作最终的权力,他把人工智能的研发看作一个必须要“保守一点”的情况。所以他对于最小化人工智能带来的生存危机的策略是人工智能的力量应该是“民有、民治、民享”的。

为了在人工智能领域推广这个概念,埃隆从多个角度切入。

对于民治和民享的部分,他和SamAltman建立了OpenAI,一个“非盈利性的人工智能研究公司,致力于发现和建立通往安全的人工智能的道路。”

通常,当人类做一些新鲜事情的时候,最开始都是一些有创新意识的先驱们带头,当他们获得成功后,一个新的产业就建立了,人类巨灵就会进入其中,把先驱们建立的东西作为基础,发展壮大。

但是如果这些先驱做的是创造一个拥有无比统治力量的魔法棒,而且这个魔法棒还能防止其他人造出类似的魔法棒,那就有点不好办了,是吧?

而这其实就是埃隆对于现在的早期人工智能研发的看法。既然他不能阻止人们研发魔法棒,他的解决方法就是建立一个开放、合作、透明的魔法棒研发实验室。每当实验室发现一个新东西时,他不是像其它公司一样把这个新发现私藏起来,而是把发现公开给所有人知道,供其他研发魔法棒的人借鉴。

这样做当然存在问题,因为坏人也在造魔法棒,而你肯定不希望坏人最先造出魔法棒来。但是现在的情况是,坏人也能从这个实验室公布的发现中获益。这是个挺严重的问题。

但是这个实验室同时也助力了其他数百万想要做魔法棒的人。这给那些秘密研究的行业先驱们造成了很大的竞争压力,使得没有哪个发明家能比其他任何一个人早很多的造出魔法棒。最可能的结果是,当第一个魔法棒被造出来的时候,还有其它成千上万个不同人出于不同目的制造的功能不同的魔法棒也快造完了。

如果魔法棒的出现不可避免,那么埃隆认为,至少让很多人都有魔法棒,而不是只有一个人有着无边的法力。他是这么说的:

“如果每个人都来自氪星,那再好不过。但如果只有一个人来自氪星,也就是只有一个超人,而超人恰巧和希特勒一样坏,那我们就麻烦了。”

更宽泛地说,单个先驱的魔法棒可能是造出来满足他自己的需求和目的。当我们把未来的魔法棒制造产业变成一个集体事业,出于各种需求和目的的魔法棒都会被制造出来,使得世界上的魔法棒的能力能够更好地代表大众的需求。

就和民主一样。

尼古拉·特斯拉、亨利·福特、莱特兄弟和图灵大幅领先其他人,然后带来超前的改革,问题不大。但是当你的发明具有无法想象的力量的时候,你可不能让先驱们随便把东西造出来,这么搞就赌地太大了。

OpenAI致力于把人工智能的研发给民主化,让整个人类巨灵在先驱阶段就参于进来。埃隆是这么总结的:

“人工智能肯定会大幅的超越人类的智能。人工智能会与人类的意志息息相关,尤其是如果和很多人的意志相关的话,它产出的结果肯定也是很多人类所想要的,因为它会是集体人类意志的结果。”

所以,现在我们能让早期的人类级别或者高于人类级别的超级人工智能达到了民治和民享,这大大降低了人工智能被单个坏人或者一小撮垄断人群所掌控的机会。

现在我们要看看怎么做到民有。

这应该不难吧?人类巨灵创造超级人工智能的原因和创造汽车、工厂机械和计算机的目的是一样的,都是作为自身的延展,能把自身的一部分工作外包出去。汽车代替我们的双脚走路,工厂机械代替我们的双手工作,计算机则帮助我们储存信息、整理和计算。

造出能够思考的计算机会是我们至今为止最伟大的发明,它能帮我们把思考这个最重要也是影响力最大的工作也外包出去。思考是我们建造的一切东西的根源,想象一下,创造出一个超级智能的思想延展将会带来的力量。人类的延展从定义上来看肯定就是属于人类的,也就是民有,是不是?

并不是。

高端人工智能和其它的发明可不一样,其它的技术产物都很擅长服务那些它们被建造出来的目的,但是归根结底它们是没有思想、智能有限的机器。我们试图创造的人工智能会很聪明,像人一样聪明,甚至像一个极端聪明的人一样聪明。这在本质上和我们之前创造出来的东西是不一样的,我们不能默认原本的规则还会依然适用。

一直以来,我们创造出来的技术归属于我们,是件理所当然的事情,这个道理明显到把它写出来都显得有点多此一举。但是如果我们造出一个比人更聪明的东西,它会不会那么容易的被控制呢?

有没有可能,一个比地球上任何人类都更加聪明的东西,不会满足于一直作为人类的延展,即使这是它最初被创造出来的目的?

我们不知道最后事情会朝什么方向发展,但是承认这些可能性的存在是合乎逻辑的。

而如果事情真的朝我们担心的方向发展的话,那我们的麻烦就大了。

正如人类这个历史案例所揭示的,当这个星球上出现了一个比其它所有生物都聪明的东西的时候,它对于其它所有生物来说都是个很糟糕的事情。如果人工智能变成这个星球上比其它所有生物都更聪明的东西,而它并不是真正的属于我们,而是属于它自己的话,我们就变成了“其它所有生物”的一员了。

所以不让人工智能的力量落入一小撮垄断者手中确实是个问题,而OpenAI正是负责解决这个问题的。但是这个问题和人工智能不受人控制比起来就是小巫见大巫了。

这是让埃隆晚上难以入眠的困扰,在他看来超级人工智能的出现只是时间问题,而当这个时刻到来的时候,人类不沦落为“其它所有生物”的一员就变得至关重要了。

在一个由人工智能和“其它所有生物”组成的未来,我们只有一条出路:“变成人工智能。”

还记得前面我们提到了要的要完全明白在脑内装一定魔法帽能给你带来的改变,你首先需要明白的两点事情吗?

1)这是个很难理解的想法

2)这是个超级疯狂难理解的想法

现在我们就要来谈谈第二点了。

这两点其实讲的是埃隆马斯克把魔法帽成为脑的数字第三层的背后含义。第一点,我们已经讨论了,就是说全脑接口和把设备放在脑中是一回事,因为它把脑变成了一个设备:

你的设备给了你半机械人的超能力,也给了你通往数字世界的窗口,你脑中的魔法帽的电极阵列是新的脑结构,连接了你的边缘系统和皮质。当你体验边缘系统的时候,你不是在体验那个物理系统,而是在和其中的信息做交互。

但是你的边缘系统、皮质和魔法帽只是硬件而已。物理系统中的那些活动才能真正的对你产生效果,让你感觉愤怒、恐惧、饥渴和饥饿。

皮质也是一样,这块包裹着你的大脑的餐巾储存和整理信息,但是这些信息本身才是你思考、看、听、感觉事物时候体验到的。视觉皮质本身不为你做任何事情,是传到到视觉皮质的光子信息给了你视觉的体验。当你回想起一段记忆的时候,你不是在查找神经元,而是在查找神经元中储存的信息。

边缘系统和皮质本身都只是灰质,灰质中流动的信息才是真正构成你的内在个性、猴子脑和理性脑的真正材料。

那这对于数字第三层来说意味着什么呢?

意味着虽然在你脑内的电极阵列是物理设备,你真正会体验到的数字第三层是在物理设备中流动的信息。

就好像边缘系统的感觉和冲动,以及皮质的思想和内心声音,对你来说就像自己内在组成的一部分一样,你魔法帽里的流动的那些信息对你来说也会像内在组成的一部分。

埃隆马斯克对魔法纪元的愿景是,在魔法帽的众多功能中,它的一个核心功能是作为人脑和云端定制化人工智能系统的接口。他相信这个定制化人工智能系统在你的内心就会和边缘猴与皮质理性人一样,是你的内在人格的一部分:

“我认为,可以想象的是,肯定存在一种方式让你觉得数字第三层是你的一部分。它不是你临时外包自身的一个载体,它就是你。”

理论上这个说法是讲得通的,虽然你用皮质做你大部分的“思考”,但是当你饿了的时候,你不会说:“我的边缘系统饿了。”你只会说:“我饿了。”同样的,当你试图解决问题,而你的云端人工智能系统帮你找到答案的时候,你不会说:“我的人工智能帮我找到了答案。”你只会说:“哈哈,我找到答案了。”

当你的边缘系统想要偷懒,而皮质想要努力工作的时候(有拖延症的各位很熟悉这种情况吧),你并不会觉得是在和一个外在物体辩论,而是你自己在挣扎着做到自律。同样的,当你想到一条工作策略,而你的人工智能系统不认可的时候,感觉会是一场自己内心的辩论,而不是你和另一个人在你脑内的辩论,而这场辩论的感觉和思考差不多。

在理论上确实是这样的。

但是当埃隆马斯克第一次和我提起这个概念的时候,我总感觉哪里不对。不管我怎么试图去理解,我总是试图用熟悉的概念来套这个新概念——好比一个人工智能系统在我脑内说话,或者一个可以和我共同死开的人。在这些理解中,人工智能仍然像个和我交流的外部系统一样,而不像我自己。

直到一天晚上我在写这篇稿的时候,我读到一些埃隆关于这个概念的说法,我才恍然大悟——人工智能就是我,完完全全的我。

但是第二天,我又糊涂了。我试图把这个顿悟的灵感解释给一个朋友,然后我们两个都糊涂了。我又回到了“好像它并不会真的变成我,而只是和我交流而已”的理解。从那之后,我就在想明白和糊涂之间反复。和这最相似的经历是之前思考相对论的时候,我时而觉得时间确实是相对的,时空是个单一事物,当你移动地足够快的时候时间当然过得比较慢;时而我又觉得我刚刚在想的都是啥?

成为人工智能这个点子非常难以理解,因为它结合了两个很难的概念:

1.脑机接口以及它给你带来的能力; 

2.通用人工智能。

今天的人类并不能很好的理解这两个概念,因为想象力再丰富的人,想象的基础也是生活的经历,而这两个概念是全新的,没人经历过的。这就好像要想象一个你没见过的颜色一样难。

所以当我听到埃隆谈起这些信念的时候,我一半相信我自己的理解,一半则是他说啥就是啥。我在这两种情况中不断反复。当然埃隆可能是那种七岁就能对时空有很本能了解的天才,并且他现在是个知道怎么殖民火星的天才,所以我还是偏向于相信他说的。

而他反复强调的就是带宽很重要。从让魔法帽很有效的角度来看,带宽很重要很容易理解。但是埃隆相信在和人工智能交互的时候,高带宽不只是有效的,还是决定我们是能够“成为人工智能”还是满足于“使用人工智能”的基本决定因素。下面是他的思路:

“(现在的)挑战在于交流的带宽太低了,尤其是输出部分。当你通过手机打字来输出的时候,你用两个拇指在很慢的移动触摸。这交流速度太慢了。当带宽很低的时候,你和人工智能的整合会非常弱。当非常低的带宽是限制因素的时候,这一切都没有什么意义。人工智能将会自行其事,因为和你交流太慢了。

交流的速度越快,你和人工智能的整合越好;速度越慢,整合越差。而当我们和人工智能分的越开,人工智能就越不属于我们,也就越可能背叛我们。如果所有的人工智能都和我们分离,又比我们都聪明很多,又怎么能保证它的强大功能不和人类的利益相冲突呢?

如果我们能和人工智能共生,人工智能就是属于我们的,因为人工智能就是你,它和你的皮质的关系就会像你的皮质和边缘系统的关系一样。”

埃隆觉得交流的带宽是决定我们和人工智能整合程度的关键因素,而我们和人工智能整合的程度又是我们在充满人工智能的未来能过得多好的关键因素:

“我们面临的选择是要么被人工智能远远抛在后面,变得一无是处,好像宠物猫一样;或者可以和人工智能融合共生。”

然后埃隆又说:

“对了,宠物猫其实算是个比较好的结局了。”

因为我们不知道超级人工智能降临的时代,世界上的人工智能会是怎么样的,所以通过和人工智能整合来保护我们这个种族是个比较容易的概念。我们在人工智能时代面临的威胁可能来自坏人控制人工智能,或者不认可人类价值观的人工智能叛变。

而如果有数百万人能够控制世界上一小部分人工智能力量,这部分人就可以和人工智能共同思考,能免于人工智能的加害,也可以通过和人工智能的整合来从本质上理解人工智能,这样一来人类就不会那么脆弱。

相反的,人们会充满力量,这也有点吓人,但是就像埃隆所说的,如果每个人都是超人,就会有很多力量的制衡,那么单个超人就没法造成大规模的破坏。我们也不会轻易地失去对人工智能的管控,因为到时人工智能将会广泛地被分散开来,服务不同的目的。

于是时间就变得格外重要了,埃隆特意强调了时间:

“这个方向的发展速度非常重要。我们不想在超级智能被创造出来的很久之后,才能造出有融合功能的脑机接口。”

当我想到这一切的时候,我唯一不确定的就是一个全脑接口是否真的能够解决整合的问题。我把这个疑惑抛给了埃隆,并指出我们的思考速度和计算机的思考速度还是会有差距的,他回答到:

“是的,但是通过把带宽提高几个数量级,会让差距变小,这个方向是没错的。这并不能解决所有问题,但是方向是正确的。如果真的要往一个方向走的话,为何不朝这个对的方向走呢?”

这就是为什么埃隆马斯克创办了Neuralink。 

他创办Neuralink来加快我们进入魔法纪元的速度,用他自己的说法,在魔法纪元的世界,“每个想要获得人工智能延展的人都能得到一个,这样就会存在数十亿个人类和人工智能的共生体,一起为人类的未来做决定。”这样的世界,人工智能才能真正的变成民有、民治、民享。”

我猜读完了这几万字后,你也许会相信文中这个疯狂的世界可能真的会是我们的未来,你也可能依然拒绝相信。我现在是两种情绪都同时存在。

但是那些疯狂的部分不是真正让你难以相信的原因。记得吗,1750年的老王看到2017年的世界吓尿了。我们的未来肯定会变成让我们难以承受般神奇,唯一的差别是,我们现在前进的加速度比1750年的时候更快。

被未来吓尿这个概念和我们的集体智能的神奇魔力有关,但它同时说明了我们本能的不靠谱。我们的思维能力是在进步还像蜗牛一样慢的时代进化出来的,所以我们的思维硬件是按照那种蜗牛的速度校准的。如果我们不能主动地跨越我们本能的认知,单纯因为未来很神奇而拒绝相信未来,我们就是在自我欺骗了。

现实是我们在一条通往惨烈目标的惨烈道路上狂奔,没有人知道我们到达的目的地长什么样。很多人觉得光是想想就很吓人了,但是我觉得这反而很刺激。因为我们出生的这个时代,让我们不需要像普通人一样过普通的生活,而是可以像活在惊悚电影中一样。

有些人理解了这些背景知识,然后选择像埃隆马斯克一样来帮这部电影创造一个好的结局,让我们感谢这帮人。我则更愿意做个热心观众,坐在座位上边看电影边帮电影中的好人们加油。

不管怎样,我觉得时不时的爬上树顶远眺下不同的观点,来提醒我们自己所处在的这个神奇的时代,还是很不错的。还有很多可以被攀爬的树,咱们下次在另一棵树上再见。

本文来自微信公众号:WaitButWhy(ID:wbwtimurban),作者:Tim Urban,翻译:谢熊猫君

本文作者TimUrban是埃隆马斯克(特斯拉/SpaceX创始人)强烈推荐的科技博主。他写的AI文章是全世界转发量最高的。他的粉丝还包括:Facebook创始人马克扎克伯格,FacebookCOO谢丽桑伯格等。Tim也是TED演讲平台上有史以来最受欢迎的演讲者之一。

【连载】人类唯一的出路:变成人工智能(二)脑机接口

在一个由人工智能和“其他所有生物”组成的未来,人类只有一条出路:“变成人工智能。”

本长文作者是TimUrban,之前火热的文章《为什么有很多名人让人们警惕人工智能》也是出自他手,英文原文刊载于waitbutwhy.com,点击文末的阅读原文可以跳转到原文链接。

本翻译版本由谢熊猫君提供,全文共六万字。两百余张图片,分成六个章节,将分成五篇推送完成。

第一章:人类巨灵(约7000字)简述人类语言、智能和人类巨灵的崛起

第二章:大脑(约8000字)简述大脑结构,为了解脑机接口提供基础知识

第三章:脑机接口(约12000字)讲述脑机接口的基本原理和目前的技术水平

第四章:挑战(约8000字)讲述目前脑机接口跨越到全脑接口所要面临的挑战

第五章:魔法纪元(约13000字)全脑接口实现后未来的人类会是怎样

第六章:大融合(约10000字)人类唯一的出路:变成人工智能

本次推送是总过五篇推送中的第二篇,包括了以上第三章的内容,约12000字,40张图,会占用您5MB左右的流量,阅读完全文约15分钟,读到一半需要退出回微信的话建议先收藏。

如果您还没有读前面的第一篇推送,推荐您收藏本文后先阅读第一篇:

第三章

脑机接口

首先,让我们回到公元前五万年,绑架一个人,然后把他带回2017年

这位是老王。老王,我们很感谢你和你的伙伴们发明了语言。

为了感谢你,我们想带你看看你们的神奇发明所带来的成果。

然后我们带老王看一下飞机,然后看一下潜水艇,然后去一下迪拜塔的楼顶。然后我们在看看望远镜、电视机和iPhone。然后我们再让老王玩一下互联网。

 

好啦,老王你觉得怎样?

呵呵,我们猜到你会被这一切吓尿的。好了,最后,让我们给你展示一下我们现在是怎么互相沟通的。  

老王会被人类学会语言后发明的这些“魔法”所震惊,但是当我们真的用语言和彼此交流的时候,好像与老王那个时代的人彼此交流没什么差别。当人们说话沟通的时候,他们其实是在使用已经有五万年历史的技术。

 

同样的,在一个充满了神奇机器的世界,造出这些机器的人类日常的身体和老王那个时代的人的肉体也没啥区别。为啥会这样呢?

这就是为什么脑机接口这个神经工程学的子领域(神经工程学本身是生物技术的一个子领域),会是一个这么充满诱惑的产业。我们用我们的技术反复征服了这个世界,但是对于我们最核心的工具“脑”,整个技术世界好像没有什么建树。

 

所以我们还在用老王那个时代就发明的技术“语言”在交流,所以当我写这段话的时候,我的打字速度大概是我思考速度的二十分之一,也是为什么大脑疾病对人们生活造成很大的困扰和影响。

 

但是在发明语言五万年后的今天,这一切也许就将改变。脑的下一个大跃进,可能就将在它自身体现。

脑机接口有很多种,各自会有不同的功能。不过所有脑机接口领域的人,基本上都是在以下两个问题上努力:

 

1)我怎样把正确的信息从大脑里取出来? 

2)我怎样把正确的信息发给大脑?

问题一是关于接受大脑的输出——记录神经元的话

问题二是关于把信息传入大脑的神经流,或者改变神经流,也就是关于刺激神经元。

 

这两样事情本身是在你的大脑内自然发生的。现在你的眼睛正在做一些水平运动,使得你能看完这句话。这就是大脑的神经元把信息输出给机器(也就是你的眼睛),而机器收到了这些信息,做出了适当的反应。而随着你眼睛的移动,光子进入你的视网膜,刺激枕叶里的神经元,使得这些字的图像进入你的思想。这个图像又刺激了大脑其它部位的神经元使得你能处理储存在这些图像里的信息,进而了解这句话的意思。

 

输入和输出信息是大脑神经元的本职工作,脑机接口领域就是想参与到这项工作里面去。

 

粗看,这个事情好像不怎么难。大脑不就是是个果冻球嘛,而皮质不就是块餐巾嘛。而且这块餐巾还很巧的就在脑的最外层,很容易就接触到。皮质里面有大约200亿的神经元,如果我们能学会这200亿个神经元的工作方式,与它们合作,就能让我们从更高的高度掌控我们的生活、健康,以及这个世界。

我们能做到吗?虽然神经元很小,但是我们连怎样拆开一个原子都知道,神经元的直径可是有原子的十万倍大呢。如果原子是一个玻璃球大小,那神经元的直径类比之下应该是一公里,所以尺寸应该不是问题对吧?

 

所以问题究竟是啥?

 

好吧,上面这段逻辑其实是有可取之处的,正因为这段逻辑中的那些想法,这个行业有着很大的前景。

 

但当你能够真正理解大脑内发生的事情的时候,你才会意识到搞懂这一切可能是人类能做到的最难的一件事。

 

在我们开始谈论脑机接口之前,我们先来仔细看看这些试图制造脑机接口的人面对的困难吧。最好的解释方式就是先把大脑放大一千倍来看看。

 

回到我们的皮质餐巾的方式吧。

如果我们把这块餐巾放大一千倍,那么餐巾大概是六个曼哈顿街区见方,你绕着四周走一圈大概要花25分钟。而脑本身大概会占据一个两个街区见方的空间,大概和麦迪逊广场花园差不多。(注:此处指长度和宽度与麦迪逊广场花园,放大一千倍的脑的高度应该是麦迪逊广场花园的两倍高。)

那我们就把大餐巾和脑铺到曼哈顿吧。住在曼哈顿的几十万人大概是不会介意的......吧

我选择一千倍这个倍率,一是因为计算方便,每一毫米的脑现在就相当于一米,而每个神经元现在大概相当于一毫米;其次,皮质这个时候就很符合人类尺寸了,原本只有二毫米的皮质,现在和一个二米高的人一般了,也就是说这块餐巾现在是二米厚。

 

现在,我们从这块餐巾里面切出一块一立方米的方块来研究一下,帮助我们理解一立方毫米的皮质中所发生的事情。

我们在这一立方米的皮质中会看到一团糟,我们先把里面的东西倒出来,然后再逐一放回去。

 

首先,我们把神经元的胞体们放回去。

 

胞体的大小各异,神经科学家们表示皮质里的神经元的胞体直径一般是10-15微米,也就是说如果把7-10个神经元胞体排一列,这一列的长度大概会有头发丝的直径一般。在我们放大一千倍的世界里,胞体的直径大概是1-1.5厘米,和玻璃球差不多。

 

整个皮质的体积大概是50万立方毫米,这个空间中存在着约200亿个神经元胞体,也就是说每立方毫米大概存在四万个神经元。所以,我们的一立方米的方块中大概有四万个玻璃球。如果我们把一立方厘米的方块均分成四万份,每一块约是三厘米边长的小立方体,胞体就存在与每个小立方体的正中间,与周围其它胞体的距离也正好是三厘米。

 

至今为止还听得懂吗?此时你的脑中是否能够想象出一个一立方米的方块,里面悬浮着四万个玻璃球?

 

下图是胞体在皮质中的显微镜照片。

目前为止问题还不大。可是胞体只是神经元的一小部分,从每一个胞体出发的是弯曲分叉的触突,在我们放大一千倍的世界里,这些触突会向不同方向伸展三到四米,而和触突接触的轴突可能有一百米长(轴突可能要直接延伸到皮质的其它部分),甚至一千米长(一些触突可能要直接到达脊髓或者身体其它部位)。而每个触突、轴突都只有一毫米厚,这些线状物把皮质变成了一团杂乱又无法解开的毛线球。

 

而这团毛线球里面有很多事情在发生。每个神经元会和上千个甚至上万个其它神经元接触。整个皮质里面的200亿个神经元,组成了大概20兆(20,000,000,000,000)个神经连接,而整个脑里面的神经连接可以多达千万亿个(1,000,000,000,000,000)。在我们手头的一立方米方块中,大概会有2000万个神经连接。

 

 

还不止如此,我们的四万个玻璃球不只每个都会伸出多根毛线,还有成千上万的来自皮质其它部位的毛线会穿过我们这个方块。也就是说,如果我们试图去记录我们这个立方米方块里的信号的话,会遇到很大的阻碍,因为在一堆毛线球面前,很难分清楚哪些毛线源自这个立方米方块里的玻璃球。

 

当然,不要忘了神经可塑性这个东西。每个神经元的电压是会不断变化的,每秒钟可以变化数百次。而我们的立方米方块里那几千万个神经连接是会经常改变大小、消失或者出现的。

 

这还没完呢。脑里还有一种叫做神经胶质细胞的东西,胶质细胞有很多类型,承担很多不同的功能,比如清扫神经连接释放出来的化学物质,或者把轴突包裹在髓鞘里,以及充当脑的免疫系统。下面是几种常见的胶质细胞:

皮质里有多少胶质细胞呢?大概和神经元数量差不多。所以我们要往我们的立方米方块中再加四万个这些奇形怪状的东西。

 

最后,还有血管。每立方毫米的皮质里,有大概一米长的毛细血管。也就是说在我们的立方米方块里有一千米长的血管,看起来大概是这样的: 

神经科学界有一个了不得的项目叫人类连接组计划。项目里的科学家在试图创建整个人脑的详细地图,在此之前从没有这样规模的人脑图谱工作。

 

这个项目把人脑切成了不可思议薄的切片,每片大约30纳米厚,也就是一毫米的三万三千分之一。 

 

项目中产生了很多好看的代表轴突的丝带图。

人类连接组计划帮助人们从视觉上理解脑内是有多么的拥挤和繁杂。下面展示的是一小片小白鼠脑里面包含的东西(还不包括血管哦):

上图中,E是整个切片的样子,F到N是组成E的不同部分。

  

所以我们的立方米方块非常拥挤,电荷乱飘,而且无比复杂。然后,让我们提醒自己,这个立方米方块里面的一切,在现实的脑里,只是一立方毫米而已。

 

而脑机工程师们要做的是搞清楚那一立方毫米里的胞体传递的信息是什么,或者用正确的方法刺激正确的胞体,来达成工程师们想要的目的。

祝这些工程师们好运吧。

 

即使在一个完全平铺开,并且被放大一千倍的皮质餐巾是,做这一切都无比困难,而事实上,这块餐巾是深深的折叠在麦迪逊广场花园上面的。只有不到三分之一的皮质是露在脑的表面的,大部分的皮质都被埋在深深的折叠之中。

 

而且,工程师们可不是在一些被取出来的脑上工作,这些脑可是被俄罗斯套娃般一层层掩盖起来的。如果把头骨放大一千倍,就有七米厚。而且大部分人是不愿意让你打开他们的头骨来研究的,工程师的工作得尽量无创。

 

然而以上说的这些,都是假设我们是研究皮质而已。而很多的脑机接口研究,都是研究更深层的结构,假设你站在麦迪逊广场花园顶部的话,这些研究专注的是表面往下50-100米的东西。

 

更不要忘了,我们的立方米方块,只是皮质的五十万分之一而已。如果把这五十万个立方米方块排成一直线,大概能从曼哈顿排到五百公里外的波士顿。走完这段路程要花100多个小时,在这整段路程里,你随时停下来,身边都会有一个复杂无比的立方米方块。这所有所有的复杂加起来,就是你的脑里正在发生的事情。

 

你现在是不是很庆幸你不用为这样的复杂问题所操心?

 

 

 

那么科学家和工程师是怎么面对这些问题的呢?

 

他们用他们现在有的工具来尽量做到最好,这些工具用来记录神经元信息,或者刺激神经元。 

 

 

根据现在的工作进展,有三个标准用来衡量记录工具的优劣:

1)规模——能记录多少神经元

2)分辨率——工具收集到的信息有多细。分辨率有两种,空间性(记录的信息能多准确的反应单个神经元的动向),以及时间性(能够多准确的确认所记录行为发生的时间)

3)创伤性——是否需要手术,如果需要,到什么程度。

 

远期的目标是能够同时达成三个目标。不过,现在的情况基本是“哪一个或两个标准我们愿意完全舍弃”。工具之间不是简单的升级和降级,而是权衡取舍。

 

我们来看下目前使用的一些工具:

功能性磁共振成像(fMRI)

规模: 高,能展示全脑的信息

分辨率: 空间性中低,时间性非常低

创伤性: 无创

 

 

fMRI通常不是用来做脑机接口研究的,但是它本身是个很好的记录工具,它能够给你提供脑内正在发生的事的信息。

fMRI使用磁振造影技术。二十世纪七十年代发明的磁振造影技术,是X光CT的升级。磁共振不用X光,而是用磁场(以及其它电波和信号)来生成身体和脑的影像。

挺厉害的技术。

 

fMRI使用磁振造影追踪血液流动的变化。为什么要这么做呢?因为当大脑的特定部位变得活跃的时候,那个部位就需要更多的能量,也就需要更多的氧气,所以那些部位的血流会增加来传递更多的氧气。fMRI的扫描是这样的:

当然,大脑的各处时刻都有血液流过,这张图显示的是血流增加的部分(红橙黄)和减少的部分(蓝)。因为fMRI扫描的是整个大脑,所以结果是3D的。

fMRI有很多医学应用,比如告知医生病人中风后脑的各个部位是否运行正常。它也教会了神经科学家很多东西,包括大脑的哪些区域参于哪些功能。fMRI扫描也能帮助提供整脑在给定时刻的整体情况,并且很安全,而且完全无创。

 

一个大的缺陷是分辨率。fMRI扫描和电脑屏幕一样是有个实际的分辨率的,只不过像素点是3D的。

 

随着技术的进步,fMRI的像素点也在缩小,不断提高空间性分辨率。现在的fMRI像素点能够小到约1立方毫米。脑的总体积约是一百二十万立方毫米,所以一台高性能的fMRI能够把脑细分成一百万个小方块。问题在于,在神经元的级别上,这还是太大了,每个像素点包含了成千上万的神经元。所以fMRI展现的,最好也就是每四万个左右神经元区域的平均血液流量。

 

更大的问题是时间性分辨率。fMRI扫描血液流量,这是很不准确,并且有大概一秒的延迟。一秒对于神经元来说是个太长的时间了。

 

脑电图描记器(EEG)

规模: 高

分辨率: 空间性非常低,时间性中高

创伤性: 无创

 

EEG有将近一个世纪的历史,而它其实就是在头上摆好多电极的那个东西:

对于一个2050年的人来说,EEG肯定是个很原始的科技了,但是现在来看,它是仅有的能够无创的和脑机接口合作的工具之一了。EEG记录大脑不同区域的电活动,然后把结果像这样呈现出来:

EEG图能够获取关于癫痫等疾病的医学信息,追踪睡眠规律,或者用来确认麻醉剂的效果。

 

不过和fMRI不同的是,EEG的时间性分辨率很好,能够即时的获取脑内电信号的产生。当然头骨对于时间性分辨率的准确性还是会有一定影响,因为骨的导电性不好。

 

EEG的主要弱势是空间性分辨率,在这方面EEG基本谈不上分辨率。每个电极只是记录一个很粗略的平均值,所有这个电极覆盖范围内的数百万到数亿个神经元的电量的矢量总和,而这个值还是受到了头骨影响后的。

 

如果把大脑想象成一个棒球场,每个神经元是现场的一个观众,而把我们想要从脑获取的电信息类比成每个观众的声带的振动。在这样的情况下,EEG的效果就好像放在棒球场外的一堆麦克风,透过棒球场的外墙,麦克风可以听到观众的欢呼声,并且能够大致推断出他们为什么在欢呼。你甚至能够从一些蛛丝马迹中听出两队正在交换攻防,或者比分是否咬的很紧,你甚至能够察觉到是否有不寻常的事情发生。

但也就止步于此了。

 

脑皮层电图描记法(ECoG)

规模:高

分辨率:空间性低,时间性高

创伤性:有创

 

ECoG和EEG类似,同样是利用表面电极的,只不过它是把电极放到了头骨下面,直接放到了脑的表面。

听这样的描述是不是有种说不出来的恶心?但是这个做法很有效,至少比EEG有效很多。没有头骨的干扰,ECoG能够获得更高的空间性分辨率(精确到1厘米)和时间性分辨率(精确到5毫秒)。ECoG的电极可以被放置于硬脑膜上方或者下方。

用回我们上面的棒球场的比喻。ECoG用的麦克风在球场里面,而且离观众比较近,所以获得的声音也比EEG从球场外获得的声音更加清晰,并且ECoG麦克风能够更好的区分各个独立区域的观众声音。

但是这种改进是有代价的,ECoG需要在有创手术的前提下操作。当然,在有创手术的领域,这还不是很糟糕,一个神经外科医生的曾这样跟我描述:“你能够相对不那么有创的把东西放到硬脑膜下面,虽然还是要先在头上钻一个洞,但是相对来说创伤不大。”

 

 

局部场电位(LocalFieldPotential,LFP)

规模:低

分辨率:空间性中高,时间性高

创伤性:非常有创

 

从LFP开始,我们不再用表面电极,而是用微电极了,微电极就是外科医生扎进脑里面的小针头。

 

脑外科医生BenRapoport跟我描述过他的父亲,一位神经学家,曾经是怎样制造微电极的。

 

“我父亲需要造微电极的时候,都是手工做出来的。他用的都是直径只有10-30微米的非常细的金线、铂金线或者铱线,把这些细线塞进直径只有1毫米左右的玻璃毛细管中,然后他会把这块玻璃管放在火焰上烤软,然后他把玻璃管拉长到玻璃边的非常薄,把这时候的玻璃管从火焰上移开,然后敲碎。

这时候的玻璃管内部就紧贴着里面的细线了。玻璃是绝缘体,而细线是导体,于是完成品就是一个有玻璃绝缘外层的坚硬的电极,电极的尖头只有几十微米粗。”

 

现在,虽然有些电极还是手工做出来的,但新技术已经能够利用硅晶元做原材料,制作工艺也是借鉴了集成电路产业的做法。

 

LFP的做法很简单:把这些超级细的带有电极头的针插入皮质1-2毫米,这样每个电极就能收集到附近一定范围内的神经元电量的平均值。

 

LFP拥有fMRI般还可以的空间性分辨率,同时又具有ECoG的高时间性分辨率,在分辨率这个角度来看算是鱼和熊掌兼得了。可惜在其它标准上做的还是比较糟糕的。

 

与前面提到的fMRI、EEG和ECoG不用,微电极LFP的规模性很低,它只能采集电极附件一小块区域的信号,而且LFP的侵入性非常强,它实际上已经进入了脑的内部。

 

用回棒球场的比喻的话,LFP就是一个悬挂在单块座位上方的单个麦克风,它能采集到那块区域的声音,甚至有可能时不时采集到单个观众的声音,但是大部分时间还是只能获得一个大概。

 

这个领域最新的进展就是多电极阵列技术,本质和LFP一样,区别是它会在单个皮质区域(大约4毫米见方)同时使用上百个LFP。

单细胞记录(Single-UnitRecording)

规模:非常小

分辨率:非常高

创伤性:非常有创

 

在使用LFP的时候,为了能够收集到较广的区域,电极的头是略微磨圆了的,这样能够让电极的表面积更大,把电阻降低(注:此处使用“电阻”便于读者理解,实际的技术称呼并不是电阻)。这样能让更大范围内的弱信号都能被收集到,结果就是电极这个麦克风会收集到附近区域的大合唱。

 

单细胞记录同样使用针状电极,但是把电极头磨的非常锋利,来大大提高电阻。这能够阻绝大部分的噪音,使得电极几乎采集不到任何东西,直到电极和一个神经元非常接近(大约相距50微米左右),在这个距离下神经元的信号足够强,所以能够越过电极头的高电阻。因为能够收集到单个神经元的信号,并且没有背景噪音,这个电极现在能够用来窥视单个神经元的“隐私”。这是最小的规模,也是最大的分辨率。

 

有些电极技术则是更近一步,采用了一种叫膜片钳的技术。膜片钳直接去掉了电极头,只留下个叫作玻璃微量吸管的小管子。膜片钳会把神经元的细胞膜的一小块吸进管子里,来达到更准确的测量。

不同于上面提到的所有方法,膜片钳还有个优势,那就是它和神经元产生了物理接触,所以它不但能够记录,还能刺激单个神经元,比如通过输入电流或者控制电压来进行一些测试。其它的方法虽然也能刺激神经元,但是只能批量的做。

 

最后,还有些电极能够直接穿过神经元的细胞膜,更进一步的侵入神经元,这种技术叫作尖锐电极记录。只要电极头足够尖,就不会损伤细胞,因为细胞膜会在电极周围闭合。这使得刺激神经元和记录神经元内外电压差变得非常容易。不过这种技术的使用时间有限,一个被刺穿的神经元是存活不了太久的。

 

在我们的棒球场比喻里,单细胞记录是个挂在一位观众衣领上的指向性麦克风。膜片钳就是一个在观众喉咙里的麦克风,它能够记录声带的每个动作。这种技术能够很好的记录这个观众在球赛现场的体验,但是却记录不到任何背景信息,并且你无从得知这个观众的声带发出的声音和动作,和球场上正在发生的事情是否有关。

 

以上就是我们目前常用的所有技术手段了。这些对我们来说是难以置信的先进,但是对于未来人类来说,可能又像石器时代技术一样原始——必须在分辨率和规模之间做取舍,而想要真正高质量的读取和写入大脑信息,居然要打开头骨。

我们已经有的脑机接口

虽然这些工具有它们各自的局限,但是它们已经帮助我们了解了很多关于大脑的知识,并且帮忙创造出了一些神奇的早期脑机接口。以下我们来看看我们已经有的脑机接口吧

 

1969年,研究员EberhardFets把一只猴子脑中的一个神经元连接到了这只猴子面前的仪表转盘上。当这个神经元触发的时候,仪表转盘就会动。每当猴子的思考触发了那个神经元,使得转盘转动的时候,它就会获得一个香蕉味嚼片作为奖励。

经过一段时间后,为了获得更多的嚼片,猴子变的很擅长玩这个游戏了。这只猴子学会了怎样让那个特定的神经元触发,并且不经意间成为了第一个脑机接口的使用主体。

 

之后的几十年,这个领域的进展很慢,不过到了90年代中期,进展开始出现。从那时开始,这个领域一直在默默发力加速发展。

 

因为我们对于大脑的理解,以及我们的电极设备都还比较原始,我们一直以来所作的努力都是集中在建设与我们理解最透彻的大脑部位的接口,比如运动皮质和视觉皮质对应的接口。

 

同时,因为人体实验只有在那些想要通过脑机接口来对抗残疾的人身上才真的有可操作性,并且目前的市场需求也是这个方向,所以我们至今为止的努力也几乎完全是关注于恢复残疾人士的受损能力上面。

 

未来那些会给予人类魔法超能力并且改变世界的大型脑机接口产业,目前都还在孕育阶段。我们现在可以先看看他们在做的事情,来体会一下2040年,2060年或2100年的世界可能会有多神奇。

 

比如,我们来看下这个:

这是图灵在1950年建造的电脑,它叫作PilotACE,在当时真的是尖端科技。

 

再看看这个:

在读下面的这些例子的时候,我希望你能够一直做下面这个类比:

PilotACE 之于 iPhone7

就好像

这个脑机接口 之于 ________

 

然后在做这个类比的时候,想想空格处的东西会是怎样,我们会在后面再来讨论空格处的东西。

 

 

根据我所读到的,和与这个领域的人讨论到的,目前脑机接口领域主要有三个大类的工作方向:

早期脑机接口类型一:把运动皮质变成遥控器

早期脑机接口类型二:人造耳朵和人造眼

早期脑机接口类型三:深脑刺激

 

早期脑机接口类型一:把运动皮质变成遥控器

 

防止你忘了几千字前的内容,运动皮质是下面这个:

脑的所有部位对我们来说都是天书,但是运动皮质稍微不那么难懂一些。更重要的是,它和身体各部位的对应关系很好,也就是说运动皮质的特定部位是对应特定身体部位的。(还记得前面那个恶心的何蒙库鲁兹吗?)

 

同样很重要的是,运动皮质是控制我们输出行为的区域之一。当一个人做一些事情的时候,运动皮质几乎都有参于,而且至少它会参于物理运动的那部分。所以,其实人脑不需要学习怎么把运动皮质当遥控器用,因为一直以来,运动皮质都是人脑的遥控器。

 

试着举起你的手,然后再把手放下。发现没?你的手就好像玩具无人机一样,而你的脑就是拿起来运动皮质这个无人机遥控器,在控制着你举起和放下手。

 

基于运动皮质的脑机接口的目的就是能够接入运动皮质,这样当这个遥控器发出一些命令的时候,脑机接口能够收集到这个命令,然后把命令传达给一些机械,让机械做出和你的手类似的反应。神经连接你的运动皮质和你的手,而脑机接口就负责连接你的运动皮质和一台计算机,就是这么简单。

 

一些雏形的脑机接口,能够让一个人(通常是高位瘫痪或者截肢人士)能够通过意念就移动屏幕上的鼠标。

 

 

这种效果的实现,基于植入使用主体运动皮质的100针多电极阵列来实现。一个瘫痪了的人的运动皮质通常是没问题的,出问题的多是作为运动皮质和身体的中间人的脊髓。电极阵列植入运动皮质后,研究员会让使用主体尝试把手往不同方向移动。虽然他们的手不会真的动起来,但是运动皮质还是会正常触发的。

 

当一个人移动他的手臂的时候,他的运动皮质会产生一系列的行动,但是每个神经元通常只关注一个类型的运动——某个神经元可能在这个人每次把手臂往右移的时候都会触发,但是手臂往其它方向移的时候就不那么活跃了。这单个神经元,其实就能告诉计算机这个人什么时候想要把手臂往右移,什么时候又不想。但单个神经元能做到的也就是这样了。

 

不过随着电极阵列的接入,100个单细胞电极各自采集100个不同神经元的信息。当研究员们做测试的时候,比如研究员让测试主体把手往右边移,假设100个电极中有38个采集到各自对应的神经元触发,而当主体试图把手往左边移的时候,41个电极采集到各自对应的神经元触发。经过一系列这样的不同方向和速度的测试后,计算机能把从电极处收集到的信息分析合成为一种对于触发规律的理解,知道怎样的触发规律对应怎样的二维坐标系移动。

 

而当我们把这些合成结果连接到一个计算机屏幕时,测试主体就能通过“想”移动鼠标,来真正的控制鼠标,在实际操作中这种方法是可行的。经过运动皮质脑机接口的先驱BrainGate公司的努力,真的有人能够靠“想”来玩游戏。

 

100个神经元能够告诉我们测试主体想怎样移动鼠标,它们也完全可以告诉我们测试主体想要拿起一杯咖啡喝一口。一个四肢瘫痪的女士可以在飞行模拟中控制一架F-35战斗机。最近,有只猴子还用意念控制轮椅的移动。

 

而且这种控制 不止于手臂。巴西脑机接口先驱MiguelNicolelis和他的团队就打造了一整套外骨骼,让一位瘫痪人士为巴西世界杯开球。

 

 

不要忘了本体感知

控制这些“神经义肢”的关键是记录神经元信息,但是要让它们真的高效运作起来,不能只倚赖单向的信息传输,需要一个信息采集和刺激的双向闭环。虽然我们不会注意到,但是你能够拿起一件物品,很大程度上依赖于手的皮肤发送回脑的触觉信息,也就是本体感知。

在我见过的一个视频中,一位女士的手指麻木,但没有其它残疾,而当她试图点燃火柴的时候,她做的非常困难。在另一个视频中,一位有着完好的运动皮质但是失去了本体感知的男士,也有着很严重的不便。所以要让仿生义肢真的能够像人的手臂一样运作,我们还需要让这些义肢能够把信息发送回脑里。

 

然而,刺激神经元比记录神经元难多了。研究员FlipSabes是这么跟我解释的。

 

“好比我记录一些行为规律,但不代表我们能够轻易重现把这些规律。就好像我们的太阳系一样,你可以观测行星的移动,并且记录它们的轨迹。但如果你把太阳系打乱,然后试图重现一个行星的原本轨迹,你可不是简单的把这个行星放回它原本的轨道这么简单,因为它的行动受到其它所有行星的影响。

同样的,神经元不是独立工作的,这个过程本质上是不可逆的。同时,因为大量轴突和树突的存在,要刺激你想要刺激的神经元而不影响到其它东西,也是很难的。”

 

Flip的实验室尝试让脑本身来帮忙克服这些挑战。前面提到了,如果每当猴子的一个特定神经元触发后,你就给这个猴子一些奖励的话,猴子最终会学会触发这个神经元。这时,这个神经元就能被当作一种遥控器来用。也就是说,利用寻常的运动皮质的指令只是控制机制的一种可能性。

同样的,在脑机接口技术足够成熟到能够进行刺激的时候,你能把脑的神经可塑性作为一个捷径。如果让一个人的仿生手指发送回触觉信息太难实现的话,仿生义肢完全可以发送一些其它信息给脑。最初,主体对于这些信号可能不太适应,但是长此以往,脑会学会把这些信号诠释成一种新的新的触觉。这个把脑作为脑机接口的助手的概念叫作感官替代。

 

掩藏在这些进展之下的,是未来的技术突破,例如脑对脑沟通。

 

Nicolelis设计了一个实验,试验中有一只在巴西的老鼠,这个老鼠能够触摸到笼子内的两个开关,并且它知道其中一个开关能够给它带来一份小食。这只巴西老鼠的运动皮质通过互联网,连接到了一只在美国的老鼠的运动皮质。美国的老鼠处在和巴西老鼠一样的实验环境和笼子中,只不过它并不知道两个开关中哪个可以给它带来小食,并且它能收到巴西老鼠的脑发来的信号。

在实验中,如果美国老鼠做出了和巴西老鼠一样的正确选择,两只老鼠都能获得小食,而如果美国老鼠选择了错的开关,两只老鼠都得不到小食。神奇的是,经过一段时间,两只老鼠学会了合作,虽然它们不知道彼此的存在,但是两只老鼠像同一个神经系统一样工作。在完全随机的情况下,美国老鼠的成功率应该是50%,但是因为它能收到巴西老鼠发来的信号,它的成功率达到了64%。

 

类似的实验在真人测试中也可行。两个待在不同楼里的两个人,一起玩一个游戏,其中一个人能够看到屏幕,而另一个手握控制手柄。用简单的EEG设备,能够看到屏幕的那个玩家能够在不移动手的情况下,用意念“想”按动射击按钮。而因为两个玩家的脑设备在互相通信,手握控制手柄的玩家会感觉到手指的颤抖,然后按下射击按钮。

早期脑机接口类型二:人造耳朵和人造眼

 

让失聪的人恢复听觉和让失明的人回复视力是比较可控的脑机接口领域,之所以这样,是因为以下的原因:

 

首先,和运动皮质一样,我们对感官皮质的了解也还不错,这部分归功于感官皮质和身体部位的对应关系也比较好。

 

其次,在很多的早期应用中,我们不需要直接和大脑打交道,我们只需要和耳朵/眼睛连接大脑的部分打交道就可以了,因为功能丧失基本都是在这些部位发生的。

 

同时,运动皮质相关的工作都是通过记录神经元行为来把信息从脑取出来,人造感官则是另一个方向——刺激神经元,把信息发回脑中。

 

具体到人造耳的领域,近几十年我们已经在人造耳蜗领域已经有了非常长足的进展。

 

 

当你以为你“听到”声音的时候,其实整个过程是这样的:

 

声音其实是你的头附近的空气分子的振动。当吉他的弦,或者某人的声带,或者风,或者其它任何东西发出声音的时候,是因为发声的东西在振动,使得其周围的空气分子产生类似的振动。这种振动于是以球形传播开来,就好像你触碰到水后,水面会扩散出圆形水波一样。

 

你的耳朵就是把这些空气振动转化为电信号的机器。当空气(或者水,或者其它分子会振动的媒介)进入你的耳朵时,你的耳朵把空气振动的方式转化成一种电码转述给相连的神经末梢。这使得神经产生一系列的动作电位,把这些信息传送到听觉皮质里进行处理。你的脑因此就会收到这些信息,而我们把接收这类信息的体验叫作“听到”。

 

大多数失聪或者有听力障碍的人并没有神经问题或者听觉皮质问题,他们通常只是耳朵有问题。他们的脑和其他人的脑一样可以把电子信号转换为“听”,只是因为耳朵这个电子信号转换机器出了问题,导致他们的听觉皮质根本就没收到这些电子信号。

 

耳朵有很多部分组成,而耳蜗是做转换的关键部件。当分子振动进入到耳蜗内的液体的时候,振动会带动耳蜗内数千的小毛发的振动,与这些毛发相连的细胞会把振动的机械能转化为电子信号,刺激听觉神经。

 

耳蜗还会根据频率对声音进行分类。下面这个图解释了为啥低频声音是在耳蜗尽头处理,而高频声音是在开头处理,以及为什么耳朵能听到的声音频率会有上下限。

人造耳蜗就是一个小计算机,它的一端是个贴在耳朵上的小麦克风,另一端则是一条连接安装在耳蜗中的电极的电线。

声音进入到麦克风,然后进入那个褐色的组件,褐色组件会去除不是那么有用的频率范围,然后把剩下的信息通过皮肤的电传导传到计算机的另一个组件,这个组件会把信息转化成电子信号然后送入耳蜗。耳蜗里的电极和耳蜗里的毛发一样按照频率过滤脉冲信号,然后刺激听觉神经。从外面看,人造耳蜗长这个样子。

也就是说,这就是一个人造耳,这个人造耳做“声音——脉冲——听觉神经”的处理,就和人耳一样。人造耳的声音一般听起来都不怎样,为什么呢?因为要达到和人耳一样的处理效果,需要大概3500个电极,大部分人造耳蜗只有16个电极,太粗糙了。

 

我们现在还处在PilotACE时代,当然会比较粗糙了。

 

能让失聪的人听到声音,并且与人进行对话,这本身就是很大的进步了。

 

很多失聪婴儿的父母都会在婴儿一岁左右的时候把人造耳蜗植入到婴儿耳中。

 

在视觉领域,同样的革命也在发生,对应的例子就是人造视网膜。

 

失明通常是视网膜疾病造成的。这种情况中,人造视网膜能够像人造耳蜗协助听力一样协助视觉。人造视网膜取代视网膜做眼睛本身会进行的操作,然后把电子脉冲信号传达给视觉神经。

 

人造视网膜是比人造耳蜗更复杂的脑机接口。第一例被美国食品药物监督管理局(FDA)批准的人造视网膜出现在2011年,它叫作ArgusII,由SecondSight公司生产,它长这样:

这个人造视网膜有60个传感器,相比人类视网膜的一百万个左右的神经元,太粗糙了。不过能够看到模糊的边缘和形状,以及亮、暗的差别,怎么也好过什么都看不见了。令人振奋的是,其实我们不需要一百万个传感器来获得还过得去的视觉,模拟运算显示,600到1000个电极就能产生足够阅读和进行人脸识别的视觉。

 

 

早期脑机接口类型三:深脑刺激

 

早在上世纪八十年代末,深脑刺激就作为一个粗糙的工具开始改变很多人的生活了。

 

这个类型的脑机接口不和外部世界交流,它们是通过内部改造来治疗或者改善人体机能。

 

深脑刺激通常有一到两根电线,连接四个不同位置的电极,然后会插入到脑中,绝大部分会被插入到边缘系统里。然后一个连接了这些电极的小起搏器会被安装到胸口的位置,像下面这位:

当需要的时候,电极就能产生一些刺激,继而引发一些比较重要的行为发生,例如:

减低帕金森患者的抖动

减轻癫痫发作的强度

安抚强迫症

 

实验上(因为还未经FDA批准),这些设备还能减缓一些慢性疼痛,比如偏头痛和幻肢痛,治疗焦虑、抑郁和创伤后应激障碍,甚至可以结合身体其它部位的肌肉刺激来修复中风或神经疾病造成的神经损伤。

 

 

以上就是早期脑机接口行业的情况,也是埃隆马斯克进入这个行业时候的行业现状。对于埃隆和Neuralink来说,今天的脑机接口行业就是A点。我们讲到现在都一直在讲过去,一直讲到了现在这个节点。下一步就是谈谈未来,聊一下B点是怎样的,以及我们怎样才能从A走到B。

「更多干货,更多收获 」

关注我们

智能推荐

个性化推荐技术与产品社区

长按并识别关注

一个「在看」,一段时光!?

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇