算法时代
算法时代(美)卢克·多梅尔经济/经济学理论·14.3万字更新时间:2019-01-0403:40:24首页>经济>经济学理论>算法时代在线阅读算法时代世界上的一切事物都可以被简化成一个公式吗?数字可以告诉我们谁是最适合我们的另一半,而且能和我们白头偕老吗?算法可以准确预测电影的票房收入,并且让电影更卖座吗?程序软件能预知谁将要实施犯罪,并且精确到案发时间吗?这些事听起来都像是科幻小说中的情节,但事实上,它们仅是日益被算法主宰的人类世界的“冰山一角”。近年来随着大数据技术的快速发展,我们正在进入“算法经济时代”。每天,算法都会对展示在我们眼前的信息进行分类、筛选与取舍。我们看到的谷歌搜索结果,脸谱网上显示的好友信息,以及亚马逊给我们提供的个性化购买建议等,都是算法作用的结果。算法正在以各种各样的方式,影响着世界的方方面面,包括企业创新、产业变革、经济发展。在《算法时代》一书中,作者带领读者展开了一次算法和大数据世界的探索之旅:探寻我们如何开始相信大数据的力量;向我们介绍人工智能专家、大数据科学家和硅谷的创业家们,是他们创造了这个美丽的新世界。在当下以及未来,当大数据和算法成为社会、企业和个人已经无法忽视的资产时,就会催生一些新型经济模式。毋庸置疑,算法将成为新经济的新引擎。如果你对人工智能、大数据、互联网技术和算法感兴趣,《算法时代》就非常适合你阅读。品牌:中信出版社译者:胡小锐钟毅出版社:中信出版社本书数字版权由中信出版社提供,并由其授权上海阅文信息技术有限公司制作发行——因版权原因待上架——上QQ阅读APP看其他好书新人免费读10天去QQ阅读,和更多书友互动QQ阅读用户看了那么久,可能你有话说。我有故事,你有想法吗?客户端|触屏版|帮助|反馈|举报达人推广合作:https://kol.yuewen.com网站备案/许可证号:粤B2-20090059B2-20090028客服电话(24小时):010-59357051反馈人工智能:改变世界,重建未来
土耳其机器人的复仇04-12Ctrl+D收藏本站
关灯护眼小中大繁直达底部这些工作不仅涉及建造更大更好的人工智能系统,还包括人类要与这种人工智能系统合作的工作。后者有时被称作土耳其机器人工作,这是以沃尔夫冈·冯·肯佩伦(WolfgangvonKempelen)在18世纪发明的“土耳其行棋傀儡”(TheTurk)命名的。土耳其行棋傀儡游历了欧洲,打败了包括拿破仑·波拿巴和本杰明·富兰克林在内的众多象棋手。然而,人们后来发现,土耳其行棋傀儡根本算不上是一个机器,只是一个躲在秘密隔间里控制“机器人”傀儡的人类象棋师。如今的人工智能工具也是差不多的原理,它们看起来像是拥有机器智能,而实际上只是一种混合智能——每一步都需要人类和机器共同输入信息。土耳其机器人的工作可以是任何因为机器无法完成而分配给人类的工作。因此,这有时也被称作“人工的人工智能”(ArtificialArtificialIntelligence)。
许多企业都进行了人工的人工智能方面的试验。最著名的就是亚马逊的机械特克(MTurk)平台,该平台允许个人和企业进行众包,完成人工智能无法独立完成的人类智能任务(HIT)。从在图片中找到物体并进行标记到转录音频,该任务涉及的范围十分广阔。
亚马逊并不是唯一的参与者。2015年8月,Facebook发布了一款基于文本的人工智能助理“M”,使用的技术与第四章中描述的类似。与Siri、GoogleNow和微软的Cortana不同的是,M同时使用人类和人工智能来回答用户的问题。如果人工智能没能给出满意的答案,人类将继续完成这一任务。
推特(Twitter)也雇用了大量合同工,他们被称为判定官,主要工作就是解释微博上不同检索词的意思。举例来说,2012年10月3日下午6点,美国推特上“大鸟”(BigBird)一词的搜索量突然飙升。推特使用其人类判定官确定这个词指的是正在谈论政府对公共广播进行资助的米特·罗姆尼(MittRomney),而不是“芝麻街”。为什么人类能够比机器更好地完成这一工作?因为我们比机器更了解这些暗喻的含义。
推特工程师在博客中解释道:“收到判定官的回应后,我们会将信息推送到后台系统,这样下次有用户搜索这一信息的时候,我们的机器就能够使用这一附加信息。”
随着企业投资开发更大更好的人工智能系统,对这类土耳其机器人工作的需求会不断增加。例如,据称2011年亚马逊的机械特克平台有“来自190个国家的超过500000名活跃工作者”。如今,这一数据可能变得更高。
土耳其机器人主要被诟病的是工作所得太少。即使是美国的土耳其机器人工作者每小时也只能赚1英镑左右,而且享受不到劳动保护和相关福利。这是因为人类从事的需要运用智能的任务尽管因其难度而让机器迷惑不已,但是以人类标准来看普遍是没有技术含量的,大多数人都能够熟练地完成这些工作。因此,全球能做这项工作的工人有很多,这就降低了成本。结果就是不止一位批判家曾经称之为“数码血汗工厂”。
这当然是对的,而且有些使当前的人工智能系统更加智能的工人根本得不到报酬。正如我们所知,目前许多成功的人工智能应用都依靠人类生成的数百万甚至数十亿数据。不成文的用户协议是,公司免费提供产品,前提是它们可以利用生成的数据做广告或使其人工智能系统更加智能。举例来说,就像我们之前提到的,谷歌的在线翻译服务看似是百分之百的机器智能,实际上,它是在人类用户提供的数据基础上工作的,它使用的单词和短语是人类在之前的翻译中就匹配好并且应用到所有文本中的。下次使用谷歌翻译的时候,你可以想一下这些土耳其机器人,它们的背后是经验丰富的人类译员,他们擅长不同语言,很多人都有博士学位。
与那些自愿报名参加土尔其机器人任务的人不同,这些译员永远不会收到报酬,也就是除了最初合同规定的工作之外的报酬。汉娜·吕岑(HannaLützen)将《哈利·波特》翻译成了丹麦语,因此她将收到挪威居伦达尔出版社的稿酬,而之后,如果谷歌使用这些加起来超过100万字的数据帮助你翻译一封来自女友的用丹麦语写的情书,谷歌不会给她一分钱。
这与现实世界中类似“取样”所涉及的法律问题不同。举例来说,在嘻哈文化中,音乐家们通常将其他人的作品分割开来再重新使用。如果这样做,他们必须为使用的部分支付费用。如果没能支付费用,对方可能提起法律诉讼。2006年法院判决美国嘻哈音乐人声名狼藉先生(NotoriousB.I.G.)的专辑《准备死去》(ReadytoDie)停止销售,因为专辑在没有获得适当许可的情况下引用了一首1972年的歌曲《清晨歌唱》(SingingintheMorning)。德国电子乐队“发电站”(Kraftwerk)在法庭上成功辩解称其音乐的最小片段(例如几小节鼓点)都受版权保护。
这与合法使用数据有什么关系呢?从某种意义上来说,我们每个人都是土耳其机器人,因为正是我们每天生成的数据使人工智能系统变得更加智能。无论是在Facebook上传照片还是输入验证码,我们都是在训练那些将接管我们工作的机器人。在不久的将来,我们需要就数据的价值展开一场严肃的对话。正如我们常说的,如果说数据是数字经济的原料,那么我们应当重视它。
虚拟现实领域的先驱杰伦·拉尼尔(JaronLanier)建议了一种方法,那就是使用一个通用的小额付款系统。拉尼尔举了几个例子。假设你报名参加了一个网上约会活动,你提供信息进行浪漫匹配,而公司会使用你的信息来完善其算法,进而吸引其他用户。Facebook可能会将你的照片放到广告里并将页面定向发送给你的朋友。另外一个例子就是,网飞公司(Netflix)可以使用你的浏览偏好来制作一部电视剧,就像在艾美奖上获奖的美剧《纸牌屋》一样,这部电视剧就是完全根据网飞公司的用户数据制作的。在这样的案例中,可以创建一个公式来确定数据的出处和这些数据对某些特定决策的重要性。这一计算要求公司对用户进行小额付款,就像有人引用音乐家的作品时需要支付版税一样。
这个想法听起来有些牵强,但是在过去的10年里,法律确实在追赶技术转移的步伐。欧盟针对谷歌的“被遗忘权”[2]这样的判例表明了法律仍在适应数字化新技术。在某种情况下,数据所有权的问题一定会经历详细审查。让我们回到音乐取样的例子中,早些时候,有很多违法取样的事件发生。后来,技术成为主流音乐的一部分,艺术家们突然发现自己因版权侵权面临着数百万美元的罚款。同样,人工智能带来的就业方式转变使土耳其机器人从事的这样的工作更加普遍,我们仍需探讨驱动人工智能系统的数据到底归谁所有。如果以正确的方式实施,这不仅能帮助个人,而且能够帮助企业。在21世纪,企业的实际价值是其持有的可分析数据。如果用户因提供数据而获得经济回报,那么他们使用产品时就更有动力。如果我们生成的所有数据都使用杰伦·拉尼尔提出的通用小额支付系统,可以想象,土耳其机器人每小时赚的薪水将从1英镑上涨到英国最低工资标准6.7英镑,甚至更高。这对创建一个数字框架来说是至关重要的一步,在这个框架中,人工智能系统将变得更加智能,但人类也可以共享创造的财富。
人工智能:改变世界,重建未来
专家系统04-12Ctrl+D收藏本站
关灯护眼小中大繁直达底部人工智能的另一项新应用成为人们解决问题的工具。尽管人工智能擅长推理,但研究人员都知道,人工智能并不只有推理。为了创造出能够在现实生活中解决问题的人工智能,科学家们认为,他们需要一台能够将推理和知识相结合的机器。例如,一台应用于神经系统科学的电脑必须像合格的神经系统科学家一样,了解该学科的相关概念、事实、表述、研究方法、模型、隐喻和其他方面。
这意味着程序员突然需要担负起“知识工程师”的重任,他们必须充当各领域专家的角色,并且将他们的知识提炼成计算机能够读取的规则,生成的程序被称为“专家系统”。该系统是在广泛收集概率性规则“如果……那么……”的基础上建立的。有人曾经使用名为“DENDRAL”的专家系统进行过尝试,这个程序能够帮助有机化学家确定未知的有机分子。DENDRAL的创造者爱德华·费根鲍姆(EdwardFeigenbaum)对最早记载人工智能历史的一位作家帕梅拉·麦考达克(PamelaMcCorduck)说道:“有一段时间,人工智能领域的其他人都与我们保持一定的距离。我想他们可能不敢靠近DENDRAL,因为它涉及化学。但是人们还是会毫不吝啬地发出惊奇的感叹,因为它就像是化学界的博士一样。”
另一个类似的项目名为“MYCIN”,用于为脑膜炎等严重感染状况提供合适的抗生素用药剂量。MYCIN像一个真正的医生一样,能够将程序员之前收集的概率性证据汇总起来,并据此得出结论。人们不断对之前的经验进行归纳,直到它们变得像下面的“规则”:
如果……需要治疗的感染是脑膜炎,感染类型为真菌感染,培养染剂上没有有机体,患者不是易感染病患并且曾经到过球孢子菌病盛行的地区,患者是黑种人、黄种人或印度人,并且脑髓液检测中的隐球菌抗原不是阳性,那么……隐球菌有50%的可能并非是造成感染的有机物之一。
这些概率规则本身并没有什么了不起。然而,如果达到数百条,通常就能够找到正确答案。DENDRAL和MYCIN都只是实验室的实验,并没有真正应用到现实世界。相比之下,名为“XCON”的专家系统则要成功得多。诞生于1978年的XCON并不像DENDRAL和MYCIN那样具有改变世界的雄心壮志。它既不能帮助科学家创立假设,也不能帮助医生治疗传染病,而是通过为客户选择正确的系统来协助工程师设置VAX超级计算机[4]。简而言之,XCON就是世界上最伟大的“百事通”店员。
XCON的出现使大企业首次对人工智能产生了兴趣,它们不再将人工智能简单视为未来演示。只要专家系统能够为它们赚钱,企业们并不在乎它们到底是真正的人工智能还是“巧妙的编程”。1980年,XCON在数字设备公司(DEC)位于新罕布什尔州塞勒姆的工厂首次投入使用。到1986年,XCON就已经处理了80000份订单,每年约为数字设备公司节约2500万美元,准确率高达95%—98%。人们开玩笑称,如果它能够娶了老板的女儿,未来甚至能够当上公司的首席执行官。
其他企业很快也开始公开露面,为需要专家系统的企业客户提供解决方案。在油井钻探作业中,地层倾角顾问(DipmeterAdvisor)能够对地质构造进行分析。著名的粮食市场顾问(GrainMarketingAdvisor)的目标是帮助农民进行恰当的营销,并储存粮食作物。1986年10月《电脑世界》(ComputerWorld)杂志上的一则广告做出了这样的问答:“你如何充分利用专家系统技术的优势让员工改进当前软件上现有的数据处理应用?只有Teknowledge公司能够给你答案。公司将在你所在的地区免费举行为期半天的研讨会。”
1985年,约有150家公司投资10亿美元想要开展人工智能业务。这一年,美国人工智能协会召开的一场会议和国际人工智能联合大会共吸引了近6000名参会者,其中一多半是风险投资家、猎头和媒体。1987年,并非电脑研究前沿阵地的《财富》杂志盛赞“软盘上的直播专家”的到来。研究人员在人工智能历史上首次变得和史蒂夫·乔布斯、比尔·盖茨等个人电脑界的新贵一样富有。
有趣的是,像马文·明斯基这样经验丰富的研究者却在回避这样的情况。我们往往以为,人工智能保守派在经历了20多年辛苦工作后一定急于寻求回报。而实际上,这些人都在提心吊胆地等待最后的结果。好在这并没有花费他们太多的时间。就像20世纪90年代后期投机性的互联网泡沫一样,倡导者们对专家系统能力的高估到了危险的程度。其中有一本教科书十分推崇“打电话规则”,称“使用专家系统打一通电话,家里的所有问题都能够在10—30分钟解决”。专家系统的基本概念是十分可靠的,但是仍存在一些问题。专家系统十分昂贵,需要不断更新,并且是反直觉的,当规则增多时准确率就会下降。斯图尔特·罗素(StuartRussell)和彼得·诺威格(PeterNorvig)在《人工智能:一种现代方法》(ArtificialIntelligence:AModernApproach)这本教科书中写道:“随着规则集的不断壮大,规则间的不良交互作用就会越来越平常,于是,从业人员发现,添加规则时,必须‘调整’其他规则的可信度。”
1987年财年结束时,两大开发专家系统的公司Teknowledge和Intellicorp损失了数百万美元。其他人工智能企业的情况更糟糕,几乎濒临破产,员工和公司高管们露宿街头。温暖了一阵之后,人工智能的第二个冬天到来了。