博舍

中国的自然语言处理领域的人工智能公司 全球20家最好的人工智能企业是哪些公司

中国的自然语言处理领域的人工智能公司

中国的自然语言处理领域的人工智能公司

2018-08-17eNet&Ciweek/轩中

自然语言处理领域的代表性公司排名企业综述1微软亚洲研究院近些年在人工智能领域,尤其是自然语义理解、计算机视觉等方面取得了不菲的成绩。它是人工智能领域的“黄浦军校”2搜狗利用数据挖掘、自然语言处理技术实现搜狗输入法3科大讯飞一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业4腾讯2017年在西雅图成立人工智能实验室,其人工智能实验室副主任俞栋博士是前微软研究院语音识别专家5华为2016年在香港成立诺亚方舟人工智能实验室,该实验室有一个部门专注于以无缝的方式和自然语言让机器与人沟通6阿里巴巴2018年,阿里巴巴达摩院机器智能实验室开源了新一代语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%7云知声语音识别领域的初创公司,在平台及行业领域,云知声已经与科大讯飞构成了直接竞争8思必驰思必驰对话工场是提供语音识别、语音合成、语义理解、智能对话以及声纹识别服务的开放平台9出门问问出门问问语音助手APP是一款基于语音识别、语义理解技术,面向移动搜索领域的智能手机应用。用户只需通过语音用口语化的提问方式就可以搜索出有关于吃穿住行的服务。10达观数据国内唯一一家将自动语义分析技术应用于企业数据化运营的人工智能公司。11北京紫平方公司拥有自主研发的专业级人工智能深度学习平台,在自然语言(NLP)处理领域处于业界领先水平12追一科技主攻深度学习和自然语言处理,通过将人工智能与企业场景深度结合,帮助企业构建人企交互智能化解决方案。13玻森数据一家中文自然语言分析云服务提供商,旗下有中文语义开放平台BosonNLP等14武汉烽火普天专注于互联网大数据语义分析云服务的公司15北京嘿哈科技全球第一家将最先进的体感技术、语音识别技术等运用在幼儿教育领域的教育软件开发公司16拓尔斯基于大数据、云服务和人工智能技术,推出网络舆情分析平台17智言科技一家专注于深度学习和文本语义理解技术突破的人工智能公司18明略数据一直深入大数据挖掘,致力于用领先科技成就客户价值,从大数据到人工智能都有很深的技术积累19今日头条通过自然语言处理技术,对分发的内容进行分类、筛选20苏州驰声信息由国内知名的语音技术提供商思必驰原口语教育事业部于2014年6月1日剥离成立的公司2018《互联网周刊》&eNet研究院选择排行

龙泉寺以前并不太出名,它坐落在北京西山凤凰岭山脚下,始建于辽朝应历初年。寺庙山门前有两棵遒劲的翠柏拔地而起,据说已经有600多岁,走进寺内,可以看到粗壮挺拔的古银杏树,据说也已经1000多岁。

这里隐居着一批世外高人,他们发明了一个会说话的机器僧人“贤二”。

如果你问贤二:“贤二,我心情不好怎么办呢?”

贤二可能会说:“试着读一些好书吧。”

贤二是全球首个人工智能“出家人”。身高60厘米,穿着黄色僧袍,特长是诵经、对话,甚至还会唱歌,尤其难能可贵的是他还会卖萌。

贤二为什么能与人对话呢?原来,它应用了最新的人工智能自然语言处理技术。

什么是自然语言处理?

正如哥德巴赫猜想是数论皇冠上的明珠,微软创始人比尔·盖茨曾经如是说,“自然语言理解是人工智能领域皇冠上的明珠”。

比尔·盖茨所说的自然语言理解是自然语言处理的一个重要组成部分。自然语言处理的英文是NaturalLanguageProcessing,一般被简写为NLP,它实际上包括了三个方面:语音识别、自然语言理解与语音合成(有一些人把语音识别作为自然语言处理之外的技术,在本文中,我们将语音识别也包含在自然语言处理的技术范畴之内)。

霍金不会说话,但英特尔公司给他定制的电脑轮椅可以帮他说话,这背后所利用的技术就是语音合成技术。语音合成技术可以把文本信息转化为语音信息。当然了,霍金的电脑轮椅设备是没有人工智能的(也就是说语音合成并不一定是人工智能,关键还是要看机器背后的算法)。

科学家们已经可以让电脑像人那样自主说话,这个时候电脑就具有人工智能的语音合成。比如微软小冰,比如“贤二”机器人和尚,这些会说话的机器人都具有人工智能。前面已经说过,自然语言处理包括了三个方面:语音识别、自然语言理解与语音合成。这三方面分别解决了三个问题:听清楚别人在说什么,理解别人说的意思,根据听到的与理解到的对话内容回答别人的问题。

自然语言处理是工业界与学术界都关注的人工智能领域,这一领域的突破性发展与深度学习算法的成熟有直接的关系。加拿大多伦多大学的辛顿是深度学习的先驱,他和学生于2006年发表在《科学》上的文章提出了降维与逐层预训练的方法,这使得深度学习成为可能。2009年,微软亚洲研究院的邓力小组开始与辛顿合作,用深度学习加上隐马尔科夫链模型开发了实用的语音识别与同声翻译系统。

从学术界来说,中国大陆地区除了微软亚洲研究院,还有哪些研究机构设置了自然语言处理的实验室呢?据《互联网周刊》了解,清华大学自然语言处理与社会人文计算实验室、北京大学计算机科学技术研究所语言计算与互联网挖掘研究室、哈工大机器智能技术与自然语言处理实验室、中科院自动化研究所语音语言技术研究组、南京大学自然语言处理研究组、复旦大学自然语言处理研究组等都对自然语言处理有深入的研究。

一般来讲,自然语言处理的步骤主要分为6步:1、获取原始文本;2、对文本进行预处理;3、分词:将文章按词组分开;4、词法分析:对名词、动词、形容词、副词、介词进行定性;5、语法分析:分析主语、谓语、宾语、定语、状语、补语等句子元素;6、语义分析:将句子的正确含义表达出来。

自然语言处理的发展历史

20世纪的80年代,自然语言处理的语音识别方面开始取得了突破性的进展,当时以李开复为代表的人工智能科学家摒弃了符号主义学派的方法,选择用统计模型来破解语音识别的难题,将语音识别的准确率提高到了一个全新的高度。但当时这个方法离真正的实用化还是有很远的距离。因此,在当时并没有诞生出擅长对话的机器人。

于是,科学家开始发展新的自然语言处理的算法。这里面包括Word2vec、CRF、LDA,LSA、SVD等。2010年以后,一种更加有效的人工智能算法——深度神经网络重新打造了语音识别的算法框架。在这个过程中,以科大讯飞为代表的语音识别公司开始崛起,其开发的语音识别产品已经开始进入实用化的阶段。

2013年,谷歌的语音识别系统对英语单词的识别错误率已经下降到23%左右。到了2015年,谷歌的语音识别系统再次刷新了记录,利用深度学习神经网络,它们将单词的识别错误率下降到了8%。

在这个过程中,微软也不甘落后,在2016年,微软的语音识别系统成功地将单词识别错误率下降到了6.3%。

到了今天,语音识别技术作为自然语言处理的一个侧面已经非常成熟。比如科大讯飞的语音输入法可以帮助我们在一分钟内完成400个汉字的输入。人工智能在自然语言处理上已经开始实现产业化落地,成为真正能对人们的日常生产与生活产生价值的新工具。

自然语言处理的龙头企业

科大讯飞创办于1999年,目前已经成为中国最有名的自然语言处理的龙头企业,它于2008年成为中国人工智能语音产业界的第一家上市公司。在2016年阿尔法狗打败李世石之后掀起的人工智能热潮中,科大讯飞的股价也是水涨船高,得到了资本市场的疯狂追捧。2017年,随着资本大量涌入与相关科技政策的不断加持,科大讯飞股价一度创下历史新高74.76元/股,市值突破千亿大关。

但是,看起来如此幸运的科大讯飞,在成立的最初几年里,也面临前所未有的运营压力。科大讯飞的相关领导曾经这样描述当年的困境:“我们刚开始创业的时候是挺难的,没有钱,没有市场,也没有资源背景,所以是很难的草根创业。最开始大家租了个房,没白天没黑夜地干。最困难的时候是什么呢?快过年了,发不出工资,只能以个人的名义去借钱渡过难关。公司从成立到盈亏平衡我们用了5年的时间,这五年我们天天在投入,却不见产出。”由此可见,作为人工智能时代的弄潮儿,科大讯飞能有今天的辉煌,离不开当年的艰苦付出。要理解这一段历史,其实还需要理解自然语言处理背后的人工智能算法的发展过程。其实在科大讯飞的早年岁月,人工智能自然语言处理的算法并不成熟。从这个意义上来说,科大讯飞是一个早产儿。只有到了2006年,深度学习的创始人杰弗里.辛顿及合作者发表了一个里程碑的文章《一种深度置信网络的快速学习算法》以后,这一论文宣告了深度学习时代的真正来临。只有在深度学习算法的指引下,人工智能才真正进入了实用化阶段。因此,2006年是人工智能发展的分水岭。从这个意义上来说,1999年就成立的科大讯飞出生的太早了。

科大讯飞在漫长的时间赛道上长跑,通过自主研发不断更新技术。从国际上来看,根据ResearchandMarkets报告,在全球语音市场,谷歌、微软、苹果和科大讯飞是“四大高手”。它们在全球市场份额分别为20.7%、13.4%、12.9%和6.7%,从这个意义上来说,科大讯飞在自然语言处理上的专项能力是非常杰出的,确实已经超越了国内的其他大公司。

在终端消费者应用方面,科大讯飞的财报显示,目前讯飞输入法总用户发展至5.6亿;讯飞翻译机销售近数十万台,用户已在覆盖全球130个国家。

中国还有哪些自然语言处理的代表性公司?

自然语言处理的应用前景相当广泛,它可以进行很多工作,比如机器翻译,典型的机器翻译有百度翻译、谷歌翻译等。自然语言处理还可以用到信息检索和过滤,比如在大流量的信息中寻找关键词,在网络瞬时检查敏感文字信息。

形形色色的应用造就了形形色色的企业,《互联网周刊》整理了自然语言处理领域的代表性公司。

目前,专注于自然语言处理的公司相当多,外国大公司有谷歌、苹果等,在国内也涌现了科大讯飞、百度、云知声与思必驰等著名企业。而且这些企业都有学院派的背景,比如在苏州的思必驰的创始人俞凯本身就是英国剑桥大学的博士,后来成为上海交通大学的教授,他的研究团队里就有很多来自上海交通大学的博士生。在俞凯教授的推动下,思必驰与上海交通大学成立了SpeechLab联合语音实验室,侧重前沿语音技术的研发及转化,取得较多技术成果,例如,他们推出的VDCNN抗噪算法模型,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率,相比于世界其他机构目前10%左右的最好结果,有一个大幅度的提高;而他们开发的PSD新型解码框架则使语音识别系统的速度累积提高20-30倍,内存下降50%以上。产学研一体化模式,为思必驰进一步拓展市场起到了极大作用。目前的自然语言处理的公司很多都与高校结盟进行创新发展,虽然有高等学校的智力支持,但中文语言的处理比起西方语言更加难以处理。其中最令人费解的是多语义现象。比如假设在两场篮球比赛中,中国队都打败了美国队。在中文报道中可以分别使用“中国队大胜美国队”、“中国队大败美国队”来作为标题。这其实是同一个意思,但人工智能自然语言处理则很容易把这个语义分析错。

再举一个例子,比如“今天下雨路滑,我骑车差点翻倒,幸亏我一把把把把住了”。在这句话中,出现了很多“把”字,人工智能如果不了解其中有一个“把”字是“车把”的意思,也是很难理解这句话的。

因此,在自然语言处理方面,还有许多的问题需要解决,比如训练数据的缺乏、成语俗语方言的精确处理。而在这里,其实算法还是最关键的。但是,技术的进步是不可阻挡的滚滚潮流,中国在这方面已经做得相当不错。科大讯飞的董事长刘庆峰认为,科大迅飞在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等智能语音与人工智能核心技术上已经达到了国际最高水平。

将来随着自然语言处理技术越来越成熟,计算机能够更加正确理解人类的语言,相关的人工智能产品将不断落地,像“贤二和尚”这样的聊天机器人一定会变得越来越智能。

 

相关频道:eNews排行

您对本文或本站有任何意见,请在下方提交,谢谢!

投稿信箱:tougao@enet16.com

人工智能如何影响五大科技巨头还有哪些公司会成为赢家

·苹果的策略:聪明的公司试图将其产品的补充品商品化;亚马逊的前景将取决于若干因素;人工智能对Meta来说是一个巨大的机会;谷歌和人工智能的关系让人想起柯达的商业模式导致其最终厄运;微软似乎处于最有利的位置。

·从新公司的角度来看,OpenAI显然是最有意思的:有可能成为所有其他人工智能公司的平台。最大的赢家也可能是英伟达和台积电。

【编者按】2022年,聊天机器人ChatGPT、AI创作机器人DALL-E、MidJourney的爆火,对传统互联网的模式发出了挑战。这个时代的赢家、科技界五大巨头——微软、苹果、Meta、亚马逊、谷歌,仍将是人工智能时代最值得关注的公司。一方面,维持性技术的发展会确保其现有地位,让它们的产品、服务不断迭代,另一方面,被称作破坏性创新或者颠覆性技术的新影响,也将迫使巨头们重新思考自己的商业模式,以及如何在人工智能时代继续成为领导者。

云计算和人工智能技术将成为新时代的主旋律,广告业务和推荐算法将是各个巨头的“护城河”。无论是日渐臃肿的谷歌搜索、市值蒸发的Meta,还是与OpenAI加深合作的微软,这些巨头正处在不同的位置上,但可以预见的是,它们终将以自己的方式强势入场、决出胜负。这五家公司的未来如何?人工智能又将产生怎样的影响?著名科技博客Stratechery的作者BenThompson于1月9日发表文章《人工智能与五巨头》,对此做出了深度剖析。以下为全文,有少量删减。

人工智能的涌现是2022年发生的故事,首先是图像生成模型,包括DALL-E、MidJourney和开源的StableDiffusion,然后是ChatGPT,这是第一个取得重大突破的文本生成模型。在我看来,这明显是一个科技发展的新时代。

为了预测这个时代的发展,我们不妨回顾一下26年前最著名的战略书籍:Clayton Christensen的《创新者的困境》(TheInnovator’sDilemma),特别是这段关于不同类型创新的文字:

大多数新技术促进了产品性能的提高。我把这些技术称为维持性技术。一些维持性技术可能是不连续或激进的,而其他技术则是渐进性的。所有维持性技术的共同点是,它们沿着主要市场的主流客户历来重视的性能维度改善现有产品的性能。某一行业的大多数技术进步都具有维持性的特点。

但颠覆性技术为市场带来了与以往截然不同的价值主张。一般来说,颠覆性技术在主流市场上的表现不如成熟产品。但它们有一些边缘(一般是新)客户看重的其他特点。基于颠覆性技术的产品通常更便宜,更简单,更小,而且经常使用起来更方便。

通过观察创新进入市场现有公司后的表现,似乎很容易总结,并确定一项创新是维持性的还是颠覆性的:如果创新是维持性的,那么现有的巨头会变得更强大;如果是颠覆性的,那么初创公司会抓住大部分的价值。

看看以前的科技时代:

·个人电脑对几乎所有现有公司都是颠覆性的;这些相对便宜和低功率的设备曾经几乎没有微型计算机的能力和利润率,更不用说大型机了。这就是为什么IBM愿意将最初的个人电脑的芯片和操作系统分别外包给英特尔和微软,这样他们就可以推出产品去满足企业客户;不过,随着个人电脑的速度越来越快,英特尔和微软占据了主导地位,让之前的一切都相形见绌。

·互联网几乎完全是新的市场创新,因此由全新的公司来定义。它们颠覆现有公司时,也颠覆了远离技术的行业,特别是涉及信息的行业(即媒体)。这是谷歌、Facebook、在线市场和电子商务的时代。所有的应用都运行在由Windows和英特尔驱动的个人电脑上。

·云计算可以说是互联网的一部分,但我认为它应该有自己的类别。它也是极具颠覆性的:x86架构横扫了专用服务器硬件,一大批SaaS(编者注:软件即服务)初创企业从现有的公司中剥离出功能来建立新公司。值得注意的是,云计算的核心基础设施主要是由以前时代的赢家建造:亚马逊、微软和谷歌。微软尤其值得注意,因为该公司也将其传统的软件业务过渡到SaaS服务,部分原因是该公司已经将上述软件业务过渡到订阅模式。

·移动业务最终被两个在位者所主导:苹果和谷歌。但这并不意味着它不是颠覆性的。苹果公司新的用户界面形式要求不把手机看作是小型个人电脑,就像微软一样;谷歌公司新的商业模式要求不把手机看作是操作系统销售的直接利润中心,而是作为他们广告业务的护城河。

这段历史值得注意的是,我上面所说的假设并不完全正确。颠覆性创新确实一直来自于市场的新进入者,但这些新进入者不一定是初创企业:在以前的科技时代,一些最大的赢家是利用其现有业务进入新领域的公司。同时,Christensen的理论的其他原则也是成立的。微软在移动领域挣扎,因为移动领域是颠覆性的,但SaaS最终是维持性的,它的商业模式已经被调整。

鉴于现有公司在新时代的成功,在思考人工智能的影响时,最明显的起跑点是五大公司:苹果、亚马逊、Facebook、谷歌和微软。

苹果公司

我已经提到了关于科技战略的最著名书籍之一,而最著名的文章之一是JoelSpolsky的《战略信条五》,特别是这句著名的话:

聪明的公司试图将其产品的补充品商品化。

Spolsky是在解释为什么大公司会投资开源软件时写下这句话的:

调试代码不是免费的,无论专有还是开源。即使你不为它支付现金,它也有机会成本,也有时间成本。可用于开源工作的志愿者编程人才是有限的,每个开源项目都在与其他开源项目竞争同样有限的编程资源,只有最引人注目的项目才真正拥有更多可供使用的志愿者开发人员。总而言之,我对那些试图证明免费软件有巨大经济性的人不感兴趣,因为在我看来,他们只是在进行用一个数除以0的错误。

开源不能不受万有引力或经济规律约束。我们在Eazel、ArsDigita、VALinux和其他许多项目中看到了这一点。但有些事情仍在发生,而在开源世界中很少有人真正理解这样一个道理:许多非常大的上市公司,为使股东价值最大化,正在投入大量资金支持开源软件,通常是通过雇佣大量的程序员团队来开发。而这就是补充品原则所解释的。

再次强调:当一个产品的补充品价格下降时,对该产品的需求就会增加。一般来说,一个公司的战略利益将是尽可能降低其补充品的价格。理论上可持续的最低价格是“商品价格”,即当你有一群竞争对手提供无差别的商品时产生的价格。因此,聪明的公司试图将其产品的补充品商品化。如果你能做到这一点,你的产品的需求将增加,你将能够收取更多的费用,赚取更多的利润。

苹果投资于开源技术,最引人注目的是其操作系统的达尔文内核和WebKit浏览器引擎;后者符合 Spolsky的处方,因为确保网络与苹果设备配合良好,会使苹果的设备更具价值。

与此同时,苹果在人工智能方面的努力在很大程度上是其专有的:传统的机器学习模型被用于推荐、照片识别和语音识别等方面,但这些不会对苹果的业务产生重大推动。然而,苹果确实从开源世界收到了一份令人难以置信的礼物:StableDiffusion模型。

StableDiffusion之所以引人注目,不仅仅因为它是开源的,还因为它的模型小得令人吃惊:发布时,它已经可以在一些消费级显卡上运行;几周内,它已经被优化到可以在iPhone上运行。

值得称赞的是,苹果公司抓住了这个机会,其机器学习团队上个月宣布:

今天,我们很高兴在macOS13.1和iOS16.2中发布CoreML的StableDiffusion优化,以及开始部署到AppleSilicon设备的代码……

在任何应用程序中,StableDiffusion的一个关键问题是模型在哪里运行。在应用程序中部署StableDiffusion比基于服务器的方法更可取,原因有很多。首先,用户的隐私会受到保护,因为用户作为模型输入提供的任何数据都保存在用户的设备上。其次,在初始下载后,用户不需要连接互联网就可以使用该模型。最后,在本地部署这个模型使开发人员能够减少或消除与服务器相关的成本……

优化CoreML的StableDiffusion和简化模型转换,使开发人员更容易以保护隐私和经济可行的方式,将这项技术整合到他们的应用程序中,同时在AppleSilicon上获得最佳性能。该版本包括一个Python软件包,用于使用diffusers和coremltools将StableDiffusion模型从PyTorch转换为CoreML,以及一个Swift包来部署模型。

值得注意的是,这一宣布分为两部分:首先,苹果对StableDiffusion模型本身进行了优化(它可以这样做,因为是开源的);其次,苹果更新了其操作系统,由于苹果的集成模型,该系统已经针对苹果自己的芯片进行了调整。

此外,似乎可以肯定这只是一个开始:虽然苹果多年来一直在自己的芯片上发布所谓的“仿生引擎”,但人工智能专用硬件是根据苹果自己的需求调整的。似乎未来的苹果芯片,如果不是今年,也可能是明年,将会为StableDiffusion调整。与此同时,StableDiffusion本身可以内置到苹果的操作系统中,任何应用程序开发者都可以轻松访问API。

这使得“足够好”的图像生成功能可以有效地内置到苹果设备中,因此任何开发者都可以使用,而不需要像病毒式传播的Lensa(编者注:最近流行的人工智能图像生成App)那样扩大后端基础设施。推而广之,这个时代的赢家最终很像AppStore时代的赢家:苹果之所以获胜,是因为它的集成和芯片优势被用来提供差异化的应用程序,而小型独立应用程序制造商拥有API和分销渠道来建立新的业务。

另一方面,输家将是Dall-E或MidJourney等集中式图像生成服务,以及支撑它们的云提供商(到目前为止,还支撑了前面提到的StableDiffusion应用程序,如Lensa)。诚然,苹果设备上的StableDiffusion不会占领整个市场——至少在我看来,Dall-E和MidJourney都比StableDiffusion“更好”。苹果内置的本地功能将影响集中式服务和集中式计算的最终目标市场,当然,苹果设备之外还有一个大世界。

亚马逊

亚马逊和苹果一样,在其应用程序中使用机器学习;不过,像图像和文本生成这样的直接消费者用例似乎不太明显。目前最重要的是AWS(编者注:亚马逊的云服务AmazonWebServices),它在云端提供对GPU(编者注:图形处理器)的访问。

其中一些GPU被用于训练人工智能,包括StableDiffusion。据Stability AI的创始人兼首席执行官EmadMostaque说,StableDiffusion使用256个英伟达A100显卡训练,耗时15万小时,市场价格为60万美元。不过,AWS更大的应用是推理,即实际应用模型来产生图像(或文本,例如ChatGPT)。每次你在MidJourney中生成图像,或在Lensa中生成头像时,推理都会在云端的GPU上运行。

亚马逊在这一领域的前景将取决于若干因素。首先,也是最明显的,就是这些产品最终在现实世界中的实用性如何。然而,除此之外,苹果在建立本地生成技术方面的进展可能也会产生重大影响。不过亚马逊本身就是一个芯片制造商:虽然它迄今为止的大部分努力都集中在其GravitonCPU上,但该公司可以为StableDiffusion等模型建立自己的专用硬件,并在价格上竞争。

亚马逊短期的一个大问题是在衡量需求方面:没有足够的GPU会让资金闲置,而购买太多闲置的GPU,对于一家试图限制成本的公司来说却是一项重大成本。但这也不会是最严重的错误:人工智能的挑战之一就是推理要花钱,换句话说,用人工智能做东西本就有边际成本。

我怀疑,就开发引人注目的人工智能产品而言,边际成本问题是一个被低估的挑战。虽然云服务一直都有成本,但人工智能生成的离散性可能会导致难以提供资金,以实现产品与市场契合所需的迭代。

尽管如此,随着时间的推移,这些成本应该会下降:即芯片本身变得更快、更有效,模型也会变得更有效,而且一旦市场上有足够的产品可以最大限度地利用其投资,云服务就会得到有规模的回报。不过,除了上述在本地运行推理的可能性之外,全栈集成会带来多大的变化仍是一个开放的问题。

Meta

我在《Meta的神话》一文中已经详细说明了,为什么我认为人工智能对Meta来说是一个巨大的机会,值得该公司进行巨额资本支出:

Meta拥有庞大的数据中心,但这些数据中心主要是关于CPU计算的,这是驱动Meta的服务所需要的。CPU计算也是驱动Meta的确定性广告模型(deterministicadmodel)以及推荐算法所需要的。

不过,ATT(编者注:苹果推出的应用程序跟踪透明度功能,用于管理开发者对用户的广告跟踪,对Meta的广告收入造成巨大影响)的长期解决方案是建立概率模型,不仅要弄清楚谁应该成为广告目标,还要了解哪些广告转化了,哪些没有。这些概率模型将由大规模的GPU舰队建立,就英伟达的A100显卡而言,其成本为五位数。在一个确定性广告就能发挥作用的世界里,这显得太昂贵了,但Meta似乎不再属于那个世界,不投资于更好的目标定位和算法是愚蠢的。

此外,同样的方法对Reels(编者注:Instagram于2020年8月推出的一种视频形式)的持续增长至关重要:从整个网络中推荐内容比只从你的朋友和家人那里推荐内容要困难得多,特别是Meta计划不仅推荐视频,还推荐所有类型的媒体,并将其与你关心的内容穿插在一起。在这里,人工智能模型也将是关键,而建立这些模型的设备同样需要大量资金。

不过,从长远来看,这项投资应该得到回报。首先,好处有我刚才描述的,更好的目标定位和更好的算法推荐,可能重新启动Meta的收入增长。第二,一旦这些人工智能数据中心建成,维护和升级它们的成本应该大大低于建造它们的初始成本。第三,这种大规模投资是其他公司无法做到的,除了谷歌(而且,并非巧合的是,谷歌的资本支出也将上升)。

最后一点可能是最重要的:ATT对Meta的伤害比其他任何公司都大,因为它已经拥有迄今为止最大、最精细的广告业务,但从长远来看,它应该会促使Meta加深护城河。对于Snap、Twitter或任何其他数字广告领域的同行者,这种水平的投资根本不可行(即使Snap依赖云提供商而不是自己的数据中心)。

让Meta的人工智能发挥作用,将不是简单地建立基础模型,而是不断根据个人用户进行调整,这将需要巨大的算力,Meta必须弄清楚如何低成本地进行这种内容定制。不过,Meta的产品可能会越来越具有整合性,这一点很有帮助:虽然Meta可能已经承诺为其VR头盔装配高通的芯片,但Meta仍在开发自己的服务器芯片;该公司还发布了提取英伟达和AMD芯片的工具,以满足其工作负载,但Meta似乎也在开发自己的人工智能芯片。

有趣的是,从长远来看图像和文本生成如何影响Meta:SamLessin(编者注:科技创业者、撰稿人)已经假设,算法时间线的终点就是人工智能内容。而在谈到元宇宙时,我也提出了同样的观点。换句话说,虽然Meta正在投资人工智能以提供个性化的内容推荐,但这个想法与2022年的突破相结合,就是个性化的内容,通过Meta的渠道传递。

看Meta的广告工具如何发展也将会很有趣:生成、A/B测试副本和图像的整个过程都可以由人工智能完成,没有哪家公司比Meta更擅长大规模提供这种功能。

谷歌

《创新者的困境》于1997年出版。那一年,伊士曼柯达的股票达到了94.25美元的最高价,而这似乎是有原因的。就技术而言,柯达公司处于完美的位置。该公司不仅主导了当前的胶片技术,而且还发明了下一个浪潮:数码相机。

问题要归咎于商业模式:柯达通过提供卤化银胶片赚了很多钱,利润率非常高;但另一方面,数码相机是数字的,这意味着它们根本不需要胶片。因此,柯达的管理层非常有动力说服自己,数码相机永远只适合业余爱好者,而且它们得变得非常便宜,这肯定需要很长的时间。

事实上,柯达的管理层是对的:从数码相机的发明到销售额超过胶片相机,花了25年;而数码相机在专业领域的应用,则花了更长时间。在此期间,柯达赚了很多钱,并派发了数十亿美元的股息。但该公司在2012年破产,这是因为消费者有机会获得更好的产品:首先是数码相机,然后是内置相机的手机。

柯达是一个警示故事,讲述了一家创新公司的商业模式如何导致它最终的厄运,即使这种厄运是消费者得到更好东西的结果。

由此再看谷歌和人工智能:谷歌发明了thetransformer,这是支撑最新人工智能模型的关键技术。据传闻,谷歌有一款对话聊天产品,远远优于ChatGPT。谷歌声称其图像生成能力比Dall-E或市场上的任何其他产品都要好。然而,这些传闻只是传闻而已,因为市场上没有任何实际产品。

这并不令人惊讶。长期以来,谷歌一直是使用机器学习使搜索引擎和其他产品变得更好的领导者(并通过谷歌云将该技术作为一项服务提供)。然而,搜索引擎一直依赖于人类作为最终的决定者。谷歌提供链接,但由用户通过点击来决定哪一个。这延伸到了广告:谷歌的服务是革命性的,因为它没有就展示次数向广告商收费——其价值很难确定,特别是在20年前——而是对点击收费,广告商想找到的人,才能决定广告是否足够好。

七年前,我在《谷歌和战略的局限性》一文中写到了,这对谷歌在人工智能世界中的业务带来的难题:

在昨天的主题演讲中,谷歌首席执行官SundarPichai在回顾科技历史,强调我2014年底所描述的个人电脑-网络-移动时代后宣布,我们正在从移动优先的世界转向人工智能优先的世界,这就是引入谷歌助理的背景。

发布iOS6的前一年,苹果首次以Siri引入了语音助手的概念;你可以(理论上)第一次通过语音进行计算。起初它的效果并不好(可以说现在也是如此),但它对计算机和谷歌的具体影响是深远的:语音交互扩大了可以进行计算的地方,从你可以把眼睛和手放在设备上的情况扩展到任何有效的地方,即使它限制了你可以做什么。语音助手必须比搜索结果页面更加积极主动;仅仅提供可能的答案是不够的,相反,需要给出正确的答案。

这对谷歌的技术来说是一个可喜的转变;从一开始,搜索引擎就包含了一个“手气不错”按钮,谷歌创始人拉里·佩奇(LarryPage)非常自信,认为搜索引擎可以为你提供想要的准确结果。尽管昨天的谷歌助理演示被取消,但目前来看,尤其是在上下文感知方面,其远比市场上的其他助理令人印象深刻。更广泛地说,很少有人质疑谷歌在其助理背后的人工智能和机器学习领域是否具有领先地位。

然而,一项业务不仅仅是技术,尤其是在语音助手方面,谷歌有两个重大缺陷。首先,正如我在今年谷歌I/O大会之后所说的,该公司有一个走向市场的缺口:语音助理只有在可用的情况下才有意义,对于数亿iOS用户来说,这意味着还得下载并使用一个单独的应用程序(或建立一种用户愿意花费大量时间的体验,就像Facebook一样)。

其次,谷歌有一个商业模式问题:“手气不错”按钮让搜索不会给谷歌带来任何收益。毕竟,如果用户不必从搜索结果中进行选择,那么该用户也没有机会点击广告,从而选择谷歌为其广告商之间创建的用户注意力竞争的获胜者。谷歌助理也有完全相同的问题:广告去哪儿了?

在过去七年中,谷歌的主要商业模式创新是将越来越多的广告塞进搜索中,这是一种在移动设备上特别有效的策略。而且,公平地说,谷歌挣钱最多的搜索——旅游、保险等——可能无论如何都不太适合聊天界面。

然而,这只会增加谷歌管理层的担忧,即在特定的搜索环境中,生成型人工智能可能代表一种颠覆性的创新,而不是一种维持性的创新。颠覆性创新,至少在一开始,不如现有的创新。这就是为什么它很容易被经理们驳回,因为他们可以告诉自己目前的产品更好,以避免思考商业模式的挑战。当然,问题是颠覆性的产品会变得更好,但在任者的产品变得越来越臃肿和难以使用,这听起来当然很像谷歌搜索目前的发展轨迹。

我不为谷歌打call。我以前这样做过,但大错特错。然而,犯错往往是时间问题:是的,谷歌已经有云服务,YouTube的主导地位似乎正在增强,但搜索引擎的瓶颈似乎已经很清晰,即使它会在未来几年带来现金和利润。

微软

与此同时,微软似乎处于最有利的位置。和AWS一样,它也有销售GPU的云服务;它也是OpenAI的独家云提供商。是的,这是非常昂贵的,但考虑到OpenAI似乎有优势成为人工智能时代的另一个顶级科技公司,这意味着微软是在投资那个时代的基础设施。

必应(Bing)就像iPhone诞生前夕的Mac:是的,它贡献了相当多的收入,但只占主导地位的一小部分,在微软整体的背景下,这一数字相对微不足道。如果将ChatGPT式的结果整合到必应中,可能会危及当前的商业模式,而获得巨大的市场份额,但这是一个非常值得的赌注。

TheInformation的最新报道称,GPT最终将进入微软的生产力应用程序。

重要的是,增加新功能——也许是收费的——完全符合微软的订阅业务模式。值得注意的是,这家曾经被认为是颠覆性变革受害者典型代表的公司,在完整的叙述中,将不仅仅是诞生于颠覆,而是因为颠覆而有条件达到更高的高度。

关于人工智能的潜在影响还有很多可以写,但这篇文章已经很长了。从新公司的角度来看,OpenAI显然是最有意思的:OpenAI有可能成为所有其他人工智能公司的平台,这最终意味着在OpenAI之外的人工智能的经济价值可能相当有限。

还有另一种可能性,即除了图像生成之外,开源模型在文本生成领域也会激增。在这个世界里,人工智能变成了一种商品:这可能是对世界影响最大的结果,但矛盾的是,对单个公司的经济影响是最微弱的。

事实上,最大的赢家可能是英伟达和台积电。英伟达对CUDA生态系统的投资意味着该公司不仅拥有最好的人工智能芯片,而且拥有最好的人工智能生态系统,该公司正在投资扩大这一生态系统。不过,这将继续刺激竞争,特别是在谷歌TPU等内部芯片方面。此外,至少在可预见的未来,所有人都将在台积电制造芯片。

然而,最大的影响可能完全不在我们的雷达范围内。就在休息之前,NatFriedman(编者注:GitHub首席执行官)在Stratechery采访中告诉我,Riffusion使用StableDiffusion通过视觉超声波从文本中生成音乐,这让我想知道当图像真的是一种商品时,还有什么可能性。现在文本是通用的媒介,因为自书写发明以来,文本一直是信息传递的基础。然而,人类是视觉生物,人工智能在图像创作和解释方面的可用性可能会从根本上改变信息传递的含义,这是无法预测的。

目前,我们的预测必须有更多的时间限制,而且是适度的。现在可能是人工智能时代的开始,但即使在科技领域,新时代也需要十年或更长时间才能改变周围的一切。

(本文由吴天一编译)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇