博舍

一线|百度发布文心一言,李彦宏在发布会都讲了些什么 百度文心一言用的什么芯片

一线|百度发布文心一言,李彦宏在发布会都讲了些什么

腾讯新闻《潜望》刘雨点3月16日发自北京

3月16日下午2点,百度在北京总部举办新闻发布会,发布他们的AI生成式产品文心一言。这是继OpenAI发布ChatGPT后,中国第一款生成式语言大模型产品。

李彦宏作为第一个演讲嘉宾,一上来就讲述很多人问他为什么百度要在现在发布?

他称,百度在过去十几年一直在人工智能投入,文心大模型在2019年已首次发布,后来每年都有迭代。当然现在大家的期望值是对标ChatGPT甚至是GPT-4,期望值非常高,具有挑战性。

随后他说,他在内测过程当中,体验到的文心一言的能力不能叫做完美,但为什么发布?因为有市场需求——包括百度各个产品线,大家都在等着在用这样的技术;更重要的是,客户、合作伙伴在等着用这样的技术。同时,大语言模型一旦发布,就会获得真实用户反馈,而有了用户反馈,迭代速度就会很快。

接着,李彦宏开始展示文心一言。他展示了5方面能力,分别是文学创作、商业文案、数理逻辑推算、中文理解和多模态的生成。

比如,在展示第一项能力时,视频中,工程师向文心一言提出了《三体》的作者是哪里人?总结一下《三体》的核心内容?如果续写的话怎么写?如何从哲学角度进行续写?电视剧《三体》的演员都有哪些?等问题并得到回答。

但展示过程是提前录制好的,没有现场的体验。

李彦宏表示,文心一言现在可以处理英文,但是要承认对英文的处理能力没有中文好。因为训练数据中,英文数据没有那么多,接下来会逐步训练英文和其他语言。

他说,文心一言目前没有向所有受众开放。发布会后现场观众可以拿到邀请码,体验文心一言的自然语言能力、表达能力、逻辑推演能力。这些能力在不断完善中,有时会感受到惊喜,有时会有错误,但它的进步速度快。

在他的演讲后半段,李彦宏分享了他对科技产业演进的认识。他认为IT技术栈到了AI时代有四层:从下到上依次是芯片层、框架层、模型层和应用层。刚发布的文心一言处于模型层,以后AI时代的应用会基于这些预训练大模型进行开发。他说,生成式AI非常耗算力,费用昂贵。四层架构只有相互协同和优化,才能使它的效率比别人高很多。他认为,在全球范围内,同时在四层都有领先产品的公司是少有的,百度是其中一家。

人工智能带来哪些创业、投资机会?他说,至少有三方面,包括新型云计算(MaaS,模型即服务)、行业模型精调和应用开发。

百度“文心一言”首秀,大模型内测开启

3月16日,百度文心一言如约而至。在ChatGPT发布三个月后,国内终于有了第一款可以对标的产品。

文心一言是基于文心大模型推出的生成式对话产品。从今年2月消息外泄开始,这个项目就备受外界瞩目。在百度集团内部也上升为过去两个月里优先级最高的项目,并由CTO王海峰博士亲自挂帅。

李彦宏在现场展示了文心一言在文学创作、商业文案创作、数理逻辑推算、中文语境下典故理解、多模态信息生成等不同场景下的案例。

而对于目前文心一言的性能,李彦宏也坦言这类语言大模型的门槛非常高,现在的表现不算完美,会持续训练提升。「一旦有了真实的人类反馈,文心一言的进步速度会非常快,我们都希望它快点成长,早日为用户和客户创造价值。」

或许正是出于这样的考虑,百度这次在宣传上十分低调,避开了「发布」、「推出」这样的字眼,将此次活动命名为文心一言的「邀请测试会」。极客公园获得内测码后,测试了一下古文理解能力,并与ChatGPT做了同题对比。在古文理解上,似乎它更擅长一些。

生成式AI的浪潮才刚刚开始,大模型不会是最后的王炸,而是这场游戏的牌桌。百度选择在这个时间点发布,或许正是认为相比一个完美的产品,先有一个牌桌让中国的玩家们参与游戏,才是今天最重要的事情。

01写诗,做视频,算鸡兔同笼

会上,李彦宏表示「文心一言」对标的是ChatGPT(亦即GPT-3.5),甚至最新发布的GPT-4。这意味着,文心一言需要在开放域多轮对话的场景下,具有内容创作、知识问答、数学计算、写作代码等不同能力。对标GPT-4则又增加了处理图片、文字等不同维度信息的能力。

李彦宏演示了文学创作、商业文案创作、数理逻辑推算、中文语境下典故理解、多模态信息生成等不同场景下的实例。

在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度。

在商业文案创作场景中,在「建立一个大模型为中小企业数字化升级的科技服务公司」设定下,文心一言完成了给公司起名、写Slogan、写新闻稿的创作任务。

在数学计算上,文心一言解答了经典的「鸡兔同笼」问题。

此外,为了展示文心一言对中文语言的更强理解能力,李彦宏根据「洛阳纸贵」这一典故进行连续追问:洛阳纸贵是什么意思?当时洛阳纸多贵;在经济学原理中;对应的理论是什么;写一首藏头诗。

在多模态的能力上,李彦宏请文心一言创作「世界智能交通大会」的海报,并让模型用四川方言回答「智能交通最适合哪个城市发展」,并将以上内容再转化为视频。

信息的多模态转换并非百度的新技术,此前在百家号中,根据文章生成短视频即来源于此。李彦宏表示,「生成视频因为成本比较高,还没有对所有用户开放,未来我们会逐步接入。」

李彦宏表示,文心一言针对中文理解,表现出更优秀的能力。不过相对于英文、代码场景的训练还是不够好,接下来会继续完善相关能力。

极客公园拿到内测码,和ChatGPT(GPT3.5版本)对比了一下古文理解能力。文心一言回答对了《项脊轩志》最后一句话的含义、出处、及作者。而ChatGPT只回答对了句意。

总体而言,今天的发布会更像宣布了一个时间点,作为中国市场类ChatGPT产品空白的填充。而接下来,基于真实用户的数据反馈,模型将持续进行迭代。

02大模型时代,AI技术栈变化

在上一轮深度学习热潮中,百度开始了对AI的技术投入,至今已经12年。近十年,百度累计投入超过1000亿元的研发开支,核心研发投入占核心收入比例连续8个季度超过20%。在全栈能力积累至今,是百度能够在短短几个月的时间内集中攻关,将文心一言完善到可以邀请外界测试的基础。

7年前,当AlphaGo战胜李世石,产业内外共同意识到了深度神经网络展示其强大威力。如今,发布于2017年的Transformer被认为是比卷积神经网络更有延展性的架构。

基于此架构,AI从原来的识别模式发展到生成模式。形象而言,如果大模型是房屋,那么Transformer便是搭建房屋的「砖头」。

然而,训练作为系统工程的大模型,远远比「搭建房屋」要复杂得多,不少有过训练模型经验的从业者,更喜欢用「造火箭」来形容。因此,真正要实现模型的训练、数据闭环、持续迭代,需要全面技术能力和基础设施支持。

在ChatGPT出现后,随着微软、谷歌进入视野,首先人们意识到牌桌上巨头的身影,以搜索业务起家的百度,也顺理成章成为视野内可见的第三位巨头玩家。

不过,可能很少有人知道,2012年百度就曾和微软、谷歌坐在同一张拍卖桌上。那时候,图灵奖得主、深度学习三巨头之一的GeoffreyHinton和OpenAI总裁Brockman拍卖共同创立的技术公司,当初四家竞标企业之中的唯一中国身影,便是百度(另外三家分别是谷歌、微软与DeepMind)。

2013年,百度建立了深度研究院(IDL),随之在AI领域,开始了从芯片、框架、模型算法、到应用全面能力的布局。

在算力上,百度2012年即投建了阳泉计算中心。2022年,正式升级为「智算中心」。此次,阳泉智算中心也专门搭建了一个机房支持「文心一言」训练。该中心最高支持每秒400亿亿次浮点运算。当模型投入使用之后,这里将与江苏盐城等地的其他几座智算中心一起支持大模型的运算。

文心一言的模型演进始于2019年的ERNIE1.0,此后,百度不断发布新模型。2021年,发布了百亿参数中英双语的对话大模型PLATO-X,以及知识增强大模型ERNIE3.0。

CTO王海峰表示,文心一言是在ERNIE及PLATO系列模型的基础上研发的。「文心」系列模型是百度持续研发的一系列模型,而「文心一言」则是最新研发,基于对话场景下的通用模型。

CTO王海峰介绍「文心一言」相关技术|来源:百度

文心模型也一直在服务百度的产品。在模型的能力的加持下,百度搜索的问题分类准确率提升4.5%,新闻去重召回率提升8%,视频推荐召回率提升10%,小度的意图理解准确率提升了3.1%。

王海峰介绍,在文心一言的研发过程中,深度学习框架所提供的支持也颇为关键。「飞桨有效支撑了大模型的灵活开发、高效训练和推理部署。」飞桨平台,也是百度AI技术成果的重要部分。目前,飞桨是除了国际两大主流框架TensorFlow和PyTorch之外,国内影响最大的深度学习框架,平台上开发者数量已经达到535万,创建AI模型超过67万个。

生成式AI让市场的需求爆发式增长,意味着除了底层模型的开发人员之外,需要更多开发者加入,进行不同环节、不同层面的开发工作。这也意味着基于大模型,会形成新的技术栈。

提到基于模型开发AI应用,李彦宏表示「文心一言让每一家公司离客户更近,利用新的能力,做出更好的客户体验」。服务客户,首先需要服务开发者。当学习框架与底层模型的训练适配,无疑能为更多开发者基于通用模型继续开发应用,提供更友好的环境。

03李彦宏:大模型带来三大产业机会,「模型即服务」是未来的云

演讲中李彦宏坦言,目前文心一言的效果尚不完美。王海峰也表示,在对大模型的最终训练环节中,在人类反馈的强化学习(RLHF)上做的还不够充分。

但大模型的市场需求日益增长,国内大模型的空白急需填补,这是百度选择在今天发布的原因之一。邀请测试会的最后一个环节,百度正式宣布了向C端和B端开放测试。首批用户采用邀请制,可以通过邀请码在「文心一言」官网进行产品体验;面对企业用户,百度智能云开放API接口调用。

李彦宏还透露,近期,百度智能云将召开发布会。届时,将围绕文心一言的云服务和应用产品做介绍。接入了大模型的智能,既能够提供公有云服务,也可以做私有化部署。

而在上个月的Q4财报电话会上,他便强调了大模型对于云服务的加持。「之前选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。这会根本性地改变云计算市场的游戏规则。」

李彦宏介绍「文心一言」|来源:百度

这也是百度智能云的新机会。在文心一言发布会上,李彦宏提出,大模型将会带来新型的云计算。主流商业模式从将从IaaS变为MaaS。所谓Maas,是「模型即服务」。依托云设施,模型将其推理能力快速接入软件公司,后者能够做出更新的产品体验。

传闻中投资OpenAI百亿美金的微软,也在做相同的布局。目前,GPT-4的模型能力也已经集成在微软Azure中,并通过云服务的方式向外提供服务,即为AzureOpenAI产品。微软还表示,为了能够支持大模型的持续升级,针对大语言模型培训,专门优化了Azure的基础设施。

李彦宏认为,大模型将为AI产业带来三大机会,云服务是其中之一,另外两个分别是「行业模型精调」、「基于大模型底座进行应用开发」。

前者服务的是企业客户,应用行业Knowhow,提供垂直领域解决方案;后者直接面向普通用户开发产品,在文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,今天已经涌现出很多创业明星公司,他们可能就是未来的新巨头。

值得注意的是,要实现模型能力的大规模发放,还需要解决部署端的快速调用问题。目前出现「智能涌现」的大模型,参数达到了一定量级之后,在多种任务的能力上,都具备了小模型所不具备的能力水平。并且这种表现是「突然出现」的。这使得在模型的综合表现令人惊喜,也成为ChatGPT已经具备了产品属性的原因。

当人们使用模型回答问题、整合信息,或者创作能力生成文本草稿时,便是在调用模型的实时计算推理能力。这与训练模型所需求的数据训练、参数调优等能力相比,需要的是基础设施支持上的软硬件协同效率、服务稳定性的能力。

如何实现灵活地调用模型能力,也将是构建商业模式的关键。这里面可能涉及到很多具体挑战,比如对于数据隐私要求极高的医疗、金融等行业,不适合将数据直接接入大模型。而领域的专业性要求,又需要基于通用能力,基于专业数据进行精调。

大模型的训练成本极高。将大模型微调后,服务于相关企业,如何既保留大模型的能力,又节约算力成本,并实现本地化部署、迭代,将是未来服务行业需要解决的问题。

目前,百度积累了芯片、框架、模型、应用的四层技术架构。李彦宏表示,「在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,百度的优势非常独特,相信大家会在后续文心的迭代速度上有明显感受。」

文心一言的测试开始,也意味着数据飞轮即将启动。随着真实用户反馈的建立,在AI上积累了十多年,百度的机会刚刚开始。

谈点不一样的:百度的“文心一言”,也许真没有那么不堪

随着ChatGPT的发布,OpenAI一次次地将大语言模型式的AI推向了舆论的顶点,一时间仿佛各行各业的热点都变成了AI和ChatGPT,变成了未来自己的工作会不会被AI所取代。在这种大环境下,包括谷歌、亚马逊、DeepMind、百度等等互联网公司也纷纷被迫应战,表示将入局大语言模型式的AI,或将在未来推出类ChatGPT式的产品。而在这些互联网科技公司中,第一个“交卷“的就是百度。

本文引用地址:

北京时间2023年3月16日,百度正式推出大语言模型文心一言,并展示了文心一言在多个使用场景中的综合能力。“大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高”刚一开场李彦宏就略带紧张的说道。随后,李彦宏便展示了文心一言的五种能力,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,最后甚至还秀了一口AI生成的四川话,引得现场的各位观众忍俊不禁。

对于录屏发布的文心一言,资本市场看到的是百度对于自己的文心一言缺乏信心,但是,百度发放内测邀请后,百度股价大涨15%,这背后的原因是什么?我们应该对文心一言持怎样的态度?

虽说,演示的现场有条不紊,所演示的功能,无论是基础的问答、商业文案创作还是简单的数理逻辑推算看上去还挺像是那么回事,但是很快人们就发现文心一言的现场演示并不是实时的演示,而是提前就录好的视频。在发布会进行的同时,百度港股市值大幅下跌,相关话题还直接上了微博热搜。可见,在3月16日这个时间节点,对于录屏发布的文心一言,资本市场看到的是百度对于自己的文心一言缺乏信心,但是,随着百度开始发放内测邀请,越来越多的人试用过文心一言之后,在发布会的第二天百度集团股价价格逐渐回暖,最终大涨15%。本篇文章,笔者想就这背后的原因和我们应该对文心一言持怎样的态度做出一些自己的评价。

笔者需要点明的一点是,就目前这个状态文心一言对比ChatGPT-4来说确实还差了十万八千里。我想,这一点李彦宏肯定也是知道的,所以在如此重要的发布会之上,才显得如此紧张,而且为了不出意外,还使用了录屏演示这种下下策的演示方案,方方面面都散发着不自信。加之互联网上在发布会之前,就充满了对文心一言的贬低和不好看,这也就不难理解,为什么在发布会上,资本市场普遍对文心一言信心不足,导致百度股价一跌到底。

文心一言发布会现场但是,有意思的地方就来了,不知道是不是百度有意而为之,别家都是发布会上说得天花乱坠,实际拿出来的东西只是差强人意。但是百度整场发布会表现得十分糟糕,让外界对文心一言的期待值降到了冰点。等到第一批内测用户试用过之后发现文心一言的体验没有外界臆想的如此不堪,买家秀比卖家秀还好看,倒是少见。

客观来讲虽然距离ChatGPT还有很远的路要走,但是远不是发布会之前互联网上所冷嘲热讽文心一言是所谓“ChatPPT”,甚至还有人猜测是ChatGPT的“套壳”。随着第二天文心一言开启测试,无论是资本市场,还是用户都发现,文心一言是真正的百度自研AI,这是世界上唯二能拿出来的大语言模型式的AI,而且还是我国目前的“独苗”。那么资本市场自然对于文心一言自然会有所反应,这也就是为什么,在发布会的第二天,百度的股价大涨了13.67%。

蒸汽机就是蒸汽机,代表了无限可能的未来,是下一个时代的钥匙;而“马车”也只能是历史的强弩之末,只能看到“马车”,而看不到新生的“蒸汽机”,只能被上一个时代所桎梏。

那么我们对于这么一款目前还相对粗糙的大语言模型式的AI该持有怎样的态度呢?笔者认为,没必要对文心一言冷嘲热讽,再落后的蒸汽机也足够带来一次工业革命。

对于我国目前的AI市场来说,能拿出和ChatGPT同类的产品实在是太重要了。几个月前的OpenAI带着ChatGPT打遍天下无敌手,整个产业都对国内AI普遍持悲观态度。特别是在今年年初,《日本经济新闻》的一项最新调查显示:“从AI论文数量来看,中国一直位居世界第一。2021年,中国发表了4.3万篇论文,大约是美国的两倍,并且中国在被引用最多的论文中占了7401篇,比美国多出70%左右。”AI在学术之上如此繁荣,可是落地到实际的产品上就被微软的OpenAI甩出很远,这种情况对于我国AI的研究和商业化是十分不利的,严重打击了我国的无论是研究者,还是投资者的信心。而目前百度拿出的文心一言对我国AI产业来说,无疑是一剂强心剂。

现在,百度所搞出来的这台“蒸汽机”确实很烂,这是一个技术问题,但是更深层是在认知上的:刚推出的蒸汽机确实漏洞百出,它速度慢,不靠谱,甚至还没有“马车”强,但蒸汽机就是蒸汽机,代表了无限可能的未来,是下一个时代的钥匙;而“马车”也只能是历史的强弩之末,只能看到“马车”,而看不到新生的“蒸汽机”,只能被上一个时代所桎梏。

而这一次,国内没有表示ChatGPT这东西就是个“噱头”,就是个“玩具”,而是很快就意识到了这是下一次工业革命的钥匙,是新时代的“蒸汽机”,并且很快就攒出来一台至少能动的“蒸汽机”,在笔者看来,这是一件值得乐观看待的事儿,因为我们意识到了问题所在,也意识到了差距,并且行动了起来,然后拿出了成果。

这就证明了在AI这个领域,我们的认知是对的,而且最重要的是,知道了这条路一定走得通,从1到99不难,真正困难的是从0到1,而这一次我们迈出的第一步,还算不晚。

固然,OpenAI的ChatGPT是时代的先行者,是第一个吃螃蟹的人,我们如何赞美也不为过。而作为全世界第一个向“擂主”挑战的文心一言,我们也不必报以讽刺,纵观世界,短期内也没有第二位上台的挑战者了。

目前,我国内(或者说百度)要做的就是做好数据训练,利用好国内最多的网络用户,做好AI的人工标注工作,最难的从0到1已经完成了,而从1到99甚至更多就是我国最擅长的领域了。只要抓住这个机会,加大投资,让文心一言持续进化,对于百度来说,这是一个改善,甚至逆转国内口碑的绝好机会,对于各位读者来说目前不必踩上文心一言脚,AI的迭代速度是十分惊人的,让子弹再飞一会儿,再下结论也不迟。就现在来看,在未来文心一言很有可能成为工作上的优秀帮手。笔者对于文心一言的未来,持乐观态度。

百度文心一言发布会详细纪要

第二个例子,是商业文案的创作。问“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,应该给它起个什么名字?”,信智科技、数智云图、云集科技、意向科技、魔方科技。“给我起一个公司的服务slogan,来表达共赢的概念?”,答案就是“数智共赢智慧未来”。“帮我生成一篇公司成立的新闻稿,数智云图,以共赢的服务理念,用大模型来服务中小企业的数字化升级,要求是600字左右”,也生成了相应的新闻稿。这里涉及到相应的理解能力、表达能力、创意创作能力。这些能力都是没有办法教文心一言的。那么怎么做到的?其实还是要有好的技术,要有大的数据。人们说读书破万卷,文心一言可能读了千亿万亿的页面,用了几十亿的搜索请求,用了很多的图片,用了我们全部知识图谱的5500亿的事实,在不断的训练过程当中,逐步具备了一些比较通用的能力。大模型当参数达到千亿量级,又有足够多的训练语料数据来进行训练时,就会发生智能涌现,就是没有教过它的能力它也会。

第三个例子,演示数理逻辑的推算。来玩一个鸡兔同笼的游戏,问有多少只鸡,多少只兔子,文心一言说这题好像出的不太对,算不出来。我们再改一下,重新问一遍。解题思路是这样的,答案是“3只鸡和6只兔子。在这两轮提问当中展现出来的是文心一言的逻辑推理能力”。这方面它不仅知道题出的对不对,也不仅能够给出答案,也给出了解题的步骤。这很像是小学生在解应用题,它是有逻辑的,一步一步的推理出来的。我们在过去一个月左右的内测当中,不断看到文心一言在进步,虽然现在还不敢说百分之百这类型的题都能做对,但是它的能力已经是挺强的了。

第四个例子,对中文的理解。因为百度是植根于中国市场的,理应在中文的理解和对中国文化的了解上,超出世界上任何一个预训练大模型。“洛阳纸贵是什么意思?”,必须得知道这个成语,才能答对。“当时洛阳的纸到底有多贵?”,这就有点冷知识了,不是那么容易能够答对的。“这个成语在经济学原理里对应的理论是什么?”,回答“这是一个需求定律,就是物以稀为贵”。最后“用洛阳纸贵来写一首藏头诗”,回答“洛阳城里春光好,阳燕无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央”。所以看到文心一言中文的理解能力,对中国文化的熟悉程度是相当高的。文心一言也可以处理英文,只不过对英文的理解和处理能力现在还没有中文这么好,部分原因是我们在训练数据里,给它注入的英文数据还没有那么多。未来我们会逐步的训练它英文以及其他语种的能力,以及跨语种的翻译推理能力。

第5个例子,是多模态的生成。“请为2023世界智能交通大会来创作一张海报”,看到它的反应是很快的,而且这个海报很有未来感,也很贴切。“你认为智能交通最适合哪个城市发展?”,回答“上海、北京、广州、成都”。“请用四川话将以上内容讲出来”,“请将以上内容生成视频”,大家看到生成的视频也非常相关,而且还挺美。这四次交互分别看到它可以用文字生成图片,可以回答有一定创造性的问题,可以用语音方言(四川话、广东话、东北话、闽南话),最后用这些内容来生成视频。前三个现在所有文心一言的用户都可以用了。第四个因为计算成本比较高,我们还没有对所有用户开放。今天大概每天有几万篇的百家号文章,通过这个技术自动转成视频进行分发,这些技术我们都已经都把它连起来了。

从文心一言的表现来看,它已经具备了很多像人类对自然语言的理解能力、表达能力、逻辑推理能力,这些的能力还在不断完善的过程当中。我们有时候用会感受到惊喜,有时候也会发现明显的错误,但是有一点是肯定的,就是它进步的速度非常快,在未来的一段时间当中,一定是日新月异的状态。而且我们通过对文心语言大模型进行微调,让它适配百度各种各样的产品,就可以在用户界面,或者在用户体验上展示出惊人的亲和力,让每一个产品都离自己的客户更近。所以文心一言会成为每一人必不可少的生产力工具。

无论是什么样的公司,都不可能在几个月的时间里靠突击做出来这样的技术。它是百度十几年超大规模的研发投入,慢慢积累出来的。所以进一步解释文心一言到底怎么能做出来的,需要把IT领域最近发生的一些变化跟大家分享。

过去IT的技术栈分为3层,第层是芯片层,上面是操作系统层,再往上是应用层或者软件层。在PC时代、移动互联网时代都是这样,但是当我们进入AI时代,IT技术栈从3层变为了4层:1、芯片层。这个芯片层跟过去芯片也不太一样,过去以CPU为主,未来很可能会以GPU为主了。2、框架层。什么叫框架?像百度飞桨叫做框架。3、模型层,文心一言就处在模型层。文心是百度整个模型的一个品牌,AI时代的应用会基于这些大模型来进行开发。以后不管是搜索也好,聊天也好,或者其他的应用都会是基于预训练大模型来进行开发。百度搜索每天有数十亿的需求,也就意味着文心大模型每天在服务数十亿的用户。只不过在服务搜索的时候,它是一个判别式的语言大模型。今天文心一言是一个生成式的语言大模型。为什么讲技术栈的变化,因为生成式的AI是非常耗算力的,要有大算力,要有大模型,要有大数据,费用相当的昂贵。

四层架构之间相互进行协同,不断地进行优化,就可以使它的效率比别人高很多,显著地降低成本。尤其是框架层、模型层之间的协同,过去几个月我们已经体会到了这方面来的收益。在全球范围内,芯片、框架、模型、应用这4层都有领先产品的公司,可以说是绝无仅有,百度就是那个唯一。我们的优势非常独特,这个优势在未来文心的迭代速度上会有明显的感受。从2月7号我们正式官宣文心一言要发布以来,也就一个多月的时间,已经有650家的企业宣布接入文心一言的生态,这意味着很多企业其实已经明白,这是一个大机会,这是任何一个企业都不应该错过的的机会。生成式AI,它是代表了一个新的技术范式,它会带来市场需求的爆发性增长,商业价值的释放会是前所未有的指数级。对于文心一言的定位,我们认为它是在通用的基础模型之上,在4层结构上可以有能源大模型、交通大模型、媒体大模型等等,可以做成适合于千行百业的、服务各种各样应用的模型。所以文心一言不仅仅会影响到搜索,也不仅仅会影响到互联网公司,它会影响到每一家公司,由于它超强的自然语言理解能力、表达能力以及推理能力,它可以使得任何一个公司都能离自己的客户更近,也就是说任何一个公司都有可能利用这些能力做出更好的客户体验,从而更好地抓住客户,建立更强的竞争优势。所以文心一言对于每一个企业都是机会,甚至对于每一个人都会有很大的影响。

有机构预测到2030年,脑力劳动者的生产效率会因为人工智能跟今天相比有4倍的提升,也就是说很多人的工作性质会发生不可逆转的改变。文心一的发布或者说生成式大模型的问世,会带来哪些创业机会、投资机会?我觉得有至少有三方面的机会。

首先,新型云计算。云计算今天最主要的商业模式叫做IAAS,公有云提供的基础云服务主要是算力。未来云计算公司主要的商业模式会变成ModelAsAService,以后的应用会建立在大模型上,而不是建立在过去的云计算算力或者存储上。这对于云计算产业是改变游戏规则的。以前的基础云服务,看算力,看存储,今天会看模型好不好,框架好不好,芯片框架、模型、应用之间协同的好不好,效率高不高。百度智能云会基于这套架构对外提供服务,赋能千行百业。它会使得各行各业提升效率,在各自领域的应用中有很大的商业机会,有很大的效率提升空间。随后过两个星期,我们智能运营会有一个单独的发布会,会具体地介绍相关的产品,既有公有云服务,也可以做私有化部署。

第二类机会,行业模型精调。4层架构里模型层我们没有把文心放上去,而是放了各种各样的行业大模型,因为我们觉得很可能是存在一个中间层的。任何一个行业都有自己独特的数据,都有对行业的独特理解。数据的理解知识如果跟基础大模型进行结合,就会产生很强大的创造力、效率提升的能力。这些能力很可能不是百度所具备的,这些数据也不是别人愿意给到百度的。这些在各个行业的精调,可以避免基础模型容易犯的错误,它的实用性会更强。

第三类机会,应用开发。文字的生成、图像的生成、音频的生成以及数字人、3D能力一旦结合,再加上超强的理解能力和表达能力,会创造出很多新的可能性。所以大模型时代,真正最大的机会既不在基础服务,也不在这个行业。服务恰恰是在应用。就好像在移动互联网时代,最大的商业机会可能不是iOS或者安卓这样的操作系统,而是微信、抖音、淘宝应用一样。在人工智能时代,我相信一定会出现杀手级的应用、现象级的新产品,会不断看到里程碑事件的发生。

最后,在文心言发布之后,我们就会建立起一个好的反馈闭环,用户的真实反馈,开发者的模型迭代,以及开发者的调用之间,会形成一个正向的循环。给大家“士别三日当刮目相看”的惊喜。文心也不是中美科技对抗的工具,而是一代代百度技术人员在追寻让科技改变世界的梦想当中的一个自然结果,是我们服务亿万客户、赋能千行百业的平台,更是新驱动发展的最佳证明。

王海峰(CTO):文心一言背后是全栈的人工智能技术,百度经过11年积累了全栈的人工智能技术,芯片层、框架层、模型层到应用层。文心一言的推出来源于这11年的积累,这四层之间形成了层到层到反馈、端到端的优化,尤其是模型层的文心大模型和框架层的飞桨(全称是产业级开源开放平台),在开发文心一言的过程中,它们的协同优化起到了至关重要的作用。

飞桨经过10年积累形成了完整的产业级深度学习开源开放平台,凝集了500多位开发者、20多家企业、60多万个模型,基于这个平台也为社会培养了300多万的AI人才。平台核心框架是开发、训练、推理部署。对于开发,动静一体的开发模式,既可以发挥动态图的灵活,也可以发挥静态图的高效。训练是深度学习框架最核心的部分,不仅要支持超大规模的训练,还要有产业级的数据处理能力。模型训练出来最终是为了应用,应用时会面对不同的场景、软硬件环境,有很多细致工作需要做,比如模型压缩、推理引擎、服务化部署等。很多深度学习开发的高手是从框架层开始,用这些框架来开发自己的应用。在飞桨平台上,开发者可以直接调用平台的模型库,几年下来积累了大量产业级的模型库,这几年着重发展的是文心大模型。在框架和模型的基础上,我们还提供丰富的端到端的开发套件、工具与组件,支持开发者完成开发和部署。

2019年发布第一个文心大模型,和如今的文心一言一样是自然语言处理模型,文心的名字与此有关,“文”是语言文字,“心”是希望技术能用心理解语言和服务客户,另一个出处是《文心雕龙》,我们希望细致地把这个模型做好。除了基础的自然语言1.0、2.0、3.0,我们也有很多跨语言模型、图网络模型、对话模型等,对话模型已在很多领域取得了应用成果。前两天中国人工智能协会发布了人工智能科技进步奖,我们是史上第一次拿到了该奖的特等奖。既有跨视觉和语言的模型,也有语音和语言、地理信息和语言跨模态的模型。同时也在延伸其他领域,例如生物技术大模型,可以进行化合物表征的学习、半导体结构预测等。在此基础上,我们已经和很多行业伙伴合作发布了行业大模型,未来会和行业领先企业一同打造领先的模型。有了这些模型以后,我们也会提供相应的工具和平台,比如数据的标注处理、模型的精调、压缩、部署等。

文心一言是基于百度多年在人工智能领域的积累,尤其是深度学习和大模型,水到渠成的成果。在开发过程中,一方面基于ERNIE知识增强模型,另一方面借助了PLATO对话模型。在此基础上,主要有6个核心技术模块:有监督精调、人类反馈的强化学习、提示、知识增强、检索增强、对话增强。

有监督精调的创新特色:1、面向中文。中文目前强于其他语言,训练更充分。2、服务应用。百度既有C端应用,也有很多B端客户,基于客户服务积累了很多对应用需求的理解。3、富含知识。基于知识图谱,不仅把知识用在知识增强过程中,而且产生了很多有效的用于有监督精调的数据。

人类反馈的强化学习在应用中至关重要,我们已经有了很多技术,但训练还不够充分,只有等使用用户的反馈后才能迭代。

对于一个千亿级参数的大语言模型,里面已经蕴含了很多的知识,如何找到合适的知识还有很多要做的事情,这是目前人工智能技术智能涌现的根本原因,提示的构建直接影响模型的能力。当一个用户输入,我们会用自动构建的方法,给他补充实例、提纲、规范等。大语言模型也会有错误,如果我们把已知的准确知识点补充进去有助于它表现更准确,这时知识增强、思维链就会起作用。

知识增强是百度的特色,文心大模型又叫知识增强大模型,知识增强一直是我们非常重视的。知识增强可以使模型效率更高、效果更好,比如用更少的参数达到和用更多参数模型一样的效果,同时效率更高。这涉及知识内化和知识外用两大技术,知识内化是把知识内化到模型参数中,知识外用是知识没有内化在模型参数中,但在推理过程中去用外部知识。在训练过程中,我们基于语义单元来学习,效率更高而且效果更好。我们也可以通过知识图谱构建训练数据,达到知识内化到效果。知识外用涉及基于大知识图谱进行知识推理,基于知识构架提示。

百度在搜索方面有领先的技术和产品,发展了20多年,基本的底层技术原理一直是关键词匹配和链接分析。搜索引擎技术一直在变迁,2010年百度将机器学习技术引入到搜索,2013年百度将深度学习技术引入到搜索,到2023年搜索引擎架构发生了变化,基于语义理解和匹配的新一代检索架构,该架构和文心模型天然有着密不可分的关联。生成模型时可以进行优化,可以把检索里面有价值的结果、精准的信息带入生成,使生成效果更好。

百度在对话方面也有很多年的积累,对话时有上下文,所以涉及记忆机制和上下文的理解,如果是长对话,还涉及对话规划。

总结:文心一言既有大家熟知的技术,也有百度特有的技术(但训练得不够充分),相信后续会发挥出更强的能力。

深度学习层和大模型层之间做链接和优化是非常有价值的,飞桨支撑了文心一言,使其效果更好、效率更高、性能更强。从开发训练角度,动静统一的开发范式、自适应分布式架构等领先技术都在文心一言的开发过程中起到了很大作用。当前类似文心一言的大模型技术,推理过程中对算力的消耗很大,如何让推理效率更高是至关重要的,不仅是成本问题,而且是更广泛应用的问题,过去几年百度已经取得了很大进展,离不开飞桨推理部署的能力。

从今天起就会开始邀测,邀测既有个人用户,也有百度智能云的客户。

来源:券商研报精选返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇