百度文心一言AI视频，潜藏版权风险百度ai文心一言

发表时间：2023-06-21 19:13:37

百度文心一言AI视频，潜藏版权风险

本文来自微信公众号：IT时报（ID：vittimes），作者：孙妍，编辑：钱立富，原文标题：《百度文心一言潜藏风险，AI视频素材来源不明，创作者或陷版权风暴》，头图来自：视觉中国

3月16日，李彦宏携百度文心一言亮相，并宣布开放邀请测试。

虽然文心一言的能力受到了质疑，但毋庸置疑的是，百度是全球第一个挑战ChatGPT的大厂。李彦宏也已经预见，文心一言在与ChatGPT正面比较时会令大众失望，但百度认为，文心一言有两大优势：一是，画图、写长文、文字转视频等多模态生态能力是ChatGPT所不具备的；二是，文心一言具备中文理解能力优势。

但是，百度自诩的优势也许会成为文心一言所面临的大问题。近日，有网友在对百度文心一言AI作画功能进行大量测试后产生怀疑，认为其可能只是一个套壳的AI模型，先将用户的中文指令翻译成英文，然后用国外开源的AI模型生成作品。百度方面针对此回应表示，文心一言完全是百度自研的大语言模型，文生图能力来自文心跨模态大模型ERNIE-ViLG。

不过《IT时报》记者发现，百度低调向百家号入驻作者开放的AI图文转视频功能存在版权风险：百度视频素材来源不明。但这一风险被转嫁至媒体及其他百家号作者，若被告侵权，作者将承担巨大的版权风险。截至发稿，百度没有对文心一言版权问题进行回复。

百度即将在今天（3月27日）上线文心一言云服务，届时，AI写作、AI作图、AI文字生成视频等功能都有可能对外开放，这些危险的AI生成作品，也许会把百度席卷至版权风暴之中。

一、AI视频潜藏版权风险

《IT时报》记者实测比较百度文心一言和微软必应ChatGPT后发现，文心一言在文学创作、商业文案创作、数理推算方面仍有较大的追赶空间。但正如李彦宏所言，百度文心一言的优势在中文理解和多模态生成能力。

李彦宏表示，文心一言目前版本已经能生成文字、图片和语音。生成视频因为成本比较高，还没有对所有用户开放，未来百度会逐步接入。但熟悉百家号创作的用户，不少都已经体验过这个功能，每天有几万篇文章通过这个能力转成视频内容在百度平台分发。

但是，巨大的版权风险正潜藏在这每天几万条根据文字自动生成的视频中。

百度AI文字转视频功能早在2022年3月就已在百家号低调上线，百家号作者鲜少第一时间发现，是因为这一功能是在发布文章时默认勾选。在默认勾选状态下，百度AI会自动根据文字内容寻找合适的视频素材，生成视频后并自动发布，其中文章配图只占10%以内的占比，其他视频素材均来自百度视频库。

这是属于文心一言AIGC（人工智能自主生成内容）的TTV（文本内容情感化分析）功能。危险的是，百度并未公开其AI视频素材来源。多位百家号工作人员向《IT时报》记者表示，的确存在版权风险，至于其视频素材来源，一部分由百度进行版权采买，一部分是公开CC0（放弃版权）素材，建议不发到百度站外，或关闭该功能。

目前，这些AI视频主要自动发布在百家号及百度好看视频平台，但可以下载。“如果在百度平台内，可能由百度来处理版权纠纷，但目前还没了解到有什么版权侵权的案例。”百度百家号工作人员向《IT时报》记者透露。

但在社交平台上，多名百家号作者表示，AI根据其文章自动生成的视频被投诉侵权，其账号信用分被扣至0分而被封禁。还有百家号作者表示，AI自动生成视频中疑似含有版权水印。

《IT时报》记者发现，百度AI视频库里还有不少电视台等媒体拍摄视频，但无处查询视频素材出处。

百家号只在图文转视频的相关权益说明中提到，“如果您是原创视频作者，那么您发布的图文为原创时，转出的视频会自动声明该视频为原创视频，并且视频的阅读收益归您所有。”

截至发稿，百度没有对文心一言AI视频来源等问题做出回复。

二、风险转嫁至作者

更不合理的是，百度可以无偿使用百家号作者上传的内容，又将版权风险转嫁给百家号作者。

百家号在平台服务协议9.7条中提到：“您使用百家号平台服务上传、发布或传输内容即代表了您有权且同意在全世界范围内，永久性地、不可撤销地、免费地授予百度及其关联方对该内容的存储、使用、发布、复制、修改、改编、出版、翻译、据以创作衍生作品、传播、表演和展示等权利；将内容的全部或部分编入其他任何形式的作品、媒体、技术中的权利；对您的上传、发布的内容进行商业开发的权利……以及再授权给其他第三方以上述方式使用的权利。”

作者供图

据此协议理解，百度有权使用百家号A作者上传的文字、图片、视频等内容，编入B作者的作品中，甚至用于商业用途，完全不需要得到A作者的授权，也不需要付费给A作者。

《IT时报》记者查询抖音及其他新闻媒体平台与作者签订的协议发现，并没有存在如百度百家号这般不合理的条款。

上海大邦律师事务所高级合伙人、知识产权律师游云庭解读认为，如果上述条款有效，那百度就可以使用这些视频素材，不构成侵权也无须支付对价，如果该条款被法院认定为无效，则百度对外使用就构成侵权。

而当该条款遇上AI生成内容，潜藏的版权风险将对百家号作者更加不利。游云庭认为，文字内容是媒体创作的，百度只是提供了技术服务，因为AI生成的视频是无权享受著作权的，所以知识产权应该归媒体所有。媒体发布的视频，对外应该由媒体承担责任，如果权利人起诉媒体就是媒体承担责任，如果权利人起诉双方共同侵权，则构成连带侵权责任。

“由百度提供模型，素材库按照百度的合同规则使用的情况下，发生侵权可能责任是百度的。这当中任何一个节点发生变化，可能就是使用者的责任或者共同责任。这里面变量很多，要看具体细节。判断依据是人工智能生成品是不是侵权，模型数据提供者和使用者有没有过错等。”

上海段和段律师事务所合伙人刘春泉认为，人工智能生成品有没有版权？与责任风险由谁承担？应该按照权利义务相一致原则来处理。纯粹人工智能生成品与动物按快门拍照片和大象画画一样没有版权。但是人利用AI作为工具制作的产品，符合法律规定的构成作品，可以受保护。

三、制作1条AI视频最低9.99元

《IT时报》记者发现，百度已经在进行文心一言的商业化尝试，而上述AI文字转视频的服务正是文心一言云服务的主要盈利点。

目前，百度大脑智能创作平台推出了两种会员套餐，视频创作会员1698元/月，智能写作会员198元/月。其中，视频创作会员的权益就包括每月50次图文转视频等。此外，图文转视频200条的报价是1998元，50条的报价是698元，20条的报价是298元，也就是说，1条图文转视频的价格最低是9.99元。

“目前不管是API还是线上售卖的套餐，我们都没接入素材库。”百度云客户经理没有正面回答文字转视频素材来源的问题，但就AI生成图片的版权问题回复表示：“AI生成内容的可版权性在法律上仍处于不确定状态，百度不限制您将生成图片用于商业用途，但您应确保自身使用行为的合法合规性，在享有生成图片使用权益的同时，自行承担使用生成图片的一切后果。”

截至3月27日，百度大脑智能创作平台显示，其自动创作文章已超200万篇，自动创作短视频已超15万条。

四、风口上的百度急了

“现在百度最卷的部门已经不是自动驾驶了，而是文心一言。”一位百度自动驾驶部门的员工说道。

基于20多年搜索业务的积累，百度建立起世界上最大的知识图谱，包含50亿实体、5500亿级事实，每天调用量超过400亿次。受益于百度知识图谱，文心大模型也成为全球首个知识增强千亿级大模型。研究表明，数据达到千亿级，大模型就可能发生“智能涌现”，但最快跑出ChatGPT的为什么不是百度？

过去10年，百度在AI领域投入超1100亿元的研发费用，2019年就推出了文心大模型ERNIE1.0。论起步时间，文心一言并不比ChatGPT晚，但论专注度，百度没有OpenAI聚焦。此前百度之前一直将最大的精力投向了自动驾驶，以及一系列的AI风口追逐，当初希壤也让百度争得了国内元宇宙“头号玩家”等名号。

“百度的主要收入还是搜索广告，这也是百度为什么着急做文心一言的原因之一。”一位百度昆仑芯的员工认为。

ChatGPT焦虑已经是业内的常态。

国内ChatGPT模型跟OpenAI的差距到底在哪里？“算法上还有细节要打磨，其次，高质量的文本数据还需要多积累。”一家研发GPT模型公司CEO对《IT时报》记者道出了多数国内ChatGPT从业者的现实和心态，“类ChatGPT的产品可能有版权上的顾虑，但先把技术用起来，以后再想办法更好地规范。”

不过，也有一家国内AI大厂的相关人士对《IT时报》记者表示，目前已跑出AI作图等ChatGPT大模型，但是主要考虑到版权等风险，没有快速上线。

五、AI版权风暴即将来袭

最近，网易旗下轻博客社区LOFTER上的大量创作者删档销号，退出平台，用行动抵制AI作画。起因是网易LOFTER上线AI作画功能“老福鸽画画机”，部分创作者认为该功能可能用到原创作者的画作，有侵犯版权之嫌。

对此，网易LOFTER强调“该功能训练集来自于开源，没有使用LOFTER用户的作品数据，并明确注明不得用于商业用途”。3月16日，网易LOFTER官微向创作者发出一份公开致歉信，为伤害了很多创作者而表达歉意。该AI作画功能已于3月8日下线，网易LOFTER单独设立的“AI内容冒充原创”反侵权投诉渠道，截至3月25日收到1148条举报投诉。

在国外，AI侵权问题已经引起社会关注。近日，《华尔街日报》等多家国外主流新闻媒体指控OpenAI及其聊天机器人模型ChatGPT未经许可使用新闻来源进行训练，并拒绝向媒体支付相关费用。

早在2022年，一名程序员起诉GitHub、微软和OpenAI，指控GitHubCopilot的AI编程工具抄袭代码。今年1月，一群艺术家起诉AI绘画StabilityAILtd、MidjourneyInc和DeviantArtInc，声称这些公司下载并使用了数十亿张受版权保护的图像，但没有获得艺术家的授权并对其进行补偿。

一场AIGC的版权风暴正在来袭。

2月15日，爱奇艺宣布将全面接入百度文心一言，双方将共同探索AIGC在内容搜索、内容宣发、内容创作工具、小说创作等业务上的应用。近期，文心一言开发的AI文档写作助手也将上线百度文库，作者只要输入主题及内容要求，AI写作助手就能帮助搜集资料、搭建框架、填充内容、理顺文档、制造亮点，最终生成范文。

李彦宏认为，多模态生成能力是ChatGPT不具备的能力，这是文心一言的优势。但是，百度一旦开放AI写作、AI作图、AI文字生成视频等，受到的版权类指控并不会比ChatGPT少。训练数据是否得到授权，AI生成作品是否涉嫌侵权等问题会接踵而至。

关于AI生成内容的版权问题正在业内掀起大讨论。

知识产权界绝大多数专家都认为，AI生成内容是不受版权保护的。中国社会科学院知识产权中心主任李明德认为，《著作权法》只保护人的作品，AI生成的内容不是作品，没有版权。只有个人使用存在免责情况，公司拿媒体的作品去训练AI，但没有拿到媒体的授权，就构成侵权，文字三四行就能构成作品，视频每一帧都是作品。

本文来自微信公众号：IT时报（ID：vittimes），作者：孙妍，编辑：钱立富

百度“文心一言”，就这

原创深燃团队深燃

深燃（shenrancaijing）原创

作者|王敏

编辑|金玙璠

“冲刺”一个多月后，百度文心一言终于来了，但刚出道就遭到群嘲。

3月16日下午，百度举行文心一言发布会，被寄予厚望的发布会居然没有产品现场演示，而是采用“Demo演示”的形式，用提前准备好的问题和答案做展示，瞬间引发众多吐槽。或许百度是吸取了谷歌的教训，看到其因Bard产品在演示中“翻车”导致市值一下子蒸发了1000亿美金后，才变得谨慎。

不仅如此，很多对新产品跃跃欲试的用户们，被“邀请码”阻挡在了门外。直到晚间，才有极少部分用户真正“尝鲜”。

深燃拿到邀请码后，第一时间实测了文心一言的“五大能力”，整体感受是，文心一言的大多数回答，还算流畅自然，产品达到可用水平，但对于部分基础问题，不能正确理解题意，更不要说给出准确答案，而且多轮对话能力也有所欠缺。

就在前一天，国内外还沉浸在对3月14日OpenAI新上线的GPT-4的讨论中。GPT-4比上一代准确性更高，解决问题能力更强，可以处理超2.5万字的文本，并支持图像输入，尽管现在图像输入还未对外开放，但这款产品已经拔高了用户对产品的标准。

在文心一言发布的当晚，微软再发“重磅炸弹”，举办了一场Microsoft365Copilot发布会，将GPT-4模型引入Office应用程序，举个例子，熬夜赶不完的论文Word、看不出数据联系的Excel表格，都可以找Copilot来帮忙。Copilot也被评价为，要颠覆打工人的工作方式。

自去年12月以来，中外大厂们都纷纷冲刺，试图追赶ChatGPT，百度被视为是国内比较有希望追赶ChatGPT的选手之一，两相对比，有部分用户表示看到文心一言时，觉得被迎头浇上一盆冷水。资本市场对百度的文心一言似乎也不买账，发布会进行过程中，百度股价一度下跌10%。截至3月16日收盘，百度股价报125.1港元，跌6.36%。

不可否认，作为国内第一款对标ChatGPT的产品，百度也算是勇敢的迈出了第一步。但此前百度铺天盖地的宣传已经拉高了外界预期，目前看来文心一言有些高开低走，让外界对其何去何从产生了质疑。

亲测百度文心一言，不够AI

从2月初官宣要集中“冲刺”，百度文心一言吊足了外界的胃口。

但在正式发布时，观众们的评价都是“文心一言，一言难尽”、“CheatGPT”等不太正面的言辞。

对于这次百度文心一言和ChatGPT的PK，英诺天使基金合伙人王晟对深燃形容道，就像是“ChinaPPTVSChatGPT”。

百度“文心一言”究竟怎么样？在发布会现场，百度创始人李彦宏从文学创作、商业文案创作、数理推算、中文理解和多模态生成五个方面举例展示了文心一言的能力。拿到邀请码后，深燃也从五大层面对文心一言进行了体验，并将部分答案与接入GPT-4的微软NewBing或基于GPT-3.5的ChatGPT进行了对比，试图得到一些结论。

在文学创作层面，在对于最近爆火电视剧《黑暗荣耀》的剧情总结时，文心一言的答案和剧情不太相符，NewBing的答案更贴近剧情。不过，在深燃提出将电视剧进行喜剧改编时，两个产品的表现都不算太好，但NewBing对于追问的回答，更加灵活。

图源/文心一言

图源/NewBing

在商业文案的创作能力上，我们让这两个产品分别给“文心一言”想一句广告词，文心一言设计的广告词词句更加优美，而NewBing设计的广告词更侧重于产品特性。

图源/文心一言

图源/NewBing

至于数学推理能力，对于小学奥数题的解答，文心一言给出了一个错误答案，NewBing的最终答案是准确的。

图源/文心一言

图源/NewBing

对于中文理解能力，让两款产品解读网友对于文心一言邀请码的调侃，结果是，文心一言和NewBing都没能精准解读其中的调侃意味，不过文心一言识别出了KFC是快餐品牌，还提醒不要将该邀请码和特定品牌关联。

图源/文心一言

图源/NewBing

在脑筋急转弯式的对话中，交给文心一言“要电话号码”的任务后，其在第二轮就忘记了，而ChatGPT还记得上一轮的隐藏任务。

图源/文心一言

图源/ChatGPT

在多模态生成方面，目前ChatGPT的识图功能还没对外开放。文心一言可以根据文字生成图片、语言和视频，但是这并非新功能，此前在百度的其他产品中也已经看到过。而且文字生成图片有时生成的图片并不精准。比如，本意是想获得一只阿拉斯加犬图片，但由于表述不够精确，最后得到的是一张动漫图片。

图源/文心一言

总结下来，从深燃的初步体验来看，“文心一言”没有达到惊艳效果，有时更像搜索引擎，回答问题的方式相对模式化，情感色彩流露较少，在回答问题的精准性、灵活性、上下文多轮对话等方面还有待提升。而基于GPT大模型的产品在语言组织和创造能力上更加灵活、流畅，交互性更强一些。

智能客服从业者Allen对深燃表示，仅从个人体验的主观感受而言，如果说ChatGPT能够提供正确答案的比例在90%，那么文心一言只有70%。不过，至少从用户体验的便捷度而言，文心一言之于国内用户，要比ChatGPT更加方便。

距离OpenAI，百度差了多少步？

对于“文心一言”的产品表现，百度创始人李彦宏略显底气不足，在发布会刚出场不久，就开始主动降低用户预期。他说道，“要对标ChatGPT、甚至GPT-4，门槛还是很高的”、“自己测试还是感觉有很多不完美的地方”。

产品的背后，国内大厂和OpenAI相比，差在了哪里，差距又有多大？

AI大模型之争最早是在国外科技巨头之间，此后国内大厂纷纷跟进。有专家分析称，在2020年中GPT-3发布后，双方差距进一步拉大，当时很多人认为不仅是技术的差距，更体现了AI模型的发展新理念。

在GPT-3的基础上，OpenAI进行了大量的微调和训练，增强交互性、更加产品化后，有了基于3.5版本的ChatGPT。

值得注意的是，3月14日GPT-4的发布，再次拉大了双方的距离。和上一代相比，GPT-4有很多跨越式提升，包括逻辑推理能力更强，比做题家更会考试；支持图像输入并能理解图像；能接收超大上下文，支持输入处理超过25000个单词的文本；更有创造力，能够写代码、写小说、编剧。

差距拉大的背后，是人才、资金投入和技术积累的差距。

来源/视觉中国

伴随着ChatGPT的火热，从业者们都表示，要做底层AI大模型，资金、顶尖科技人才、技术积累，这些要素缺一不可。

做大模型，前提是有资金的投入。OpenAI在2019年获得微软10亿美金的投入后，又于今年获得了微软100亿美金的投资，这让其有了烧钱的资本。业界测算，GPT-3涉及1750亿参数，训练费用约花费1200万美元。据国盛证券报告估算，GPT-3训练一次成本约为140万美元，每一次训练任务都耗资巨大。

此外，大模型训练的三要素包括大算力、大数据和大模型。有从业者指出，影响最后训练结果的因素有很多，包括清洗、标注、模型结构设计、训练推理的技术积累等。每一个因素的变化都影响着最后的结果。

过去十几年里百度一直在AI方面投入，包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元，占百度核心收入比例达22.4%。

但是，百度和OpenAI还有不小差距。李彦宏也表示，无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理，需要多年的坚持和积累，没法速成。

王晟曾指出，中国的ChatGPT们即便奋起直追，静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化，且进展速度远比追得速度要快，那么可能永远都追不上。直到对方遇到瓶颈不得不停下来，或者国内选手找到新的技术路径，才有可能打平。

AI，百度不能输的一战

相较于完美，文心一言更加注重“争第一”，李彦宏强调，“对标ChatGPT，百度是全球大厂中第一个”。

大模型带来了AI产业的变革，也将是未来十年的主流趋势，这已经成为了业界共识。

想要入场分羹的选手不少。自去年12月ChatGPT发布之后，无论是一级市场，还是国内外的大厂，都在发力大模型，研发类ChatGPT产品。

在国内一级市场上，投资机构为了投大模型公司，焦虑难安，行业几乎每天都会有大量认知的迭代。与之相应的是创业热潮，前美团联合创始人王慧文、出门问问CEO李志飞、前搜狗CEO王小川、前京东高级副总裁周伯文等一批大佬，都在杀向大模型赛道。

国内大厂们更是如此。除了百度之外，阿里、腾讯、华为、字节、科大讯飞、商汤都没有放弃大模型之战。

相较于其余互联网大厂而言，AI，是百度“不能输”的一战。王晟分析道，站在企业角度，腾讯、阿里等大厂，发力AI是给原有业务提供助力，但AI之于百度是生死问题，需要“殊死一搏”，也会用出“破釜沉舟”的力气来研发新产品。

来源/视觉中国

在百度的营收结构中，广告是大头，2022年占六成左右，但近几年，呈现萎缩局势，而且被阿里、腾讯等大厂超越。百度需要搜索引擎的变革来使得广告业务回温。另一方面，百度近几年在AI方面投入颇多，而且一直对外强调其AI能力，更是将以AI为特色的百度智能云当作重要增长曲线。

OpenAI在GPT-4发布后，通过ChatGPTPlus付费版以及面向企业开放接口，正从一家小型非营利性实验室向一家成熟的商业公司转变。Allen认为，百度作为互联网大厂，自身体量比较大，有很多业务线可以直接用上文心一言，享受商业化的红利。

此外，AI大模型时代的到来，也将带来大量产业机会。李彦宏在发布会上称，大语言模型带来三大产业机会：第一类是新型云计算公司，其主流商业模式从IaaS变为MaaS；第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们具有行业Konwhow（技术诀窍），调用通用大模型能力，为行业客户提供解决方案；第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。

尽管“文心一言”和ChatGPT相比或许还有差距，但并不意味着其没有发展空间。

一方面，能够发布一款成型产品，百度在国内争夺的第一，确实领先了其他同行。另一方面，在国内用户和企业较难顺畅使用ChatGPT的情况下，需要一款本土产品来提供服务。“技不如人”的情况下，百度还可以靠本土化取胜。李彦宏也提到，百度在没有完全准备好的情况下发布“文心一言”，是出于市场的需要。

考虑到信息安全和数据安全等因素，中国必须要有自研的AI大模型。王晟分析，由于AI算力的高投入和高技术门槛，目前中国能做语言类大模型的团队非常有限，有潜在能力做的只有10来个团队，最终能成的可能只有2-3家。

也就是说，百度或许并不需要和ChatGPT正面硬刚，只要在国内市场上能够占据领先位置，就能够享受中国市场所带来的红利和发展空间。

王晟认为，短期内，百度的“文心一言”或许没有达到市场预期，但从中长期来看，百度还是具备一定的竞争力。

新一轮AI范式变革，才刚刚开始。

*题图来源于视觉中国。

你觉得文心一言符合预期吗？

原标题：《百度“文心一言”，就这？》

阅读原文

李彦宏再提“车水马龙”，百度文心一言进展神速

5月18日天津举办的第七届世界智能大会上，百度创始人、董事长兼CEO李彦宏发表了题为《大模型改变人工智能》的演讲。在解释什么是“生成式AI”的时候，这位一向谦卑儒雅的科技大佬笑着玩起了梗，“比如给我画一幅车水马龙的图片”。

上网冲浪的小伙伴应该都有印象。3月16日，第一批用户涌入文心一言进行体验，紧接着“车水马龙”、“鱼香肉丝”、“夫妻肺片”“虎头虎脑的大胖小子”等神图纷纷冒了出来，成了社交媒体上流传的热梗。更有甚者当时猜测，百度文心一言是套壳国外的AI公司。一时之间不明真相的看客们纷纷被引导，站在道德制高点质疑百度的出发点与技术能力。

但事实是，文心一言在此后1天之内就迭代完成，“车、水、马、龙”成为了热闹的“车水马龙”。这就是生成式AI产品惊人的学习迭代能力，所有质疑都不攻自破了。这次大会上，李彦宏风淡云轻地拿来调侃，也体现了对文心一言的自信。

“车、水、马、龙”成为了热闹的“车水马龙”

那么到底什么是生成式AI，为何它的学习能力如此惊人？

生成式AI利用深度学习和神经网络等技术，通过学习大量数据的模式和特征，可以生成新的内容、数据或创造性作品。它可以应用于多个领域，包括自然语言处理、图像生成、音乐创作和艺术创作等。

举个简单的例子，借助文心一言的生图能力，人人都可以当画家。ARK数据显示，生成式AI可以让知识工作者的效率提升4倍。就实际体验来看，产品设计、海报制作、脚本生成、视频剪辑，甚至编织PPT等一系列办公室白领传统的“手艺活”都可以被取代。

这又引发了新的担忧：以往5个人的活，现在1个人就能干。AI抢走了打工人的饭碗，那我们会不会下岗？面对普遍的担忧，李彦宏觉得自己是乐天派，他相信人工智能不会让工作机会减少，反而带来全球经济的下一个增长奇迹。

01生产力革命

“街上，要隔一段很远的路，才有一盏粗陋的街灯，用绳子和滑轮吊着；到了晚上，点灯人把灯放下点着，然后又吊起来，一束昏黄的灯光就在人们头上无力地摇曳。”

狄更斯1859年出版的小说《双城记》里描写过这样一种职业：点灯人。他们的工作就是在天黑前点亮街道的灯，同时在天亮前熄灭它们。现在听起来很不可思议，一个灯泡开关的事情，居然这么费劲。直到19世纪末20世纪初，随着电力技术的发展和电力网络的建设，城市街道才抛弃了油灯、煤气灯，开始普及电灯照明系统。

点灯人下岗了，但夜晚从此长明。电力推动了一场生产力革命，电子、通信、能源、医疗相关产业迎来跨越式发展，无数新兴岗位涌现。工业化和城市化进程加速，人类进入电气时代。

回到现在，人工智能正在引领一场新的生产力革命。和历史上的工业革命类似，传统的岗位没了，但新兴的岗位会出现。画师下岗了，但prompt（提示词）工程师出现了。国际劳工组织称，至2030年世界还需要设立6亿多个新的岗位。这些新的岗位来自哪里，一定是来自创新产生的新产业。

所以最关心这场AI浪潮的，不是打工人，一定是创业者和管理者。因为大模型的出现，传统的商业规则将会被打破重写。因为人机交互方式的改变，大量的垂直、长尾需求将会被满足。以前是人围绕着机器，现在是机器围绕着人。以前的图形用户界面，需要用文本命令行进行人机交互。但是到了今天，我们可以用自然语言跟AI进行交互。只要思路活跃、表达清晰，机器就能给你干活儿。

传统的客服和营销方式将被重新定义。今天，大模型可以变成千人千面的AI助理，AI客服。即使你有70亿的客户，他们每一个人都可以拥有一个专属的客服，7X24在线，无所不知，无微不至。李彦宏认为，任何一个公司，谁拥有最佳的跟客户沟通的方式，谁就会拥有客户。

企业的组织形态也将颠覆，人数极简的特种部队作战式小公司会大批涌现。以前我们面试员工，会要求他能熟练掌握Office办公软件；以后我们面试员工，会要求他熟练掌握各种AI工具。

与之而来的，是AI原生应用的井喷爆发，也会带更多全新的商业机会。目前已经有AI原生应用面世了，比如Notion，是一个文档管理应用，它很多文档都是AI在生产；Jasper是一个营销策划、文档生成的应用；DoNotPay则是一个用AI帮人打官司的应用。

02浪潮之巅

人工智能时代，IT的技术栈发生方向性改变，从三层变成四层。

纵观全球范围的人工智能公司，只有百度进行了全栈布局。四层技术架构优势，在全球都是唯一的：芯片层为生成式AI优化，框架层飞桨占据中国深度学习框架第一，模型层有文心一言，应用层除搜索外，全面布局“车路行”智能化。全栈布局的优势是，能够实现层层反馈，端到端优化。

百度是全球大厂中第一个做出生成式AI产品的公司，早在2019年就发布了文心大模型的1.0，到现在已经有四年的时间。目前，排队体验文心一言的用户已经超过200万用户，几十万家企业申请测试文心一言。数据显示，文心一言发布一个多月，效率已经提升了接近10倍左右。

这仅仅是个开始。李彦宏认为，大模型将带来三大产业机会：一是新型云计算。以前云计算比拼的是算力、是存储，今天比的是模型和框架。

二是行业模型精调。每个行业都有自己独特的数据和对行业的独特理解，与基础大型结合，会产生强大的创造力，极大提升各行各业的效率。

三是应用开发。就像2011年前后的移动互联网时代，无数应用井喷。如今所有的应用都基于大模型开发，这可能是10倍于移动互联网的机会。

站在浪潮之巅的百度，已经在人工智能领域投入十年了，如今已经成为国内人工智能领域发展的最大推动者。截至2022年5月20日，飞桨开发者社区已经凝聚了477万开发者，创建了56万个模型，服务了18万家企业。智能驾驶方面的成绩也很亮眼，百度2023年Q1财报显示，2023年第一季度，百度的自动驾驶服务萝卜快跑订单量约为66万单，同比增长236%，稳居全球最大的自动驾驶出行服务提供商。

03人类才是创新的引擎

“人们完全误解了人工智能是什么。”风靡全球的AI绘图工具Midjourney的创始人DavidHolz说，大多数人把人工智能比喻成老虎，担心它会吃掉自己。但实际上，人工智能更像水。水很危险，但它也是文明的驱动力。

懂得如何与水一起生活和工作的人类，将有能力在水中游泳、做船、筑坝发电，从而更好地生活，因此，Midjourney的logo是一艘帆船，人类发动想象力的引擎驾驭它航行。

AI发展的目的不是超越人、取代人，一定是更好地被人所用，为社会服务。游荡在19世纪城市街道的点灯人，所到之处，给人们带来光明和安全。尤其在发明这一职业的巴黎，专业点灯人数量一度有5000多名，他们点亮了巴黎的夜空，被来访的英国人惊叹“光明之城”。如今，点灯人退出了历史舞台，但人们对美好生活的追求仍在继续，那就是让技术更好服务自身。

百度这么多年坚定不移地在人工智能领域投入，也是抱着相同的使命：用科技让复杂的世界更简单。众里寻他千百度，23年前，32岁的李彦宏毅然辞掉硅谷的高薪工作，抱着科技改变世界的梦想，回国创立了百度。如今新的生产力革命爆发，这家世界顶级的人工智能公司正站在浪潮之巅，全球瞩目。

但创新依旧在继续，在未来文心一言大模型将在各行各业找到好的应用场景，助推效率大幅度提升，一个“车水马龙”的繁荣生态正在成型。李彦宏说：“对人类最危险最不可持续的事情，就是关掉创新引擎，不发明不创造不进步，才是人类最大的威胁。”

以下为李彦宏演讲实录：

各位领导、各位嘉宾：我今天给大家带来的题目叫做《大模型改变人工智能》。刚才龚克也讲了，人工智能在过去这半年当中，受到的关注度比以前高了很多，最主要的是因为出现了生成式的人工智能。而生成式人工智能底层技术，实际上就是大模型。

那么大模型为什么会改变人工智能呢？是大算力、大模型、大数据，导致了智能涌现，什么叫智能涌现呢？过去的人工智能是，我想让机器学会什么技能，就教它什么技能。教过的有可能会，没教过的就不会。大模型出现所谓的智能涌现之后，以前没教过的技能，它也会了。这就是为什么有人讲，我们现在朝着通用人工智能方向发展。

与此同时，人工智能发展方向从辨别式走向生成式。什么叫辨别式？我们过去比较熟悉的人工智能的应用，基本上都是辨别式。比如说人脸识别，过来一个人，我识别这个人是谁，或者不是谁。这个是典型的辨别式。搜索引擎也是典型的辨别式人工智能。用户输入关键字或者一段话，他要找的东西，我们在全网进行匹配，哪一个网页，哪一段内容是他需要的，这是辨别式人工智能。

什么叫生成式人工智能？今天我想写一份申请书，你给我写一下。或者说，我周末请客，10个人，需要出一份菜单，这个无所谓对错，但是它能给你一些感觉，给你一些创意，给你一个好的基础去发展你的思路。或者说，给我画一幅车水马龙的图片。这种东西，过去人们不觉得是人工智能应该做的事，现在可以做了。

那么这样会导致什么呢？导致人们的工作效率大幅度地提升。比如说，在内容创作、客户服务、翻译这些工作，它的效率会大幅度地提升。所以我们也看到，很多研究机构都认为，在未来的10年，很多工作它的效率会成倍成倍的提升。同时也带来一些担心，是不是这样的效率提升，会使得很多人的工作就没了？这些人工作丢掉之后，会不会给我们人类带来不可预知的问题。

其实这个事儿我也讲过很久，最好的去探知答案的方法，实际上是回顾过去。因为很多人也觉得，人工智能是第四次产业革命的标志，我们可以看看之前的产业革命都取代了哪些工作？

200年前，从井下背水的工作基本上消失了。第一次产业革命是蒸汽机的发明，蒸汽机发明第一个应用就是采矿的水，怎么能够把它用机器弄上来。井下背水这些工作的消失，带来了什么？我们来看一下，实际上产生了很多新的工作。

这100年，我们看到世界人口出现了高速增长，跟之前的一两千年人口增长速度相比，快了很多。与此同时，人均GDP也几乎是在同样地快速增长。这说明什么？说明虽然有些工作机会没了，但是更多的机会出现了。人们工作效率的提升，可以养活更多的人，而每个人的生活又变得比以前更好了。从井下背水那个工作，真的不是什么好工作。

100年前，马车夫的工作消失了。这张图片是1913年纽约第五大道的一张图片，这张图片里几乎已经全部都是汽车，只有一辆马车。那会儿，纽约到处都是卖马肉的，马也没用了，后来出现了很多新的工作。1900-1990接近90年，同样的规律，世界人口继续高速增长，每一个人创造的价值继续高速地增长。

30年前，我们这一代人亲身经历，也就是我大学毕业前后，什么工作消失了？打字员的工作消失了。现在年轻一代没有见过打字机的，但也出现了很多新的工作。同样的规律，世界人口继续高速增长，人均GDP继续高速增长。

历史虽然不会重复，但是确实有它的规律。那么这一次，为什么那么多人会担心AI会让工作机会减少呢？我觉得是因为，大家能够看到现在的工作会消失，但是我们看不到什么新的工作机会会被创造出来。就像100年前、200年前那些人，看不到后来产生的新的工作机会一样。我个人是属于乐观派，我不担心大模型会导致人类工作机会减少、生活会变差。

那么大模型怎么重新定义的人工智能？刚才万钢主席也讲了，人机交互的方式发生了变化。其实过去几十年信息产业的发展，人机交互的方式发生了三次变化。

更早我们就不说了，命令行是我读大学读研究生的时候，主要的工作界面。人机进行交互，是通过命令行。我输入一个命令，它给我想要的反应。我当时觉得这个东西效率很高，但是大多数人不会这种操作。

更简单的人机交互方式是什么？是图形用户界面（GUI）。这个起码很多人能看懂了，比第一个要更友好一些。但它仍然不是最自然的交互方式。我要想搞清楚怎么重设一下电脑的自动睡眠时间，我得经过四级菜单，一层一层地点进去，才能找到这个位置。有多少人能记住四级菜单以后，每一个功能在哪？

人工智能的诞生，让我们可以用自然语言跟电脑进行交互。当我有需求的时候，比如说我想查一下上个月，2023年4月，我的公司每一个产品线，有哪些产品的毛利率超过了疫情前的水平？这样一个课题，在过去很可能需要我的助理花半天一天的时间才能获得。今天，如果计算机懂你的自然语言，一秒钟之内就可以给你一个表格。

大模型也会重新定义营销和客服。其实道理很简单，就是谁拥有最佳的跟客户沟通的方式，谁就会拥有这个客户。这个道理不是因为AI的产生，不是因为大模型的产生，只不过技术使得我们实现的可能性，变得比以前多了很多。今天即使你有70亿个客户，你的每一个客户也都可以有一个专属的7×24小时的、什么都知道的助理去服务他。

大模型是一个基础，大模型之上会有各种各样人工智能的应用。最近这段时间讨论比较热的是，AI时代的原生应用到底长什么样子？我给大家举几个例子：

比如说像DoNotPay，这是什么呢？比较典型的应用场景是人工智能律师。比如说，你在美国开车超速了，超速之后警察给你一个罚单，一般交几百块钱。其实你可以不交，你请一个律师帮你打官司，就可以不交了。但是请一个律师的钱，可能是罚单钱的两倍，所以你不请了。今天请AI当律师，你就可以不交那个钱。

Jasper是营销创意的生成工具，你的公司想要出什么样的创意，它来帮你出，所以效率高很多。

Speak是韩国的软件应用，实际上是教你学外语的，模拟各种场景，你要到餐馆点餐，跟对方谈判，你要跟对方怎么交互，上百种语言都可以做得非常好。

对于百度来说，我们的大模型叫文心一言，两个月之前发布的，应该说是在全球大厂当中是第一个发布的。之所以我们要尽快地发布出来，是因为市场有非常强的需求。目前有200多万的用户在排队等待进行测试，也有十几万家企业希望接入文心一言进行测试。

当然百度在这方面的投入，实际上不是刚刚开始的，不是这半年才开始的。我们从2019年发布了文心大模型的1.0，到现在已经有四年的时间。更早的时候，我们从2013年左右就开始人工智能投入了。

人工智能之所以有这么大的变化，其实不仅仅是它的应用场景的变化，实际上背后的技术栈也发生了非常根本的变化。

我们每个人都熟悉的IT的技术栈是这三层，底层是芯片层，典型的公司是英特尔、AMD、高通，它的芯片叫做CPU；中间层是操作系统，在PC时代就是Windows，在手机时代是安卓和iOS；上面是应用层，PC时代所有的人都给Windows开发软件，在移动时代所有的人都给安卓和iOS开发应用。

今天人工智能时代的到来，改变了这个格局。现在的IT技术栈变成了四层，底层仍然是芯片层，但是主要的芯片已经不是CPU，而是以GPU为代表的，新一代适合并行大规模浮点运算的芯片。上面我们叫做框架层，就是深度学习的框架，像百度的PaddlePaddle飞桨，META的PyTorch，谷歌的TensorFlow都是在这一层。再上面一层是模型层，今天的ChatGPT、文心一言等等，这些是属于模型层，以后AI时代的原生应用，都会基于大模型来进行开发。

这方面百度有比较明显的优势，我们在四层当中每一层都有比较领先的产品，比如说芯片层有昆仑芯。这个也做了有十年之久，最早是因为搜索应用需要，我们买别人的芯片，毕竟太贵了，所以自己开发了。框架层是飞桨，飞桨今天在中国的市场份额第一。在模型层是文心大模型，其实除了文心一言，它是对标ChatGPT的之外，我们还有很多行业大模型，如交通大模型、能源大模型等。应用层的话，像百度搜索等都是我们比较领先的应用。

这四层都有比较领先的产品或者技术，有什么好处呢？就是你可以进行端到端的优化，每一层可以给其他层反馈，根据这些反馈你可以综合的、统筹的去考虑怎么优化。

百度在芯片层的布局，就是昆仑芯，我们已经有两代产品，几万片的部署，无论是公司内还是公司外都在应用。昆仑芯第三代，会在明年年初上市。

在框架层，飞桨的框架在中国人工智能领域已经有了500多万开发者，也越来越获得大家的认同。

模型层刚才讲了文心一言，在各种使用场景都有不少的应用。未来，我相信会有更多的应用会基于文心大模型开发出来。

在应用层大家比较熟悉的是百度的搜索，百度不可能在应用层什么都做，我们除了搜索之外，还做了跟交通有关的应用。交通也是非常复杂，而且影响非常广泛的方向。

百度做的其实主要是两件事，一个是自动驾驶，或者是无人驾驶的技术，一个是智能交通。无人驾驶我们做了有十年时间，现在在武汉、在重庆都可以进行商业化的无人的运营。智能交通我们也做了有好几年了，在不少城市都证明了效果，通过智能的调整红绿灯变灯的时间，可以让我们的城市的交通效率有15%到30%的明显提升。五一长假之前最后一个工作日，很多人也注意到，北京是大堵车，从二环到五环，甚至在六环都是红的，唯一一片绿的是亦庄，亦庄有智能交通的人工智能系统，可以动态调整交通流，所以效率确实是被证明有明显的提升。

我们也很期待未来在大模型之上，会有各行各业各种应用能够找到好的应用场景，能够获得效率大幅度的提升。

最后，我想说对于人类来说，最大的危险，最大的不可持续，并不是创新带来的不确定性。相反的，我们停止创新，不发明不创造不进步，按照惯性走下去，所带来的各种各样不可预知的风险，才是人类最大的威胁。这就是为什么，百度在这么多年长期持续的在人工智能方面进行投入，也是我们为什么要把百度的使命，在多年前就定义成“用科技让复杂的世界更简单”。

谢谢！

本文作者刘思雨：超声波联合创始人&主编、和牛商业创始人，曾就职于多家知名互联网公司，长期关注TMT、AI、新消费领域，在社群运营、品牌战略和用户增长领域有一定的实战沉淀。

百度文心一言AI视频，潜藏版权风险 百度ai文心一言