博舍

百度文心一言AI视频,潜藏版权风险 百度ai文心一言

百度文心一言AI视频,潜藏版权风险

本文来自微信公众号:IT时报(ID:vittimes),作者:孙妍,编辑:钱立富,原文标题:《百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴》,头图来自:视觉中国

3月16日,李彦宏携百度文心一言亮相,并宣布开放邀请测试。

虽然文心一言的能力受到了质疑,但毋庸置疑的是,百度是全球第一个挑战ChatGPT的大厂。李彦宏也已经预见,文心一言在与ChatGPT正面比较时会令大众失望,但百度认为,文心一言有两大优势:一是,画图、写长文、文字转视频等多模态生态能力是ChatGPT所不具备的;二是,文心一言具备中文理解能力优势。

但是,百度自诩的优势也许会成为文心一言所面临的大问题。近日,有网友在对百度文心一言AI作画功能进行大量测试后产生怀疑,认为其可能只是一个套壳的AI模型,先将用户的中文指令翻译成英文,然后用国外开源的AI模型生成作品。百度方面针对此回应表示,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。

不过《IT时报》记者发现,百度低调向百家号入驻作者开放的AI图文转视频功能存在版权风险:百度视频素材来源不明。但这一风险被转嫁至媒体及其他百家号作者,若被告侵权,作者将承担巨大的版权风险。截至发稿,百度没有对文心一言版权问题进行回复。

百度即将在今天(3月27日)上线文心一言云服务,届时,AI写作、AI作图、AI文字生成视频等功能都有可能对外开放,这些危险的AI生成作品,也许会把百度席卷至版权风暴之中。

一、AI视频潜藏版权风险

《IT时报》记者实测比较百度文心一言和微软必应ChatGPT后发现,文心一言在文学创作、商业文案创作、数理推算方面仍有较大的追赶空间。但正如李彦宏所言,百度文心一言的优势在中文理解和多模态生成能力。

李彦宏表示,文心一言目前版本已经能生成文字、图片和语音。生成视频因为成本比较高,还没有对所有用户开放,未来百度会逐步接入。但熟悉百家号创作的用户,不少都已经体验过这个功能,每天有几万篇文章通过这个能力转成视频内容在百度平台分发。

但是,巨大的版权风险正潜藏在这每天几万条根据文字自动生成的视频中。

百度AI文字转视频功能早在2022年3月就已在百家号低调上线,百家号作者鲜少第一时间发现,是因为这一功能是在发布文章时默认勾选。在默认勾选状态下,百度AI会自动根据文字内容寻找合适的视频素材,生成视频后并自动发布,其中文章配图只占10%以内的占比,其他视频素材均来自百度视频库。

这是属于文心一言AIGC(人工智能自主生成内容)的TTV(文本内容情感化分析)功能。危险的是,百度并未公开其AI视频素材来源。多位百家号工作人员向《IT时报》记者表示,的确存在版权风险,至于其视频素材来源,一部分由百度进行版权采买,一部分是公开CC0(放弃版权)素材,建议不发到百度站外,或关闭该功能。

目前,这些AI视频主要自动发布在百家号及百度好看视频平台,但可以下载。“如果在百度平台内,可能由百度来处理版权纠纷,但目前还没了解到有什么版权侵权的案例。”百度百家号工作人员向《IT时报》记者透露。

但在社交平台上,多名百家号作者表示,AI根据其文章自动生成的视频被投诉侵权,其账号信用分被扣至0分而被封禁。还有百家号作者表示,AI自动生成视频中疑似含有版权水印。

《IT时报》记者发现,百度AI视频库里还有不少电视台等媒体拍摄视频,但无处查询视频素材出处。

百家号只在图文转视频的相关权益说明中提到,“如果您是原创视频作者,那么您发布的图文为原创时,转出的视频会自动声明该视频为原创视频,并且视频的阅读收益归您所有。”

截至发稿,百度没有对文心一言AI视频来源等问题做出回复。

二、风险转嫁至作者

更不合理的是,百度可以无偿使用百家号作者上传的内容,又将版权风险转嫁给百家号作者。

百家号在平台服务协议9.7条中提到:“您使用百家号平台服务上传、发布或传输内容即代表了您有权且同意在全世界范围内,永久性地、不可撤销地、免费地授予百度及其关联方对该内容的存储、使用、发布、复制、修改、改编、出版、翻译、据以创作衍生作品、传播、表演和展示等权利;将内容的全部或部分编入其他任何形式的作品、媒体、技术中的权利;对您的上传、发布的内容进行商业开发的权利……以及再授权给其他第三方以上述方式使用的权利。”

作者供图

据此协议理解,百度有权使用百家号A作者上传的文字、图片、视频等内容,编入B作者的作品中,甚至用于商业用途,完全不需要得到A作者的授权,也不需要付费给A作者。

《IT时报》记者查询抖音及其他新闻媒体平台与作者签订的协议发现,并没有存在如百度百家号这般不合理的条款。

上海大邦律师事务所高级合伙人、知识产权律师游云庭解读认为,如果上述条款有效,那百度就可以使用这些视频素材,不构成侵权也无须支付对价,如果该条款被法院认定为无效,则百度对外使用就构成侵权。

而当该条款遇上AI生成内容,潜藏的版权风险将对百家号作者更加不利。游云庭认为,文字内容是媒体创作的,百度只是提供了技术服务,因为AI生成的视频是无权享受著作权的,所以知识产权应该归媒体所有。媒体发布的视频,对外应该由媒体承担责任,如果权利人起诉媒体就是媒体承担责任,如果权利人起诉双方共同侵权,则构成连带侵权责任。

“由百度提供模型,素材库按照百度的合同规则使用的情况下,发生侵权可能责任是百度的。这当中任何一个节点发生变化,可能就是使用者的责任或者共同责任。这里面变量很多,要看具体细节。判断依据是人工智能生成品是不是侵权,模型数据提供者和使用者有没有过错等。”

上海段和段律师事务所合伙人刘春泉认为,人工智能生成品有没有版权?与责任风险由谁承担?应该按照权利义务相一致原则来处理。纯粹人工智能生成品与动物按快门拍照片和大象画画一样没有版权。但是人利用AI作为工具制作的产品,符合法律规定的构成作品,可以受保护。

三、制作1条AI视频最低9.99元

《IT时报》记者发现,百度已经在进行文心一言的商业化尝试,而上述AI文字转视频的服务正是文心一言云服务的主要盈利点。

目前,百度大脑智能创作平台推出了两种会员套餐,视频创作会员1698元/月,智能写作会员198元/月。其中,视频创作会员的权益就包括每月50次图文转视频等。此外,图文转视频200条的报价是1998元,50条的报价是698元,20条的报价是298元,也就是说,1条图文转视频的价格最低是9.99元。

“目前不管是API还是线上售卖的套餐,我们都没接入素材库。”百度云客户经理没有正面回答文字转视频素材来源的问题,但就AI生成图片的版权问题回复表示:“AI生成内容的可版权性在法律上仍处于不确定状态,百度不限制您将生成图片用于商业用途,但您应确保自身使用行为的合法合规性,在享有生成图片使用权益的同时,自行承担使用生成图片的一切后果。”

截至3月27日,百度大脑智能创作平台显示,其自动创作文章已超200万篇,自动创作短视频已超15万条。

四、风口上的百度急了

“现在百度最卷的部门已经不是自动驾驶了,而是文心一言。”一位百度自动驾驶部门的员工说道。

基于20多年搜索业务的积累,百度建立起世界上最大的知识图谱,包含50亿实体、5500亿级事实,每天调用量超过400亿次。受益于百度知识图谱,文心大模型也成为全球首个知识增强千亿级大模型。研究表明,数据达到千亿级,大模型就可能发生“智能涌现”,但最快跑出ChatGPT的为什么不是百度?

过去10年,百度在AI领域投入超1100亿元的研发费用,2019年就推出了文心大模型ERNIE1.0。论起步时间,文心一言并不比ChatGPT晚,但论专注度,百度没有OpenAI聚焦。此前百度之前一直将最大的精力投向了自动驾驶,以及一系列的AI风口追逐,当初希壤也让百度争得了国内元宇宙“头号玩家”等名号。

“百度的主要收入还是搜索广告,这也是百度为什么着急做文心一言的原因之一。”一位百度昆仑芯的员工认为。

ChatGPT焦虑已经是业内的常态。

国内ChatGPT模型跟OpenAI的差距到底在哪里?“算法上还有细节要打磨,其次,高质量的文本数据还需要多积累。”一家研发GPT模型公司CEO对《IT时报》记者道出了多数国内ChatGPT从业者的现实和心态,“类ChatGPT的产品可能有版权上的顾虑,但先把技术用起来,以后再想办法更好地规范。”

不过,也有一家国内AI大厂的相关人士对《IT时报》记者表示,目前已跑出AI作图等ChatGPT大模型,但是主要考虑到版权等风险,没有快速上线。

五、AI版权风暴即将来袭

最近,网易旗下轻博客社区LOFTER上的大量创作者删档销号,退出平台,用行动抵制AI作画。起因是网易LOFTER上线AI作画功能“老福鸽画画机”,部分创作者认为该功能可能用到原创作者的画作,有侵犯版权之嫌。

对此,网易LOFTER强调“该功能训练集来自于开源,没有使用LOFTER用户的作品数据,并明确注明不得用于商业用途”。3月16日,网易LOFTER官微向创作者发出一份公开致歉信,为伤害了很多创作者而表达歉意。该AI作画功能已于3月8日下线,网易LOFTER单独设立的“AI内容冒充原创”反侵权投诉渠道,截至3月25日收到1148条举报投诉。

在国外,AI侵权问题已经引起社会关注。近日,《华尔街日报》等多家国外主流新闻媒体指控OpenAI及其聊天机器人模型ChatGPT未经许可使用新闻来源进行训练,并拒绝向媒体支付相关费用。

早在2022年,一名程序员起诉GitHub、微软和OpenAI,指控GitHubCopilot的AI编程工具抄袭代码。今年1月,一群艺术家起诉AI绘画StabilityAILtd、MidjourneyInc和DeviantArtInc,声称这些公司下载并使用了数十亿张受版权保护的图像,但没有获得艺术家的授权并对其进行补偿。

一场AIGC的版权风暴正在来袭。

2月15日,爱奇艺宣布将全面接入百度文心一言,双方将共同探索AIGC在内容搜索、内容宣发、内容创作工具、小说创作等业务上的应用。近期,文心一言开发的AI文档写作助手也将上线百度文库,作者只要输入主题及内容要求,AI写作助手就能帮助搜集资料、搭建框架、填充内容、理顺文档、制造亮点,最终生成范文。

李彦宏认为,多模态生成能力是ChatGPT不具备的能力,这是文心一言的优势。但是,百度一旦开放AI写作、AI作图、AI文字生成视频等,受到的版权类指控并不会比ChatGPT少。训练数据是否得到授权,AI生成作品是否涉嫌侵权等问题会接踵而至。

关于AI生成内容的版权问题正在业内掀起大讨论。

知识产权界绝大多数专家都认为,AI生成内容是不受版权保护的。中国社会科学院知识产权中心主任李明德认为,《著作权法》只保护人的作品,AI生成的内容不是作品,没有版权。只有个人使用存在免责情况,公司拿媒体的作品去训练AI,但没有拿到媒体的授权,就构成侵权,文字三四行就能构成作品,视频每一帧都是作品。

本文来自微信公众号:IT时报(ID:vittimes),作者:孙妍,编辑:钱立富

百度“文心一言”,就这

原创深燃团队深燃

深燃(shenrancaijing)原创

作者|王敏

编辑|金玙璠

“冲刺”一个多月后,百度文心一言终于来了,但刚出道就遭到群嘲。

3月16日下午,百度举行文心一言发布会,被寄予厚望的发布会居然没有产品现场演示,而是采用“Demo演示”的形式,用提前准备好的问题和答案做展示,瞬间引发众多吐槽。或许百度是吸取了谷歌的教训,看到其因Bard产品在演示中“翻车”导致市值一下子蒸发了1000亿美金后,才变得谨慎。

不仅如此,很多对新产品跃跃欲试的用户们,被“邀请码”阻挡在了门外。直到晚间,才有极少部分用户真正“尝鲜”。

深燃拿到邀请码后,第一时间实测了文心一言的“五大能力”,整体感受是,文心一言的大多数回答,还算流畅自然,产品达到可用水平,但对于部分基础问题,不能正确理解题意,更不要说给出准确答案,而且多轮对话能力也有所欠缺。

就在前一天,国内外还沉浸在对3月14日OpenAI新上线的GPT-4的讨论中。GPT-4比上一代准确性更高,解决问题能力更强,可以处理超2.5万字的文本,并支持图像输入,尽管现在图像输入还未对外开放,但这款产品已经拔高了用户对产品的标准。

在文心一言发布的当晚,微软再发“重磅炸弹”,举办了一场Microsoft365Copilot发布会,将GPT-4模型引入Office应用程序,举个例子,熬夜赶不完的论文Word、看不出数据联系的Excel表格,都可以找Copilot来帮忙。Copilot也被评价为,要颠覆打工人的工作方式。

自去年12月以来,中外大厂们都纷纷冲刺,试图追赶ChatGPT,百度被视为是国内比较有希望追赶ChatGPT的选手之一,两相对比,有部分用户表示看到文心一言时,觉得被迎头浇上一盆冷水。资本市场对百度的文心一言似乎也不买账,发布会进行过程中,百度股价一度下跌10%。截至3月16日收盘,百度股价报125.1港元,跌6.36%。

不可否认,作为国内第一款对标ChatGPT的产品,百度也算是勇敢的迈出了第一步。但此前百度铺天盖地的宣传已经拉高了外界预期,目前看来文心一言有些高开低走,让外界对其何去何从产生了质疑。

亲测百度文心一言,不够AI

从2月初官宣要集中“冲刺”,百度文心一言吊足了外界的胃口。

但在正式发布时,观众们的评价都是“文心一言,一言难尽”、“CheatGPT”等不太正面的言辞。

对于这次百度文心一言和ChatGPT的PK,英诺天使基金合伙人王晟对深燃形容道,就像是“ChinaPPTVSChatGPT”。

百度“文心一言”究竟怎么样?在发布会现场,百度创始人李彦宏从文学创作、商业文案创作、数理推算、中文理解和多模态生成五个方面举例展示了文心一言的能力。拿到邀请码后,深燃也从五大层面对文心一言进行了体验,并将部分答案与接入GPT-4的微软NewBing或基于GPT-3.5的ChatGPT进行了对比,试图得到一些结论。

在文学创作层面,在对于最近爆火电视剧《黑暗荣耀》的剧情总结时,文心一言的答案和剧情不太相符,NewBing的答案更贴近剧情。不过,在深燃提出将电视剧进行喜剧改编时,两个产品的表现都不算太好,但NewBing对于追问的回答,更加灵活。

图源/文心一言

图源/NewBing

在商业文案的创作能力上,我们让这两个产品分别给“文心一言”想一句广告词,文心一言设计的广告词词句更加优美,而NewBing设计的广告词更侧重于产品特性。

图源/文心一言

图源/NewBing

至于数学推理能力,对于小学奥数题的解答,文心一言给出了一个错误答案,NewBing的最终答案是准确的。

图源/文心一言

图源/NewBing

对于中文理解能力,让两款产品解读网友对于文心一言邀请码的调侃,结果是,文心一言和NewBing都没能精准解读其中的调侃意味,不过文心一言识别出了KFC是快餐品牌,还提醒不要将该邀请码和特定品牌关联。

图源/文心一言

图源/NewBing

在脑筋急转弯式的对话中,交给文心一言“要电话号码”的任务后,其在第二轮就忘记了,而ChatGPT还记得上一轮的隐藏任务。

图源/文心一言

图源/ChatGPT

在多模态生成方面,目前ChatGPT的识图功能还没对外开放。文心一言可以根据文字生成图片、语言和视频,但是这并非新功能,此前在百度的其他产品中也已经看到过。而且文字生成图片有时生成的图片并不精准。比如,本意是想获得一只阿拉斯加犬图片,但由于表述不够精确,最后得到的是一张动漫图片。

图源/文心一言

总结下来,从深燃的初步体验来看,“文心一言”没有达到惊艳效果,有时更像搜索引擎,回答问题的方式相对模式化,情感色彩流露较少,在回答问题的精准性、灵活性、上下文多轮对话等方面还有待提升。而基于GPT大模型的产品在语言组织和创造能力上更加灵活、流畅,交互性更强一些。

智能客服从业者Allen对深燃表示,仅从个人体验的主观感受而言,如果说ChatGPT能够提供正确答案的比例在90%,那么文心一言只有70%。不过,至少从用户体验的便捷度而言,文心一言之于国内用户,要比ChatGPT更加方便。

距离OpenAI,百度差了多少步?

对于“文心一言”的产品表现,百度创始人李彦宏略显底气不足,在发布会刚出场不久,就开始主动降低用户预期。他说道,“要对标ChatGPT、甚至GPT-4,门槛还是很高的”、“自己测试还是感觉有很多不完美的地方”。

产品的背后,国内大厂和OpenAI相比,差在了哪里,差距又有多大?

AI大模型之争最早是在国外科技巨头之间,此后国内大厂纷纷跟进。有专家分析称,在2020年中GPT-3发布后,双方差距进一步拉大,当时很多人认为不仅是技术的差距,更体现了AI模型的发展新理念。

在GPT-3的基础上,OpenAI进行了大量的微调和训练,增强交互性、更加产品化后,有了基于3.5版本的ChatGPT。

值得注意的是,3月14日GPT-4的发布,再次拉大了双方的距离。和上一代相比,GPT-4有很多跨越式提升,包括逻辑推理能力更强,比做题家更会考试;支持图像输入并能理解图像;能接收超大上下文,支持输入处理超过25000个单词的文本;更有创造力,能够写代码、写小说、编剧。

差距拉大的背后,是人才、资金投入和技术积累的差距。

来源/视觉中国

伴随着ChatGPT的火热,从业者们都表示,要做底层AI大模型,资金、顶尖科技人才、技术积累,这些要素缺一不可。

做大模型,前提是有资金的投入。OpenAI在2019年获得微软10亿美金的投入后,又于今年获得了微软100亿美金的投资,这让其有了烧钱的资本。业界测算,GPT-3涉及1750亿参数,训练费用约花费1200万美元。据国盛证券报告估算,GPT-3训练一次成本约为140万美元,每一次训练任务都耗资巨大。

此外,大模型训练的三要素包括大算力、大数据和大模型。有从业者指出,影响最后训练结果的因素有很多,包括清洗、标注、模型结构设计、训练推理的技术积累等。每一个因素的变化都影响着最后的结果。

过去十几年里百度一直在AI方面投入,包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。

但是,百度和OpenAI还有不小差距。李彦宏也表示,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理,需要多年的坚持和积累,没法速成。

王晟曾指出,中国的ChatGPT们即便奋起直追,静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化,且进展速度远比追得速度要快,那么可能永远都追不上。直到对方遇到瓶颈不得不停下来,或者国内选手找到新的技术路径,才有可能打平。

AI,百度不能输的一战

相较于完美,文心一言更加注重“争第一”,李彦宏强调,“对标ChatGPT,百度是全球大厂中第一个”。

大模型带来了AI产业的变革,也将是未来十年的主流趋势,这已经成为了业界共识。

想要入场分羹的选手不少。自去年12月ChatGPT发布之后,无论是一级市场,还是国内外的大厂,都在发力大模型,研发类ChatGPT产品。

在国内一级市场上,投资机构为了投大模型公司,焦虑难安,行业几乎每天都会有大量认知的迭代。与之相应的是创业热潮,前美团联合创始人王慧文、出门问问CEO李志飞、前搜狗CEO王小川、前京东高级副总裁周伯文等一批大佬,都在杀向大模型赛道。

国内大厂们更是如此。除了百度之外,阿里、腾讯、华为、字节、科大讯飞、商汤都没有放弃大模型之战。

相较于其余互联网大厂而言,AI,是百度“不能输”的一战。王晟分析道,站在企业角度,腾讯、阿里等大厂,发力AI是给原有业务提供助力,但AI之于百度是生死问题,需要“殊死一搏”,也会用出“破釜沉舟”的力气来研发新产品。

来源/视觉中国

在百度的营收结构中,广告是大头,2022年占六成左右,但近几年,呈现萎缩局势,而且被阿里、腾讯等大厂超越。百度需要搜索引擎的变革来使得广告业务回温。另一方面,百度近几年在AI方面投入颇多,而且一直对外强调其AI能力,更是将以AI为特色的百度智能云当作重要增长曲线。

OpenAI在GPT-4发布后,通过ChatGPTPlus付费版以及面向企业开放接口,正从一家小型非营利性实验室向一家成熟的商业公司转变。Allen认为,百度作为互联网大厂,自身体量比较大,有很多业务线可以直接用上文心一言,享受商业化的红利。

此外,AI大模型时代的到来,也将带来大量产业机会。李彦宏在发布会上称,大语言模型带来三大产业机会:第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS;第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow(技术诀窍),调用通用大模型能力,为行业客户提供解决方案;第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。

尽管“文心一言”和ChatGPT相比或许还有差距,但并不意味着其没有发展空间。

一方面,能够发布一款成型产品,百度在国内争夺的第一,确实领先了其他同行。另一方面,在国内用户和企业较难顺畅使用ChatGPT的情况下,需要一款本土产品来提供服务。“技不如人”的情况下,百度还可以靠本土化取胜。李彦宏也提到,百度在没有完全准备好的情况下发布“文心一言”,是出于市场的需要。

考虑到信息安全和数据安全等因素,中国必须要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技术门槛,目前中国能做语言类大模型的团队非常有限,有潜在能力做的只有10来个团队,最终能成的可能只有2-3家。

也就是说,百度或许并不需要和ChatGPT正面硬刚,只要在国内市场上能够占据领先位置,就能够享受中国市场所带来的红利和发展空间。

王晟认为,短期内,百度的“文心一言”或许没有达到市场预期,但从中长期来看,百度还是具备一定的竞争力。

新一轮AI范式变革,才刚刚开始。

*题图来源于视觉中国。

你觉得文心一言符合预期吗?

原标题:《百度“文心一言”,就这?》

阅读原文

 

李彦宏再提“车水马龙”,百度文心一言进展神速

5月18日天津举办的第七届世界智能大会上,百度创始人、董事长兼CEO李彦宏发表了题为《大模型改变人工智能》的演讲。在解释什么是“生成式AI”的时候,这位一向谦卑儒雅的科技大佬笑着玩起了梗,“比如给我画一幅车水马龙的图片”。

上网冲浪的小伙伴应该都有印象。3月16日,第一批用户涌入文心一言进行体验,紧接着“车水马龙”、“鱼香肉丝”、“夫妻肺片”“虎头虎脑的大胖小子”等神图纷纷冒了出来,成了社交媒体上流传的热梗。更有甚者当时猜测,百度文心一言是套壳国外的AI公司。一时之间不明真相的看客们纷纷被引导,站在道德制高点质疑百度的出发点与技术能力。

但事实是,文心一言在此后1天之内就迭代完成,“车、水、马、龙”成为了热闹的“车水马龙”。这就是生成式AI产品惊人的学习迭代能力,所有质疑都不攻自破了。这次大会上,李彦宏风淡云轻地拿来调侃,也体现了对文心一言的自信。

“车、水、马、龙”成为了热闹的“车水马龙”

那么到底什么是生成式AI,为何它的学习能力如此惊人?

生成式AI利用深度学习和神经网络等技术,通过学习大量数据的模式和特征,可以生成新的内容、数据或创造性作品。它可以应用于多个领域,包括自然语言处理、图像生成、音乐创作和艺术创作等。

举个简单的例子,借助文心一言的生图能力,人人都可以当画家。ARK数据显示,生成式AI可以让知识工作者的效率提升4倍。就实际体验来看,产品设计、海报制作、脚本生成、视频剪辑,甚至编织PPT等一系列办公室白领传统的“手艺活”都可以被取代。

这又引发了新的担忧:以往5个人的活,现在1个人就能干。AI抢走了打工人的饭碗,那我们会不会下岗?面对普遍的担忧,李彦宏觉得自己是乐天派,他相信人工智能不会让工作机会减少,反而带来全球经济的下一个增长奇迹。

01生产力革命

“街上,要隔一段很远的路,才有一盏粗陋的街灯,用绳子和滑轮吊着;到了晚上,点灯人把灯放下点着,然后又吊起来,一束昏黄的灯光就在人们头上无力地摇曳。”

狄更斯1859年出版的小说《双城记》里描写过这样一种职业:点灯人。他们的工作就是在天黑前点亮街道的灯,同时在天亮前熄灭它们。现在听起来很不可思议,一个灯泡开关的事情,居然这么费劲。直到19世纪末20世纪初,随着电力技术的发展和电力网络的建设,城市街道才抛弃了油灯、煤气灯,开始普及电灯照明系统。

点灯人下岗了,但夜晚从此长明。电力推动了一场生产力革命,电子、通信、能源、医疗相关产业迎来跨越式发展,无数新兴岗位涌现。工业化和城市化进程加速,人类进入电气时代。

回到现在,人工智能正在引领一场新的生产力革命。和历史上的工业革命类似,传统的岗位没了,但新兴的岗位会出现。画师下岗了,但prompt(提示词)工程师出现了。国际劳工组织称,至2030年世界还需要设立6亿多个新的岗位。这些新的岗位来自哪里,一定是来自创新产生的新产业。

所以最关心这场AI浪潮的,不是打工人,一定是创业者和管理者。因为大模型的出现,传统的商业规则将会被打破重写。因为人机交互方式的改变,大量的垂直、长尾需求将会被满足。以前是人围绕着机器,现在是机器围绕着人。以前的图形用户界面,需要用文本命令行进行人机交互。但是到了今天,我们可以用自然语言跟AI进行交互。只要思路活跃、表达清晰,机器就能给你干活儿。

传统的客服和营销方式将被重新定义。今天,大模型可以变成千人千面的AI助理,AI客服。即使你有70亿的客户,他们每一个人都可以拥有一个专属的客服,7X24在线,无所不知,无微不至。李彦宏认为,任何一个公司,谁拥有最佳的跟客户沟通的方式,谁就会拥有客户。

企业的组织形态也将颠覆,人数极简的特种部队作战式小公司会大批涌现。以前我们面试员工,会要求他能熟练掌握Office办公软件;以后我们面试员工,会要求他熟练掌握各种AI工具。

与之而来的,是AI原生应用的井喷爆发,也会带更多全新的商业机会。目前已经有AI原生应用面世了,比如Notion,是一个文档管理应用,它很多文档都是AI在生产;Jasper是一个营销策划、文档生成的应用;DoNotPay则是一个用AI帮人打官司的应用。

02浪潮之巅

人工智能时代,IT的技术栈发生方向性改变,从三层变成四层。

纵观全球范围的人工智能公司,只有百度进行了全栈布局。四层技术架构优势,在全球都是唯一的:芯片层为生成式AI优化,框架层飞桨占据中国深度学习框架第一,模型层有文心一言,应用层除搜索外,全面布局“车路行”智能化。全栈布局的优势是,能够实现层层反馈,端到端优化。

百度是全球大厂中第一个做出生成式AI产品的公司,早在2019年就发布了文心大模型的1.0,到现在已经有四年的时间。目前,排队体验文心一言的用户已经超过200万用户,几十万家企业申请测试文心一言。数据显示,文心一言发布一个多月,效率已经提升了接近10倍左右。

这仅仅是个开始。李彦宏认为,大模型将带来三大产业机会:一是新型云计算。以前云计算比拼的是算力、是存储,今天比的是模型和框架。

二是行业模型精调。每个行业都有自己独特的数据和对行业的独特理解,与基础大型结合,会产生强大的创造力,极大提升各行各业的效率。

三是应用开发。就像2011年前后的移动互联网时代,无数应用井喷。如今所有的应用都基于大模型开发,这可能是10倍于移动互联网的机会。

站在浪潮之巅的百度,已经在人工智能领域投入十年了,如今已经成为国内人工智能领域发展的最大推动者。截至2022年5月20日,飞桨开发者社区已经凝聚了477万开发者,创建了56万个模型,服务了18万家企业。智能驾驶方面的成绩也很亮眼,百度2023年Q1财报显示,2023年第一季度,百度的自动驾驶服务萝卜快跑订单量约为66万单,同比增长236%,稳居全球最大的自动驾驶出行服务提供商。

03人类才是创新的引擎

“人们完全误解了人工智能是什么。”风靡全球的AI绘图工具Midjourney的创始人DavidHolz说,大多数人把人工智能比喻成老虎,担心它会吃掉自己。但实际上,人工智能更像水。水很危险,但它也是文明的驱动力。

懂得如何与水一起生活和工作的人类,将有能力在水中游泳、做船、筑坝发电,从而更好地生活,因此,Midjourney的logo是一艘帆船,人类发动想象力的引擎驾驭它航行。

AI发展的目的不是超越人、取代人,一定是更好地被人所用,为社会服务。游荡在19世纪城市街道的点灯人,所到之处,给人们带来光明和安全。尤其在发明这一职业的巴黎,专业点灯人数量一度有5000多名,他们点亮了巴黎的夜空,被来访的英国人惊叹“光明之城”。如今,点灯人退出了历史舞台,但人们对美好生活的追求仍在继续,那就是让技术更好服务自身。

百度这么多年坚定不移地在人工智能领域投入,也是抱着相同的使命:用科技让复杂的世界更简单。众里寻他千百度,23年前,32岁的李彦宏毅然辞掉硅谷的高薪工作,抱着科技改变世界的梦想,回国创立了百度。如今新的生产力革命爆发,这家世界顶级的人工智能公司正站在浪潮之巅,全球瞩目。

但创新依旧在继续,在未来文心一言大模型将在各行各业找到好的应用场景,助推效率大幅度提升,一个“车水马龙”的繁荣生态正在成型。李彦宏说:“对人类最危险最不可持续的事情,就是关掉创新引擎,不发明不创造不进步,才是人类最大的威胁。”

以下为李彦宏演讲实录:

各位领导、各位嘉宾:我今天给大家带来的题目叫做《大模型改变人工智能》。刚才龚克也讲了,人工智能在过去这半年当中,受到的关注度比以前高了很多,最主要的是因为出现了生成式的人工智能。而生成式人工智能底层技术,实际上就是大模型。

那么大模型为什么会改变人工智能呢?是大算力、大模型、大数据,导致了智能涌现,什么叫智能涌现呢?过去的人工智能是,我想让机器学会什么技能,就教它什么技能。教过的有可能会,没教过的就不会。大模型出现所谓的智能涌现之后,以前没教过的技能,它也会了。这就是为什么有人讲,我们现在朝着通用人工智能方向发展。

与此同时,人工智能发展方向从辨别式走向生成式。什么叫辨别式?我们过去比较熟悉的人工智能的应用,基本上都是辨别式。比如说人脸识别,过来一个人,我识别这个人是谁,或者不是谁。这个是典型的辨别式。搜索引擎也是典型的辨别式人工智能。用户输入关键字或者一段话,他要找的东西,我们在全网进行匹配,哪一个网页,哪一段内容是他需要的,这是辨别式人工智能。

什么叫生成式人工智能?今天我想写一份申请书,你给我写一下。或者说,我周末请客,10个人,需要出一份菜单,这个无所谓对错,但是它能给你一些感觉,给你一些创意,给你一个好的基础去发展你的思路。或者说,给我画一幅车水马龙的图片。这种东西,过去人们不觉得是人工智能应该做的事,现在可以做了。

那么这样会导致什么呢?导致人们的工作效率大幅度地提升。比如说,在内容创作、客户服务、翻译这些工作,它的效率会大幅度地提升。所以我们也看到,很多研究机构都认为,在未来的10年,很多工作它的效率会成倍成倍的提升。同时也带来一些担心,是不是这样的效率提升,会使得很多人的工作就没了?这些人工作丢掉之后,会不会给我们人类带来不可预知的问题。

其实这个事儿我也讲过很久,最好的去探知答案的方法,实际上是回顾过去。因为很多人也觉得,人工智能是第四次产业革命的标志,我们可以看看之前的产业革命都取代了哪些工作?

200年前,从井下背水的工作基本上消失了。第一次产业革命是蒸汽机的发明,蒸汽机发明第一个应用就是采矿的水,怎么能够把它用机器弄上来。井下背水这些工作的消失,带来了什么?我们来看一下,实际上产生了很多新的工作。

这100年,我们看到世界人口出现了高速增长,跟之前的一两千年人口增长速度相比,快了很多。与此同时,人均GDP也几乎是在同样地快速增长。这说明什么?说明虽然有些工作机会没了,但是更多的机会出现了。人们工作效率的提升,可以养活更多的人,而每个人的生活又变得比以前更好了。从井下背水那个工作,真的不是什么好工作。

100年前,马车夫的工作消失了。这张图片是1913年纽约第五大道的一张图片,这张图片里几乎已经全部都是汽车,只有一辆马车。那会儿,纽约到处都是卖马肉的,马也没用了,后来出现了很多新的工作。1900-1990接近90年,同样的规律,世界人口继续高速增长,每一个人创造的价值继续高速地增长。

30年前,我们这一代人亲身经历,也就是我大学毕业前后,什么工作消失了?打字员的工作消失了。现在年轻一代没有见过打字机的,但也出现了很多新的工作。同样的规律,世界人口继续高速增长,人均GDP继续高速增长。

历史虽然不会重复,但是确实有它的规律。那么这一次,为什么那么多人会担心AI会让工作机会减少呢?我觉得是因为,大家能够看到现在的工作会消失,但是我们看不到什么新的工作机会会被创造出来。就像100年前、200年前那些人,看不到后来产生的新的工作机会一样。我个人是属于乐观派,我不担心大模型会导致人类工作机会减少、生活会变差。

那么大模型怎么重新定义的人工智能?刚才万钢主席也讲了,人机交互的方式发生了变化。其实过去几十年信息产业的发展,人机交互的方式发生了三次变化。

更早我们就不说了,命令行是我读大学读研究生的时候,主要的工作界面。人机进行交互,是通过命令行。我输入一个命令,它给我想要的反应。我当时觉得这个东西效率很高,但是大多数人不会这种操作。

更简单的人机交互方式是什么?是图形用户界面(GUI)。这个起码很多人能看懂了,比第一个要更友好一些。但它仍然不是最自然的交互方式。我要想搞清楚怎么重设一下电脑的自动睡眠时间,我得经过四级菜单,一层一层地点进去,才能找到这个位置。有多少人能记住四级菜单以后,每一个功能在哪?

人工智能的诞生,让我们可以用自然语言跟电脑进行交互。当我有需求的时候,比如说我想查一下上个月,2023年4月,我的公司每一个产品线,有哪些产品的毛利率超过了疫情前的水平?这样一个课题,在过去很可能需要我的助理花半天一天的时间才能获得。今天,如果计算机懂你的自然语言,一秒钟之内就可以给你一个表格。

大模型也会重新定义营销和客服。其实道理很简单,就是谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户。这个道理不是因为AI的产生,不是因为大模型的产生,只不过技术使得我们实现的可能性,变得比以前多了很多。今天即使你有70亿个客户,你的每一个客户也都可以有一个专属的7×24小时的、什么都知道的助理去服务他。

大模型是一个基础,大模型之上会有各种各样人工智能的应用。最近这段时间讨论比较热的是,AI时代的原生应用到底长什么样子?我给大家举几个例子:

比如说像DoNotPay,这是什么呢?比较典型的应用场景是人工智能律师。比如说,你在美国开车超速了,超速之后警察给你一个罚单,一般交几百块钱。其实你可以不交,你请一个律师帮你打官司,就可以不交了。但是请一个律师的钱,可能是罚单钱的两倍,所以你不请了。今天请AI当律师,你就可以不交那个钱。

Jasper是营销创意的生成工具,你的公司想要出什么样的创意,它来帮你出,所以效率高很多。

Speak是韩国的软件应用,实际上是教你学外语的,模拟各种场景,你要到餐馆点餐,跟对方谈判,你要跟对方怎么交互,上百种语言都可以做得非常好。

对于百度来说,我们的大模型叫文心一言,两个月之前发布的,应该说是在全球大厂当中是第一个发布的。之所以我们要尽快地发布出来,是因为市场有非常强的需求。目前有200多万的用户在排队等待进行测试,也有十几万家企业希望接入文心一言进行测试。

当然百度在这方面的投入,实际上不是刚刚开始的,不是这半年才开始的。我们从2019年发布了文心大模型的1.0,到现在已经有四年的时间。更早的时候,我们从2013年左右就开始人工智能投入了。

人工智能之所以有这么大的变化,其实不仅仅是它的应用场景的变化,实际上背后的技术栈也发生了非常根本的变化。

我们每个人都熟悉的IT的技术栈是这三层,底层是芯片层,典型的公司是英特尔、AMD、高通,它的芯片叫做CPU;中间层是操作系统,在PC时代就是Windows,在手机时代是安卓和iOS;上面是应用层,PC时代所有的人都给Windows开发软件,在移动时代所有的人都给安卓和iOS开发应用。

今天人工智能时代的到来,改变了这个格局。现在的IT技术栈变成了四层,底层仍然是芯片层,但是主要的芯片已经不是CPU,而是以GPU为代表的,新一代适合并行大规模浮点运算的芯片。上面我们叫做框架层,就是深度学习的框架,像百度的PaddlePaddle飞桨,META的PyTorch,谷歌的TensorFlow都是在这一层。再上面一层是模型层,今天的ChatGPT、文心一言等等,这些是属于模型层,以后AI时代的原生应用,都会基于大模型来进行开发。

这方面百度有比较明显的优势,我们在四层当中每一层都有比较领先的产品,比如说芯片层有昆仑芯。这个也做了有十年之久,最早是因为搜索应用需要,我们买别人的芯片,毕竟太贵了,所以自己开发了。框架层是飞桨,飞桨今天在中国的市场份额第一。在模型层是文心大模型,其实除了文心一言,它是对标ChatGPT的之外,我们还有很多行业大模型,如交通大模型、能源大模型等。应用层的话,像百度搜索等都是我们比较领先的应用。

这四层都有比较领先的产品或者技术,有什么好处呢?就是你可以进行端到端的优化,每一层可以给其他层反馈,根据这些反馈你可以综合的、统筹的去考虑怎么优化。

百度在芯片层的布局,就是昆仑芯,我们已经有两代产品,几万片的部署,无论是公司内还是公司外都在应用。昆仑芯第三代,会在明年年初上市。

在框架层,飞桨的框架在中国人工智能领域已经有了500多万开发者,也越来越获得大家的认同。

模型层刚才讲了文心一言,在各种使用场景都有不少的应用。未来,我相信会有更多的应用会基于文心大模型开发出来。

在应用层大家比较熟悉的是百度的搜索,百度不可能在应用层什么都做,我们除了搜索之外,还做了跟交通有关的应用。交通也是非常复杂,而且影响非常广泛的方向。

百度做的其实主要是两件事,一个是自动驾驶,或者是无人驾驶的技术,一个是智能交通。无人驾驶我们做了有十年时间,现在在武汉、在重庆都可以进行商业化的无人的运营。智能交通我们也做了有好几年了,在不少城市都证明了效果,通过智能的调整红绿灯变灯的时间,可以让我们的城市的交通效率有15%到30%的明显提升。五一长假之前最后一个工作日,很多人也注意到,北京是大堵车,从二环到五环,甚至在六环都是红的,唯一一片绿的是亦庄,亦庄有智能交通的人工智能系统,可以动态调整交通流,所以效率确实是被证明有明显的提升。

我们也很期待未来在大模型之上,会有各行各业各种应用能够找到好的应用场景,能够获得效率大幅度的提升。

最后,我想说对于人类来说,最大的危险,最大的不可持续,并不是创新带来的不确定性。相反的,我们停止创新,不发明不创造不进步,按照惯性走下去,所带来的各种各样不可预知的风险,才是人类最大的威胁。这就是为什么,百度在这么多年长期持续的在人工智能方面进行投入,也是我们为什么要把百度的使命,在多年前就定义成“用科技让复杂的世界更简单”。

谢谢!

本文作者刘思雨:超声波联合创始人&主编、和牛商业创始人,曾就职于多家知名互联网公司,长期关注TMT、AI、新消费领域,在社群运营、品牌战略和用户增长领域有一定的实战沉淀。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇