中国团队自动驾驶大模型斩获CVPR最佳论文；Stability AI推出新文生图模型自动驾驶人工智能的关键技术论文

发表时间：2023-06-24 08:48:32

中国团队自动驾驶大模型斩获CVPR最佳论文；Stability AI推出新文生图模型

原创AIGC要闻智东西

06/23

全球AIGC产业要闻

1、中国团队自动驾驶大模型斩获CVPR最佳论文

3、美国将成立生成式AI公共工作组

4、深度学习相关岗位平均年薪近42万元

5、5月份美国生成式AI职位发布量增长20%

6、AI创企获得新融资，Benchmark领投

7、AI视频编辑应用创企Captions融资2500万美元

8、纽约律师因用ChatGPT被罚款5000美元

9、京东7月13日发布京东大模型

10、海天瑞声定增布局AI大模型

11、郑中设计：部分设计师已尝试使用AI绘画工具

12、天舟文化：AI社交产品《PartyYoo》开发中

13、谷歌推出电子表格生成式AI功能

14、InflectionAI将推出新模型性能超过GPT-3.5

15、Shopify正测试由OpenAI技术驱动的翻译机器人

16、摩根大通任命投资银行老将负责推动AI开发

17、特斯拉官方推特新建与AI相关的推特附属账号

18、Snap聊天机器人MyAI互动用户超过1.5亿

19、埃森哲宣布扩大在AI领域的合作关系

20、AWS拟投资1亿美元设立生成式AI创新中心

21、OpenAICEO：全球监管可以帮助AI变得安全

22、斯坦福大学：AI模型或不符合欧盟规则草案

23、StabilityAI：训练AI模型需要更好的数据

24、Airbnb目标成为“终极AI礼宾服务”

25、德国媒体巨头高管：AI可以解放记者

1、中国团队自动驾驶大模型斩获CVPR最佳论文

6月18日-22日，国际计算机视觉顶会CVPR2023在加拿大温哥华举行。本届CVPR论文投稿总量达9155篇，最终共有2369篇论文被接收。上海人工智能实验室、武汉大学、商汤科技联合完成的自动驾驶研究论文《Planning-orientedAutonomousDriving》（以路径规划为导向的自动驾驶）斩获本届CVPR最佳论文奖（BestPaperAward）。

这是CVPR历史上第一篇以自动驾驶为主题的最佳论文。该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD，首次将检测、跟踪、建图、轨迹预测，占据栅格预测以及规划整合到一个基于Transformer的端到端网络框架下，更高效契合了“多任务”和“高性能”的特点，开创了以全局任务为目标的自动驾驶大模型架构先河。

2、StabilityAI推出新AI文生图模型SDXL0.9

知名生成式AI独角兽企业StabilityAI周四宣布推出SDXL0.9，称其是StableDiffusion文生图模型套件中最先进的开发。继4月份的StableDiffusionXLbeta版成功发布之后，SDXL0.9在图像和构图细节上都大大改进，可在消费级GPU上运行。该模型现在可以通过ClipDrop访问，API很快就会发布，SDXL1.0预计将于7月中旬开源。

SDXL0.9是所有开源图像模型中参数数量最多的模型之一，拥有一个35亿参数基础模型和一个66亿参数模型集成pipeline（通过在两个模型上运行并聚合结果创建最终输出）。pipeline的第二阶段模型用于向第一阶段生成的输出添加更精细的细节。

相比之下，测试版运行在3.1亿个参数上，只使用一个模型。SDXL0.9在两个CLIP模型上运行，其中包括迄今为止训练过的最大的OpenCLIP模型之一OpenCLIPvitg/14，它增强了SDXL0.9的处理能力和创建具有更大深度和1024x1024更高分辨率的逼真图像的能力。SDXL团队将很快发布一篇研究博客，详细介绍该模型的规范和测试。

3、美国将成立生成式AI公共工作组

据路透社报道，美国商务部周四表示，美国一家机构将成立一个生成式AI公共工作组，以帮助抓住新技术的机遇，同时制定应对其风险的指南。美国商务部下属的非监管机构美国国家标准与技术研究所（NIST）称，该工作组将吸收来自私营和公共部门的技术专家志愿者。

4、深度学习相关岗位平均年薪近42万元

据央视财经6月21日报道，面对这一轮人工智能技术的广泛应用，相关人才的供需矛盾日益凸显。某招聘平台数据显示，今年应届生人工智能新发职位在十几个新兴产业招聘职位里占比第一，同比增长超170%，其中深度学习相关岗位平均年薪近42万元，位居各类职位之首。无论应届生还是社会招聘，人工智能相关招聘需求在近三年都呈现大幅增长。

5、5月份美国生成式AI职位发布量增长20%

据路透社报道，根据就业门户网站Indeed的数据，5月份美国与生成式AI相关的职位发布量增长了约20%。在Indeed美国平台上，数据科学家职位占AI职位发布的5%，软件工程师、机器学习工程师和数据工程师等职位也很受欢迎。

Indeed表示，总体而言，美国的科技岗位比去年6月减少了43.6%，并补充说可用的AI岗位数量跟不上求职者的兴趣。其数据显示，5月份，生成式AI职位的搜索量从一年前几乎为零跃升至每百万职位搜索量中的147个。其美国网站显示了Meta、苹果、TikTok、Pinterest、亚马逊等公司的生成式AI职位列表。

6、AI创企获得新融资，Benchmark领投

据TheInformation援引知情人士消息，Benchmark领投了由前Salesforce联合首席执行官、前Facebook首席技术官BretTaylor和前谷歌高管ClayBavor创立的一家成立3个月的AI创企的首轮融资，估值超过1亿美元。

Taylor和Bavor的公司本轮融资至少2000万美元，投资方包括红杉资本。知情人士表示，该公司希望帮助企业使用AI，尚未得知进一步的细节。

Taylor和Bavor在2005年至2007年期间一起担任谷歌产品经理，之后Taylor于2007年以常驻企业家的身份加入Benchmark。之后，他创办了自己的第一家公司FriendFeed，后来被Facebook收购。

无独有偶，Benchmark在今年2月领投了对AI创企LangChain的投资，不久后，红杉资本以接近2亿美元的估值领投了这家创企的A轮融资。

7、AI视频编辑应用创企Captions融资2500万美元

据福布斯报道，美国AI视频编辑应用Captions周四宣布获得2500万美元B轮融资，由硅谷风险投资公司KleinerPerkins领投，红杉资本、AndreessenHorowitz和SVAngel参投。其累计融资达4000万美元，估值达2.5亿美元。

Captions成立于2021年。迄今已有大约300万创作者使用Captions应用程序自动添加字幕和编辑视频。该应用程序拥有约10万名日活跃用户，每月在该平台上创建约100万个视频。

8、纽约律师因用ChatGPT被罚款5000美元

一名美国地区法官P.KevinCastel周四对两名律师处以5000美元罚款。原因是这两名律师StevenSchwartz和PeterLoDuca在提交的一份法律摘要中使用了用AI聊天机器人ChatGPT生成的6个虚构案例引文，并在司法命令对其存在提出质疑后，故意回避，继续坚持这些虚假意见，向法庭做出了误导性陈述。

法官在周四的制裁令中写道，律师使用AI“提供帮助”并没有“本质上的不当”，但他表示，律师道德规则“要求律师扮演守门人的角色，以确保他们提交的文件的准确性”。

9、京东7月13日发布京东大模型

据京东黑板报6月21日发文，2023京东全球科技探索者大会暨京东云峰会定档“7.13”，届时将发布京东大模型，分享京东大模型应用实践，推出新一代数字基础设施，升级产品及解决方案。

10、海天瑞声定增布局AI大模型

6月21日下午，海天瑞声发布公告，拟定增募资不超过7.9亿元，用于AI大模型训练数据集建设项目、数据生产垂直大模型研发项目。

根据公告，本次定增项目拟建设AI大模型训练数据集，即生产用于通用型、及各种垂直领域大模型训练的海量、高品质数据集；拟购置办公楼作为建设大模型训练数据研发生产基地，并购置数据采集、数据处理、数据存储和办公等软硬件设备。海天瑞声称，这次定增项目建成后，将提供可供大模型训练和评测的不少于10个品类的专业数据集。

根据海天瑞声在互动平台的回复，其提供的训练数据覆盖智能语音（语音识别、语音合成等）、计算机视觉、自然语言等多个AI核心领域。海天瑞声最新披露的调研纪要显示，从目前一季度的情况来看，海天瑞声的大模型订单主要集中在强化学习阶段的数据处理需求，例如对prompt的内容回复续写、机器生成内容的评分等等。

11、郑中设计：部分设计师已尝试使用AI绘画工具

财联社6月21日电，郑中设计在机构调研中表示，公司研发人员紧跟行业发展态势，积极尝试使用前沿技术的工具，目前公司部分设计师也已经尝试使用AI绘画工具来提升工作效率，犀照科技也正在研发基于开源的StableDiffusion的AI应用，计划通过已有的设计案例数据，训练打造针对室内设计行业垂直领域的AI应用模型，目前相关计划尚处于探索阶段，未有相关商业化产品落地。

12、天舟文化：AI社交产品《PartyYoo》开发中

财联社6月21日电，天舟文化在互动平台表示，天舟高考是参股公司北京永载开发的基于高考的教学解决方案，积极探索AI相关应用、高考趋势分析、AI命题等。AI学情诊断还在开发中，并计划采取纸数融合的方式在一些地区逐步做试点；通过旗下基金管理公司天舟创投投资了麓卓互动，布局音舞类虚拟社交游戏，积极拓展海外游戏市场。AI社交产品《PartyYoo》开发中，计划第三季度开启测试。

13、谷歌推出电子表格生成式AI功能

谷歌今日凌晨宣布推出电子表格生成式AI功能，仅向WorkspaceLabs用户开放。谷歌Workspace的DuetAI可以帮助用户在谷歌电子表格GoogleSheets中，只需描述想要完成的任务，Sheets就会生成自定义模板。

14、InflectionAI将推出新模型性能超过GPT-3.5

在周四举行的彭博科技峰会上，AI独角兽创企InflectionAI宣布将发布一种新的大型语言模型Inflection-1，为其Pi聊天机器人产品提供动力。与OpenAI的ChatGPT相比，InflectionAI的Pi聊天机器人采用了更加个性化、情感化的方式。据悉，Inflection-1性能应该会超过OpenAI的GPT-3.5。

15、Shopify正测试由OpenAI技术驱动的翻译机器人

据BusinessInsider周四报道，在5月份解雇数千名员工几周后，Shopify正在为要求客户支持人员测试一个基于OpenAI技术的翻译机器人。员工们预计将于本月开始测试这个新工具，这个翻译机器人直接内置在Shopify的内部聊天工具Athena中，可将聊天对话从多种支持的语言翻译成英语。

16、摩根大通任命投资银行老将负责推动AI开发

财联社6月22日电，摩根大通任命TeresaHeitsenrether担任新的数据和分析部门负责人。首席执行官杰米·戴蒙称推动AI对公司未来的成功“至关重要”。根据戴蒙和总裁DanielPinto周三发布的内部备忘录，该任命即日生效。已经在摩根大通工作三十余年的Heitsenrether将继续向Pinto汇报工作，并成为该公司最高领导层的一员。

17、特斯拉官方推特新建与AI相关的推特附属账号

财联社6月22日电，特斯拉创建了一个名为TeslaAI的推特账号，并称“特斯拉正在制造自主机器人的基础模型”。

推特页面显示，该账号为特斯拉的附属账号，创建于2023年5月，并在当地时间周三发布了几条推文，分享关于特斯拉人工智能工作的一些细节。特斯拉CEO马斯克也关注了该账号并且转发了其中几条推文。

18、Snap聊天机器人MyAI互动用户超过1.5亿

Snap近日宣布，旗下视觉通讯应用Snapchat中的智能聊天机器人MyAI面向全球用户上线2个月以来，互动用户超过1.5亿，占到Snapchat7.5亿全球月活用户（MAU）的20%，收到来自用户的互动消息超过100亿条。

基于对美国、印度、法国、英国用户与MyAI对话的整体观察，Snap发布了MyAI早期用户数据洞察，分享当前Snapchat平台上流行的热点话题和趋势。

19、埃森哲宣布扩大在AI领域的合作关系

据新浪财经报道，埃森哲周三表示，继最近承诺在AI领域投资数十亿美元之后，该公司将扩大与Alphabet、微软和亚马逊公司的合作关系。此前不久，埃森哲宣布未来三年内将在数据和AI业务领域投资30亿美元。

20、AWS拟投资1亿美元设立生成式AI创新中心

据彭博社报道，亚马逊云科技（AWS）正在制定一项计划，投资1亿美元设立AWS生成式AI创新中心。该中心将免费为客户提供AWS内部的AI和机器学习专家，帮助来自医疗健康、金融服务、制造等行业的客户使用新技术构建定制应用、开发和部署新型AI产品。亚马逊称，Highspot、Twilio、瑞安航空（Ryanair）和LonelyPlanet将成为该创新中心的早期用户。

21、OpenAICEO：全球监管可以帮助AI变得安全

在周四举行的彭博科技峰会上，OpenAI首席执行官SamAltman再度呼吁全球对AI进行监管。SamAltman说，世界各地的立法者在监管AI方面应该谨慎，全球监管可以帮助它变得安全，这是一个比阻止它更好的答案。

他称AI是人类和科技“迄今为止最重要的一步”，世界必须管理新技术带来的风险，快速发展的AI技术“可能会在很多方面出错”。同时他也认为，利大于弊，“我们使用的是危险的技术，可能会经常以危险的方式使用”。

22、斯坦福大学：AI模型或不符合欧盟规则草案

据英国《金融时报》报道，斯坦福大学研究警告称，花费数十亿美元开发复杂新AI模型的公司，包括OpenAI、谷歌、Meta等，有违反欧盟技术规则草案的风险，可能与致力于遏制其风险的全球监管机构之间即将发生冲突。

“企业未能达到（规则草案）要求，尤其是在版权方面。”斯坦福大学基础模型研究中心的人工智能研究员RishiBommasani说，“如果基础模型正在生成内容，那么他们需要总结他们训练的哪些数据受版权保护。”他说目前大多数提供商在这方面做得尤其糟糕。Bommasani认为该行业更大的透明度将使政策制定者能够比过去更有效地监管AI。

由Bommasani领导的斯坦福大学研究根据欧盟关于描述数据源和总结受版权保护的数据、披露技术的能源消耗和计算要求以及与其相关的评估、测试和可预见风险的报告的规则草案，对10个AI模型进行了排名。每个模型在许多关键领域都表现不佳，10个提供商中有6个得分低于50%。

研究人员发现，OpenAI的ChatGPT或谷歌的PaLM2等封闭模型因受版权保护的数据缺乏透明度而受到影响，开源竞争对手或可公开访问的模型则更透明，但更难控制。在该研究中排名垫底的是德国的AlephAlpha和加利福尼亚州的Anthropic，而开源的BLOOM模型排名最高。

23、StabilityAI：训练AI模型需要更好的数据

在周四举行的彭博科技峰会上，StabilityAI首席执行官EmadMostaque呼吁各国提供更多开放数据，以帮助改进AI模型，并指出“垃圾”数据导致该技术效果不佳。他称AI是我们一生中最大的经济现象，但该行业仍在解决道德问题，并确保更好的数据来训练AI模型。

据Mostaque透露，StabilityAI目前尚未融资。此前彭博社3月份报道称，StabilityAI的估值目标是40亿美元。

24、Airbnb目标成为“终极AI礼宾服务”

在周四举行的彭博科技峰会上，全球民宿短租公寓预订平台Airbnb的首席执行官BrianChesky谈道，他预计AI将成为家庭共享旅游网站未来的核心，将参与“连接人们的业务”。Chesky说，Airbnb在AI领域的机会“围绕个性化而构建”，借助其收集的大量客户数据和旅行者留下的评论，“我们越了解您，我们就越能像终极AI礼宾员一样，为您指明地点、社区住宅、体验以及更多事物。”

25、德国媒体巨头高管：AI可以解放记者

据路透社报道，德国媒体巨头AxelSpringer的首席信息官SamirFadlallah称，AI将使记者能够将更多时间投入到核心报道中。“对于新闻编辑室来说，AI开辟了新的道路和自由。记者可以将繁琐的工作外包给AI，并将更多的时间和精力投入到核心任务上。”他透露说，AxelSpringer将“建设性地”解决围绕该技术的挑战。

（本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容，未经账号授权，禁止随意转载。）

原标题：《中国团队自动驾驶大模型斩获CVPR最佳论文；StabilityAI推出新文生图模型；京东大模型即将发布丨AIGC大事日报》

阅读原文

自动驾驶相关论文获全球最佳

加拿大温哥华当地时间6月21日，人工智能领域最有学术影响力的顶级会议之一——国际计算机视觉与模式识别会议（CVPR）2023公布了最佳论文等奖项：上海人工智能实验室、武汉大学及商汤科技联合提出的自动驾驶通用模型相关论文从近万篇作品中脱颖而出，获得本届CVPR最佳论文奖。

这是近十年来计算机视觉三大顶级会议中第一篇以中国学术机构作为第一单位的最佳论文。入围CVPR最佳论文候选名单的作品来自包括谷歌、上海AI实验室、斯坦福大学、康奈尔大学等在内的世界顶尖企业及机构。

在本届CVPR上，上海人工智能实验室以一篇最佳论文、一篇最佳论文候选、12篇论文入选“高亮（Highlight）”名单的成绩，在国际上充分展示了上海原创AI的实力。

万里挑一

我国科研团队

闪耀国际顶会

国际计算机视觉与模式识别会议在学术界及工业界都具有极为重大的影响力。根据“谷歌学术指标”2022年列出的全球最有影响力的六大科学期刊/会议中，CVPR位列第四，仅次于《自然》《新英格兰医学杂志》《科学》期刊，排在《柳叶刀》和《先进材料》之前。

CVPR每年评选出的一篇或多篇最佳论文，不仅是计算机视觉领域的顶级学术荣誉，更代表了将对行业发展产生重要影响的里程碑式研究成果。

今年的CVPR最佳论文近乎“万里挑一”。据CVPR大会公布，今年的投稿量达9155篇，创下历史新高。最终，大会共接收论文2359篇（接收率25.8%）。其中仅有12篇入选最佳论文候选名单（入选率1.3‰），提交机构不仅包括谷歌、StabilityAI等人工智能领域顶尖企业，也包括上海人工智能实验室、斯坦福大学、康奈尔大学、香港中文大学、香港科技大学、南洋理工大学等世界一流研究机构及高校。

在本届CVPR上，上海AI实验室有12篇论文入围“高亮（Highlight）”名单，覆盖视觉基础模型、通才模型、三维视觉、底层视觉、视频检索、物体检测、姿态估计、自动驾驶等大模型等相关领域的研究。其中，UniAD相关工作获最佳论文奖、三维物体数据集研究工作入围最佳论文候选。

“以原始创新引领技术突破，上海AI实验室作为人工智能领域的新型科研机构，致力于通过开展战略性、原创性、前瞻性的科学研究与技术攻关，实现从‘原创’到‘源创’的突破，目标成为享誉全球的人工智能原创理论和技术的策源地。”上海人工智能实验室主任助理乔宇告诉记者。

开创先河

感知决策一体化

自动驾驶大模型

在今年的CVPR最佳论文中，上海人工智能实验室联合团队提出了首个感知决策一体化的自动驾驶通用大模型，开创了以全局任务为目标的自动驾驶大模型架构先河，为自动驾驶技术与产业的发展提出了新的指引方向。

据介绍，自动驾驶是一项高度复杂的技术，不仅需要多个学科领域的知识和技能，包括传感器硬件、机器学习、多模态融合等内容，还需要适应不同国家与地区的道路规则和交通文化，与车辆及行人进行良好的交互，以实现高度的可靠性和安全性。

自动驾驶系统中包含三大主任务即，感知、预测和规划。当前，业界主流的方案架构分别采用不同的模块来处理这些具体任务，但由于各模块并非以驾驶为最终目标进行优化，因而自动驾驶系统的整体性能提升受到了很大限制。

在UniAD中，研究人员首次将感知、预测和规划等三大类主任务、六小类子任务（目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划）整合到统一的端到端网络框架下，实现了全栈关键任务驾驶通用模型。在真实场景数据集下，UniAD的所有任务均达到“领域最佳性能”，尤其是预测和规划效果远超之前的最佳方案。其中，多目标跟踪准确率超越“领域最佳性能”20%，车道线预测准确率提升30%，预测运动位移和规划的误差则分别降低了38%和28%。

上海人工智能实验室青年科学家李弘扬介绍，凭借其充分的可解释性、安全性、与多模块的可持续迭代性，UniAD是目前为止最具希望实际部署的端到端模型。基于UniAD的纯视觉自动驾驶方案可为产业界提供全新的研发思路，在节省大量硬件成本的同时，有助于提高出行的安全性与舒适性。该科研成果在产业界的落地应用，将有力地推动自动驾驶技术与产品的规模化发展。

本报记者郜阳

海量资讯、精准解读，尽在新浪财经APP

中国团队自动驾驶大模型斩获CVPR最佳论文；Stability AI推出新文生图模型 自动驾驶人工智能的关键技术论文