博舍

华为盘古系列AI大模型即将上线 包括NLP大模型、CV大模型等 华为盘古ai大模型发布时间

华为盘古系列AI大模型即将上线 包括NLP大模型、CV大模型等

站长之家(ChinaZ.com)3月27日消息:根据华为云官网消息,华为旗下的盘古系列AI大模型即将上线,该系列AI大模型中的NLP大模型、CV大模型、科学计算大模型(气象大模型)已经标记为即将上线状态。

据悉,盘古大模型采用了深度学习和自然语言处理技术,并使用了大量的中文语料库进行训练。该模型拥有超过1千亿个参数,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。

其中,盘古NLP大模型是被认为最接近人类中文理解能力的AI大模型。其首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。

盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。

盘古气象大模型,气象预报精度首次超过传统数值方法,速度提升1000倍

盘古气象大模型提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。

(举报)

华为云All in盘古大模型,回应业界五大疑惑

7月7日下午,华为云在东莞举办的华为开发者大会2023(HDC.Cloud2023)上,宣布推出盘古大模型3.0,这是华为云自2021年4月正式发布盘古大模型后的最新进展。

由于华为是BATH等科技大厂中,最晚官宣大模型进展的企业,又选择了一条与OpenAI不同的道路——定位产业、大模型包含三层架构、多个模型。由此,华为的路线选择、大模型在行业市场的可商用性、华为发力点等,都引发业界广泛关注。

与OpenAI聚焦于GPT一个大模型不同,华为云盘古大模型3.0包含了三层架构、多个模型。为什么华为大模型与OpenAI的不一样?

在大会上,华为常务董事、华为云CEO张平安系统介绍了华为云盘古大模型的情况。华为云于2019年投入AI大模型研发,并于2021年发布了基于Transformer架构的盘古NLP中文大模型和阿语大模型。华为云称,与2021年发布的盘古大模型1.0相比,此次主要在架构、训练方法上进行了升级。

在华为云盘古大模型3.0架构中,第一层L0层有5个盘古基础大模型,不仅有今年最火的自然语言大模型,还有视觉大模型、多模态大模型、预测大模型、科学计算大模型。第二层L1层目前有多个行业大模型,既有基于行业公开数据训练的行业通用大模型,如政务、金融、气象等,也有基于行业客户自有数据,在盘古L0和L1上训练而来的企业专有大模型。第三层L2层是针对更多细化场景的模型,可以开箱即用。

为什么华为云会选择这样的道路?实际上,此前也有企业采用类似做法,“本质上是更容易实现行业闭环落地”,有业界人士认为,这是一个更平滑的技术路线。通过不同层模型间的飞轮效应,既可以把模型越做越大,也可以形成真实的行业落地和用户反馈闭环,让模型越来越有用,“而不是一上来就是万亿参数的大模型,却形不成用户反馈闭环”。

这轮大模型变革以语言大模型为主,但有人士注意到,从华为云基础大模型来看,除了语言大模型之外,还有预测、科学计算大模型这类比较专用、解决特定问题的模型。业界人士告诉数智前线,这些基础大模型之间能形成互补,也是目前演进的一个趋势——这一轮以语言大模型发起,逐步衍生出CV、多模态等大模型。张平安介绍,他们是考虑到行业客户不同应用场景、不同时延、不同响应速度的多样化需求而来。

值得注意的是,盘古大模型采用了“完全的分层解耦设计”,这是盘古3.0全新做的架构设计,也是此前各大企业推出大模型时未涉及的。根据张平安的介绍,这是为了更好地构筑一个商业模式——适配行业不同场景,必须要做到完全解耦。比如,有些企业只需要图像分析,不需要文案生成,基础大模型和能力集解耦后,他们就可以按需调用;甚至还有数据解耦,模型升级时,数据就可以复用;这个解耦架构,也实现了模型的并行迭代。

业界观察,自从OpenAI推出ChatGPT之后,美国绝大部分创新应用集中在C端。在中国市场,百度、阿里、商汤、科大讯飞、华为等科技大厂先后公布大模型最新进展。截至7月,全球已发布数百个大模型,中国有80多个。

业界观察,国内企业在大模型落地时,都结合自身在已有业务上的积累,虽然有些模型看着较为类似,但落地思路上有较大差异。比如,百度“文心一言”大语言模型,正在搜索、地图、音箱等方向上探索;同时也推出“文心千帆”大模型平台,争夺产业级市场。科大讯飞一面将大模型技术叠加到教育、办公智能硬件等成熟业务中,另一面也介入此前一直在做的医疗、教育等企业数字化市场。

华为云此次发布的盘古大模型3.0,则聚焦在行业市场,这也有赖于它在政企市场上的长期积累。张平安称,“AIforIndustries”是华为云坚持的方向,“盘古大模型,不作诗只做事”,这在一定程度上代表了产业界的声音。资深业界人士认为,ChatGPT核心并不是“Chat”,而是它的思维链、智能涌现、从感知到认知这些巨大的变化,它让人工智能的通用性有了眉目,而不像过去一个场景、一个场景地去提供AI技术。

实际上,虽然这一轮大模型是先在消费级市场引发风潮,让每个人意识到大模型的价值,但业界也达成共识,大模型是可能引发类似蒸汽机产业革命的技术范式变迁,因此,企业级市场也是商业竞争焦点。

张平安告诉数智前线,他们注意到OpenAI也有动作准备进入行业,“我觉得这才是正确的道路”。

虽然业界在进军行业,但由于目前大模型在企业级市场落地还处于早期阶段,各种问题也引发了“大模型远未达到可商用化程度”的说法。不过,从本次华为开发者大会上看,大模型落地的各种问题正在逐步解决,在产业中确实在发挥出价值。

举例来说,大模型的最大弊端之一是擅于“一本正经地胡说八道”,这对于严谨的行业应用是致命的。而这次华为云演示了对准确性要求严苛的金融业和制造业的落地进展。

在金融行业,工行在全国有4万多个网点、20多万网点的柜员,经常要帮助客户解决各种问题,需要在不同系统中进行多次查询。工行和华为正在紧密合作,通过盘古打造工行的金融大模型。

华为云EI服务产品部部长尤鹏介绍,在合作中工行首先提出,大模型协助网点员工办理业务时,第一要做到合规,这就意味着在用生成式大模型时,必须要能够溯源。第二是要准确,年利率如果是3%,绝对不能说成3.5%。由此,基于盘古大模型的的银行网点助手,将大模型的生成能力和检索能力进行融合,自动生成的办理流程和操作指导,都提供了检索来源。目前,原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。

在制造行业,无论是高精工艺,还是生产计划,都需要分毫不差,一旦出现错误,可能会酿成事故。盘古大模型已走进华为生产线,在学习了各种数据,包括能准确理解发给计划员的邮件,并转化为调度指令,再通过天筹AI求解器进行运算,现在1分钟可准确做出未来3天的生产计划。

大模型如何在要求精准的行业应用中不跑偏,仍是行业性挑战。目前业界都在进行探索改进。华为云战略与产业发展部总裁黄瑾称,除了要不断提升大模型的水平外,依赖现有高质量知识,包括外挂插件、搜索引擎、相关数据库、知识图谱、行业知识库等,都能在一定程度上保障大模型应用的精准和专业。而此前,包括微软在内的业界认为,当下大模型的定位“还是一个专家助手”,并非完全替代人。

一些行业企业还有一个疑惑,他们关注到一些应用如矿山,用的最多的是摄像头和图像分析,这真的需要大模型吗?业界人士告诉数智前线,实际上,大模型的出现,提升了政企客户的期望值。他们应用大模型,不再为解决单点问题,而是期望大模型充当企业智能化的“一个底座”。

从这次华为展示的盘古矿山大模型来看,覆盖煤矿的采、掘、机、运、通、洗、选等业务流程下的1000个细分场景,大模型将充当底座。在华为与深圳福田区政府的合作中,此前在数字政府1.0项目中,福田区建设了很多感知系统。现在,将这些系统接入大模型后,相当于给政务系统配上了智慧大脑,客户认为这才是数字政府2.0。

大模型在行业中的应用才刚刚开始,由于行业数据的可获得性及开放度不高,行业Know-how复杂等挑战,大模型在行业的落地进展较慢。张平安称,未来随着不断深入行业,华为云会推出更多行业大模型。而这也是当下竞争的关键。

业界看到,在推出大模型的企业中,他们的投入重点各有不同。在7月7日开发者大会上,张平安强调了大模型所需的各项根技术。他称,一方面大模型的创新来自模型本身创新;另一方面则必须依靠AI各项根技术,“如果没有算力技术、没有算子,没有开发框架,没有开发平台、工程平台,没有开放性,很难做到大模型好用,给各行业赋予价值”。

业界观察,华为不仅提及昇腾芯片,更强调上述软硬件根技术组成的昇腾云底座。由于行业中最成熟的GPU以及相关软件,华为都不可用,它转而发展全栈根技术:最底层是鲲鹏、昇腾为基础的AI算力云平台,之上是异构计算架构CANN、全场景AI框架昇思MindSpore,以及AI开发生产线ModelArts。“现在基于华为的AI根技术,我们大模型训练效能不仅不落后,还可以调优到业界主流GPU的1.1倍。”张平安在大会上透露了这个业界关注的数字。

7月7日,华为云也将昇腾AI云服务对外开放。华为云2000PFlops单集群的昇腾AI云服务在乌兰察布和贵安同时上线。昇腾云服务除了支持华为的AI框架Mindspore外,还支持Pytorch、Tensorflow等主流AI框架,框架中的90%算子,可以通过华为端到端迁移工具从GPU平滑迁移到昇腾。

有业界人士称,目前GPU之所以一卡难求是因为大家都急着用,未来随着多样化算力走向商用,AI算力将更为多元化。据悉,美团用30天时间,已将70多个AI应用迁移到了昇腾AI云。华为还与美团的开发人员一起,将美团30个算子进行了深度优化,AI算力的效能比原来提升了30%。

AI算力是一个堪称比摩尔定律发展速度还快的领域。目前,包括英伟达在内的企业都在风暴般研发新框架,拉升AI算力。张平安称,华为对AI根技术堆栈的发展是一条长期道路,除了大量自身技术外,还要与客户应用场景、算子结合。

张平安表示,为了帮助全球客户、伙伴、开发者训练和使用大模型,华为云致力于为全球客户打造世界AI另一极,为所有AI开发者提供新的选择。

目前,业界大模型处于快速演进状态。业界人士称,在过去几个月时间中,大模型在训练、推理方面,每天都有很大变化。

“我们内部做了一个非常激进的roadmap(技术路线图)。”张平安说,华为云现在是“Allin盘古大模型”,目标图制定得密密麻麻。他透露,这一阶段的路标更多的不在盘古大模型参数提升等方向,比如,在昇腾AI云服务上,华为云刚刚发布的2000PFlops单集群,如果按照一张加速卡算力是400T的话,集群规模是6000张卡。

另外,更为重要的是向行业深处的挺进速度,“这也是我们价值最大的路标图”。

张平安称,盘古大模型在中国市场成功之后,在海外也会继续拓展。在海外,既可以部署在华为昇腾云上,也可以经过合作伙伴的改造,部署在其他任何算力平台上。“盘古更加是个软件,它是一个AI的软件系统。”数智前线获悉,今年以来,华为在软件发展战略方面,内部也进行了多次大范围研讨,华为有意在软件领域成为一家成功的企业。

此外,华为云CTO张宇昕针对业界关注的盘古大模型开发问题进行了回复。盘古大模型没有采用开源技术,全栈技术为自主创新。

他介绍,从数据角度,L0基础大模型训练采用业界开放数据集。L1和L2面向行业的模型,采用了行业公开数据集以及行业客户授权的数据。在这个过程中,他们需要采用多项技术保证数据处理过程中的隐私保护、安全合规要求,确保知识产权等。而基于此,华为盘古大模型也将走商业闭源道路。

海量资讯、精准解读,尽在新浪财经APP

华为盘古大模型新进展,华为云AI首席科学家7000字演讲精华

智东西(公众号:zhidxcom)

作者|李水青

编辑|心缘

智东西4月8日杭州报道,今日,在由中国人工智能学会主办的人工智能大模型技术高峰论坛上,华为云AI领域首席科学家、国际欧亚科学院院士田奇出席现场,对华为盘古系列大模型的研发与应用落地情况进行了分享。

在论坛上,田奇谈道,华为在2021年就立项盘古大模型,目前在CV大模型、NLP大模型、科学计算大模型等领域都有技术和落地案例。他提出了一种将大模型像自动驾驶一样划分为“L0~L2”不同阶段的方式,并称大模型已成为应对AI应用碎片化的一种方式,将导致市场向大公司集中,产业规则及格局也可能随之改变。

在备受行业关注的NLP大模型方面,田奇谈及了盘古NLP大模型目前覆盖的智能文档检索、智能ERP、小语种大模型等落地领域,比如2022年刚交付了一个阿拉伯语的千亿参数大模型。

一、大模型成确定趋势,分L0~L2三个层级

AI正加速进入千行百业,田奇公布了一组数据:华为云过去几年的AI项目已超100个,其中30%已渗入核心生产系统,助客户盈利能力平均提升10%。现在随着AI迎来一波新浪潮,AI的渗透速度会大大增快。

田奇称,华为云在2020年就预判AI发展有以下两大趋势:

一是AI会从传统小模型发展到大模型的趋势,对应算力需求过去十年里增加了40万倍。大模型成为应对AI应用碎片化的一种方式,可能收编高度定制化的小模型,导致市场向大公司集中,产业规则集格局也可能改变。

二是AIforScience(AI赋能科研),AI与科学计算交汇。包括传统的气象、海洋、农业、地球科学、航空航天等领域开始从偏微分方程的方法拓展到AI方法,在这一领域华为云推出了气象、药物分子领域的多个行业大模型。

田奇说,大模型是对各行各业产业赋能的一个重要枢纽,华为把大模型赋能千行百业分成了“L0~L2”三个层级,分别对应基础通用模型、行业模型和细分场景任务模型。

二、2021年立项盘古大模型,赋能行业分三步走

田奇回顾道,过去几年,华为主要聚焦打造“盘古”系列的预训练大模型。大模型诞生分两个阶段:第一是预训练阶段,由海量数据来运行链路的通用底座基础模型。第二是针对下游的千行百业的具体的任务,基于行业数据进行微调。

同时大家也看到大模型为了越用越好,迭代也非常重要,如何实现大模型的增量学习、终身学习、应用全生命周期迭代,非常重要。因此华为布局了第三步:大模型的迭代。

从发展关键节点来看,华为于2021年开始立项做盘古大模型;2021年4月发布了盘古NLP大模型、盘古视觉大模型、盘古科学计算大模型;2021年9月,推出用于药物研发细分场景的大模型;2022年,与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。

对应到华为大模型赋能千行百业的层次,其基于底层一站式AI开发平台ModelArts建立了L0基础大模型、L1行业大模型、L2场景模型多层服务,通过系统化工程赋能行业。

三、CV大模型落地矿山,NLP大模型落地智能文档检索等

田奇谈道,在过去的2022年,华为盘古大模型主要是AIforIndustry(AI赋能产业),希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值,目前已有多个案例。

如下图所示,盘古CV大模型目前覆盖了工业质检、物流仓库监控、时尚辅助设计等行业;盘古NLP大模型覆盖了智能文档检索、智能ERP、小语种大模型等领域,比如去年交付了一个阿拉伯语的千亿参数大模型;盘古科学计算大模型也用在了气象预报、海浪预测等方向。

而后,田奇展开讲解了几个相关案例,覆盖矿山大模型、科学计算大模型、华为气象大模型等几个领域。

比如在与能源公司合作的盘古矿山大模型中案例中,矿井现场是一个40米长的采掘机,宽度仅2米左右,传统相机很难一下子捕捉到全部画面,只能用图中的种九宫格视频画面。通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业。

盘古矿山大模型还用在了煤矿的主运输皮带作业监控。煤矿被采集下来以后,它会通过一个主运输皮带,从地下传输到地上。按传统方法是通过工人配合作业,华为提出通过视频对作业的安全规范进行巡检,主运场景的异物识别精度达98%,煤矿作业场景动作识别准确率达95%,助井下安全事故减少90%以上;此外大模型还能进行轨道机车缺陷检测,比如掉链、脱落、裂痕等潜在不安全因素,人工检测成本较高,盘古大模型提供图像质量的自动评估、小样本的故障定位与识别等。

结语:大模型掀起AI新浪潮,大厂之战一触即发

当下,ChatGPT引发的AI新战场正在从国外推进到国内,AI大模型成为新的大厂一把手工程,不做大模型的大厂很有可能在新一轮洗牌中掉队。

随着百度的对话机器人文心一言、阿里的通义千问纷纷推出,在开放测试中展开激烈对打,作为另一大云厂商的华为云进展情况备受产业关注,答案或许也呼之欲出。

尽管本次田奇没有透露华为云对话机器人的进展,但从田奇的分享,我们能看到华为对大模型技术的前瞻布局和重视,作为大模型细分场景应用之一的对话机器人,应该也正在路上。

【华为盘古大模型及核心股逻辑】拓维信息 一、华为盘古大模型1、消息面华为盘古大模型4月将发布,远超 百度 文心一言, 拓维信息 、 特发信息 参与千亿算力搭建( 

来源:雪球App,作者:秉烛夜谈888,(https://xueqiu.com/7845750337/245502909)

一、华为盘古大模型

1、消息面

华为盘古大模型4月将发布,远超百度文心一言,拓维信息、特发信息参与千亿算力搭建(华为盘古NLP对标CHATGPT)

2、学习下盘古大模型

盘古大模型是由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。

1)盘古NLP大模型是业界首个千亿参数中文语言预训练模型,预训练阶段学习了40TB中文文本数据,是最接近人类中文理解能力的AI大模型。权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。

2)盘古CV大模型:30亿参数,10亿级图像,业界最大预训练CV模型,首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力:基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。

   业界最大预训练CV模型:30亿参数,10亿级图像

   判别与生成联合预训练:底层/高层视觉预训练任务通用

   100+场景验证:研发成本降低90%

   小样本学习性能领先:ImageNet10%标签分类精度业界第一

已在电力、金融等多个行业应用,国家电网无人机电力巡检:基于盘古CV大模型的智能缺陷识别,视觉预训练大模型助力下游缺陷识别,进一步提升巡检效果,缺陷样本标注代价减少85%;平均精度提升18%。浦发银行浦慧云仓:盘古CV大模型1个模型覆盖9种物流场景,监测收货、入库、在库和出库全流程。9种场景差异较大,大模型具备较强泛化能力。异常样本种类多、数量少,大模型可利用小样本数据取得高精准度结果。利用大模型的时空对齐能力,综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹。广发证券企业财务智能预警:2019年有496家企业被监管处罚、问询或被ST处理,利用盘古大模型预测出其中439家,覆盖率近90%,其中被监管处罚企业111家,盘古大模型全部命中,无一家遗漏。

盘古NLP大模型可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让AI开发由作坊式转变为工业化开发的新模式。我们认为,未来随着盘古系列AI大模型的上线,将持续赋能金融、电力、交通、气象、物流等行业,华为产业链及下游应用相关公司有望持续受益。

3、建议关注:

底座硬件:拓维信息、特发信息、四川长虹、神州数码、常山北明

底座软件:麒麟信安、中国软件

2B应用:

  金融:长亮科技、中科软、软通动力

  电网:智洋创新、东方电子

  其他:中科创达、赛意信息、东方国信

2C应用:金山办公、同花顺、科大讯飞、万兴科技、光云科技、当虹科技、视源股份

——————————

二、梳理一下核心逻辑股池(这个时候具体操作要注意情绪和技术走势)

1、拓维信息:华为盘古大模型,华为唯一“昇腾AI/鲲鹏计算+开源鸿蒙操作系统”的战略合作伙伴,2022年,拓维信息携手华为在8大节点算力中心做了布局,参与了长沙、重庆人工智能算力中心、全国一体化算力网络国家(贵州)主枢纽中心的建设,实现2022年上半年昇腾出货量位列华为合作伙伴第一。结合华为的盘古大模型,拓维信息也将基于软件能力及自研的AI中台优势,探索基于盘古大模型的AI行业应用创新,实现在AI领域“算力+模型+平台+应用”的整体布局。

2、特发信息:华为盘古大模型,鹏城云脑

3、晶瑞电材:光刻胶,国家基金增持,3月24日消息 晶瑞电材公告,参股子公司湖北晶瑞拟通过增资扩股方式引入战略投资者,国家集成电路产业投资基金二期、国信亿合基金、国信闽西南基金拟以现金方式向湖北晶瑞分别增资1.6亿元、3000万元、3000万元,增资完成后,潜江基金、公司、大基金二期、国信亿合基金、国信闽西南基金分别持有湖北晶瑞44.39%、23.9%、23.05%、4.32%、4.32%的股权。湖北晶瑞自成立以来一直致力于布局电子级双氧水、电子级氨水等半导体及面板显示用电子材料等。 

4、剑桥科技:海内外CPO,算力业绩,趋势龙,详细逻辑说过n遍了,买卖点都公开了,不详述【趋势玩法将成为常态,加强核心逻辑把握】剑桥科技成为长趋势牛股的可能性3月24日消息,剑桥科技已直接或通过通信设备制造商间接向微软供应高速光模块产品,“2023年,特别是下半年,市场预计将迎来800G光模块的快速上量,公司现有产能暂时能够满足800G光模块产品的生产需求,公司将持续根据客户需求提前规划和建设产能。”谢冲在谈及产能时表示。

5、昆仑万维:1)自研大模型,首期投入3亿,今年内推出,2)旗下Opera浏览器目前接入ChatGPT,且合作奇点智源,将在今年内发布中国版类ChatGPT产品

6、360:自研大模型,据传200亿,3.16日透露并有望在近期推出产品

7、拓尔思:媒体资讯、网络舆情、产业大脑等多个细分领域的行业大模型

8、科大讯飞:40个通用领域的系列中文预训练语言模型

9、汤姆猫:接入微软chat的,海外市场好的游戏

10、万兴科技:旗下视频创意软件WondershareFilmora新版本已全新接入ChatGPT母公司OpenAI相关服务,率先在视频创作领域集成AIGC新技术。

11、工业富联:由微软采购,负责组装服务器,AI拉动GPU服务器需求,工业富联作为AWS和Azure核心供应商受益,其在AWS中份额过半,且一直是AzureAI服务器的ODM厂商 

12、汉王科技:1)源于中科院,2)二波

13、中文在线:1)百度文心一言直接持股,2)和澜舟科技打造中文自主可控操作系统(澜舟科技,孟子大模型,李开复孵化,周明牵头,典型微软系背景)

14、首都在线:联合燧原科技研发自主大模型(燧原科技上海独角兽企业,估值120亿左右,大模型正在开发))

15、上海电影:收购控股股东优质资产新增IP运营业务,重视国有资产价值重估

16、返利科技:接入微软chat,电商导购APP基于ChatGPT人工智能技术,公司与OpenAI的接口已经升级至ChatGPT4.0版本,采用AI聊天对话模式为用户提供导购服务,目前,该款APP尚未正式上线,小范围用户可通过邀请码进行体验

17、掌阅科技:跳动字节系直接持股

18、彩讯股份:接入openai

19、创业黑马:阿里达摩院,唯一合作达摩院开源社区

20、蓝色光标:接入GPT4,蓝标传媒宣布与Microsoft广告达成战略合作并成为中国区官方代理商

$拓维信息(SZ002261)$ $中文在线(SZ300364)$ $三六零(SH601360)$ 

重磅!登Nature正刊后,华为云盘古大模型30来了

智东西(公众号:zhidxcom)

作者|李水青

编辑|心缘

智东西7月7日东莞报道,在今日启动的华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安宣布推出盘古大模型3.0,从通用大模型、行业大模型及场景模型“L0~L2”三个层面为行业提供大模型服务。

盘古3.0提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,预训练数据中包含了超3万亿tokens,推出了NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等全新能力集。

同日,华为云昇腾AI云服务在乌兰察布和贵安上线。张平安称,昇腾AI云服务可提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。昇腾AI云服务支持华为MindSpore以及PyTorch、TensorFlow等主流AI框架,支持便捷迁移。

▲华为云推出昇腾AI云服务

随着ChatGPT在全球爆火,当下全球已发布上百个大模型,中国内已有80多个大模型发布。华为云于2020年就启动盘古大模型立项,2021年4月推出盘古系列大模型,包括业界首个千亿参数中文语言预训练模型,并在当时就现场演示了对话机器人。然而,华为今年上半年却一直隐而不发,引起产业的关注。

为何华为云今年上半年一直没有消息?

张平安现场首先正面回答了这一问题。他说,华为盘古大模型“不写诗,只做事”,华为的理念是AIforIndustry(AI赋能产业),因此要将盘古大模型致力于深耕各个行业。盘古大模型在矿业、铁路、气象、金融、政务、制造、软件开发、数字内容生成等多个领域的落地成果在现场得以展示。

▲华为云团队现场演示政务大模型用于图文结合问答

现场,智东西与部分媒体对张平安等华为高管进行了采访。

当被问及华为云做大模型的差异化竞争力时,张平安尤其强调行业结合:“我们的科学家、数学家可以下到矿井、蹲车库、下田头,因此盘古真的是和行业的痛点深度结合而来,这是华为盘古大模型最大的优势。”就在昨日,国际顶级学术期刊《自然》(Nature)登载了华为云盘古气象大模型成果,与张平安的阐述形成呼应。

一、盘古3.0面世:NLP、多模态新升级,模型服务“开箱即用”

张平安说:“希望盘古大模型成为每个行业、企业和个人的专家助手,让工作更轻松。”盘古大模型3.0是一个面向行业的大模型系列,简单来说,主要通过以下“5+N+X”三层架构,在不同层面,构建不同的能力。

▲盘古大模型3.0的“5+N+X”三层架构

1、L0基础模型层:提供五大模型服务,NLP、多模态模型大升级

首先是L0基础模型层,包括自然语言处理(NLP)、视觉(CV)、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。

具体来说,盘古3.0为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

同时,盘古3.0提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。张平安说,无论多大参数规模的大模型,盘古提供一致的能力集。

▲盘古L0基础大模型层架构图

盘古大模型3.0的预训练数据中包含了超过3万亿tokens,使用超1000+TB数据训练,指令微调数据达千万级,因此也可以称之为“读万卷书”。

2、L1行业大模型层:行业通用大模型+客户专有大模型,“行万里路”

然后是L1层行业大模型。如果说最底层的基础模型是做好海量基础知识的学习,相当于“读万卷书”,打好基础;那么行业大模型、场景模型就相当于“行万里路”。

在L0基础大模型之上,针对不同行业和场景,客户可基于盘古3.0进行专项知识和经验的训练。一方面,L1层提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;另一方面,客户也可以基于自有数据,在盘古大模型的L0和L1层上训练自己的专有大模型。

▲盘古L1行业大模型层架构图

3、L2场景大模型层:专注细分场景,“开箱即用”

最后是L2场景大模型层。张平安说,华为云为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。

张平安谈道,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。

在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

此外,华为云2000PFlops单集群的昇腾AI云服务在乌兰察布和贵安同时上线。

据张平安称,昇腾AI云服务可提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。昇腾云服务除了支持华为的AI框架MindSpore外,还支持PyTorch、TensorFlow等主流AI框架,框架中的90%算子,都可以通过华为的迁移工具从GPU平滑迁移到昇腾。

▲张平安:盘古大模型3.0采用全栈自研技术

二、气象大模型登Nature正刊,盘古发力行业“不作诗只做事”

“盘古为行业而生,就要为行业着想,更好地服务千行百业的客户。”张平安说。

7月5日,国际顶刊Nature登载了华为云盘古气象大模型研发团队研究成果,成为近年来首篇以中国科技公司为唯一署名单位发表的Nature正刊论文。审稿人高度评价该模型:“华为云盘古气象大模型让人们开始重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”

本次,张平安谈及这一成果的行业落地情况。作为首个精度超过传统数值预报方法的AI预测模型,盘古气象大模型的预测速度也有大幅提升。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。

▲盘古气象大模型落地全球多地

除了气象大模型成果,张平安还在现场展示了盘古大模型在政务、煤矿、金融、制造、医药研发、铁路等诸多行业发挥的价值。

比如在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式。据称,盘古政务大模型对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。

在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。

▲盘古矿山大模型已在8个矿井复制使用

在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、超430种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。

在金融领域,盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。盘古大模型让数十万网点柜员都拥有自己的智慧助手。

在制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。

▲盘古大模型助力制造业降本增效

在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。

张平安说:“我们始终坚持AIforIndustries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。”

结语:深耕行业,国内大模型走深向实

回顾华为盘古大模型的发展历程,其在2021年就推出了NLP、CV、科学计算、多模态等基础大模型;于2022年4月推出盘古2.0,而后陆续发布了盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型、盘古矿山大模型等行业大模型。今日,随着盘古3.0的推出,其有望进一步推动大模型在行业真正走深向实,我们有望看到大模型落地行业的进程大大加快。

一手抓算力底座,一边加速大模型落地行业。可以看到,在当下“百模大战”的背景下,华为盘古大模型走出了一条相对差异化的道路。很多人都在问国内大模型与ChatGPT的差距有多大,但实际上Chat(聊天)仅仅是大模型的一个很小的能力,当下ChatGPT的访问量也在减少,以OpenAI为代表的公司下一步也需要在千行百业中探索大模型落地的真实刚需。当AI大模型落地进入深水区,或许在行业落地跑在前面的玩家更容易脱颖而出。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇