大语言模型 (LLM)
NeMoMegatron是一种端到端框架,用于训练和部署具有数十亿或数万亿参数的LLM。
容器化框架可依托数千个GPU提供高训练效率,使企业能够构建和开发大规模模型。该框架提供各种功能,以便您整理训练数据、训练高达数万亿参数的大型模型、使用提示学习进行自定义,以及使用NVIDIATriton™推理服务器进行部署,进而在多个GPU和多个节点上运行大规模模型。
NeMoMegaton经过优化,可在NVIDIADGX™Foundry、NVIDIADGXSuperPOD™、AmazonWebServices、MicrosoftAzure和Oracle云基础架构上运行。
蚂蚁集团开发自己的人工智能大语言模型
有消息称,阿里巴巴的金融子公司蚂蚁集团正在开发自己的大语言模型,或LLM,称为贞仪。然而,该公司没有提供更多信息,蚂蚁集团拥有全球最大的移动支付平台之一支付宝。
在微软(Microsoft)支持的OpenAIChatGPT发布之后,包括阿里巴巴、商汤科技和百度在内的中国公司都推出了自己的生成式人工智能服务。根据最近的一项研究,在过去的三年里,中国企业已经推出了79个大预言模型,以提高他们的人工智能技术能力。
6月初,有报道称,阿里巴巴正在将其最新的人工智能(AI)系统构建到其即时通讯应用钉钉和一个名为听悟的会议助手中。阿里云的大语言模型“通义千问”现在与新版本的“通义听悟”助手进行互动。