强化智能算力集群供给,夯实人工智能算力基座 深圳算力规模位居全国前三
转自:深圳商报
深圳新闻网2023年6月20日讯(深圳商报首席记者王海荣)近日,国际高性能计算领域针对存储性能的权威排行榜IO500在德国汉堡举行的全球高性能计算领域盛会ISC23揭晓,鹏城实验室牵头研制的“鹏城云脑Ⅱ”连续6次蝉联冠军。与此同时,位于光明区的国家超级计算深圳中心(深圳云计算中心)二期工程进展顺利,项目的基坑部分施工已进入尾声。强化智能算力集群供给,这是《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》提出的首要任务。通过积极布局算力基础设施,深圳正不断夯实人工智能高质量发展的算力基座。深圳算力阵营加速扩容算力是大数据时代的生产力,更是支撑国民经济发展的源动力。伴随数字经济的高速发展,特别是人工智能的爆发,整个社会对算力的需求呈现快速增长态势。国际数据公司(IDC)在《2022全球计算力指数评估报告》中指出,中国的算力产业规模和多样性目前正持续高速增长,2018年-2022年,北京、杭州、深圳的算力规模位居全国前三。扩充算力规模正成为区域中心城市经济发展的必然要求。据了解,深圳的算力基础设施建设以政府、电信运营商、大型互联网企业、独立第三方为主力,算力产业链代表性企业广泛分布于半导体装备制造、算法与技术研究、算力应用与服务等领域,包括国家超算深圳中心、鹏城云脑、弈峰科技数据中心、腾讯云等算力集群。2009年获批成立的国家超算深圳中心自投入运营以来,已在科学计算、工程计算、生物医药、动漫渲染、海洋石油、智慧城市等领域支持科技创新。去年11月14日,国家超算深圳中心二期项目在光明科学城大科学装置区开工,该项目是科技部和深圳共同布局的重大创新基础设施,项目用地面积约4.6万平方米,建设周期从2022年至2025年,将建成新一代E级超级计算机,实现大规模科学计算、工业计算、专业大数据处理及智能超算创新服务。2022年3月,世纪华通旗下控股子公司建设的深圳弈峰科技数据中心在深圳光明区电达谷源产业园动工。该数据中心计划部署12000台机柜,重点服务头部互联网企业、大型金融企业、政府机关及各类行业龙头。今年5月29日,这个规模庞大的数据中心项目建设有了新进展。世纪华通在公告中提到,旗下深圳数据中心项目预计将于2023年下半年步入首批交付机柜的运营期,并开始产生营业收入。雄厚产业为算力提供练兵场数据、算法、算力并称为人工智能三大核心要素。伴随“东数西算”工程的深入推进,我国算力产业迈入高速发展阶段,逐步形成了新的技术体系,推动新业态的兴起与发展。深圳完备的产业集群,尤其是重点培育发展壮大20个产业集群和八大未来产业,为算力提供了广阔的练兵场。2023年深圳政府工作报告提出,将建设数字经济核心区,高标准打造智慧城市,夯实以城市信息模型为核心的全市域统一时空信息平台和数字化底座。5月31日印发的《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》提出,强化智能算力集群供给,建设城市级智能算力平台。实现“算力一网化、统筹一体化、调度一站式”,全市可统筹的公共智能算力及相关网络带宽保持国内领先水平。同时打造大湾区智能算力枢纽,建设企业级智能算力平台。国家超算深圳中心主任冯圣中认为,超算中心是支撑、发挥新基建协同效益,带动新一代信息技术、人工智能、新能源、新材料、药物研发等新兴产业发展的重要一环,在产业协同中,将催生出更多产业形态,形成集群效应。据介绍,通过联合南科大、港中大(深圳)、深圳湾实验室、儿童医院、深圳计算科学研究院等高校与科研机构,超算中心支撑能源材料、防灾减灾、城市安全、生命健康等领域的研发与应用。同时,支持深圳公安、卫健、气象等部门的民生服务和业务管理能力提升。“在支持传统应用领域之外,我们也将投入大量人力和资源布局新应用领域,当前建设的超算中心二期将把新型人工智能领域应用作为一个重要的发展领域。”国家超级计算深圳中心主任助理王正璐透露,未来超算行业将就传统超算和智算相结合的发展方向进行更多尝试和探索。“深圳智算”实现服务输出不久前在IO500排行榜中问鼎的“鹏城云脑Ⅱ”是由鹏城实验室牵头研制的人工智能大型科技基础设施。公开信息显示,“鹏城云脑”的建设以开放共享和支撑产业创新发展为目标。试运行期间,约70%的机时服务于鹏城实验室以外的企业、高校、科研院所,已支撑近千个国产AI模型训练。同时,以“鹏城云脑”为初始枢纽的“中国算力网”已接入20余个大型智算、超算、数据中心,汇聚异构算力达3E,其中自主研发的AI算力超1.8E,初步实现了全国大型算力的协同调度与高效计算,并为下一代宽带通信和新型网络的创新提供驱动力和试验场。《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》提出,积极有序集聚政府、企业、科研机构、高校等的智能算力资源,与周边城市加强智能算力合作,谋划共建粤港澳大湾区智能算力统筹调度平台。事实上,今年以来,“鹏城云脑”的智算服务已成功实现服务输出。5月22日,第四届广东人工智能发展论坛暨2023新一代人工智能院士论坛在广州举行,论坛上发布了鹏城·星云系统和鹏城·星方数据集。其中,鹏城·星云系统作为面向遥感和天文的科研云平台,是依托“鹏城云脑Ⅱ”构建的,能提供多域多模态数据智能生产服务、多域AI+学科算法研究服务和跨学科协同研究交流服务三大功能。鹏城实验室分别与国家遥感中心、广州大学签署合作备忘录和合作协议,将运用鹏城·星云系统,在空天信息、人工智能等领域,共同开展国际科技创新和合作研究。5月29日,在韶关举行的第二届粤港澳大湾区(广东)算力产业大会暨首届中国算力网大会上,鹏城实验室主任、中国工程院院士高文介绍,实验室将推出人工智能通用大模型——“鹏城·脑海”,依托“鹏城云脑”及“中国算力网”构建的超大规模国产化算力底座,打造国产化AI通用大模型,实现“算力-数据-算法”全链条的自主可控、安全可信、开源开放。记者注意到,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》明确提出,鹏城云脑Ⅲ项目2023年年底前启动建设。可以预见的是,新一轮算力大潮将席卷深圳。海量资讯、精准解读,尽在新浪财经APP营造人工智能大模型产业生态
推动人工智能大模型产业化应用是提升国家竞争力的关键举措。要抢占人工智能大模型产业发展制高点,必须加强战略规划和深度治理,推进新型算力生态基础设施建设,打造稳定可靠的算法开源生态。
不久前举办的中关村论坛人工智能大模型发展分论坛发布的《中国人工智能大模型地图研究报告》提出,我国自2020年进入大模型快速发展期,目前与美国保持同步增长态势。当前,我国人工智能大模型已发布79个。此前召开的中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。推动人工智能大模型产业化应用,是加快实现我国人工智能领域高水平科技自立自强的应时之举,也是推动我国产业优化升级、实现经济高质量发展的重要一招,更是提升国家竞争力、维护国家安全的关键举措。
营造良好的人工智能大模型产业生态,应着力解决目前我国人工智能大模型发展面临的高端算力技术不可控、大规模高质量数据集少、算法可靠性和可解释性弱等核心问题。目前,由GPU、FPGA、ASIC等加速芯片异构而成的人工智能高端算力芯片技术面临“卡脖子”风险。在高效低碳的算力网络基础设施方面,跨省域互联互通与动态调配的机制尚未建立,规模化的高端算力供给能力亟待提升。同时,高质量数据供给不足影响了大模型“智商”。这体现在高价值公共数据开放程度不足、行业及企业数据要素市场化流通不够充分、用于大模型训练的数据集规模较小等。此外,算法可解释性不强也影响了大模型的产业化应用。拥有千亿级参数的大模型算法,开发难度大、训练难度高、决策过程及结果的可解释性差、合规评估难,直接对行业大模型开发的进程有所影响。
基于此,要抢占人工智能大模型产业发展制高点,必须加强源头技术创新,打赢软硬件基础设施国产化攻坚战,化解大模型关键核心技术被“卡脖子”的风险,多措并举推动人工智能大模型产业化应用。
首先,推进新型算力生态基础设施建设。实施高端算力芯片研发重大专项扶持计划,鼓励头部企业联合高水平大学“揭榜挂帅”。建立新型研发机构,推动国产高端算力芯片实现突破。在国家“东数西算”工程背景下,推动新型算力网络基础设施建设的顶层设计,建设国家公共算力开放创新平台,搭建算力生态链,推动全国算力资源互联互通、协同共享与优化配置。
其次,构建规模大、质量高的数据生态。完善国家公共数据开放标准和平台,推动高价值公共数据开放与多元化授权运营,引导行业、企业大数据有条件开放、融通并进场交易,形成多模态、多领域的大规模数据集。打造数据集精细化标注的众包服务平台和数据质量评估标准体系,建设高质量中文语料库。构建敏感领域数据隐私保护的监管体系和技术服务体系。
再次,打造稳定可靠的算法开源生态。建立大模型算法及工具开源平台,完善具有稳定性、可靠性和安全性的算法监测标准和技术体系。实施行业大模型产品和服务的登记备案、安全评估及潜在风险预测的审查机制。鼓励平台企业积极开展算法创新探索与应用,赋能中小企业降本增效并创新商业模式,深化数字化转型并引领高质量发展。
最后,加强人工智能大模型的战略规划和深度治理。制定人工智能大模型产业发展规划,对大模型技术研发和产业应用给予相应的政策、资金和人才等支持。推动算力、算法、数据、应用场景等上下游产业无缝衔接与协同联动,实现大模型产业相关要素跨语言、跨模态、跨任务、跨行业融合发展。加强人工智能大模型深度治理的国际合作,推动技术向善发展,促进大模型产业高质量发展。(何喜军张惠娜)