博舍

大模型概念股还能走多远 人工智能大模型牌照概念股票代码

大模型概念股还能走多远

估值前置透支的恶果早有人饱尝。

©️深响原创·作者|李静林

你或许已经忘了这样一段往事:去年3月11日,NFT艺术品《每一天:最初的5000天》,在佳士得拍卖行以6934万美元(约合4.5亿元)成交。此后NFT概念成为街头巷尾的热议话题,半个月时间内,NFT概念股涨超200%。

历史惊人相似,今年,以ChatGPT为代表的新AI热潮奔涌而来,迅速席卷行业舆论与资本市场——春节后,ChatGPT话题发酵,多只个股跳空高开、板块行情爆发,1月30日以来,海天瑞声在13个交易日里,累计上涨260%,迭创历史新高。与此同时,汉王科技、初灵信息、云从科技、鸿博股份也分别录得116.55%、110.73%、110.56%、104.76%的涨幅。各路分析师纷纷撰文力推各种维度的ChatGPT概念股。

算力、算法、数据、网络安全、云计算、人工智能……只要与之相关,均可冠以“ChatGPT”或“大模型”概念之名。但如果深究这些公司到底和ChatGPT有什么关系,答案都是模糊不清的。

而这远没有结束,3月百度文心一言上线,恐怕连李彦宏也没想到,在百度股价出现小插曲的时刻,市面上的“文心一言概念股”“AIGC龙头股”们早已起飞。更夸张的是,在阿里的通义千问还没发布的时候,“天猫精灵概念股”就已经按捺不住了,“鸟鸟分鸟”确实令人惊艳,但整个智能音箱板块个股集体点燃也确实会让人觉得投资者们是不是太“上头”了。

物极必反。很快,这次波澜壮阔的行情开始回归冷静,多个概念股开始震荡走低。而汉王科技因涉嫌内幕交易收到深交所关注函,海天瑞声、云从科技收到上交所监管工作函。“尽管目前表面上大模型百花齐放,但是能够拥有高质量数据场景助力持续迭代,使得逐步性能逼近ChatGPT的大模型预计最终仍是凤毛麟角”,民生证券直接点出了目前国内大模型领域的症结所在。

技术上的持续突破不是一天两天就能完成的,具体场景的商业化落地更是难且不确定。概念股到底能走多远,这又是一个能否真正“长期主义”的底层命题。

风来了

2月初,东方财富上的“ChatGPT”板块还只有29只股票,如今已经攀升到59家。但风口不宜硬蹭,机会总是给“有准备”的人。

360创始人周鸿祎可谓ChatGPT的拥趸,他曾在多个场合表达过,ChatGPT已经拥有或接近拥有了人类智慧,并正处于通往“通用人工智能”的临界点。2023年以来,受到AI、信创、数据安全和ChatGPT等概念持续轮动的影响,360股价上涨了足足两倍。

4月9日,周鸿祎在360主办的2023数字安全与发展高峰论坛上发布了360版的GPT。根据企业公告,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。尽管产品在展示过程中的表现并不完美,但资本市场对360的产品还是给出了认可,360GPT发布后,360股价高开7%。

目前来看,360大模型的精准度、可用性还都处在早期。正如周鸿祎所说,“360版ChatGPT”还只是个没有准生证的孩子,目前只是抱出来给大家看看。周鸿祎客观地估计,360GPT与GPT-4的差距在两年以上,先抢占场景,再发力技术,360在搜索引擎应用AI大模型迈出了第一步,但未来的路还很长。

周鸿祎现场实测|图源:公众号360黑板报

相比360的快速上手,科大讯飞和商汤科技的AI标签属性更鲜明。

在今年4月举办的人工智能大模型发展论坛上,科大讯飞研究院院长刘聪颇有信心地表示,尽管尚有差距,中国自主研发的AI大模型,在中文应用领域有能力超过ChatGPT。以此为契机,刘聪表示科大讯飞的“1+N认知智能大模型”将在下月发布,这款大模型产品将会应用在教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。

对语言、文本的处理一直是科大讯飞的基础能力,其AI大模型未来也将在科大讯飞AI学习机、讯飞听见等应用上率先实现落地。

从今年初到峰值的4月3日,科大讯飞股价翻了一倍有余,借着这股风重回千亿市值俱乐部。

商汤则是从2018年开始就开始了AI大模型的研发,2019年商汤自研出一个10亿参数的CV大模型。4月10日,商汤科技公布了“日日新SenseNova”的大模型体系。同样首次公布的,还有在NLP(自然语言处理)、AIGC(人工智能内容生成)领域的多个AI大模型。

中金发布研报上调商汤目标价至4.3港元,认为大模型有望带来远期多元化变现。光大证券亦将商汤上调至“买入”评级。分析师们看好商汤的主要理由都有一条——大模型针对具体应用场景,商业落地可能性高。

但资本市场始终还是节奏大师的舞台。商汤大模型发布后,其股价表现并没有“跟上”。

今年以来商汤科技股价走势

发布大模型之后没能收到资本市场理想效果的还有昆仑万维。

回溯科技圈过去几年的大热事件,元宇宙、新能源、AIGC、ChatGPT....昆仑万维这个名字总是会适时出现。今年2月,昆仑万维就宣布Opera浏览器计划接入ChatGPT功能,消息一出昆仑万维股价持续走高。4月6日,昆仑万维股价达到峰值的52.88元。

4月10日,昆仑万维更进一步,宣布和奇点智源合作自研国产大语言模型“天工”,然而消息一出,其股价当日跌17.25%。当然股价下跌和昆仑万维当日发布年报,净利润下跌或许有直接关系。至于“天工”大模型,也受到了质疑,深交所就发出了关注函,要求昆仑万维说明“天工”在技术、商业化等方面可能面临的风险。

从上述几家公司的股价情况可以看到,尽管由ChatGPT、各种大模型等带来的风潮席卷A股、港股市场,但行业、市场的警惕情绪也逐渐抬头。4月10日,ChatGPT指数大跌,收盘跌超7%。中信证券指出,主题炒作热度短期已到极致,机构调仓带来的增量资金效应已经相当有限。4月11日,ChatGPT指数继续大跌7.06%,38只成份股中,仅两只收涨,云从科技、科大讯飞、三六零跌停,昆仑万维、海天瑞声、初灵信息等个股跌超10%。

风吹来得快,吹走得也很快。概念普及后,真正的应用落地才是长久竞争的要义。

高潮迭起

其实360也好,昆仑万维也好,不管落地如何,他们至少都是有东西的。但放眼更多的概念股,恐怕说是“硬蹭”也毫不为过。

4月7日,脱口秀演员鸟鸟发布了一则微博,称自己拥有了“AI嘴替”。这个所谓的“AI嘴替”,就是接入了AI语音助手版本的天猫精灵,鸟鸟正是参与了这款产品的研发和语音录制。鸟鸟在视频中介绍称,这个分身为阿里训练出的类ChatGPT语音助手,能够模仿她的音色、语气以及文本风格。从对话视频中可以看到,“鸟鸟分鸟”不管是在语速、情绪以及文本风格都跟鸟鸟本鸟很像,且具有较强的逻辑性。

智能音响ODM厂商奋达科技透露,阿里巴巴是公司合作多年的智能音箱客户,此次“鸟鸟分鸟”搭载的天猫精灵正是双方合作的。4月7日当天,其股价便创下年内最高点6.19元/股。

在4月11日阿里云宣布钉钉和天猫精灵率先接入「通义千问」大模型后,4月12日,智能音箱概念早盘大幅拉升,截至当日午间收盘,惠威科技涨停,佳禾智能、全志科技、中科蓝讯等多股纷纷跟涨。奋达科技则一度达到近期的峰值6.35元,最终以6.3元收盘。

恐怕阿里也是万万没想到自己的发布能给其他人带来这么多意外的收获。不知道是出于何种压力,奋达科技最终在4月11日于投资者互动平台澄清:阿里是公司智能语音音箱的重要客户之一,未来能否进一步深度合作具有不确定性,请投资者理性投资,注意投资风险。

华为也没有缺席这一场AI大模型的盛宴。华为的AI大模型早在2020年便立项,2021年4月正式发布,此后不断迭代,拓展应用范围。根据上海证券分析师陈宇哲在研报中称,在早前的华为开发者大会上,华为曾宣布盘古大模型是业界首个千亿级生成与理解中文的NLP大模型,其认为未来有望成为国内最强的ChatGPT应用。

在今年3月举办的博鳌亚洲论坛2023年年会上,华为云人工智能领域首席科学家田奇介绍盘古大模型的特点时表示:“华为盘古聚焦文本生成与内容理解,已进入智能文档搜索、智能ERP、小语种大模型领域,落地企业财务异常检测、阿拉伯语大模型等场景。”在应用场景上,华为的聚焦点没有放在日常的场景中,而是在科学领域,例如气象、药物分子和海浪预测等方面。

华为的盘古AI将会在金融、电力、交通、气象、物流等行业发挥作用,由于涉及产业多元,盘古AI模型所接驳的上下游公司也数量繁多——这就是盘古大模型概念股的基底。

比如聚焦在盘古大模型算力基础设施建设的拓维信息,2022年上半年,该公司昇腾服务器出货量在华为合作方中排名第一。进入2023年,拓维信息的股价走势基本保持着上扬的状态,从年初的6.63元,涨至4月3日的最高点16.78元。

在toB应用领域,东方国信的大数据应用系统支持华为TaiShan服务器。进入2023年后,其股价也借着AI的东风和华为在大模型领域的深入,翻了不止两倍。在toC应用层面,与华为有关联的企业更多,其中不乏像金山办公、同花顺、科大讯飞等名头很响的公司。上述公司在2023年的股价涨幅都在2倍左右,且大幅增长的时间点都集中在了三月到四月当中。

盘古模型现场实测

有的大厂已经迈出第一步,还有些大厂如腾讯、京东、美团,还在蓄势,尽管产品还没有发布,但他们的概念股已经先行一步了。

3月,在腾讯年报电话会议上,腾讯管理层首次确认了推出类ChatGPT聊天机器人产品并且披露了项目进展,据报道,这一产品是由腾讯混元助手项目组(HunyuanAide)推进的。腾讯总裁刘炽平表示,大模型的核心应用领域主要集中在通讯、游戏、社交领域——这几项也正是腾讯的核心业务。可以预想,腾讯的生成式AI做成后,将被纳入到旗下微信和QQ等产品中。

就在4月14日,腾讯官方发布了面向大模型训练的新一代HCC(High-PerformanceComputingCluster)高性能计算集群,在当下AI大模型训练大火的背景下,高性能的算力集群是不可或缺的基础设施。

腾讯出手后,与混元大模型相关的概念股也不断上涨。世纪华通深度参与并投资的上海松江的腾讯长三角人工智能先进计算中心及生态产业园区项目已累计已交付近万个机柜并逐步投入运营。从3月初开始,世纪华通的股价从4.16元一路涨到了现在的接近7元。

此外还有与腾讯云计算在云计算、大数据、人工智能等领域有合作的拓尔思,其股价从年初到4月初上涨三倍左右;在AI、数字虚拟人、VR/AR、沉浸式体验、全息技术、云计算、大数据等方面与腾讯保持合作的岭南股份,股价也从年初的不到3元,上涨到峰值时期的4.36元。

可以看到,大公司的AI大模型布局主要是围绕着自身业务展开,试图通过新技术提升自身业务或产品的效率和价值。在这一波大厂集体卷入“军备竞赛”的浪潮之下,与之业务关联极深的公司或多或少都会接收到红利,在业务进化和股价走势上被大厂辐射到。

互联网大厂争相加入卡位战,产业风口已至。东方证券就表示,ChatGPT题材是超越元宇宙、虚拟现实的大风口,资本市场今年可能会反复炒作。由此也引发了一些新的担忧,允泰资本创始合伙人付立春表示,从技术革命的角度来看,这确实代表了未来的发展方向和趋势,但其作为技术创新本身存在不确定性。但本质上而言,目前大多数所谓概念股的行情在实质的基本面改善方面和它的关联度并不是很大。

这些年我们见到过太多风口,也看到过太多的风口过后的狼藉。元宇宙、NFT带动的资本盛宴至今还历历在目,但现在几乎很少有人再会提起。这样的情况值得所有人警惕。

对投资人来说,拨开概念的迷雾,真正认清技术的长期价值是一项必修的功课。对公司来讲,专注在研发上,而非期待通过热度催高估值或者股价才是正道。

毕竟,估值前置透支的恶果在此前多次的风口沉浮中都有人饱尝。

人工智能概念股名单一览

人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

实际应用于:机器视觉,指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,自动规划,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学,语言和图像理解,遗传编程等。

人工智能概念股

启明星辰:人工智能赋能安全一直是公司重点探索的方向,公司自主研发的人工智能安全建模和赋能平台,被威胁检测、安全大数据分析、威胁情报、UEBA等多个产品广泛采用,全面提升了安全数据治理、安全模型构建、模型安全检测、模型推理赋能等能力,实现了基于ModelOps和AIOps的人工智能应用快速搭建、模型全生命周期管理和多重赋能,助力网络安全分析技术、流量检测技术、威胁检测技术等实现智能化,推动公司网络安全产品向自动化、智能化进阶。在公司的安全运营中心服务中,形成基于人工智能技术的智能化安全运营解决方案,开发了以全生命周期人工智能安全服务、运营(AISecOps)为目标的AI安全研发运营一体化平台。基于多年对自然语言理解、自然语言处理、大数据分析、智能化处理方面的智算能力和安全运营经验,于2022年发布了“PanguBot盘小古”安全智慧生命体。“PanguBot”由启明星辰盘古人工智能平台提供模型运行算力和环境,以Chat为窗口,应用基于安全运营专用语料库训练的自然语言模型,能够接收文字、语音、图片、视频等方式的信息输入,通过文字和图片的形式向用户反馈,并能够整合各种运营工具,安全分析处置自动化,成为启明星辰智能化安全运营的有力支撑。

报告显示:中国人工智能大模型已发布79个

在5月28日举办的中关村论坛人工智能大模型发展分论坛上,由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》正式发布。

据中国科学技术信息研究所党委书记、所长,科技部新一代人工智能发展研究中心主任赵志耘介绍,以ChatGPT为代表的人工智能大模型引领新一轮全球人工智能技术发展浪潮,大模型相关新研究、新产品竞相涌现。中国前期在人工智能领域的各项部署为大模型发展奠定了坚实基础,在政产学研各方共同推动下,建立起涵盖理论方法和软硬件技术的体系化研发能力,大模型研发呈现蓬勃发展态势。该报告借助大模型地图的可视化方式,分析了中国大模型阶段性发展特征,描绘中国大模型发展最新全貌,也揭示大模型发展中尚存在的问题与不足,希望对中国大模型未来发展有所促进。

大模型技术群快速壮大

报告对全球大模型技术发展脉络进行梳理发现,自谷歌2017年发布的Transformer网络结构以来,仅用五年多时间全球已迅速成长出庞大的大模型技术群,衍生出涵盖各种技术架构、各种模态、各种场景的大模型家族。

中美引领全球大模型发展 

报告分析发现,美国谷歌、OpenAI等机构不断引领大模型技术前沿。欧洲、俄罗斯、以色列、韩国等地越来越多的研发团队也在投入大模型的研发。从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,美国在大模型数量方面始终居全球最高。

中国大模型呈现蓬勃发展态势

中国自2020年进入大模型快速发展期,目前与美国保持同步增长态势。在自然语言处理、机器视觉和多模态等各技术分支上均在同步跟进、迅速发展,涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。

中国大模型分布地图 

报告基于公开信息梳理分析了中国已发布的79个大模型,分析结果显示,目前中国在14个省市/地区均有团队在开展大模型研发,北京、广东两地最多,地域集中度相对较高。从领域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,学术界与产业界之间的联合开发相对较少。

中国大模型算力要素地图 

报告通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近三年人工智能服务器采购数量最高的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。

中国大模型人才要素地图 

大模型具有较高门槛,需要高素质AI人才。报告结果显示,从数量上看目前各地大模型人才仍不充足。报告统计了国内人工智能相关论文的作者,从区域分布上看,北京不论在人工智能学者数量方面还是大模型学者数量方面都遥遥领先于其它地区,体现出明显的人才储备优势,江苏、广东、上海也是大模型人才相对较多的地区。

中国大模型学术影响力地图 

报告认为,中国大模型通过学术论文发表方式已经形成一定学术影响力。其中北京、广东、上海三地不论是论文发表量还是引用量都居国内最高。

中国大模型学术影响力前十

从模型影响力方面看,清华大学与阿里和百度联合开发的CogView模型论文引用数最高,华为的FILIP、百度的ERNIE3.0以及阿里的M6-OFA引用数也位居国内前列,在大模型领域形成了较好的学术影响力,但与国外领先大模型的学术影响力相比差距仍然较大。

中国大模型开源影响力地图 

开源开放是人工智能研发协作的重要模式,也是中国人工智能发展重要理念。报告分析发现,中国大模型研发团队积极推进大模型开源发展,目前已经有超过半数大模型实现开源。北京、广东、上海三地开源数量和开源影响力均居国内前三。

中国大模型开源影响力前十 

报告显示,目前大模型开源更多是高校和机构在推动,清华大学的ChatGLM-6B、复旦大学的MOSS以及百度的文心系列大模型已形成最高的模型开源影响力。

通用模型与专用模型并行发展 

报告分析认为,目前中国大模型产业化应用大致出现两种并行的发展路径,文心一言、通义千问、紫东太初等一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。

与此同时,一批针对生物制药、遥感、气象等垂直领域的专业类大模型,正在发挥其领域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案。

赵志耘指出,大模型技术推动人工智能实现了一次历史性跨越,未来仍有广阔的持续创新空间。中国经济社会高质量发展为大模型创新提供了丰富场景和数据基础,人工智能在中国发展潜力巨大。建议加强资源和研发力量统筹,促进大模型有序发展;加快基础研究和技术创新,提升学术和开源影响力;强化大模型发展中的场景牵引作用,打造大模型标杆项目;强化国际合作,积极参与全球人工智能治理。(经济日报记者佘惠敏)

在发展中治理完善人工智能大模型

  新一轮科技革命和产业变革迅猛发展,数字技术、智能经济与数字化产业成为催生新产业、新业态、新模式的重点领域。发布仅6个月的ChatGPT,已掀起全球人工智能(AI)产业的大模型热潮。在日前举办的中国人工智能产业年会中,AI大模型带来的安全挑战和发展机遇成为与会专家热议话题。

  赋能千行百业

  ChatGPT在与人类对话、写作文、写代码等方面令人惊艳的表现,是AI大模型GPT通过大算力、大规模训练数据突破自然语言处理瓶颈的结果。但大模型本身并不是新鲜事物,AI大模型也不止GPT这一条路线,很多科技巨头近几年都在“炼”大模型,且各有积累。这也是ChatGPT走红之后,各巨头短短数月内就纷纷推出竞品的原因。

  “以ChatGPT为代表的多模态通用大模型,将深刻变革各行各业。”电子科技大学教授、考拉悠然科技有限公司联合创始人沈复民说,行业人工智能可有效推动技术与市场供需平衡,将是人工智能产业化的最大机遇。人工智能技术落地行业时,需要克服开发效率低、落地成本高、场景复杂多元等难题。

  沈复民所在的研发团队获得了2022年度吴文俊人工智能科学技术奖自然科学一等奖。据他介绍,团队开发了为垂直行业赋能的多模态AI操作系统,基于行业多模态大模型、多模态融合分析、机器视觉等核心AI算法支持,可以让企业摆脱繁杂的算法、算力、数据整合工作,快速孵化行业大模型,高效率应用到工业制造、城市治理、消费、能源、交通、建材等业务场景。

  “通用对话技术是人工智能领域最具挑战性的方向之一,也被认为是通用人工智能的必备能力。如今备受关注的对话式人工智能,其背后就有通用对话技术。”百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰说。中国人工智能产业年会期间,由他带领团队完成的“知识与深度学习融合的通用对话技术及应用”成果,获2022年度吴文俊人工智能科技进步奖特等奖。

  公开资料显示,这一研究项目已获授权发明专利82项,发表高水平论文36篇,在国际权威评测中获世界冠军11项。目前项目成果实现了大规模产业应用,已支持5亿智能设备,服务超过10亿用户,覆盖包括通信、金融、汽车、能源等20多个行业。

  争取“主动安全”

  技术是把双刃剑。人工智能大模型能力越大,一旦滥用带来的危害也就越大。当前,ChatGPT等工具被用于生成假新闻、假照片、假视频,甚至实施诈骗等犯罪行为,引发人们对大模型安全性的担忧。

  西北工业大学教授王震是网络空间智能对抗应用研究领域的专家,他认为,要用人工智能驱动网络空间智能对抗。比如,用人工智能检测、识别有害信息,搭建“主动安全”的智能防御网。

  “只有在AI发展过程中,我们才能面对问题、解决问题,并找到机遇。”蚂蚁集团AI风险管理负责人杨舟表示,在AI管理中,安全事件对日常风险管理至关重要。“我们需要重视和预测相关事件,分析安全问题,避免发展带来的风险。”

  了解机理是安全管理的基础。不过,大模型的“智能涌现”目前还是个难以解释的黑箱,没有人能理解、预测或可靠地控制这些大模型,甚至模型的创造者也不能。开发出ChatGPT的公司OpenAI,也为大模型做了大量价值敏感设计和道德嵌入工作,但仍然存在明显的漏洞和局限。

  “虽然大模型的能力在不断变强,但如果不对其进行专门的安全性训练或安全性加固,其脆弱性不会得到任何改善。”瑞莱智慧公司首席执行官田天认为,人工智能大模型的安全性面临很多挑战。

  “大模型是人工智能发展的转折点,研究人员需要进一步了解这些大模型为何具备类人思考的能力。”香港科技大学教授冯雁表示,ChatGPT最初只作为科研项目发布,但通过加入人机交互界面,迅速变成网红产品。其爆红带来的伦理问题始料未及,也给生成式人工智能的管理提出了挑战。“只有真正的开源,才能共同研究,理解大模型存在的问题和产生的根源,更好地进行管理。”

  “商汤一直是开源开放的贡献者和支持者,但在开源上我们要谨慎一些,特别是目前对于大模型而言,安全防护体系还未健全。”商汤科技人工智能伦理与治理研究主任胡正坤说,在智能时代把底层模型开源,不见得安全,因为在开放能力的同时,也在开放薄弱点,而薄弱点有可能被不法分子利用。

  亟需深度治理

  专家们对未来的人工智能长远治理做出种种设想。

  “不能把价值设计看成治理的唯一路径。”复旦大学应用伦理学研究中心教授王国豫认为,针对现阶段人工智能治理的局限性,可从三方面采取措施。一是充分评估数据和模型的伦理影响和风险点;二是从流程方面,不仅要考虑通用模型,还要把通用模型纳入到社会生态系统、社会政治经济系统来考虑;三是探索伦理方法,充分探索“价值敏感设计”“负责任创新”等伦理方法在通用模型语境下的可行性。

  中国社会科学院哲学所科技哲学研究室主任、研究员段伟文表示,需要警惕机器对人类思维的驯化。比如,有的人不擅社交,可能用人工智能生成对话的方式帮他社交聊天,这样的对话机制会反过来驯化人类。他建议加强人类和人工智能的交互和沟通,不仅要了解人类怎么去修机器,也要研究机器如何影响人类。

  中科院自动化研究所研究员曾毅期待构建人工智能的道德直觉,“为机器人立心、为人工智能立心”是重要的长远工作目标。“强化学习的奖惩只是加加减减,它不是真正对道德的理解,除非人工智能实现基于自我的道德直觉。缺乏自我的人工智能无法拥有真正的道德直觉,做真正的道德决策。我们在做一个基于类脑的脉冲神经网络构建创生的人工智能引擎,希望让它像儿童一样去学习,获得自我感知。”曾毅说。

  “从要求人工智能大模型合乎伦理,到真正构建有道德的人工智能。”曾毅表示,未来通用人工智能和超级智能的伦理安全问题,要从现在就开始关注和准备。(记者佘惠敏)

人工智能从“大炼模型”到“炼大模型”

       人工智能可以分为几个发展阶段:基于数据的互联网时代、基于算力的云计算时代,以及接下来可能将进入的基于模型的AI时代,这相当于把数据提升为超大规模预训练模型。未来,研究人员可以直接在云模型上进行微调,很多公司甚至不用维护自己的算法研发团队,只需要应用工程师即可。

       写小说、和人聊天、设计网页、编写吉他曲谱……号称迄今为止最“全能”的AI模型GPT-3,当然远远不止会这些。作为2020年人工智能领域最惊艳的模型之一,GPT-3无疑把超大规模预训练模型的热度推向了新高。

       3月下旬,我国首个超大规模人工智能模型“悟道1.0”发布,该模型由智源学术副院长、清华大学教授唐杰领衔,带领来自清华大学、北京大学、中国人民大学、中国科学院等单位的100余位AI科学家组成联合攻关团队,取得了多项国际领先的AI技术突破,形成了超大规模智能模型训练技术体系,训练出包括中文、多模态、认知和蛋白质预测在内的系列超大模型。

       已启动4个大模型开发

       据悉,“悟道1.0”先期启动了4个大模型研发项目:以中文为核心的超大规模预训练语言模型文源、超大规模多模态预训练模型文澜、超大规模蛋白质序列预测预训练模型文溯,以及面向认知的超大规模新型预训练模型文汇。

       唐杰介绍,文源拥有26亿参数,文澜则为10亿,文溯是2.8亿,文汇则达到了百亿以上。虽然相对于GPT-3的1750亿参数而言还有差距,但“接下来会有更大的模型”。

       目前,文源模型参数量达26亿,具有识记、理解、检索、数值计算、多语言等多种能力,并覆盖开放域回答、语法改错、情感分析等20种主流中文自然语言处理任务,在中文生成模型中达到了领先的效果。

       “目前这些模型既有一些交集,但也存在明显差异。文源的重点是在中文和跨语言,未来也会加入知识;文澜的重点主要是图文;文汇则更多地瞄向认知。”唐杰表示,认知是人工智能技术发展的趋势和目标,关系到机器是否能像人一样思考这个终极问题。

       “下一代人工智能技术的发展方向一定是认知。”据唐杰介绍,在作诗任务中,目前文汇已经通过了图灵测试。从算法的角度上来看,文汇能通过图灵测试的关键在于“生成”,而不仅仅限于“匹配”,这种生成能力是多样的。

       被问及为何会选择这4个预训练模型项目时,唐杰说,这是综合考虑了国内外同行的相关工作、国内人工智能发展的现状、团队人员构成、北京区域优势等作出的决定。“当时GPT-3刚发布不久,悟道团队认为首先要对标其卓越的少样本学习能力,同时还要做出差异化,做短、中、长3个阶段的布局。于是,中文版GPT-3即清源CPM(文源的前身)应运而生,这是短期布局。之后,文源要向中英文模型乃至多语言模型发展,这是中期布局。最后走向认知智能,这是长期布局。”唐杰说,与此同时,国内顶尖的企业人才、学术人才和自然科学人才所组成的团队给了项目巨大的想象空间。

       大模型有大智慧

       自2018年谷歌发布BERT以来,预训练模型逐渐成为自然语言处理(NLP)领域的主流。

       2020年5月,OpenAI发布了拥有1750亿参数量的预训练模型GPT-3。作为一个语言生成模型,GPT-3不仅能够生成流畅自然的文本,还能完成问答、翻译、创作小说等一系列NLP任务,甚至可以进行简单的算术运算,并且其性能在很多任务上都超越相关领域的专有模型。

       以GPT-3为代表的超大规模预训练模型,不仅以绝对的数据和算力优势取代了一些小的算法模型,更重要的是,它展示了一条通向通用人工智能的可能路径。在此背景下,建设国内的超大规模预训练模型和生态势在必行。

       在唐杰看来,为了提高机器学习算法的效率,改变传统的行业布局,过去几年,大家拼命做模型,导致模型越做越多。然而,一般的模型训练效果并不如人意,花了大量财力精力却达不到理想的训练效果,“为了优化效果、提高精度,模型越来越复杂,数据越来越大,很多公司的能力不足以应对这种状况,效率越来越低。”唐杰举了个例子,小炼钢厂往往条件简陋,能炼钢,但质量不好。大炼钢厂买得起设备、花得起电费,炼出的钢质量就好,大模型就是大炼钢厂,它可以获得大量数据,并把数据清洗干净,提升算力,满足要求。

       与此同时,“小模型可能只需要几个老师和学生就能完成算法的设计,但是大模型的每一层都要找专人来做,这样可以把模型的设计和训练精细化,模型设计也从单打独斗变成了众人拾柴。”唐杰说。

       小团队将成最大受益者

       据唐杰透露,团队目前正在跟北京冬奥会合作,开发可通过文本自动转成手语的模型,“医疗方面我们的主要方向是癌症早筛,如上传乳腺癌图像,找到乳腺癌相关预测亚类,通过影像识别宫颈癌亚类等。”

       而谈到“悟道1.0”的发展,唐杰坦言,目前还存在需要持续攻关的问题。一是模型能否持续学习的问题,即能否不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。就目前来看模型还需要调整,其效果还有待加强;二是面对一些复杂问题,目前模型还无法回答;三是万亿级模型的实用性问题,即如何在保证精度的同时压缩模型,从而能让用户低成本地使用。

       “这是一个全新的产业模式。原来大家数据上云、算力上云,现在模型上云。”唐杰说。

       他认为,人工智能可以分为几个发展阶段:基于数据的互联网时代、基于算力的云计算时代,以及接下来可能将进入的基于模型的AI时代,这相当于把数据提升为超大规模预训练模型。未来,研究人员可以直接在云模型上进行微调,很多公司甚至不用维护自己的算法研发团队,只需要应用工程师即可。

       唐杰表示,随着超大规模预训练模型系统的开放,小团队是最大的受益者,大家不必从零开始,预训练基线智能水平大幅提升,平台多样化、规模化,大家在云上可以找到自己所需的模型,剩下的就是对行业、对场景的理解。这将给AI应用创新带来全新的局面。

       唐杰透露,“悟道1.0”只是一个阶段性的成果,今年6月将会有一个规模更大、水平更高的智慧模型发布。届时,模型规模会有实质性的进展:模型会在更多任务上突破图灵测试,其应用平台的效果也会更加让人期待。

【纠错】【责任编辑:付琳】

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇