博舍

科学网—打通“人工智能最后一公里” 人工智能的最后一公里

科学网—打通“人工智能最后一公里”

打通“人工智能最后一公里”

 

图片来源:Unsplash

■本报记者计红梅

到2023年,将有75%的数据产生于数据中心以外的地方。这些地方可能是工厂、医院,抑或零售商店、城市……

其中,超过50%的数据将会在边缘产生。数据在边缘端被处理、存储和分析,可满足低延迟、高可靠性和隐私性等各种用途、场景的需求。

随着网络向5G转型,人工智能(AI)应用无处不在且与日俱增,作为“人工智能的最后一公里”,智能边缘来了!

边缘计算升级

今年,智能边缘是一个在IT界屡屡被提及的词汇。从早前的边缘计算,到现在的智能边缘,概念更迭的背后昭示着怎样的趋势和变化?

“对于以前的边缘计算来讲,智能边缘计算是一个升级。”在日前举行的“未来智能边缘计算论坛”期间,在接受《中国科学报》采访时,英特尔中国研究院院长宋继强表示。

他告诉记者,边缘计算主要是强调计算发生的位置,即计算发生在云的边缘、网络的边缘还是设备的边缘,而智能边缘则是强调在这一过程中AI所发挥的作用。“智能边缘将是未来人工智能真正在很多地方发挥效力的应用场景。目前,智能边缘总体市场规模为350亿美元,预计到2025年将增长至650亿美元以上。”宋继强说。

而在中国工程院院士、中国科学院计算技术研究所所长孙凝晖看来,从上世纪80年代机器之间的一元互联,即IT1.0时代,发展到未来人、机、物三元互联的IT3.0时代,很大一个区别是边缘有大量物的存在,即互联网要进入万物智联的时代。

他对比了不同阶段信息基础设施各自的特点。在IT1.0时代,信息处理的主要方式是超级计算中心,计算机网络追求高速率,要求“算得快”。在IT2.0时代,云计算中心追求共享,要“算得省”,以高吞吐量为目标。而在IT3.0时代,高吞量计算中心通过天地一体泛在网或物联网进行信息传输,追求“算得多”,强调高并发、强实时、全局可调和内构安全。“这中间的变化,可以拿飞机和高铁来加以对比。”孙凝晖说。

从数据的处理、过滤或简单分析,到运用AI能力对一些物理场景的视觉数据做实时处理,从边缘计算到智能边缘,“提出的要求将会更高”。宋继强指出。

云边端融合

“高通量是IT3.0时代信息基础设施的新标签。”孙凝晖认为。在他看来,IT3.0时代的新型信息基础设施要面向人、机、物三元融合的新要求,提供高通量的计算与传输能力,以及万物智联服务的高品质保障。

具体而言,高通量有四个具体技术特征。其中,高并发是指信息通量要达到亿级并行,连接千亿级互联物端;强实时是指终端到云端的延迟可控,同时能够支持实时语音等延迟敏感应用;全局可调则是指具有全局的可测、可调能力,提高在大载荷下的资源匹配效率;此外,对于工业生产领域的基础应用而言,一定要有很强的安全属性,即内构安全或内置安全属性,强化对安全的控制手段。

而在宋继强看来,未来的计算系统要具备多个智能设备合作及在线学习能力。

他举例说,未来如果有一个妈妈带着小孩去医院看病,丢了一部手机,只需要给机器人派发一个命令“帮我找一下手机”就可以。在这一过程中,机器人一方面需要有记录和构建知识图谱的能力,也要有根据任务指令规划自身行动的能力。

“而后者如果靠机器人本身,我觉得对机器人硬件的要求太高,它就是一个电池供电的设备,不方便让它做这么多事。这时就需要利用智能边缘来加以解决。”宋继强告诉记者,此时不需要即时响应的计算可以卸载到边缘端,通过人工智能和5G等技术,实现云边端融合,让比较小的前端设备无形中具备更大的存储和计算容量。

智能边缘尚处于发展的初期阶段。为了让机器人尽快向自主智能系统演进,在未来智能边缘计算论坛上,英特尔中国研究院宣布,将和全球顶尖的学术机构一起,联合举办为期三年的全球机器人学习室内挑战赛,旨在推进服务机器人自学习能力技术的切实突破,推动行业应用落地。同时,英特尔“机器人创新生态”也宣布将全面升级。

《中国科学报》(2020-10-15第3版信息技术)

人工智能跑向“最后一公里”

AI还能干什么?

1970年,第一代神经网络算法问世,证明了《数学原理》前52个中的38项。

此后,AI不断突破迭代,“折叠”生产力时空,将人类从重复劳作中解放出来。

近年来,随着各行各业高度发展,信息量和应用场景也呈指数级增加,算法模型逐渐步入深水区。而AI落地的场景,大多数仍然有限,并未能发挥最大效能。

怎样的AI技术,能够持续赋能行业,解决更为细碎但常见的长尾问题?乃至跑向机器“拓荒”思考的“最后一公里”?

AI现在需要“解放自己”,展开一场范式转变。

欲知未来,先看历史。因此,有必要从人工智能应用落地的第一阶段,看AI如何一步步构建和影响身边的世界。

01教会机器“看脸”

当代生活对人工智能最直观的认知,来自人脸识别。

人脸识别,是AI众多技术中最早、最为成熟的技术。现如今,在各个场合“刷脸”已经成为一种常态,比如交通运输场景中,刷脸登机、入闸、安全检测等。

但人脸识别被广为人知的应用,当数智能美颜。经过智能美颜“点石成金”,照片变得精致动人。

虽然“一切看脸”难免失之狭隘,但人类70%-80%的信息获取来自视觉。人脸识别让人工智能具备了识人知物的能力。

简单来说,视觉AI就是研究如何让机器会“看”,即用摄影机和电脑代替人眼对图像进行特征提取和分析,并由此训练模型对新的图像数据进行检测、识别等任务,建立能够从图像或者多模态数据中获取信息的人工智能系统。

作为人脑之外的另一种智能,在认识世界之前,先要认识人类。模仿人脑学习过程的深度学习的内核,也是构建特征模型。人的面部信息,是社交及传播行为的重要载体,具有丰富的数据基础和重要的应用化需求。

因此,人脸识别成为人工智能诞生60年来的爆发“奇点”。深度学习从人脸识别开始,劈开一条道路。

此后,人脸识别技术在各行业领域,都得到了应用。在商业楼宇,可用来录入门禁考勤系统;互联网APP为面部设计出好玩的滤镜,创造新奇社交体验;银行系统用上了便捷且具有高安全性的刷脸支付;而智能手机厂商的人脸解锁和智能美颜,大概是日常最频繁的应用。

人脸识别在诸多领域的应用,打开了广阔的蓝海市场,也滋养了一批AI技术企业和应用企业,诞生了商汤(0020.HK)、旷视科技、云从科技等AI企业,同时百度(BIDU.O)、阿里(9988.HK)等互联网厂商也积极切入人工智能领域。

发展到现在,AI人脸识别技术已非常成熟,甚至被打上基础技术的符号。以精度、准确度为导向的技术驱动力量正在减弱,而用户对产品使用场景适配度的要求,却越来越高。

而人工智能技术的应用,远不止于此。

02在长尾场景中,重识世界

随着人工智能技术的迅速发展,现如今AI的应用已经突破了识别人自身的第一阶段,进入了第二阶段——即对人周边已知领域的探索,体验人能感知到的现实世界。

在第二阶段,人工智能的使命,和第一阶段有所不同。

从人脸识别,过渡到识别万物、实现万物互联;从标注图像中的单一要素,到识别物体组合和场景,甚至是物体与场景的关系。

从数据化到结构化,乃至可交互化,是人工智能第二阶段的使命。

只有将时间、地点、人物关系有机串联,才能真正令AI“理解”和学习人类世界的真实状态,以解决在第二阶段大量出现的长尾问题。

所谓长尾问题,即AI应用中出现的差异化、碎片化和细节化的需求。现在的应用场景中,80%都是此类低频、长尾的需求。能否解决这些长尾需求,是AI大规模产业化落地的关键。

以城市管理为例,城市是一个复杂的系统,要想让城市真正实现有序地运转、高效的治理,仅仅依靠人的力量是不够的,借助人工智能的力量,可以让治理更高效。

如今,虽然“智慧城市”方案已在很多地区落地应用,但真的利用AI技术去解决细节问题,需要面临成千上万的治理元素,比如共享单车乱停乱放、消防通道被占、垃圾桶满溢、积水阻碍通行等。

商汤试图挑战这个问题,并取得了新进展。2020年,他们与上海市进行合作,基于商汤SenseFoundry方舟城市级开放视觉平台,构建了多场景、一站式的解决方案。长宁区的AI+一网统管试点,“智慧巡屏”等功能,就是AI研判处置全闭环管理的案例。

AI打通城市管理闭环后,有效地解决了城市暴露垃圾识别、共享单车乱停乱放的痛点,不仅能帮助城市管理者发现问题,还能在案件被处置后自动核查,甚至将管理模式转变为主动发现。

商汤SenseFoundry方舟企业开放平台,还将AI应用于上海徐汇滨江水岸的生态管理中。

上海徐汇滨江岸线长达11.4公里,沿线入驻近500家企业,有近20多万人员通勤,以及每天数以万计的游客。如此大面积、多人流、偶发事件频繁的环境,日常运维管理难度极高。

但现在的水岸区域,是具有“城市生命体征”的智慧水岸——针对各种“突发事件”,均可构建从自动发现、预案触发、任务分派和复查的一体化管理体系。

徐汇滨江智慧公共空间管理平台,来源:商汤官方公众号

从区域内座椅、灯杆、井盖、绿植、草坪、建筑等16000+资产建档,到自动告警派发工单,甚至花花草草的养护需求,都能有条不紊一一照顾到,这种“能感知、主报告、有温度”的“智慧公共空间管理平台”,由SenseFoundryEnterprise商汤方舟企业开放平台的AI赋能而来。

见微知著。一个个AI长尾问题背后映射出的,是AI发展趋势。

根据Gartner发布的《2021年AI成熟度曲线》显示,AI发展主要面临4个趋势,具体包括:负责任的AI、小而广的数据方法、AI平台运营化、高效使用数据、模型和计算资源。也就是说,AI的发展最终要走向高效使用数据、模型和计算资源方向。

成熟曲线显示,目前很大比例的AI创新,依旧在上升型的技术萌芽期,AI工具还无法达到最终用户需求所具备的能力。这其实意味着,大部分AI的应用依旧处在研发环节。

2021年AI成熟度曲线,来源:Gartner(2021年9月)

当前AI还在以快速的步伐发展,“成熟度曲线”上大部分技术,有希望在2年至5年内得到业界采用。边缘AI、计算机视觉、决策智能和机器学习等在内的创新,都会在未来几年对市场产生革命性的影响。

与真实世界的拟合度越高,越需要构建高复杂度的识别算法模块。对下游行业来说,这无疑是巨大的难题。即使需要AI技术,也很难再投入重资产开发。

具有行业精深的专业知识、甚至掌握客户资源在手,但苦于缺乏开发能力和项目管理经验,而无法施展所长,这是诸多垂直类行业解决方案的中小企业的核心痛点之一。显然,他们需要能快速上手、能辅助项目尽快落地、提升项目研发效率的产品。

Gartner高级首席分析师ShubhangiVashisth认为,平均而言,将基于AI的模型集成到业务工作流程中,并交付,需要大约8个月的时间。”

因此,对下游企业来说,如果有了强大的深度学习通用模型和众多模型组件,并能与行业属性相结合,无疑是最为便捷、成本最优的AI解决方案。

另外,某些低频次但高“赔率”的场景,如火灾、危化品泄漏防范等,也是非常核心的需求。如能解决这样的问题,便能带来巨大的商业价值。

应对上述需求的深度学习模型,参数规模也相当可观。相应地,对算力这一基础设施的要求也越来越高——过去几年翻了100万倍,几乎是以平均每年十几倍的速度增长。

商汤AI大装置就是这样的算法与算力模型“工厂”,能有针对性地解决行业痛点,即长尾问题。

03商汤AI大装置:AI突破行业成本红线

2019年,商汤便开始了SenseCore商汤AI大装置研发,这是一种高效率、低成本、规模化的人工智能基础设施。目前,已经为长三角区域大量科研单位和头部企业提供了算力、数据、算法全领域的核心能力服务。

SenseCore商汤AI大装置核心架构,由计算基础设施、模型层和深度学习层三部分组成。

计算基础设施,即是支撑数字经济坚实基础的算力“基建”,数字经济时代的新型生产力。

坐落在上海临港的商汤人工智能算力中心(AIDC),为亚洲最大,峰值算力可达3740P,可同时接入850万路视频,1天内即可完成23600年时长的视频处理工作。

“P”即PetaFlops,指每秒千万亿次浮点运算。数字越大,运算速度越快;算力也越高,能训练的模型数据也更多。

算法方面,AIDC具备超大规模的AI模型生产能力,可以进行更为通用的大模型训练。

在大数据应用领域内,快速生成稳定可靠的模型十分重要。商汤的SenseSpring“模型工厂”,已经开发数万个人工智能模型。这些模型将用于大数据应用的各个领域,如数字化转型、智慧城市智能汽车、商业领域等等。

除模型工厂外,开源算法体系OpenMMLab平台,也将与外部资源协同,共建新型生态。由商汤参与打造的OpenMMLab,在世界上最大的代码平台GitHub上,已经获得超过58,000个Stars。

算法训练平台,是商汤SenseParrots深度学习层。该平台采用领先的视觉训练框架,具备接近90%的并行处理效率,可以实现900倍计算提速,也就是,仅需要1块GPU,就能实现1000块的工作效率。

这样的巨无霸型AI装置,如何赋能下游行业呢?

在工业领域,人工智能尚未取得较高的效益。一个原因是,工业数据虽然量大,但是相互关系十分紧密。数据与数据之间,有明确的逻辑,本质上属于小数据的范畴。

由于需要特定的高性能AI模型,因此生产成本高昂,模型开发效率低,导致市场大量需求无法满足。另外,某些低频发生、规模量小的数据集,难以训练出高性能的AI模型,也成为工业级人工智能落地的一个障碍。

而SenseCore商汤AI大装置,通过整合强大的算力基础和领先的算法能力,能以高效、自动化、集约化的方式,让高质量的AI算法实现“量产”。

比如,通过向企业开放算法模型工厂进行定制化生产,大幅降低人工智能的生产要素成本,实现高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,乃至构建出物理空间的数字化搜索引擎。

更有意义的是,AI企业在垂类领域的商业影响力越强,越有利于AI多元化落地的发展,最终搭建起辐射多行业的AI商业生态。

在能源、基建、物流等行业,数字化转型过程中面临很多痛点。大到工业园区的统筹、生产与运营资产的安全和运行维护,小到对工业品质检,场景多,需求复杂且细碎。

而商汤AI大装置的“能力圈”,不仅在于分布地域广阔的工业基础设施,铁路、电网等设备运营维护,即便是安全规范的车间生产区域中,AIDC也能通过智能化的AI感知,实现对车间、厂房、产线、车辆的实时智能安全管理,使用自动化预警措施,降低安全事故的发生率。

国家电网“多站融合”的数字化转型中,国网综合能源服务集团有限公司得以被商汤AI赋能,成功提升了运维体验和效率,推动了现有变电站资源的整合。

另一个频繁可见的工业场景在汽车行业。

汽车产品质检环节,也是一个长尾场景,很多细微的瑕疵,需要被快速精准定位。

无论是商汤协助一汽青岛汽车厂开发的业内首条“5G+AI”冲压件表面质量在线检测线,还是与发动机厂商康明斯合作研发的深泉质检推训平台,都在零部件的表面缺陷和工艺过程检测效率,以及质检结果输出的一致性上,有了极大改善。

商汤科技联合创始人兼大装置首席科学家林达华表示,当人工智能进入到这个行业时,会发现它整个生产链条非常长,商汤遇到了很多长尾场景,在响应每个具体需求的时候,成本和代价都是非常高的。

因此,要让人工智能成为未来整个国民经济发展的根本,就需要突破一个新的红线,即成本红线。

SenseCore商汤AI大装置的出现,在某种程度上,意味着AI助力下游行业走到了成本下降的关键节点。

04颠覆式创新,猜想未来

2016年,AlphaGo在围棋大战中击败了韩国围棋冠军李世石。

2020年,开源人工智能系统AlphaFold测出35万种蛋白质的结构,解决了困扰生物学界50多年的蛋白质测序难题。

2022年,谷歌旗下人工智能企业DeepMind使用“深度强化学习”,首次在模拟环境下实现了控制核聚变。

在人类有能力探知的领域,人工智能可缩短工作时间、提高工作效率。

例如,在澳门镜湖医院,SenseCare®️Cardiac心脏冠脉智能临床系统,能全自动完成高精度的心脏分割、冠脉提取与三维重建,大量减少医生手动后处理的工作量。

但人工智能贡献不仅限于此,更大的意义在于,它能够探索“不知道自己不知道”的领域,依靠未知数据的发现和利用,以令人类惊叹的方式,重绘新世界的图景。

癌症至今是人类的世纪未解难题之一。而肝细胞性肝癌(HCC)是全球第六大最常见的恶性肿瘤,死亡率仅次于胃癌和食道癌。

在手术切除HCC后,仍有60%-70%的患者五年内出现复发。肿瘤异质性(肿瘤的生长速度、侵袭能力、对药物的敏感性、预后等产生的差异)的存在,使患者预后生存情况,与治疗期与治疗方式的相关性不高,难以预测,给肝癌精准治疗带来极大挑战。

但基于人工智能方法建立的预测预后模型,能够兼顾精准度与实用性,且与现有的临床工作流程完全兼容。

浙江大学医学院附属邵逸夫医院放射科胡红杰教授团队,联合温州医科大学附属第一医院杨运俊教授团队和商汤科技,基于364例多中心数据建立CT影像组学模型,预测HCC患者在手术切除后的无复发生存期(RFS),帮助临床进一步筛选可能从术后辅助经动脉化疗栓塞术(PA-TACE)获益的患者。

最重要的是,使预后预测方式,从宏观的肿瘤形态分级,进入到通过人工智能细化肿瘤的微观生物学信息,这将有助于降低HCC患者术后复发率,提高总体预后。

在这些提高诊疗效率措施的基础上,新药研发同样被AI赋能,从而大幅度缩短研发周期、降低药品研发成本以及提高新药研发成功率,突破人类创造力边界。

2021年,商汤发布以AI技术“猜想”新药的研究成果,全面覆盖药物研发、临床研究、临床试验、新药上市后等多个环节。

其中,最为“惊艳”的是辅助新药发现。靶点是药物发现的开端,而新作用靶点的机制,建立在对蛋白质相互作用(protein-proteininteractions,简称PPI)的研究上。

传统PPI研究方法耗时漫长,且难以有效对PPI分类;即便后来进步到计算机模拟,仍是一种“已知推算未知”的底层逻辑,无法直接泛化应用于未知新蛋白及PPI。

针对此点,商汤团队有两个创新方案。一是训练出一套能够学习PPI的GNN(图神经网络)模型,优化了在未知PPI上的预测性能;二是重新划分数据,衡量模型在跨数据集和未知新蛋白的性能效果。

商汤的创新方案,比传统方法提高了36%的预测精度。

高鲁棒性的基于GNN的PPI分析框架,来源:商汤公众号

不只医学领域,在游戏训练中,商汤的AI智能体,也有优秀作战能力。

《星际争霸2》是业界公认的具有超高游戏难度、公平竞技性的即时战略游戏。给AI玩家带来挑战的是,需要多个智能体在复杂环境中的相互竞争、相互协作,且并不存在唯一的最佳策略。

不同于围棋、象棋等规则明确的游戏,在《星际争霸2》中,对局存在大量隐藏信息,有高度不确定性。即使是一局对战里,也需要频繁切换策略、把握长短期目标,控制宏观与微观的单体平衡。

这对AI机器人造成了挑战。因为仅依靠堆积算力解决不了问题,强大的直觉、预测、推理等模糊决策能力同等重要。

依靠SenseCore商汤AI大装置海量算法和卓越的算力,商汤以较低成本开发出原创游戏AI生产平台。

在分布式训练流程中,AI“左右互搏”,不断博弈,生成大量对局。历经不断进化后,AI智能体像AlphaGo一样,最终达到了战胜人类高手的对战水平。

最有意思的是,这些平台不仅能应用于游戏中的“人机对战”,还能进一步延伸到现实生活中的城市管理、交通调度、自动驾驶等智能决策交互难题,探索“颠覆式”创新。

探索未知,不仅仅是延伸,更是模型重构。从某种意义上,产业价值得以再造,甚至颠覆原有格局,推动AI商业化进入一个新的上升螺旋通道。

探索元宇宙“生存”,如何能“真实”地在消费场景中应用,带来新鲜的消费体验?

在广州悦汇城的周年庆中,商汤给出了答案。基于商汤SenseMARS火星混合现实平台,带来更多“元宇宙”超现实体验。

空中盘旋的巨大冰龙、梦幻的冰雪城堡、可爱的动物冰雕、AR红包雨、AR集图打卡等有趣的功能,营造出超现实的氛围感,令人沉浸其中,忍不住想参与进来。在周年庆的10多天里,广州悦汇城全场销售额提升了196%,会员增长74%。

元宇宙,还可以是“汽车元宇宙”。

2021年7月,商汤发布智能汽车解决方案SenseAuto绝影智能汽车平台,此后不断迭代,到目前已完成从智能座舱到智能驾驶(L2-L4)以及V2X业务的全面覆盖。

商汤绝影平台(SenseAuto)由五大产品组成:即SenseAutoADAS、SenseAutoCabin、SenseAutoEmpower、SenseAutoRoboX及SenseAutoV2X。

“cornercase”指在复杂系统的测试或是除错过程中,由极值参数构成的边角案例。但这些边角案例的发生,往往是智能驾驶中不可接受的行驶风险。

SenseCore商汤AI大装置提供的强大的算法和算力支持,令商汤绝影团队能够顺畅迭代针对性模型,化解掉各种边角案例的极端场景。

比如车辆出入车库,穿行于林间道路时,强烈的光线反差导致驾驶员出现的“阴阳脸”,包括眼镜反光、大角度侧脸场景等,都给感知算法带来极大挑战。

在本田中国近期发布的两款首发车型——东风本田e:NS1与广汽本田e:NP1中,借助车舱内置的红外单目摄像头,商汤绝影平台SenseAutoCabin-D驾驶员感知系统,可实时感知驾驶员的表情、视线、姿态动作,准确判定疲劳、分心、危险动作等危险驾驶隐患,并及时预警。

目前为止,SenseAuto绝影智能汽车平台已有累计超过30家汽车行业客户,累计前装定点数量达2300万台,覆盖未来五年内量产的60多款车型。

在高工智能汽车研究院近期公布的“2021年度中国市场乘用车前装座舱AI软件供应商标配搭载量”排行榜单中,商汤以9.47万辆搭载上险量、15.79%的市场份额高居第一。

日前,商汤科技与广州汽车集团有限公司签署了战略合作协议。双方围绕智能驾驶、智能车舱、智能网联、汽车元宇宙、AI工具链、超算中心等多个领域展开合作。

今年和明年,商汤与广汽传祺、广汽埃安合作的多个车型,将陆续量产上市。未来,还将有更多车型搭载商汤绝影智能汽车平台。

但AI的终极议题,是普惠人类生活。

05共生时代,AI普惠生活

8月9号,商汤正式发售由中国象棋协会权威认证的“元萝卜SenseRobot”AI下棋机器人。

可爱的外形、酷酷的机械臂看起来科技感十足。人机对弈、象棋教学、残局闯关等有趣的功能,让无论是初学者还是具备一定象棋水平的玩家,都能找到适合自己的对弈等级。与元萝卜一起学习,甚至能考取中国象棋协会认可的棋士等级证书。

“元萝卜SenseRobot”AI下棋机器人,来源:商汤官网

这是商汤首款家庭消费级人工智能产品,也是AI的一步普及性探索。未来AI的发展,必将惠泽万家。

但探索真正未知宇宙的前提,仍然是算力和算法的“基建”设施,足够完满。

电力、汽车、医药、消费、城市管理……这些案例,几乎触摸到了各行业疑难杂症的边界,但仍然只是AI能做的冰山一角。

千行百业都能实现智能化升级的前提条件,即万物数字化、智能化。而AI行业发展到新阶段的必要条件,即是打通闭环、解决长尾问题。

谁能以更低的成本、更早的布局、更快的技术迭代解决好这个问题,谁就能成为人工智能跑向“最后一公里”的决赛冠军,打开巨大的商业空间。

8月19日,恒生指数公司宣布截至2022年6月30日的恒生指数系列季度检讨结果,所有变动将于2022年9月5日(星期一)起生效。其中,商汤-W被纳入恒生中国企业指数成份股。

恒生中国企业指数,反映的是在香港上市的大型中国企业的表现,涵盖50家市值最大、交易最活跃的港股中国企业。

在产业规模超过4000亿元、企业数量超过3000家的人工智能行业,不仅有小而美,还有大而强。

当虚拟世界真正映射到现实世界,人类对机器的“驱使”,也将转变为机器对人的照料。

AI在这一过程中,所赋能的功能意义,是使机器“接地气”,变得有温度,有人文情怀,也更有力量和智慧,参与到人类社会历史的进程当中。

从高深莫测的黑科技,变身为辅助工作、生活不可或缺的重要组成,持续提供创造力的灵感,是人类世界对人工智能最深切的愿景。

打通人工智能去虚向实“最后一公里”―中国经济网

■ 深圳特区报评论员 赵强 

我国首部人工智能产业专项立法――《深圳经济特区人工智能产业促进条例》(以下简称《条例》)日前正式公布,并拟于今年11月1日起实施。为破解人工智能产品落地难问题,《条例》提出创新产品准入制度,对于国家、地方尚未制定标准但符合国际先进产品标准或者规范的低风险人工智能产品和服务,允许通过测试、试验、试点等方式开展先行先试。 

“落地难”是制约人工智能发展的一大瓶颈。在2022年世界人工智能大会开幕前夕的一场闭门交流大会上,有专家切中肯綮地指出,“人工智能技术要真正地落地,不仅有对星辰大海的仰望,更要脚下带泥的深耕。” 

深圳在人工智能领域深耕多年,目前不仅已形成完整的人工智能产业链,而且人工智能正不断进入人们的生活日常,在民生服务、社会治理以及经济发展等诸多领域发挥着积极作用。良好的人工智能产业基础与丰富的应用经验,为深圳破解人工智能产品落地难问题创造了先行先试的条件和机遇。 

人工智能只有不断真正落地,才能去虚向实,实现人工智能与实体经济的双向奔赴。《条例》以促进产业发展为出发点,针对深圳人工智能产业发展的瓶颈,出台了一系列政策,从强化应用示范、着力引导开放和创新产品准入等多个方面发力,消除“痛点”、疏通“堵点”、攻克“难点”,为打通人工智能去虚向实的“最后一公里”,进行了富有创新性、创造性的探索。 

法治先行,是人工智能产业行稳致远的有力保障。《条例》率先为人工智能产业立法,为促进人工智能进一步落地开花结果提供了法治保障与支撑,是深圳打造全球领先的人工智能产业高地的重要抓手,也将为国家层面立法探索经验。深圳人工智能产业当抓住先行先试的重大战略机遇,在不断创新与突破中共创美好未来。 

数字双赋打通韧性城市建设“最后一公里”

摘要

随着城市脆弱性的不断攀升,韧性城市建设愈发成为城市治理现代化进程中的关键。基层韧性治理是韧性城市建设的“最后一公里”,且数字技术手段的应用是实现基层韧性治理的有力抓手。通过构建“技术双赋—韧力释放”框架,引入中国智慧社区建设案例,剖析数字技术助力基层治理的逻辑进路,可以发现,在“技术赋能”与“技术赋权”双轮驱动的理想状态下,基层组织将在一定程度上发生变革:能够释放韧性治理能力的韧性基层组织将逐步形成。因此,在运用数字技术手段助力基层韧性治理过程中,需充分发挥数字技术手段机理优势,积极探索与数字技术相适应的权力配置机制,大力推动建设朝向韧性治理目标的组织体系。

【关键词】韧性城市 韧性治理 数字技术 基层治理 智慧社区

【中图分类号】D630

【文献标识码】A

【DOI】10.16619/j.cnki.rmltxsqy.2022.1112.003

引言

城市是现代社会中最重要的物理空间、经济载体与社会场域。在治理现代化进程中,城市作为日益复杂的巨型系统,具有集聚性、规模性、流动性、异质性、多元性等特有属性。[1]这些特有属性增加了城市的脆弱性,城市治理难度不断攀升,[2]建设韧性城市以应对城市脆弱性问题势在必行。党的十九届五中全会指出,“我国已转向高质量发展阶段,制度优势显著,治理效能提升,……发展韧性强劲”;要“建设海绵城市、韧性城市”。显而易见,“韧性”一词在我国国家治理话语体系中举足轻重。“韧性”(resilience)的概念最早于1973年被提出,生态学教授霍林在其著作《生态系统韧性和稳定性》中指出,“韧性”是系统在外部扰动时恢复稳态的能力。[3]此后,韧性的理念逐渐在应急管理领域中广泛应用,强调系统的稳定性、可靠性和抗干扰性。[4]“韧性城市”概念则发源于“韧性”理念,自2005年联合国发布的《兵库行动框架》强调“韧性城市建设”后,这一概念逐渐引起国内外的高度重视,国外典型的如日本推出《社区可持续发展——现有的关于可持续发展和城市韧性的指南和方法的清单》、美国洛克菲勒基金会推行“全球100韧性城市”项目等,国内典型的如《北京韧性城市规划纲要研究》《合肥市市政设施韧性提升规划》等。

在国家治理现代化背景下,“韧性”不再局限于应急管理领域,而被引入更广泛的治理领域,主要强调系统受到干扰后需要综合硬件(基础设施和生态系统等)和软件(社会治理要素),通过学习和再组织吸收扰动、降低损失,使系统恢复到原来的状态或达到新状态的能力,其本质特征在于鲁棒性、自组织性、创新性。[5]如“鲁棒性”是“robustness”(健壮、强壮)一词的音译,是指在异常和危险情况下系统生存的能力。在此基础上,“韧性”与多元治理机制相耦合,“韧性治理”应运而生,成为当前治理领域的一个新热词。有学者指出,韧性治理的重点在于保持系统的功能而不是系统本身,以保证城市在面对压力和冲击时也能保持正常运转并提供应有的服务。[6]

为推动精细化治理目标的实现,我国治理重心逐渐下沉。基层治理现代化是国家治理体系和治理能力现代化的重要组成部分,基层韧性治理成为韧性城市建设的“最后一公里”。数字化时代,大数据、区块链、云计算、人工智能等新兴数字技术在公共治理中实现有机嵌入,并成为了国家治理现代化进程中不可或缺的重要手段。因而,“韧性治理”在愈加多元的数字化应用场景中有了新的释义与内涵。中央网络安全和信息化委员会印发《“十四五”国家信息化规划》(2021年12月),提出“到2023年,基层智慧治理规划、政策和标准规范更加完善,数据资源整合取得明显成效,支撑基层社会治理水平大幅提升;到2025年,精细化服务感知、精准化风险识别、网络化行动协作的基层智慧治理体系基本建成,有力支撑基层治理体系和治理能力现代化”。我国智慧社区、数字乡村等顶层设计与前沿实践表明,数字技术的深化应用是实现基层韧性治理的有力抓手,是助推基层治理体系和治理能力现代化的重要方式之一。因此,本文以基层韧性治理为轴线,以数字技术为理路,剖析数字技术如何推动基层韧性治理能力生成,极具现实价值,可为更好实现基层韧性治理建设提供理论支撑。本文主要回答以下研究问题:数字技术何以推动基层韧性治理?如何更好发挥数字技术优势推动基层韧性治理能力释放?基于此,本文通过构建“技术双赋—韧力释放”理论分析框架,引入我国智慧社区建设的实际案例,阐述数字技术助力基层韧性治理的逻辑进路。

文献综述与理论分析框架

韧性与韧性治理。“韧性”衍生于拉丁语“resillo”(跳回原来状态)。[7]学界对“韧性”这一概念的界定形成了四种代表性的观点:“能力恢复说”[8]“扰动说”[9]“系统说”[10]“能力提升说”[11]。相对应地,韧性理论的发展先后经历了工程韧性、生态韧性、社会生态韧性三种观念的转变。[12]近年来,学界围绕韧性的内涵,结合治理实践,延伸开展了大量关于韧性治理的研究。当前,大部分学者聚焦于应急管理或风险治理领域。现有研究分为三类:宏观层面的研究主要关注韧性治理的概念与特征[13]、韧性城市的评价指标构建[14]、韧性城市的实践与探索[15]等内容;从中观层面切入的研究大多是基于实证依据分析韧性理念在城市治理中的嵌入过程[16];微观层面关注的则是面向韧性治理的某一具体机制,如危机学习机制构建过程[17],或是某一具体领域,如卫生安全韧性构建的治理模式创新[18]。此外,在现有研究中,还有小部分学者关注“韧性”在更广泛治理领域中的应用,如有学者提出当代中国治理体系韧性的再解释[19];还有学者通过阐述试验民主与韧性治理的关系,提出中国改革的行动逻辑[20]。尽管如此,当前学界将韧性治理拓展至更广泛治理领域的研究和探讨依旧十分薄弱,深入至治理环节剖析治理韧性生成机理的研究少之甚少。当前,韧性治理研究的薄弱点,正是本文的破题之处。本文将韧性治理置于更广泛的治理领域,且落脚于基层治理层次,从组织学意义与治理逻辑出发,探究数字化背景下基层治理韧性的生成机理。

数字技术助力韧性治理。随着新兴数字技术向纵深发展,政府数字化转型进程不断加速,数字技术在政府治理中的实际效用研究引发了学界的广泛关注。当前,在数字政府领域已有大量的理论探讨与实证分析,也不乏聚焦数字政府应用细分领域的探讨。[21]更进一步,关于数字技术助力韧性治理方面的研究,大多学者仅在应对韧性治理困境中提及数字技术的应用可行性。[22]还有部分学者探究韧性和智慧的关系。如有学者提出,基层治理的数字化创新,在有效赋能基层治理的同时,也在一定程度上削弱了基层治理的固有韧性,并在此基础上提出基层韧性治理的数字化转型策略;[23]还有学者基于智慧城市评价指标体系,通过利益相关者评价模型,分析我国智慧城市建设对城市韧性提升的显著性,回应智能与韧性是否兼容的研究问题。[24]此外,仅有少部分学者深入治理环节探究数字技术助力韧性治理的逻辑或机制。例如,有学者通过剖析“技术赋能”“技术赋权”在基层韧性治理中的实际效用,探究数字化时代基层治理韧性的生成机理;[25]还有学者对韧性理论进行深入分析,论证智慧社区对灾害韧性提升的促进机制。[26]综上,当前学界从韧性治理理论视角关注数字技术对政府治理影响的研究仍较为稀缺;从数字治理视角关注韧性治理实践的研究也屈指可数。以上理论视角的有机整合,正是本文的理论创新之处与突破之处。基于此,本文将数字治理与韧性治理相结合,探究数字技术助力基层韧性治理的逻辑进路。

技术双赋—韧力释放:数字技术助力基层韧性治理的解释框架。技术赋能和技术赋权是数字技术推进数字政府转型的两大关键机制,也是当前关于政府数字化转型研究中深刻探讨的两大核心议题。“技术赋能”强调新兴技术对公共部门的赋能作用,“技术赋权”强调新兴技术赋权社会主体提升其参与和协同能力的价值。[27]与此同时,不可割裂看待技术赋能和技术赋权,二者相互促进。[28]由于“能”与“权”是组织结构的核心组成部分,二者的变化也将在一定程度上影响组织结构特征。综上,数字技术手段应用有效实现了技术赋能,进而助推技术赋权,最终推动组织在一定程度上发生变革。[29]落脚于韧性治理范畴,现有研究已论证数字技术对韧性治理起到显著的正向助推作用。[30]因此,本文基于数字治理、韧性治理理论视角,提出数字技术助力基层韧性治理的解释框架:技术双赋—韧力释放(如图1所示)。具体而言,在“技术赋权”和“技术赋能”双轮驱动的理想状态下,能够释放韧性治理能力的韧性基层组织逐步形成。依托此理论分析框架,本文结合智慧社区实践案例,深入探究了数字技术助力基层韧性治理的逻辑进路。

数字技术助力基层韧性治理的逻辑进路:以中国智慧社区建设为例

中国智慧社区:面向未来的智慧社区。《中共中央国务院关于加强基层治理体系和治理能力现代化建设的意见》(2021年4月28日)强调,“要加强基层智慧治理能力建设”,将数字技术在基层治理中的应用置于重要地位,指出“市、县级政府要将乡镇(街道)、村(社区)纳入信息化建设规划,统筹推进智慧城市、智慧社区基础设施、系统平台和应用终端建设,强化系统集成、数据融合和网络安全保障”。关于智慧社区建设,民政部、中央政法委、中央网信办等9部门于2022年5月10日印发《关于深入推进智慧社区建设的意见》(民发〔2022〕29号),明确了智慧社区建设的总体要求、重点任务和保障措施等,指出“智慧社区是充分应用大数据、云计算、人工智能等信息技术手段,整合社区各类服务资源,打造基于信息化、智能化管理与服务的社区治理新形态”。从智慧社区的定义可以看出,智慧社区虽然是智慧城市建设的基础单元,但由于社区是一个极其复杂的系统,智慧社区建设需要社区内外的人、物、技术、组织等多要素的协同联动。随着智慧社区实践的不断深入,学界对于智慧社区的特征已形成较为成熟的提炼:第一,重视利用通信和信息技术手段;第二,推进各类要素资源的协调与整合;第三,坚持以人为本原则,鼓励公众参与;第四,促进系统迭代升级;第五,实现可持续发展目标。[31]当前,我国各地大力推进智慧社区建设,已拥有十分可观的建设基础、建设规模及建设成效。2012年3月,北京市人民政府印发《智慧北京行动纲要》,北京市海淀区在全市率先启动了智慧社区建设;随着新兴数字技术及其应用的迭代发展,“智慧”的标准及水平不断提高。近年来,北京市海淀区利用5G、人工智能、大数据等新技术手段,整合社区资源,建立“智慧社区”服务平台,实现社区公共服务和管理的智能化。2012年9月,广州市启动了天河、越秀、海珠、番禺四个地区的“智慧社区”试点工作。2013年11月,上海市经信委、民政局、文明办印发了《上海市智慧社区建设指南(试行)》,指出社区建设需要网络化、便利化、信息化、智能化。2019年,浙江省政府印发了《浙江省未来社区建设试点工作方案》,擘画了以数字化改革为引领的未来社区建设蓝图,开创了我国未来社区建设的先河,为后续实践提供了示范性参考。未来社区建设是我国智慧社区建设的最新形态和先进阶段,其不再局限于数字技术在社区中的普及和应用,更强调多元治理场景中数字手段与治理机制的耦合。综上,我国智慧社区建设逐步面向“未来”。

智慧社区建设助力社区治理韧性的逻辑进路。

1.技术赋能:“强健性”基础为社区韧性治理提供能力保障。数字技术手段的引入有效实现了技术赋能,为韧性治理的实现提供了“强健性”基础。数字技术的应用助力社区治理能力现代化,主要表现在四个方面:第一,数字技术的运用使得关键公共问题能够被社区治理主体精准、迅速地识别。在技术运用下,社区治理主体在治理过程中获取信息的渠道得以拓宽,且信息传递的链条得以缩短,因而社区治理主体在第一时间所能获取的用于研判、分析的数据量级大大提高,且传递过程减少了信息的失真与损耗。与此同时,社区治理主体对信息的感知能力得以提升,尤其是自动预警等功能的应用,使得治理主体能够迅速、精准地识别出有待处置的关键公共问题。第二,数字技术的运用有助于社区治理主体实现科学化决策。基于海量信息的分析及研判过程有助于社区治理主体的决策过程趋向科学化,改变了以往依赖经验主义甚至闭门拍脑袋的决策形式,因而降低了路径依赖带来的影响。第三,数字技术的运用有助于提升行政执行效能。智能化手段的运用替代了非必要的机械式人力成本投入,有效提升了工作效能。此外,跨功能、跨层级、跨组织、跨领域的沟通和协调成本在数字手段运用下得以降低,全方位的资源能够实现迅速配置,冗余度在此过程中得以提升,进而有助于更好应对危机和风险。[32]第四,数字技术的运用有助于社区治理主体在决策及执行过程中对所实施的方案进行不间断地跟踪及效果评估,并根据预期目标进行实时动态调整,执行过程由此极具韧性。例如,深圳市南山区西丽社区智慧管理运营中心推出“算法超市”功能模块,社区管理人员通过筛选适配性的数字化解决方案,高效完成基层治理事务或开展专项治理活动。尤其在应急指挥方面,依托技术实现秒级自动下发核查任务,并经由网格员分拨到社区,达到基层减负的效果。又如,上海市静安区临汾路街道“社区大脑”集网格中心、综治中心、物业中心、应急中心、保障中心为一体,并通过智能化技术接入绝大部分城市部件与全部城市事件管理数据,使“社区大脑”成为能分析、能判断、能指挥、能协调、能处置的社会治理平台。综上,在数字技术手段运用下,社区治理能力得以提升,具备实现“韧性治理”的“强健性”基础。

2.技术赋权:权责匹配与多主体共治推动社区韧性治理。数字技术手段的引入可以有效助推技术赋权,且技术赋能与技术赋权相互促进。其一,在技术赋能情况下,社区治理能力逐步提升,即社区有能力自主承接更多的治理事务,在一定程度上增强了上级政府部门对街道办、居委会治理能力的信任度,使其在可控范围内下放权力,实现了治理重心的下移。基层的事务交由基层自主处置,不仅降低了层层授权的时间成本、协调成本和机会成本,提升了整体治理效能,更有助于精细化治理目标的实现,尤其是应对重大突发事件时的响应速度及处置效果将得到显著提高。例如,北京市“街乡吹哨,部门报到”机制是数字技术手段助推基层韧性治理的先进经验。具体而言,在基层一线发现问题时,借助平台系统发出“哨声”,上级部门须在半小时之内迅速作出响应。换句话说,在技术赋能的基础上充分赋权基层,实现执法力量的下沉,通过解决权责匹配不合理、协同机制不完善等困境提升基层治理能力,实现数字治理理念和韧性治理理念的有机耦合。此外,北京市朝阳区还进一步推出了“社区吹哨、科室报到”“社区吹哨、社会力量报到”“支部吹哨、党员报到”等创新机制。其二,数字技术的运用拓宽了社区与外界的信息交互渠道。数字技术的引入,使得智慧社区的治理主体不仅包括发挥政府基层治理作用的街道办和作为群众性自治组织的居委会这两个核心治理主体,社会、市场、公众等参与性治理主体开始扮演愈来愈重要的角色。基于此,多元共治逐渐走向常态,权力结构特征趋向扁平化、均等化、共享化,有效实现了“还权于民”。例如,杭州市拱墅区小河街道“红茶议事会”治理模式已在9个社区进行推广。具体而言,该模式是基于居民信箱、信访数据、网络舆情等数据进行民意热点大数据分析,自动形成“红茶议事会”议题,通过邀请多方主体召开线上或线下会议形成共治方案,回应群众诉求。又如,杭州市萧山区瓜沥七彩社区利用社区积分制度,调动社区居民参与社区治理与建设。从基层管理演化至基层治理,再进一步实现基层韧性治理,公众参与其中发挥自身重要作用。提升公众对政策的认同感,并将公众意见吸纳至政策制定与执行过程中,将对社区治理起正向推动作用。与此同时,治理过程能够对公众诉求进行回应,也是治理成效的一种表现。因此,在数字技术手段运用下,技术赋能助推技术赋权,权力运行的变化又反向助推技术赋能。在此基础上,社区治理呈现稳定性、自适应性、抗干扰性,即有效助推了社区韧性治理。

3.韧性组织形成:释放韧性治理能力的韧性社区形成。在“技术赋能”与“技术赋权”双轮驱动的理想状态下,基层组织将在一定程度上发生变革,能够释放韧性治理能力的韧性基层组织将逐步形成。聚焦于社区治理层面,可以将韧性社区定义为:由街道办、居委会、物业公司、业委会、公众及其他商业企业、社会组织等多元主体以实现社区韧性治理为目标而共建共治共享的“大组织”。社区治理能力的有效提升,以及权力运行机制发生变化,将在一定程度上驱使组织发生相对应的系统性变革,即科层体制、功能结构、治理机制、治理手段等均将发生变化。由此,韧性社区应运而生。韧性社区具备强健性、灵活性、稳定性、抗干扰性、自适应性等特性,能够充分接纳外部环境的复杂多变性,尤其是应对外界风险和挑战等例外事件时更显现该特质。与此同时,这些特质将作为内生动力,助力社区韧性特征的稳定表达,如自适应性所匹配的组织学习能力将帮助社区就外界环境的变化进行调整和适应,以应对重大风险挑战。因此,社区韧性治理能力的可持续供给则来源于组织自身,数字技术的引入仅为制度性的变革提供了一个契机和手段。[33]在我国智慧社区建设实践中,创新性较强的是建立多主体一体化治理机制的杭州市滨江区缤纷未来社区。为应对管理主体多、执法主体多、业态问题多、数据平台多、居民投诉多等治理难点与堵点问题,缤纷未来社区整合公安、城管、交警、市监、消防等主体力量,实现由一支队伍进行综合管理。数字手段的引入为整合多社区功能提供了契机,缤纷未来社区打破条块分割,基于“多跨融合、高效协同、整体智治”的数字化理念,建立社区微脑并形成一体化指令平台。当前,缤纷未来社区的改革创新仅是我国智慧社区实践成效的一个面向,但已初显新兴数字技术引入带来的制度性变革端倪。

结论与讨论

城市作为日益复杂的巨型系统,随着其脆弱性不断攀升,韧性城市建设愈发成为城市治理现代化进程中的关键。基层韧性治理作为韧性城市建设的“最后一公里”,是韧性城市建设能否顺利落地的具体指向。由于数字技术手段的应用是实现基层韧性治理的有力抓手,在数字化背景下探究基层治理韧性的生成机理,可为后续韧性城市建设尤其是在基层中的实践提供理论指导与经验借鉴。因此,本文通过构建“技术双赋—韧力释放”框架,基于对中国智慧社区建设案例的分析,回应了研究问题。本文的研究贡献在于将韧性治理理论与数字治理理论视角相耦合,并深入治理环节,从机理层面探究数字技术助力基层韧性治理的逻辑进路。

综上所述,数字技术助力基层韧性治理的逻辑进路为:数字技术的引入有助于“技术赋能”,进而助推“技术赋权”,且二者在推动韧性治理的过程中相互促进(如图2所示)。在“技术赋能”与“技术赋权”双轮驱动的理想状态下,基层组织将在一定程度上发生变革:能够释放韧性治理能力的韧性基层组织将逐步形成。具体而言,“技术赋能”体现在:数字技术的引入有助于迅速且精准识别关键问题,实现科学化决策,提升行政执行效能,并有助于政策执行效果的动态评估与执行调试。因此,在数字技术手段运用下,治理能力得以提升,使得治理过程极具韧性,形成了实现“韧性治理”的“强健性”基础能力。“技术赋权”体现在:数字技术的引入可以促使权力运行过程发生转变,如实现权力的下放、回归等,可以推动权责匹配并实现多主体共治,推动社区韧性治理的良好局面。“技术赋能”和“技术赋权”二者呈现有机统一的关系,“技术赋能”是“技术赋权”的基础,“技术赋权”的实现能够助推“技术赋能”。在双轮驱动的理想状态下,具备强健性、灵活性、稳定性、抗干扰性、自适应性的韧性组织逐步形成,可持续地释放韧性治理能力。一言以蔽之,从技术赋能至技术赋权,再至释放韧性治理能力的韧性基层组织的变革过程,即为数字技术助力基层韧性治理的逻辑进路。

在充分认识到数字技术助力基层韧性治理的内在机理之后,如何在实践中更好发挥数字技术优势,推动基层韧性治理能力释放?在此,提出三大政策建议:第一,充分发挥数字技术手段机理优势,将数字化思维融入基层治理全生命周期,为基层实现韧性治理提供能力保障。第二,积极探索与数字技术相适应的权力配置机制,促进技术与机制的有机融合,为基层实现韧性治理提供机制保障。第三,大力推动建设朝向韧性治理目标的组织体系,化被动为主动应对组织变革,为基层实现韧性治理提供组织保障。[34]

注释:略

(本文系科技创新2030—“新一代人工智能”重大项目“重点领域人工智能治理挑战及对策研究”和国家社科基金重大研究专项“新时期深化国家科技体制改革、提升国家创新体系整体效能的思路、路径与对策研究”的阶段性成果,项目编号分别为:2020AAA0105300、18VZL005;清华大学公共管理学院博士研究生黄甄铭对本文亦有贡献)

文章原刊载于《人民论坛·学术前沿》2022年6月合刊

原文标题:《数字双赋打通韧性城市建设“最后一公里”》

通用(大)模型的最后一公里:ETA计算中

自2018年谷歌推出BERT(3.4亿参数)以来,语言模型开始朝着「大」演进。国内外先后出现了参数量高达千亿甚至万亿的语言模型,比如谷歌的T5(110亿)、OpenAI的GPT-3(1,750亿)、华为联合鹏城实验室的盘古(Pangu)(2000亿),智源研究院的WuDao2.0(1.75万亿)……

基于注意力机制的Transformer架构已经席卷了CV领域,并成为研究和实践中日益流行的选择。此前,Transformer被广泛用于NLP领域。有研究者仔细研究了自然语言处理中Transformer最优扩展,主要结论是大型模型不仅性能更好,而且更有效地使用了大量计算预算。

2022年了,语言模型的参数的规模量卷到如此程度,它们究竟能做些什么?大模型又跨界到什么程度了呢?

在2021年6月的一篇论文中,原ViT团队成员、谷歌大脑的几位研究者集中研究了预训练ViT模型用于图像分类任务的迁移性能的扩展规则(scalinglaw)。研究者尝试对从500万到20亿个参数不等的模型进行了实验,从3000万到30亿个训练图像不等的数据集、低于1个TPUv3核每天(core-day)到超过10000个核每天进行计算预算。基于实验结果,文献描述了ViT模型的性能计算边界。

随着BERT、DALL-E、GPT-3等大规模预训练模型的出现,AI社区正在经历一场范式转变。从计算机视觉到自然语言处理,从机器人学到推理、搜索,这些大模型已经无处不在,而且还在继续「野蛮生长」。

这种野蛮生长是大模型的有效性带来的必然结果。在BERT出现(2018年)之前,语言模型的自监督学习本质上只是NLP的一个子领域,与其他NLP子领域并行发展。但在BERT横扫11项NLP任务之后,这种格局被打破了。2019年之后,使用自监督学习构造语言模型俨然已经成为一种基础操作,因为使用BERT已经成为一种惯例。这标志着大模型时代的开始。

这一时代的重要标志是「同质化」。如今,NLP领域几乎所有的SOTA模型都是少数几个基于Transformer的大模型进化而来。而且,这种趋势正在向图像、语音、蛋白质序列预测、强化学习等多个领域蔓延。整个AI社区似乎出现了一种大一统的趋势。

毋庸置疑,这种同质化是有好处的,大模型的任何一点改进就可以迅速覆盖整个社区。但同时,它也带来了一些隐患,因为大模型的缺陷也会被所有下游模型所继承。

大模型的强大能力来自巨大的参数空间的结合,这也导致它们的可解释性非常差,其能力和缺陷都存在不确定性。在这种情况下,盲目将整个研究范式向大模型转变真的可取吗?

此外,我们目前依然尚不清楚这些发现在多大程度上能够迁移到视觉领域。例如,视觉中最成功的预训练方案是有监督的,而NLP领域是无监督预训练。

2021年8月,斯坦福大学的PercyLiang、RishiBommasani(PercyLiang的学生)、李飞飞等100多位研究者联名发布了一篇系统探讨此问题的论文。在论文中,他们给这种大模型取了一个名字——「基础模型(foundationmodel)」,并系统探讨了基础模型的机遇与风险。「基础」代表至关重要,但并不完备。

在即将到来的一年里,在大规模预训练模型的跨界之路上,又将出现哪些变数?

-「基础模型(foundationmodel)」是否将成为下一个AI范式?

-「基础模型(foundationmodel)」的出现是否意味着距离实现「通用模型」只剩最后一公里的路程的?

-针对细分应用领域,例如生化领域等,搞「专用模型」是否还有未来价值?「专用模型」又有哪些不一样的玩法?

2022年1月25日晚7点,在机器之心年度特别策划「驱动未来的AI技术——2021-2022年度AI技术趋势洞察」的「模型专场」,ICCV2021马尔奖(最佳论文奖)SwinTransformer作者、微软亚洲研究院(MSRA)视觉计算组的主任研究员胡瀚博士,循环智能联合创始人&清华大学交叉信息院助理教授杨植麟,循环智能资深算法总监陈虞君,AutodeskAILab研究科学家、DailyArxivRadiostation主持人楚航四位嘉宾将做客机器之心「2020-2021年度AI技术趋势洞察」直播间,分别通过技术报告「面向统一的AI模型架构和学习方法」、「对大规模预训练模型效率与泛化的新思考」,并共同就「通用(大)模型的最后一公里」等话题进行探讨。

嘉宾简介

技术报告:面向统一的AI模型架构和学习方法

胡瀚,微软亚洲研究院(MSRA)视觉计算组的主任研究员

胡瀚博士目前是微软亚洲研究院(MSRA)视觉计算组的主任研究员和研究经理。本科和博士毕业于清华大学自动化系,荣获中国人工智能学会优秀博士论文奖。曾就职于百度研究院深度学习实验室(IDL)。担任CVPR2021/2022的领域主席。目前主要研究兴趣包括视觉模型架构、视觉自监督表征学习和视觉语言联合学习等,是SwinTransformer系列、关系网络系列,可变形卷积系列的作者,其中SwinTransformer获得ICCV2021马尔奖(最佳论文)。

技术报告:大规模预训练模型的新思考:效率和泛化

杨植麟,循环智能联合创始人、清华大学交叉信息院助理教授

杨植麟博士是循环智能(RecurrentAI)联合创始人,智源青年科学家。其联合创办的循环智能(RecurrentAI)累计融资4亿元,连续三年营收增长超200%。由杨植麟博士带领研发的产品及解决方案已成功应用于银行、保险、房地产和汽车等行业,日均处理对话超一亿次、覆盖数百万终端用户。其研究成果累计GoogleScholar引用10,000余次;作为第一作者发表Transformer-XL和XLNet,对NLP领域的学术研究和商业应用都产生重大影响,分别是ACL2019和NeurIPS2019最高引论文之一;主导开发的盘古NLP大模型获2021年世界人工智能大会“卓越人工智能引领者之星奖”;曾入选2021年“福布斯亚洲30under30”;曾效力于GoogleBrain和FacebookAI,博士毕业于美国卡内基梅隆大学,本科毕业于清华大学。

趋势圆桌:通用(大)模型的最后一公里?

胡瀚,微软亚洲研究院研究员

陈虞君,循环智能(RecurrentAI)人工智能部门资深算法总监

楚航,AutodeskAILab研究科学家、DailyArxivRadiostation主持人

陈虞君,循环智能(RecurrentAI)人工智能部门资深算法总监

陈虞君博士是循环智能(RecurrentAI)人工智能部门资深算法总监。主要研究方向为自然语言处理与语音识别。曾参与国家基金委、科技部等科研项目十余项。2021年作为核心成员参与开发的盘古NLP大模型,在中文自然语言评测榜单CLUE上打破包括总榜在内的三项记录,同时盘古大模型获得2021年世界人工智能大会“卓越人工智能引领者(SAIL)之星”奖。其语音识别与自然语言处理研究成果在银行、保险、房地产和汽车等行业已规模化落地应用,日均处理超过1亿次对话。陈虞君毕业于北京航空航天大学计算机专业,获得博士学位。

楚航,AutodeskAILab研究科学家、DailyArxivRadiostation主持人

楚航,计算机视觉研究者。现任职Autodesk人工智能实验室首席研究科学家,致力于为工业建筑及动画中的设计场景提供智能解决方案。曾分别就读于上海交通、康奈尔、及多伦多大学,长期致力于使用人工智能技术构建生成元宇宙内容的研究。同时与罗若天一并发起了DailyArxivRadiostation。

2022年1月24日——1月28日精彩议程如下

作为「与AI俱进,化时光为翎」机器之心2021-2022跨年特别策划中的重要组成部分,「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI技术」与「重塑产业的AI科技」,推出线上分享,邀请行业精英、读者、观众共同回顾2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

2022年1月24日(周一)至1月28日(周五)每晚7点至9点,近20位高校教授、技术专家及技术企业高管将做客机器之心「2020-2021年度AI技术趋势洞察」直播间,共同探讨「通往第三代人工智能的理论之路如何走?」、「通用(大)模型的最后一公里」、「如何突破AI实践中的资源限制与壁垒?」、「构建元宇宙基础设施的AI技术」和「通向可信人工智能的技术路径」五个与AI技术人息息相关话题,洞察AI技术在「AI算法理论」、「ML模型架构」、「AI算法工程化」及「热点AI应用技术」四大方面的发展趋势与潮水所向。关注机器之心机动组视频号,1月24日晚7点开播!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇