人工智能核心创新触及天花板
原标题:人工智能核心创新触及天花板?“目前人工智能论文数量激增,泥沙俱下,导致部分论文质量不高,但这并不能说明人工智能发展停滞不前,而是表明目前有更多的研究人员投入到了这个火热的研究方向。”
最近几年,在人工智能领域,从基础算法到落地应用研究成果不断涌现,其中致力于人工智能落地的应用成果尤其突出,目前人工智能许多子领域的系统在性能上已经满足了具体应用场景的落地要求。
但这能说明人工智能领域的核心创新存在明显进步吗?近日,《科学》杂志刊登的一篇标题为《人工智能某些领域的核心进展一直停滞不前》的文章,对目前人工智能的研究成果提出了质疑。作者马修・赫特森指出,研究员声称的核心创新只是对原算法的微改进,新技术与多年前的旧算法在性能上相差不大。
近几年人工智能领域快速发展,其应用场景不断拓宽,为何该论文却认为人工智能某些领域的核心进展停滞不前?当前人工智能的核心创新是否已经触及了“天花板”?就此,科技日报记者采访了有关专家。
AI核心研究是否取得突破进展存争议
具体来说,《科学》杂志上刊登的这篇文章指出的现象主要有哪些呢?
该文章引用了近期在神经网络推荐算法、对抗性训练、自然语言模型等领域的批判性论文,指出这些年来一些人工智能算法发展中面临的问题。
作者马修・赫特森认为,当前部分子领域算法核心的改进并未取得突破进展。同时,当前多数论文倾向于提出新算法而不是在旧算法上调优,这样做的主要原因是更容易发表论文,尽管在旧算法上调优的效果和新算法的效果相差无几。
“目前人工智能论文数量激增,泥沙俱下,导致部分论文质量不高,选题跟风甚至论文灌水的现象确实存在,但这并不能说明人工智能发展停滞不前,而是表明目前有更多的学者和研究人员投入到了这个火热的研究方向。”微众银行人工智能首席科学家范力欣在接受科技日报记者采访时表示。
范力欣强调,尤其需要指出的是,年轻学子中的佼佼者,包括博士、学士甚至高中生,都有了登上人工智能顶会顶刊崭露头角的机会。面对这样的形势,以偏概全地以“核心研究停滞不前”来总结是不合适的。
事实上,近几年,人工智能某些领域的创新,包括算法核心创新,还是取得了较为明显的进步。
如在自然语言处理领域,《科学》杂志这篇报道中提到的长短期记忆网络(LSTM)是1997年提出的,而当前,Transformer架构在速度和性能方面,比长短期记忆网络要更优越;预训练模型方面,以BERT为代表的预训练模型不仅在很多任务上获得成功,更带来了自然语言处理研究和应用范式的变化。更重要的是这些改进已经在相对比较公认的数据集上测试过,有的还在实际的产业应用中获得成功。
对此,南京大学人工智能学院教授俞扬也指出,近几年人工智能国际顶级会议的投稿数量持续上涨,如近期神经信息处理系统大会会议的投稿接近一万篇,其中技术“催熟”、审稿随机的现象确实存在。同时,革新性的工作往往容易遭受质疑,在海量投稿中真正的技术进步也容易被淹没。
核心创新要瞄准“痛点”
当前,在人工智能领域“汹涌”的浪潮中,研究人员的成果如何称得上核心创新、突破进展?
“能够克服以往的局限,在我看来就是突破。克服的局限越关键、越深刻、越普适,突破就越巨大。”俞扬举例说,例如,以往在国际象棋上战胜人类的搜索算法,无法扩展到搜索空间更加巨大的围棋上,而广为人知的阿尔法围棋便利用机器学习技术减少了巨大的搜索空间,从而取得成功。
范力欣认为,虽然人工智能领域的研究很火热,但该领域现在仍然处于积累实践观察的初级阶段。现在的核心创新,就是通过观察与分析新的现象,不断提升现有方法的实际性能,并收集数据、证据。长期大量的观测后,真正有价值的是无数小的观察结果。
那对算法进行创新需要哪些条件?“首先是要找准问题,特别是关注制约算法性能的‘瓶颈’问题,这也是目前人工智能算法改进最难的。”厦门大学人工智能系副教授陈毅东说。
找到问题之后,需要提出合适的应对方法。一方面,新方法可以来源于对目标任务领域知识的结合,这需要研究者对目标任务和相关领域知识有全面的把握;另一方面,新方法还可以来源于其他学科,仿生技术就是常用的方式,这需要研究者对跨学科知识有一定的涉猎。
“除此以外,由于现实条件的限制,如数据、算力等,算法改进要成功还需要根据现实条件进行各种折中和裁剪。这又需要研究者具有相当的工程能力和实践经验。”陈毅东说。
科技日报记者了解到,2015年诞生的阿尔法围棋组成部分中,搜索树方法发表于2006年,策略梯度强化学习发表于2000年,卷积神经网络的提出则更早。“科学发展常常是证伪的过程,而不是一次性提出一个开创性的新理论。只有集量变为质变,才能为即将到来的理论突破打下坚实可靠的基础。”范力欣说。
“人工智能基础研究要取得突破,很有可能需要做长期并且有争议的工作。”俞扬指出,如何为这样的研究工作、研究者提供足够的生存空间,对热点之外的研究方向有独立清晰的判断力,尤其是在人工智能热浪一波接一波的环境下保持对基础研发的投入,可能是为推动人工智能基础研发、产生原创性基础成果需要考虑的重要问题。
还无法做到全领域创新评价标准统一
根据上述论文的观察,不少研究工作都夸大了其改进的效果,而其中的根源问题之一,是当前人工智能相关领域的创新评价标准不统一,那么目前有无解决措施?
事实上,当前有不少解决途径,如代码开源、公开模型、公开实验结果等手段,都能够加强研究工作的可复现性和可对比性。
不过,作为一个还在不断发展变化的领域,新问题、新领域、新现象、新关注点层出不穷,全领域范围要做到评价标准统一十分困难。但在一些已经成形的领域,有组织地制定统一评价标准是有可能而且很必要的。
陈毅东认为,首先制定评测标准需要一定站位高度,也面临相当的难度和工作量,还需要根据研究前沿的变化不断进行调整更新。因此,必须有组织地开展,建议可以由相关学会的专委会、学术与产业联盟有组织地引导领域学者、产业界研究人员来共同完成。
“其次,真实的场景和数据往往来源于产业界,建议学术界和产业界更加密切地配合,共同研讨相关领域的前沿动态、发展方向和应用痛点,制定相应的标准数据集、搭建平台,并面向科研开放数据、接口甚至计算资源。”陈毅东说。
从应用的角度看,当前人工智能技术仍然处于积累实践观察的初级阶段,面临着在许多实际环境条件下无法奏效的困境。
近期的学术会议在论文的评价标准上,也越来越强调研究工作的可复现性。俞扬建议,要把基础研究与国内的实际生产需求结合,一方面在特别的需求牵引下容易产生原创成果;另一方面,来自实际需求的正反馈容易形成闭环激励,有利于不断创新,形成自主技术体系。
“实践是检验真理的唯一标准,任何算法是否是真正的创新都要接受实践的检验。坚持不懈就会收获美好的结果,我个人是持乐观态度的。文章作者其实也认同这一点,提出各种方法必须经过严格的验证,只是文章中没有全面反映现在人工智能发展的总体态势,存在以偏概全误导公众的可能。”范力欣说。
(责编:赵超、吕骞)分享让更多人看到
适应人工智能驱动科研新范式
当前,随着新科技革命和产业变革深入发展,人工智能技术不断突破并向科研领域广泛渗透,为科研工作注入了新元素、新动能,对科研效率提升和范式变革形成显著催化作用,现代科研活动由此更加高效、精准,“人工智能驱动的科学研究”已成为全球人工智能新前沿,必将为未来科技发展开启全新局面。
近年来,我国人工智能技术快速发展,科研数据和算力资源日益丰富,顺应新时代新趋势,利用新技术新优势,推动人工智能赋能科学研究恰逢其时、大有可为。
应用场景是新范式的孕育土壤和实训基地,人工智能技术与科学研究互动互促需要在诸多应用场景中反复实践、不断完善,随着应用范围不断拓展延伸,科研能力持续实现智慧升级。为此,以需求为牵引谋划人工智能技术应用场景,基于促进科学研究更加紧密拥抱人工智能技术,拓展人工智能技术在数学、化学、地学、材料、生物和空间科学等重大科学领域的应用。充分发挥人工智能技术在文献数据获取、实验预测、结果分析等方面的作用,围绕具有典型代表意义和辐射带动性的基础科学、应用科学领域,创造更多实战式应用场景,融合人工智能模型算法和领域数据知识,不断探索重大科学问题研究突破的新路径、新范式,持续积累可复制可推广的经验做法。
人工智能技术在科研活动应用中涉及多专业、多环节,离不开不同类型、不同链条主体机构的合理分工和有效协作。为此,要鼓励企业运用人工智能开展关键技术研发、新产品培育等科研活动,支持高校、科研院所、新型研发机构探索人工智能技术用于重大科学研究和技术开发的先进模式,培育壮大一批跨界技术转化和企业孵化机构、科研中介服务机构,探索多元主体合作协作新机制。面向重大科学问题的人工智能模型和算法创新,发展一批针对典型科研领域的“人工智能驱动的科学研究”专用平台,推动国家新一代人工智能公共算力开放创新平台建设,支持高性能计算中心与智算中心异构融合发展,鼓励各类科研主体按照分类分级原则开放科学数据。支持成立“人工智能驱动的科学研究”创新联合体,搭建国际学术交流平台。
适应性人才是新范式突破和推广的根本源泉。提高人工智能技术在科学研究领域的应用水平,既需要人工智能和相应学科的专业人才,也离不开跨领域复合型人才为跨界沟通协作提供高效支撑,这需要多渠道构筑相关人力资源引育平台和机制。为此,要多渠道培养和汇聚跨越人工智能和专业领域的复合型人才。支持更多数学、物理等科学领域的科学家、研究人员投身相关研究,鼓励普通高校、职业院校在人工智能学科专业教学中设置科技创新类专业课程,提升人工智能专业学生科研专业素养。鼓励开展相关人才培训,通过开设研修班、开展实践交流、组织专题培训等多种形式,培养一批人工智能与专业科研能力兼顾的复合型人才。鼓励地方政府、央企、行业领军企业通过“揭榜挂帅”、联合创新等方式支持相关优秀人才和科研团队开展智慧赋能科研工作。(张璐璐)
人工智能:中国研究热度最高 美国优势明显
作者:金叶子
人工智能(AI)作为引领未来的前沿性、战略性技术,正在全面重塑传统行业发展模式、重构全创新版图和经济结构。
对AI领域最具影响力学者进行分析研究,有助于深入了解人工智能AI领先人才的全球储备现状和技术发展与合作趋势。
近日,清华-中国工程院知识智能联合研究中心、清华大学人工智能研究院知识智能中心、中国人工智能学会以及北京智源人工智能研究院发布了《人工智能全球2000位最具影响力学者报告》(下称“报告”)。该报告基于清华大学AMiner团队发布的“AI2000人工智能全球最具影响力学者榜单”,获取人工智能领域最具影响力学者并进行分析。
报告显示,2021年度AI2000推出200名人工智能全球最具影响力学者和1800名提名学者,其中,美国的优势较为明显,达1164人次,占比58.2%;中国入选学者数量位列第二。从技术发展趋势看,当前十大热点研究话题分别是深度神经网络、机器学习、特征抽取、社会化媒体、社交网络、计算机视觉、信息检索、物联网、数据挖掘、语言识别。
美国优势明显
行业热度持续,更需要人才的助力。
从地域角度看,AI2000学者主要集中在北美洲的美国地区;欧洲中西部也有一定的学者分布;亚洲的人才主要分布于中国、新加坡及日韩等地区。
美国学者入选AI2000的数量最多,总人数的一半以上。不过,本届美国上榜学者数量比上届下降6%;中国入选学者数量位列第二,为222人次,占比11.1%;德国位列第三,是欧洲最多的国家。
当前,人工智能技术处于第三个发展高潮期,以机器学习特别是深度学习为核心,在视觉、语音、自然语言等应用领域迅速发展。在AI具体领域层面,全球呈现什么特点?
报告显示,在计算机视觉领域,学者引用最高的国家是美国,其次是中国、英国等。而在机器学习领域,学者引用量前五的是美国、加拿大、英国、中国和德国。美国学者以超16万的总引用量居于全球首位,大幅度领先,显示出美国在人工智能机器学习领域的强大实力。
这也与世界上人工智能的发展情况大致相符。从层次上划分,AI主要分为基础层、技术层、应用层。欧美国家在基础层起步早、投入大,中国则是在应用层和技术层涌现出诸多公司。
商汤科技香港公司总经理尚海龙曾对第一财经记者表示,中国AI产业发展更注重落地应用,同时也在不断提升对基础研究的加强,以及对原创基础设施的搭建。应用场景落地对于原创基础研究、平台搭建的牵引作用也不容小觑。庞大的市场应用激发和倒推基础层,这是中国区别于欧美AI产业的最大特点。
上海交通大学人工智能研究院副院长王延峰也告诉记者,中国AI领域的优势在于应用端的人才丰富,比如场景丰富,加上教育部学科目录也在跟进,应用层面的人才储备较多。但是我国较欧美发达国家起步较晚,高端、前沿人才和国外比还有差距。
中国研究热度最高
在AI研究热度上,当前热度最高的国家是中国。
报告通过国家研究热度趋势分析发现,当前热度前10的国家分别是中国、美国、德国、英国、加拿大、日本、法国、意大利、澳大利亚、韩国。从全局热度来看,美国早期有着领先优势并一直保持着最高的热度,而中国的研究热度近年来赶超美国。
为了推动人工智能与实体经济深度融合,中国围绕促进人工智能产业发展发布了一系列相关政策文件,包括《新一代人工智能发展规划》、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》、《“互联网+”人工智能三年行动实施方案》、《关于促进人工智能和实体经济深度融合的指导意见》、《国家新一代人工智能创新发展试验区建设工作指引》和《国家新一代人工智能标准体系建设指南》。
在人工智能学者所在的机构和企业层面,全球又呈现什么特点?
报告显示,美国机构人工智能学者上榜数量较多。人工智能影响力学者数前10的研究机构,包括9家美国机构和1家中国机构。居首位的是美国的谷歌公司,共135人次入选榜单,也是唯一一家上榜学者数过百的机构。清华大学是唯一入选前10的中国机构院校。
不过,多媒体、物联网、经典AI三个领域入选学者数量最多的机构不再是美国机构,而是来自于亚洲国家。在多媒体领域,中国电子科技大学和新加坡国立大学的入选学者数量最多;物联网和经典AI领域入选学者数量最多的机构都是清华大学。
与此同时,作为人工智能全球范围内的实施主体,全球企业都在围绕产业上下游进行深耕布局。
中国信通院去年年末发布的《全球人工智能战略与政策观察(2020)》显示,全球各大科技巨头具备数据、技术、资本等优势,结合自主研发和兼并收购共同发力,拓展“软件+硬件+应用+芯片”产品,在AI领域进行全产业链布局。
具体来看:具有数据优势的互联网企业如谷歌、百度等,全面布局人工智能行业;基于应用场景的互联网企业,如脸书、苹果、亚马逊、阿里巴巴、腾讯等,将人工智能与自身业务深度结合,不断提升产品功能和用户体验;传统科技巨头企业,如IBM、英特尔、微软、甲骨文等,面向企业级用户搭建智能平台系统。
总体来看,美国人工智能企业占据市场较大份额,美国巨头呈现全产业布局的特征,而中国巨头主要集中在应用层,在技术层近年来有所突破。