人工智能为教育带来什么郭毅可:培养更聪明的人,也创造更聪明的智能机器
7月8日,2023年世界人工智能大会教育主题论坛在世博中心举行。本文图片均为主办方供图
人工智能时代,教育的任务和路径发生了怎样的变化?在香港科技大学首席副校长、英国皇家工程院院士郭毅可看来,“聪明的我们应该用创造的智能机器去培养更聪明的人, 这样就能创造更聪明的智能机器”。
7月8日,2023年世界人工智能大会教育主题论坛在世博中心举行,主题为“引领学习变革智创教育未来”,超4.6万人次通过线上线下共同参与。
“面对人工智能新技术的加速迭代,教育如何做出更加快速、更加科学的反应?”华东师范大学党委书记梅兵在致欢迎辞时指出,在新技术加速迭代的背景下,更加科学、更加快速地推进智能教育学科建设和人才培养成为教育高质量发展的当务之急。
上海市教委副主任王浩介绍了上海在大力推动AI赋能教育数字化转型,加快构建智能时代现代化教育体系的重大举措。他表示,上海将加快部署校园数字新基建,打造互联互通的智能教育基础设施;聚焦拓展智能教育新应用,探索基于AI的个性化学习方式;聚焦构建智能教育新格局,加快建设教育数字资源共享平台。
中国科学院院士、国防科技大学教授王怀民作“群体智能与智能教育”主题演讲,他提出,在智能中人不可或缺,技术只是手段,人类教育能力的提升来自人类激发和汇聚群体智能的手段与水平的提升。大语言模型是激发和汇聚群体智能的最新技术成果,人类可接受的高质量大语言模型来自人类的群体智能。王怀民表示,大语言模型是可能成为好教师、好学生的智能助手,成为教学相长的工具。大语言模型是支撑智能教育的最新技术手段。智能教育可能为大语言模型提供高质量人类反馈和矫正数据。
“什么是知识”“什么是学习”“什么是教学”,在香港科技大学首席副校长、英国皇家工程院院士郭毅可看来,学习环境在变化中,这是各界需要重新考虑教育的三个基本问题。
郭毅可将演讲主题定为“人有人的作用:人工智能时代的大学教育”,他指出,人工智能对教育的影响是根本性的,传统的教育是积累知识,AI时代的传统教育,人工智能成为工具。在人工智能赋能的世界里,教师、学习者需要拥有以人为中心,批判思维和创造力,人、机器交流的能力是最重要的三个方向。郭毅可提出“聪明的我们应该用创造的智能机器去培养更聪明的人, 这样就能创造更聪明的智能机器”的理念。
7月8日,教育通用人工智能大模型标准系列研制成果发布。
当日,华东师范大学教育学部教授吴永和等嘉宾还共同发布教育通用人工智能大模型标准系列研制成果,包括研究报告和系列标准。
研究报告详细介绍了国内外24个通用人工智能大模型;并基于此,提出构建教育通用人工智能大模型标准体系,从体系预研、体系规划、标准制定、试用验证、培训贯标、应用推广六个阶段建设教育通用人工智能大模型标准体系和研制该系列标准,旨在构建可信、安全、高效、好用的教育通用人工智能大模型,建立一个以人为本的人工智能,更好赋能、赋智教育,完善数字教育标准体系,推进教育数字化,促进教育创新变革和高质量发展。该研究报告预计将于8月由清华大学出版社正式出版。
教育通用人工智能大模型系列标准旨在规范教育领域内通用人工智能大模型总体框架、构成要素、功能要求、数据集的构建原则、测评框架、安全隐私,以及教学应用要求等。后续这些标准也将进入行业标准和国家标准的建设之列,并启动教育通用人工智能大模型测试平台的建设。
中科院院士何积丰:人工智能需要告诉我们为什么会是这样的决策结果
腾讯科技讯7月7日,在“2023世界人工智能大会丨聚焦·大模型时代AIGC新浪潮论坛-可信AI专场“上,中国科学院院士、上海华科智谷人工智能研究院院长何积丰表示安全和可信是两个不同概念,可信人工智能要有两个基本要素:第一,数据安全可靠、系统行为正确·可追责、决策结果可解释;第二,数据模型在开放环境工作,包括不确定扰动、不可控环境行为、恶意攻击等。基于现状,何积丰建议:第一,数据方面强调隐私保护;第二,算法方面推进可解释性;第三,整个体系中要存在可信度量。
以下为演讲实录:
关于可信的概念有些混淆,通常大家都说这个是不是安全,安全跟可信是两个不同概念,因为早期我们的计算机系统,它里面的软件都是程序员,把我们现实世界中的一些物理规律变成一个数学模型,然后他通过编程序办法把数学模型“喂“给我们计算机,所以计算机程序去按照这个模型做了,当然“喂”的过程可能会有错误。因此我们有个测试任务,说这个程序是不是可靠,安全可靠可信,对我们一般的软件代码也是会有的,但人工智能这个系统跟传统软件是有极大的不同、根本的不同。首先整个模型是他自己学习而来的,不是我们教他的,你是第一个问题问他,他到底学到了什么?为什么会这么想?我们这里一个简单例子就是20年以前,Alphazero软件他帮助IBM确立了他们在人工智能方面一种新的突破。
国际象棋方面,Alphazero打败了国际比赛的冠军,但是编这个系统的专家,他不清楚Alphazero是怎么工作的,为什么下这步棋而不那一步?换句话说,他不知道它的工作原理,那么很多情况下,如果工作人员你不清楚了,你心中就有一些怀疑了,将来可能会发生什么事情,这是一种。
那么第二类我们发生的情况就是人工智能技术突破,它是一种真正意义下的创新。过去我们做技术创新,它实际上是一个创新的帽子,人们本质上并不认为他们是创新,比如说我们有汽车,相对于马车来说是个创新,当然我们要觉得无非是一个发动机代替了一匹马,我们有坦克,人家说是很好的战车,本来也有。换句话说,过去创新都对现有东西的一个延伸,当然人工智能是另开辟一个天地,因此我们不知道为什么他会发现这样一些新的成果是超出人们想象的。
一个典型例子,大家在文献中看到,通过用智能学习办法,我们发明了新的一种药叫海森,它就是一个建筑学校,产生了一个机器血液模型,开始科学家把2000多个分子结构喂给了我们的血液系统,告诉他没有分子结构,它有哪种抗菌性能,然后就让我们在学模型,在2万多分结构中间,要选择一种新的药,满足以下两个特征:第一,杀菌率要高,第二副作用要小。结果学习系统果然是发现一种新的,但是我们专家不知道他为什么挑中这个,而不是挑中其他的,那么这些都是一种非确定性的问题。我们去从这些问题中间提出一些新的科学期望。
什么叫可信人工智能?我们这边有两个要素:第一要素是从学术界的人,我们怎么理解呢?我们第一数据安全可靠,第二你这个系统行为应该是正确的,如果发生问题要追求责任了,能够追溯这个过程。第三部分,决策结果很多大模型给你一些选择余地,你告诉我为什么选这个而不选那个,这是一种情况。第二就是考虑到我们这个模型是在一个不确定环境下工作的,因此我们希望能够解决,如果我们环境里面一些小的扰动会影响你这个系统工作等等,总结起来我们应该他组里面提到6种品质,提到它应该是正确的,鲁棒性的有公平性的,它结果可以解释,安全性的、伦理性的,每一样代表东西很不一样的,我们不能笼统都说安全可信,要求是差别很大的。
那么当前我们状态怎么样呢?从几个方面来看,第一个就是关于数据科学问题,这个问题大家就不要说了,因为你像数据不可信的话,用你的数据训练我们的机器它绝对不会可靠的。第二是算法可信,那么现在算法可信有两条问题可能是比较困难,就关于算法本身的可解释性问题,那么这个问题前面已经有不少工作做了,那么下面还是为继续推进这方面的工作。第三是网络可信,这个就不解释了,因为做网络空间安全的专家都知道,网络可信是我们长期安全中的工作目标。第四是系统可信,我们希望从芯片、硬件、软件、服务等各方面之间的广泛应用中间发现一些问题,什么问题?就系统被攻击的面更加大,安全风险比过去突出。最后是法律伦理问题,我们中国例子比较少。最近美国有个例子,就是新冠期间,他们大家普遍用了脉搏的血氧仪,测大家心率,根据血里面含氧的程度,结果发现白人吃下来血氧总是比较低,黑人总是比较高,后来发现什么?他在本身收集数据里面,他收集的是白人数据,没有黑人数据,是这样的一个伦理问题,在通常的安全可行范围里面是很少能顾及到。
我们看我们这个能力跟法律部分,我们说个人隐私数据保护,数据垄断跟数据的霸权问题,现在还没提了,实际上不少地方有很多霸王条款,一般用户也不会感到数据的污染跟投毒到迁到最高层面,就是说这会影响到国家政治跟国家安全。第二方面是关于算法方面,我们说在伦理方面,我们是希望能够推进黑盒决策的可解释性、算法的歧视问题、算法乱用跟误用、商业垄断与不正当的竞争。
那么这里想讲几句关于大模型的问题,大模型用了以后,我们教育部门很担心,一给学生布置论文,可能他们不需要自己做了,他把这个题目给我们大模型,大模型可以给他写了一篇很好的文章,然后不少法律方面的人也在说,很多图片可能是假的,伪造的作为法律证据,那么这个就跟我们算法里面不安全是密切相关,已经影响到我们的业务了。
对社会短期的影响,主要是我们要解决智能系统责任划分问题,这类工作主要是在一些智能系统,我们的智能机器人跟我们用的无人驾驶汽车,万一有什么事故,谁负责任的划分条例。那么最后就是长期的影响,长期影响以后可能主要是一个就业问题。昨天主论坛上联合国的一个官员说了,他们估计在5年里面会有1,400万人由于大模型使用而失去他们的位置,我希望这个数字是假的,因为这个数字看起来就比较可怕了,占全世界就业人口5%,这是关于可信人工智能,我们在伦理法律上现状。
那么该做哪些事情,我们这里有一个建议,这建议毕竟是非常科学跟可实施,但是我们每一方面还是提一下,我们从数据方面我们是强调数据隐私保护,充分利用我们现有的一些it技术,无论是我们的区块链跟密码应该用在很多金融数据处理方面。还有通过联邦学习,包括我们数据中间一些安全机密部分,那么这个方面我们前面跟上海证券所也事先做一些项目,看看联邦学习对它整合各方面数据是不是会有促进作用。第二是关于算法理论,我们还是主要推进可解释性,我最后有几张片子会专门谈这个问题。然后关于整个体系里面,我们希望有个可信度量,有些安全等级是比较多,但是实际上我们没有很精密的度量体系。
然后从应用系统方面,我们现在做的这几个主要的一些行业应用,:比如工业控、生物制药、智慧交通等等,他对安全可行要求是很高的,尤其是像那种工厂部门里面,他用的机器人,他就说当机器人跟人在同一生产线上,大家关心他们交互之间是不是有危险性。
我下面有一个关于工作的一个规划目标,我们这里分成两部分,一部分从技术方面来说,第二部分是从建设的目标来说,我们分成两个部分,第一个目标是因为上海要建立国际金融中心,然后我们说金融是长三角一体化的,那么对我们安全做什么?主要是做数据的大数据的区块链的可行治理。
另外我再举个例子,我们要做智能系统的可信验证的平台,一种是有一个中心专门负责这个工作,那么这里面他要做什么?可行分析,认证跟评测。建设目标就是上海国家新一代人工智能创新发展试验区,所以我们这里面提了一些建议,那么这个建议各部门都在推进,希望这个工作有效果。
下面我讲一下关于可解释性问题,可解释性大概有三种不同类型的可解释性,不是一个简单的可解释性。
第一是基于这个理论模型的可解释性,这个事情很多都是高校的研究院的老师在做,今天你看清华大学也有不少教授在的,我相信这方面工作他们都是会有基础的。第二是关于机器学习的可解释性,这里面既有定性的,也有定量的,也有可视化的。最后一个是基于知识推理的可解释性方法研究,这是关于研究现状,那么我们自己想通过个片子跟大家介绍一下,它到底对我们实体经济会有什么应用。大家看一下左边这个图,我们说可信,可解释人工智能怎么用到我们这个产业部门,它有这样一个全生命周期的迭代过程,它从市场需求分析开始来支撑它的产品设计。
换句话说,市场数据对它产品设计提需求是所有工作的一个启动点,然后在设计过程中间,他希望有一个国际化的分工,换句话说整个供应链不是全部自己做了,要考虑到合作伙伴怎么做,在这基础上我们有个很好的生产管理过程,既有生产制造的过程,也有对用的设备的管理过程。
然后我们对销售维护也是它整个生命周期中间很大一部分。那么这样我们通过产品对客户的应用,客户对你提的意见为我们有个反馈,因此我们希望有个需求分析的重新的迭代过程。那么中间他讲了一个迭代里面反映了哪几个问题,他有关于怎么订单采购的,有生产管理的,有物流的,换句说我们人工智能一些技术不是用在一个环节,是用在整体上是有这样的一个过程。
我们说我们科学设立公司有三个方面的挑战,一个是关于方法研究方面要挑战,这属于基础研究的。第二部分是应用方面,因为各行业对这个可行要求也不完全一样。第三个管理层面上,因为搞可解释性可能要牺牲点效率的,那么这个事情领导是不是能够支持这样做法的,右面我们提到了可解释人工智能能够面向决策方面的支撑,他对决策支撑跟赋能管理,对我们推进模式,对知识管理都有决策导向。因此我相信可信人工智能我们已经走了好几年,现在这个行业需求也会越来越多,我希望各行各业会进一步的总结经验,看到哪些是我们应该工作聚焦的地方,我的讲话完了,谢谢大家。
新城市志|打造人工智能“上海高地”,上海正在做什么
7月6日,专家在一幅关于上海的智能生成画作前讨论。当日,2023世界人工智能大会在上海世博中心拉开帷幕。新华社 图
2023世界人工智能大会7月6日至8日在上海举行。本届大会主题为“智联世界生成未来”,有超400家参展企业在世博展览馆5万平方米主展览区内展示包括大模型、芯片、机器人、智能驾驶等领域的科技成果。参展企业数量、展览面积均创历届之最。
大会围绕大模型、生成式人工智能、科学智能、具身智能、元宇宙等前沿话题展开前瞻性探讨,展望“智变”后的人类文明全新形态。小米集团创始人雷军几年前就曾表示,过去十年是移动互联网的时代,未来则是万物智慧互联AIoT的时代,“谁把握住AI,谁就把握住未来”。为此,各国各地近年来都在发力AI赛道。
目前,中国的AI产业整体发展如何?国家及地方层面分别在做着哪些布局?作为此次WAIC举办地的上海,又在其中占据着何种位置?
全球大厂抢滩AI蓝海
今年年初以来,OpenAI公司研发的聊天机器人程序ChatGPT火遍全球,进而引发了一波科技巨头间的比拼。百度“文心一言”、阿里“通义千问”、腾讯“混元助手”、京东“ChatJD”、华为“盘古”纷纷下场,抢滩人工智能这片浩瀚蓝海。
其实,语言识别、人机互动只是AI技术应用的冰山一角。正如创新工场总裁兼CEO李开复所言,AI技术将会对金融、制造、教育、影视、娱乐、医疗等诸多领域产生深远的影响。现实中,人工智能早已遍布各种生产场景,譬如青岛的自动无人码头、韶关凡口矿里的无人驾驶机车、智慧医疗领域的AI创新药物研发等。
而此次上海WAIC,更是为我们展现了一幅广阔的AI生活画面:与AI机器人比赛投篮、对弈下棋,欣赏它在团扇上创作书画,品尝其研磨冲泡的咖啡……可以说,人类正在迈入到“人工智能时代”。相信用不了多久,它就会像电脑、汽车甚至空气和水一样,成为人类须臾不可或缺的必需品。
也正因如此,各国都将AI作为优先发展的重点产业全力争夺。其中,不仅美英、欧盟、日韩等主要经济体持续加强政策引导,加大支持力度,抢占人工智能竞争制高点,一些中小国家也全力以赴,甚至“AllinAI”。
比如丹麦政府2019年3月发布《人工智能国家战略》,旨在使丹麦从人工智能的巨大潜力中获得最大收益。而当年11月,新加坡也发布了一项为期11年的国家人工智能战略,计划投入5亿新加坡元,在交通物流、智慧城市、医疗保健、教育和安全5大领域推动人工智能技术的应用,力争在2030年完成国家基础设施的智能化升级。
至于中国,就数量、规模而言,已经堪称人工智能大国。根据中国信通院测算,截至2022年底,全球人工智能代表企业数量27255家,中国企业数量4227家,约占全球的16%。2022年中国人工智能核心产业规模达5080亿元,同比增长18%。这些都意味着中国人工智能产业已进入全球第一梯度,产业规模持续扩大、产业生态初步形成。
但另一方面,正如2023中关村论坛人工智能开放生态建设论坛上,科技部高科技司副司长、一级巡视员梅建平指出的,中国在底层算法、关键软硬件、生态系统等领域,与世界领先水平仍有一定的差距。如何缩小这一差距,能否实现在AI领域的弯道超车,关乎国运,需要国家与地方、科技和工业界的携手合作、共同努力。
谁是国内AI产业第一城?
2016年被誉为“人工智能元年”。那一年,谷歌旗下团队开发的人工智能机器人AlphaGo两次击败围棋冠军,引发轰动。同年5月,国家发改委、科技部、工信部等部门联合发出《互联网+人工智能三年计划实施方案》,次年7月又发布了《新一代人工智能发展规划》。国内AI产业由此获得更多政策及资金支持,开始步入发展的快车道。
根据《中国人工智能产业图鉴》统计,从2016年到2022年的短短6年间,全国人工智能相关企业数量从27.95万家增长至60.05万家,翻了一番多。
从地域分布来看,珠三角、长三角和北京作为国内人工智能产业的三大聚集区优势明显。其中,广东人工智能相关企业数量达到13万家,高居各省市第一名,总量是第二名的两倍多。其后,江苏56582家、北京47793家、浙江42785家、上海39202家,它们与广东一同构成国内AI产业的头部阵营。
而就企业增长数量来说,过去6年间,广东、江苏、浙江三省的AI产业相关企业数量增长最为迅猛,分别新增了95701家、42560家、35009家。另外,山东、安徽、四川、北京、上海等省市的新增数量也都超过了2万家。
其中,百度、字节跳动所在地北京,表示要做人工智能“领军城市”;微软、IBM、英飞凌等布局的上海,提出加快打造人工智能“上海高地”;而坐拥腾讯、华为的深圳,则致力于成为人工智能“产业高地”……那么在这场激烈的AI产业竞逐赛中,目前究竟谁暂时领先,谁又能最终登顶人工智能第一城呢?
单从企业数量来看,2016年至今,新增AI企业最多的城市是深圳,为42598家,其次是广州(29922家)和北京(21483家)。深圳也因此凭借6.38万家AI相关企业的总量成为全国人工智能“密度”第一城。不过深圳的优势主要集中于AI产业链下游,虽然产业链规模、创新性全国领先,但融资、成长性存在不足。
《中国人工智能产业图鉴》数据显示,2016年至2022年期间,AI相关企业融资金额总量前五城分别为:北京(67161.82亿)、上海(43557.43亿)、深圳(27066.35亿)、杭州(17690.97亿)和南京(8036.45亿元),京沪两城的吸金实力遥遥领先包括深圳在内的其他城市。
总的来说,目前国内各地的AI产业还处于百花齐放、群雄逐鹿的阶段,尚未分出胜负,而这也给了各地比学赶超、后来居上的机会。
上海的AI产业雄心
就在2023世界人工智能大会开幕的前一天下午,上海召开了一场市委书记、市长双双出席的高级别人工智能战略咨询专家会议,对AI产业的未来发展,以及“通用人工智能的上海作为”的重视可见一斑。
随后,上海市委常委、常务副市长吴清出席“智慧中信共创新可能”AI+产融协同发展论坛并讲话,更是直接宣示了上海的AI产业雄心:上海将人工智能作为三大先导产业之一,加快打造人工智能“上海高地”。
上海这么说是有底气的。目前,上海规模以上AI企业数量已经达到350家,五年来几乎翻了一番;产值达到3800多亿元,几乎是五年前的三倍;而产业人才更是达到了23万,约占全国三分之一。
这些成绩的取得,与上海在人工智能方面的提前谋划、长期布局密不可分。早在2017年,上海就发布了《关于本市推动新一代人工智能发展的实施意见》,首次将AI上升为上海优先发展战略。此后,又相继制定了《关于加快推进人工智能高质量发展的实施办法》《关于建设人工智能上海高地构建一流创新生态的行动方案(2019-2021年)》《上海市人工智能产业发展“十四五”规划》等。
2022年9月22日,《上海市促进人工智能产业发展条例》正式公布,这也是全国人工智能领域的首部省级地方法规。
在组织保障方面,上海则成立了人工智能产业工作领导小组、上海市人工智能战略咨询专家委员会;在资源整合方面,上海建设了全国首个人工智能创新应用先导区、国家新一代人工智能创新发展试验区;在生态体系方面,上海相继成立了市人工智能行业协会、全球高校人工智能学术联盟、青年AI科学家联盟等行业组织。
同时,上海高度重视发挥自身作为国际金融中心的优势,为AI产业发展提供源源不断的活水。比如成立上海人工智能产业投资基金,推动一批领军企业科创板上市;给予AI关键技术项目不超过项目投资30%的资金支持;鼓励民企投资AI基建,提供利息补贴;发放“AI算力券”,重点支持租用市智能算力且用于核心算法创新、模型研发的企业……
当前,上海人工智能产业正处在从局部探索到整体推进、从试点应用到赋能百业、从以会聚智到兴业引才的“蝶变期”。牢牢把握人工智能等新科技革命浪潮,不仅有助于加快推动上海的科技跨越发展、产业优化升级、生产力整体跃升,还将为建设具有世界影响力的现代化国际大都市注入澎湃动力。
海报设计祝碧晨