人工智能的三个必要条件
人工智能的必要条件:深度学习模型,大数据,算力作者:MichaelZhang麦教授2016年,AlphaGo下围棋战胜李世乭,大家都认为人工智能的时代到来了。人工智能也是同样的在一定的历史契机下,几个独立发展的领域碰巧合并在一起就产生了巨大的推动力。这一波人工智能发展的三个必要条件是:深度学习模型,大数据,算力(并行计算)。深度学习模型AlphaGo用的机器学习模型是深度学习教父杰佛瑞·辛顿(GeoffreyHinton)在1986年开始倡导,并在2010年取得重大突破的。[[392241]]
「辛顿的推特头像」
2012年的夏天,64岁的辛顿离开了他在多伦多附近的家,成为了谷歌的一名实习生。他领到了一顶缝有“Noogler”(意思是:谷歌新员工,NewGoogler的缩写)字样的螺旋桨小帽,并参加了主要由80后、90后组成的迎新会。年轻的Nooglers不会认出他来,因为辛顿几十年来一直在默默研究神经网络的算法。用他的话说,这些年轻人似乎把他当成了“老年低能儿”(有没有想起罗伯特·德尼罗的电影《实习生》?)。谷歌之所以要请他,是因为他的深度学习算法模型打破了机器学习几乎所有领域的天花板。人工智能最近几年的突破得益于辛顿过去几十年的研究,他最初在1986年发表的论文提出让机器像人类的大脑一样通过神经网络来做学习的模型。但是这个模型在取得初步的成功后,就停滞不前了(缺乏另外两个要素:数据和算力)。大多数的学者都背弃了它,而辛顿没有。历史快进20年,到了2006年,辛顿的团队取得了突破性进展。被重新命名为“深度学习(deeplearning)”的神经网络开始在每一项关键任务中击败传统的人工智能,如语音识别、描述图像和生成自然可读的句子等等。这些算法支撑着从自动驾驶汽车、虚拟助手到搜索引擎推荐的后端技术。近几年,谷歌、Facebook、微软、BAT、抖音等所有科技巨头都开始了深度学习的淘金热,争夺世界上极少数的专家,由数亿风险投资支持的深度学习创业公司也如雨后春笋般涌现。这些都是因为辛顿的模型改变了人们做人工智能研究和应用的范式。值得一提的是:辛顿这个家族出了太多的神一样的人物。辛顿的曾祖父是乔治·布尔(GeorgeBoole),就是就是布尔代数那个布尔。布尔32岁出版了《逻辑的数学分析》(TheMathematicalAnalysisofLogic),把逻辑和代数之间的关系建立起来。他39岁时出版了《思维的规则》(TheLawsofThought),创立了布尔逻辑和布尔代数。数理逻辑这个数学分支奠定了现代计算机的数学基础。布尔的妻子叫玛丽·艾佛斯特(MaryEverest),珠穆朗玛峰(MountEverest)英文名字就是以玛丽的叔叔,曾任印度大地测量局总测量师的乔治·艾佛斯特(GeorgeEverest)而命名的。布尔最小的女儿艾捷尔·丽莲·伏尼契(EthelLilianVoynich)写出了伟大的作品《牛虻》(TheGadfly)。布尔长女玛丽·爱伦(MaryEllen)这一支更是名人辈出,爱伦和数学家CharlesHowardHinton结婚。爱伦的孙女(辛顿的姑姑)JoanHinton中文名寒春(名字就是Hinton的音译),是芝加哥大学核物理研究所研究生,是费米(EnricoFermi)的学生,杨振宁、李政道的同学,也是参与了曼哈顿计划的极少数的女科学家之一。「“一个逃掉的原子间谍”」
1953年,美国的《真相》杂志报道称曾参与过美国曼哈顿计划的女物理学家寒春(JoanHinton)突然失踪而后在北京露面。作者(是个后海军上将)怀疑寒春向中国透露了美国的原子弹秘密,甚至可能协助中国政府发展了原子弹计划。寒春其实是厌恶了原子弹对人类的伤害而选择逃离到中国,她认为中国最缺的是牛奶,于是选择帮中国推进科学养牛和农业机械化。她是第一位获得中国绿卡的外国人,2010年在北京去世。和寒春一样,辛顿也厌倦了美国军方开发大规模杀伤武器,1980年代就离开了卡耐基梅隆大学(CMU)到加拿大的多伦多大学专心做人工智能研究。2010年,63岁的他发表的深度神经网络AlexNet对机器学习各个领域都起到巨大的推动作用。2018年,他和自己的学生和合作者一起获得了计算机科学的最高奖“图灵奖”。人工智能的大数据辛顿的深度学习算法摧枯拉朽般地推进了机器学习的各个子领域。大众意识到这个算法的威力是在2012年。2012年,语音识别还远未达到完美。这些系统通常使用隐藏马尔可夫模型(HMM)或高斯混合模型(GMM)来识别语音中的模式。辛顿等人在2012年发表的一篇开创性论文表明,深度神经网络的表现明显优于之前的这些模型。2012年ImageNet大规模视觉识别挑战赛(ILSVRC),是将深度神经网络用于图像识别的一个决定性时刻。辛顿和他的学生亚历克斯·克里泽夫斯基(AlexKrizhevsky),还有伊尔亚‧苏茨克维(IlyaSutskever)共同发表了一个被称为“AlexNet”的卷积神经网络(CNN),将ImageNet视觉识别上现有的错误率降低了一半,达到15.3%,比第二名低了10.8个百分点。为什么之前看不出来这个算法的威力呢?原因很简单,之前研究者们没有大规模的训练人工智能的数据。在小规模数据上,深度学习的算法并没有很强的优势。「数据规模和算法性能」
图中可以看到,传统的算法会遇到一个瓶颈,数据规模再大也没有办法提高了。但是深度学习可以随着数据规模提升而持续提高算法的表现。这个计算机视觉比赛用的大规模数据ImageNet来自于斯坦福大学教授李飞飞的研究。她有很强的连接不同领域之间关系的洞察力。她的计算机视觉同行们那时在研究计算机感知和解码图像的模型,但这些模型的范围都很有限,他们可能会写一个算法来识别狗,另一个算法来识别猫。李飞飞怀疑问题不是出在模型上而是出在数据上。如果一个孩子可以通过观察无数的物体和场景来学会识别物体,那么计算机也许也可以用类似的方式,通过分析大规模的各种各样的图像和它们之间的关系来学习。但是这样就要求训练模型时,有大量的打好标签的图片,告诉计算机图片里的物体都是什么。在一个有百万甚至千万张图片的数据库中标记每张图片上所有的物体是一个巨大的体力活。2007年在普林斯顿大学担任助理教授的李飞飞提出了她对ImageNet的想法时,很难得到同事们的帮助,因为那时大家只是习惯于用几百到几千张图片的数据库。有人评论说:“如果连一个物体都识别不好,为什么还要识别几千个、几万个物体?”李飞飞尝试给普林斯顿的学生支付每小时10美元的工资来打标签,但进展缓慢。后来有学生跟她提到了亚马逊人力外包AmazonMechanicalTurk,突然间,她可以用极低的成本雇佣许多人来打标。2009年,李飞飞的团队集齐了320万张(后来增加到1500万张)打过标的图片,他们发表了一篇论文,同时还建立了开放的数据库。起初,这个项目几乎没有受到关注。后来团队联系了次年在欧洲举行的计算机视觉竞赛的组织者,并要求他们允许参赛者使用ImageNet数据库来训练他们的算法。这就成了ImageNet大规模视觉识别挑战赛。历年来ImageNet挑战赛的参赛者在科技界的每个角落都能找到。2010年大赛的第一批获奖者后来在谷歌、百度和华为担任了高级职务。基于2013年ImageNet获奖算法创建的Clarifai公司后来获得了4000万美元的风险投资支持。2014年,牛津大学的两位研究人员获得冠军,他们很快被谷歌抢走,并加入了其收购的DeepMind实验室。「ImageNet错误率逐年下降」
这个数据库突然激发了深度学习的潜能,让人们意识到数据的规模有时比模型的效率更重要,之前人们总是纠结在小规模数据上一点一点的推进算法准确性,而ImageNet和AlexNet让大家看到了数据规模能给人工智能带来的变革。到了2017年,也就是比赛的最后一年,计算机识别物体的错误率已经从2012年的15%降到了3%以下。2020年,很多算法都可以把错误率降低到2%以下了。算力(并行计算)所谓深度神经网络,说的是神经网络有好多层,每一层又有好多节点,为了计算最优的模型,要做非常大量的计算。这个方法以前不流行的原因就是它计算量太大了。在处理小规模数据时,深度学习的正确率并不比别的简单模型高,但是计算量大很多,于是并不讨喜。在2010年前后,随着并行计算越来越容易做了,这个计算量的瓶颈突然就变得不那么重要了,于是人工智能的三个必要条件就凑齐了。「CPU对比GPU」
并行计算可以大幅加快计算的速度。传统的有十几个内核的CPU(中央处理单元)可以同时处理十几个互相独立的运算工作。而GPU(图形处理单元)本来是用来给图形显示加速的,当需要计算复杂的图形的光影时,可以通过GPU上千的内核来做并行处理,从而大幅加快计算速度。GPU并不适合所有的加速场景,我们遇到的很多问题是串行的,就是一个计算结束之后得到了结果才可以进入下一个计算,这样的场景还是CPU比较高效率。但是有些场景,各个计算之间相互独立,并不需要等待,而深度学习的算法恰恰就符合了这个特性。有人做过一个简单的对比,CPU就和古代军队里的将军一样,适合遇到串行问题时单打独斗;但是GPU就像士兵一样,适合在遇到并行问题时一拥而上。深度学习算法是个并行计算可以解决的问题,于是一拍即合,GPU并行计算的算力被大量应用于人工智能需要加速的场景。「英伟达(Nvidia)股价」
制作GPU芯片的英伟达公司的股价也一飞冲天,从2016年到现在股价已经翻了20倍。之后人们为人工智能计算又专门研制了更好的协处理器,如TPU或NPU,处理AI算法的效率更高。GPU的重要性当然也和区块链、比特币的发展有关。区块链里面的ProofofWork就需要很多相互独立的计算,也是GPU可以大展身手的领域。
整理近年来关于《人工智能》的标准和评估规范(1)
前言我们在人工智能领域研发、开发和应用时,需要有专业性的标准、标准化的指标、或评估规范等,在网上查找了一段时间,发现很多资料并不可靠,或简单介绍,让人头大呀;这里整理了一些比较专业的资料,分享给大家。
主要包括:
人工智能安全标准白皮书(2019)
人工智能标准化与开源研究报告(2019)
人工智能伦理风险分析报告(2019)
人工智能标准化白皮书(2018)
中国人工智能开源软件发展白皮书(2018)
人工智能深度学习算法评估规范(2018)
一、人工智能安全标准白皮书(2019)
1)来源
全国信息安全标准化技术委员会
大数据安全标准特别工作组
2)更新时间:2019年10月
3)前言
需要加强人工智能发展的潜在风险研判和防范,维护人民利益和国家安全,确保人工智能安全、可靠、可控。人工智能(ArtificialIntelligence,简称AI)经过60多年的演进,已发展成为研究和开发用于模拟、延伸和扩展人类智能的学科。近年来,在算法、算力和数据三大因素的共同驱动下,人工智能进入加速发展的新阶段,成为经济发展的领头雁和社会发展的加速器。目前世界主要国家均把人工智能作为国家发展战略。2017年我国发布《新一代人工智能发展规划》,将发展新一代人工智能上升至国家战略高度。随着人工智能在相关行业和人民社会生活中的深度融合应用,由此带来的国家安全、社会伦理、网络安全、人身安全和隐私保护多个层面的风险和挑战,也引起了社会的广泛关注。
人工智能安全标准化是人工智能产业发展的重要组成部分,在激发健康良性的人工智能应用、推动人工智能产业有序健康发展方面发挥着基础性、规范性、引领性作用。《新一代人工智能发展规划》中明确提出了“要加强人工智能标准框架体系研究,逐步建立并完善人工智能基础共性、互联互通、行业应用、网络安全、隐私保护等技术标准”,切实加强人工智能安全标准化工作,是保障人工智能安全的必由之路。
为推动人工智能技术健康、快速、安全、有序的发展和推广应用,全国信息安全标准化技术委员会(以下简称“全国信安标委”)下设的大数据安全标准特别工作组启动了《人工智能安全标准化白皮书》编制工作,本白皮书主要围绕人工智能本身的安全,详细分析人工智能发展现状,面临的主要安全威胁和风险挑战,梳理总结国内外人工智能安全法规政策和标准化组织标准化工作进展。在此基础上,对人工智能安全标准化需求进行深入辨析,提出人工智能安全标准框架和标准化工作建议。
4)编写单位
中国电子技术标准化研究院清华大学北京百度网讯科技有限公司华为技术有限公司三六零科技集团有限公司阿里巴巴(中国)有限公司中国移动通信集团有限公司中国人民大学浙江蚂蚁小微金融服务集团股份有限公司国际商业机器(中国)有限公司北京天融信网络安全技术有限公司联想(北京)有限公司上海依图网络科技有限公司深信服科技股份有限公司深圳市腾讯计算机系统有限公司北京三快在线科技有限公司(美团点评)奇安信科技集团股份有限公司陕西省网络与信息安全测评中心北京猎户星空科技有限公司中国科学院大学自动化研究所四川大学内蒙古自治区大数据发展管理局维沃移动通信有限公司北京大学北京神州绿盟信息安全科技股份有限公司阿里云计算有限公司上海观安信息技术股份有限公司OPPO广东移动通信有限公司中国平安保险(集团)股份有限公司
5)目录
一、人工智能概述……………………………………………………………1 1.1 人工智能迎来第三次发展浪潮 …………………………………1 1.2 人工智能技术与应用进展显著 …………………………………2 1.3 人工智能产业链初具规模 ………………………………………4 1.4 我国人工智能应用场景广阔 ……………………………………6 1.5 人工智能总体发展水平仍处于起步阶段 ………………………7二、人工智能安全法规政策和标准化现状…………………………………9 2.1 人工智能安全法律法规和政策 …………………………………9 2.1.1 国际国外情况 ………………………………………………9 2.1.2 国内情况 ……………………………………………………15 2.2 主要标准化组织人工智能安全工作情况 ………………………17 2.2.1 ISO/IEC JTC1 ………………………………………………17 2.2.2 ITU-T ………………………………………………………18 2.2.3 IEEE …………………………………………………………18 2.2.4 NIST …………………………………………………………21 2.2.5 TC260 ………………………………………………………22 2.2.6 其他标准化组织 ……………………………………………25 2.3 人工智能伦理道德工作情况 ……………………………………26三、人工智能安全风险分析与内涵…………………………………………29 3.1 新的攻击威胁 ……………………………………………………29 3.2 人工智能安全隐患 ………………………………………………31 3.2.1 算法模型安全隐患 …………………………………………31 3.2.2 数据安全与隐私保护隐患 …………………………………33
3.2.3 基础设施安全隐患 …………………………………………36 3.2.4 应用安全隐患 ………………………………………………37 3.2.5 人工智能滥用 ………………………………………………38 3.3 安全影响 …………………………………………………………39 3.4 人工智能安全属性和内涵 ………………………………………41四、人工智能安全标准体系…………………………………………………44 4.1 人工智能安全标准化需求分析 …………………………………44 4.2 人工智能安全标准与其他领域标准的关系 ……………………46 4.3 人工智能安全标准体系 …………………………………………46 4.3.1 人工智能基础性安全标准 …………………………………47 4.3.2 人工智能数据、算法和模型安全标准 ……………………48 4.3.3 人工智能技术和系统安全标准 ……………………………48 4.3.4 人工智能管理和服务安全标准 ……………………………49 4.3.5 人工智能测试评估安全标准 ………………………………50 4.3.6 人工智能产品和应用安全标准 ……………………………50五、人工智能安全标准化工作建议…………………………………………51附录A人工智能相关安全标准 ………………………………………………55 A.1 TC260人工智能安全标准研究项目 ……………………………55 A.2 TC260人工智能安全相关标准 …………………………………56 A.3 ISO/IEC JTC1/SC42人工智能安全相关的标准 …………………57附录B人工智能应用安全实践案例(排名不分先后) …………………58 B.1 百度人工智能安全实践 …………………………………………58 B.2 猎户星空人工智能安全实践 ……………………………………61
B.3 清华大学人工智能安全实践 ……………………………………63 B.4 依图人工智能安全应用实践 ……………………………………66 B.5 IBM人工智能安全实践 …………………………………………69 B.6 深信服人工智能安全实践 ………………………………………72 B.7 360 人工智能安全实践 …………………………………………75 B.8 阿里巴巴人工智能安全实践 ……………………………………78 B.9 华为人工智能安全实践 …………………………………………82参考文献 ……………………………………………………………………85
6)资料下载
链接:https://pan.baidu.com/s/1CQOiObjZrc_k5_KEghLHyA 提取码:xwng
7)版权申明:资料来源中国电子标准化研究院的官网
http://www.cesi.cn/201911/5733.html
二、人工智能标准化与开源研究报告(2019)1)来源
国家人工智能标准化总体组
2)更新时间:二零一九年四月
3)前言:
背景及目的
自2013年以来,随着深度学习技术的不断发展,引发了新一轮人工智能热潮,诸如:AlphaGo、刷脸支付、无人驾驶、AR、无人超市等应用层出不穷。大量资本和并购的涌入,加速了人工智能和产业的结合,人工智能甚至有可能成为是继蒸汽机、电力和计算机之后,人类社会的第四次革命。人工智能(Artificialintelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。在历史上,人工智能有过很多个定义,但是迄今为止没有一个官方的、统一的、正式的定义。人工智能最早由麻省理工学院的JohnMcCarthy在1956年的达特矛斯会议上提出的:人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。
世界各国纷纷将发展人工智能作为抢抓下一轮科技革命先机的重要举措。随着人工智能领域国际竞争的日益激烈,2017年国务院印发《新一代人工智能发展规划》,提出我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,为部署构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国构建了基础。
本报告中的开源指源码公开、源数据公开及其他成果形式(如软件、系统或平台架构等)的公开。近年来开源技术蓬勃发展,诸如计算机视觉开源社区OpenCV、开源数据集ImageNet、开源智能终端操作系统Android和其他大量开源工具及平台,无不表明开源创新与协同有力推动了产业进程。同理,人工智能尤其是深度学习相关的开源蓬勃发展,也将对我国人工智能相关产业产生积极影响。
第一,人工智能开源有助于支撑人工智能领域形成高端产业集群优势,逐步引领世界前沿技术的发展。第二,人工智能开源有助于吸引更多人才进入人工智能产业,建设多层次人才培养体系。第三,人工智能开源有助于推动人工智能广泛应用,加快推动人工智能与各行业的融合创新和赋能。
4)编写单位(排名不分先后)
中国电子技术标准化研究院 中国科学院自动化研究所华为技术有限公司 北京深睿博联科技有限责任公司腾讯计算机系统有限公司 成都四方伟业股份有限公司京东数字科技控股有限公司 英特尔(中国)有限公司威麟信息技术开发(上海)有限公司 国际商业机器(中国)投资有限公司深圳前海微众银行股份有限公司 机械工业第六设计研究院有限公司浪潮软件集团有限公司 深圳市商汤科技有限公司重庆邮电大学 华夏芯(北京)通用处理器技术有限公司南京云问网络技术有限公司 西门子(中国)有限公司中国电力科学研究院有限公司 金税信息技术服务股份有限公司深圳云天励飞技术有限公司 上海智能制造系统创新中心有限公司重庆中科云从科技有限公司 天津天大康博科技有限公司苏州苏相机器人智能装备有限公司
5)目录
第一章概述..................................................................................................................11.1背景及目的....................................................................................................11.2本报告的价值................................................................................................21.3本报告的脉络梳理与导读............................................................................3第二章AI产业现状及开源面临的宏观问题..............................................................42.1AI产业现状及产业链....................................................................................42.1.1基础层................................................................................................52.1.2技术层................................................................................................62.1.3行业应用层........................................................................................72.2AI开源所存在的问题....................................................................................92.2.1法律道德问题....................................................................................92.2.2潜在锁定风险..................................................................................102.2.3安全问题..........................................................................................102.2.4标准统一问题..................................................................................102.2.5版本兼容性问题..............................................................................112.2.6行业问题..........................................................................................11第三章AI开源生态现状............................................................................................123.1AI开源全栈(聚焦机器学习及深度学习)..............................................123.1.1芯片使能..........................................................................................133.1.2分布式集群......................................................................................153.1.3大数据支撑......................................................................................163.1.4数据管理..........................................................................................173.1.5模型格式..........................................................................................183.1.6深度学习框架..................................................................................183.1.7机器学习框架..................................................................................193.1.8知识图谱(知识库)......................................................................203.1.9强化学习..........................................................................................20
3.1.10模型中间表示层IR........................................................................213.1.11端侧推理框架................................................................................223.1.12高级API..........................................................................................233.1.13开放数据集....................................................................................243.1.14分布式调度....................................................................................263.1.15可视化工具....................................................................................273.1.16模型市场........................................................................................273.1.17应用类项目....................................................................................283.2开源组织......................................................................................................323.2.1开源中国..........................................................................................323.2.2开源社..............................................................................................333.2.3OpenI启智开源开放平台...............................................................353.2.4Linux基金会....................................................................................363.2.5OpenStack基金会...........................................................................373.2.6Apache基金会.................................................................................383.3组织/机构参与开源的角色及目的............................................................39第四章AI开源技术目前在落地中存在的问题与差距............................................404.1AI在应用时的总体工作流..........................................................................414.1.1概述..................................................................................................414.1.2经过抽象的工作流实现..................................................................444.1.3实际应用的AI工作流应具备的特点.............................................474.2当前AI技术在行业应用中的现状及问题.................................................484.2.1交通领域..........................................................................................484.2.2油气领域..........................................................................................504.2.3公共安全领域..................................................................................524.2.4工业领域..........................................................................................554.2.5电力领域..........................................................................................584.2.6金融领域..........................................................................................604.2.7医疗领域..........................................................................................62
4.3问题总结及应对思路..................................................................................644.3.1AI开源软件的数据支持..................................................................654.3.2AI开源软件的算法..........................................................................664.3.3AI开源软件的分布式基础设施......................................................67第五章AI数据开放及协同........................................................................................695.1AI数据的关系和需求..................................................................................695.1.1面对的挑战......................................................................................695.1.2AI数据开放和协同中的相关方......................................................715.2AI数据开放和协同中相关行业分析..........................................................725.2.1政府角度分析..................................................................................735.2.2医疗行业分析..................................................................................745.2.3金融行业分析..................................................................................765.2.4交通行业分析..................................................................................775.2.5物流行业分析..................................................................................785.2.6制造行业分析..................................................................................805.2.7教育行业分析..................................................................................815.2.8石油行业分析..................................................................................825.3AI数据开放和协同的可行性......................................................................835.3.1顶层设计..........................................................................................835.3.2法律法规..........................................................................................845.3.3数据治理..........................................................................................855.3.4开源数据平台建设..........................................................................855.4潜在解决方案..............................................................................................865.4.1中心化模式......................................................................................875.4.2混合型模式......................................................................................895.4.3去中心化模式..................................................................................905.4.4没有初始数据的模式......................................................................92第六章AI领域开源与标准的关系............................................................................936.1开源与标准联动的案例..............................................................................93
6.1.1容器..................................................................................................936.1.2大数据文件格式..............................................................................946.1.3OPNFV(网络功能虚拟化)..........................................................956.2AI领域开源与标准联动的思考..................................................................966.3本次标准机遇研究的范围与内容..............................................................976.3.1行业应用标准..................................................................................986.3.2AI平台标准......................................................................................986.3.3安全标准........................................................................................1046.3.4应用智能化水平评估....................................................................1056.4制定人工智能标准中要考虑的因素........................................................1066.4.1伦理与社会关注............................................................................1066.4.2监管与治理因素............................................................................1076.4.3把握开源与标准平衡,促进创新与产业发展............................108结语..........................................................................................................................109附录A........................................................................................................................110表A.1AI开源项目社区活跃度指标统计........................................................110附录B.........................................................................................................................113表B.1第五章技术术语表................................................................................113表B.2第六章技术术语表................................................................................115
6)资料下载
链接:https://pan.baidu.com/s/1av4ZHASA12FyMmtBTv5RVQ 提取码:3641
7)版权申明:资料来源中国电子标准化研究院的官网
http://www.cesi.cn/201904/5037.html
三、人工智能伦理风险分析报告(2019)1)来源
国家人工智能标准化总体组
2)更新时间:二零一九年四月
3)前言:
人工智能伦理研究的背景与意义
我国人工智能的应用范围极广。从行业应用的角度看,在制造、物流、医疗、教育、安防等行业都有广泛应用。以制造业为例,当前的制造业不论是生产、流通还是销售,都正趋于数据化、智能化。大数据和人工智能技术可以协助企业分析生产过程中的全链路数据,实现生产效率、库存周转率、设备使用效率提升等目标。在智能制造进程中,工业机器人成为人工智能的典型代表,成为智能制造的重要实现端之一。就物流行业而言,人工智能的技术应用主要聚焦在智能搜索、推理规划、模式识别、计算机视觉以及智能机器人等领域。如今,现代物流企业纷纷尝试利用人工智能技术优化物流环节、提高物流效率。人工智能还能够帮助企业根据市场销售情况、供应链生产情况、物流配送、仓储库存水平,甚至每个环节的容错概率等等进行精准排产,最大限度利用已有资源。人工智能在医疗健康主要的应用领域则包括五个方面:临床决策支持、临床辅助诊疗系统、患者管理、辅助手术和患者照护的自动设备,即各种机器人、医疗机构的管理以及新药的研发。
人工智能在自动驾驶、医疗、传媒、金融、工业机器人以及互联网服务等越来越多领域和场景下得到应用,一方面带来了效率的提升、成本的降低,,另一方面,人工智能系统的自主性使算法决策逐步替代了人类决策,而这种替代有时非但没有解决已有的问题,还让已有的问题更难解决,甚至给社会带来了全新的问题。这些问题不仅仅引发社会的广泛讨论,更是限制人工智能技术落地的重要因素。
4)编写单位(排名不分先后)
中国电子技术标准化研究院 北京九天微星科技发展有限公司中国人民大学 国家电网有限公司北京理工大学 苏州中德宏泰电子科技股份有限公司深圳市腾讯计算机系统有限公司 中国航空综合技术研究所北京航空航天大学 上海电器科学研究所(集团)有限公司大成律师事务所 北京爱奇艺科技有限公司京东数字科技控股有限公司 北京西普阳光教育科技股份有限公司昆山炫生活信息技术股份有限公司 华为技术有限公司美国科文顿柏灵律师事务所 中国船舶重工集团公司第七一六研究所美团点评西门子(中国)有限公司
5)目录
第一章人工智能伦理研究的背景与意义..................................................................1第二章国内外人工智能伦理发展现状......................................................................32.1国外发展现状................................................................................................32.2国内发展现状................................................................................................6第三章人工智能技术的伦理风险..............................................................................83.1算法相关的伦理风险....................................................................................93.1.1算法安全............................................................................................93.1.2算法可解释性..................................................................................103.1.3算法决策困境..................................................................................143.2数据相关的伦理风险..................................................................................153.2.1隐私保护..........................................................................................153.2.2个人敏感信息的识别和处理..........................................................173.3应用相关的伦理风险..................................................................................193.3.1算法歧视..........................................................................................193.3.2算法滥用..........................................................................................243.4长期和间接的伦理风险..............................................................................263.4.1算法与就业......................................................................................263.4.2算法与产权......................................................................................273.4.3算法与竞争......................................................................................273.4.4算法责任..........................................................................................28第四章人工智能伦理原则........................................................................................294.1人类根本利益原则......................................................................................314.2责任原则......................................................................................................31第五章伦理风险评估及其管理................................................................................335.1人工智能伦理风险评估指标......................................................................335.1.1算法方面..........................................................................................335.1.2数据方面..........................................................................................345.1.3社会影响方面..................................................................................34
5.2行业实践指南..............................................................................................355.2.1风险管理框架..................................................................................355.2.2风险管理流程..................................................................................375.2.3对相关人员进行培训......................................................................395.2.4定期进行风险评估..........................................................................39第六章结论................................................................................................................40附录:国外有关人工智能基本原则的文献..............................................................42
6)资料下载
链接:https://pan.baidu.com/s/1tgt27qIQFJLc0xYL3fccrw 提取码:s593
7)版权申明:资料来源中国电子标准化研究院的官网
http://www.cesi.cn/201904/5036.html
由于华为云的博客最多只能写2万字,只能在整理近年来关于《人工智能》的标准和评估规范(2)介绍剩下的内容了。
(•̀ω•́)y
人工智能可能有自主意识了吗
参会者在第六届世界智能大会上参观(2022年6月24日摄) 赵子硕摄/本刊
➤大模型、大数据的驱动让人工智能在对话的自然度、趣味性上有了很大突破,但距离具备自主意识还很远。换言之,即便人工智能可以对人类的语言、表情所传递的情绪作出判断,但这主要应用的是自然语言处理、计算机视觉等技术
➤不同于当前依赖数据学习的技术路线,新一代人工智能强调在没有经过数据学习的情况下,可以通过推理作出合理反应,从而与没有见过、没有学过的事物展开交互
➤当前人工智能治理面临的最大挑战,是我们没有一套比较成熟的体系来规制其潜在的风险。在发展科技的同时,必须同步发展我们的规制体系
➤“技术归根结底是由人类来发展和把控的。人类和人工智能的未来,是由人类选择的。”
文 |《瞭望》新闻周刊记者 于雪 魏雨虹
今年6月,美国谷歌公司软件工程师布莱克·勒莫因称语言模型LaMDA出现自我意识。他认为,LaMDA拥有七八岁孩童的智力,并相信LaMDA正在争取自己作为一个人的权利。
LaMDA是谷歌去年发布的一款专门用于对话的语言模型,主要功能是可以与人类交谈。
为佐证观点,勒莫因把自己和LaMDA的聊天记录上传至互联网。随后,谷歌以违反保密协议为由对其停职。谷歌表示,没有任何证据支持勒莫因的观点。
事实上,“AI(人工智能)是否拥有自主意识”一直争议不休。此次谷歌工程师和LaMDA的故事,再次引发讨论。人们想知道:人工智能技术究竟发展到了怎样的阶段?是否真的具备自主意识?其判定依据是什么?未来我们又该以怎样的能力和心态与人工智能和谐共处?
人工智能自主意识之辨
勒莫因认为LaMDA具有意识的原因有三:一是LaMDA以前所未有的方式高效、创造性地使用语言;二是它以与人类相似的方式分享感觉;三是它会表达内省和想象,既会担忧未来,也会追忆过去。
受访专家告诉《瞭望》新闻周刊记者,上述现象仅仅是因为LaMDA所基于的Transformer架构能够联系上下文,进行高精度的人类对话模拟,故能应对人类开放、发散的交谈。
至于人工智能是否已经具备自主意识,判定标准如何,受访专家表示,对人类意识的探索目前仍属于科技前沿,尚未形成统一定义。
清华大学北京信息科学与技术国家研究中心助理研究员郭雨晨说:“我们说人有自主意识,是因为人知道自己在干什么。机器则不一样,你对它输入内容,它只是依照程序设定进行反馈。”
中国社会科学院科学技术哲学研究室主任段伟文认为,一般意义上,人的自我意识是指对自我具备觉知,但如何认识和理解人类意识更多还是一个哲学问题而不是科学问题,这也是很难明确定义人工智能是否具备意识的原因。
被誉为“计算机科学与人工智能之父”的艾伦·图灵,早在1950年就曾提出图灵测试——如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么可以称这台机器具有智能。
这一设想随后被具化为,如果有超过30%参与测试的人以为自己在和人说话而非计算机,就可以认为“机器会思考”。
当前随着技术的发展,已经有越来越多的机器能够通过图灵测试。
但清华大学人工智能国际治理研究院副院长梁正告诉《瞭望》新闻周刊记者,图灵测试只能证明机器在表象上可以做到让人无法分辨它与人类的不同,却不能证明机器能够思考,更不能证明机器具备自主意识。
段伟文表示,目前大体有两种方式判定人工智能是否具有自主意识,一种以人类意识为参照,另一种则试图对机器意识进行全新定义。
若以人类意识为参照,要观察机器能否像人一样整合信息。“比如你在阳光下,坐在河边的椅子上看书,有树影落在脸上,有风吹来,它们会带给你一种整体的愉悦感。而对机器来说,阳光、河流、椅子等,是分散的单一元素。”段伟文说。
不仅如此,段伟文说,还要观察机器能否像人一样将单一事件放在全局中思考,作出符合全局利益的决策。
若跳出人类构建自主意识的范式,对机器意识进行重新定义,则需要明白意识的本质是什么。
段伟文告诉记者,有理论认为如果机器与机器之间形成了灵活、独立的交互,则可以称机器具备意识。也有理论认为,可以不追究机器的内心,仅仅把机器当作行为体,从机器的行为表现判断它是否理解所做事情的意义。“比如机器人看到人类喝咖啡后很精神,下次当它观察到人类的疲惫,能不能想到要为人类煮一杯咖啡?”段伟文说。
但在段伟文看来,这些对机器意识进行重新定义的理论,其问题出在,即便能够证明机器可以交互对话、深度理解,但是否等同于具备自主意识尚未有定论。“以LaMDA为例,虽然能够生成在人类看来更具意义的对话,甚至人可以与机器在对话中产生共情,但其本质仍然是在数据采集、配对、筛选机制下形成的反馈,并不代表模型能够理解对话的意义。”
换言之,即便人工智能可以对人类的语言、表情所传递的情绪作出判断,但这主要应用的是自然语言处理、计算机视觉等技术。
郭雨晨直言,尽管在情感计算方面,通过深度学习的推动已经发展得比较好,但如果就此说人工智能具备意识还有些一厢情愿。“把‘意识’这个词换成‘功能’,我会觉得更加准确。”
技术换道
有专家提出,若要机器能思考,先要解决人工智能发展的换道问题。
据了解,目前基于深度学习、由数据驱动的人工智能在技术上已经触及天花板。一个突出例证是,阿尔法围棋(AlphaGo)在击败人类围棋世界冠军后,虽然财力和算力不断投入,但深度学习的回报率却没有相应增长。
一般认为,人工智能可被分为弱人工智能、通用人工智能和超级人工智能。弱人工智能也被称为狭义人工智能,专攻某一领域;通用人工智能也叫强人工智能,主要目标是制造出一台像人类一样拥有全面智能的计算机;超级人工智能类似于科幻作品中拥有超能力的智能机器人。
从产业发展角度看,人工智能在弱人工智能阶段停留了相当长时间,正在向通用人工智能阶段迈进。受访专家表示,目前尚未有成功创建通用人工智能的成熟案例,而具备自主意识,至少需要发展到通用人工智能阶段。
梁正说,大模型、大数据的驱动让人工智能在对话的自然度、趣味性上有了很大突破,但距离具备自主意识还很远。“如果你给这类语言模型喂养大量关于内省、想象等与意识有关的数据,它便更容易反馈与意识有关的回应。”
不仅如此,现阶段的人工智能在一个复杂、专门的领域可以做到极致,却很难完成一件在人类看来非常简单的事情。“比如人工智能可以成为围棋高手,却不具备三岁小孩对陌生环境的感知能力。”段伟文说。
谈及背后原因,受访专家表示,第一是当前人工智能主要与符号世界进行交互,在对物理世界的感知与反应上发展缓慢。第二是数据学习让机器只能对见过的内容有合理反馈,无法处理陌生内容。第三是在数据驱动技术路线下,人们通过不断调整、优化参数来强化机器反馈的精准度,但这种调适终究有限。
郭雨晨说,人类在特定任务的学习过程中接触的数据量并不大,却可以很快学习新技能、完成新任务,这是目前基于数据驱动的人工智能所不具备的能力。
梁正强调,不同于当前主要依赖大规模数据训练的技术路线,新一代人工智能强调在没有经过数据训练的情况下,可以通过推理作出合理反应,从而与没有见过、没有学过的事物展开交互。
相比人类意识的自由开放,以往人工智能更多处在封闭空间。尽管这个空间可能足够大,但若超出设定范畴便无法处理。而人类如果按照规则不能解决问题,就会修改规则,甚至发明新规则。
这意味着,如果人工智能能够超越现有学习模式,拥有对自身意识系统进行反思的能力,就会理解自身系统的基本性质,就有可能改造自身的意识系统,创造新规则,从而成为自己的主人。
“人工智能觉醒”背后
有关“人工智能觉醒”的讨论已不鲜见,但谷歌迅速否认的态度耐人寻味。
梁正表示:“如果不迅速驳斥指认,会给谷歌带来合规性方面的麻烦。”
据了解,关于人工智能是否有自主意识的争论并非单纯技术领域的学术探讨,而关乎企业合规性的基本坚守。一旦认定公司研发的人工智能系统出现自主意识,很可能会被认为违反第2版《人工智能设计的伦理准则》白皮书的相关规范。
这一由美国电气和电子工程师协会2017年发布的规范明确:“根据某些理论,当系统接近并超过通用人工智能时,无法预料的或无意的系统行为将变得越来越危险且难以纠正。并不是所有通用人工智能级别的系统都能够与人类利益保持一致,因此,当这些系统的能力越来越强大时,应当谨慎并确定不同系统的运行机制。”
梁正认为,为避免社会舆论可能的过度负面解读,担心大家认为它培育出了英国作家玛丽·雪莱笔下的弗兰肯斯坦式的科技怪物,以“不作恶”为企业口号的谷歌自然会予以否认。“不仅如此,尽管这一原则对企业没有强制约束力,但若被认为突破了底线,并对个体和社会造成实质性伤害,很有可能面临高额的惩罚性赔偿,因此企业在合规性方面会更为谨慎。”
我国也有类似管理规范。2019年,国家新一代人工智能治理专业委员会发布《新一代人工智能治理原则——发展负责任的人工智能》,提出人工智能治理的框架和行动指南。其中,“敏捷治理”原则主要针对技术可能带来的新社会风险展开治理,强调治理的适应性与灵活性。
中国信息化百人会成员、清华大学教授薛澜在接受媒体采访时表示,当前人工智能治理面临的最大挑战,是我们没有一套比较成熟的体系来规制其潜在的风险。特别是在第四次工业革命背景下,我国的人工智能技术和其他国家一样都处于发展期,没有现成的规制体系,这样就使得我们在发展科技的同时,必须同步发展我们的规制体系。“这可能是人工智能发展面临最大的挑战。”
在梁正看来,目前很难断言新兴人工智能技术具有绝对风险,但必须构造合理的熔断、叫停机制。在治理中既要具有一定的预见性,又不能扼杀创新的土壤,要在企业诉求和公共安全之间找到合适的平衡点。
毕竟,对人类来说,发展人工智能的目的不是把机器变成人,更不是把人变成机器,而是解决人类社会发展面临的问题。
从这个角度来说,我们需要的或许只是帮助人类而不是代替人类的人工智能。
为了人机友好的未来
确保通用人工智能技术有益于人类福祉,一直是人工智能伦理构建的前沿。
薛澜认为,在科技领域,很多技术都像硬币的两面,在带来正面效应的同时也会存在风险,人工智能就是其中一个比较突出的领域。如何在促进技术创新和规制潜在风险之间寻求平衡,是科技伦理必须关注的问题。
梁正提出,有时技术的发展会超越人们预想的框架,在不自觉的情况下出现与人类利益不一致甚至相悖的情况。著名的“曲别针制造机”假说,即描述了通用人工智能在目标和技术都无害的情况下,对人类造成威胁的情景。
“曲别针制造机”假说给定一种技术模型,假设某个人工智能机器的终极目标是制造曲别针,尽管看上去这一目的对人类无害,但最终它却使用人类无法比拟的能力,把世界上所有资源都做成了曲别针,进而对人类社会产生不可逆的伤害。
因此有观点认为,创造出法力高超又杀不死的孙悟空本身就是一种不顾后果的冒险行为。
与其对立的观点则认为,目前这一担忧为时尚早。
“我们对到底什么样的技术路线能够发展出具备自主意识的人工智能尚无共识,现在谈论‘禁止发展’,有种空中楼阁的意味。”梁正说。
商汤科技智能产业研究院院长田丰告诉《瞭望》新闻周刊,现实中人工智能技术伦理风险治理的关键,是产业能够在“预判防范-应用场景-用户反馈-产品改进”中形成市场反馈机制,促成伦理风险识别与敏捷治理。同时,企业内部也需建立完整的科技伦理自律机制,通过伦理委员会、伦理风控流程平台将伦理风险把控落实到产品全生命周期中。
郭雨晨说,人工智能技术发展到目前,仍始终处于人类可控状态,而科技发展的过程本来就伴随对衍生问题的预判、发现和解决。“在想象中的人工智能自主意识出现以前,人工智能技术脚踏实地的发展,已经造福人类社会很多年了。”
在梁正看来,人与人工智能在未来会是一种合作关系,各自具备对方无法达成的能力。“技术归根结底是由人类来发展和把控的。人类和人工智能的未来,是由人类选择的。”□
长沙华夏实验学校学生和机器狗互动(2022年6月22日摄)薛宇舸摄/本刊