博舍

人工智能优缺点 人工智能不足之处有哪些呢

人工智能优缺点

人工智能优缺点

Inthisarticleyou’llseetheadvantagesanddisadvantagesofartificialintelligence.

在本文中,您将看到人工智能的优点和缺点。

Artificialintelligenceisdesigningprogramsormachinesthathaveabilitytothink,somachinescantakedecisionswithoutinterferenceofhuman.

人工智能正在设计具有思考能力的程序或机器,因此机器可以做出决策而不会受到人为干扰。

Givingthinkingcapacitytomachinescanariseseveralproblemsandadvantagestoo.Solet’sseethem.

使机器具有思考能力也会产生一些问题和优势。让我们来看一下。

目前人工智能的不足

​人工智能的崭新范式

人工智能的研究范式和数理科学截然不同。这种范式数据导向,非常工程化,方法论发达而认识论不足。首先我们谈数据导向。李飞飞老师的ImageNet项目是一个非常典型的例子。海量图片的收集,整理和标注,有巨大的工作量。在这些高质量数据基础上进行了世界范围的图像识别竞赛,参赛队通过构建规模更大的深度学习网络,表现迅速超过了传统算法,这也成为深度学习标志性的成就。其基本的工作流程是积累大规模数据,得到更深的网络模型,实现更好的表现。虽然现在我们有了更多不同种类的深度网络应对不同任务,但这一基本框架并没有本质的改变。在该框架中,数据收集几乎占据了最为重要的位置,若数据质量不过关,很容易造成所说的garbagein-garbageout。而数据集大小是影响深度学习效能的重要因素,一般认为,当数据集较小时,深度学习不一定优于传统机器学习方法。而随着数据集规模的增大,传统机器学习算法的表现很容易饱和,深度学习的表现却可以随着网络规模的增大而更加优异。

在传统数理科学领域,我们并没有如此依赖数据来进行模型构建。可能由于人脑思维能力的限制,人们更习惯于从简单假设出发,利用逻辑演绎或者公式推导来构建一套模型系统,用以解释实际数据。数理科学存在利用大量数据的情形:比如开普勒从第谷得观测数据中也找到了特定的结构,不过这种结构不是用神经网络的方式来描述的,而是采取了数学上更为简洁的形式。而该规律只有纳入牛顿力学的框架的时候才成为一个自然的结果。现在观测手段更加进步,据说LHC每秒可以产生100万亿字节的对撞数据。但这些数据不是为了导出模型,而主要是为了验证只有几十个参数的人为构建的标准模型,其包含的信息量也没有超过这个模型。在很多时候,理论的提出或者发展,可以用到很少的数据,甚至几乎不用数据。伽利略构建其运动学的时候,应该只依据很少的观测。而泰勒斯提出原子理论的时候我相信是没有什么观测数据的。理论的魅力在于可以从人的经验,思维或者直觉中生产,具有内在的简洁性却能解释大量的现实观测。

对数据的内在追求,导致人工智能研究中有很多重劳力的部分。和产业的结合,资本的进入进一步放大了这一效应。国内人工智能创业公司不断涌现,数据标注俨然已经成为一种新的职业。已经有不少相关的报道,比如可以参考甲子光年的《那些人工智能背后的人工》一文。这些人每个月拿着4000左右的工资,在电脑前机械的点着鼠标做图片标注,得到的数据最终用于无人驾驶项目。还有很多下到村里收集人脸识别数据的,报酬是洗衣粉或者豆油。即使是科学研究逐渐资本化的今天,也很难想象一门学科可以像这样直接催生新的劳动关系。这也部分由于我们要谈的第二个问题,也就是人工智能研究非常工程化。

如果上过吴恩达老师的深度学习课程,就会发现,深度学习在工程上非常先进,具有一套非常清晰的工作模式。对于一个深度网络模型,那些参数具有最大的影响,如何通过表现判断调节参数的方向,人们有着丰富的经验。最终决定表现的还是数据质量,规模,以及特征(feature)选取。这就导致了人工智能领域的工作,非常容易scale-up,也就是规模化。这也是硅谷最喜欢的发展模式--通过资本催化迅速实现技术飞越和革新。类似的模式造就了我们熟悉的facebook,amazon,现在的互联网移动互联网世界。

在数理科学领域,我们不能简单通过积累用户或者数据获得革新。一般情况下,理论的发育程度对应了工程范畴的发展程度。新的工程实践可能要求理论的创新,而理论的进步又可以拓展人们进行工程化创造的能力。没有爱因斯坦的质能方程,我想人们试再多年,有再多数据也不会造出原子弹。所以人工智能可以算是一朵奇葩,感谢计算能力的巨大发展,它工程的发展程度已经可以跟理论脱节。这种缺乏理论或者认识论会带来比较严重的后果,我们后面会有所述及。

人工智能没有催生理念的进步

对人工智能最大的批评在于它的可诠释性,人们难以理解越发庞大的深度网络是如何发挥它的作用,每个节点有着怎样的功能。拿图像识别任务来说,比较早期的深度网络AlexNet有35K个参数。到了2014年,VGG16网络有138M个参数。在强大的表现背后,是一个人们从未接触过的,难以理解的庞大造物(考虑到标准模型只有19个自由参数)。关于如何解读网络,现在逐渐有一些工作。但似乎还没有令人信服的结果。在数学上可能也没有成熟的工具来针对这类问题。神经网络算法的提出,最开始是受到了生物学研究,尤其是神经研究的启发。不过即使针对比较简单的模式生物,比如只有302个神经元的线虫,我们也刚刚能理解一些最简单行为,比如趋热或者趋冷在神经系统里细胞层面是如何编码的。诠释神经网络的工作,一方面受制于网络规模的飞速增大,参数的急剧膨胀,以及应用场景的逐渐复杂。另一方面,这本身可能就是不可解的问题,类似于我们本身都不知道大脑是如何运作,产生复杂思维。

没有理论的学科会造成很多问题,可以参看我之前的博文《没有理论的学科会怎么样》。针对人工智能这一领域,第一个负面结果是会造成边际效益递减。也就是随着数据规模的增大,网络复杂度的增大,获得的进步越来越少。我们谈到深度学习一个重要的特征是表现随着数据体量增大而提高,这也是为什么大数据时代最适合深度学习。有时候我们觉得参数的膨胀标志着一种进步。但从物理学的角度看,这其实是退步--因为这标志着参数解释力的下降。这正是现实发生的情况,但即使我们在计算能力以及数据规模(感谢资本)上大跃进,表现的提高却越来越慢。还是拿图像识别为例,AlexNet的错误率是16.4%,而参数增加了4000倍的VGG网络错误率是7.3%,基本错误减半。换过来说,是35K个参数可以识别83.6%的图片,多出几千倍的参数只多识别了9.1%的图片,效能加起来只有接近九分之一。这也是为什么每当人工智能进入一个新的领域时,往往可以产生激动人心的初步结果(因为数据要求低),但对表现的改善却是趋于更慢的。这对于一些要求苛刻的领域这其实是致命的,比如对于自动驾驶,我们必须把失误控制在非常低的水平(每次失误可能都会造成致命的事故),而现实情况又非常复杂多变,有些情况不仅靠训练,也要靠应变和经验上的判断。

没有理论的另一个负面结果是研究过程近似于盲人摸象。虽然我们也有越来越多的网络模型,但这些模型的构建似乎更受到灵感的作用,而不是通过理论的启发。这种tryanderror类型的研究,试对了就好,试不对就重来,运气的成分会比较大。从理念上看,深度学习领域似乎还没有根本上的创新,其最大的进步似乎还是计算力上的进步,工作的模式仍然接近于对生物神经系统的模仿。而这种模仿其实并不能算是效率很高的模仿,我相信人脑完成复杂任务计算的效率平均讲还是高于神经网络的。至少从计算时间和所需能量来讲是远优于计算机的。人脑的功率据说是20W左右,而现在好点的英伟达显卡比如GeForceGTX1080Ti的功耗已经到了200W大关了。好在现在计算力不是瓶颈,再低的效率乘上庞大的计算力都能得到可观的结果。

人工智能从应用方式和应用场景上,都是对人的一些基本能力的模仿。吴恩达老师有过一个说法,说如果一个问题,人可以凭借直觉在几秒内判断出来,那么就有可能用人工智能来解决。现在出现比较多的也的确是这类问题,比如对于图像识别,到底是猫是狗,人一般几秒钟就能看出来。或者在自动驾驶方面,在一个路口是要刹车还是左转,正常的司机几秒钟也能判断出来。所以说人工智能是对人的能力的再现,这使得它在一些场景下可以代替人工,提高生产效率。但它难以完成更高级的一些思维活动,比如创造性思维。虽然有些“灵感一现”发生的时间也很短,但目前的计算框架并不具备相应的发散性,联想性和随机性。所以深度学习研究不仅自身缺乏理论,而且也很难为其他学科领域带来新的理论。根本的区别在于数理科学的研究具有不同的工作模式,一般包括假设提出,理论发展和实验验证,三者之间相互促进。其中假设的提出是最为关键的一步,也是研究设计的基础。人工智能在这第一步就败下阵来。人怎么能够提出假设,这是一个复杂的问题。但其基本原因,脱不开人是有自我意识的,对世界的认识是自由的,人的思维也是自由的。人工智能有没有思维,有没有意识是另外的话题,但目前来看它的训练数据都是高度单一的,它的结构或者结构的规则也是比较单一的,难以形成更复杂的思维结构。

人工智能与社会发展

所以综上人工智能最佳的应用场景是对人类劳动的部分替代。人工智能的革命,可能是生产效率的革命,类似于工业革命把人的双手解放出来。但现在还很难讲它在产业上会不会产生类似工业革命的影响,主要的区别可能有几点,第一,现在社会一般性产品的生产基本已经饱和,需要更多的是创新性产品,消费主要为了提高生活品质,也就是所说的“满足美好生活需要”。在生产创新性产品和服务方面,还没有看到人工智能的优势。第二,全球经济发展不平均(以及国内发展不平衡)造成的大量的低成本劳动力,在一些场景下替代这部分劳动力效益不高。举一个极端的例子,一些创业公司搞线上的人工智能产品或者demo,背后其实可以在人力成本比较低的地方雇真人来做,这也是实际发生过的事情。如果人力成本很低,电子化的人不一定能竞争过肉身的人。如果有一天人力成本都很高了,我们可能就进入共产主义社会了。我怀疑人工智能最危险的地方在于它对社会治理和网络治理的影响,而且这种影响很可能是负面的。这里就不展开多说了。

另外像我提到的,人工智能对生产力的解放是有限的,它还难以替代创造性劳动,尤其是科研活动。我们支持人工智能是合理的,all-in人工智能是危险的。基础研究还应该受到重视,目前看这是唯一可能导向新技术革命的路径。不重视基础研究,永远会被人落在后面。

【飞马会】

往期福利

********关注飞马会公众号,回复对应关键词打包下载学习资料;********回复“入群”,加入飞马网AI、大数据、项目经理学习群,和优秀的人一起成长!

回复数字“1”下载从入门到研究,人工智能领域最值得一读的10本资料(附下载)

回复数字“2”机器学习&数据科学必读的经典书籍,内附资料包!

回复数字“14”小白|机器学习和深度学习必读书籍+机器学习实战视频/PPT+大数据分析书籍推荐!

回复数字“29”干货|28本大数据/数据分析/数据挖掘电子书合集免费下载!

回复数字“36”286页PDF教你如何搞明白深度学习的算法、理论与计算系统!(可下载)

回复数字“46”700页的《图形深度学习》(附代码和下载)

回复数字“47”好书推荐|106页的《Python进阶》中文版(附下载)

回复数字“48”最具影响力的20篇数据科学研究论文,附电子版~

回复数字“131”下载|《人工智能的认知神经基础白皮书》PDF版

回复数字“132”下载|2020城市大脑与超级智能建设规范研究报告(PDF版)

回复数字“133”下载|京东《未来科技趋势白皮书》

我国人工智能产业发展面临的三大问题

2019年,人工智能数据、算法、算力生态条件日益成熟,我国人工智能产业发展迎来一轮战略机遇,智能芯片、智能无人机、智能网联汽车、智能机器人等细分产业,以及医疗健康、金融、供应链、交通、制造、家居、轨道交通等重点应用领域发展势头良好。展望2020年,全国各级地方将根据自身实际情况申报和落地人工智能创新应用先导区,国内人工智能产业投融资将更关注易落地的底层技术公司。

2020年形势判断

从产业链建设看,人工智能数据、算法、算力生态条件日益成熟。算法、数据和计算力是推动人工智能技术进步和产业发展的“三驾马车”。

一是在算法方面,2019年,基于视觉、触觉传感的迁移学习、变分自动编码器(VAE)和生成对抗网络(GAN)是无监督学习中新涌现的算法类型。预计2020年,上述新兴学习算法将在主流机器学习算法模型库中得到更高效的实现,Caffe框架、CNTK框架等分别针对不同新兴人工智能算法模型进行收集整合,可以大幅度提高算法开发的场景适用性。

二是在数据方面,2019年,我国5G、物联网、汽车电子等多种新兴技术产业的快速发展,数据总量呈现海量聚集爆发式增长。预计2020年,我国5G通信网络部署加速,接入物联网的设备将增加至500亿台,数据的增长速度越来越快,世界领先的互联网公司大数据量将达到上千PB,传统行业龙头型企业数据量将达到PB级,个人产生数据达到TB级。

三是在算力方面,2019年以来,我国人工智能的算力仍以GPU芯片为主要硬件承载,但随着技术的不断迭代,预计2020年,ASIC、FPGA等计算单元类别将成为支撑我国人工智能技术发展的底层硬件能力。

从政策推动来看,全国各级地方将根据自身实际情况申报和落地人工智能创新应用先导区。2019年,我国31个省份中已有19个省份发布了人工智能规划,其中有16个制定了具体的产业规模发展目标,以北上广深为代表的城市积极地制定了行之有效的政策,对人工智能产业的落地和发展产生了较大的推动作用,成为中国人工智能行业的重要实践者和领头羊。

尤其是2019年下半年以来,上海市和深圳市获批成为我国首批人工智能创新应用先导区,为我国人工智能产业应用发展带来新契机。预计2020年,国内更多城市(群)将聚焦智能芯片、智能无人机、智能网联汽车、智能机器人等优势产业,面向医疗健康、金融、供应链、交通、制造、家居、轨道交通等重点应用领域,积极申报和搭建符合自身优势和发展特点的人工智能深度应用场景,以“先导区”工作为抓手,促进人工智能产业与实体经济深度融合。

从投融资情况看,我国人工智能产业投资市场将关注易落地的底层技术公司。在过去5年间,我国人工智能领域投资曾出现快速增长。2015年,人工智能产业投融资规模达到450亿元。到2019年,仅上半年国内人工智能领域就获得投融资超过478亿元。近四年来,人工智能领域投融资集中在企业服务、机器人、医疗健康、行业解决方案、基础组件、金融等落地前景较好领域。预计2020年,新零售、无人驾驶、医疗和教育等易落地的人工智能应用场景将更加受到资本关注。

同时,由于中国在人工智能底层技术方面仍落后于美国,随着人工智能在中国的进一步发展,底层技术的投资热度将持续增长,那些拥有顶级科学家团队、雄厚科技基因的底层技术创业公司将获得资本市场的持续资金注入。

三大问题

我国人工智能领域的基础创新投入严重不足。

从企业研发创新看,中国人工智能企业的创新研发支出仍远远落后于美国、欧洲和日本。2018—2019年,美国人工智能领域企业投入的科技研发费用占据了全球科技支出的61%,我国人工智能领域企业研发支出虽然快速增加,增速达到34%,但实际占据的全球科技支出份额明显小于美国。

从人工智能知识产权保有量看,我国各类实体拥有的人工智能专利总量超过3万件,位居世界第一,但中国相关企业拥有的人工智能相关专利多为门槛较低的实用新型专利,发明专利仅占专利申请总量的23%。同时,根据世界知识产权组织的数据,我国企业拥有的95%的人工智能设计专利和61%的人工智能实用新型专利将会在5年后失效,相比之下,美国85.6%的人工智能专利技术在5年后仍在支付维护费用。2020年,我国需要在人工智能基础研究与创新,打造核心关键技术长板、加强知识产权保护方面加大投入力度。

我国人工智能产业的算力算法核心基础相对薄弱。我国人工智能发展在数据规模和算法集成应用上都走在世界前列,但在人工智能基础算力方面,能提供国产化算力支持的企业还不多。

在人工智能的算力支持方面,IBM、HPE、戴尔等国际巨头稳居全球服务器市场前三位,浪潮、联想、新华三、华为等国内企业市场份额有限;国内人工智能芯片厂商需要大量依靠高通、英伟达、AMD、赛灵思、美满电子、EMC、安华高、联发科等国际巨头供货,中科寒武纪等国内企业发展刚刚起步。

在人工智能算法方面,主流框架与数据集领域国内外企业龙头企业包括谷歌、脸书、亚马逊、微软等,深度学习主流框架TensorFlow、Caffe等均为美国企业或机构掌握,百度、第四范式、旷视科技等国内企业的算法框架和数据集尚未得到业界的广泛认可和应用。2020年,我国需要进一步部署加强人工智能基础设施建设,并重视国内人工智能算法框架的创新推广。

以算法战、深度伪造为代表的人工智能技术滥用给经济社会带来严重负面影响。算法战指的是将人工智能算法、机器学习等技术全面应用于对敌作战中的情报收集、武器装备、战场勘测、指挥协同、决策制定等环节,核心目标是利用人工智能技术提升军事作战能力;深度伪造(Deepfakes)是“DeepMachineLearning”(深度学习)和“Fake”(造假)的英文组合词,是一种基于深度学习的人物图像合成技术,随着人工智能算法开源不断推进,深度伪造技术门槛正在不断降低,非专业人员已经可以利用简单开源代码快速制作出以假乱真的视频和图像。

2019年以来,基于人工智能的算法战和深度伪造的正在扩大军事影响、形成网络暴力、破坏政治选举、扰乱外交关系等方面被滥用,并给社会和国家带来极大风险。上述对人工智能技术的滥用给我国家安全、产业安全、社会经济安全带来巨大风险,需提前预防可能风险,并寻求国际支持。

对策建议

以算力为核心加强人工智能基础能力建设。首先要大力推进人工智能算法库、解决方案库、数据集及公共服务平台建设,强化人工智能发展基础。其次加强面向人工智能发展应用的5G网络、边缘计算硬件新兴信息基础设施建设。最后要对各行业企业自动化、智能化改造的产出、效果进行科学有效测算,指导企业找准技术研发投入的切入点,利用好人工智能技术实现经济社会高质量发展。

体系化梳理我国人工智能产业供应链现状。我们既要关注重要整机产品以及大厂商、大企业,也要覆盖量大面广的细分领域及增长势头良好的隐形冠军。

推动国内人工智能企业加快开拓国内外应用市场并提升出海抗风险能力。我国需要加强国内应用市场推广,挖掘多种类型的应用场景,培育各种规模的竞争主体,进一步提升新技术的应用水平和应用层级。同时,引导对外应用市场开拓,支持企业开拓海外市场,对出海企业在经营合规管控、知识产权管理、专利诉讼等方面的具体问题给予窗口指导。最后,提升企业自身的抗风险抗打击能力,鼓励新兴领域的独角兽企业尽快做大做强,形成较大规模体量和较强技术竞争力。

在国际社会上提出发展“负责任的人工智能”。首先应加紧研究并提出中国版的人工智能伦理守则或框架,形成人工智能伦理风险评估指标体系或风险管理指南,为人工智能企业提供风险识别、评估及应对的系统指引。其次应加强与联合国、欧盟及其成员国、G20等国际组织的合作,参与搭建多层次国际人工智能治理机制,提出发展“负责任的人工智能”供全球各国讨论,在全球人工智能伦理框架的制定议程中发挥建设性作用。

来源:赛迪研究院

 

更多资讯,请扫描下方二维码,关注中国微米纳米技术学会微信公众号

吴恩达谈当前人工智能的能力与不足

全球顶尖人工智能专家、百度首席科学家吴恩达在《哈佛商业评论》撰文讨论了当前人工智能的能力与不足。吴恩达谈到:

许多企业高管问我人工智能够做些什么,他们想要知道人工智能会如何颠覆其所在的行业以及他们可以如何利用人工智能来重塑自己的公司。但最近的一些媒体报道对人工智能能力的描绘有点不切实际,如人工智能会统治整个世界。人工智能现在已经改变了网络搜索、广告、电子商务、金融、物流、媒体等领域。作为谷歌大脑(GoogleBrain)团队创办人、斯坦福人工智能实验室(StanfordArtificialIntelligenceLaboratory)主任以及百度千人人工智能团队的现任负责人,我有幸培养了许多全球领先的人工智能团队,并创造了许多拥有亿万用户的人工智能产品。我已经看到了人工智能的影响,人工智能会改变许多行业,但它并不是魔法。为了弄清人工智能对具体业务的影响,让我们抛开那些天花乱坠的言论,看看人工智能现在究竟能够做些什么。

令人惊讶的是,尽管人工智能的影响范围十分广泛,其部署类型却仍然极其有限。几乎所有人工智能的最新成果都是通过一种部署类型获取的,即使用一些输入数据(A)快速生成一些简单响应(B)。构建这种A→B软件的过程在技术术语上称为监督式学习(supervisedlearning)。A→B这种系统距离科幻小说中设想的存在情感的机器人还有很远的距离,人工智能的能力也远比A→B系统的能力强得多。这些A→B系统正在快速发展,目前,最好的A→B系统采用名为深度学习或深度神经网络的技术构建,它们都受到大脑的启发,但这些系统远远不像科幻小说中描述的那样神奇。许多研究人员正在探索其他形式的人工智能,其中一些已在特定的环境中被证明有用;也许还能找到其他突破口开发出更高级的人工智能,但目前还没有发现实现这一目标的明确路径。

目前的监督式学习软件有致命弱点,那就是它需要海量数据。您需要向系统展示大量的A、B范例。例如,开发照片标记软件需要成千上万张图片(A)以及用于提示图中是否有人存在的标签或标记(B)。构建语音识别系统则需要成千上万小时的音频(A)和转录脚本(B)。

A→B系统可以做些什么呢?以下是一个关于其颠覆性影响的经验法则:

表:就监督式学习进行思考的简单方法

输入A

响应B

应用

图片

有人脸吗?(0或1)

照片标记

贷款应用程序

他们会偿还贷款吗?(0或1)

贷款审批

广告和用户信息

用户会点击广告吗?(0或1)

针对性在线广告

音频片段

音频片段的转录脚本

语音识别

英语句子

法语句子

语言翻译

硬盘、飞机发动机等的传感器

会出现故障吗?

预防性维护

车辆摄像头和其他传感器

其他车辆的位置

无人驾驶车辆

如果一个普通人通过思考完成某项思维任务所需的时间少于1秒,那么我们也许可以在现在或不久的将来使用人工智能将这项任务自动化。

目前由人类完成的许多有价值的工作可以在1秒内完成:检查安全视频中是否有可疑行为、确定车辆是否会撞到行人、查找并删除辱骂性的网络发帖,是时候对这些任务进行自动化了,但它们通常只是一个大环境或业务流程的一部分,找出它们与业务中其他部分的联系同样重要。

人工智能研究需要谨慎选择A和B,并提供必要的数据来帮助人工智能确立A→B关系。有创造性地选择A和B已经变革了许多行业,并且有望带来更多变革。

了解人工智能的能力范围后,企业高管们下一步应将人工智能与自己的战略融合,即了解什么可以创造价值以及创新点。人工智能社区具有极高的开放性,有许多顶尖的研究人员在其中发表和分享自己的想法或甚或开源代码。这个开源世界中的稀缺资源包括:

(1)数据。在顶尖的人工智能团队中,许多团队最多只需一到两年就能复制其他团队的软件,但要获得其他团队的数据却极为困难。因此,数据(而不是软件)才是许多企业的防御对象。

(2)人才。仅下载其他公司的开源软件并将其“应用”于您的数据并不能起什么作用,需要根据自身的业务环境和数据对人工智能进行自定义,这也是为当下诸多企业纷纷争抢能够完成这项任务的稀缺人才的原因。

关于人工智能能够反映人性中最好的一面和最坏的一面的潜力已有诸多报道,例如,我们看到人工智能能够通过对话为孤单的人们提供慰藉;我们也看到有些人工智能牵涉到种族歧视问题。但人工智能在短期内对个人可能造成的最大伤害在于失业,这是因为我们可以使用人工智能自动完成的工种大大增加。作为人工智能领域的领导者,确保我们构建的世界能够让每个个体都有发展机会是我们义不容辞的责任。了解人工智能能够做些什么以及如何将其与您的发展战略融合只是这一进程的开始,而非终点。

人工智能的安全问题不容忽视

现在有很多技术可以欺骗人工智能,也有很多人工智能技术被用来欺骗人。在人工智能(AI)时代,安全问题不容忽视。

近几年,人工智能技术在很多领域都取得了初步的成功,无论是图像分类、视频监控领域的目标跟踪,还是自动驾驶、人脸识别、围棋等方面,都取得了非常好的进展。那么,人工智能技术到底安全不安全?事实上,目前的人工智能技术还存在很多问题。

人工智能并不安全

现在有很多技术可以欺骗人工智能,如在图片上加入一些对抗干扰。所谓对抗干扰,就是针对智能判别式模型的缺陷,设计算法精心构造与正常样本差异极小、能使模型错误识别的样本。如图1所示,本来是一幅手枪的图片,如果加入一些对抗干扰,识别结果就会产生错误,模型会识别为不是枪。在人的前面挂一块具有特定图案的牌子,就能使人在视频监控系统中“隐身”(见图2)。在自动驾驶场景下,如果对限速标识牌加一些扰动,就可以误导自动驾驶系统识别成“Stop”(见图3),显然这在交通上会引起很大的安全隐患。另一方面,人工智能的一些技术现在正在被滥用来欺骗人。例如,利用人工智能生成虚假内容,包括换脸视频、虚假新闻、虚假人脸、虚拟社交账户等。

图1被暴恐检测系统识别成正常图片

图2在智能监控下隐身

图3误导自动驾驶系统

不只在图片和视频领域,在语音识别领域也存在这样的安全隐患。例如,在语音中任意加入非常微小的干扰,语音识别系统也可能会把这段语音识别错。同样,在文本识别领域,只需要改变一个字母就可以使文本内容被错误分类。

除了对抗攻击这种攻击类型外,还有一种叫后门攻击的攻击类型。后门攻击是指向智能识别系统的训练数据安插后门,使其对特定信号敏感,并诱导其产生攻击者指定的错误行为。例如,我们在对机器进行训练时,在某一类的某些样本中插入一个后门模式,如给人的图像加上特定的眼镜作为后门,用一些训练上的技巧让机器人学习到眼镜与某个判断结果(如特定的一个名人)的关联。训练结束后,这个模型针对这样一个人还是能够做出正确的识别,但如果输入另一个人的图片,让他戴上特定的眼镜,他就会被识别成前面那个人。训练的时候,模型里留了一个后门,这同样也是安全隐患。

除了对抗样本、后门外,如果AI技术被滥用,还可能会形成一些新的安全隐患。例如,生成假的内容,但这不全都是人工智能生成的,也有人为生成的。此前,《深圳特区报》报道了深圳最美女孩给残疾乞丐喂饭,感动路人,人民网、新华社各大媒体都有报道。后来,人们深入挖掘,发现这个新闻是人为制造的。现在社交网络上有很多这样的例子,很多所谓的新闻其实是不真实的。一方面,人工智能可以发挥重要作用,可以检测新闻的真假;另一方面,人工智能也可以用来生成虚假内容,用智能算法生成一个根本不存在的人脸。

用人工智能技术生成虚假视频,尤其是使用视频换脸生成某个特定人的视频,有可能对社会稳定甚至国家安全造成威胁。例如,模仿领导人讲话可能就会欺骗社会大众。因此,生成技术是否需要一些鉴别手段或者相应的管理规范,这也是亟须探讨的。例如,生成虚假人脸,建立虚假的社交账户,让它与很多真实的人建立关联关系,甚至形成一些自动对话,看起来好像是一个真实人的账号,实际上完全是虚拟生成的。这样的情况该如何管理还需要我们进一步探索和研究。

人工智能安全隐患的技术剖析

针对AI的安全隐患,要找到防御的方法,首先要了解产生安全隐患的技术。以对抗样本生成为例,其主要分为2类:一类是白盒场景下对抗样本生成;另一类为黑盒场景下对抗样本生成。白盒场景的模型参数完全已知,可以访问模型中所有的参数,这个情况下攻击就会变得相对容易一些,只需要评估信息变化的方向对模型输出的影响,找到灵敏度最高的方向,相应地做出一些扰动干扰,就可以完成对模型的攻击。黑盒场景下攻击则相对较难,大部分实际情况下都是黑盒场景,我们依然可以对模型远程访问,输入样本,拿到检测结果,但无法获得模型里的参数。

现阶段的黑盒攻击可大致分为3类。第一类是基于迁移性的攻击方法,攻击者可以利用目标模型的输入信息和输出信息,训练出一个替换模型模拟目标模型的决策边界,并在替换模型中利用白盒攻击方法生成对抗样本,最后利用对抗样本的迁移性完成对目标模型的攻击。第二类是基于梯度估计的攻击方法,攻击者可以利用有限差分以及自然进化策略等方式来估计梯度信息,同时结合白盒攻击方法生成对抗样本。在自然进化策略中,攻击者可以以多个随机分布的单位向量作为搜索方向,并在这些搜索方向下最大化对抗目标的期望值。第三类是基于决策边界的攻击方法,通过启发式搜索策略搜索决策边界,再沿决策边界不断搜索距离原样本更近的对抗样本。

有攻击就有防御,针对对抗样本的检测,目前主要有3种手段。第一种,通过训练二分类器去分类样本是否受到干扰,但通用性会比较差。通常而言,训练一个分类器只能针对某一种特定的攻击算法,但在通常情况下并不知道别人使用哪一种攻击算法。第二种,训练去噪器。所谓的对抗干扰基本上都是样本中加入噪声,通过去噪对样本进行还原,从而实现防御。第三种,用对抗的手段提升模型的鲁棒性,在模型训练中加入对抗样本,模型面对对抗样本时会具有更强的鲁棒性,提高识别的成功率,但训练的复杂度较高。整体而言,这些方法都不很理想,我们亟须研究通用性强、效率高的对抗样本的防御方法。

针对换脸视频的生成,目前主流技术是基于自动编码器进行人脸图像重建。在模型训练阶段,所有的人脸图像使用同一个编码器,这个编码器的目标是学习捕捉人脸的关键特征。对于人脸重构,每个人的脸都有一个单独的解码器,这个解码器用于学习不同人的脸所具有的独特特征。利用训练后的编码器与解码器即可进行虚假人脸生成。

针对换脸视频的鉴别,目前主流技术是基于视觉瑕疵进行鉴别,这个假设是换脸视频具有不真实的情况。因此,可以对眨眼频率、头部姿态估计、光照估计、几何估计等提取特征,利用这些特征去判断人脸的图片或者视频的真假。

对抗攻防已取得一定研究成果

目前,我们在人工智能安全技术上加大了投入,围绕人工智能安全领域的问题开展了一些研究。

第一个工作是针对视频识别模型上的黑盒对抗攻击。在该工作中,我们利用对抗扰动的迁移性,将图像预训练模型中得到的扰动作为视频帧的初始扰动,并在此基础上利用自然进化策略对这些初始扰动噪声进行纠正。当我们得到针对视频域特殊纠正后的梯度信息后,采用投影梯度下降来对输入视频进行更新。该方法可以在黑盒场景下,对主流视频识别模型进行攻击,这也是全球在视频模型黑盒攻击上的第一个工作。我们实现的结果是在目标攻击情况下,需要3万至8万次查询就可以达到93%的攻击成功率,非目标攻击只需要数百个查询就可以完成对主流模型的攻击。目标攻击是指不仅让这个模型识别错,还要指定它把这个东西识别成什么,如把A的照片识别成B。非目标攻击是指只要识别错就可以了,识别成谁则不重要,如A的照片只要不识别成A就可以。

第二个工作是基于时空稀疏的视频对抗攻击。由于视频数据的维度很高,导致攻击算法的复杂度往往较高。对此,我们提出了基于时空稀疏的视频数据对抗攻击方法。时空稀疏是指在生成对抗扰动时,仅对特定帧的特定区域生成扰动,以此降低对抗扰动的搜索空间,提高攻击效率。在该工作中,为了实现时空稀疏,我们根据启发式规则衡量每个帧的重要性,选择视频帧的子集进行扰动;同时,在空间上我们选择指定帧的写入区域,如针对前景运动的人做一些干扰。以此实现高效的视频黑盒攻击。

第三个工作是针对视频识别模型进行后门攻击。针对后门攻击,之前的研究都集中于图像领域,且都是生成固定的棋盘格式的后门,这种方法在视频上的攻击成功率极低。对此,我们提出了一种针对视频数据的后门攻击方法。在该工作中,我们首先对视频数据进行后门生成,并将后门图案安插在视频中不显眼的角落,同时我们对原始视频其他内容施加一些对抗干扰,使得我们识别的模型更加侧重利用后门,以此得到污染数据,并用污染的数据替换原始数据集里对应的数据,实现后门攻击。该工作在公开数据集上取得了比较好的攻击结果,在很多类别上平均攻击成功率可以实现80%左右,远高于现有的基于图像数据的后门攻击方法。

技术对人工智能治理至关重要

未来,技术将在人工智能安全问题检测以及相应规则落实上发挥重要的作用。在保障模型安全方面,通过发展对抗攻防理论设计更加鲁棒的智能模型,确保智能系统在复杂环境下的安全运行,形成人工智能安全评估和管控能力。在隐私保护上,发展联邦学习及差分隐私等理论与技术,规范智能系统分析和使用数据的行为,保障数据所有者的隐私。针对智能系统决策的可解释性问题,发展机器学习可解释性理论与技术,提升智能算法决策流程的人类可理解性,建立可审查、可回溯、可推演的透明监管机制。在决策公平方面,可以利用统计学理论与技术,消除算法与数据中的歧视性偏差,构建无偏见的人工智能系统。最后,为了保证人工智能技术不被滥用,可以通过发展大数据计算与模式识别等理论与技术,预防、检测、监管智能技术被滥用的情况,创造有益于人类福祉的人工智能应用生态。

姜育刚,复旦大学教授、博士生导师,计算机科学技术学院院长、软件学院院长、上海视频技术与系统工程研究中心主任。

文/姜育刚

本文来自《张江科技评论》

智能家居有哪些不足如何解决这些问题呢

原标题:智能家居有哪些不足?如何解决这些问题呢?

什么是智能家居?

智能家居是指利用综合布线技术、通信技术、物联网技术、安防技术、自动控制技术、音视频技术、人工智能等,整合与家居生活相关的设施,构建高效的住宅设施和家庭日程事务管理系统。智能家居的概念起源很早,市场前景也很广阔。然而,在探索智能家居的过程中,行业的乱象也随之产生。

智能家居常见的缺点有哪些?

1、装了不会用,利用率不高。

由于智能家居的操作比较复杂,目前智能家居的市场还不够成熟,企业对系统的设计也不够人性化,所以操作起来比较困难,本来是要享受生活的,但是使用过程过于复杂,很多老年人和家庭中的孩子不会使用这些产品,这已经成为智能家居市场冷淡的一个关键因素。

2、智能家居网络安全问题。

当家中所有设备都接入互联网后,就会给别有用心的黑客提供一种新的违法犯罪途径。当黑客入侵时,对于家里的摄像头简直就是一场灾难,不但可以轻松获取用户的隐私信息,还可能将这些信息进行贩卖。

3、市场标准不统一,升级维护麻烦。

目前智能家居中能够标准化的设备并不多,也缺乏监管机制。因此,没有统一的市场标准。如果你的智能家居需要维护或者升级,那就麻烦了。

如何解决这些问题?

内载五节省智能线路装配式:信号传输采用世界公认的安全频段,通俗一点就是我们经常听的收音机的信号传输是一样的,收音机携带的是音频信号,我们的信号传输携带的是指令信号,而非利用网络平台放大信号整个覆盖生活区域才能正常应用的弊端,当然了利用网络平台除了对人身有辐射之外它的局限性也就大了很多。

内载传输的办法和技术,已经做到了,待机功耗为零、对人体辐射为零、这个系列产品的正常工作就不需要网络,所以就没有了网络安全问题的发生,对人体辐射的危险,避免了家用电器的待机功耗问题及电器待机状态被损坏的问题,现已做到了建筑、装饰装修的六节省:节省开关、节省开槽、节省埋管、节省预埋、节省穿线、节省布双控布三控,省工省时、节省原材料、降低劳动强度、提高工作效率(线路改造的工作效率提高了90%以上)。返回搜狐,查看更多

责任编辑:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇