对于人工智能的恐惧,来源于人类的无法预知
(作者声明:以下内容仅代表个人观点)
当下正在热映的两部好莱坞大片《复仇者联盟2》和《超能查派》,其中都出现了机器人主角:奥创与查派,它们虽然在人设上大有不同,可归根结底,都是人工智能主导的生命体。
但你可不要以为电影里的场景距离你遥不可及,其实“人工智能”这一概念早在世界上第一台计算机埃尼阿克问世后不到十年就被提出了,而在当下,人工智能更是早已已经布满在你的身边——远一些像IBM研发出的超级国际象棋电脑“深蓝”,近一点像翻译软件、Siri和无人驾驶,其实都是人工智能,只不过大部分人工智能在实现和普及以后,人们就只称呼它为“智能”而已。
不过,相比较普通人对于人工智能的好奇和期待,一些科学家和行业巨头们却对于人工智能的未来发展抱以担忧,其中,包括史蒂夫·霍金、比尔·盖茨和埃隆·马斯克。比如霍金很早之前就表示,人工智能是人类历史上出现过的最可怕的事物;而马斯克也在麻省理工的演讲中提到,人工智能将成为人类“最大的生存威胁”。
这似乎很难以理解,因为无论是“深蓝”还是Siri,或是无人驾驶等等,看上去似乎满满都是利好的一面,是科技进步的体现,那为什么我们还是恐惧它们呢?
人工智能的分类
要回答这一问题,先要搞清楚人工智能的分类。人工智能分为弱人工智能、强人工智能、超人工智能三种,而它们本身也是循序渐进的发展路线关系。包括“深蓝”和Siri,其实只属于弱人工智能,而真正令巨头们感到忧虑的,主要是后两者。
弱人工智能目前在生活中已经非常普遍,其特点是可以执行某种单独的能力,比如检索信息、生产操作等等。人们对于弱人工智能的关注点主要在于,它存在一定的替代效应,比如生产用的机器人,在其可以于部分生产环节里代替人力资源之后,就可能会造成人类的工作流失;
而强人工智能,是指达到人类脑力活动级别的智能,它不仅可以执行指令,还可以思考、学习、理解,乃至进行抽象思维,比起弱人工智能,强人工智能实现起来的难度非常之大,关键就在于它需要具备“自我意识”——这意味着它和其它被人类研发出来的技术,比如核武和克隆不同,因为它可能会自己做点什么;不过目前,人工智能虽然已经在多数需要思考(主要是计算)的领域上超过人类,但在一些人类不需要思考就能完成的事情上(比如下意识躲避飞来的球),它们还差的很远;
而超人工智能顾名思义,就是超出人类自身能力的人工智能,包括在科研、社交、生产领域等等,超人工智能都将比人类本身要更加聪明强大——而这一点,也是最令人担忧的,因为如果比人类更强大的超人工智能普世之后,人类自身,还有存在的必要和可能吗?
对超人工智能的恐惧,来源于人类的无法预知
在霍金、盖茨和马斯克这些悲观派眼中,强人工智能尚有一定可控性,但超人工智能则不一样,因为后者令人害怕的地方,在于人们对其一无所知——是的,人类最多能用目前已有的东西,去预测将来可能发生的事情,但是,超人工智能的能力是超过人类的,这意味着许多人类目前无法解决,甚至无法预知的东西,对超人工智能来说则可能不是问题,换言之,人类也无法预知超人工智能。
而现阶段那些表示人工智能不值得担心的人,包括百度人工智能负责人吴恩达,都是基于人工智能还有很长的发展时间这个点——换言之,他们并非是否认人工智能可能带来毁灭,而是对于这中间的时间,以及这段时间内人类自身技术的发展表示乐观,他们认为人类有能力在超人工智能引起灾难之前,把一切隐患环节都锁死和控制住,就像现在断电断网,就能遏制弱人工智能的“生命”一样。
也就是说,时间是一个关键,它既关系着人工智能的发展程度,也决定着人类是否有足够的应对和控制时间,那么,在时间上我们能乐观吗?
宁愿杞人忧天,不可自欺欺人
霍金给出的预计是100年以内,而马斯克则激进的表示在5年之内人类就会有危险——掐头去尾之后,这个难以确定的时间,可能就是当代人的有生之年。而很多人都知道一个道理,科技越发达,科技本身的发展速度就会越快,它既体现在社会环境中,也体现在具体产品至上,比如智能手机的处理能力,以及互联网本身的发展,就是呈指数级递增的,从之前到现在需要100年发展的东西,从现在到下一个节点可能只需要50年,再来就是25年。
这就是为何看似非常遥远的超人工智能,会在这个强人工智能都还难以实现的当下就让人感到恐惧的原因——因为它的开端可能很慢,但是之后会越来越快,包括动物本身的进化就是如此,现在所拥有的一些习性,其实是经过了漫长时间的适应与培养,最终沿袭下来的,然而,猿人和人类之间的差距很漫长,但普通人与高智商人群之间的距离,则就要被缩小N多倍。
也就是说,人工智能的发展,在时间和效率上,都会比人类自身的发展要快的多(除非人类控制人工智能的发展始终保持在一个相对间平衡状态下,但这并不容易)。而就像人类不会停止自身的进步一样,人工智能也不会停留在强人工智能阶段,一旦它们达到了强人工智能,那么下一秒就会开始像超人工智能的目标飞奔过去。像阿西莫夫所向往的以人类为代表的“碳文明”与机器人为代表的“硅文明”的共存共生的局面可能发生,但可能只是一段时间而已。
而在实现了超人工智能之后,它们看待人类,就像人类现在看待动物一样,有足够的资本睥睨后者的低能,而届时,人类也就像动物一样,不再能理解超人工智能的世界了。不夸张的说,现阶段我们预言的“背叛”(指机械可能会在没有人为干预的条件下自主采取任何行动),到时候可能就会成为一种自然法则,而人类的社会结构,将有可能会因此而遭到毁灭。
小结
正是这种在当前有限的认知中所能试想出来的悲观结果,才会使大佬们连番发话号召人们警惕人工智能,这同时也是作为行业领导者的他们所拥有的责任。
不过换过一面看,也许超人工智能实现以后,会把人类带到一个新纪元中去——甚至是再一次进化也不是不可能。只是无论好与坏,人类都不会再是现在这个样子了。这也就是为什么有人会说,超人工智能将会是人类最后一项发明的原因。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
人工智能
概述什么是人工智能?人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它试图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样的思考,甚至超过人的智能。第一阶段:Python
利用Python解析数据速度,效率方面比较轻量级i.轻量级指的是部署到服务器里面,可以提高服务器访问并发ii.轻量级指的是业务与业务之间的逻辑性很强,兼容性很强,降低耦合度iii.轻量级指的是业务与数据之间的一种关系体现很轻,简单说:获取数据集的方式很快,多样化
Java语言也可以实现人工智能的数据操作—不建议—重量级i.重量级的操作不适合’数据集’的采集操作ii.重量级操作不适合数据集的清理操作iii.重量级的业务与数据之间很难进行数据解析操作
人工智能的历史
1956年夏天:达特茅斯会议,提出“人工智能“20世纪60年代:感知机20世纪70年代:专家系统、知识工程20世纪80年代:日本第五代机20世纪90年代:统计机器学习2006年:深度学习2012年:卷积神经网络…人工智能的分类弱人工智能ArtificialNarrowIntelligence(ANI):弱人工智能是擅长于单个方面的人工智能。强人工智能ArtificialGeneralIntelligence(AGI):人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。超人工智能ArtificialSuperIntelligence(ASI):知名人工智能思想家NickBostrom把超级智能定义为”在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能“。人工智能的机器学习机器学习需要’思考’
机器学习是一门从数据中研究算法的科学学科‘数据’---->>‘算法’如何实现’数据’到’算法’的过程?数据采集(Python)>>数据分析(Python)>>数据挖掘(Hadoop)>>模型建立(算法)>>预测未来
机器学习理性认识
机器学习的算法公式思想数据1:x轴x1,x2,x3…xn数据2:y轴y1,y2,y3…yn目标值:x---->y误差趋近于零的时候就是目标值,误差最小->数据输出
结果公式:{(x1,y1),(x2,y2),(x3,y3)…(xn,yn)}g:x->y备注:g表示最终的公式
导论结果:其实’数据集’就是一种算法的实现
算法(T):根据业务需要和数据特征选择的相关算法,也就是一个数学公式模型(E):基于数据和算法构件出来的模型评估/测试§:对模型进行评估的策略
训练数据:"训练"数据训练指的是是:一种学习行为----转化为:“经验”-----通过经验采集的数据才是训练数据!训练数据是存在很大的不合理性!并不能满足机器的学习使用!
数据集是训练数据吗?数据集可以让机器学习使用!
机器学习概念拟合构建的算法符合给定数据的特征x(i):表示第i个样本的x向量xi:x向量的第i维度的值
鲁棒性也就是健壮性、稳健性、强健性,是系统的健壮性;当存在异常数据的时候,算法也会拟合数据
过拟合算法太符合样本数据的特征,对于实际生产中的数据特征无法拟合,目标数据和预测数据差距太大!
欠拟合算法不太符合样本的数据特征
人工智能的3大框架sciket-learn(Python)基于Python语言开发的人工智能—大量使用(效率最高)http://scikit-learn.org/stable/
Mahout(Hadoop生态圈基于MapReduce)基于大数据Hadoop的人工智能—不建议(大数据直接与AI结合)—成本高http://mahout.apache.org/
SparkMLlib基于SparkMLlib处理数据解析数据集—处理数据集的速度高于hedoophttp://spark.apache.org/
OpenStack云机房很高端,但对技术要求过高
机器学习之商业个性化推荐:个性化指的是根据各种因素来改变用户体验和呈现给用户内容,这些因素可能包含用户的行为数据和外部因素;推荐常指系统向用户呈现一个用户可能感兴趣的物品列表。精准营销:从用户群众中找出特定的要求的营销对象。客户细分:试图将用户群体分为不同的组,根据给定的用户特征进行客户分组。预测建模及分析:根据已有的数据进行建模,并使用得到的模型预测未机器学习、数据分析、数据挖掘区别与联系数据分析:数据分析是指用适当的统计分析方法对收集的大量数据进行分析,并提取有用的信息,以及形成结论,从而对数据进行详细的研究和概括过程。在实际工作中,数据分析可帮助人们做出判断;数据分析一般而言可以分为统计分析、探索性数据分析和验证性数据分析三大类。
数据挖掘:一般指从大量的数据中通过算法搜索隐藏于其中的信息的过程。通常通过统计、检索、机器学习、模式匹配等诸多方法来实现这个过程。
机器学习:是数据分析和数据挖掘的一种比较常用、比较好的手段。
机器学习分类有监督学习用已知某种或某些特性的样本作为训练集,以建立一个数学模型,再用已建立的模型来预测未知样本,此种方法被称为有监督学习,是最常用的一种机器学习方法。是从标签化训练数据集中推断出模型的机器学习任务。
重点算法判别式模型(DiscriminativeModel):直接对条件概率p(y|x)进行建模,常见判别模型有:线性回归、决策树、支持向量机SVM、k近邻、神经网络等;
生成式模型(GenerativeModel):对联合分布概率p(x,y)进行建模,常见生成式模型有:隐马尔可夫模型HMM、朴素贝叶斯模型、高斯混合模型GMM、LDA等;
区别:
生成式模型更普适;判别式模型更直接,目标性更强生成式模型关注数据是如何产生的,寻找的是数据分布模型;判别式模型关注的数据的差异性,寻找的是分类面由生成式模型可以产生判别式模型,但是由判别式模式没法形成生成式模型无监督学习与监督学习相比,无监督学习的训练集中没有人为的标注的结果,在非监督的学习过程中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。
无监督学习试图学习或者提取数据背后的数据特征,或者从数据中抽取出重要的特征信息,常见的算法有聚类、降维、文本处理(特征抽取)等。
无监督学习一般是作为有监督学习的前期数据处理,功能是从原始数据中抽取出必要的标签信息
半监督学习(SSL)考虑如何利用少量的’标注样本’和大量的’未标注样本’进行训练和分类的问题,是有监督学习和无监督学习的结合
主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。半监督学习对于减少标注代价,提高学习机器性能具有非常重大的实际意义。
SSL的成立依赖于模型假设,主要分为三大类:平滑假设、聚类假设、流行假设;其中流行假设更具有普遍性。
SSL类型的算法主要分为四大类:半监督分类、半监督回归、半监督聚类、半监督降维。
缺点:抗干扰能力弱,仅适合于实验室环境,其现实意义还没有体现出来;未来的发展主要是聚焦于新模型假设的产生
机器学习分类2分类通过分类模型,将样本数据集中的样本映射到某个给定的类别中聚类通过聚类模型,将样本数据集中的样本分为几个类别,属于同一类别的样本相似性比较大回归反映了样本数据集中样本的属性值的特性,通过函数表达样本映射的关系来发现属性值之间的依赖关系关联规则获取隐藏在数据项之间的关联或相互关系,即可以根据一个数据项的出现推导出其他数据项的出现频率机器学习算法算法名称算法描述C4.5分类决策树算法,决策树的核心算法,ID3算法的改进算法。CART分类与回归树(ClassificationandRegressionTrees)kNNK近邻分类算法;如果一个样本在特征空间中的k个最相似的样本中大多数属于某一个类别,那么该样本也属于该类别NaiveBayes贝叶斯分类模型;该模型比较适合属性相关性比较小的时候,如果属性相关性比较大的时候,决策树模型比贝叶斯分类模型效果好(原因:贝叶斯模型假设属性之间是互不影响的)SVM支持向量机,一种有监督学习的统计学习方法,广泛应用于统计分类和回归分析中。EM最大期望算法,常用于机器学习和计算机视觉中的数据集聚领域Apriori关联规则挖掘算法K-Means聚类算法,功能是将n个对象根据属性特征分为k个分割(k