人工智能的现实意义表现在哪里
提及人工智能,相信大多数人还是一头雾水:是什么?有什么用?和我有什么关系?人工智能绝对是现代生产力变革的巨大动力,和不远的将来,和你和我都息息相关,现如今它已经在不远的将来向我们招手了。
人工智能是什么?它是计算机科学,统计学,知识工程里的传统学科在生产实践中,趋渐融合的一项综合性学科。自然啦,它就成为了一项可以综合运用的强大机器。
假如你是一名在不断重复自己工作的普通劳动者。那么人工智能将解放你的双手。同时,在人力成本不断上涨的今天,也会降低人力成本,缩减生产所需要的成本。最大的好处就是提高生产效率,从而获得最大的生产效益。在我国的东莞、深圳、浙江、江苏等城市,生产机器人都得到了最广泛的应用。
假如你是一名学生,那么人工智能的学习能力将远远超乎你的想象。我们都知道,学习是一个重复性的过程,需要坚持,最后实现输入和输出对等,才实现了学习的目的。但是相比起来,一来人们的意志力远远比不上机器的重复性运作。二来,相比起培养一个学生所需要付出的人力物力财力和时间周期,人工智能只是算法的输入和操作的输出,来的更加实惠划算。精准有针对性的算法,使其应用更加趋向于现实,更加容易变现。
假如你是文学类,艺术类的研究者,那么人工智能的思考方式将会帮你解决许多疑难。首先,人工智能是直线型思维,相比起人类的思维,将会更加迅速做出判断。其次,人工智能能排除各种环境,人为的影响,独立的做出判断,更加具有客观性。
假如你是一位创业者或是一名企业家,那么我相信人工智能绝对会是你的好伙伴。人工智能的应用将催生出许多新产业,如人脸识别,无人驾驶,AR虚拟技术。相应的人工智能也会帮助旧产业的更新换代,给予其新的动能,带动其新发展:如传统的汽车行业,在其制造中广泛应用生产机器人,在其应用中,无人驾驶则成为新的产业赢利点。
人工智能的现实应用绝对不止以上几点,更多的需要我们在生产生活中用智慧的眼睛不断去发现,用智慧的双手不断去更新。
人工智能和5G对于教育改革的意义在哪里
教育改革是一个大话题,虽然当前教育领域整合资源的能力在不断提升,但是优质的教育资源毕竟还是比较有限的,尤其是研究生教育阶段有更为明显的体现,这也导致了当前考研的竞争非常激烈。当然,除了研究生教育之外,中小学教育领域也存在教育资源分配不均的问题,这些问题在人工智能和5G时代,将有一些新的解决办法和思路。
通过人工智能和5G技术,能够在以下三个方面对于当前的教育改革形成影响:
第一:进一步扩大优质教育资源的覆盖面。5G技术的推广应用对于教育领域会产生诸多积极的影响,对于一些教育资源相对匮乏的地区来说,完全可以借助于5G技术来提升自身的教育能力,通过5G与人工智能技术的结合,能够全面提升学生的学习体验。
第二:教师岗位升级。人工智能产品的落地应用将把老师从基础性的教学工作任务当中解放出来,让老师把更多的精力放在培养学生的创新能力等更有意义的方面,这一点也是人工智能技术在教育领域应用的一个重要特点。
第三:因材施教。因材施教一直是教育领域追求的教育目标之一,但是基于当前的教育资源情况,要想真正实现因材施教是非常困难的事情,但是未来借助于人工智能技术,能够在很大程度上实现因材施教。
责任编辑:ct
《人工智能》之《计算智能》
教材:《人工智能及其应用》,蔡自兴等,2016m清华大学出版社(第5版)
参考书:
《人工智能》之《计算智能》1概述2神经计算2.1人工神经网络研究的发展2.2人工神经网络的特性2.3人工神经网络的结构2.3.1激活函数2.3.2网络结构2.4基于神经网络的知识表示和推理4遗传算法4.1遗传算法的基本机理4.1.1编码与解码4.1.2适应度函数4.1.3遗传操作4.1.4交叉操作4.1.5变异操作4.2遗传算法的求解步骤4.2.1遗传算法的特点4.2.2遗传算法的框图1概述计算智能是信息科学、生命科学、认知科学等不同学科相互交叉的产物。它主要借鉴仿生学的思想,基于人们对生物体智能机理的认识,采用数值计算的方法去模拟和实现人类的智能。
计算智能目前还没有一个统一的定义,使用较多的是美国科学家贝兹德克(J.C.Bezdek)从计算智能角度给出的定义。
贝兹德克于1994年提出,表示ABC与神经网络(NN)、模式识别(PR)和智能(I)之间的关系。
A-Artificial:人工的(非生物的)B-Biological:物理的+化学的+(?)=生物的C-Computational:数学+计算机计算智能(CI)、人工智能(AI)和生物智能(BI)的关系:
计算智能是智力的低层认知。人工智能是在计算智能基础上引入知识产生的中层认知。生物智能(人类智能)是最高层次的智能。ABC的交互关系图:
定义1:当一个系统只涉及数值(低层)数据,含有模式识别部分,不应用人工智能意义上的知识,且能够呈现出:
计算适应性;计算容错性;接近人的速度;误差率与人相近。则该系统就是计算智能系统。
定义2:当一个智能计算系统以非数值方式加上知识,即成为人工智能系统。
神经网络是一种大规模的并行分布式处理器,天然具有存储并使用经验知识的能力。它从两个方面模拟大脑:(1)网络获取的知识是通过学习来获取的;(2)内部神经元的连接强度,即突触权重,用于储存获取的知识。——西蒙·赫金(SimonHaykin)[Haykin,1994]
2神经计算2.1人工神经网络研究的发展1943年麦卡洛克和皮茨提出神经网络模型(称为MP模型)的概念。20世纪60年代威德罗和霍夫提出自适应线性元件。60年代末至80年代中期,整个神经网络研究处于低潮。20世纪80年代中后期,最流行的一种连接主义模型是分布式并行处理模型,它有3个特性:1)信息表示是分布式的(非局部的);2)记忆和知识是存储在单元之间的连接上;3)通过逐渐改变单元之间的连接强度来学习新的知识。2006-现在,Hinton提出深度学习,空前繁荣。2.2人工神经网络的特性并行分布处理非线性映射(理论上可以模拟任何函数)通过训练进行学习适应与集成硬件实现(GPU)2.3人工神经网络的结构人工神经网络是由大量的人工神经元经广泛互联所形成的一种人工网络系统,用以模拟人类神经系统的结构和功能。Perceptron感知机人工神经元模型人工神经网络
人工神经网络主要由大量的神经元以及它们之间的有向连接构成。因此考虑三方面:
神经元的激活函数:主要是指神经元输入到输出之间的映射关系,一般为非线性函数。网络的拓扑结构:不同神经元之间的连接关系。学习算法:通过训练数据来学习神经网络的参数。2.3.1激活函数性质:
连续并可导(允许少数点上不可导)的非线性函数。可导的激活函数可以直接利用数值优化的方法来学习网络参数。激活函数及其导函数要尽可能的简单,有利于提高网络计算效率。激活函数的导函数的值域要在一个合适的区间内,不能太大也不能太小,否则会影响训练的效率和稳定性。Sigmoid型函数
Sigmoid型函数是指一类S型曲线函数,为两端饱和函数。常用的Sigmoid型函数有Logistic函数和Tanh函数。
ReLU型函数ReLU(RectifiedLinearUnit,修正线性单元),也叫Rectifier函数,是目前深度神经网络中经常使用的激活函数。ReLU实际上是一个斜坡函数,定义为:
2.3.2网络结构人工神经网络由神经元模型构成,这种由许多神经元组成的信息处理网络具有并行分布结构。前馈神经网络在前馈神经网络中,各神经元分别属于不同的层。整个网络中无反馈,信号从输入层向输出层单向传播,可用一个有向无环图表示。BP网络模型误差反向传播(ErrorBackPropagation)网络通常简称为BP(BackPropagation)网络,是由美国加州大学的鲁梅尔哈特和麦克莱兰于1985年提出的一种网络模型。
BP网络的网络拓扑结构是多层前向网络,如图所示。在BP网络中,同层节点之间不存在相互连接,层与层之间多采用全互连方式,且各层的连接权值可调。BP网络实现了明斯基的多层网络的设想,是当今神经网络模型中使用最广泛的一种。
对BP网络需说明以下两点:
每个处理单元均为非线性输入/输出关系,其作用函数通常采用的是可微的Sigmoid函数,如:学习过程是由工作信号的正向传播和误差信号的反向传播组成的。正向传播:输入模式经隐层到输出层,最后形成输出模式。误差反向传播:输出层开始逐层将误差传到输入层,并修改各层连接权值,使误差信号为最小的过程。前馈神经网络的不足:
连接存在层与层之间,每层的节点之间是无连接的。输入和输出的维数都是固定的,不能任意改变。无法处理变长的序列数据。假设每次输入都是独立的,也就是说每次网络的输出只依赖于当前的输入。循环神经网络
循环神经网络通过使用带自反馈的神经元,能够处理任意长度的序列。循环神经网络比前馈神经网络更加符合生物神经网络的结构。循环神经网络已经被广泛应用在语音识别、语言模型以及自然语言生成等任务上。Hopfield网络Hopfield网络是由美国加州工学院物理学家霍普菲尔特1982年提出来的一种单层全互连的对称反馈网络模型,分为离散Hopfield网络和连续Hopfield网络。
离散Hopfield网络模型是一个离散时间系统,每个神经元只有0和1(或-1和1)两种状态,任意神经元i和j之间的连接权值为Wij。因神经元之间为对称连接,且神经元自身无连接,因此有:由该连接权值构成的连接矩阵是个零对角的对称矩阵。
离散Hopfield网络的特点:
神经元自身无连接每个神经元都与其他神经元相连每个神经元的输出都将通过突触连接权值传递给别的神经元,同时每个神经元又都接受其他神经元传来的信息,对每个神经元,其输出经过其他神经元后又有可能反馈给自己。2.4基于神经网络的知识表示和推理1.基于神经网络的知识表示
在这里,知识并不像在产生式系统中那样独立地表示为每一条规则,而是将某一问题的若干知识在同一网络中表示。例如,在有些神经网络系统中,知识是用神经网络所对应的有向权图的邻接矩阵及阈值向量表示的。
2.基于神经网络的推理
基于神经网络的推理是通过网络计算实现的。把用户提供的初始证据用作网络的输入,通过网络计算最终得到输出结果。
一般来说,正向网络推理的步骤如下:
把已知数据输入网络输入层的各个节点。利用特征函数分别计算网络中各层的输出。用阈值函数对输出层的输出进行判定,从而得到输出结果。4遗传算法遗传算法是模仿生物遗传学和自然选择机理,通过人工方式所构造的一类优化搜索算法,是对生物进化过程进行的一种数学仿真,是进化计算的最重要的形式。遗传算法为那些难以找到传统数学模型的难题指出了一个解决方法。进化计算和遗传算法借鉴了生物科学中的某些知识,也体现了人工智能这一交叉学科的特点。4.1遗传算法的基本机理遗传算法由密歇根大学的约翰·霍兰德和他的同事于二十世纪六十年代在对细胞自动机进行研究时率先提出。霍兰德的遗传算法通常称为简单遗传算法(SGA,SimpleGeneticAlgorithm)。
现以此作为讨论主要对象,加上适当的改进,来分析遗传算法的结构和机理。它包括三个部分:
编码与解码适应度函数遗传操作4.1.1编码与解码将问题结构变换为位串形式编码表示的过程叫编码;将位串形式编码表示变换为原问题结构的过程叫解码或译码。把位串形式编码表示叫染色体,有时也叫个体。遗传算法的编码方法:二进制编码、浮点数编码方法、格雷码、符号编码方法、多参数编码方法等。二进制编码
二进制编码是最常见的编码方法。二进制编码的缺点:
长度较大汉明(Hamming)悬崖:例如,7和8的二进制数分别为0111和1000,当算法从7改进到8时,就必须改变所有的位。(类似于数字逻辑编码中的毛刺)格雷编码
格雷编码是对二进制编码进行变换后所得到的一种编码方法。这种编码方法要求两个连续整数的编码之间只能有一个码位不同,其余码位都是完全相同的。它有效地解决了汉明悬崖问题,其基本原理如下:
4.1.2适应度函数体现染色体的适应能力,对问题中的每一个染色体都能进行度量的函数,叫适应度函数(fitnessfunction)在遗传算法中,一般要求适应度函数非负,并且适应度值越大越好。这样所得到的适应度函数被称为标准适应度函数Fnormal(x)。对优化问题,适应度函数就是目标函数。4.1.3遗传操作简单遗传算法的遗传操作主要有三种:
选择(selection)交叉(crossover)变异(mutation)改进的遗传算法大量扩充了遗传操作,有更高的效率。
选择操作也叫复制(reproduction)操作,根据个体的适应度函数值所度量的优劣程度决定它在下一代是被淘汰还是被遗传。
一般地说,选择将使:
适应度较大(优良)的个体有较大的存在机会适应度较小(低劣)的个体存在的机会也较小从统计角度看,个体的适应度值越大,其对应的扇区的面积越大,被选中的可能性也越大。这种方法有点类似于发放奖品使用的轮盘,并带有某种赌博的意思,因此亦被称为轮盘赌选择。
4.1.4交叉操作4.1.5变异操作4.2遗传算法的求解步骤4.2.1遗传算法的特点遗传算法是对参数集合(定义域区间)的编码而非针对参数本身进行进化;遗传算法是从问题解的编码组开始而非从单个解开始搜索;遗传算法利用目标函数的适应度这一信息而非利用导数或其它辅助信息来指导搜索;遗传算法利用选择、交叉、变异等算子进行随机操作,而不是利用确定性规则。遗传算法属于随机优化。4.2.2遗传算法的框图初始化种群计算种群上每个个体的适应度值按由个体适应度值所决定的某个规则选择将进入下一代的个体按概率pc进行交叉操作按概率pm进行变异操作若没有满足某种停止条件,则转第2步,否则进入下一步输出种群中适应度值最优的染色体作为问题的满意解或最优解GA算法的参数:
种群规模(P,populationsize):即种群中染色体个体的数目。字串长度(l,stringlength)交叉概率(pc,probabilityofcrossover):控制着交叉算子的使用频率。交叉操作可以加快收敛,使解达到最有希望的最优解区域,因此一般取较大的交叉概率,但交叉概率太高也可能导致过早收敛。变异概率(pm,probabilityofmutation):控制着变异算子的使用频率,决定了遗传算法的局部搜索能力。终止条件(terminationcriteria):1.完成预先设定的遗传代数。2.种群中的最优化个体在连续若干代后没有改变或平均适应度在连续若干代基本没有改进。沈浩:博弈论在人工智能中的应用
什么是博弈论?
所以,什么是博弈论?相信你一定接触过这个概念,但可能从没有真正深入其中。不过,现在的人工智能领域中,这是个有趣且具有启发性的主题。
让我们先给博弈论一个正式的定义。
“博弈论可以被定义为——对两个或两个以上的理性Agents或参与者之间可能的相互作用的建模。”
本文中,我们将Agent理解为一个主体(行为人)。
在博弈论中,我们必须强调“理性”这个关键词,因为它是博弈论的基础。但是“理性”究竟是什么意思?
我们可以简单的将“理性”理解为,每个主体(Agent)都知道其他主体也是理性的,并且拥有与该主体同等的理解与知识水平。
此外,“理性”也意味着,在考虑到其他主体行为前提下,该主体总倾向于得到更高的报酬或回报。
简而言之,每个主体都是自私的,并试图将回报最大化。
“我知道,你知道我知道你是理性的”(左),“是的,我知道”(右)
既然我们了解了“理性”的意义,让我们来处理一些与博弈论有关的关键词:
博弈:一般来说,博弈包括一系列的玩家、动作、策略和最终的报酬,例如拍卖、国际象棋、政治问题等等
玩家:玩家是参与博弈的理性主体。
例如,
博弈:一般来说,博弈包括一系列的玩家、动作、策略和最终的报酬,例如拍卖、国际象棋、政治问题等等
玩家:玩家是参与博弈的理性主体。
例如,
拍卖中的竞标者
玩石头剪刀布的玩家
参加选举的政治家等
拍卖中的竞标者
玩石头剪刀布的玩家
参加选举的政治家等
报酬:报酬是所有玩家在达到某种结果时的得到的回报,它可以是积极的,也可以是消极的。正如我们之前所讨论的,每个主体都是自私的,希望得到最大化的报酬:
报酬:报酬是所有玩家在达到某种结果时的得到的回报,它可以是积极的,也可以是消极的。正如我们之前所讨论的,每个主体都是自私的,希望得到最大化的报酬:
“选举中,党派得到的席位数”(左),“成功的手术台数”(中),“是否能成为族群领袖(右)”
博弈论中的纳什均衡
纳什均衡是人工智能博弈论的“基石”。纳什均衡是一个由玩家选择的行为:
“没有一个玩家愿意改变他们的行动,不使自己处于纳什均衡,意味着没有发挥到最佳状态。一旦玩家违背纳什均衡,就意味着,对方将有机会改变策略使你的收益变差。”
或可以如此理解“考虑到其他所有主体都是理性的,他们会为自己选择最佳的行动,那么达到纳什均衡的行为,对我来说就是最佳对策。”
为了了解行为中的纳什均衡,让我们来解决博弈论中最常见的问题:囚徒困境。这是一个经典的案例,它说明了在主体只关心自身利益的情况下,为了共同利益或互惠而合作行动是十分困难的。
在这个案例中,存在两个犯人,Alan和Ben,他们因同一罪行而被捕,并被关押在两个不同的审讯室。他们有两个选择:
保持沉默
承认罪行
假设他们都做出了选择,那么,就会产生4种不同的结果:
·{沉默,沉默}
·{承认,沉默}
·{沉默,承认}
·{承认,承认}
这四种结果可以很方便地用博弈矩阵来表示:
在这种表示中,收益以(Alan收益,Ben收益)的形式表示。我们以列表示Alan的选择,行表示Ben的选择。
他们的选择都将导致负收益,因为根据选择,他们将被监禁的时间是预先确定的(尽管不是他们所希望的)。
结果收益如下:
如果他们都保持沉默,则都将被监禁1年
如果其中一人承认罪行,而另一人沉默,则坦白者将被释放,而另一人将被判处15年监禁
如果两人都承认罪行,则他们都将被判处10年监禁
这个困境来源于两个囚犯都不清楚另一人的选择,那么在这个情况下,什么样的行动将达到纳什均衡?理想状况下,两个犯人将合作保持沉默。(红框中的选择)
但我们也知道,犯人一定希望自己被判处最少的监禁时间,以得到最大利益。因此,在即使保持沉默,也将被判处1年监禁的情况下,实际上会发生的将可能是:
如果Ben承认了罪行,那么坦白是更好的选择(10年监禁好于15年监禁);同时,如果Ben保持沉默,那么坦白同样是最好的选择(释放好于1年监禁)
我们可以看到,这个博弈矩阵与Alan所想的完美契合。那么,如果Ben如果也在进行博弈选择,他的博弈矩阵将是:
让我们假设Ben也像Alan一样经历了理性的思考过程。那么同样的,Ben将得到相似结论——无论Alan怎样选择,他总可以从坦白中受益。如果我们将两个囚犯的理性思考一起考虑,结果将是:
以结果来说,最好的对策是{承认,承认}。即使他们中的任何一个不采取这个行为,他们也只会得到比这个策略更糟糕的结果。因此,{承认,承认}是一个纳什均衡。
“因为都承认了罪行,我们要在监狱10年。如果我们没承认,就只需要1年”。
“是的!但如果我不承认,你一样会为了不去监狱而承认。那么我就要去监狱15年。我很庆幸我承认了。”
很有道理,对吧?对于纳什均衡来说,我们可以得到:对于任何博弈,它都是一个“无悔”的解决方案,但却并不一定是最理想的。
博弈的种类
我们刚刚看到的是囚徒困境的一个例子,两个囚犯必须同时做出一个决定,用博弈矩阵的形式来表示。这些类型的博弈通常被称为“标准式博弈”。
在博弈论中,根据不同的标准,博弈可以分为许多不同的种类。
1.主体之间的交互
直观上,我们可以根据博弈中的主体是以竞争还是合作为目标来区分博弈的种类。
政治竞选是竞争博弈的好例子,一个候选人的报酬就意味着另一个候选人的失败。另一方面,篮球比赛可以被看作是一场合作博弈,每个运动员彼此合作以赢得更多的回报。
2.主体是如何运作的
我们也可以根据博弈的同时性和扩展性来进行分类。
为了理解这一点,我们可以以一个叫做“性别之战”的问题为例。
假设Bob和Amy是两个十分要好的朋友。他们很清楚彼此的爱好,足球和舞会。他们可以一起商量这个周末的游玩计划,或者给对方一个惊喜。如果他们都计划给对方惊喜,那么他们就不会知道对方的周末计划。以下博弈矩阵描述了4中不同的情况。
博弈矩阵清楚地表示,如果Bob和Amy没有成功碰面,那么他们都不会得到回报。这是一个同时性的博弈案例,在这个博弈中,两个玩家同时行动,并且事先不知道其他玩家的行动。
另一方面,如果他们告诉对方各自的计划来进行行动,博弈将成为以下形式:
我做出最初的决定,因此我的决定节点在树顶。我可以在足球(左枝)和舞会(右枝)之间选择”。
“我有两个选择节点。但是一旦Amy告诉了我她的选择,那么将只有一个节点与我相关。如果她选择了舞会,那么我就会在该选择节点进行选择。”
这是一个扩展型博弈或“回合制博弈”的案例。在这种博弈中,每个玩家都可以看到对方的行动。
另一个更直观的例子,石头剪刀布游戏就是同时型博弈。另一方面,井字游戏就是扩展型博弈。
3.基于信息的分类
在博弈论中,参与者往往不能得到完全的信息。他们可能不知道其他玩家的所有可能决策或潜在收益。玩家也可能不知道他们在和什么样的人打交道,或者他们的动机是什么。
根据对其他主体的了解程度,博弈可以大致分为三类:
·完美信息博弈
·不完美信息博弈
·不完全信息博弈
完美信息博弈:(下左)
在完美信息情况下,每个主体都知道:
·其他主体可以采取的所有可能行为
·他们正在进行的行为
·他们得到多少回报
井字游戏和国际象棋就是最好的例子。当涉及到现世界时,完美信息博弈是非常罕见的。此外,机器学习和深度学习方法在这种博弈中表现出色。
不完美信息博弈:(上右)
在这种情况下,主体知道其他主体的性质和动机,以及在所有可能结果中会得到的回报。但不知道其他主体正在进行的行为。
这里,将军知道每一种可能情况下敌人的动机和回报。但是他无法知道敌人藏在哪里。因此,将军不知道他所在的确切决策节点(虚线框)。不完美信息博弈在现实世界中经常出现。
不完全信息博弈:
不完全信息是一种非常接近真实世界的模型。主体没有关于其他主体的“类型”信息。即使任意特定主体能够知道其他主体采取的行动,他也不知道其他主体的动机,或采取这种行动的回报。
本质上,不完全信息博弈是最广义的博弈形式。
扑克游戏是不完全信息博弈的一个典型案例,因为玩家不知道对手手中的牌是好是坏。
我们特别关注扑克游戏中的博弈,因为它不完全信息的性质很好地代表了真实世界。因此,不完全信息博弈问题一直被认为是人工智能领域的一个基准问题。
人工智能中的博弈论
那么,以上的一切在人工智能的背景下意味着什么。这些不同类型的博弈和信息与人工智能有什么关系呢?
就人工智能而言,博弈论的基本作用是帮助决策。考虑到“理性”是博弈论的基础这一事实,这并不是很难理解。实际上,博弈论已经开始在人工智能领域占据一席之地。
生成对抗网络(GANs)就是这样的一个重要应用。GANs被YannLeCun认为是:“过去20年中机器学习领域最酷的想法。”(YannLeCun是人工智能和深度学习领域的领头人之一)。那么博弈论在GANs中是如何起作用的呢?
为了回答这个问题,我们首先要了解GANs的基础知识。一个GAN就是两个神经网络的组合,即:
·生成器
·鉴别器
生成器是一个产生随机图像的神经网络。另一方面,鉴别器将试图对生成的随机图像进行分类——应属于给出的数据集?或只是一个生成的假图像。
如果鉴别器将生成的图像分类为假图像,那么生成器将调整其参数;另一方面,如果鉴别器将生成的图像分类为来自数据集,那么鉴别器将调整其参数。
这种竞争过程将一直进行,并持续到无法再改进的状态。这个状态就是“纳什均衡”。从本质上讲,这是两个神经网络之间的竞争博弈,但在竞争中,它们不断的优化自己以得到纳什均衡状态。
博弈论的核心应用是不完美信息博弈。扑克游戏是一个经典的例子,也是人工智能应用在不完美信息状态下的基准问题。
在现实世界中,不完美信息是非常重要的。但至今为止,机器学习和深度学习在不完美信息博弈方面的成功十分有限。
德州扑克无限制版就是一个不完美信息博弈的案例,因为其他玩家隐藏了所持牌的信息。考虑到这个扑克游戏中,所持牌有10的161次方种可能,而可观测宇宙中的总原子数也只是10的82次方,可见这是一个非常具有挑战性的问题。
因此,使用暴力方法对这个游戏进行建模是完全不可能的。当然,也有人尝试过使用深度学习和深度强化学习,但到目前为止知识效果平平。
但是由卡内基梅隆大学的教授TuomasSandholm和人工智能研究员NoamBrown开发的,名为Libratus的人工智能程序表现优于以前的任何方法。在超过20000手扑克牌中,Libratus战胜了世界冠军。Libratus的神奇之处在于它不使用任何机器学习的方法!
博弈论就是Libratus的核心思想。与深度学习和强化学习等相比,它并不需要极高的计算能力。为了更多地了解博弈论是如何应用到Libratus中的,以及博弈论在未来人工智能中的引用。
另一方面,人们经常争论机器学习和深度学习是否可以用于现实中的案例,因为现实世界中的案例往往是是不完全信息博弈,大多数机器学习和深度学习方法都会遇到很大困难。
博弈论方法方法由于其在现实世界中的普遍性而逐渐得势。最好的例子就是“AIForSocialGood”项目的负责人MilindTambe所做的工作——利用博弈论概念处理现实世界中的问题,比如:
·公共安全
·野生动物保护
·公共卫生等
博弈论小测验
本文详细讨论了博弈论。就让我们以一个快速的突击测验来结束吧!
在0-100之间随机选择一个数字。如果你给出的数字是这次测验中所有玩家给出的数字平均值的三分之二,那么你就将获胜。(提示:你应该考虑其他玩家也和你一样理性)
你能回答这个问题吗?
结语
在这篇文章中,我们讨论了博弈论的基本原理,并简要地涵盖了必要的主题。我们甚至谈到了博弈论是如何被应用到机器学习领域的,以及它在现实世界中的应用。但这只是一篇介绍性的文章——在以后的文章中,我们将更深入地探讨博弈论,以及如何将其应用到人工智能领域,并从技术角度进行阐述。
注:大部分图片来自伊万帕斯汀的《介绍博弈论》一书。
本文来源:人工智能学家
C2
连云港
南京
武汉
西安
北京
北京
北京返回搜狐,查看更多