人工智能在麻将领域能够战胜人类吗
而牌类的获胜策略在于尽可能增大自己的得分期望(EV)。我并不知道我接下来要摸什么牌,或我的对手有什么牌,但所有可能的情形组成一个概率空间,我只需做出一个选择,使得自己的得分函数的期望最大。牌类策略的难点在于,影响这一概率空间的因素过多,且具体影响很难确定,比如对手打牌的习惯。
※下图选自《科学化麻雀》,闲家愚形听牌打10%危险度的牌对攻,x轴为自己和牌时得分,y轴为牌局巡次,z轴为自己的得分期望。
二.何谓「获胜」?
选手的竞技水平如何衡量?麻将是否是「运七技三」的游戏?其实无论围棋还是麻将,区分选手的竞技水平都不可能只靠一局,就好比AlphaGo和李世乭要进行五番棋对决,AlphaGo赢第一盘时大家并不觉得AlphaGo一定比李世乭强一样。围棋有三番、五番、十番棋,对于竞技麻将(国标麻将、日本麻将)而言,区分顶尖选手的竞技水平至少需要2000~10000手牌(如果采用类似桥牌的复式赛制,这一数字会大幅降低)。
至于衡量一个竞技项目的竞技性,单纯用运气所占比例是没有意义的。随着对局数的增大,运气所占比例会越来越小,选手的长期成绩必然会向其真实水平收敛。一个竞技项目的竞技性应当用「区分选手竞技水平所需必要对局时间」来衡量。比如围棋需要三番棋,麻将需要2000手牌,围棋一盘平均需要4小时,三番棋约12小时,而麻将一手牌约3分钟(网络对局),2000手牌约100小时。麻将相比围棋有运气成分,并不意味着麻将选手的竞技水平无法衡量,而意味着麻将需要更多的对局时间来区分选手的竞技水平。
下图选自日本麻将平台天凤麻雀凤凰桌1000场以上玩家安定段位排行。这里的「试合」是指半庄,也就是两圈牌,考虑到连庄,平均一试合是10手牌,1000试合是10000手牌。可以看到牌手的竞技水平得到了很显著的区分,结果也与麻将圈内认知相似。
所以在这个问题下我们讨论麻将AI能否战胜人类,指的是麻将AI长期成绩(10000手牌以上)能否比人类更好,并不是单指一手牌。只打一手牌,谁都有可能和牌,这是牌类游戏的本质所决定的。
当然,这里也不考虑牌手或AI作弊的问题。如果通过作弊获得别人手牌的非法信息,麻将的竞技平衡就完全被打破了。再强的麻将AI成绩也不可能比作弊的人类好,反之亦然。事实上,现在很多单机麻将游戏的AI就是通过作弊来增加「智能」的。
三.麻将会成为人类面对人工智能的「最后壁垒」吗?
一言以蔽之,麻将AI不是做不了,而是没人做。之所以目前还没有能够战胜人类的麻将AI,主要原因还是人们在麻将AI研究方面的投入不够。目前的麻将AI基本都是麻将游戏制作团队为麻将游戏设计的,在单机上就可以运行,强度自然有限。如果像AlphaGo一样,世界顶级团队制作,背后庞大资金支持,使用1000个CPU运行,想要设计一个轻易战胜人类顶尖麻将牌手的AI没有任何难度。
首先,麻将的复杂度要远远小于围棋。单就自己的14张手牌来说(总牌数136张),组合共有326520504500种(计算方法详见),远远小于围棋的2.08×10^170。不足10^12的手牌种类意味着麻将AI完全可以提前计算好每手牌的打法估值并储存在资料库中,打牌时调用即可。
※下图选自日本麻将研究者らすかる的个人网站。
当然,打麻将也要考虑别人打的牌以及各家的得分。各家分差的复杂度是很小的,而别人打的牌虽然复杂度会很高(136张牌的牌墙组合为4.3×10^185种,甚至超越了围棋的复杂度),但别人打的10张牌大多只有1~2张是有用的信息,AI只需要识别这种模式并搜索对比以往对局的牌谱即可。
其次,人类对麻将的研究远不及围棋,顶尖麻将牌手的训练水平很低。相比围棋研究几千年的历史,麻将诞生不过百余年,人们真正开始利用科学手段(统计学、大数据)来研究麻将只是近十年刚刚起步。例如「间四间」是上世纪流行的日本麻将理论,指的是别人打过中间相隔4张的2张同花色数牌,则这2张牌的内侧筋牌是危险牌。如别人打过三筒、八筒(中间相隔四五六七筒),则四七筒是危险牌,这是因为别人手里一开始可能是三五六八筒,三八筒效率较低被打掉,留下的五六筒要四七筒。这一理论在近十年的大数据研究中已被证明是完全错误的——别人要四七筒的概率并没有显著性的上升。
可见,目前人们对麻将的研究还处在很初级的阶段,通过别人打过的牌来分析别人想要的牌的科学研究才刚刚开始。麻将界也没有围棋那样3岁开始学棋,10几岁就和世界顶级高手过招,接受世界顶级指导的职业选手。麻将本身复杂度低,人类顶尖牌手水平又不高,被人工智能击败会比围棋要容易得多,不可能是「最后壁垒」。
四.现在有哪些比较强的麻将AI?
竞技麻将方面,目前国标麻将和日本麻将都有比较强的AI(高于人类平均水平)。日本麻将的AI目前最强的当然是「爆打」。
「爆打」是由东京大学工学系在读博士生水上直纪开发的日本麻将AI,他所在的课题组就是专门研究麻将AI的。爆打和AlphaGo一样,也具有自我对局和分析并学习人类牌谱的能力。水上发表过的论文题目为《RealizingaFour-PlayerComputerMahjongProgrambySupervisedLearningwithIsolatedMulti-PlayerAspects》。
爆打从2015年开始在最大的日本麻将平台——天凤麻雀上开始运行,至2016年2月已经打了1.3万多场(约13万手牌)。2015年9月,爆打达到天凤麻雀四段,2015年12月更是一度冲进天凤七段,长期成绩显示平均为六段以上。这意味着什么呢?
上图是天凤麻雀平台2016年3月13日的段位成绩分布图(来源)。天凤平台具有非常科学的段位和EloRating体系,越是和高水平牌手对局,获胜后Rate增加越多,失败后Rate减少越少;越是和低水平牌手对局,获胜后Rate增加越少,失败后Rate减少越多。最终段位和Rate值的稳定值就代表了牌手的真实实力。
可以看到,天凤麻雀平台的活跃用户数约为17万人(不包括新人僵尸号),而六段以上的用户总数为5793人,约占3.4%。也就是说,爆打打麻将比96.6%的麻将玩家要好,全世界麻将打得比爆打好的人,数量仅有几万人左右(包含所有麻将规则的估算)。这只是一个课题组,用时一年多研究出的,在一台电脑上运行的麻将AI,就已经基本赶上AlphaGo早期版本所取得的成绩了。
国标麻将方面,目前最强的AI大概是我本人目前正在参与设计的国标麻将AI了。最初的版本只加入了最常用的十几个番种的分值判断,防守端几乎没有做,实测对随机牌手和牌率就已经达到24%左右,基本与国标麻将平均和牌率24.3%持平(国标麻将数据可见)。实际水平大概处在所有牌手中上位10~20%左右的水平(低段位牌手多,大部分牌手的水平处在平均以下)。
五.麻将AI的算法应该是什么样子的?
最后,我来浅谈一下麻将AI的基本算法。
1.基础牌效率
麻将的牌效率指的是能使手牌更快和牌的打牌方法,是麻将的基本功。来简单举个例子:
※下图牌画取自联众国标麻将。
这是一手13张牌的手牌,现阶段是一上听(差1张牌就可以听牌),那么哪些牌是有用的牌,或者说我摸到哪些牌会留下呢?这些有用的牌称为「有效牌」,最有用的当然是能让我直接听牌的牌,这类牌称为「第一类有效牌」。
●第一类有效牌:能使手牌向和牌前进一步(上听数降低)的牌,包括:
除了第一类有效牌,有用的牌还有以下这些:
●第二类有效牌:不能使上听数降低,但能使第一类有效牌增多的牌,包括:
比如摸到九索,一般情况下应该选择留下九索打掉三索,因为第一类有效牌变多了:
※计算采用天凤牌理。
●第三类有效牌:不能使上听数降低,也不能使第一类有效牌增多,但能使第二类有效牌增多的牌,包括:
比如摸到五索,一般情况下应该选择留下三五索拆掉八九索,虽然第一类有效牌张数没变,但三五索相比八九索多了1种第二类有效牌——六索(原是第三类有效牌)。
(也许看到这里,你有点算不过来,或者感觉这和你平时打的麻将压根不是一个游戏。没关系,这很正常,你可以找张纸,在纸上仔细算一下每种第二类有效牌都新增了哪些第一类有效牌。)
可见,对于一开始一上听的13张手牌而言,除了七八九筒外的所有数牌都是有用的牌。麻将的牌效率就是这样——不断通过有效牌增大自己的进张面,最终使得和牌的概率越来越大。也许你已经发现,麻将牌效率的本质就是一个搜索树,最开始的手牌
经过多轮选择后可能对应多种结局(和牌),例如:
①
路径:摸到第一类有效牌八万或七索听牌,再自摸另一张和牌(最大概率结局)。
②
路径:先摸到第二类有效牌一万或七万后打掉三索,然后摸到一万或七万的另一张听七索,或者摸到七索选择听一万和七万对倒和牌。
③
路径:先摸到第三类有效牌三筒后打掉三索,然后摸到四筒后拆掉八九索,之后和牌。
对于一个两上听以内的手牌来说,这个树的深度最多也就是4~5步,每一步的分支平均在15种左右,也就是说复杂度最多在10^5数量级。由于每条路径都对应着一个确定的概率,一个好的麻将AI完全可以做到遍历这个树,比较两种或更多种打牌选择之间所对应结局的和牌期望之和。
对于三上听以外的手牌(由上文图中可知三上听以外的手牌约占手牌所有组合的80%),由于手牌中会存在大量的孤张或简单搭子,只需单独比较孤张或简单搭子的效率即可,计算量更小。
除了上述穷举手牌搜索树的方法,还可以采用模拟的方法。比如让麻将AI在短时间内模拟两种打法各1000手牌,哪个和牌率更高就选哪种打法。虽然这样不太精确但已经足够保证比人要强了。
2.和牌限制与番数价值
很多麻将规则对和牌有限制,比如国标麻将必须八番起和,四川麻将必须缺一门,太原麻将和牌必须包含指定牌张等等。我们只需在上述基础牌效率算法搜索树的基础上,「砍掉」那些结局不符合要求的分支即可。
有些时候我们不仅关注和牌的概率,也关注和牌的大小,比如有些牌我们宁可损失一些进张也想去做清一色,追求更高的和牌得分。我们只需为树的所有结果赋值(和牌得分),并用结局对应的值与路径对应的概率求出不同打法的得分期望并进行比较。
3.副露判断
「这个牌该不该碰」似乎是打麻将时比较令人头疼的问题。但其实副露判断只是计算量大,并不需要特殊的算法,依然是对比碰与不碰两种选择所对应的所有结局的得分期望即可。日本麻将中的立直(报听)判断也是同理。
只不过当我们在考虑「打哪张好」的时候,两种打牌选择之间所对应的路径和结局有大部分都是重合的;而我们在考虑「该不该碰」的时候,两种选择所对应的路径和结局基本是完全不同的,这无形中增大了计算量。其实人脑在做蒙特卡洛树搜索时,比较容易做到「想得很深」,比如职业棋手可以提前算到20甚至30步棋;但难以做到「想得很广」,通常情况下大脑只能做到从两种选择中找几个概率较大、有代表性的结局样本做比较。所以副露判断显得难,其实只是计算量的问题,而对于麻将AI来说,这不是问题。
4.防守端
防守端需要解决的是攻守判断和防守打法两个问题,即「什么时候要防守」和「要防守应该打什么」。解决这些问题最好的方法是让麻将AI自己通过大量的牌谱(千万场量级)进行自我学习。正如前文我所提到的,其实人们对于麻将应该如何科学防守的研究也才刚刚开始,想要分析一个打过三筒和八筒的人真正需要的是几筒,需要大量的牌谱作为样本进行研究。这部分研究现在还要等待电脑去完成,未来的麻将AI在这方面要比人类做得更好可以说是必然的。
对大量牌谱所做的出牌模式研究还可反过来应用于牌效率算法的改进中。比如早巡打过八万的人手牌中有九万的概率较小,那么牌墙中剩余九万的概率就有所上升,牌效率中利用九万的路径的概率就可以做出相应的修正。
5.状况判断
状况判断指的是麻将的「大局观」,如为了争取第一名或者为了规避第四名而采取不同的策略。状况判断其实就是对得分期望做进一步的修正。比如某状况下我必须自摸13番牌才能逆转,那么最终结果是13番以下的牌的得分期望可以进一步降低,而13番及以上的牌的得分期望则可以提高。
总之,麻将的复杂度较低,算法上可以用搜索树穷举法以及大量牌谱的自我学习来解决,只要有大量牌谱资料,有人肯花时间,有人愿意出资,开发一个能胜过人类的麻将AI,非常容易。
——准备跑题的分割线——
最后的最后我想说,同为智力运动,相比棋类,人们对牌类的研究真的是太少了。虽然牌类的竞技性(区分选手竞技水平的必要对局时间)要普遍弱于棋类,但牌类也有其独特的策略与魅力。诚然,人们普遍对牌类项目有着各种各样的偏见与误解,比如认为牌类是纯运气项目,比如说起牌类就联系到赌博……也正由于此,牌类项目的规范化、竞技化、运动化才显得尤为迫切与重要。
我希望有朝一日,麻将、斗地主这些项目能够获得与桥牌同样的地位与发展空间。我希望未来的孩子们既可以选择学习围棋,也可以选择学习麻将。我正走在追寻理想的道路上,而且我坚信理想并不遥远:。
麻省理工科技评论倾力推荐:首部中文图书《五十大突破技术》深度剖析版
本书将收集2012年——2016年的五十大突破性技术,并邀请国内外技术专家对每项技术的应用、未来发展及投资潜力进行点评。我们还会为参与众筹者建微信群,随时更新最新进展和进行交流,并希望将这些微信群逐步打造成成高品质的创新科技社群。众筹设置了三档可以选择,包括下面这些回报:
麻省理工科技评论《五十大突破技术》深度剖析版;麻省理工科技评论定制(科技英文格言版)T-Shirt;麻省理工科技评论全年英文版杂志(6期),喜欢看原版杂志的一定不能错过;MITTR中国会员微信交流群名额,与志同道合的小伙伴一起交流,甚至还可能认识科技大牛;全球顶尖企业家、学者CocktailParty聚会;麻省理工科技评论,全球所有会议活动VIP门票;免费参加MITTR中国年会。
地址请戳”阅读原文“。
↙↙↙返回搜狐,查看更多
IJCAI 2023 麻将人工智能比赛
比赛介绍欢迎来到IJCAI2022麻将人工智能比赛。在本次比赛中,你将在在线人工智能平台Botzone上开发一个能够与其他人工智能和人类玩家比赛的麻将人工智能。本次比赛中采用《中国麻将竞赛规则》,即俗称的国标麻将。我们为国标麻将初学者提供了样例程序和比赛使用的国标麻将裁判程序,方便你学习国标麻将的规则并调试你的程序。最终比赛的胜者经由两轮正式的竞赛角逐诞生。
点击观看比赛精彩回放!麻将是一款起源于中国、拥有超过3000年历史的四人不完全信息博弈游戏。1998年,中国国家体育总局制定了《中国麻将竞赛规则》(俗称国标麻将),也就是本次比赛中我们采用的规则。麻将既需要玩家的运筹帷幄,也需要玩家的运气相助,而这带来的不确定性也为麻将带来了更多的乐趣与挑战。与其他亚洲麻将不同(如日式麻将),国标麻将鼓励玩家使用更加激进的策略进行游戏,使得国标麻将比赛更具有吸引力与观赏性。
国标麻将需要玩家不断的根据手牌情况计算并选择可行的胡牌组合,选择每次打出的麻将牌。如果想在本次国标麻将比赛中崭露头角,参赛者可以尝试结合多种人工智能领域的方法,如规划、博弈论、启发式搜索、蒙特卡洛树搜索、对手建模和机器学习等——这也是当下人工智能领域最大的挑战之一。
赛制伪码公布点击查看大图立即参加比赛注册所有参赛者需要以队伍的形式注册,每支队伍只需要注册一次。点击此处注册Botzone。注册位于页面右上方。点击此处注册比赛小组。会议注册进入到决赛轮的参赛者需要注册IJCAI-ECAI2022。每名参赛者至多属于一支参赛队伍。点击进入比赛小组查看报名情况立即开始点击此处查看如何使用Botzone参加IJCAI2022麻将人工智能比赛。下载样例程序并提交,创建你的第一个麻将Bot!通过wiki中的麻将条目了解麻将基本规则以及提交程序的详细输入输出格式。常见问题想变得更强?通过官方手册详细学习国标麻将的规则。本次比赛使用的国标麻将裁判程序和国标麻将算番库已开源,可供比赛选手参考和使用。我们提供了强AI的对局数据,供比赛选手使用。赛程安排注册截止时间:2022年5月21日(北京时间)第0轮(模拟赛):2022年3月14日~2022年5月21日(北京时间)每周举行模拟赛,帮助参赛者熟悉平台的使用方法、国标麻将的游戏规则和本次比赛的赛制模拟赛的积分将不会计入比赛的成绩第1轮(积分赛):2022年5月22日(北京时间)积分赛使用瑞士轮及复式赛制,比赛进行128轮瑞士轮第1轮成绩前16名的队伍进入第2轮(决赛)赛制说明详见上方最迟在2022年5月29日公布第1轮最终成绩及邮件通知第2轮(决赛):2022年7月3日(北京时间)决赛使用瑞士轮及复式赛制决赛分为两阶段,共有16支队伍进入决赛第一阶段:16支队伍进行128轮瑞士轮,每轮瑞士轮均为复式赛,16支队伍被匹配成4组,每组匹配到的4位选手进行24盘对局(座次全排列)第二阶段:第一阶段中的前四名进入冠军争夺战。共进行512轮复式赛,每轮进行24盘对局(注:原定256轮,在决赛第一阶段后注意到比分接近,因此修改为512轮)决赛结果将于IJCAI会场公布第一阶段与第二阶段之间将不能修改代码注:复式赛制详情请参考Botzone维基。初赛结果公示以下是积分赛晋级的十六强队伍。根据代码检查及人工确认,已去除代码重复/具有小号行为的队伍。
排名队伍名账号排名分1ALONGyue353.00292Joeytribbiani337.00093菜鸡互助intellouis336.00124Suphxnamespace_bilibili334.00025每日坚果MCC_gameAI333.00306XYZTONY333.00267随机出牌样例zbww333.00198随机出牌样例程序Solitude21332.00089麻神理工metaphysics330.002110e史蒂夫胜多负少分dark329.000811放铳自动机TokisakiKurumi328.002212重在参与Louison327.002413缘督以为经zhmomo327.000514Hayasakallkkcc326.001415humanfyhumanfy325.999716pandaorangedavis0520324.0003决赛第一阶段结果公示以下是十六强队伍在决赛第一阶段中的结果表现。
排名队伍名账号排名分1Hayasakallkkcc345.00252缘督以为经zhmomo339.00293菜鸡互助intellouis338.00364随机出牌样例zbww337.00195ALONGyue336.00156e史蒂夫胜多负少分dark332.00207随机出牌样例程序Solitude21332.00078重在参与Louison331.00269XYZTONY331.002610Joeytribbiani330.003711每日坚果MCC_gameAI330.002512放铳自动机TokisakiKurumi330.001313麻神理工metaphysics329.001014Suphxnamespace_bilibili327.003715humanfyhumanfy325.002016pandaorangedavis0520弃权决赛第二阶段结果公示以下是决赛第一阶段的前四名在决赛第二阶段中的结果表现。
排名队伍名账号排名分1随机出牌样例zbww1345.00132Hayasakallkkcc1301.00043菜鸡互助intellouis1238.99934缘督以为经zhmomo1234.9990研讨会资料排名队伍名账号视频1随机出牌样例zbww点击下载2Hayasakallkkcc点击下载3菜鸡互助intellouis点击下载4缘督以为经zhmomo点击下载5ALONGyue6e史蒂夫胜多负少分dark点击下载7随机出牌样例程序Solitude21点击下载8重在参与Louison点击下载9XYZTONY点击下载10Joeytribbiani点击下载11每日坚果MCC_gameAI点击下载12放铳自动机TokisakiKurumi点击下载13麻神理工metaphysics点击下载14Suphxnamespace_bilibili15humanfyhumanfy点击下载16pandaorangedavis0520点击下载权威评审李文新北京大学教授邓小铁北京大学教授杨耀东北京大学助理教授张国川浙江大学教授高阳南京大学教授张海峰伦敦大学学院研究助理李文龙国际麻将联盟秘书长陈御天GoogleDeepMind研究科学家郑蓝舟微智娱CTO傅浩波腾讯游戏AI专家研究员相关资源麻将人工智能和Botzone平台的相关工作:
Zhou,Haoyu,etal."Botzone:anonlinemulti-agentcompetitiveplatformforAIeducation." Proceedingsofthe23rdAnnualACMConferenceonInnovationandTechnologyinComputerScienceEducation.2018.Zhou,Haoyu,etal."Botzone:acompetitiveandinteractiveplatformforgameaieducation." ProceedingsoftheACMTuring50thCelebrationConference-China.2017.Zhang,Haifeng,etal."Botzone:Agameplayingsystemforartificialintelligenceeducation." ProceedingsoftheInternationalConferenceonFrontiersinEducation:ComputerScienceandComputerEngineering(FECS).TheSteeringCommitteeofTheWorldCongressinComputerScience,ComputerEngineeringandAppliedComputing(WorldComp),2012.Li,Wenxin,etal."TeachingAIAlgorithmswithGamesIncludingMahjongandFightTheLandlordontheBotzoneOnlinePlatform." ProceedingsoftheACMConferenceonGlobalComputingEducation.2019.联系我们李文新(联合主席)lwx@pku.edu.cn张海峰(联合主席)haifeng.zhang@pku.edu.cn鲁云龙botzone@126.com主办单位北京大学信息科学技术学院计算机科学技术系网络与信息系统研究所人工智能研究室由李文新教授负责,主要致力于游戏中的人工智能研究,其他研究方向主要包括:计算机教育、生物特征识别。微智娱(北京)科技有限公司是一家专注于人工智能研发与游戏行业应用的公司。公司在互联网棋牌类游戏智能机器人领域技术水平、行业占有率领先。公司目前有30+人的技术团队,且核心成员均来自清华北大等著名高校,同时公司和清华大学、北京大学、北京信息科技大学、中科院等科研机构长期开展科研合作,研究前沿人工智能技术。赞助商创优天地是由中国互联网精英们一起创建的人工智能网络游戏公司,致力于将人工智能技术与游戏相结合,打造出有别于传统模式的网络游戏,让玩家在游玩的同时,获得由人工智能技术带来的全新体验。指导机构国际麻将联盟(MahjongInternationalLeague,简称MIL)是在世界智力运动最高管理机构IMSA(国际智力运动联盟)支持下成立的全球性麻将组织,会员包括来自全球五大洲52个国家和地区的正式麻将协会。MIL秉承智力运动理念,推动全球麻将规范化、竞技化、运动化发展,推动麻将进入智运会和奥运会。MIL在麻将竞技赛事中,创新地使用复式赛制,有效地降低了传统麻将项目中的因手牌随机性带来的运气成分,这符合国际竞技体育运动发展所要求的公平博弈的智力运动特征,将传统用于休闲娱乐的麻将活动提升到了竞技体育运动层面。过往比赛第十三届北京大学游戏对抗赛-校内赛.2021年春.游戏:叫分斗地主FightTheLandlord2IJCAI2020麻将人工智能比赛.2020年.游戏:国标麻将Chinese-Standard-Mahjong第十二届北京大学游戏对抗赛-校内赛.2020年春.游戏:国标麻将Chinese-Standard-Mahjong第十一届北京大学游戏对抗赛-校内赛.2019年春.游戏:坦克大战改Tank2第四届北京大学游戏对抗邀请赛.2018年秋.游戏:坦克大战Tank第十届北京大学游戏对抗赛-校内赛.2018年春.游戏:斗地主FightTheLandlord第三届北京大学游戏对抗邀请赛.2017年秋.游戏:俄罗斯方块改Tetris2第九届北京大学游戏对抗赛-校内赛.2017年春.游戏:俄罗斯方块Tetris第二届北京大学游戏对抗邀请赛.2016年秋.游戏:吃豆人改PacMan2第八届北京大学游戏对抗赛-校内赛.2016年春.游戏:吃豆人PacMan第一届北京大学游戏对抗邀请赛.2015年秋.游戏:贪吃蛇Snake第七届北京大学游戏对抗赛-校内赛.2015年春.游戏:贪吃蛇SnakeNOI2014团体赛.2014年夏.游戏:麻将(旧)Mahjong德州扑克也被人工智能攻克了,下一个会是麻将吗
德州扑克也被人工智能攻克了,下一个会是麻将吗?2017年02月01日15:45来源:每日经济新闻
用微信扫描二维码
人参与评论斗地主、桥牌、德州扑克……在未来我们都有希望看到这些项目对应的“最强AI”,永远能找到最优解的AI出现。这是我们要探究这个世界上一切未知事物的动力,包括却不限于,创造一个永远可以找到最优解的,麻将AI。
原标题:围棋之后,德州扑克也被人工智能攻克了!下一个会是麻将吗?
你有没有想过,未来某一天,称霸各种竞技、棋牌游戏的都不再是人类,而是AI(人工智能)?
据科技网站TechRepublic报道,虽说位于匹兹堡的河流赌场与“科技突破”有些不搭,但本周二(1月31日),它确实见证了卡耐基梅隆大学的AI系统Libratus将4位德州扑克顶级选手斩落马下。
“我真的觉得它在钻我空子”
据凤凰科技报道,Libratus是卡耐基梅隆大学计算机科学教授尚德洪姆与博士生布朗共同打造的,在为期20天的赛程中,它们一共进行了12万手牌的比赛,最终Libratus战胜了四位人类顶尖高手。
“这是AI开辟的新疆界,”尚德洪姆在赛后的新闻发布会上说道。“也是AI在游戏比赛中获得的里程碑式突破。”
▲图片来源:卡耐基梅隆大学
Libratus的成功主要在于不断学习,每结束一天的比赛,它都能学到人类牌手的技巧并有所提升。“每天比赛结束后,Libratus内置的原算法就会分析对手的漏洞和技巧,并将其融入到Libratus未来的牌路之中。”尚德洪姆说道。
而Libratus的方式与此前人机扑克大赛的思路有所不同,此前研究人员主要寻找对手的破绽并针对相应破绽进行各个击破。Libratus则正相反,它寻找破绽的目的是要补漏,防止自己也出现同样的破绽。
1月30日傍晚,完成了3万手比赛的JimmyChou就曾筋疲力尽地告诉媒体,“这太难了。它(Libratus)不仅不留空子给我钻,而且我真的觉得它在钻我空子”。
在现实生活中或许比AlphaGo更有用
Libratus的胜利是AI逐步统治棋牌类游戏的又一里程碑,1997年时IBM的深蓝电脑在国际象棋比赛中击败世界冠军卡斯帕罗夫,去年AlphaGo则成功在围棋比赛中摘冠,而此前这项运动被认为是直觉的游戏。与深蓝电脑纯靠计算能力有所不同的是,AlphaGo拥有强化学习的能力。
Libratus的胜利还象征着AI的另一个巨大突破,因为德州扑克与围棋预设的挑战不同,它信息缺失的特性是此前AI从未触碰过的。
▲图片来源:视觉中国
杜克大学计算机教授科尼特兹也认为AI击败德州扑克顶级选手是个巨大突破。“扑克是一个有关不完美信息的游戏,它与现实世界的战略决策更加息息相关,而这种特性在商业、政治、安全甚至社交生活中都能发挥直观重要的作用。”
新南威尔士大学AI教授瓦尔斯也同意这一观点。“从某些角度来看,德州扑克的难度甚至要超越国际象棋和围棋,因为它的信息缺失非常严重。你不知道对手拿了什么牌或者即将打出什么牌,这就意味着变数的增多。此外,在扑克比赛中,选手们还会动用心理战虚张声势来影响对手的判断。”
值得注意的一点是,虽然Libratus用的依旧是传统的树形搜索、抽象和游戏战略分析等AI技术,但我们现在并未完全了解Libratus的工作方式。
“AI的进步可不止在深度学习上。”瓦尔斯补充道。
同时,瓦尔斯认为我们不能高兴的太早,因为AI并未彻底统治扑克界,眼下的比赛还是一对一,如果有更多选手加入进来,德州扑克的难度将会成倍增加。想在多人比赛中获胜,AI恐怕还得多历练几年。
此外,Libratus与AlphaGo有相同的毛病,那就是它们只专精于一个领域。因此人类不必担心它们的觉醒,因为除了玩扑克和下围棋,它们什么都不会。
围棋和德州扑克之后,人工智能的下一站会是哪个游戏?不少正在家里搓着麻将的中国网友认为,麻将会是AI无法攻破的堡垒,但果真如此吗?
带着AI去打麻将,就能百战百胜?
在许多人看来,麻将只要手气足够好,不需要技术也能赢。大部分人也常常将自己的胜利或失败,归于手气,也就是运气够不够好。
但运气真的是麻将游戏中的一切吗?一局人类看起来必输的牌,让AI来接管,结果会不会有所不同?
▲图片来源:视觉中国
每经小编(微信号:nbdnews)在此向大家分享一篇深入解读的文章。以下文字摘自微信号“百度大脑”(发布于去年12月8日):
诚然,麻将是一种运气成分占比非常高的竞技棋牌项目,技艺再强的高手,也有输给菜鸟的可能性。但同时不可否认的是,麻将中“技艺高低”也是明显存在的。
麻将技艺的高低,不仅仅存在于高手和菜鸟之间。即使是顶尖高手,日本竞技麻将的高手段位中,在经过大量场数的竞技之后,顶尖选手之间的分数差距,同样可以稳定地被拉开,竞技水平被显著地区分开来。所以在麻将领域,研究出一个具有极高竞技水准的AI,是完全有可能的。
麻将AI的策略是怎样的?
相比于棋类这样在大多理论上可遍历(通过计算机模拟出每一种可能的情况)的“完全信息动态博弈”,棋牌类项目,因为很多情况下,你都不能知道对方手上的手牌,也不知道接下来会摸到什么牌,所以更多的情况是属于无法遍历的“非完全信息动态博弈”。
也就是说,相比于棋类AI,力求“将对手逼入必输的岔路口”这个博弈目标不同,麻将AI的策略则更多地增加自己得点的期望值,尽量让自己有更大的可能性和大牌,同时尽量避免对手的大牌点炮。而麻将的打牌策略,显然是有最优解的。每圈弃牌的14个选择里,我们总可以找到我们当前认为最好的选择,而高等的选手,和高级的AI要做的,就是尽量能多思考几回合。
当代的计算机棋手大多采用的是“蒙特卡洛树”搜索算法,策略是选择或迫使对手选择一个分支,这个分支下的所有的结局都是自己胜。AlphaGo就是蒙特卡洛算法和深度学习的结合。
让自己有更大的可能性和大牌,就需要通过手牌和弃牌池里的牌,计算自己进张(摸到有效牌)和鸣牌(吃、碰、杠),使自己手牌有进展的概率,进而计算自己和牌得分的期望值。这对于AI设计来说实际上是很简单的。
让AI避免对手的大牌点炮相对更难,一方面麻将AI需要通过大量的牌谱数据库,来获得通过对方打出的弃牌来分析其牌型的能力。这样可以让AI拥有在几圈之前,就开始弃掉别家需要的关键牌的能力。
百战百胜的麻将AI距离我们有多远?
因为竞技麻将这项运动的小众性,麻将AI目前处于一个相当缺乏发展的阶段。目前还没有可以完全战胜所有人类的麻将AI,但这其中主要的原因是缺乏相关的研究。大多麻将AI都还停留在游戏厂商的AI上,计算强度非常有限,无法与棋类AI动辄就在超级计算机上进行运行相比。
但麻将运动中,可执行的打法数量,实际上是远小于围棋的。因为毕竟手上只有14张手牌,一共也只有136张的总牌数。所以实际上麻将的复杂度,AI运行所需要的计算量,实际上也是比AlphaGO这样的围棋AI要少很多的。
并且麻将有着相对明确的目标,有着相对少的和牌牌面,所以麻将AI实际上完全可以储存大量的牌谱,然后在运算的时候,只要寻找对自己有用的牌即可,这样可以减少很多的计算量。
目前最强的麻将AI,是东京大学开发的日麻AI——“爆打”。“爆打”在日本最大的线上麻将平台,天凤上进行了1.3万多场比赛,最高达到过七段的成绩,这意味着「爆打」比96%以上的麻将玩家都取得了更好的成绩。
▲日麻AI“爆打”对战两位天凤六段选手和一位八段选手,自摸。
除了麻将之外的其他棋牌AI
实际上,除了麻将之外,很多中国民间喜闻乐见的棋牌项目,对于开发AI来寻找最优解的能力,相比棋类AI程序来说,都要简单得多。其面对的问题,同样是因为这些项目中都包含了运气成分,这使验证AI的有效性变成了一个相当难的问题。相反,麻将还是这些项目中相对规范化程度非常高的一个,至少在日本,有着非常完善的ranking(排名)机制与平台。而因为验证AI有效性很麻烦,所以也导致了这类AI开发的相对滞后。
而这样的AI的作用是什么?除了他们可以用来研究算法本身之外,棋牌AI所伴随的棋牌类竞技规范化,也是一个很重要的事情。但同时,我们还可能会看到的是,伴随着棋牌类竞技项目的赌博,可能也会开始依赖于AI催生出一个全新的产业。
斗地主、桥牌、德州扑克……在未来我们都有希望看到这些项目对应的“最强AI”,永远能找到最优解的AI出现。
很多人都想不通,为什么人类要研究一个仅仅是用来下围棋的AI,更不必说“打麻将”这件事,如今在中国完全不被当做一个“正经”竞技项目。但他们很难意识到的是,AI实际上代表了人类对这个世界,孜孜不倦的探求,和挑战自我的精神。用来“打麻将”的AI,我们创造它的动机,当然不是让我们可以利用其功能,在麻将场上百战百胜。而是我们通过麻将AI这件小事,使人类的智慧之光,得以在广袤的世界中延伸,直到洒满每一角落。
这是我们要探究这个世界上一切未知事物的动力,包括却不限于,创造一个永远可以找到最优解的,麻将AI。
熊如梦[责任编辑:熊如梦PN040]
责任编辑:熊如梦PN040
标签:AI麻将游戏麻将运动
推荐用微信扫描二维码
分享到:新浪微博QQ空间人参与评论什么是人工智能 (AI)
虽然在过去数十年中,人工智能(AI)的一些定义不断出现,但JohnMcCarthy在2004年的文章 (PDF,127KB)(链接位于IBM外部)中给出了以下定义:"它是制造智能机器,特别是智能计算机程序的科学和工程。AI与使用计算机了解人类智能的类似任务有关,但不必局限于生物可观察的方法"。
然而,在这个定义出现之前数十年,人工智能对话的诞生要追溯到艾伦·图灵(AlanTuring)于1950年出版的开创性作品"计算机器与智能"(PDF,89.8KB)(链接位于IBM外部)。在这篇论文中,通常被称为“计算机科学之父”的图灵提出了以下问题:“机器能思考吗?” 他在这篇文章中提供了一个测试,即著名的“图灵测试”,在这个测试中,人类询问者试图区哪些文本响应是计算机做出的、哪些是人类做出的。虽然该测试自发表之后经过了大量的审查,但它仍然是AI历史的重要组成部分,也是一种在哲学中不断发展的概念,因为它利用了有关语言学的想法。
StuartRussell和PeterNorvig随后继续发表了“人工智能:一种现代方法 ”(链接位于IBM外部),成为AI研究方面的重要教材之一。在这本书中,他们深入探讨了AI的四个潜在目标或定义,基于理性、思考和行动来区分计算机系统:
人类方法:
像人类一样思考的系统像人类一样行动的系统理想方法:
理性思考的系统理性行动的系统艾伦·图灵的定义可归入"像人类一样行动的系统"类别。
以最简单的形式而言,人工智能是结合了计算机科学和强大数据集的领域,能够实现问题解决。它还包括机器学习和深度学习等子领域,这些子领域经常与人工智能一起提及。这些学科由AI算法组成,这些算法旨在创建基于输入数据进行预测或分类的专家系统。
目前,仍有许多围绕AI发展的炒作,市场上任何新技术的出现都会引发热议。正如Gartner在其hypecycle技术成熟度曲线(链接位于IBM外部)中指出的那样,自动驾驶汽车和个人助理等产品创新遵循“一个典型的创新周期,从欲望膨胀到期望幻灭、到最终了解创新在市场或领域中的相关性和作用。”正如LexFridman在2019年麻省理工学院演讲中指出的那样(01:08:15)(链接位于IBM外部),我们正处于欲望膨胀高峰期,接近幻灭的谷底期。
随着对话围绕AI的伦理道德展开,我们可以开始看到幻灭谷底初见端倪。如想了解更多关于IBM在AI伦理对话中的立场,请阅读这里了解更多信息。