AlphaGo小白的人工智能之路ppt课件pptx
《AlphaGo小白的人工智能之路ppt课件.pptx》由会员分享,可在线阅读,更多相关《AlphaGo小白的人工智能之路ppt课件.pptx(40页珍藏版)》请在新文库网上搜索。
1、小白的人工智能之路2018-6AlphaGo&AlphaGoZero在接下来的一个小时中,你将会认识“谁”是可爱的AlphaGo还有它的兄弟AlphaGoZero探知AlphaGo和AlphaGoZero的实现原理深度神经网络蒙特卡洛树搜索有监督学习做自己的井字棋AI/人机对弈程序易于实现的极大极小树算法AlphaGoHumanorAI?AlphaGo战绩20162016年年11月月2727日日AlphaGo以5:0完胜欧洲围棋冠军樊麾20162016年年33月月99日到日到1515日日挑战世界围棋冠军李世石的AlphaGo
2、以4:1取得胜利20172017年年55月月2323日到日到2727日日乌镇围棋峰会,AlphaGo以3:0战胜世界围棋冠军柯洁AlphaGoAlphaGo家族家族AlphaGoAlphaGoZeroAlphaZeroAlphaGo:于2014年开始由GoogleDeepMind开发的人工智能围棋软件。它以人类围棋高手的棋谱作为参考数据。AlphaGoZero:AlphaGo的团队于2017年10月19日在自然杂志上发表了一篇文章,介绍了AlphaGoZero,这是一个没有用到人类数据的版本(围棋棋盘大小与规则除外),比以前任何击败人类的版本都要强大。通过
3、跟自己对战,AlphaGoZero经过3天的学习,以100:0的成绩超越了AlphaGoLee的实力,21天后达到了AlphaGoMaster的水平,并在40天内超过了所有之前的版本。AlphaZero:AlphaZero使用与AlphaGoZero类似但更一般性的算法,在不做太多改变的前提下,并将算法从围棋延伸到将棋与国际象棋上。AlphaGo家族有多可怕?!训练第0天的AlphaGoZero什么都不懂,训练第3天打败AlphaGoLee,训练第21天打败AlphaGoMaster,训练第40天超越了此前AlphaGo系列的所有成员。AlphaGo
4、家族有多可怕?!AlphaZero在短时间训练后能达到其他算法的同等或更高水平版本使用规则硬件Elo等级分的理论峰值战绩AlphaGo樊(v13)中国规则176个GPU,分布式3,1445比0战胜?AlphaGo李(v18)48个TPU,分布式3,7394比1战胜?AlphaGoMaster4个TPUv2,单机4,858网棋60比0战胜职业棋手;3比0战胜柯洁;1比0战胜人类团队AlphaGoZero川普-泰勒规则4个TPUv2,单机5185100:0战胜AlphaGo李;与AlphaGoMaster对战胜率达90%AlphaZero4个TPUv2,单机N/A60:40
5、战胜AlphaGoZero(3天版本)AlphaGo走下神坛AlphaGo的胜利意味着AI技术有了突破性的进展?AlphaGo的胜利意味着机器打败人脑?答案是否定的。其实,AlphaGo在算法层面上并没有太多新意,而是通过Google强大的团队和计算平台,把已有的技术整合在一起,利用大量的训练数据和计算资源来提高准确性。AlphaGo=蒙特卡洛树搜索算法(MCTS)+深度神经网络博弈树博弈树把游戏看作一棵树每个结点是一种游戏状态。名称棋盘大小(位置数)状态空间复杂度(状态数)状态树复杂度(叶子结点数)平均游戏长度井字棋(Tic-Tac-Toe)91031059四子棋(Con
6、nect4)421013102121翻转棋(Reversi/Othello)641028105858跳棋(Internationaldraughts/Checkers)501030105490中国象棋9010401015095国际象棋(Chess)6410471012370五子棋(Gomoku)22510105107030围棋(Go)3611017010360150六子棋(Connect6)361101721014030常见对弈游戏的状态复杂度对比常见对弈游戏的状态复杂度对比围棋的状态复杂度为围棋的状态复杂度为10170那么那么1010的的170170次方意味着什么呢?次方意味着什么呢?21
7、21个个百亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿百亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿这个规模十分这个规模十分可怕可怕!由于不能将所有状态都遍历一次,于是AlphaGo使用“蒙特卡罗树搜索蒙特卡罗树搜索”算法(MCTS)先从蒙特卡罗方法开始:假设我们要计算一个不规则图形的面积。蒙特卡罗方法基于这样的思想:假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。AlphaGo什么是蒙特卡罗树搜索(MCTS)?图:计算机蒙特卡罗方法模拟借助计算机程序可以生成大量随机的、均匀分布坐标点,统
8、计出图形内的点数,通过它们占总点数的比例和坐标点生成范围的面积就可以求出图形面积。AlphaGo什么是蒙特卡罗树搜索(MCTS)?如何让计算机“看懂棋局”:AlphaGo中一个游戏状态的大小是19*19*17。不仅要考虑当前棋盘状态,还要考虑前几次下棋的位置。其中19*19是围棋棋盘的大小,17=8+8+1:1、过去8步的黑棋位置2、过去8步的白棋位置3、当前走棋方(黑棋/白棋)AlphaGo什么是蒙特卡罗树搜索(MCTS)?蒙特卡罗树的一个结点:对应一个游戏盘面树节点的子结点:从该状态出发可以产生的后续状态父结点到子结点的边:落子动作每个结点还具有信息NN和WW:NN
9、=结点(动作)被选择的次数WW=所有子结点的价值总和价值:获胜的期望值,-1为负,0为平,1为胜。图:一棵蒙特卡罗树AlphaGo什么是蒙特卡罗树搜索(MCTS)?蒙特卡罗树搜索的一次迭代包括四个阶段:选择、扩展、模拟、反向传播(回溯)蒙特卡罗树搜索的一次迭代选择(Selection):从当前结点的子结点的中选择U值最大的一个。U=f(N,W)扩展(Expansion):扩展结点,列出所有可能的动作及其游戏状态。模拟(Simulation):对于一个节点,多次随机模拟博弈直到决出胜负。用频率代替用频率代替概率概率,估算这个子节点的价值W。胜:W:=W+1平
10、:W:=W+0负:W:=W-1蒙特卡罗树搜索的一次迭代蒙特卡罗树搜索的一次迭代进行多次模拟后,可以近似认为W/N就是获胜的期望值。反向传播(Backpropagation):回溯更新父节点到子节点的路径上所有结点的(N,W)值。蒙特卡罗树搜索的一次迭代AlphaGo等算法中,不同于传统MCTS方法的随机模拟博弈,W/N的值由深度神经网络深度神经网络(后述)估算。选择子结点时,除了N,W以外还需要考虑落子概率落子概率PP。AlphaGo中使用人类专业棋手的棋谱数据训练深度神经网络,落子更接近于人的思维。而AlphaGoZero和AlphaZero算法中,
11、在进行多次MCTS迭代后,以(子结点N/父结点N)估算落子概率,再以此训练深度神经网络。AlphaGo等算法中MCTS的创新注:图中Q=W/N,U正相关于P/(N+1)(不同于前述传统MCTS的U)深度神经网络可以用函数f(s)f(s)表示,ss表示当前游戏状态。函数f(s)f(s)有两个输出:PP((落子概率落子概率))和和WW((价值价值)),按下图的方式应用到MCTS的计算中。根据N,N,W,PW,P的值,进一步选择子结点并迭代。最初使用传统MCTS随机模拟的估算结果来训练深度神经网络。迭代的次数足够后,用深度神经网络的输出代替随机模拟。用深度神经网络预测落
12、子概率和价值的方法比传统MCTS的随机模拟速度更快,效果更好速度更快,效果更好。AlphaGoAlphaGo=深度神经网络+蒙特卡罗树搜索算法|估值网络+走棋网络使得电脑像人类的大脑一样自发学习使得电脑可以结合树状图进行长远推断AlphaGo什么是深度神经网络?图:一个三层结构的简单神经网络神经网络三要素:输入层隐藏层输出层走棋网络走棋网络(PolicyNetwork)的输出是19*19+1维向量,表示在19*19的棋盘上每个位置落子的概率,以及当前走棋方(黑棋/白棋)。估值网络估值网络(ValueNetwork)的输出是范围在-1,1的标量。AlphaGo的估值网络和
13、走棋网络是独立独立的,并且没有用到残差层。AlphaGoZero、AlphaZero的估值网络与走棋网络共享共享前面的网络层。AlphaGoAlphaGo等算法的强化学习流程等算法的强化学习流程(ReinforcementLearning)(11)自对弈)自对弈(Self-Play)(Self-Play)当前网络自对弈25000局,保存每一步的游戏状态、MCTS中的结点概率以及最终的获胜者。AlphaGoAlphaGo等算法的强化学习流程等算法的强化学习流程(ReinforcementLearning)(22)训练)训练(RetrainNetwork)(RetrainNet
14、work)从500000局游戏中抽取2048个样本。样本包括上述的游戏状态、MCTS的结点概率以及最终获胜者。将游戏状态作为深度神经网络的输入。然后将预测输出与实际结果对比,得到损失函数的值。最后,反向传播调整深度神经网络中的参数。AlphaGoAlphaGo等算法的强化学习流程等算法的强化学习流程(ReinforcementLearning)(33)评价网络)评价网络(EvaluateNetwork)(EvaluateNetwork)调整后的网络与原网络对弈400局。若调整后的网络能赢下至少55%的对局,则接受调整后的网络,并替代原网络。实战环节:做自己的井字棋AI/
15、人机对弈程序1919的围棋AlphaGo能hold住,哈哈,我的电脑可不行!一口吃不成胖子,谁叫我们是人工智能小白呢!不如来看看轻量级的人工智能应用井字棋人机对弈实战:自己动手做井字棋AI/人机对弈程序1、安装python3python3-V2、安装pygame模块python3-mpipinstall-ihttps:/AI/人机对弈程序3、分析极大极小树算法的实现函数实战:自己动手做井字棋AI/人机对弈程序4、将文件“ticky.py”放进D盘根目录在cmd中输入D:回车;python3ticky.py,回车;程序效果实战:自己动手做井字棋AI/人机对弈程序5、点击绿色按键“vsAI”;点击蓝色框内的棋盘;重新开始请再次点击“vsAI”。THANKS
人工智能智能制作PPT构想
人工智能智能制作PPT
一、问题的提出
1.1 人工智能在幻灯片制作领域应用价值与意义
1.2 人工智能制作幻灯片需解决的技术难题
二、问题的论证
2.1 人工智能在幻灯片制作域技术路线
2.2 现有技术方案与应用案例
2.3 技术应用效果
三、结论与展望
3.1 现有技术的不足与有待改进
3.2 新技术方法预测或下一步研究
3.3 工程伦理挑战
3.4 结论
参考文献
介绍PPT
一、问题的提出
1.1 人工智能在幻灯片制作领域应用价值与意义
根据Facebook的有项调查研究,80%的人每天工作都会涉及到PPT;
其中85%的人每天会查看10份以上的PPT。
所以说PPT已经成为当代社会人,打工人的左膀右臂,
而且PPT的应用场景广泛,无论是大中小学上课,学生毕业答辩、小组课题研讨、公司商业演讲、老板会议汇报还是工作梳理,招商引资、项目申报、产品发布、上市融资等都离不开PPT
我现在也正使用PPT来传递关于人工智能制作PPT的念想和实现思路,离开ppt,演讲就难以让观众理清行文的逻辑和抓住我所说的重点
以上都是PPT对人们的重要性,但是做过PPT的人都知道,制作一套精美贴合实际的PPT有多么耗时间,
而且在当代社会的巨大压力下人们很难抽出大量的时间来学习并自己制作PPT,
所以才有了老教授反人类的蓝白PPT,白底黑字密密麻麻的根本不想看的PPT
但如果随着科技的快速发展,幻灯片制作被人工智能所替代后,这项技术可以为任何有PPT需求的人提供便利,节省他们的节省时间精力,再也不用为做ppt强说愁了
BUT在关于智能制作ppt市场上,我们可以看到有很多PPT插件,但无论是PPT美化大师也好,islide也罢,本质上都是辅助人设计的,却没有一款软件是可以智能制作的ppt!
这也是情有可原的,要将大量的内容,逻辑清晰、系统全面地整合到短短十几页的PPT里,与此同时,风格还要简约大气,贴合主题、场景,确实是一件不容易的事情。
而且对于目前阶段尚未达到强人工智能的AI来说更是一个挑战
1.2 人工智能制作幻灯片需解决的技术难题
文本的处理
版面设计
二、问题的论证
2.1 人工智能在幻灯片制作域技术路线
关于如何实现ppt的人工智能制作,我设想可以借用NLP
NLP英文名是NaturalLanguageProcessing中文名就是自然语言处理
其中N是指神经系统L是指语言P是指指令
我们可以通过NLP,通过研究我们的大脑如何制作ppt的过程转换为机械制作ppt
2.2 现有技术方案与应用案例
文本的处理
我们的目标是可以使用人工智能的中文自然语言处理,对文本内容进行处理,将文本分成ppt主题,ppt副标题,ppt内容,以及演讲稿内容,以便之后PPT制作的调用
其中提到了对文本内容进行处理,我们要有文本才能进行处理啊。首先我们应该接受用户的文章标题输入,以及相关资料文本的输入
然后我们可以通过网络爬虫,即一段自动执行的程序,能把访问到的网页记录保存下来。通过指定好种子(起始连接)、选择合适抓取策略(关键词搜索的结果列表、种子页面的链接等)以及明确好提取的内容(抽取网页中的正文、图片等),就能搭建出满足自己需求的爬虫。然后利用用户提供的文章标题相应的关键词,对全网的文章进行信息检索与布尔运算,通过文章的浏览量,点评数,点赞数,引用数,和ppt主题内容的相关性进行加权计算,取前十名的文章下载,但是整体最优秀不代表最合要求和局部最优秀,我们可以对其文章标题,副标题,文章内容进行分类,再在小类中通过和主题关键词的相关性进行加权打分,选取最优内容保存,并通过逻辑来安排ppt的进行顺序
这里有一些相关问题的实现问题,
首先是关于用户提供的文章标题和相关资料中相应的关键词的提取问题
以及如何识别相关副标题的逻辑问题,比如是并列逻辑、顺序逻辑还是其它逻辑的逻辑问题
关于关键词问题,我们可以通过识别成具有特定意义的实体,包括人名,地名,机构名,专有名词等等,来进行关键词提取
但是如何让只知道0和1的计算机领悟我们博大精深的汉语呢?
这就关系到了计算机如何理解中文语料的问题,facebook机械学习的工程师mikelov已经提出创新性的方法wordsvel,通过记录神经网络模型的权重来解决减轻onehot和TF-IDF的稀疏矩阵和词向量维度过高和效率底下的问题,又使用n-gram算法来解决计算机识别字的顺序问题,相关内容这里就不多展开了
回到正题,我们可以使用命名实体识别(namedentityrecognition)利用隐马尔可夫模型和维特比算法来提取关键词
我们可以建立几个标签,
如
then通过字典、文章分析,
计算单字的转移概率,也就是第一个字转移到第二个字仍是词组的概率
发射概率,也就是所在词组在字典文章中的概率
以及初始隐状态概率,就是词组是标签的概率
来训练隐马尔可夫模型模型
然后用维特比算法进行修正,让局部最优解变成全局最优解
之后利用训练好的HMM模型将输入的可读文本语句转换成不可观测的隐状态,来判断关键词
比如用于判断一句话
也可以用于判断逻辑
例如并列的人名
和公司名
然后利用检索文本中的关键词来判断词语之间的逻辑关系问题
例如
“和”就是“并列”逻辑、“因为...所以”是因果逻辑、“第一步第二步第三步”就是“流程”逻辑
来安排ppt进行顺序
版面设计
文档处理完成,我们就可以来实现人工智能在版面设计方面的工作了
首先我们可以通过网络爬虫获取大数据时代下网络上的大量PPT模板或者ppt的数据库,以及我们可以利用用户提供的官方,老板,或者同伴公认做得好的ppt样本,增加此样本在样本选择中的权重。
之后通过标题和相关介绍给相关模板加标签。
然后通过神经网络,通过和主题的相关程度,相关关键词的百度图片的颜色重复率统计,来确定最佳配色以及美术设计等各种参数的加权计算,选取最合适的模板。
选取模板后识别并增删模板中的文本框,修改其中内容,并自动插入文字,形成文字初稿。
但只有文字的PPT不是好PPT,还应解决图片配图和逻辑的问题,
我们先训练机器对设计理解的模型,建立一个框架印象
先将大量设计素材的设计数据进行结构化标注,最后经过一系列的神经网络学习,输出空间+视觉的设计框架.
框架设计中,首先通过人工标注的方式,让机器理解该幅设计有哪些元素组成,比如它的商品主体,花的背景,蒙版.往上一层,还需要通过设计的经验知识,定义一些设计的手法和风格.手法指的是这些元素为什么可以这么构成.最上面这一层是风格,当这些元素构成之后,它从美学或者视觉角度看是一个什么感受,让机器知道它是用什么组成.
下一步是准备设计的原始文件,比如一系列花朵和设计方法,输入到深度学习网络中.该网络具备一定记忆功能,可以记住设计步骤中复杂的过程.
经过这层神经网络学习之后,会得到一个设计框架.从技术上理解,它是一堆空间特征和视觉特征构成的模型.从设计师的视角来看,它相当于设计师脑里在做一组设计之前那个大概的框架印象.
在设计框架的同时,元素中心也在批量输入元素(如底图,主图、修饰元素等),由元素分类器进行学习,按照视觉特征和类型分类.
具体来说,提前收集一些版权图库,以及自己造设计元素的方式,输入到元素分类器中.这个分类器会把这些元素分布到各个类型里,比如背景、主体、修饰,也会完成图片库的提取.
行动器的主要作用,是根据需求从风格学习模块中选择设计原型,并从元素中心中选取元素,规划出多个最优生成路径,完成图片设计.
这与设计师实际工作过程非常相似,如设计师要设计一朵花,也会在软件里会不断去调每个位置、每个像素、每个角度.同时,整个过程也是一个强化学习的过程,行动器会在不断试错中更聪明、更智能.
计算机理解设计以后,我们可以通过网络爬虫,在各大专业非专业的网站上下载大量高清相关性高的图片,或者使用云图库,或者插入相关视频。然后利用关键词和逻辑顺序,删除冗余图片,通过设计框架进行图片设计,之后按逻辑词编写对应的代码,根据逻辑从而将文本内容快速转化为逻辑图形,然后快速调取“并列”“递进”等的Smartart图形套上去,就完成了
但只有呆板的图片和文字还不行,我们还应解决图片文字排版和ppt之间的动画设计问题
好在现在市场上已经有相对成熟的技术了,例如口袋动画插件,就可以一健排版一键动画,我们只用利用代码调用插件就可以达到效果
而艺术字,市场上已经有piti等插件支持一键美化,我们可以通过代码调用
而对于文字配上数据就需要数据表格直观化,
好在现在市场上islide已经制作出成熟的模板,我们只需要将相关数据调出导入插件中就可以达到自动生成的效果
此过程完成后,最后由于人工智能可以极大提高制作ppt的效率,人类做一天的ppt,可能人工智能在极短时间内就可以做几十个,还可以通过代码和算法进行打分,输出评分最高的三个,以供用户选择。用户使用的过程中产生了更多的数据反馈到大数据库中,更多更精准的数据使AI不断学习并应继续应用于设计当中,从而使新技术赋能新设计,新设计赋能新商业
2.3 技术应用效果
人们通过内容输入,瞬间就可以获得千人千面的PPT
三、结论与展望
3.1 现有技术的不足与有待改进
现在人工智能只能调用以前的PPT逻辑,然后参考和模仿
而无法形成具有创造新的思路和方案,以及令人构想耳目一新的思路
总的来说人工智能制作还没有办法进行逻辑创新,
3.2 新技术方法预测或下一步研究
更深一步的发展,可能要等待计算机学科的深度发展,生物学课对人脑的进一步认识,甚至是哲学上对人工智能的更深一步的认识
以后美工的工作将会被人工智能所取代,但设计被取代的可能性较低,内容创意设计和全链路设计会成为设计师未来发展的方向
3.3工程伦理挑战
虽然有人说懒是人类进步的阶梯,但有人对人工智能化与设计的矛盾提出了质疑
他们认为没有情感化的思考,人工智能制作的PPT会同质化严重。
有可能这样的人工智能技术只会把人变成傻子,
设计是一个全局化思维过程,你的审美能力、逻辑思维、文字排版都会体现在你最后的结果上。
全部交给机器来完成,将会逐渐丧失你独立思考的能力,
太多的影视、文学作品里看到过人工智能独霸一方与人类对抗的故事。
一切的起源都是因为这种贪图方便开始的,懒惰最终会毁了我们自己。
工具永远只是协助更高效的完成工作,不要把最后的底线都交给机器。
3.4 结论
人工智能智能制作PPT还在纸上谈兵的阶段,还没有实现市场化,但是有很多互联网公司都在进行积极的尝试,例如阿里鲁班智能设计平台对商业广告和别墅设计进行了探索,Office365的排版神器,设计灵感和智能图文对图形和文字的排版进行了探索等,随着未来对人工智能NLP领域的深入探讨和其他学课的共同发展,人工智能智能制作幻灯片将脱离纸上谈兵的阶段,让这个想法落地,让其水平接近专业设计师设计的效果.
参考文献
[1]EnhancedLSTMforNaturalLanguageInference
[2]BilateralMulti-PerspectiveMatchingforNaturalLanguageSentences
[3]NaturalLanguageInferenceoverInteractionSpace
[4]蓝江《人工智能的伦理挑战》[N].人民日报2019年04月01日
[5]Islide《如何使用人工智能技术生成ppt?》[EB/OL]2019-02-19
[6]《DiscussiononWebCrawlersofSearchEngine》2016-12-12
[7]杨状元,林建中.人工智能的现状及今后发展趋势展望[J].科技信息,2009(04):184~185.
[8]郝勇胜.对人工智能研究的哲学反思[D].太原:太原科技大学,2012.
[9]史忠植,王文杰.人工智能[M].北京:国防工业出版社,2007.
介绍PPT