人工智能热潮背后——透视算力新趋势
新华社北京6月8日电题:人工智能热潮背后——透视算力新趋势新华社记者董瑞丰以ChatGPT为代表的人工智能技术发展,引发了全球算力需求的进一步增长。迎接新一轮人工智能热潮,中国的算力增长点在哪里?什么样的算力更精准高效?记者日前采访业内专家,前瞻算力发展趋势。大模型呼唤“大算力”在全球新一轮人工智能技术发展浪潮中,大模型是一个关键词。ChatGPT等正是通过大模型来“学习”海量数据,并由此取得突破。中国科学院院士陈润生表示,人工智能大模型在应用层面正在发生巨大变化,未来将在多个领域引发变革,同时也会消耗大量算力。中国工程院院士郑纬民说,做大模型必须要有“大算力”,ChatGPT正是基于大规模算力基础设施的产物。不久前举行的中关村论坛上,科技部新一代人工智能发展研究中心发布了《中国人工智能大模型地图研究报告》。报告显示,我国研发的大模型数量排名全球第二。中国科学院计算机网络信息中心研究员陆忠华表示,全社会对算力的需求日益增长,人工智能应用的算力需求更加突出,要迎接好这一趋势。通用算力+专用算力近年来,我国人工智能算力的占比在升高。“根据估算,人工智能算力过去几年大体上年均增长率为70%,其他算力大概增长30%左右。”中国信息通信研究院院长余晓晖说。清华大学计算机系教授陈文光也观察到,随着人工智能的渗透程度加深,相比传统超算中心,智算中心的利用率变得更高。国家高性能计算机工程技术研究中心副主任曹振南则表示,虽然算力常被分为超算和人工智能计算,但二者有许多相像之处,最大区别在于对计算精度的要求不同。“目前人工智能算力的缺口较大,一些人工智能应用为追求计算性能而降低了精度要求。但如果算力变得易得、便宜,一些人工智能应用可能又会对精度提出一些高要求。”曹振南说。专家认为,“通用算力+专用算力”将成为人工智能算力基础设施的建设关键。一方面要满足广泛的应用场景,具备普适性,实现通用;另一方面也能支持部分对计算精度、效率要求高的个性化应用场景,具备高效性,实现专用。构建算力网络“高速路”在专家看来,将已有的、不同体系架构的算力中心通过网络连接起来,可以合理配置、共享、调度、释放更多算力,并降低应用门槛。在科技部高新技术司的牵头下,国家超算互联网工作已经启动。按照规划,到2025年底,国家超算互联网将成为支撑数字中国建设的“高速路”。曹振南介绍,超算互联网平台的建设目标之一,正是致力于解决算力设施分布不均衡的问题,实现算力资源的互联互通、资源共享。中国科学院院士钱德沛表示,算力基础设施提供的应当不仅是算力,更要有用户所需的软件或应用服务,这样才能将算力资源最大化。“希望超算算力未来能像电力一样走进千家万户,任何地方、任何时间都可以获得大数据算力来支持相关应用。”钱德沛说。当人工智能遇上超级计算机
◎记者吴纯新通讯员涂兴佩
由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力、整型计算,多数超级计算机并不具备这些计算能力,因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机,它作为一种专用算力,被应用于人工智能推理或训练等领域。
打开手机,半个月内的天气状况一目了然;出门在外,地图导航给出最优路线……这些“未卜先知”从何而来?答案是计算。
如今,算力作为数字经济的第一引擎,正成为科技巨头们争相进军的主阵地。
日前,英伟达宣布与微软联手开发人工智能超级计算机,依托微软Azure云运行,通过数以万计的图形处理单元(GPU)、中央处理器(CPU)处理云中的密集人工智能计算工作。
人工智能遇见超级计算机,将会碰撞出怎样的火花,又将带来哪些挑战和机遇?
对基础软件和通信能力要求极高
“实际上,人工智能超级计算机去年就出现了,其核心是解决大规模密集人工智能训练和推理等的计算问题。”武汉人工智能研究院院长王金桥说。
传统超级计算机相对一般计算机而言,就是一种计算能力更强、通信速度更快、存储容量更大、功能更完善的计算机,它们在高精度计算能力方面更强,应用范围也更广,主要用于解决一些科学计算类问题,比如行星模拟、新材料开发、分子药物设计、基因分析和气象预测等。
随着人工智能逐渐在各个应用场景中落地,各行业对于算力的需求也在持续提升。
由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力以及整型计算,多数智能计算机并不具备这些计算能力,因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机,它作为一种专用算力,被应用于人工智能推理或训练等领域。
王金桥介绍,人工智能超级计算机对基础软件要求极高,这也是英伟达与微软合作的最大原因。人工智能超级计算机集群通过虚拟化和分布式加速训练,可以有效支撑超大规模人工智能模型DALLE2(基于文本来生成模型的模型)、CLIP(用文本作为监督信号训练可迁移的视觉模型)等的训练,包括图像、文本、语音等多模态异构数据,以及最近特别火爆的人工智能自主生成内容技术。
不过,由多台服务器组成的人工智能超级计算机在进行模型计算时,调度的数据规模将越来越大,对通信能力的要求也越来越高。
因此,人工智能超级计算机需要部署在云端,这样对用户而言,就可以将之当成一个普通计算机来使用。用户可以简单便捷地完成数据的通信、访问、调度、资源管理与配置等各项工作,从而专注解决人工智能模型训练和推理问题。
帮助解决科学计算领域问题
“随着数据量的增长,未来人工智能超级计算机能够解决很多以前没办法解决的问题。”王金桥介绍。
人工智能超级计算机给科学计算带来了巨大变革。比如,由于大多数物理规律可以表达为偏微分方程的形式,所以偏微分方程组的求解成为了解决科学计算领域问题的关键,而人工智能超级计算机无疑能在这方面助人类一臂之力。
不仅如此,人工智能超级计算机还能帮助人们解决更多其他的科学问题,尤其是数学方面复杂方程求解的难题,人工智能超级计算机能变成一个趁手的工具,助力科学家发挥更大的创造力和想象力。
虽然专用的人工智能超级计算机去年才出现,但“人工智能+超级计算机”这种模式其实早有端倪。
出现于20世纪六七十年代的图计算,就是超级计算的一种方式。“图计算作为下一代人工智能关键核心技术,已被广泛应用于医疗、教育、军事、金融等多个领域,如我们熟知的金融反欺诈分析和商家刷单行为识别等,成为全球科技竞争新的战略制高点。”华中科技大学大数据技术与系统国家地方联合工程研究中心副教授张宇说。
这里所指的“图”并非常规理解的图像,而是人与人、物与物之间的构成图,能有效表达事物之间关联关系,是数据分析与应用的基础。万物联通,随着科技发展,人工智能等重要应用利用图数据的处理方法,可处理更复杂、更大规模的数据,且效率和精准率大幅提升。
去年底,一篇发表在《自然》杂志的研究成果显示,研究人员利用最新的人工智能技术发现了纯数学拓扑学和表象理论的新见解,寻找到数学不同领域间意想不到的关联,不仅改进了目前最优的4×4矩阵解法,还进一步提升了其他70余种不同大小矩阵的计算速度。
这些人工智能与算力“联姻”的典型案例,也预示着人工智能超级计算机未来的发展趋势。
相关链接
武汉人工智能计算迎来好“帮手”
11月23日,武汉超算中心正式投运,国家文化大数据华中区域云平台入驻。该云平台是国家文化大数据体系八大区域中心之一,上联国家文化大数据全国中心,下接行政大区内省域中心,负责华中区域内五省(湖北、湖南、河南、江西、安徽)之间的数据、信息、产品等的交易和结算。
该超算中心是目前国内最大的集装箱超算中心,整体规划设计的算力为200P,首期算力达到50P。通俗讲,1P约等于每秒1000万亿次的浮点运算,50P的算力将超过10万台高性能计算机算力之和。其技术底座是由数万核鲲鹏处理器内核,以及数千张加速卡构成。
“武汉超算中心在国内第一个采用了基于鲲鹏架构的超级计算机。”王金桥说,投运后,将与武汉人工智能计算中心一起形成“双中心、双引擎”发展模式,这对武汉建设人工智能创新中心有极大的促进作用。
眼下,武汉超算中心已接入中国算力网,一方面作为数字中国建设的地理中心和网络中心,更好地服务“东数西算”重大战略;另一方面将利用武汉高校在分布式计算、海量存储、人工智能算力平台等方面的科研优势,助力武汉打造中部地区数据中心和算力服务枢纽。
2020年9月,武汉获批建设国家新一代人工智能创新发展试验区。去年5月,武汉人工智能计算中心一期投入运行,成为科技部批复的18个国家人工智能创新发展试验区中首批投入运营的项目,也是全国首个面向产业的多样性算力公共服务平台。
目前,武汉人工智能计算中心已为武汉大学、清华大学、中国科学院自动化所等高校和科研院所,以及100多家重点企业提供普惠算力服务,意向入驻企业已超200家,孵化应用案例超过50项,广泛服务于智能制造、智慧城市、智慧交通、网络直播等行业和领域。
[责编:肖春芳]人工智能导论期末复习题
文章目录@[toc]期末复习题一一、选择题二、填空题三、判断题四、简答题期末复习题二一、选择题二、填空题三、判断题四、简答题期末复习题一一、选择题1.【多选题】在卷积神经网络中,常用的池化方法有(ABC)A.最大池化法B.平均池化法C.概率池化法D.最小池化法
2.【单选题】本原问题所对应的节点称为(B)A.端节点B.终叶节点C.子节点D.父节点
3.【单选题】支持向量机算法属于(B)A.决策树学习B.统计学习C.集成学习D.记忆学习
4.【单选题】Teacher(father(Zhan))的个体是(C)A.常量B.变量C.函数D.谓词
5.【多选题】BP网络的优点是(ABC)A.很好的逼近特性
B.具有较强的泛化能力
C.具有较好的容错性
D.收敛效率高
6.【单选题】当P为F,Q为F,R为T时,(P∨Q)↔R的真值是(B)
A.TB.FC.不确定
7.【单选题】是(B)A.结合律B.连接词化归律
C.分配律D.德•摩根律
8.【多选题】思维方式有(ACD)A.抽象思维
B.逆向思维C.形象思维
D.灵感思维
9.【单选题】在有序搜索中,如果节点x在希望树中,若x是(C),则其所有子节点都在希望树中。A.终叶节点B.端节点C.与节点D.或节点
10.【单选题】基于状态空间的搜索算法是(A)A.A*算法B.与或树搜索C.极大极小分析法D.α-β剪枝技术
11.【单选题】神经网络是(B)学派的成果
A.符号学派B.联接学派C.行为学派D.统计学派
12.【多选题】2006年,深度学习元年,深度学习之父Hinton提出了哪些观点:(ABCD)A.多层人工神经网络模型可以有很强的特征学习能力。B.深度学习模型对原始数据有更本质的表达。C.深度神经网络可以采用逐层训练方法进行优化。D.训练时可以将上层训练好的结果作为下层训练过程中的初始化参数。
13.【多选题】机器学习包括(ABC)A.监督学习B.强化学习C.非监督学习D.群体学习
14.【单选题】极大极小分析法中,用于极大极小分析法中计算各节点分数的是(A)A.估价函数
B.代价函数C.启发式函数D.价值函数
15.【单选题】如果问题存在最优解,则下面几种搜索算法中,(D)可以认为是“智能程度相对比较高”的算法。A.深度优先搜索
B.宽度优先搜索
C.有界深度优先搜索
D.启发式搜索
16.【单选题】置换是一个形如{t1/x1,t2/x2,…,tn/xn}的有限集合:xi可以是(B)A.常量B.变元
C.函数D.谓词
17.【单选题】消去存在量词时,当(B)时,用skolem函数
A.存在量词未出现在全称量词的辖域内时
B.存在量词出现在全称量词的辖域内时
C.以上情况都需要D.以上情况都不需要
18.【单选题】产生式规则的形式化描述遵循(A)A.巴科斯范式
B.前置范式C.斯科林范式D.合取范式
19.【多选题】不确定性推理,包括(ABCD)A.主观Bayes推理
B.证据理论
C.模糊推理
D.概率推理
20.【多选题】槽值可以是(ABCD)A.数值、字符串
B.布尔值或是动作
C.过程
D.框架名
二、填空题1.框架A的某个槽值是另一个框架B时,则称框架A与框架B之间具有横向联系
2.P(y)
3.产生式系统的推理方式有正向推理,反向推理与混合推理
4.当P与Q为F,R为T时,(P∨Q)→R的真值是T
5.人工智能的终极目标是探讨智能形成的基本机理,研究利用自动机模拟人的思维过程
6.中文屋子实验是为了证明即使通过图灵测试也不能说明计算机能思维
7.卷积核与特征图之间是一一对应关系,即一个输入图如果有六个卷积核心,就应该产生六个特征图
8.从问题的初始状态集,经过一系统列的算符运算,到达目标状态,所经过算符的序列叫问题的解
9.设有如图4-26的与/或/树,请分别按和代价法及最大代价法求解树的代价
和代价是21
最大代价是10
10.从Open表的所有节点中选择一个估价函数值最小的进行扩展的A算法叫全局择优
三、判断题1.(F)将一个复杂的问题分解为几个子问题的过程称为分解。可用或树表示,将一个复杂的问题变换成若干个等价的问题的过程称为等价变换。可用与树表示
2.(T)Boosting方法和Bagging方法都属于集成方法,但是产生训练样本的方式不同
3.(F)任何文字的合取式称为子句。
4.(T)语义网的聚类关系与实例、分类、成员关系的主要区别是聚类关系一般不具备属性的继承性
5.(T)一定存在一个BP神经网络能够逼近给定的样本或者函数
6.(T)自然演绎推理与归结演绎推理属于确定性推理
7.(F)卷积神经网络中,对不同位置的特征进行聚合统计,称为池化(pooling)。池化不会丢失图像的信息,也不会降低其空间分辨率。
8.(F)“与或”树始终是站在双方的立场上得出来的
9.(T)如果已确定某个节点为可解节点,则其不可解的后继节点可以从搜索树中删除,如果确定某个节点是不可解节点,则其全部后继节点都可以从搜索树中删除。
10.(F)两个A*启发策略的h1和h2中,如果对搜索空间中的任一状态n都有h1(n)≤h2(n),就称策略h1比h2具有更多的信息性
四、简答题1.卷积神经网络设有如下特征图,给定池化窗口为2*2,请分别用最大池化法和平均池化法求出池化后的输出特征图。
2.
S={P(x,f(x))∨¬Q(x,f(x))∨R(x,f(x))}
3.对下列各题分别证明G是否为F1,F2,…,Fn的逻辑结论
4.有一农夫带一条狼,一只羊和一框青菜与从河的左岸乘船倒右岸,但受到下列条件的限制:
(1)船太小,农夫每次只能带一样东西过河;
(2)如果没有农夫看管,则狼要吃羊,羊要吃菜。
请设计一个过河方案,使得农夫、浪、羊都能不受损失的过河,画出相应的状态空间图
5.请简要解释BP学习算法的正向传播与反向传播的含义?
正向传播:输入信息由输入层传至隐层,最终在输出层输出。
反向传播:修改各层神经元的权值,使误差信号最小。
期末复习题二一、选择题1.【多选题】博弈树算法包括(CD)A.A*算法B.与或树搜索C.极大极小分析法D.α-β剪枝技术
2.【单选题】一阶谓词的个体不能是(D)A.常量B.变量C.函数D.谓词
3.【单选题】描述的是(B)
A.事实性知识B.规则性知识C.控制性知识D.元知识
4.【单选题】Teacher(father(Zhan))的个体是(C)A.常量B.变量C.函数D.谓词
5.【单选题】设P和Q是两个谓词公式,D是它们共同的个体域,若对于D上的任何一个解释P和Q都有相同的真值,则称P和Q在D上(D)A.永真B.永假C.不可满足D.等价
6.【单选题】视觉、听觉、触觉、嗅觉属于智能的什么能力(A)
A.感知能力B.记忆与思维能力C.学习能力D.行为能力
7.【单选题】认为智能取决于知识的积累量及一般化程度的理论是(B)
A.思维理论B.知识阈值理论C.进化理论D.控制理论
8.【单选题】研究机器人的“说”、“写”、“画画”属于人工智能的什么研究内容(D)
A.知识表示B.机器感知C.机器学习D.机器行为
9.【单选题】人工智能的目的是让机器能够(D),以实现某些脑力劳动的机械化。A.具有智能
B.和人一样工作
C.完全代替人的大脑
D.模拟、延伸和扩展人的智能
10.【单选题】人工智能中通常把(B)作为衡量机器智能的准则A.图灵机
B.图灵测试
C.中文屋思想实验
D.人类智能
11.【多选题】启发信息的作用可以分为(ABC)A.用于确定某些应该从搜索树中抛弃或修剪的节点
B.用于决定要生成哪一个或哪几个后继节点
C.用于决定应先扩展哪一个节点
D.用于决定节点的类型
12.【单选题】专家系统是(A)学派的成果
A.符号学派B.联接学派C.行为学派D.统计学派
13.【单选题】对于谓词公式,以下说法错误的是(C)A.上述公式中的所有y是自由变元。
B.P(x,y)中的x是约束变元。
C.R(x,y)中的x是约束变元。
D.Q(x,y)中的x是约束变元。
14.【单选题】(B)表示“每个人都有喜欢的人”。
15.【单选题】以下等价式错误的是(C)
16.【单选题】设个体域D={1,2},求公式,设对个体常量b,函数f(x)指派的值分别为:b=1,f(1)=2,f(2)=1,对谓词P,Q:P(1)=F,P(2)=T,Q(1,1)=T,Q(2,1)=F,谓词的真值是(A)A.TB.FC.不能确定D.都不是
17.【单选题】决定人工神经网络性能的三大要素中没有(B)A.神经元的特性B.神经元个数C.神经元之间的连接形式,即拓扑结构D.学习规则
18.【单选题】卷积神经网中,如果特征图是32×32矩阵,池化窗口是4×4的矩阵,那么池化后的特征图是(C)的的矩阵
A.2×2
B.4×4
C.8×8
D.16×16
19.【单选题】卷积神经网中,如果输入图像是32×32矩阵,卷积核心是5×5的矩阵,步长为1,那么卷积操作后的特征图是(D)的矩阵A.34×34
B.32×32
C.30×30
D.28×28
20.【单选题】用极大极小分析法计算博弈树的倒推值,根点s的倒推值是多少(B)
A.2B.3C.4D.6
二、填空题1.按拓扑结构分,人工神经网络可以分为前馈网络和反馈网络
2.第一次提出“人工智能”,标志着人工智能学科诞生的会议是达特茅斯会议
3.当P与Q为F,R为T时,(P∨Q)→R的真值是T
4.在博弈树中,“或”节点和“与”节点逐层交替出现。自己一方扩展的节点为或节点,对方扩展的节点为与节点
5.连接词﹁,→,↔,∨,∧,的优先级别从低到高排列是↔,→,∨,∧,﹁
6.若P是原子谓词公式,则称P和~P为互补文字
7.,需要用g(y,z,v)替换的约束变元是w
8.卷积神经网络是BP神经网络的延伸与拓展
9.求与或树中解树的代价,如果是与节点,则求解方法有和代价法与最大代价法
10.博弈树是一棵与或树
三、判断题1.(F)知识具有不确定性与相对正确性,所以它不一定可以被表达与利用。
2.(T)希尔勒中文屋实验证明即使通过图灵测试也不能说明计算机能思维。
3.(T)产生式系统求解问题的过程是一个反复进行“匹配–冲突消解–执行”的过程
4.(T)一定存在一个BP神经网络能够逼近给定的样本或者函数
5.(F)“与或”树始终是站在双方的立场上得出来的
6.(T)因为归结式C12是其亲本子句C1与C2的逻辑结论,所以将归结式C12加入原子句集S,得到的S1与S的真值相同
7.(F)演绎推理是由个别事物或现象推出一般性知识的过程,归纳推理是由一般性知识推理出个别事实的过程
8.(T)卷积主要用于得到图片的局部特征感知,池化主要用于特征降维,压缩数据和参数的数量
9.(F)将一个复杂的问题分解为几个子问题的过程称为分解,可用或树表示。将一个复杂的问题变换成若干个等价的问题的过程称为等价变换,可用与树表示
10.(T)本原问题所对应的节点称为终叶节点。终叶节点一定是端节点,但端节点不一定是终止节点
四、简答题1.BP学习算法的基本思想是什么?
BP学习算法的基本思想是调整权值,使得神经网络的实际输出能够逼近样本与函数的实际输出。
2.2016年ALphaGo挑战韩国职业九段选手李世石获胜,2017年与当时世界排名第一的中国棋手柯洁对战获胜,ALphaGoZERO已经从观摩人类棋局进化到自己与自己下棋,你觉得这属于强人工智能还是弱人工智能,并结合此事件分析什么是强人工智能,什么是弱人工智能,以及它们的区别。
我觉得属于弱人工智能,ALphaGo虽然战胜了人类冠军,可它没有自我意识,更没有胜利的喜悦,因为弱人工智能是对人类某项智能的模拟与扩展,ALphaGo仍然属于这个范畴,而强人工智能是指机器真正能思维,具有自我意识,我觉得ALphaGo的计算依然只是特征的抽取与模型的建立,还谈不上真正的思维,所以属于弱人工智能。(参考)
3.
4.设有子句集:
S={~A(x,y)∨~B(y)∨C(f(x)),~A(x,y)∨~B(y)∨D(x,f(x)),~C(z)∨~B(y),A(a,b),~A(x,b)∨B(b)},请用归结原理证明这个子句集是否不可满足。并结合证明过程来讨论为什么归结原理会出现组合爆炸的问题,你觉得会导致推理程序出现什么问题?
(1)~A(x,y)∨~B(y)∨C(f(x))
(2)~A(x,y)∨~B(y)∨D(x,f(x))
(3)~C(z)∨~B(y)
(4)A(a,b)
(5)~A(x,b)∨B(b)
(6)B(b){a/x}(4)(5)
(7)~C(z){b/y}(3)(6)
(8)~A(x,y)∨~B(y){f(x)/z}(1)(7)
(9)~B(b){a/x,b/y}(4)(8)
(10)nil(6)(9)
盲目归结会产生大量的不必要的归结式,这种不必要的归结式在下一轮归结时,会以幂次方的增长速度增长,从而产生组合爆炸。这会造成智能程序无法在人可以接受的时间内完成归结。
5.设训练例子集如表所示,请用ID3算法计算出其决策树选择的第一个属性?
(注1:不需要计算出全部的决策树
注2:计算到小数点后3位。
注3:log2(1/2)=-1,log2(2/3)=-0.5850,log2(1/3)=-1.5850)
表训练例子集
初始化样本集S={S1,S2,…,S6}和属性集X={x1,x2}。
生成仅含根节点(S,X)的初始决策树。计算根节点(S,X)关于每一个属性的信息增益,并选择具有最大信息增益的属性对根节点进行扩展。
首先,计算根节点的信息熵:
E(S,X)=-PS(+)logPS(+)-PS(-)logPS(-)
式中
PS(+)=3/6,PS(-)=3/6,log2(3/6)=-1
即有
E(S,X)=-(3/6)*log2(3/6)-(3/6)*log2(3/6)
=0.5+0.5=1
按照ID3算法,再计算根节点(S,X)关于每个属性的加权信息熵。
先考虑属性x1,对x1的不同取值:
当x1=T时,有ST={1,2,3}
当x1=F时,有SF={4,5,6}
其中,ST和SF中的数字均为例子集S中的各个例子的序号,|S|、|ST|和|SF|分别为例子集S、ST和SF的大小且有|S|=6,|ST|=|SF|=3。
由ST可知:
PST(+)=2/3,PST(-)=1/3,log2(2/3)=-0.5850,log2(1/3)=-1.5850
则有:
E(ST,X)=-PST(+)log2PST(+)-PST(-)log2PST(-)
=-(2/3)(-0.5850)-(1/3)(-1.5850)
=0.9183
再由SF可知:
PSF(+)=1/3,PSF(-)=2/3
则有:
E(SF,X)=-PSF(+)log2PST(+)-PSF(-)log2PSF(-)
=-(1/3)(-1.5850)-(2/3)(-0.5850)
=0.9183
E(S,X),xi)=(|ST|/|S|)*E(ST,X)+(|SF|/|S|)*H(SF,X)
=(3/6)*0.9183+(3/6)*0.9183
=0.9183
再考虑属性x2,对x2的不同取值:
当x2=T时,有S’T={1,2,5,6}
当x2=F时,有S’F={3,4}
其中,S’T和S’F中的数字均为例子集S中的各个例子的序号,|S|、|S’T|和|S’F|分别为例子集S、S’T和S’F的大小且有|S|=6,|S’T|=4,|S’F|=2。
由S’T可知:
P’ST(+)=2/4,P’ST(-)=2/4,log2(2/4)=-1
则有:
E(S’T,X)=-P’ST(+)log2P’ST(+)–P’ST(-)log2P’ST(-)
=-(2/4)(-1)-(2/4)(-1)
=1
再由S’F可知:
P’SF(+)=1/2,P’SF(-)=1/2,log2(1/2)=-1
则有:
E(S’F,X)=-(P’SF(+)log2P’ST(+)-P’SF(-)log2P’SF(-))
=-(1/2)(-1)-(1/2)(-1)
=1
E(S,X),x2)=(|S’T|/|S|)*E(S’T,X)+(|S’F|/|S|)*H(S’F,X)
=(4/6)*1+(2/6)*1=1
据此,可得到各属性的信息增益分别为
G((S,X)x1)=E(S,X)-E(S,X),xi)=1-0.9183=0.0817
G((S,X)x2)=E(S,X)-E(S,X),x2)=1-1=0
显然,x1的信息增益更大,因此应该选择对x1进行扩展。
上一篇>>人工智能导论练习题(上)
上一篇>>人工智能导论练习题(下)