博舍

人工智能导论测试题——第七章 机器学习 人工智能样本

人工智能导论测试题——第七章 机器学习

人工智能导论测试题——第七章机器学习

1单选

下列关于有监督和无监督学习说法中不正确的是(C)

A.无监督学习与有监督学习相比更加接近人类学习的过程B.有监督学习训练数据的获得需要专业人士进行标注C.有监督学习有明确的学习目标,而无监督学习没有D.K近邻算法中无需对训练数据进行训练

2单选

下列关于无监督学习的说法不正确的是(B)

A.自动编码器可以用于图像抗噪和数据降维B.聚类算法中最终的类别之间可能有少量样本的交叉C.自动编码器包含“编码”和“解码”两部分D.K-means算法中可以随机划分样本为K堆,以K堆的平均重心作为初始的K个点

3单选

下列关于弱监督学习的说法不正确的是(B)

A.弱监督学习只对部分的样本引入标注知识B.弱监督学习等价于半监督学习C.迁移学习的核心思想是将利用在任务A上获得的经验去解决相似的任务BD.半监督学习通过学习有标记的数据,逐渐扩展无标注的数据

4单选

下列关于强化学习的说法正确的是(A)

A.在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境B.强化学习的概念是从Alphago战胜李世石之后才提出的C.强化学习属于无监督学习的一种,不需要有监督信息D.强化学习和有监督学习的过程相似,是“开环”的过程

5单选

有关机器学习,说法错误的是:(D)

A.学习系统使用样本数据来建立并更新模型,并以可理解的符号形式表达,使经过更新后的模型处理同源数据的能力得以提升B.机器学习系统利用经验来改善计算机系统自身的性能C.计算机学习人解决问题的“经验”,并模仿人来解决问题D.机器学习系统不可以学习人的判断过程

6单选

下列关于有监督机器学习的算法中,说法正确的是(C)

A.属性在决策树中的位置不同,并不会影响决策树的效率B.K近邻算法中,K值的选择,不会对分类结果有很大影响C.如果一个属性对于所有样本都没有区分能力,那么对于决策毫无用处D.单一支持向量机模型本身是针对多分类问题的算法

7单选

以下关于无监督学习说法错误的是(D)

A.自动编码器常应用于图像抗噪和数据降维B.与有监督学习相比,无监督学习更接近人类学习的过程C.聚类算法中,不同类别之间样本不交叉D.聚类算法中,同一类别内部样本的相似度较低

8单选

以下哪个是弱监督学习的特点(B)

A.方法简单、数据成本低,但性能难以提升B.对部分数据引入监督,使用间接的答案信息C.全部样本都需要人工标注D.不需要人工标注任何知识

9单选

描述弱监督的是:(D)

A.以上都不是B.方法丰富、研究充分、性能好、成本高C.方法简单、数据成本低、性能难以提升D.对部分数据引入监督

10单选

关于决策树,说法有误的是:(B)

A.如果根据一个属性做判断,样本仍然有若干种情况,则该属性不应该出现在决策早期B.决策树算法是无监督学习C.规则归纳问题,适合用决策树来表示D.属性在决策树中的位置不同,决策树的效率是不同的

1人工智能概述

文章目录1.4机器学习工作流程学习目标1什么是机器学习2机器学习工作流程机器学习工作流程总结2.1获取到的数据集介绍2.2数据基本处理2.3特征工程2.4机器学习2.5模型评估拓展阅读完整机器学习项目的流程3小结1.4机器学习工作流程学习目标了解机器学习的定义知道机器学习的工作流程掌握获取到的数据集的特性1什么是机器学习

-机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

2机器学习工作流程

机器学习工作流程总结

1.获取数据2.数据基本处理3.特征工程4.机器学习(模型训练)5.模型评估

结果达到要求,上线服务没有达到要求,重新上面步骤2.1获取到的数据集介绍

数据简介在数据集中一般:

一行数据我们称为一个样本一列数据我们成为一个特征有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)

数据类型构成:

数据类型一:特征值+目标值(目标值是连续的和离散的)数据类型二:只有特征值,没有目标值

数据分割:机器学习一般的数据集会划分为两个部分:

训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效

划分比例:

训练集:70%80%75%测试集:30%20%25%2.2数据基本处理

-即对数据进行缺失值、去除异常值等处理

2.3特征工程

2.3.1什么是特征工程特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。

意义:会直接影响机器学习的效果

2.3.2为什么需要特征工程(FeatureEngineering)机器学习领域的大神AndrewNg(吴恩达)老师说“Comingupwithfeaturesisdificult,time-consuming,requiresexpertknowledge.“Appliedmachinelearning"isbasicallyfeatureengineering.”注:业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。2.3.3特征工程包含内容

特征提取特征预处理特征降维

2.3.4各概念具体解释特征提取

将任意数据(如文本或图像)转换为可用于机器学习的数字特征特征预处理通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程特征降维指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程2.4机器学习

选择合适的算法对模型进行训练(具体内容见1.5)

2.5模型评估

对训练好的模型进行评估(具体内容见1.6)

拓展阅读完整机器学习项目的流程

1抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的明确我们可以获得什么样的数据,抽象出的问题,是一个分类还是回归或者是聚类的问题。2获取数据

数据决定了机a学习结果的上限,而算法只是尽可能逼近这个上限。数据要有代表性,否则必然会过拟合。而且对于分类问题,数据偏斜不能过于严重,不同类别的数据数量不要有数量级的差距。而且还要对数据的量级有一个评估,多少个样本,多少个特征,可以估算出其对内存的消耗程度,判断训练过程中内存是否能够放得下。如果放不下就得考虑改进算法或者使用一些降维的技巧了。如果数据量实在太大,那就要考虑分布式了。

3特征预处理与特征选择

良好的数据要能够提取出良好的特征才能真正发挥作用。特征预处理、数据清洗是很关键的步骤,往往能够使得算法的效果和性能得到显著提高。归一化、离散化、因子化、缺失值处理、去除共线性等,数据挖掘过程中很多时间就花在它们上面。这些工作简单可复制,收益稳定可预期,是机器学习的基础必备步骤。筛选出显著特征、摒弃非显著特征,需要机器学习工程师反复理解业务。这对很多结果有决定性的影响。特征选择好了,非常简单的算法也能得出良好、稳定的结果。这需要运用特征有效性分析的相关技术,如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法。

4训练模型与调优

直到这一步才用到我们上面说的算法进行训练。现在很多算法都能够封装成黑盒供人使用。但是真正考验水平的是调整这些算法的(超)参数,使得结果变得更加优良。这需要我们对算法的原理有深入的理解。理解越深入,就越能发现问题的症结,提出良好的调优方案。

5模型诊断如何确定模型调优的方向与思路呢?这就需要对模型讲行诊断的技术。

3小结

机器学习义【掌握】

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

·机器学习工作流程总结【掌握】1.获取数据2.数据基本处理3.特征工程4.机器学习(模型训练)5.模型评估

结果达到要求,上线服务没有达到要求,重新上面步骤

获取到的数据集介绍【掌握】

数据集中一行数据一般称为一个样本,一列数据一般称为一个特征。数据集的构成:-由特征值+目标值(部分数据集没有)构成为了模型的训练和测试,把数据集分为:-训练数据(70%-80%)和测试数据(20%-30%)特征工程包含内容【了解】特征提取特征预处理特征降维

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇