博舍

人工智能与信息社会——基于神经网络的智能系统II 人工智能神经网络的特点是什么呢

人工智能与信息社会——基于神经网络的智能系统II

1.【单选题】(C)有跟环境进行交互,从反馈当中进行不断的学习的过程。

A、监督学习

B、非监督学习

C、强化学习

D、线性回归

2.【单选】

典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于(A)

A.非监督学习

B.

线性回归

C.

监督学习

D.

强化学习

3.【单选题】Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的(A)。

A、期望值

B、最大值

C、最小值

D、总和

4.【单选】

在Q-Learning中,所谓的Q函数是指(A)

A.状态动作函数B.策略函数C.状态值函数

D.动作值函数

5.【单选题】在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越(A)。

A、大;小

B、大;大

C、小;小

D、小;大

6.【单选】在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越____,保持旧的结果的比例越____。(B)

A.大;大B.大;小C.小;小

D.小;大

7.【单选题】在强化学习过程中,(A)表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

A、探索;开发

B、开发;探索

C、探索;输出

D、开发;输出

8.【单选题】强化学习中,(A)主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。

A、探索

B、开发

C、输入

D、输出

9.【单选题】马尔可夫性质强调在每一个动作状态序列中,下一个状态与(D)有关。

A、外部影响

B、主体内因

C、历史状态

D、当前状态

10.【单选题】强化学习的回报值一个重要特点是具有(D)。

A、客观性

B、主体性

C、超前性

D、滞后性

11.【多选题】用于监督分类的算法有(ABC)。

A、支持向量机

B、决策树

C、神经网络

D、线性回归

12.【判断题】人工智能学习玩FlappyBird过程中,只需要人类告诉AI不能碰到水管即可,不需要提供其他信息。( × )

13.【判断题】状态动作函数直接决定主体该采取什么决策。(√ )

14.【填空】在支持向量机分类算法中,用于支撑两个类别最宽分解线的这些样本点称为_______。

填空:支持向量或supportvector##%_YZPRLFH_%##SupportVector##%_YZPRLFH_%##Supportvector

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇