博舍

《人工智能导论》第二章:智能Agent(笔记一) 人工智能导论难不难

《人工智能导论》第二章:智能Agent(笔记一)

第二章:智能Agent一.Agent和环境二.好的行为:理性的概念三.环境的性质四.Agent的结构一.Agent和环境Agent通过传感器感知环境并通过执行器对所处环境产生影响。机器人Agent可以通过摄像头,红外测距仪作为传感器,各种马达作为执行器。软件Agent接受键盘敲击,文件内容和网路数据包作为传感器输入,并以屏幕显示,写文件和发送网络数据包为执行器来作用于环境。Agent的感知序列:是该Agent所收到的所有输入数据的完整历史。Agent函数:描述Agent的行为,它将任意给定感知序列映射为行动。(1)人造Agent的Agent函数通过Agent程序实现,Agent程序是具体实现。二.好的行为:理性的概念理性是使期望的性能最大化理性Agent:理性Agent是做事正确的Agent,即对于每一可能的感知数据序列,一个理性的Agent应该采取一个行为以达到最大的性能。理性的判断:(1)性能度量:一个客观的标准来评价Agent的行为的成功性3.理性agent能够进行信息收集,理性的agent应该具有自主性,能够进行学习三.环境的性质任务环境:包括性能度量,环境,Agent的执行器和传感器,英文缩写为PEAS.(设计Agent时,第一步就是尽可能完整地详细说明任务环境)例子:(1)自动驾驶出租车:(2)挑拣零件机器人:(3)交互式英语教学者:环境的性质决定了Agent的设计,也决定了实现Agent的主要技术群体的实用性。任务环境分类:(1)分类一:完全可观察的vs.部分可观察的如果Agent根本没有传感器,环境则是无法观察的(2)分类二:单agentvs.多agent(3)分类三:确定的vs.随机的如果环境的下一个状态完全取决于当前状态和Agent执行的动作,则环境是确定的。否则,它是随机的。我们说环境不确定是指它不是完全可观察的或不确定的(4)分类四:片段式的vs.延续式的片段式:Agent的经历被分成一个个原子片段,在每个片段中Agent感知信息并完成单个行动,下一个片段不依赖于以前的片段.延续式:在延续环境中,当前决策会影响到所有未来的决策。(5)分类五:静态的vs.动态的如果环境在Agent计算的时候会变化,则该Agent环境是动态的;否则为静态半动态的:环境本身不变化但Agent的性能评价随时间变化。(6)分类六:离散的vs.连续的环境的状态,时间的处理方式以及Agent的感知信息和行动都有离散/连续之分(7)分类七:已知的vs.未知的Agent的知识状态

最难处理的状态:部分可观察的,随机的,连续的,动态的,延续式的,多agent的

四.Agent的结构AI的任务是设计Agent程序,它实现的是把感知信息映射到行动的Agent函数体系结构:具备物理传感器和执行器的计算装置。Agent=体系结构+程序Agent程序(1)以传感器得到的当前感知信息为输入(2)以执行器的行动为输出注意:Agent程序以当前感知为输入,而Agent函数是以整个感知历史作为输入的。如果Agent的行为要依赖于整个感知序列,那么该Agent必须要记住感知信息。Agent的表驱动方法的缺点:(1)表太大(2)创建表时间长(3)非自主性,需人工填写(4)即使能够学习,也需要很长的时间四种基本的Agent程序(1)简单反射Agent:基于当前的感知选择行动,不关注感知历史

(2)基于模型的反射Agent:Agent根据感知历史维持内部状态,Agent随时更新内部状态信息

(3)基于目标的Agent:除了根据感知信息之外,还要根据目标信息来选择行动,但效率比较低,需要推理。

(4)基于效用的Agent:当达到目标的行为有很多种的时候,需要考虑效率。环境是部分可观察的和随机的,不确定下的决策过程可以通过基于效用的agent来实现。

学习Agent可被划分为4个组件(1)性能元件:相当于整个agent(2)评判元件:反映性能元件做得如何(3)学习元件:负责改进提高(4)问题产生器:提出一些新的有建设性的探索尝试Agent的基本特性:(1)自治性(Autonomy):Agent能根据外界环境的变化,而自动地对自己的行为和状态进行调整,而不是仅仅被动地接受外界的刺激,具有自我管理自我调节的能力。(2)反应性(Reactive):能对外界的刺激作出反应的能力(3)主动性(Proactive):对于外界环境的改变,Agent能主动采取活动的能力。(4)社会性(Social):Agent具有与其它Agent或人进行合作的能力,不同的Agent可根据各自的意图与其它Agent进行交互,以达到解决问题的目的。(5)进化性:Agent能积累或学习经验和知识,并修改自己的行为以适应新环境

人工智能思维脑图

分享一下之前学习AI时的制作的几张脑图,包含几个学习AI过程中常见的问题。能力有限,如有任何问题望大佬指出。

一:几种不同的归一化方法(normalziation)

 二:几个常见的机器学习算法

三:模型过拟合的解决办法

 

四:回归模型的损失函数

五:目标检测损失函数

 

 

六:正则化的方法 

七:优化器

八:梯度问题

九:数据不足问题

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇