博舍

人工智能的基础是什么 奠定了人工智能理论基础的是什么

人工智能的基础是什么

人工智能的基础是什么

知识是人类智能的基础,人类在从事阶级斗争、生产斗争和科学试验等社会实践活动中,其智能活动过程主要是一个获取知识并运用知识的过程。

人工智能是一门研究用计算机来模仿和执行人脑的某些智力功能的交叉学科,所以人工智能问题的求解也是以知识为基础的。

如何从现实世界中获取知识、如何将已获得的知识以计算机内部代码的形式加以合理的表示以便于存储,以及如何运用这些知识进行推理以解决实际的问题,即知识的获取、知识的表示和运用知识进行推理是人工智能学科要研究的3个主要问题。

在人们的日常生活及社会活动中,“知识”是常用的一个术语。例如,人们常说“我们要掌握现代科学知识”,“掌握的知识越多,你的机会就越多”等。人们所涉及的知识也是十分广泛的,例如,有的知识是多数人所熟悉的普通知识,而有的知识只是有关专家才掌握的专门领域知识。那么,到底什么是知识?知识有哪些特性?它与通常所说的信息有什么区别和联系?

现实世界中每时每刻都产生着大量的信息,但信息是需要用一定的形式表示出来才能被记载和传递的。尤其是使用计算机来进行信息的存储及处理时,更需要用一组符号及其组合进行表示。像这样用一组符号及其组合表示的信息称为数据。

数据与信息是两个密切相关的概念。数据是记录信息的符号,是信息的载体和表示。信息是对数据的解释,是数据在特定场合下的具体含义。只有把两者密切地结合起来,才能实现对现实世界中某一具体事物的描述。

另外,数据和信息又是两个不同的概念,相同的数据在不同的环境下表示不同的含义,蕴涵不同的信息。比如,“100”是一个数据,它可能表示“100元钱”,也可表示“100个人”,若对于学生的考试成绩来说,可能表示“100分”。同样,相同的信息也可以用不同的数据表示出来。比如,地下工作者为了传达情报信息,可以用一首诗词的每一句的第一个字组成一句话,或诗的斜对角线上的字组成的一句话来传达信息,也可能会用一个代码或数字来表示同一信息。

正如上述,现实生活中,信息是要以数据的形式来表达和传递的,数据中蕴涵着信息,然而,并不是所有的数据中都蕴涵着信息,而是只有那些有格式的数据才有意义。对数据中的信息的理解也是主观的、因人而异的,是以增加知识为目的的。

人工智能的基本概念有几方面

对于人工智能,很多人并不了解,我也如此。关于这个问题,我与我的朋友人工智能工程师张思楠进行了一番关于人工智能的交流。下面我把这些交流写出来,目的是普及一下关于人工智能的知识,对当下正在进行的人工智能工程提出自己的意见和建议,展望人工智能的未来。

既然是人工智能对话录,那么我想,我们有必要先了解关于人工智能的几个基本概念。

第一,什么是人工智能;

第二,人工智能是一门什么科学;

第三,人工智能的发展历史。

这几个基本概念的提出,源于张思楠介绍给我的一本书——《人工智能,一种现代的方法》。在这本书的绪论中,作者用了这三个小标题:1、什么是人工智能;2、人工智能的基础;3、人工智能的历史。我想,如果思考人工智能的基本概念的话,也应该从这几个问题和这几个角度入手。

我知道“人工智能”这个词汇,是因为那部著名的电影《人工智能》,很多人大概也是如此。但是,那部电影很难涵盖我们目前的人工智能工程。而今天我们生活中充斥的“人工智能”,则大多是智能手机、智能家居、智能汽车等智能硬件,与我们理想中的“人工智能”又相去甚远。所以,我们很有必要重新理解一下关于人工智能的这几个基本概念。

《人工智能,一种现代的方法》中这样解释了那三个小标题。

人工智能是类人行为,类人思考,理性的思考,理性的行动。人工智能的基础是哲学,数学,经济学,神经科学,心理学,计算机工程,控制论,语言学。人工智能的发展,经过了孕育,诞生,早期的热情,现实的困难等数个阶段。

照这种说法,类人的行为是人工智能在外的表现形式,类人的思考是人工智能的“智能基础”,而理性的思考和行动,则是接近人类、与人类等同甚至超越人类的高级智能行为了。

那么,张思楠是如何看待这几个问题的呢?以下是他的见解。

第一,什么是人工智能。重点是智能,个人更习惯词上的拆分:智慧、能力。在这里可以把智能理解为获取知识的能力,这包括识别能力,推理演绎能力,归纳能力,统计与分析能力等,当然也包括对已经入手知识的补充和应用。研究人类的情绪波动或许在生物心理学或是生物学亦或是仿生学方面是重要的,但人工智能的研究更侧重体现在对智能的研究上。

人工智能即由人类造的智能实体,这种智能实体,只是在标准和功能上要求与人的思考与认识水平相近或是超越人类,但并不代表这样的智能实体的运行模式和思考模式完全和人类相同,因为人从机器角度看的话漏洞更大。(对于这段话,我更愿意将人工智能理解为两个意思,一个是人类制造的智能实体,一个是人类制造这个实体的过程。)

第二,人工智能是一门什么科学。人工智能科学的主旨是研究和开发出智能实体,在这一点上它属于工程学。但是,正如我们所知道的那样,技术是工程得以实施的前提,这就需要我们对一些能够满足于此工程需求的知识学习,而这涉及的学科就相当庞大了。

工程的一些基础学科自不用说,数学、逻辑学、归纳学、统计学、系统学、控制学、工程学、计算机科学,还包括对哲学、心理学、生物学、神经科学、认知科学、仿生学、经济学、语言学等其他学科的研究,可以说这是一个集数门学科精华的尖端学科中的尖端学科。通常情况下,人工智能科学家都包含着除此之外的诸多头衔:数学家,逻辑学家,数理逻辑学家,哲学家等等。(笔者这样理解这个问题,既然人工智能是一门综合科学,那今后是不是会出现一门叫人工智能学的新学科呢?)

第三,人工智能的发展历史。广义上,这个需要追溯到古代历史,因为在历史上我们总能看到人们对智能研究工作的闪光之处。但是我们狭义下的人工智能的发展史,而非逻辑史或智能史亦或其他能够构成此学科需要的学科的发展历史,要从20世纪40年代左右的时间开始算起。

一开始(人工智能)是从对神经网络研究工作开始的,这应该归功于弗雷格以及罗素和怀海特在数理逻辑上的工作以及图灵的计算理论。再到后来,1950年底一台神经网络计算机(SNARC)出世。再后来,人工智能的研究有了两个大致的方向,一开始处于劣势的利用神经网络进行人工智能开发的连接主义派和符号模型派。大约到1980年左右,神经网络才重新得到重视。事实上在这个时候之前,有过一段被称为人工智能的冬天的一段时期。

起初人工智能的商业化——商用专家系统R1服务于DEC并节省了这家数据设备公司一年几千万美元的不必要资金,这使得大家对人工智能的现状和发展过于乐观。那个时候几乎每个有能力的公司都会开一个属于自己的人工智能系统研发小组,但很多公司都因无法达到当时的预订目标而垮掉。

大概在1990年左右,人工智能的一些问题得到较为满意的解决,而WEB的应用促使了AI产业的发展。AI的技术成为许多现有东西的基础,最普遍的搜索引擎,就是这样技术的最佳体现。但人工智能发展的同时也伴随着很多问题和很多质疑,譬如我们最近在网上看到的一些信息。比如据国外媒体报道,斯蒂芬·霍金曾警告“人工智能完全体的发展可能意味着人类的终结”,伊隆·马斯克担心人工智能的发展可能是人类生存面临的最大威胁,比尔·盖茨则提醒人们要小心人工智能。对于这些疑虑,人们会产生诸如此类的疑问甚至恐惧,但这也是正常的,进化必然伴随着风险与质疑,但不能因此而放弃向前推进。人

工智能在今天有了更好的发展环境,大数据、数据挖掘、神经网络、云计算等炙手可热的技术则成为了AI技术发展的温床。

以上的说法我个人认为是简单明了的,不知对您有何启示。曾几何时,诸葛亮的木马流牛让我们神往、让我们困惑不已。但今天看来,如果木马流牛为真,那也堪称是一种初级的人工智能。如今,我们要思考与憧憬的远非木马流牛了,而是更高级更加奇妙的人工智能。在了解并探讨了人工智能的几个基本概念之后,我们在下一步将会讨论人工智能的发展现状以及存在的问题。

《人工智能及其应用》重点回顾

1.1人工智能的发展阶段

        1.孕育时期(1956年前)人工智能开拓者们在数理逻辑、计算本质、控制论、信息论、自动机理论、神经网络模型和电子计算机等方面做出的创造性贡献,奠定了人工智能发展的理论基础。

        2.形成时期(1956-1970)

        AI诞生于一次历史性的聚会—达特茅斯会议,迅速发展,过于乐观

        3.暗淡(低潮)时期(1956-1970)

        过高预言的失败,给AI的声誉造成重大伤害,同时,许多人工智能理论和方法未能得到通用化和推广应用,专家系统也尚未获得广泛开发。因此看不出人工智能的重要价值。究其原因,当时的人工智能主要存在以下三个局限性:(1)知识局限性(2)解法局限性(3)结构局限性

        4.知识应用时期(1970-1988)   

         计算机视觉、机器人、自然语言理解、机器翻译等AI应用研究获得发展。

    在开发专家系统的过程中,许多研究者获得共识:人工智能系统是一个知识处理系统,人工智能的三个基本问题:知识表示、知识利用、知识获取

         5.集成发展时期(1986年至今)

     机器学习、人工神经网络、计算智能、智能机器人和行为主义研究趋向热烈和深入。

        计算智能(CI)弥补了人工智能中在数学理论和计算上的不足,更新和丰富了人工智能理论框架,使人工智能进入一个新的发展时期。

1.2人工智能的各种认识观

     人工智能研究形成了符号主义、连接主义和行为主义三大学派

         符号主义:又称逻辑主义,起源于数理逻辑,认为人的认识基元是符号,认知过程即符号操作过程,认为人是一个物理符号系统,计算机也是一个物理符号系统,因此能够用计算机来模拟人的智能行为。认为人工智能的核心问题是知识表示、知识推理和知识运用。

    连接主义:又称仿生学派或生理学派,认为思维基元是神经元,而不是符号处理过程。认为人脑不同于电脑,并提出连接主义的大脑工作模式,用于取代符号操作的电脑工作模式。使用结构模拟方法:模拟人的生理神经网络结构,不同的结构表现出不同的功能和行为。认为功能、结构和智能行为是不可分的。

    行为主义:认为智能取决于感知和行动(所以被称为行为主义),提出智能行为的“感知—动作”模式。认为智能不需要知识、不需要表示、不需要推理;人工智能可以象人类智能一样逐步进化(称为进化主义);智能行为只能在现实世界中与周围环境交互作用而表现出来。

3.4消解原理

 将下列谓词演算公式化为一个子句集       

     1、消去蕴含符号

    只应用∨和~符号,以~A∨B替换A→B。   

    2、减少否定符号的辖域

     将~内移,每个否定符号~最多只用到一个谓词符号上,并反复应用狄·摩根定律。

    3、变量标准化

    不同的量词使用不同的变量名,对哑元(虚构变量)改名,以保证每个量词有其自己唯一的哑元

     4、去掉存在量词

    两种情况:

    ①“存在”在某些“任意”的作用域内,转成Skolemfunction

     ②“存在”不在“任意”的作用域内,直接去掉存在量词,将对应的变量写成一个常量表达式

    5、化为前束形

    将所有的“任意”移到公式的最前面,并使每个量词的辖域包括这个量词后面公式的整个部分

     6、把母式写成合取范式的形式

    任何母式都可写成由一些谓词公式和(或)谓词公式的否定的析取的有限集组成的合取。

     7、去掉全称量词

    所有余下的量词均被全称量词量化了。消去前缀,即消去明显出现的全称量词。

     8、消去合取词∧

    用{A,B}代替(A∧B),消去符号∧。最后得到一个有限集,其中每个公式是文字的析取

     9、更换变量名称

    使相同的变元不会出现在不同的子句中

     4.4主观贝叶斯

  更新贝叶斯公式:

        

        

 

    EH公式

        

  CP公式

        

 

 

4.5可信度方法

 CF(H,E)的计算公式:

                

 1、组合证据(前提证据事实总CF值计算,最大最小法)

         

2、推理结论的CF值计算

        CF(H)=CF(H,E)×max{0,CF(E)} 

3、重复结论CF值计算

5.2神经计算

 

        

5.4模糊计算

    遗传算法的执行过程

                (1) 初始化群体;

                (2) 计算群体上每个个体的适应度值;

                (3) 按由个体适应度值所决定的某个规则选择将进入下一代的个体;

                (4) 按概率Pc进行交叉操作;

                (5) 按概率Pc进行突变操作;

                (6)若没有满足某种停止条件,则转第(2)步,否则进入下一步。

                (7)输出群体中适应度值最优的染色体作为问题的满意解或最优解。

    简单遗传算法的操作主要有:

        选择、交叉、变异

7.4决策树学习

         熵的计算公式:

           信息增益:

信息论在人工智能方面应用

香农三大定理与新社会人工智能发展的羁绊:

克劳德·艾尔伍德·香农(ClaudeElwoodShannon,1916年4月30日-2001年2月24日)是美国数学家、信息论的创始人。1936年获得密歇根大学学士学位。1940年在麻省理工学院获得硕士和博士学位,1941年进入贝尔实验室工作。

香农提出了信息熵的概念,为信息论和数字通信奠定了基础。

 主要论文有:1938年的硕士论文《ASymbolicAnalysisofRelayandSwitchingCircuits》,1948年的《通讯的数学原理》和1949年的《噪声下的通信》。

 

信息论概述

信息论是运用概率论与数理统计的方法研究信息传输和信息处理系统中一般规律的新兴学科。核心问题是信息传输的有效性和可靠性以及两者间的关系。

信息论作为一门科学理论,发端于通信工程。它具有广义和狭义两个概念:

狭义信息论是应用统计方法研究通讯系统中信息传递和信息处理的共同规律的科学,即研究概率性语法信息的科学;

广义信息论是应用数学和其他有关科学方法研究一切现实系统中信息传递和处理、信息识别和利用的共同规律的科学,即研究语法信息、语义信息和语用信息的科学。

信息是事物及其属性标识的集合

信息就是信息,信息是物质、能量、信息及其属性的标示。

信息是确定性的增加。即肯定性的确认。

信息论形成和发展

人们对于信息的认识和利用,可以追溯到古代的通讯实践。中国古代的“烽燧相望”和古罗马地中海诸城市的“悬灯为号”,可以说是传递信息的原始方式。随着社会生产的发展,科学技术的进步,人们对传递信息的要求急剧增加。到了20世纪20年代,如何提高传递信息的能力和可靠性已成为普遍重视的课题。美国科学家N.奈奎斯特、德国K.屈普夫米勒、前苏联A.H.科尔莫戈罗夫和英国R.A.赛希尔等人,从不同角度研究信息,为建立信息论作出很大贡献。1948年,美国数学家C.E.香农(被称为是“信息论之父”)出版《通信的数学理论》,1949年发表《噪声中的通信》,从而奠定了信息论的基础。20世纪70年代以后,随着数学计算机的广泛应用和社会信息化的迅速发展,信息论正逐渐突破香农狭义信息论的范围,发展为一门不仅研究语法信息,而且研究语义信息和语用信息的科学。它的建立是人类认识的一个飞跃。世界上各种事物都是充满矛盾不断发展的,物质的运动主要是靠内部矛盾运动所产生的能量,而事物之间的普遍联系则靠的是信息。信息是关于事物的运动状态和规律,而信息论的产生与发展过程,就是立足于这个基本性质。信息论迅速渗透到各个不同学科领域,但还不够完善。为了适应科学技术发展的需要,迎接信息化社会的到来,一门新的科学正在迅速兴起,这就是广义信息论,或者叫做信息科学。信息科学是由信息论、控制论、计算机、人工智能和系统论等相互渗透、相互结合而形成的一门新兴综合性学科。信息科学登上现代科技舞台,与能量科学、材料科学鼎足而立,将为科学技术的发展作出贡献。

信息论的应用

信息论的意义和应用范围已超出通信的领域。自然界和社会中有许多现象和问题,如生物神经的感知系统、遗传信息的传递等,均与信息论中研究的信息传输和信息处理系统相类似。因此信息论的思想对许多学科如物理学、生物学、遗传学、控制论、计算机科学、数理统计学、语言学、心理学、教育学、经济管理、保密学研究等都有一定的影响和作用。另一方面,由于借助负熵定义的信息量只能反映符号出现的概率分布(不肯定性),不能反映信息的语义和语用层次。一篇重要的报告和一篇胡说乱道的文章可以具有同样的信息,这显然不符合常识。因此现阶段信息论的应用又有很大的局限性。把信息的度量推广到适合于语义信息和语用信息的情况,曾经做过许多尝试。但至今还没有显著的进展。

 

 

香农第一定理(可变长无失真信源编码定理)

设离散无记忆信源X包含N个符号{x1,x2,…,xi,..,xN},信源发出K重符号序列,则此信源可发出N^k个不同的符号序列消息,其中第j个符号序列消息的出现概率为PKj,其信源编码后所得的二进制代码组长度为Bj,代码组的平均长度B为B=PK1B1+PK2B2+…+PKN^kBN^k当K趋于无限大时,B和信息量H(X)之间的关系为B/k=H(X)(K趋近无穷)

香农第一定理又称为无失真信源编码定理或变长码信源编码定理。

香农第一定理的意义:将原始信源符号转化为新的码符号,使码符号尽量服从等概分布,从而每个码符号所携带的信息量达到最大,进而可以用尽量少的码符号传输信源信息。

香农第一定律讲的是,对于信源发出的所有信息涉及一个编码,一定存在一种编码方式,使得编码的平均长度无限接近与它的信息熵

举例说明:比如对汉字编码,有些字用的多,有些字用的少,因此可以把常用字的编码做的短些,生僻字的编码做的长些,但是无论怎么做,编码的平均长度一定会超过汉字的不确定性,即他们的信息熵。

这是香农第一定律的第一层意思。

它的第二层意思是一定存在一种(最优)编码方法,使得每个汉字的平均编码长度可以非常接近它的不确定性(信息熵)。至于怎么做,霍夫曼给出了一个非常简单的方法--只要把最短的编码分配给最常见的汉字即可。这种编码方法具有通用性,又称霍夫曼编码。

在计算机数据处理中,霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。

可以认为是对香农第一定律的补充。

香农第二定理(有噪信道编码定理)

当信道的信息传输率不超过信道容量时,采用合适的信道编码方法可以实现任意高的传输可靠性,但若信息传输率超过了信道容量,就不可能实现可靠的传输。设某信道有r个输入符号,s个输出符号,信道容量为C,当信道的信息传输率R

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇