博舍

人工智能数学基础 人工智能数学理论基础

人工智能数学基础

链接:pan.baidu.com/s/1E0Xwem47UgXmmkDwFlZNSQ?pwd=5im9 

提取码:5im9

数学思维的体操,也是学习人工智能的基石。在人工智能算法的学习过程中,很多初学者遭遇的挫折多半是来自看不懂算法的数学推导过程,进而无法理解算法原理,在应用中只能调整参数或换工具包,却很难优化算法。要理解一个算法的内在逻辑,没有必要的数学知识是不行的,这一点是人工智能编程和以往传统程序编程的不同之处。该书立足于帮助数据科学与人工智能相关行业的读者快速掌握相关的基本数学知识,为进一步学习打下基础,是一本值得推荐的图书。——北京大学教授、博士生导师,国家重点研发计划“智能机器人”总体专家组成员,中国人工智能学会副理事长刘宏数学是一切自然科学的基础。以机器学习和深度学习为代表的人工智能的核心理论基础就是数学。《人工智能数学基础》这本书涵盖了高等数学、线性代数、概率论以及数理统计等相关学习人工智能必要的数学知识,对于广大AI学习者和研究者掌握必要数学理论和查漏补缺具有重要意义。——贝叶斯统计方向硕士,深度学习算法工程师,微信公众号“机器学习实验室”主编,《深度学习笔记》作者鲁伟人工智能+Python是当今互联网非常火热的“领域+工具”组合,但千万不要做“工具人”,3行代码的人脸识别是没有用的,打好数学基础,年入百万才不是梦!——某数据中台创业公司担任SolutionArchitect「红色警戒:复兴」联合创始人,公众号『Python专栏』主编杨庆麟数学是人工智能之基石。该书系统性介绍了人工智能相关的必要数学基础知识,同时结合了代码实战,值得一读。——某AI公司联合创始人,公众号《磐创AI》主编史周安对于人工智能的从业者而言,编程能力决定其下限,数学基本功则决定其上限。唐宇迪博士和李林教授等人编写这本书详细介绍了人工智能所涉及的高等数学、线性代数、概率论与数理统计相关知识,同时也剖析了机器学习的经典算法。不仅如此,该书还给出了大量Python实战代码,这是一本理论与实战兼备的人工智能入门书籍。——中国民航大学硕士,CSDN博客专家,《机器学习入门:基于数学原理的Python实战》作者戴璞微数学是人工智能的基础,掌握和运用数学知识将是开启人工智能算法黑箱的钥匙。本书温故了我们似曾相识又很陌生的数学知识,通过Python代码和丰富的案例建立起数学与人工智能的桥梁。在全球人工智能浪潮中,它恰逢其时的出现,对各位正在学习人工智能技术的广大学生和打算转型从事人工智能算法开发的广大工程师来说是一本不可多得的好书,也使得只会调用工具包,到看懂算法背后的数学推导,再到有能力结合实际问题做相应的算法优化成为可能。——上海交通大学计算机博士,中文知识图谱zhishi.me创始人,《知识图谱:方法、实践与应用》作者王昊奋

目录

第1章人工智能与数学基础..........11.1什么是人工智能............................21.2人工智能的发展............................21.3人工智能的应用............................41.4学习人工智能需要哪些知识.............51.5为什么要学习数学.........................71.6本书包括的数学知识......................8第1篇基础篇.................................................................9第2章高等数学基础.................102.1函数..........................................112.2极限..........................................132.3无穷小与无穷大...........................172.4连续性与导数..............................192.5偏导数......................................242.6方向导数...................................272.7梯度.........................................292.8综合实例—梯度下降法求函数的最小值.......................................312.9高手点拨...................................352.10习题.......................................38第3章微积分..............................393.1微积分的基本思想.......................403.2微积分的解释..............................413.3定积分......................................423.4定积分的性质.............................443.5牛顿—莱布尼茨公式....................453.6综合实例—Python中常用的定积分求解方法...................................493.7高手点拨....................................513.8习题........................................52第4章泰勒公式与拉格朗日乘子法..............................534.1泰勒公式出发点..........................544.2一点一世界................................544.3阶数和阶乘的作用.......................594.4麦克劳林展开式的应用..................614.5拉格朗日乘子法..........................634.6求解拉格朗日乘子法....................644.7综合实例—编程模拟实现sinx的n阶泰勒多项式并验证结果..................674.8高手点拨...................................684.9习题.........................................68第2篇核心篇...............................................................69第5章将研究对象形式化—线性代数基础..........................705.1向量..........................................715.2矩阵.........................................735.3矩阵和向量的创建.......................775.4特殊的矩阵................................855.5矩阵基本操作..............................915.6转置矩阵和逆矩阵.......................965.7行列式.....................................1015.8矩阵的秩..................................1045.9内积与正交...............................1085.10综合实例—线性代数在实际问题中的应用.......................................1145.11高手点拨................................1215.12习题......................................126第6章从数据中提取重要信息—特征值与矩阵分解..........1276.1特征值与特征向量.....................1286.2特征空间..................................1336.3特征值分解...............................1336.4SVD解决的问题.......................1356.5奇异值分解(SVD)..................1366.6综合实例1—利用SVD对图像进行压缩.......................................1406.7综合实例2—利用SVD推荐商品.......................................1436.8高手点拨..................................1506.9习题.......................................154第7章描述统计规律1—概率论基础................................1557.1随机事件及其概率......................1567.2条件概率..................................1617.3独立性.....................................1627.4随机变量..................................1657.5二维随机变量............................1737.6边缘分布..................................1777.7综合实例—概率的应用.............1807.8高手点拨..................................1817.9习题........................................184第8章描述统计规律2—随机变量与概率估计........................1858.1随机变量的数字特征..................1868.2大数定律和中心极限定理.............1938.3数理统计基本概念......................1998.4最大似然估计...........................2038.5最大后验估计...........................2068.6综合实例1—贝叶斯用户满意度预测......................................2098.7综合实例2—最大似然法求解模型参数.......................................2178.8高手点拨................................2228.9习题.......................................224第3篇提高篇.............................................................225第9章随机变量的几种分布......2269.1正态分布................................2279.2二项分布.................................2409.3泊松分布.................................2509.4均匀分布..................................2619.5卡方分布.................................2669.6Beta分布..............................2739.7综合实例—估算棒球运动员的击中率......................................2839.8高手点拨................................2859.9习题......................................286第10章数据的空间变换—核函数变换.............................28710.1相关知识简介.........................28810.2核函数的引入.........................29010.3核函数实例............................29010.4常用核函数.............................29110.5核函数的选择.........................29410.6SVM原理............................29510.7非线性SVM与核函数的引入....30510.8综合实例—利用SVM构建分类问题......................................31010.9高手点拨................................31510.10习题...................................322第11章熵与激活函数..............32311.1熵和信息熵............................32411.2激活函数...............................32811.3综合案例—分类算法中信息熵的应用......................................33911.4高手点拨................................34111.5习题.....................................342第4篇应用篇.............................................................333第12章假设检验.....................34412.1假设检验的基本概念.................34512.2Z检验...................................35112.3t检验...................................35312.4卡方检验...............................35812.5假设检验中的两类错误..............36112.6综合实例1—体检数据中的假设检验问题.....................................36312.7综合实例2—种族对求职是否有影响.....................................36912.8高手点拨...............................37212.9习题.....................................37413章相关分析......................37513.1相关分析概述..........................37613.2皮尔森相关系数.......................37813.3相关系数的计算与假设检验........37913.4斯皮尔曼等级相关....................38513.5肯德尔系数.............................39213.6质量相关分析..........................39613.7品质相关分析..........................40013.8偏相关与复相关.......................40313.9综合实例—相关系数计算........40513.10高手点拨..............................40713.11习题.....................................408第14章回归分析......................40914.1回归分析概述...........................41014.2回归方程推导及应用..................41214.3回归直线拟合优度.....................41614.4线性回归的模型检验..................41714.5利用回归直线进行估计和预测......41914.6多元与曲线回归问题..................42114.7Python工具包.......................42614.8综合实例—个人医疗保费预测任务......................................43214.9高手点拨................................44414.10习题.....................................446第15章方差分析......................44915.1方差分析概述..........................44815.2方差的比较.............................45015.3方差分析.................................45115.4综合实例—连锁餐饮用户评级分析......................................46015.5高手点拨................................46415.6习题......................................466第16章聚类分析......................46916.1聚类分析概述..........................46816.2层次聚类................................47016.3K-Means聚类......................48416.4DBSCAN聚类.......................49416.5综合实例—聚类分析..............49916.6高手点拨.................................51216.7习题.......................................512第17章贝叶斯分析....................51317.1贝叶斯分析概述........................51417.2MCMC概述..........................52017.3MCMC采样.........................52517.4Gibbs采样...........................52917.5综合实例—利用PyMC3实现随机模拟样本分布.........................53217.6高手点拨...............................53917.7习题.....................................540

查看全部↓

精彩书摘

1.1什么是人工智能人工智能(ArtifificialIntelligence,AI)作为一门前沿交叉学科,是研究和开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人类的智能随着人类的活动无处不在,如下棋、竞技解题游戏、规划路线和驾驶车辆,都需要人工智能,如果机器能够执行这些任务,就可以认为机器具有了某种性质的人工智能。由此我们可以看出,人工智能是个很宽泛的话题。从手机上的计算器到无人驾驶汽车,再到未来可能改变世界的重大变革,人工智能可以描述很多东西。日常生活中我们每天都能接触到人工智能。互联网中各种各样的人工智能新闻随处可见,人工智能已经从一个深藏于专业实验室的科研产品,步入我们的社会生活中。人工智能带来的变化已随处可见。当你打开新闻网页时,展示给你的那些文章是由人工智能为你定制的;当你上网购物时,打开首页看到的是你最有可能感兴趣的、最有可能购买的商品,这是推荐算法根据你最近的搜索记录自动推荐的;当你打开邮箱时,系统已经为你过滤了你不关心的广告和垃圾邮件。2017年,AlphaGo以无可争辩的能力战胜了人类围棋高手,名噪一时。人工智能在无人驾驶等领域也大显身手,显示出越来越强的能力。图像识别、语音识别、指纹识别等技术给人们的生活带来了极大的便利,人工智能改变了我们的生活方式。1.2人工智能的发展

政见|国际数学大师丘成桐:人工智能时代,亟须数学理论突破

政见|国际数学大师丘成桐:人工智能时代,亟须数学理论突破

深秋的石窟河,碧蓝清幽,远山丛林掩映其中,好似一幅极美画卷。

时隔两年,国际数学大师、哈佛大学教授丘成桐再次踏上故土,发起卡拉比-丘(梅州蕉岭)数学大会。日前,在接受南方日报、南方+客户端专访时,年过七旬的他分享了自己与祖国、与家乡蕉岭的点滴故事,并为中国基础科学研究的发展和人才培育鼓与呼。

在卡拉比-丘(梅州蕉岭)数学大会开幕式上,丘成桐为首届丘镇英、若琳奖学金的获奖学生、教师代表颁奖。

“在应用人工智能技术方面,中国处于世界前沿水平,但在基础理论和算法创新方面,跟美英等国尚有差距。”丘成桐表示,在可见的未来,如何让量子人工智能与量子深度学习变成实用工具,有赖于基础科学和数学的深度结合,“如果想在人工智能等前沿领域发出中国人的声音,就一定要在基础科学上下功夫”。

“我从未忘记自己是一个中国人。”丘成桐期待,在未来十年内,能够将一批中国中学生、大学生和研究生培养出来,使得他们的学识、修养与能力达到世界一流水平。“培养人才是21世纪最重要的事,我愿尽一份心。”

丘成桐院士为第八届丘成桐数学奖获得者颁奖。

话人工智能未来

数学与基础理论突破不可或缺

南方日报、南方+客户端:1979年,您在时任中国科学院副院长、数学家华罗庚的邀请下,来到中国进行首次学术访问。此后40多年来,您为推动中国数学和基础科学发展倾注了大量心血。当下,如何理解数学和基础科学的重要性?

丘成桐:数学与基础科学的发展,对于应用科学取得重大创新和突破,具有特殊的意义。要实现国家的独立自主、长治久安,强大的数学和基础科学是必须的。

当今社会,互联网和计算机的能力很大。但现阶段,种种物理极限制约着芯片性能的进一步发展。应对方法之一,是寻找更好的算法。对此的热门研究方向,正是人工智能与大数据。

如今,机器学习和人工智能等先进算法,已经给医学和卫生保健、零售等行业带来突破。事实上,人工智能的概念早在数十年前就有了。它近期的蓬勃发展得益于三个重要因素:互联网技术带来的大数据、利用深度学习的标准算法来处理数据、超级计算机和云计算的强大计算力。

丘成桐。

然而,其中的数学理论却没有明显的突破,这也是人工智能领域存在诸多瓶颈的本源。我们很多数学方法还相对原始,过度依赖于经验总结,而非真正来自内在的数学结构。这也导致了当下人工智能在处理大数据问题时还需要大量的人力和算力,甚至需要超级计算机的协助。而且,由于缺乏数学理论的支持,很多大数据分析的结果只适用于特定环境,缺乏迁移性。

当下大热的深度学习也有很多不足之处,但暂时没有更好的算法来替代。要解决这些问题,需要对相关数学理论进行深入研究,了解大数据内在的数学结构和原理。

因此,在可见的未来,如何让量子人工智能与量子深度学习变成实用工具,实在有赖于基础科学和数学的深度结合。

南方日报、南方+客户端:中国发展人工智能面临哪些机遇和挑战?怎样才能破题?

丘成桐:人口规模是中国发展人工智能的一大优势。在应用人工智能技术方面,中国已经有了很多优秀的工作,处于世界前沿水平。但在基础理论、算法创新、量子计算等方面,中国与发达国家仍有差距。未来,中国如果想要在人工智能等核心技术实现赶超,数学和基础理论的突破是不可或缺的。

在我看来,中国的理论数学家、应用数学家鼎力合作,再加上物理学家以及其他对数学逻辑思考有贡献的学者共同参与研究,是非常重要的事。想要深入了解人工智能领域的技术结构,并且要在相关学科取得大的突破,非这样做不可。

论基础科学突破

鼓励年轻人发挥创意发展所长

南方日报、南方+客户端:您长期关注中国的基础科学研究和青少年教育。中国基础科学研究和青少年教育的水平,现如今在全球处于什么地位?

丘成桐国际会议中心建筑既有现代元素,又融入客家元素精髓。

丘成桐:此次揭幕的丘成桐国际会议中心设有数学史大纲展区,列出了2000年以前数学发展史上的重要里程碑,按时间顺序和领域分类后共列出80个不同的方向。可以看到,其中的华人数学家很少,这并非有意为之,而是客观事实。

改革开放以来,中国的基础科学有了可喜的进步,但目前在包括数学在内的基础科学研究上,中国与先进国家还存在距离。要迎头赶上,我认为,国内学界与专家应当更多把精力投给年轻一辈,让他们发展所长。权威专家尤其是科学界的老人,要带头鼓励年轻人发挥创意。政府官员、专家和教育工作者应当齐心协力培养年轻人成才。这样,我想用上十年功夫,可以培养出一批世界一流的中国本土数学家。

对于中国青少年教育,我认为同样有很大的进步空间。每年,我都会主持中学生科学竞赛,和全国优秀学生多有接触。现在参选学生的素质都很不错,而且有好几所中学每一年都相当成功,表明这些中学的数学训练是足够的,学生也很有天分和能力。

南方日报、南方+客户端:对于培育中国本土数学人才,您有给自己设定目标吗?

丘成桐:我希望在未来的十年内,能够将一批一流的中学生、大学生到研究生培养出来,使得他们的数学知识、修养与能力达到世界一流水平。这个目标完成后,相信将对中国基础科学研究的未来,带来多方面的好处。

培养人才是21世纪最重要的事。但它不是一两年能完成的,要有恒心、有毅力。我自己期待尽一份力量,推动中国基础数学研究往前走,助力中国数学家迎头赶上世界科研前沿。

南方日报、南方+客户端:当今世界正经历百年未有之大变局。维护和发展国际科技人文交流合作,有什么重要性?

丘成桐:学问是没有国界的。不管哪个国家的团队,只要数学研究或者数学教育做得好,我都希望和他们开展交流合作,并且愿意提供一些互相学习借鉴各自经验的机会。

美国基础数学的能力强,正是得益于其早期乐于吸纳别国经验的开放态度。我想,中国现在也应当如此。

丘成桐院士在丘成桐中学科学奖十周年庆上致辞。

谈中华文化传承

期盼华裔新生代更多走进中国

南方日报、南方+客户端:此次回乡,您除了发起卡拉比-丘(梅州蕉岭)数学大会,也走访了位于蕉岭县文福镇羊岃村的祖居。您对家乡有哪些新感受?

丘成桐:蕉岭风光秀丽,人文底蕴深厚,如果能有完善的配套服务,是一个很合适做学问的地方,也是艺术家的创作胜地。我期待多和朋友一同回到蕉岭,做研究、做学问。同时,也希望通过文化的兴旺,促进家乡经济发展,带动乡亲们提升生活水平。

南方日报、南方+客户端:据了解,您的祖父丘集熙和外祖父梁伯聪都是清末的秀才,您父亲是哲学教授。家风对您的成长有何影响?

丘成桐:家人的教诲和激励塑造了我。我对家乡的感情,很大程度源于家中长辈的言传身教。

我父亲是蕉岭人,后来考入省立梅州中学;母亲是梅县人。那时,外祖父梁伯聪在省立梅州中学做图书馆员。父亲的一个老师,撮合他和母亲走到了一起。我外祖父是一位很有学问的读书人,书法、画画、写诗、作赋都通晓。林风眠、李金发都是外祖父的学生。外祖父很欣赏我父亲的才华,在诗集中也提到了我父亲。在我父母订婚时,外祖父还贺诗祝福。

孩童时的丘成桐与父亲丘镇英。

从小到大,我受父亲的影响颇深。他保持了家乡农村的很多风俗。即使到了香港,父亲每年都按宗族规矩祭祖。他常常和我讲起祖父做学问的故事。外祖父的一首诗,被我父亲挂在家里客厅里面。那是一首相当长的诗,主要讲怎么做学问,还夸奖了我的父亲,也表达了对百姓的关怀。我每天看这首诗,也念得很熟。

祖父和外祖父虽然我都没有见过面,但通过不同的途径,家族文化的精髓得以代代传承,并让后代从中受益。

南方日报、南方+客户端:今年1月,您在北京获颁“2019全球华侨华人年度人物”。在您看来,如何培育海外年轻华裔对中华文化的认同感与自豪感?

丘成桐:听说我这次重回家乡梅州蕉岭,全家人都很激动。可惜由于新冠肺炎疫情的缘故,身处国外的他们不方便同行。本来孩子们都是很有兴趣的,只能以后找机会再来。

丘成桐祖居地——梅州蕉岭文福镇羊岃村镇英园。

培养华裔新生代的身份认同与文化认同,是一个重要的现实命题。我的亲身经历证明,鼓励海外年轻一代更多走进中国,零距离体验中华文化习俗,实地感知中国的发展,是拉近他们与祖(籍)国感情的“良方”。

我的两个儿子都是在美国长大。大儿子小时候中文学得很不错,还通读了《三国演义》等经典名作。相较而言,二儿子的语言天赋虽然相对一般,但他时不时会跟随我来中国,自己后来又在昆明生活过数年,交了不少当地朋友。现在,二儿子的中文比大哥讲得还要好,对中华文化既着迷又自豪。每次回到美国,他都会把亲身经历分享给朋友、同事和邻居,告诉身边人什么是真正的中华文化。

近日,丘成桐走访位于梅州蕉岭文福镇羊岃村的祖居。

我始终认为,要拉近海外华裔新生代与中国的联系,就要鼓励他们多来中国实地体验。一开始,年长者可以邀请年轻人一同回乡,沿着祖辈的足迹触碰中华文脉,体会中国发展变迁。这样,年轻人会在心里逐渐建立起对中华文化的兴趣与联系,成长为中华文化的继承者和传播者。

【采写】龚春辉黄培强汪思婷

【统筹】胡良光汤凯锋

【图片】何森垚资料图

【视频剪辑】周鑫宇

【通讯员】祝银清林剑湧

【实习生】丘睿李玉萍

【作者】龚春辉;何森垚;周鑫宇;黄培强;汪思婷

阅政观

人工智能数学理论基础综述

中图分类号:TP39;TM74文献标识码:A文章编号:2095-1302(2017)07-00-04

0引言

人工智能、空间技术和原子能技术被称为20世纪的三大科学技术成就,人工智能的研究开展是智能机器人技术、信息技术、自动化技术以及探索人类自身智能奥秘的需要[1]。科学界有一个共识,即智能化是管理、自动化、计算机以及通信等技术领域的新方法、新技术、新产品的重要发展方向。人工智能是由数学、哲学、心理学、神经生理学、语言学、信息论、控制论、计算机科学等多学科相互渗透而发展起来的综合性新学科[2]。数学使人工智能成为一门规范的科学,是人工智能发展必不可少的基础,在人工智能的各个发展阶段都起着关键的作用。目前,关于人工智能数学发展史的研究综述还很少。本文以人工智能发展的三个阶段――萌芽期、诞生期、发展期为视角,介绍了人工智能的数学基础发展史,并对其数学基础的发展趋势进行了展望。

1人工智能萌芽期的数学基础

1956年以前被称为人工智能的萌芽期,在这个期间,布尔逻辑、概率论、可计算理论取得了长足的发展。布尔逻辑是英国数学家GeorgeBoole于19世纪中叶提出,典型的一元算符叫做逻辑非(NOT),基本的二元算符为逻辑或(OR)和逻辑与(AND),衍生的二元算符为逻辑异或(XOR)[3]。在Boole逻辑的基础上,Frege发展出了一阶逻辑,研究了命题及由这些命题和量词、连接词组成的更复杂的命题之间的推理关系与推理规则[4],从而出现了谓词演算。这就奠定了人工智能抽取合理结论的形式化规则――命题逻辑和一阶谓词逻辑。

人工智能要解决各种不确定问题如天气预测、经济形势预测、自然语言理解等,这需要数学为其提供不确定推理的基础,概率理论则是实现不确定推理的数学基础。概率理论源于17世纪,有数百年的发展。瑞士数学家JacobBernoulli证明了伯努力大数定理,从理论上支持了频率的稳定性;P.S.Laplace和J.W.Lindeberg证明了中心极限定理;20世纪初,俄国数学家A.N.Kolmogrov逐步建立了概率的公理化体系;K.Pearson将标准差、正态曲线、平均变差、均方根误差等统计方法用于生物统计研究,为概率论在自然科学中的应用做出了卓越的贡献;R.Brown发现了布朗运动,维纳提出了布朗运动的数学模型,奠定了随机过程的基础;A.K.Erlang提出了泊松过程,成为排队论的开创者[5]。概率论、随机过程、数理统计构成了概率理论,为人工智能处理各种不确定问题奠定了基础。

支持向量机是人工智能的主要分类方法之一,其数学基础为核函数。1909年,英国学者JamesMercer用Mercer定理证明了核函数的存在[6]。可计算理论是人工智能的重要理论基础和工具,建立于20世纪30年代。为了回答是否存在不可判定的问题,数理逻辑学家提出了关于算法的定义(把一般数学推理形式化为逻辑演绎)。可以被计算,就是要找到一个解决问题的算法[7]。1900年,DavidHilber提出了著名的“23个问题”,其最后一个问题:是否存在一个算法可以判定任何涉及自然数的逻辑命题的真实性。1931,KurtGodel证明了这一问题,确实存在真实的局限――整数的某些函数无法用算法表示,即不可计算。在不可计算性以外,如果解决一个问题需要的计算时间随着实例规模呈指数级增长,则该问题被称为不可操作的,对这个问题的研究产生了计算复杂性。计算复杂性是讨论P=NP的问题,这个问题到现在都是计算机科学中最大的未解决问题之一[8]。关于P与NP问题有很多定义,较为典型的一种定义是在确定图灵机(人工智能之父――英??数学家图灵1937年提出的一种机器计算模型,包括存储器、表示语言、扫描、计算意向和执行下一步计算)上能用多项式求解的问题是P问题,在非确定图灵机上能用多项式求解的问题是NP问题[9]。可计算性和计算复杂性为人工智能判断问题求解可能性奠定了数学基础。

2人工智能诞生期的数学基础

1956年,麦卡锡、明斯基、香农和罗切斯特等学者召开了达特莫斯会议,该会议集聚了数学、心理学、神经生理学、信息论和电脑科学等研究领域的年轻精英。该会议历时两个月,学者们在充分讨论的基础上,首次将人工智能作为一门新学科提出来。1956年至1961年被称为人工智能的诞生期。混沌是人工智能不确定推理的新的数学理论基础,最早来源于物理学科的研究。学术界认为,第一位发展混沌现象的学者是法国数学家物理学家庞加莱,他发现了天体动力学方程的某些解的不可预见性,即动力学混沌现象。以科尔莫戈夫、阿诺德和莫泽三个人命名的KAM定理被认为是创建混沌理论的标志[10]。在概率论的基础上,出现了条件概率及贝叶斯定理,奠定了大多数人工智能系统中不确定推理的现代方法基础[5]。

3人工智能发展期的数学基础

1961年之后,被称为是人工智能的发展期。在这期间,人工智能在机器证明、专家系统、第五代计算机、模式识别、人脑复制、人脑与电脑连接以及生物智能等领域取得了很多理论和实践成果。所有的成果都离不开数学知识的支撑,人工智能的数学基础在这个时期也取得了长足的发展。

混沌与分形为人工智能的不确定推理打开了新的思路,在人工智能的发展期,混沌与分形完成了理论的发展和应用研究的开展。1963年,美国气象学家E.N.Lorenz在研究耗散系统时首先发现了混沌运动,在他当年发表的论文“确定性非周期流”中解释了混沌运动的基本特征,介绍了洛伦兹吸引子和计算机数值模拟研究混沌的方法;1971年,法国的D.Ruelle和荷兰的F.Takens首次用混沌研究湍流,发现了一类特别复杂的新型混沌吸引子;1975年,华人学者李天岩和导师J.Yorke对混沌的数学特征进行了研究,标志着混沌理论的基本形成;1979年,E.N.Lorenz在美国科学促进会的一次演讲中提出了著名的“蝴蝶效应”,使得混沌学令人着迷、令人激动,激励着越来越多的学者参与到混沌学的理论和应用研究中来。1989年,R.L.Devney给出了混沌的数学定义:设X是一个度量空间,f是一个连续映射,如果f满足以下三个条件则称为X上的混沌。(1)f是拓扑传递的;

(2)f的周期点在X中稠密;

(3)f对初始条件敏感。

混沌理论在复杂问题优化、联想记忆和图像处理、模式识别、网络通信等诸多领域都有成功的运用。YamadaT将混沌神经网络用于TSP问题优化中,结果混沌神经网络表现出强大的优化性能[11]。混沌理论在联想记忆的应用上显示出优越的性能,可应用于信息存储、信息检索、联想记忆、图像识别等方面[12]。模式识别是人工智能的主要研究问题之一,混沌学在此领域也有成功的应用,KyungRung[13]将混沌回归神经网络应用于朝鲜口语数字和单音节语音识别,与常规的回归神经网络相比,新方法的效果更佳。李绪[14]等将混沌神经网络模型应用于手写体数字识别和简单图像识别,实验显示,混沌神经网络对手写体识别正确率和可靠度高达90%以上。

1967年,法国数学家B.B.Mandelbrot提出了分形学的里程碑问题――英国海岸线有多长?成为人类研究分形几何的开端[15],分形理论是对欧氏几何相关理论的拓展和延伸。1968年,Madndelbrot和Ness提出了分形布朗运动,并给出了离散分形布朗随机场的定义[16]。PelegS于1984年提出了双毯覆盖模型[17],这是对Mandelbrot在估计英国海岸线长度时的一种推广。基于分形的理论和思想,人们抽象出一种方法论――分形方法论[17],该理论在人工智能领域的典型应用是用于网络流量分析。1993年以来,陆续有许多这方面的研究成果出现。通过对局域网高分辨率的测量分析,leland[18]发现以太网流量表现出自相似的分形性质。进一步深入研究发现,在较小的时间尺度上,网络流量体现出更复杂的变化规律,由此出现了多重分形的概念[19]。分形理论用于实现网络流量智能分析,已经有很多成功的案例,如TCP流量的拥塞控制[20],Internet流量建模[21]。陆锦军等还提出了网络行为的概念[22],用于研究大规模网络上观测到的尺度行为。

扎德对不确定性就是随机性这一长期以来的观点提出了挑战,认为有一类不确定性问题无法用概率论解决。1965年发表了论文FuzzySets,创立了模糊集合论[23]。除了传统的属于或不属于一个集合之外,模糊集认为集合之间还有某种程度隶属于的关系,属于的程度用[0,1]之间的数值表示,该数值称为隶属度。隶属度函数的确定方法大致有6种形态,包括正态(钟形)隶属度函数、岭形隶属函数、柯西隶属函数、凸凹型隶属函数、隶属函数以及线性隶属函数[24]。1978年,在模糊集的基础上,扎德提出了可能性理论,将不确定理解为与概率不同的“可能性”,与之对应的可能性测度也是一种集合赋值方法[25]。聚类在人工智能领域有大量应用,是模糊集研究的较早的一个方向[26]。模糊集理论在人工智能领域的典型应用还有数据选择[27]、属性范化[28]、数据总结等[29]。

离开了隶属度或隶属函数的先验信息,模糊集合运算难以进行,粗糙集理论研究了用不确定本身提供的信息来研究不确定性。上世纪80年代初,粗糙集的奠基人波兰科学家Pawlak[30]基于边界区域的思想提出了粗糙集的概念并给出了相应的定义。粗糙集从知识分类入手,研究在保持分类能力不变的情况下,经过知识约简,推出概念的分类规则,最后获得规则知识。粗糙集隶属度函数的定义有多种形式,典型的是YaoYY在1998年用三值逻辑进行的定义[31]。粗糙集理论的核心基础是从近似空间导出上下近似算子,典型的构造方法是公理化方法。1994年,LinTY最早提出用公理化方法研究粗糙集[32],之后不少学者对公理化方法进行了完善和改进。粗糙集在人工智能领域的应用主要体现在知识获取[33],知识的不确定性度量[34]和智能化数据挖掘[35]等方面。

传统的模糊数学存在隶属度、可能测度与概率区分不是?^对分明的问题,目前,已经无法满足很多领域对不确定推理的需要。在发现状态空间理论以及云与语言原子模型后,1993年,李德毅院士在其文献《隶属云和语言原子模型》[36]中首次提出了云的概念,并逐步建立了云模型。云模型通过3个数字特征,即期望Ex,熵En和超熵He实现定性概念到定量数据间的转化,并以云图的方式表现出来,比传统的模糊概念更直观具体。1995年,李德毅等人在其文献隶属云发生器中系统化的提出了云的概念[37]。1998年,该课题组在一维云的基础上进一步提出了二维云的数学模型和二维云发生器的构成方法[38]。2001年,杜?o提出了基于云模型的概念划分方法――云变换[39]。2003年,李德毅课题组提出了逆向云算法[40]。2004年至2007年,该课题组进一步完善了云模型的数学基础和数学性质,将云模型抽象到更深层次的普适性空间。云模型在人工智能的多个领域都有成功的应用,包括定性知识推理与控制,数据挖掘和模式识别。如1999年,李德毅将云模型用于倒立摆的控制[41];2002年,张光卫建立了基于云模型的对等网信任模型[42];2001年,岳训等人将云模型用于Web数据挖掘[43];2003年,田永青等人基于云模型提出了新的决策树生成方法[44];2009年,牟峰等人将云模型用于遗传算法的改进[45]。

贝叶斯网络起源于条件概率,是一种描述变量间不确定因果关系的图形网络模型,是目前人工智能,典型用于各种推理的数学工具。最初的贝叶斯网络时间复杂度很大,限制了其在实际工程中的应用。1986年,PEARL提出的消息传递算法为贝叶斯网提供了一个有效算法[46],为其进入实用领域奠定了数学基础。1992年,丹麦AALBORG大学基于贝叶斯网开发了第一个商业软件(HUGIN)[47],可实现贝叶斯网的推理,使贝叶斯网真正进入实用阶段。1997年,Koller和Pfeffer[48]将面向对象的思想引入贝叶斯网,用于解决大型复杂系统的建模问题。将时间量引入贝叶斯网则形成了动态贝叶斯网[47],动态贝叶斯网提供了随时间变化的建模和推理工具。贝叶斯网络节点兼容离散变量和连续数字变量则形成了混合贝叶斯网,混合贝叶斯网在海量数据的挖掘和推理上有较大优势[49]。贝叶斯在人工智能领域的应用主要包括故障诊断[50],系统可靠性分析[51],航空交通管理[52],车辆类型分类[53]等。4结语

人工智能科学想要解决的问题是让电脑也具有听、说、读、写、思考、学习、适应环境变化以及解决各种实际问题的能力。布尔逻辑、概率论以及可信计算理论为人工智能的诞生奠定了数学基础,这些数学理论经历了上百年的发展,已经比较成熟。混沌与分形、模糊集与粗糙集、云模型等人工智能的数学理论是近30年发展起来的,为不确定性人工智能奠定了数学基础,但还存在很多问题需要解决。就混沌与分形来说,其理论体系还不成熟,其应用在复杂问题的优化、联想、记忆等方面将更有生命力;对于粗糙集来说,其理论研究可以从粗糙集的扩展方面进行,并在相关模型下进行应用研究;就云模型来说,如何揭示其理论上的优势以及和其他相关模型的联系与区别,以及如何实现数值域和符号域共同表达的云模型都是值得研究的问题。贝叶斯网是人工智能领域目前最有效的推理工具,将来的研究应集中在概率繁殖算法的改进、混合贝叶斯网以及动态贝叶斯网的扩展研究等方面。

人工智能数学基础

关于腾讯AboutTencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心网站导航违规举报达人推广合作:https://kol.yuewen.com网站合作:傅女士fuli.a@yuewen.com

Copyright(C)2022book.qq.comAllRightsReserved上海阅文信息技术有限公司版权所有粤公网安备44030002000001号    增值电信业务经营许可证:粤B2-20090059    互联网ICP备案号:粤B2-20090059-5    举报电话:010-59357051营业执照网络文化经营许可证:沪网文【2020】4526-308号网络出版服务许可证:(署)网出证(沪)字第055号

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇