博舍

2023年百度大数据人工智能菁英班招生选拔通知 人工智能选拔考试

2023年百度大数据人工智能菁英班招生选拔通知

各相关学院(单位)及各位同学:

为深入推进校企联合培养,激发我校学生参与大数据人工智能研究的兴趣,投身大数据人工智能工程建设,我校联合百度设立百度大数据人工智能菁英班,面向电信学部、电气学院、数学学院、物理学院、化学学院、管理学院、钱学森班等相关专业选拔优秀学生进行培养。现将2020年百度大数据人工智能“菁英班”招生选拔事宜通知如下,请相关单位组织落实,各位同学积极报名。

一、报名条件及招生人数

相关学院大二、大三、研一、博士等在读学生,热爱大数据人工智能技术,专业成绩排名前30%,预计选拔50人。研究生一年级学生若目前没有校内成绩专业排名,可以入学成绩排名作为参考,博士生不限制成绩,大数据、软件编程算法类竞赛获奖选手可直接进入面试。

二、培养方式

“菁英班”学习期限为一年半,自2020年12月至2022年7月,不独立设班。学员需参加理论课程、项目实践、国际大数据竞赛及团队建设等阶段的学习。

1、理论课程:由百度定制的人工智能“菁英班”在线课程,学习时间可以自由安排。

2、国际大数据竞赛:菁英班全员参加“国际大数据竞赛”,培训同学们的大数据算法能力,班级成立之初会按照竞赛队伍分组学习,对于获奖团队,百度重点予以奖金及荣誉证书鼓励。不仅可以获得国际大数据竞赛奖金,另外菁英班同学还额外获得百度奖学金及证书,一等奖团队1个,二等奖团队2个,三等奖团队3个,奖金分别为10000元、5000元、3000元。

3、实践实习:课程尾声,百度邀请“菁英班”学员作为百度大数据人工智能等相关技术类大赛的特邀团队,由百度科学家作为指导老师参与整个赛事。

4、团队建设:“菁英班”学员定期开展团队建设活动。

5、评优表彰:在完成全部学习内容后,全体“菁英班”学员需进行结业竞赛考试,百度技术专家对每位学员考核,并向优秀学员发放“大数据人工智能”个人奖学金及荣誉证书。奖学金设一等奖2名,每人5000元;二等奖4名,每人3000元;三等奖6名,每人2000元。

报名并录取进入百度大数据人工智能菁英班的同学,在学习期限(2020年12月至2022年7月)须全程参与菁英班各项学习及竞赛活动。

三、选拔流程

1、报名。有意向的同学请将以下材料于11月18日前发送至邮箱baidujyb@163.com。

1)学生报名表(附件1),pdf扫描版(加盖学院公章)及word版;

2)学生成绩单(研一学生没有专业成绩可不提供,特招生提供竞赛获奖证书);

3)招生选拔汇总表(附件3),excel电子版;

4)简历(文件命名“本科/硕士/博士-专业-姓名”)。

简历中请重点写明是否担任过班干部、获奖情况(只写数学类、电子设计、涉及代码调参等相关竞赛,并注明团队角色及承担任务)。

2、面试。电信学部、百度、实践教学中心(工程坊)在确定初选名单后,将在教务处、实践教学中心(工程坊)主页上公布面试通知。

3、录取。面试结束后,实践教学中心(工程坊)将面试结果公示在教务处网站主页,公示期3天。如无异议,公示期结束后正式录取。

4、开班。

四、联系人

姓名:毕文婷 

电话:029-82667907

地址:工程坊A区513办公室

附件:1.2020年百度大数据人工智能菁英班学生报名表

     2.2020年百度大数据人工智能菁英班招生选拔汇总表

     3.2020年百度大数据人工智能菁英班教学计划

     4.百度大数据人工智能菁英班简介

实践教学中心(工程坊)

  2020年11月11日    

【人工智能】绝密考试预测

第一章绪论

1、百小度变形,问北京市城市规划有什么建议?:用自己的语言描述,哪门自然语言的在就业市场比较受欢迎?从得知问题到提出建议为止,整个技术过程以及实现过程?(分析题12分)(1)通过听觉传感器,把我们语音信号的问题,转换成数字信号的形式(2)语音识别技术,把我们每个读音转换成二进制表示(3)自然语言处理,“哪门自然语言的在就业市场比较受欢迎”处理为“哪门自然语言在就业市场容易找工作”(4)机器学习技术,通过分析每种语言在企业招聘要求的频数,发现提出的这个建议最合理2、谷歌自动驾驶汽车应用技术:(1)计算机视觉,通过图像摄取装置将被摄取的目标转换成图像信号(2)雷达技术(3)人工智能(4)监控装置(5)全球定位系统3、人工智能学科诞生的标志的什么?1956的达特茅斯会议,麦卡锡、香农等人讨论机器模拟人工智能的问题人工智能:用人工的方法在机器上实现的智能智能的特征:感知能力、记忆与思维能力、学习能力、行为能力思维的种类:逻辑思维、形象思维、顿悟思维4、早期人工智能研究者属于哪几个学科领域?数学、心理学、神经生理学、计算机等5、简述实现人工智能的主要途径(观点、学派)、其基本思想及主要代表成果?(9分)主要有三种途径:符号主义、连接主义、行为主义。符号主义:通过模拟人类的逻辑思维来实现人工智能,主要代表成果是纽厄尔和西蒙提出的“逻辑理论家”数学定理证明程序;连接主义:通过模拟人类大脑的结构来实现人工智能,主要代表成果是提出的各种人工神经网络算法;行为主义:通过模拟生物进化来实现人工智能,主要代表成果是布鲁克斯设计的“六足机器虫”。

第二章知识的表示

6、知识的概念和特性(客观题)知识的定义:1.对客观世界的认识与经验2.把有关信息关联在一起所形成的信息结构知识的特性:1.相对正确性2.不确定性3.可表示性与可利用性随机性、模糊性、经验容易引起不确定性常见的知识表示方法:一阶谓词逻辑表示法、产生式表示法、框架表示法状态空间图、人工神经网络(5种5分)为什么引入谓词逻辑(命题的缺点):无法把它所描述的事物结构及逻辑思维特征反映出来,也不能把不同事物间的共同特征反映出来

8、根据中文写出谓词逻辑公式:如一班的所有同学都是朋友关系(量词的顺序)(Vx)(Vy)F(x,y)9、量词的辖域:位于量词后面的单个谓词或者用括弧括起来的谓词公式10、一阶谓词逻辑应用—保姆机器人:(1)任务规划(2)动作规划(3)轨迹规划(4)关节轨迹规划11、产生式表示的知识:事实性知识和规则性知识,都分确定性不确定性老李年龄是40岁:(Li,age,40)老李年龄很可能是40岁:(Li,age,40,0.8)12、推理过程涉及(产生式系统的部件):规则库、综合数据库、推理机

13、框架式特点:结构性、继承性、自然性框架:一种描述所论对象属性的数据结构槽:用于描述所论对象某一方面的属性侧面:用于描述相应属性的一个方面

第三章确定性推理(出证明题)

14、子句:任何文字的析取式,任何文字本身也都是子句15、自然演绎推理:假言推理、据取式推理、假言三段论例题:(1)凡是容易的课程小王都喜欢;(2)C班的课程都是容易的;(3)ds是C班的一门课程。求证:小王喜欢ds这门课程。证明:1、定义谓词EASY(x):x是容易的课程LIKE(x,y):x喜欢yC(x):x是C班的一门课程2、用谓词公式表示已知事实和结论3、应用推理规则进行推理由(1)推出EASY(z)→LIKE(Wang,z)由(2)推出C(y)→EASY(y)由C(ds),C(y)→EASY(y)推出EASY(ds)所以可由EASY(ds),EASY(z)→LIKE(Wang,z)推出LIKE(Wang,ds)16、归结演绎证明结论:例:规则1:任何人的兄弟不是女性;规则2:任何人的姐妹必是女性。事实:Mary是Bill的姐妹。求证:Mary不是Tom的兄弟。证明:1、定义谓词brother(x,y):x是y的兄弟sister(x,y):x是y的姐妹woman(x):x是女性2、将已知事实用谓词公式表示3、把要求证的结论用谓词公式表示出来并否定4、将上述谓词公式化为子句集5、将子句集进行归结

第四章不确定性推理

17、可信度理论:AND合取则取min;OR析取则取max计算公式:CF(H)=CF(H,E)*max(0,CF(E))计算可信度例子:18、可信度理论和证据理论描述一个结论成立的取值范围的区别[-1,1],[0,1],-1假,1真,0未取得任何程度的观察19、什么是概率分配函数,举例说明概率分配函数与概率的不同定义:对于样本空间D,概率分配函数为D的每个子集A指派一个0到1之间的数M(A),并且所有子集的概率分配函数值的和为1举例:假如样本空间D为{红、黄、蓝},概率分配函数M要求:M({红})+M({黄})+M({蓝})+M({红、黄})+M({红、蓝})+M({黄、蓝})+M({红、黄、蓝})=1,而概率P要求:P({红})+P({黄})+P({蓝})=1。20、信任函数:Bel(A)对命题A为真的总的信任度似然函数:Pl(A)=1-Bel(非A)

第五章搜索策略

21、状态空间:利用状态变量和操作符号,表示系统问题或问题的有关知识的符号体系四元组:状态集合S、操作算子的集合O、初始状态S0、目标状态G22、掌握宽度优先、深度优先画open、closed表23、计算某个状态的估价函数的值,八数码问题f(n)=g(n)+h(n)估计函数的值=深度(第几层)+步数和

第七章机器学习

24、机器学习中的学习任务:分类、回归、聚类、关联规则挖掘判断所给的水果是苹果还是桔子;预测明后两天的气温值、风级大小;人以类聚,物以群分;啤酒与尿布、牛奶与面包(实例)knn分类算法:3近邻如果算出的哪种样例最多最后就确定了属于哪一类1计算测试样例e与每一个训练样例ei的欧氏距离

fori=1toNcomputedist(e,ei)endfor

2找出与测试样例e距离最近的前k个训练样例,3将这些样例中最普遍的类别作为测试样例的类别K含义:选择k个与判别值最近邻的值25、分类模型算法:knn、决策树、向量机、人工神经网络26、分类:根据对某一类事物的认识来判断之前未见过的新对象是否属于该类事物基本过程:1.分类模型的生成阶段2.预测类别阶段例子:为了让一个从来没见过苹果橘子的小孩辨别,给他3个苹果2个橘子,小孩通过触摸表皮软硬,品尝,在大脑中建立了什么是橘子什么是苹果的概念模型,为了验证他是否真的学会,过几天给他不同训练样例的水果,如果能正确判断,证明他以及学会辨别这两种水果训练样例要与测试样例不同,否则不能说明模型建立的好坏27、聚类:使用某种策略将给定的一些对象分成若干个簇的过程应用举例:从客户基本信息库中发现不同的客户群;对基因进行分组,以更好地认识种群中的固有结构;根据地球卫星观测数据库,确定相似地区k均值聚类算法思想:簇中心o1=1/3*[(0.3,0.5)+(0.2,0.6)+(0.4,0.8)]

从初始样例集D中随机选择k个样例作为k个簇中心计算样例ei与每个簇中心ot的欧式距离,将其放入与其最近的簇中心ol所对应的簇Cl中重新计算每个簇的簇中心ot(t=1,2,…,k)若本次计算的簇中心与上一次的相同,则结束聚类过程第八章人工神经网络

28、设计一个BP神经网络:1.由于每个训练样例有3个普通属性,因此BP神经网络输入层中节点个数应该为32.由于每个训练样例不是属于苹果类(1)就是属于桔子类(0),因此,BP神经网络输出层中节点个数应该为23.输入输出变换关系:第2层中第一个节点的输入:(1)先计算前一层各神经元输出的累加和(2)通过激励函数计算该节点的输出值y4.通过调整这m层之间的权值wkij:使得输出层输出为[1,0]T,这样就完成了对第一个训练样例(2,0.9,6,1)“拟合”。拟合:神经网络中的连接权值能反映样例的输入值与输出值之间的关系5.同理,分别将训练集中第2、3、n个样例的值作为输入:通过调整权值,使神经网络实现对这些样例输入值、输出值间关系的“拟合”6.当使用训练集中所有n个样例训练完神经网络后,便得到了一个能反映训练集中各样例输入、输出关系的“模型”,该模型实现了对训练集的“拟合”后续:当遇到一个需要进行分类的水果时(2,0.9,6,?)1.只需将其普通属性值(2,0.9,6)输入到网络的输入层2.然后利用训练得到的权值wkjp(k=1,2,…,m,j=1,2,…,pm)逐层往后计算各层神经元的输出值ymj3.得到最后一层神经元的输出值时[ym1,ym2](例如[1,0]),便完成了分类过程29、人工神经网络是一种隐式的知识表示方式优点:解决复杂问题性强缺点:可解释性很差,对硬件要求很高30、激励函数:硬极限函数,对称硬极限函数,S型函数,双曲正切S型31、神经元数学模型:按照生物神经元的结构和工作原理构造出来的一个抽象和简化了的模型工作原理:(1)从各输入端接收输入信号xj(2)根据连接权值求出所有输入的加权和(3)用非线性激励函数进行转换,得到输出32、决定人工神经网络性能的三大要素:(1)神经元的特性(2)神经元之间相互连接的形式——拓扑结构(3)为适应环境而改善性能的学习规则

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇