人工智能在教育领域中的应用面临哪些问题和挑战
再比如说,可以了解你的学习能力的情况,可以对你的学习负担提供各种监测,当然这个是要遵循伦理,研究伦理的前提下,可以通过对你的数据和你的表情的分析知道你处在疲劳状态,处在轻生状态,这个在研究里面已经在做了,当然这个前提要尊重个人隐私、伦理的前提下,监测学生的上课状态。如果你过分疲劳,对学习效率很低的。
再比如说可以通过人工智能和虚拟现实结合,提供增强性的虚拟探究环境,供学习者进行探究,进行发现,比如再通过一个虚拟环境,可以回到两千年前去发掘那个时代的历史以及历史演化的过程,智能加虚拟现实结合。等等,人工智能可以在学习环境、学习过程上提供非常多的很好的支持。
第三,人工智能可以对学习过程的评价起到非常重要的作用。他可以分析出你在学习过程中对哪些知识掌握的情况,每个知识点上学科能力的情况,你的核心素养的情况,以及你的体质健康发展情况、心理健康发展情况,可以使得我们的教育评价从单一的学科知识的评价到全面的综合性的评价,可以使得我们的评价从以前只是期末一次考试变成过程性的评价,可以嵌入到你的学习过程中,对学习者进行一些评价,而且评价不仅仅是评价你的知识,还可以评价你的问题解决能力方面。
另外,这种评价可以使得老师的工作大幅度减轻。以前我们只是由人工来做各种各样的评分、观察,需要很大的工作量,现在人工智能可以由计算机进行自动测评,比如英语口语测试,现在已经产业化了,都已经实用化了,很多中考、高考的英语考试都是用实际的系统。
另外,英语作文的批改,现在基本上实用化了,在实验室里面,我们的问答题、论述题、作文题,这些主观题的批改,也已经取得了实质性的进步。今后这方面会取得实质性的突破。取得实质性突破以后,我们老师改作业,统计分数,这些工作就会大幅度降低。人工智能会在教育评价上发挥非常重要的作用。
另外,人工智能对教师的工作可以起到非常重要的作用,起到教师助理的作用。比如,智能出题、智能批改、智能阅卷、智能化的辅导,各种评价报告的自动生成,以及针对学生因人而异的给学生提供各种反馈,像现在我们老师面对一个班,可能面对40个-50个学生,他很难,以前很难做到每个学生都给个性化的反馈,因为他的时间精力不允许,他也不可能了解每个孩子的具体情况,但是现在基于人工智能的技术,我们完全可以了解到孩子在学习过程中存在的各种问题,在人工智能的帮助下,可以根据不同的问题,每个学生提供个性化的反馈,实现对学生个性化的支持,做到既具有规模化,又做到个性化,这是我们中国教育现代化2035所追求的目标。
中国教育现代化2035提出,我们要推进兼容个性化和规模化并重的教育。这个时候人工智能可以大幅度提高老师对学生个性化支持的一种能力,降低教师工作过程中的负担。
第五,人工智能还可以在我们的教育决策、教育管理,以及教育公共服务方面,起到非常重要的作用。比如,人工智能可以使得我们的教育公共服务,从面向群体到面向个体,比如政府,要提供教育公共服务,以前只能面对群体来提供,现在有了人工智能以后可以了解学生个性化的需求,通过网络提供个性化的教育公共服务,相比北京市,北京市有一个中学教师开放性辅导计划,这个计划就是我们在支持,在运行。
它的核心工作就是动员了10788个骨干教师常态性的在网上给学生提供一对一的答疑服务,以及直播课的服务,以及问题解答的服务,以及微课共享的服务。在这个过程中,每个学生在学校里面都有个性化的需要,这种个性化的需要以前是政府不解决的,而现在有了大数据,有了人工智能,有了互联网以后,可以使得政府可以购买教师的在线服务,给学生提供个性化内容的服务,使得我们教育公共服务更个性化。
第二,我们有了学习过程中的各种数据,以及我们办学过程之中的数据,可以使得我们的决策不再只是基于我们个体经验,而是有个体的经验加上科学的数据结合,人机结合的决策,可以使得我们的管理,我们现代教育的治理更加科学、更加精准,也更加符合我们现在民众利益主体,参与度越来越高的诉求,可以大幅度提升政府的现代教育治理的功能。
第三,还可以促进教育对各种环境的集成管控,可以实现把一些隐患的问题,在事情还没有发生之前就可以事先进行预测、进行管控。比如,刚才举的例子,校园外的一些不法分子,完全可以通过数据甄别出来,可以在一些事情上没有被发生之前就可以预测。再比如说校园的各种公共设施,如果出现了小的漏洞,小的漏洞完全可以及时通过人工智能技术集成联通以后,集成远程控制,及时发现。不是等小事情酿成大事情再进行补救,从事后补救变成事前监管,事前预警。实际上人工智能在这五个方面都可以发挥很多很多的作用。
主持人刚刚余教授听您在人工智能教育领域方面的应用非常广泛。但是可能很多人跟我有一样担心,人工智能现在在教学领域能发挥这么大的作用,未来会不会真的把老师取代了?和教师之间会存在一种什么样的关系?是合作还是相辅相承?
余胜泉
教师永远不会被取代。因为我们教师是促进人的成长,有两个职能,一个是教书的职能,一个是育人的职能。今后如果只是知识性的讲授,知识性的传授的工作,会越来越多的被人工智能所提高效率,但是完全取代是不可能的。因为人需要人和人之间的沟通,面对面的沟通,这种情感的沟通,和我们面对屏幕的沟通还是有差异的。
人永远不会取代。但是我们很多的讲课的效率,会大幅度提升。另外,教师除了教书以外还有育人,还有解决学生成长过程中的各种问题,这种问题的解决,需要人工智能来增强。教师在教育教学中非常重要的。我觉得教师和人工智能的关系,是一个相互赋能、相互增强的关系。
相互赋能是什么意思?教师的智慧会越来越多的转化为规则性的东西,使得人工智能具有教师的能力,把老师的个体智慧或者集体智慧转化为人工智能的能力,把人工变成了智能。
另外,人工智能也会赋能教师,教师利用人工智能可以提高,可以使得我们教师提高工作效率,而且能够做到以前做不到的事情,是一个相互赋能、相互增强的关系。人工智能首先是教学效率提高,比如说以前讲测考练,原来需要10个小时完成的事情,可能一两个小时就完成了,针对学生个性化辅导,作业批改。
现在老师一个人带三个班,每天都要改一百多份作业,这一百多份要认真改的话,要两三个小时,工作量非常大。如果今后人工智能发展了,完全可以让人工智能实现批改,实现批改以后可以给出你各种分析报告,每个孩子出现问题是什么地方,给他什么样的改进措施,都给你自动生成。你拿这个报告,可能比老师自己改效率还高,比你自己改还更好地了解孩子。通过这种方式给提高老师的工作效率,把原来需要花很多时间和精力的事情取代掉了。老师有更多的时间,更多的精力关注孩子的成长。心理、身心健康。
另外一方面,人工智能可以增强教师,就是可以使得我们老师做到以前做不到的事情。比如,举一个非常简单的例子,我们有个团队在做一个研究项目叫“AI好老师”,我们孩子在成长过程中,经常遇到各种各样的问题,比如说小的问题,打架、不守纪律、网络成瘾、过分崇拜明星、早恋等等这些问题,这些问题背后都是有教育学、社会学、心理学、生理学的一系列的原因,但是这些原因是很深的,一般的老师很难说把各种知识都很了解,我们很多老师、很多家长面对孩子出现这些问题的时候,总是简单地打骂或者简单的斥责,这样对孩子于事无补。
这个时候,像我们就做了一个项目叫AI好老师,我们建立了0-18岁儿童成长过程中常见的典型的问题知识库,以及每个问题背后的教育学、心理学、社会学、生理学这方面的原因,以及一些如何干预,对这些问题如何进行干预的优秀教师的案例,我们收集了优秀教师处理这些问题的案例,这样就会形成智能的系统。
只要和那个系统说,我的孩子早恋了,他会问你几个表现,如果你确认之后,他说这可能是早恋,他分析早恋的原因是什么,社会学、心理学的原因是什么,再给出某一个很好的老师处理过这个事情他是怎么和孩子沟通的,他可以把符合教育教学规律的案例,让老师学习。这样可以提高我们老师的育人的能力,提高家长和孩子相处的和谐程度,促进学生身心健康的发展。
再比如体质健康,现在儿童成长过程中的身体体质这些方面的发展越来越重要。除了知识以外,身心健康其实更重要,我们完全可以通过一些智能手环、智能肺活量的工具、智能跳绳工具,以及运动器材,会通过5G加上传感器以后,可以自动采集学生运动过程中的各种数据,把这些数据通过5G传送到云平台以后,就可以限定学生的心率、血氧、运动脉搏各种各样运动参数的常模数据库,有了这个数据库以后,可以对学生的运动知识、运动技能、营养情况、身体发育等这些方面的情况进行进一步的分析,分析可以发现学生在体质健康上存在哪些问题,或者哪一种体质类型,可以给出有针对性的运动处方的方案,也可以发现学生在运动中有哪些优势,从而增强他的优势。
我举这些例子就是想说明,我们很多教育中理想中希望老师能做到的事情,但是由于传统的时间精力以及能力的问题,我们做不到,现在人工智能可以增强我们教师,使得我们教师能够做到这些事情。人工智能和教师是相互赋能、相互增强的关系。
但是,虽然人工智能不会取代老师,但是会使用人工智能的教师会取代不使用人工智能的教师,我们教师还要主动适应互联网、大数据、人工智能时代新的技术的变化、新的技术的变革,不断进一步的学习,善于使用,关注最新的进展,希望老师能够努力把这些东西融入到他的日常教学中,从而提高自己的教学效率。
主持人
刚刚您说了很多人工智能和教师之间的互相赋能、互相增强的关系,随着人工智能的普及或者应用,对教师的压力是不是挺大的?教师之前可能只要备好课、教好学生,关心学生成长,现在要学习更多的人工智能方面的知识。人工智能在人才培养方面,我们是不是现在也是一个非常重要的环节?
余胜泉
人工智能的知识学习有一个渐进的过程,人工智能核心就是智力的自动化,像机械是我们体力的延长一样,人工智能是我们脑力的延长,可以使得我们人能够处理以前无法处理的复杂事情,实际上是提高我们老师的效率,适当的学习这些知识。像我们生活中,比如天天拿着手机录语音,那个复杂吗?不复杂。但是,背后的技术是很复杂的。
但是对于应用来说并不复杂。我们老师对人工智能的学习不要太担心。但是,你刚才提了一个很重要的问题,人工智能人才的培养。确实,人工智能人才的培养是我们国家和整个社会迈向智能时代的一个非常关键的地方。
我觉得,一是面向大众来说,我们要培养了解人工智能,未来会对我们的社会产生哪些影响,了解人工智能在现实生活中有哪些应用,这样理解这个社会的变化,主动拥抱这些变化,这是对非专业的人士。对一些专业人才,我觉得可能我们国家,一个是要加强人工智能的职业教育,在职业教育大力普及人工智能的一些技术,人工智能工程方面的工作。
比如要向使得人工智能的发展,今后数据处理是很重要的能力,数据收集、数据标记、数据关联、数据工程。第二,今后机器学习、机器训练,了解典型的各种机器学习的原理,以及它的训练的技巧、训练的方法。
另外,了解人工智能和各行各业,对各行各业特定的领域知识库的应用,以及应用系统的配置管理,我们要在职业教育里面大力加强人工智能专业的发展,让他能够很好地支持、管理以及推进人工智能在各行各业的应用,使他有序化。
另外,人工智能还要加强研究性人才的培养,大学里面研究性人才的培养。因为人工智能不是一天练成的,是一个信息科技在一个时间段内持续性发展的一个过程,智能爆发。智能爆发的背后是有成千上万研究者的智慧转化为我们生活中可以实际应用的系统,这个时候我觉得,在人工智能领域里面,高校的职责,一个是把我们信息科技,计算机相关专业办好,这是人工智能的基础。
另外,希望有一些有实力的高校多办人工智能的专业,尤其是研究性高校,这是推进技术往前进步的核心动力,需要有精英参与。另外,这个过程中,我们特别要避免计算机教学,或者人工智能教学、人工智能研究,以唯论文为核心,论文很重要,光有论文解决不了问题,一定要以解决实际问题,形成开源的系统。
像国外,计算机科学,很多大学做的那些开源的系统,对这个行业的发展,对这个研究的发展起着非常大的推动作用,但是在我们国家,这种有影响的,寥寥无几,而且不受认可,做一个几百万人用的开源系统可能还不如人家写一篇SCI论文,这是不健康的,因为这些东西最后使得我们纯理论化,对于整个行业、整个产业发展是不利的。
所以我们特别希望在计算机科学的教育,以人工智能的教育,要强调多结合实践,当然不是不发表文章,文章还是要,需要解决重大实际过程中去发文章,而不是为发文章而发文章,要解决重大实践问题,做出能够得到广泛使用,能够推动这个行业往前迈一步的应用系统,这样的话,才使得我们的研究和产业发展能够一步一步往前走。
我现在看到我们在北京市的一些中小学,他们已经开设人工智能课程了。现在在中小学开设人工智能课程,会不会太早了?
我也看到了,现在有很多学校开一些人工智能的课。还有一些企业专门编了中小学的人工智能课程。当然我觉得,在中小学,适当普及人工智能的常识是对的,但是有一些过于急功近利不值得倡导。我看过一套人工智能的教材,从三年级就开始开人工智能,很多词汇术语可能都不清楚,现在给他讲很复杂的知识,这是不合适的。因为这些知识,这个时候去学,同样一个东西理解,可能两三个星期才能明白这个词说什么意思,但是等到成年以后,可能只花两三个小时就能明白这个事情。
所以我不鼓励太多复杂的知识进入到中小学,但是适当的让小孩子理解人工智能对现实社会的变化的影响,了解人脸识别,可以做什么,了解各行各业里面应用的现象,就像我们了解汽车、飞机可以飞的道理。比如同样一个力,我们小学生也要学力的概念,但是只要知道力是相互作用的就可以了,但是到了大学就要了解力和力之间复杂的关系,甚至还要了解宏观的力和微观的力是完全不同的性质。
同样是讲人工智能,你对低年级的时候应该以浅显、形象了解为主,到了那些知识复杂算法还是应该到大学,到研究生阶段再去教比较合适。适当地让学生有一些体验性的活动,以结合信息技术课,寓教于乐,结合信息技术课,尤其是在小学,我不赞成系统开人工智能的课,但是可以让学生有感性的认识、感性的体验性的可以的。
但是概念体系和编程能力,并不见得要那么系统化。但是适当到了初中和高中的时候,结合信息技术课,因为本身信息技术课是有的,结合信息技术课适当渗透人工智能的知识,这是可以的,这是合适的。否则容易超前教学。现在什么东西都要往中小学渗透,中小学的负担太重了。
实际人的心智是有个发展的过程,当心智发展不全的时候,学一个东西花很长时间,抽象思维水平到了一定程度以后,花几个小时就学会了。要提高他到了成年以后的学习能力,小的时候要适当地给他留白,留空。让他不受过重的学习负担的压力。因为过分的学习负担的压力会造成学生学习的厌倦、倦怠,以及泯灭他的好奇心、求知欲,一旦一个孩子成长过程中,没有了好奇心、没有了求知欲,养成了功利性读书的习惯,对于他一辈子的成长都会起着巨大的障碍作用。
真正的杰出的人才都是具有很强的自学能力,很强的自律意识,很强的好奇心、求知欲在这里驱动,是内在驱动的,而不是外在驱动的。外在驱动,环境变化,有外在的驱动力弱了以后,基本就停滞不前,现在过分的学习负担过重,会对小孩子的好奇心、求知欲会起到压制作用,长期来说不好。
主持人
感谢余教授提出的中肯的意见。我们知道余教授所在的北师大未来教育高精尖创新中心是2015年成立的,到现在四年时间了,你们肯定也在致力于人工智能在教育方面的落地和研究,您觉得,通过这四年的努力和研究,有没有发现我们国家人工智能现在在我们教育领域当中会不会存在着一些问题或者挑战?
余胜泉
目前人工智能在实际应用过程中,还存在一些问题,我觉得代表性的可能体现在,一个是目前产业界对人工智能应用的场景过多的关注讲测考练,知识性的教学太多,都在用人工智能提高知识教学的效率,比如都在适应性学习,做题库,经典推荐,当然有一定作用,但是这个是对原来我们教学优势的一种强化,有时候强化的极致以后反而成了一些问题。
用人工智能进行应试教育方面做得比较多。我们其实特别希望人工智能不光是要做应试教育这方面内容,更多的需要人工智能在学生身心健康发展方面,学生体质健康发展方面,降低学生负担方面,帮助我们教育做科学决策方面,发挥更大的作用。应用场景一定要多元化、多样化。
比如我看到过一个美国的公司做的产品,给盲人做了一个智能手环,拿手在书上划,就能把书上的文字变成语音,让盲人也能听到,这种应用非常有价值,我们国家都是在搞知识性教育,原来学生做五道题,再给你做五道题,纯讲测考练的,这样就有点违背我们的教育教学的规律。这是第一个问题。
第二个问题,我觉得,目前人工智能还存在数据的问题。就是人工智能真正要发挥作用,需要有各种各样的学习数据,而且这个数据要贯通形成,有更多的数据才有更多的智能。形象地说,人工智能像汽车,数据就像汽油,没有数据,汽车就跑不起来。这种数据目前还存在着,一个是数据的孤岛,数据隔离的现象,每个系统都有各自的数据,数据没有融会贯通。
第二,数据使用的规范也存在问题。学习过程中的数据,涉及到孩子的隐私,目前隐私伦理在教育数据利用方面还缺乏清晰的规范,我觉得应该有这种清晰的教育数据利用的伦理和规范,尊重儿童身心健康以及个人隐私的前提下,合理利用数据。当然也不是说完全不用,完全不用会扼杀这个产业。一是数据贯通,一个是要遵循数据的伦理和规范。
第三个问题,人工智能还存在着技术上本身还有很大的发展。目前真正大规模使用的,像英语口语考试、英语的学习,以及英语作文的批改,这些方面做得相对成熟一些,智能教学,仪器教学装备有了一些。但是很多我们理想上问题的解决,还有待人工智能技术的进一步的成熟。这种成熟关键在于,一是要把人工智能产业界的技术人员和我们教育体系里面的人员结合在一起,形成交叉融合。
如果纯技术驱动,不懂教育规律,有时候就用技术强化我们教育中的很多违背规律的做法。实际上要在正确的教育思想、教育理念、教育规律下发挥技术所应该发挥的作用,一定要在遵循教育规律下不断地推进我们的技术成熟。这对于人工智能的发展也会起到非常重要的作用。
另外,人工智能还要避免两个极端思想。一种极端思想就是认为人工智能能做一切,什么问题都能解决。唯人工智能论。今后人工智能会取代老师,人工智能会取代学校,这都是比较简单的过分乐观的,像我们接触过原来一些企业界的,未来互联网会消灭学校,走了20多年,学校还很好,不可能的。
人工智能不会取代学校,也不会取代老师,不要过于乐观。另外,也要防止那些过于悲观。有些认为人工智能一点用没有,花架子之类的,也要防止这种过于的悲观。这两个之间要有些平衡,要防止这两个极端的事情。
另外,人工智能在用于一些关键性业务的时候,高利害业务的时候,可能还需要各种保障机制,像前段时间,印度就出了一个事情,印度的高考,由于它的高考阅卷系统出现故障,造成很多孩子都不及格,印度那段时间自杀了十几个,自杀了好多孩子,因为印度的高考是高利害的,和我们二三十年前一考定终身差不多,这也给我们启示。高利害的这些应用一定要慎重。比如说我让人工智能来阅卷,这个阅卷是高利害的,决定一个人的很大利益的。
这个时候我建议应该采用多种原理的技术,因为人工智能同样实现这个东西,可能有不同原理,不同原理的技术,比如我找三个产品来同样做这件事情。如果这三个产品都能够有一致性,这就比较稳定。如果有差异,这个产品好,那个产品差,有分歧的时候,这时候人工介入。这是比较科学的。在高利害的应用领域里面,还需要人机结合的思维方式。这种方式非常重要。
主持人
谢谢。今天非常感谢余教授和大家一起分享人工智能在我们教育领域目前的应用。包括我们未来还需要解决哪些问题,受益匪浅。非常感谢您。感谢大家收看我们今天的节目,下期见。
|来源:人民网
|美编:甄宏莉返回搜狐,查看更多
人工智能发展现状及应用
导读:人工智能(ArtificialIntelligence),英文缩写为AI。人工智能被认为是第四次科技革命的核心驱动力,目前许多领域都在探索AI技术的应用,可谓方兴未艾。那么什么是人工智能,它经历了怎样的发展历程,现阶段发展状况如何,它有哪些应用。本篇文章就为大家做个简单分享。同时也会为大家详细介绍一下百度的AI技术体系。
本文主要内容:
1.人工智能概念
①智能
②人工智能
2.人工智能的发展
①人工智能的发展历程
②AI是中国的机遇
3.AI与百度
①百度AI的发展历程
②百度AI的技术体系
③百度AI的场景化应用
1.人工智能概念
1.1智能
谈到人工智能,需要首先理解“智能”一词的具体含义。智能是指人类才具有的一些技能。人在进行各种活动的过程中,从感觉到记忆再到思维产生了智慧,智慧产生了人类本身的行为和语言,行为和语言统称为能力;智慧和能力结合在一起就是人工智能中的智能一词。
比如,人类的语言表达能力就是一种智能(语言智能);人类进行复杂数学运算的能力也是一种智能(数字逻辑智能);人类的交往能力也是一种智能(人际智能),人们对音调、旋律、节奏、音色的感知能力,也是一种智能(音乐智能)。他们都属于智能的范畴。
1.2人工智能
把智能的概念与人的逻辑理解相结合,并应用到机器中,让机器能更好的模拟人的相关职能,这就是人工智能。人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。
人工智能概念,最早可以追溯到上世纪90年代初,这个时候需要提到一位科学家:图灵。
艾伦·麦席森·图灵(英语:AlanMathisonTuring,1912年6月23日—1954年6月7日),英国数学家、逻辑学家,被称为计算机科学之父,人工智能之父。
图灵最早定义了什么是人工智能,怎样去界定一个机器(或一个设备)是否具备智能。他最早提出了图灵测试(即:一个人在不接触对方的情况下,经过某种特殊的方式和对方进行一系列的问答,如果在某些时间之内,他无法根据这些问题判断对方是人还是计算机,那么我们就认为这台机器具备智能化的思维)。直到2000年左右,才真正有计算机通过了图灵测试,才实现了一个突破。在2014年图灵测试大会上,出现了一个通过图灵测试的机器(或者称为智能聊天的机器人)。这两年人工智能的高速发展,也印证了最早的图灵测试,这也让我们反向看到了图灵在人工智能定义方面做出的突出贡献。
现今,在做图灵测试时,判断这个设备是否具备人工智能,更多的还是从模拟人的角度来考量。但在当前科技背景下,人工智能需要涵盖更广的内容,它不仅仅要模拟人本身的职能,还需要具备一些扩展、替代甚至延伸的职能。
举个例子,在医疗领域,需要经常在实验室进行病毒化验,人处这样的实验环境下会比较危险,经常会出现一些事故,如果能够用机器替代人来做这些实验,这些事故就可以避免。此时,这台机器就不仅仅是在模拟人,而是在替代人,机器本身就具备了替代人的能力。
当前,很多人在担忧:人工智能的发展会不会对人类造成威胁。其实,目前人工智能还处于早期的阶段(或者称之为婴幼儿阶段),我们还处于弱人工智能时代。
当然,随着时间的推移,将来我们可能会把弱人工智能时代推进到强人工智能,甚至再往前推进到超人工智能和智能爆炸时代。但至少目前,我们离这样的时代还有非常远的距离,要实现这样的目标,需要非常多的时间积累,可能要通过几代人甚至十几代人的努力。所以大家不要有过多的担心,人工智能现在更多的还是用于服务人类,用来提高人们的工作效率。
上图引自MIT大学一位教授。
针对人工智能所覆盖的领域,这位教授提出一个观点:“我们要尽可能避免做这些容易“进水”的工作,以免被日后所淘汰掉”。
这张图水平面以下的工作,如存储,计算、甚至象棋活动等,已经被海平面淹没。在海平面边缘的工作,如翻译、驾驶、视觉和音频等,很有可能在未来的一段时间,随着技术的进步也会被淹没。再来看图上高海拔地区的工作,如艺术创新、科学研究,文学创作等,让人工智能替代人类去做这些工作,在现阶段是比较困难的。要让人工智能实现像人一样具备主观能动性,还需要比较长的时间。我们在选择工作,或者在做技术探索的时候,应该从更高的层面布局,而把那些可以被人工智能替代的工作交给计算机去做,这样我们就可以从一些重复性、冗余性的工作中抽离出来,去专门从事创造性的工作(比如艺术创作等)。
2.人工智能的发展2.1人工智能的发展历程我们回顾一下人工智能发展的历程。
人工智能并不是特别新鲜的词,在计算机出现后不久,大家就已经开始探索人工智能的发展了。
1943到1956年这段时间,为人工智能的诞生期,期间有很多人尝试用计算机进行智能化的应用,当然此时不能称为人工智能,只是有类似的概念。
人工智能的分水岭是1956年达特茅斯会议,在本次会议上正式提出了AI这个词。
1956到1974年这段时间,是人工智能发展的黄金时代,是人工智能的第1个高速发展期,通常把这段时间称之为人工智能大发现时代。
1974到1980年这6年的时间里,进入了人工智能发展的第1个低谷,在这个低谷期,出现了非常多的问题,比如计算上的问题、存储上的问题、数据量的问题,这些问题限制了人工智能的发展。
1980到1987年这段时间是人工智能的第2个繁荣期。期间诞生了大量的算法,推动了神经网络的高速发展,同时出现了许多专业的科研人员,发表了许多创造性的论文。
1987到1993年这段时间是人工智能的第2个低谷期,期间有个词叫“AI之冬”。有大量的资本从AI领域撤出,整个AI科研遇到了非常大的财政问题,这是导致”AI之冬”的主要原因。
1993年之后,人工智能又进入到高速发展期,期间出现了许多经典案例,比如1997年IBM公司的深蓝案例,2001年IBM的沃森案例,2016年谷歌AlphaGo案例。这些案例是人工智能在应用层面的体现。
上图概括了人工智能的发展历程。
可以看到,从1956年达特茅斯会议AI这个词诞生,一直发展到现在,人工智能共经历了60多年的跌宕起伏,并不是仅在2016、2017这两年间才出现了人工智能这个概念。
从宏观上看,AI的发展历程经历了三次比较大的起伏。
第1次起伏是从1943年到1956年,首次出现了神经网络这个词,把人工智能推到一个高峰,期间出现了许多大发现。而第1次低谷使人工智能进入到了反思的阶段,人们开始探讨人工智能的应用。
第2次起伏是在上世纪80年代,期间BP算法的出现,神经网络新概念的普及,推动了人工智能又进入第2次高峰和发展。然而从1987年到1993年又进入到了了第2次低谷,这主要因为一些财政原因导致。
第3次起伏从2006年开始,由辛顿提出了深度学习的概念,把神经网络往前推动了一大步,也把人工智能推到了高速发展阶段,尤其是近几年在非结构化领域取得了许多突破(例如在语音与视觉方面),给人工智能进入商业化应用带来许多的基础性技术沉淀。
人工智能为什么会在前面的发展过程里遇到了那么多的坎坷?为什么在最近这几年会进入一个高速发展期?
我们归结了近几年人工智能高速发展的三点原因:
①算力飞跃
人工智能(尤其是深度学习),对底层计算能力的要求非常高。早期的计算受到了极大限制,从CPU发展到了GPU,使得算力几乎能达到几倍甚至十几倍量级的增长。再从GPU到TPU,计算速度能达到15~30倍的增长,使得在算力层面不断取得突破。此外,大量云资源的出现将我们计算的成本压到了最低,我们在处理海量计算的同时,也可以享受比较低的成本。再者,芯片技术的发展,使得端处理能力持续提高,这些都帮助我们在算力层面取得了很大的突破。
②数据井喷
从PC互联网时代到移动互联网时代,再到可穿戴设备的应用,都产生了大量的数据。这两年,每年产生的数据量可以达到50%左右的增长。2017年到2018年,这段时间内基本上每个月产生的数据量可以达到几十个亿的量级,数据量已经非常高。物联网的连接,能帮助我们把更多的数据采集回来,帮助我们在数据层面做更多的积累,这是数据井喷带来的积极影响。
③算法突破
近几年来,从机器学习到深度学习,算法不断取得突破。使得我们可以处理更多的大规模、无监督、多层次等复杂业务。
算法、算力、数据是人工智能的三要素,算力是骨骼,数据是血液和食物,算法就是大脑,三者不断取得突破,才能促进人工智能高速发展。
2.3AI是中国的机遇
人工智能技术的发展也促进了很多产业的发展。中国目前有非常好的历史机遇,不仅仅是在技术上有大量的积累,同时,国家也为人工智能的发展提供了非常好的政策环境。此外,市场空间、资金支持、人才储备,也都为人工智能的发展提供了非常好的条件。
通过上图可以看到,人工智能的研发人才目前还比较短缺。图上数据来源于领英在2017年所做的全球AI人才报告。以2017年的数据来看,全球人工智能专业的人才数量超过190万,在这190万人才中,美国处于第一梯队,有85万+;而中国在人工智能领域的人才积累比较少,从数据上来看,目前国内人工智能方面的专业技术人才可能只有5万+,当然这是2017年的数据,现在可能会有一些增长,但是量级也没有达到我们想象的那么大。
所以从国内目前来看,这约5-10万的AI技术人才,对比AI产业的高速发展需求,两者之间有巨大矛盾。那怎样更好的用这些人才作为突破,把人工智能方面的技术人才储备提高到百万级别。这正是整个百度(包括百度的教育合作与共建,包括百度所有对外输出的体系,包括我们今天所做的课程)所努力的方向,我们期望通过百度的技术赋能,真正的帮助人工智能取得更好的人才积累,真正培养一些在未来对人工智能行业有巨大贡献的专业人才,这是百度现在的定位目标。
AI浪潮已然到来,行业人工智能时代已经到来。目前,人工智能已经大量应用在2c和2b领域,怎么让人工智能跟具体行业有更好的接触,产生更多的积累,是我们正在重点探索的方向。
比如百度的搜索引擎,已经融入了很多AI元素。模糊匹配、拍照识图、深度挖掘检索等都应用到了大量的人工智能技术。
再如推荐系统,他会基于个人的一些喜好和历史阅读习惯来给用户做一些内容的推荐和匹配,这是很典型的结合大数据做的精准应用,实际上也属于人工智能的范畴。
再如人脸识别技术、语音技术、智慧交通和无人驾驶等,都是AI技术与行业应用的融合,并且这些技术正在不断取得突破。百度现在L4级别的无人驾驶车已经初步实现了一些小规模的量产,未来会有更多的人将真正的体会到无人驾驶给生活带来的便利。
3.AI与百度3.1百度AI的发展历程
上图为百度在人工智能领域的发展轨迹,早在2009年,百度就开始尝试探索人工智能相关技术,直到2019年,百度用了近十年的时间布局人工智能。
2009年尝试性布局人工智能,2013年发布IDL,2014年成立硅谷实验室以及百度研究院,2015年首次发布DuerOS,2016年发布百度大脑1.0版本,同年,百度的自动驾驶技术进入试运营状态,2017年是百度人工智能技术高速发展的一年,不仅成立了深度学习国家实验室,同时也成立了硅谷第二实验室以及西雅图实验室,并且Apollo平台开始运行并对外推广,在2018年到2019年,DuerOS和Apollo平台发展到3.0版本,百度大脑发展到5.0版本。经过近十年的发展和积累,百度的人工智能技术目前处于相对领先的位置。
百度在人工智能领域领域取得的进展有目共睹,比如,百度成立了首个国家级AI实验室;2016年被美国《财富》杂志评选为深度学习领域四大巨头之一;百度的刷脸支付、强化学习、自动驾驶等技术入选MIT2017年全球十大突破性技术;在AI领域,百度的中国专利申请超过2000项。
3.2百度AI的技术体系
百度的技术体系非常全面,覆盖了计算体系、大数据技术体系以及人工智能技术体系等,在机器学习、深度学习、区块链、知识图谱、自然语言处理、量子计算等领域均有雄厚的技术积累。这些技术可以按内容划分成三个板块,第一是A板块(即AI技术板块),第二是B板块(即大数据板块),第三是C板块(即云计算板块)。这就是百度在2016年提出的ABC概念。从一开始的1.0版本,发展到如今的3.0版本,代表着百度在人工智能领域的整体布局。在人工智能领域的布局中,百度的探索不仅停留在最核心的技术上,也同时将核心技术与更多的领域相结合,如边缘计算、物联网(InternetofThings,IoT)和区块链等,得到了如ABC+区块链、ABC+DuerOS、ABC+Apollo等对外输出模式,向各行各业提供解决方案。
在A板块中,将百度大脑分成了不同的层次。最底层是算法层,包含机器学习和深度学习算法,使用百度的PaddlePaddle深度学习框架提供算法层的基础支撑;算法层之上为感知层,感知层可分为对声音的感知和对光的感知,其中,对声音的感知主要是语音技术板块,对光的感知主要是图像技术、视频技术、AR/VR等技术板块;在感知层之上是认知层,认知层更多的是处理人类听到和看到的内容,对其进行深度理解,深度理解需要自然语言处理(NLP/NLU)、知识图谱等技术作为支撑,同时也需要积累大量用户画像数据,这些技术能帮助人们快速的理解和分析人类听到和看到的内容,并对内容进行有效的反馈,这是认知层面的技术;在认知层之上是平台层,平台层将底层的内容进行融合、封装,对外提供开放、完整的AI技术,并引入大量的生态合作伙伴,共同探讨人工智能产业的布局。
百度人工智能整体技术体系,最底层是深度学习框架飞桨PaddlePaddle,作为底层计算框架,飞桨PaddlePaddle支撑着上层场景化能力与平台中的全部板块。在场景化能力与平台中,包含了诸多场景大板块,每个大板块下又细分为多个技术板块,比如语音板块包含了语音合成以及语音唤醒等技术板块;计算机视觉技术中的OCR技术,包括传统通用OCR识别,以及垂直领域OCR的识别,可以对30多个OCR识别领域进行精准识别,比如票据识别、证件识别以及文字识别等;在人脸/人体识别板块,同时也会引入图像审核以及图像识别方面的技术;在视频板块,有视频比对技术,视频分类和标注技术,以及视频审核技术;在自然语言处理板块,有机器翻译技术;知识图谱板块,有AR/VR技术。这些板块构成了人工智能体系的技术蓝图。
近两年来,人工智能技术在各行各业中的应用不断加深,实践证明,单一的技术在落地时会受到诸多限制,所以现在人工智能在落地时可能不仅仅用到某一个单独的技术板块,而是需要先把这些板块进行融合,然后再进行实际应用,比如在拍照翻译的应用场景下,既需要用到OCR技术,同时也用到NLP技术。因此在实际应用中,需要综合各个板块的技术,把不同的技术体系和技术内容有机地融合起来,再去解决行业中面临的痛点。
3.3百度AI的场景化应用
2014年到2015年期间,在计算机视觉领域的部分场景下,计算机视觉识别准确率已经超过了人眼识别。而利用深度学习技术的计算机听觉识别,在2017年左右也已经超过人耳听力极限。
人工智能业务场景化不仅依赖底层的硬件资源,也需要超大规模的标注数据,这是监督学习的特点,所以在人工智能早期研究中,有评论说“有多少人工就有多少智能”,这句话在特定角度来看是具有一定意义的。在监督学习中,训练模型需要庞大的标注数据,再结合GPU强大的数据处理能力去训练特定模型,也就是从算法的层面去做更多的工作,在训练模型的过程中需要发挥人的主观能动性,更好的解决在行业应用中出现的一些痛点,构建出行业专属的模型。
比如,将人体分析技术应用到实际行业场景中时,需要结合人脸识别技术和人体识别技术。可以通过基础手势识别,识别一个人在开车时有没有系安全带、是不是在打电话等。
利用人体分析技术,可以做到行为识别,首先设定特定区域,然后对区域内的人员行为进行识别,比如人群过密、区域越界、人员逆行、徘徊以及吸烟等,在特定场景下,行为识别能够帮助用户避免安全隐患。
自然语言处理有很多相关技术,比如说词法分析、词向量表示、语义相似度、短文本相似度、情感相似度分析等。这些技术用在不同的应用场景下。
在公检法系统应用中,为了避免出现非常严重的问题,如同案不同判,具体解决方案是当诉讼呈递给法官时,根据当前诉讼内容在公检法系统中寻找历史上类似的案件,参考历史类似案件的判决,给法官提供判案依据。
在媒体领域应用中,对基础的财经类新闻,可以由机器进行新闻文章的编写,即机器写作。这些技术都是基于NLP在相应领域做的智能化应用,可以让编辑或记者从重复性的工作中解脱出来。
人工智能从广义上来看,也包括大数据及云计算相关技术,这些技术也都涵盖在百度AI技术体系中。在大数据领域,主要包括数据采集、数据存储、数据分析以及数据可视化等,利用这些技术,我们在进行模型训练的时候,对数据进行科学的管理可以帮助我们提高模型训练效率。
百度AI技术体系也提供算力层面的支持,通过GPU服务器以及FPGA服务器提供的算力,更好的解决应用层面的问题。
百度AI就是这样一个从基础层,到感知层、认知层的完整体系,为多行业、多场景提供“一站式解决方案”,力求实现“多行业、多场景全面赋能”。
回顾本篇文章,我们和大家分享了人工智能的相关概念,人工智能的发展历程,从中也可以看出AI是我们的历史机遇。同时本文也为大家详细介绍了百度的AI技术体系,经过10余年的努力,百度AI已经形成从基础层,到感知层、认知层的完整技术体系,为多行业、多场景提供“一站式解决方案”,力求实现“多行业、多场景全面赋能”。