【图解】《探寻人工智能》第2集:第三次浪潮给人类带来了什么
杨澜来到日本长崎的豪斯登堡,酒店门口立着机器人模型,和一般的酒店有点不一样。更奇怪的是,办理入住时,接待的服务员居然是一位装扮成恐龙的机器人!
这个恐龙机器人能说会道,对答如流,很快就帮助杨澜完成了酒店入住的办理。然而杨澜说“我喜欢你的帽子”时,机器人并没有对这句话做出反应,很显然,这机器人还只是固定模式下的智能程序。
酒店还有行李机器人,只要输入房间号,就会自动运行李,在运输过程中还会自动播放视频,以缓解客人的无聊。这是不是一家很奇怪的酒店?
就像他的名字“奇怪酒店”一样,位于长崎豪登斯堡的这家酒店,几乎看不到人类员工的影子。办理入住,搬运行李,向导资讯,清扫绿化,甚至餐厅大厨等工作,都由各类机器人承担。这里是世界上第一个机器人酒店。
“奇怪酒店”总经理大江岳世志介绍道:“我们酒店有144个客房,人类员工只有10名,机器人员工有200名。酒店开业后,看到入住的客人们,对于机器人兴致勃勃的样子,说实话超出了我们的预期。”
行李机器人唱着歌把杨澜带到了房间,不过速度还不够令人满意,可能也是因为酒店走廊狭窄,走得快了容易发生“车祸”。
通过人脸识别系统,杨澜刷脸进入房间。有了这个设备,即使忘带房卡,也不用麻烦前台开门了。
房间里等着她的是可爱智能小助手,Chuli。Chuli也是能说会道的小可爱,体型小巧,摆在床头柜上就像是装饰品一样。在客人询问后,Chuli会第一时间做出回答,反应速度十分快。
小Chuli跟人的对话还十分有限,有点弱弱的,萌萌哒。但可别小看这简单的一问一答,其背后做支撑的是高大上的人工智能语音技术。
人工智能是什么?人们通常会想到形态可以的机器人……
智能语音目前水平如何呢?它在我们的生活中可以有哪些应用?杨澜来到合肥的科大讯飞,这里被称作“中国声谷”,在语音领域的多项研究,取得了世界一流水准。
小曼的声音非常好听,对话流畅速度也让人满意,就好像是真的在和一位小朋友交流一样,少了很多机器人的生硬感。在科大讯飞最新人工智能机器人小曼的介绍下,杨澜见到了科大讯飞轮值主席、讯飞研究院院长胡郁。
胡郁带杨澜感受了科大讯飞的语音系统成果,包括语音输入和语音实时翻译。
语音输入系统几乎是立刻就反馈出语音的内容,并且一个字没有错,对于会议记录有很大帮助。目前语音输入是速记的一大帮手,但将来会不会有一天,语音输入很完善,让速记这个职业彻底消失呢?这不过是时间长短的问题罢了。
在语音翻译上,讯飞系统也让人惊喜。说中文可以迅速翻译成英文,说英文也可以很快翻译成中文。也就是说,如果你对一位外国人说中文,系统会翻译成英文并播报出来,让外国人听懂,随后外国人回复你英文,系统也会即时翻译成中文,帮助你们沟通。
这也就意味着,如果我们随身携带这样的语音翻译系统,出国旅游时即使不能和外国友人进行密切沟通,至少吃喝住行方面是没有什么大问题了。
智能语音不仅仅是语音输入和语音翻译,还有很多其他的作用。胡郁说道:“智能语音其实是属于人工智能的一个范畴,正因为这是一个基础性的技术,同时这个技术又能够渗入到生活的方方面面,我们可以和汽车结合,我们可以和家电结合,我们可以跟手机结合,我们可以跟很多方面合作。”
胡郁随即带杨澜感受了科大讯飞语音系统和电视机的结合,可以进行语音调换频道、点播节目,语音快进等各种操作。
这不仅对于老人很好,对于懒人而言也非常好,一进屋子就喊一声“开灯、开空调26度、开电视机……”,随后躺在床上,继续喊“冰箱送一杯果汁过来”,这样的日子想想就觉得很舒服。
斯坦福大学客座教授、前百度首席科学家吴恩达说道:“如果我们未来所有人,都可以对着手机说,嘿手机帮我叫个车吧,这种方式更自然。跟这些设备的交流,也会变得更有效率。我认为如果语音识别的表现,能继续提升的话,它将改变我们所有人与这些设备的交互方式。”
杨澜:“基本上它会改变我们与智能手机的交互方式,改变我们的日常生活。”
杨澜还感受了日本松下未来家居体验馆,说一下想要两人份的水,水龙头便会自动流出严格分量的水,烧水机还会像人一样“炫耀”它的新技术。
诸多先进科技便捷的智能家居让人叹为观止,也可想象未来的无限美好。
“艾丽莎”是一款小型智能机器人,就是下方桌面黑色的圆筒状物体,有很多功能。
“谷歌”也是类似的一款智能小机器人。
以上种种,都在证明人工智能真的火了。
然而人工智能其实经历了漫长的凛冬,科大讯飞轮值主席、讯飞研究院院长胡郁说道:“其实人工智能这个技术和名词,已经发展了六十年。我们现在是第三次浪潮,五六十年代的第一次浪潮和八十年代的第二次浪潮,中国都没有赶上。但是这个没有赶上,也是一个好的事情,因为那两次浪潮,最后都没有成功。”
《纽约时报》高级科技记者、普利策奖得主约翰·马尔科夫也说:“在美国,有一个人工智能的早期商业化浪潮,当时大家非常乐观,但问题在于当时时机并不成熟,所以美国在八十年代中期,有一个时期被称作人工智能的寒冬,所有的初创公司,在市场上都失败了。”
人工智能走过六十年,掀起两次浪潮,也遭遇过两轮寒冬,是什么原因,让它再次复兴并迎来第三次浪潮呢?
斯坦福大学客座教授、前百度首席科学家吴恩达对此说道:“今天最热门的人工智能方法,是深度学习。而我认为今天深度学习,终于能够见效,原因有两点,一个是由于我们今天拥有了具备强大计算能力的大型计算机,另一个是由于我们今天的社会拥有了大量数据。”
斯坦福大学人工智能实验室主任、“谷歌云”首席科学家李飞飞说:“从八十年代到2000年,人工智能其实有了长足的发展,尤其是几个分支领域,一个是机器学习领域,一个是自然语言处理领域,一个是计算机视觉领域。”
人工智能的发展历经沉浮,但计算机却从未停下过飞奔的脚步,短短五十年间,计算机的性能已经提高了上百万倍。以深度学习、大数据和超强运算能力为引擎的这一轮人工智能的浪潮,首先席卷了语音识别和机器视觉领域。
从大学实验室到商业投资界,从传统制造业到科技巨头,这一浪潮也搅动了英国牛津这座千年学府。
喜爱机车的菲利普·托尔,曾梦想做一名摇滚歌手,却阴差阳错地成了牛津大学的计算机科学教授,他领导的团队正致力于把计算机视觉的最新成果应用到一款特殊眼镜的开发中,让盲障人士借助机器的眼睛,看见这个缤纷的世界。
牛津大学计算机视觉教授菲利普·托尔:“我们正在设计的SmartSpecs,是为那些在法律上称为盲人但实际还残存一点视力的人,你可以想象一下,它有一个电脑,一个透明的显示屏,在这个显示屏上覆盖着他们需要的信息,用以辅助完善他们余下的视力。”
杨澜还体验了智能眼镜。
这就是杨澜在设备里看到的东西。
陪同在旁的OkSight公司创始人史蒂芬·希克斯说:你应该会看到一些,令你感到惊讶的东西。
对于这项设备的原理,OkSight公司创始人史蒂芬·希克斯也作了简单的说明:“我们用明亮的线条来勾勒物体外观,因为你的眼睛想知道这些物体在哪里,这些线条会帮助你识别物体的形状,关键在搞清楚使用者,最强烈的兴趣点在哪。”
“在大多数情况下,当你走在路上,你最感兴趣的东西就是你面前的物体,我们通过三维摄像机或其他形式的物体检测系统,来找到这些物体,然后以视障者们能够看到的方式,来重现这些物体。其中一个重要的方法,就是要提高这些边缘线的亮度,大脑会自动补全识别出该物体。”
捕捉画面如下图。
这个叫瑞德·赛尔的男人,患有视网膜色素异常症,视力大约只有正常人的3%,感觉像是透过钥匙孔,在看一个雾气弥漫的房间。
这款新型的智能眼镜给他的生活带来了巨大的变化。
瑞德·赛尔带着这副眼镜给自己的女儿做了一顿丰盛美味的早餐,他说道:“能够坐下,再次看清女儿们的脸,自她们两三岁起,我就再未看清她们的脸,我十分感动。我从未想象过能有这样一天。”
具有视觉的机器不仅可以帮助盲人看见,还可以帮助普通人把这个世界看得更清。
轻轻一碰眼镜,眼镜就会给出这样的提示:“我看到你前面有一个男人正腾空而起表演滑板特效。”
牛津大学计算机视觉教授菲利普·托尔说道:“某些情况下,机器的图像识别能力已经超过了人类,我认为我们正处在一个非常非常激动人心的时代。”
旷视科技是一家年轻的人工智能公司,他们正在把人脸识别技术应用到生活场景中。它不仅可以成为你在数字空间的美颜高手,还可以撕下那些危险分子的伪装,成为公共安防的火眼金睛。
走进旷视科技公司,员工不需要刷卡,机器一扫脸就可以通过,保安都省了。
人脸识别系统的运行原理又是怎样的?
旷视科技联合创始人兼首席执行官印奇解释道:“人脸识别我们分为三个步骤,第一个环节叫人脸检测,人脸检测的意思就是说,在这么一大片图片或者视频里面,它首先能够找出某些具体的区域,这个区域就是人脸的部分。第二个环节其实我们叫做特征提取,这个面部的人,可能多少像素乘多少像素,这个区域,变成一段编码,它编码的目标是说,同一个人的编码会很接近,而不同编码的人要很不像。第三个环节就要在一个数据库里,来找到他是谁,拿你的那段编码,去再这几百万的数据库里,去一个一个的比对,找到谁是跟他最吻合的,把那个人挑出来。”
约翰·马尔科夫:“这一次的热潮全归功于大数据的力量,正是它带来的语音识别和机器视觉的长足进步。”
印奇:“所以整个深度学习,其实是一个相对大数据的这样的一个比较暴力的学习方法。OK,我不用教你要怎么做人脸识别,但是我会给你100亿张人脸的照片,所以它的目标就像是下围棋一样,它自己去摸索很多规则。”
上亿张图片,海量的运算,正是这样的训练,练就了机器的火眼金睛,让犯罪分子难逃法网。旷视科技把这项技术带到了公共安全领域,让机器之眼发挥威力。
印奇介绍说:”一个二三线城市吧,摄像头的数量可能是在两万到几十万个之间,然后并且它们是二十四小时乘七天的,不间断地拍摄这些数据,所以数据量是非常海量的数据,去识别某一个具体的这种比如说犯罪嫌疑人,或者说是一个逃窜的惯犯,就真的是大海捞针。所以之前在这样的场景下,几乎人是无法完成这样的任务。我们抓了很多其实已经潜伏在当地,最长可能有七到八年的这种逃犯,那些逃犯甚至漂白身份再当地已经生活了。可能这个系统上线,不到三个月的情况下,我们现在已经基本能做到人均每天抓一名。”
让人工智能无处不在,延伸人类的认知功能,给生活带来便捷,这听起来是个不错的主意,但问题来了,深度学习需要海量的数据和超强的运算能力。这对机器的性能和效率提出了新挑战。
击败围棋世界冠军李世石的人工智能AlphaGo,其背后是由超强服务器集群,支撑的庞大的人工神经网络,功耗高达12万瓦,大约相当于1000台家用冰箱。
清华大学微电子学研究所副教授尹首一:“现在有很多的这个深度学习的系统,它是用中央处理器或者图形处理器搭建的。但是这两种处理器,归根结底它最初的设计目标,不是为了完成神经网络的计算。神经网络计算里边呢,只能用到它的这个功能里面的小部分。所以带来的问题就是今天的深度学习系统,我们看到它有很多的不足,比如说计算效率能量效率啊。”
智能机器要走向实用化,必须想办法解决能效问题,方法也许就隐藏在这一枚4.4乘4.4毫米的小小硅片之中。
2015年清华大学的微电子所的老师和同学们开始思考为日益兴起的神经网络,量身定制一款高效能的芯片。
尹首一:“这个芯片设计目标非常的明确,就是为了去支持各种不同形式的各种不同规模的神经网络的计算。神经网络本身呢,它是一种海量并行的这样的计算特点,所以我们现在设计的这个芯片呢,我们每一个神经元本身的功能,是相对来讲比较简单的,那我们通过大量的神经元组织在一起,而且通过调整不同神经元,这些运算部件的组织关系实现不同的功能。”
从研究所积累多年的动态可重构技术中,他们找到了思路。
2016年9月,第一阶段的测试芯片研发完成,通过了神经网络图像识别任务的测试。
尹首一:“从目前我们整个芯片的测试结果看,平均功耗在400到500豪瓦左右。每瓦能够实现4000亿次运算,那相比于图形处理器的典型的运算能力来讲呢,差不多提高了300倍左右。”
印奇接受采访时也说过:“未来有一块这个计算能力超强,能耗特别低,成本很低,非常容易集成的芯片,我觉得一定是个大的趋势。”
与尹首一的理念不谋而合。
IBM认知计算首席科学家古鲁都斯·巴纳瓦尔:“你能够把机器学习的算法和软件直接嵌入到硬件之中,然后直接利用硬件来运行我们所说的图像识别等等的算法。这样机器就能够以非常低的功率来运行人工智能程序,像我们的大脑一样。”
或许在不远的未来,有了更强大的机器更优化的算法,人工智能将真正从实验室走进生活。杨澜在奇怪酒店的奇幻体验,将成为我们生活的一部分。
机器人在送果汁的同时还会说:快乐的时候能喝上一杯真是太棒了,请享用吧,干杯。
机器人大厨在做菜,味道很不错。桌子上面的小可爱说:“你好。欢迎来到我们餐厅。”
比如微软增强现实眼镜。
比如日本松下未来家居体验馆。
世界已经如此神奇,或许人类的只会就是在创造这个世界上从来没有出现过的东西。
李飞飞:“随着互联网的崛起,带来的这个大数据的发展,随着我们对机器学习在数学方面做出的一些成果,所以就产生了六十年这个甲子轮的一个爆发。”
中国工程院院士、中国人工智能学会会长李德毅(峰会特邀嘉宾):“尤其是互联网产生的大数据,是云计算和大数据成就了人工智能,使得2016年成为它的一个元年。”
约翰·马尔科夫:“当我们把软件、廉价的传感器和大数据结合起来之后,我们就得到了这样一个综合体,我们能以前所未有的低成本支出,做出非常实际的东西,这的确改变了一切。”
印奇:“人工智能对行业的渗透,我觉得基本上是无孔不入的。”
吴恩达:“我认为人工智能会为社会带来巨大的影响,我有时打比方,人工智能就是未来的电能。”
菲利普·托尔:“人工智能真的是让人激动,因为我认为计算机真的能够切实地帮上我们。”
古鲁都斯·巴纳瓦尔:“我想这可能是我想象中的最激动人心的时代,因为我们可以拾起当初的梦想,并真正地去一一实现。”
创新工场董事长兼首席执行官李开复:“生活的每一个方式都会被改变,我们如何地学习,我们如何地享受人生,我们如何地交朋友,几乎没有一件事情会和今天是一样的。”
2016被称为是人工智能爆发的元年,自从1956年的达特茅斯会议开启了人工智能的序幕,经过了六十年的蹒跚学步,终于在超强的计算能力、互联网和大数据的助力下,人工智能开始了迅速地奔跑,在万物互联和万物智能的时代,它将融入我们的生活,无所不在。
返回搜狐,查看更多
陈小平:人工智能进入第四次发展浪潮,行业迎来新机遇和挑战
生成式人工智能的语言痕迹提取和关联
人工智能现阶段的应用是生成式的,且已不再是狭义的生成语言、图像等内容,而是从人到AI、从AI到人的交互。“我认为,自然语言人机交互的重点是,会说话,能听懂人话,能回答问题,但不能保证回答一定正确。对机器语言表达的基本要求,是说话要符合人的语言习惯。”陈小平表示,语言习惯是什么,现在没有科学标准,但是有经验标准。所以关键是要掌握并利用这个经验标准,这就要从人类规模语料中自动提取语言痕迹,并用于人机自然语言交互。
语言痕迹来源于原始语料。陈小平用两个句子组成的语料进行简单举例:用于训练的语料分别为“我要上网,请打开浏览器。”“我要听歌,请打开音响。”这两句话反复说,且概率分别为0.6和0.4。如果基于相邻语元之间关联度的预测,也就是给定一个语元,预测下一个出现的语元,不确定情况下预测错误率过高。比如从“要”预测“上网”的错误率达到40%。如果基于语言痕迹远程关联度时(远距离语元之间的关联强度),“上网”与“浏览器”语元虽然不相邻,但具有高关联度,若已出现“打开”和“上网”,预测出“浏览器”的错误率为0。
对此,陈小平表示,基于语言痕迹远程关联时,预测错误率可以大大降低。这也是为什么大家觉得大模型好用。“虽然举例的两个句子只有六个语元,但在实际应用中,是从人类规模语料中提取语元关联度,用于自然语言人机交互,数据的量很大。人工智能可以回看的语元至少超过4000个,甚至已经有可以回看10万个语元的大模型发布。”陈小平指出,如果将互联网三分之一到三分之二的语言痕迹都抓取做成模型,大模型将非常强大。
上述所说的抓取语言痕迹,训练语言痕迹,对语言痕迹做关联,被称为预训练模型。这是大模型技术体系中的一部分。陈小平表示,实际上,预训练以后的实际效果可能不够理想,不够精细,此时就可以引入一种方法——细调。“细调类似于收音机的调台旋钮,一般收音机不清晰时,就需要细调旋钮,直至内容变得清晰。”陈小平表示,细调是专门训练出的专用模型,通俗来说,不是大范围的调整,而是有一个目标后,针对当前矛盾去细调。经过细调后的大模型应用效果会大幅提升。但是细调不是凭空实现的,需要大量的语言数据进行支撑,且用不同的数据进行不同的细调。例如聊天用聊天的细调,编程用编程的细调。
然而,细调后的大模型效果可能还是不够,还可以运用“提示”。“这是小规模的训练,为用户引导模型的回答。也就是在提问题时,不仅要提问,还要给出一些提示。如果提示说得好,回答的质量也会大幅提升。”
值得一提的是,大模型是实例性模型,是从训练预料中提取的语元和语言关联度的全体组成的模型,它没有概括性规则,无法进行数学-逻辑推理。“大模型是一种颠覆,我们需要用新的观念、新的理念去看待。”陈小平说。
物理世界下,人工智能的应用
一些科幻电影刻画出的机器人具有自己的情绪、情感,会有自己的思想。陈小平直言,拟人化想象对大模型以及所有通过了大规模验证的人工智能都不成立。“即使在和人工智能交互的工作中,会从语言中感受到情感、情绪,这也是因为语言的投射效应,即脑补。”陈小平表示,人说话都带涵义,所以习惯性地将自己理解的涵义投射到大模型上,认为大模型说话也带涵义。“对大模型人工智能做拟人化想象,是不科学的。”
同时,大模型还会带来新的挑战。首先是公共安全,其次是就业问题。“2017年开启人工智能第四次浪潮的标志性实践,就是AlphaGoZero围棋程序面世,且该程序的围棋水平已经超过职业选手。现在,人类积累了千年的围棋知识很少再是人工教授或者看书,大家都开始通过这个程序进行训练和学习,人与人的对练已经很少。”他表示,虽然围棋是很小的领域,但未来大模型的应用可能会延伸到各领域,也有可能发生类似围棋领域的情况,从而影响就业。
人工智能如何在物理世界中应用,也是很大的挑战。比如现实世界中的家庭、医院、工业、农业场景,现在的大模型是无法胜任的。陈小平表示,现在在工业上普遍应用的机械臂,基本上都是刚性的,这类机器人重复精度高,但灵巧性、安全性低,适合用于结构化环境。对于更复杂的非结构化环境,需要精确测量、建模和计算,这就需要软体机器臂(柔性机器人手臂),也就是软体机器人。这类产品采用蜂巢气动网络结构,为材料-机构-算法的一体化设计。据陈小平介绍,与传统机械手臂相比,软体机器人在制作成本、负载能力、后期维护等方面都具有较高的优势。陈小平在现场通过几个视频,分享了软体机器人在喂饭、开门、拧瓶盖、拉抽屉等多个场景的应用。
对于人工智能在中国的应用,陈小平表示:“我认为,对于中国,大模型在智能制造、智慧农业、惠普养老三方面能得到很好的应用后,将迎来巨大的机遇。”返回搜狐,查看更多
人工智能将替代人类 第三次浪潮能带来什么?
第二种类型,仅仅有当前的输入信息还不够,还需要有经验判断,还需要有常识,还是要有不断迭代的专家知识,是人和机器耦合的,比如说教育,机器绝不可能替代所有老师,而是帮助老师更好地提高课堂效率,帮助孩子减轻课后的无效重复学习的时间,这是第二种场景,包括医疗,学习顶尖医疗专家的知识,并不断逼近他,还是需要人和机器的耦合。
第三种类型,是没有收录支撑的,是主要靠创意,靠想象力的,就像我们今天的艺术大师所做的成果一样,所以我们今天说机器可以作图、画画,可以写诗,但是他做出来的,我认为是工艺品,真正的艺术今天还很难做到,是靠我们人类无比充满灵感的想象来做的,真正的机器今天替代了大量的传统脑力劳动,这是要把人类释放得更加无比美好和广阔的创意空间中去,这是一个大的趋势,未来的世界应该是由顶尖专家和顶尖管理者协同管理人和机器的联合体的一个大的未来,这就是我们认为的人机协同的机制。
据记者了解,科大讯飞当前人工智能云平台上的总用户数,今天已经达到8.9亿。比去年同期增长48%。此外,第二个更重要的数据是,每天使用人次,一个人用一次叫一人次,去年这个时候每天是10亿人次的访问量使用量,今天已经突破30亿人次。第三围绕科大讯飞的创业团队,去年有7万家,现在已经达到21万家,这就是人工智能的产业生态。
刘庆峰强调,人类今天的工作会越来越多的由后台的学习系统不断地学习到机器中,由机器来代替我们,我们释放出来想象更大的未来,去做更有创意的事情,这就是科大讯飞认为今天的人机协同机制,而在这样一个人机协同机制下,人类智慧大爆炸时代正在到来。
人工智能第三次浪潮能带来什么?
自1956年的达特莫斯会上人工智能首次被提出,在1970年第一次浪潮达到顶峰的时候,就已经通过第一代的人工智能的神经网络算法可以证明,数学原理这本书中的绝大部分的数学原理。第二次浪潮在1984年的霍普菲尔德网络推出来,让人工智能的神经网络具备了历史记忆的功能。然而,由于神经网络本身算法的局限性,同时也受到当时整个运算能力和收敛的一些局限,前两次的大潮,后来都破灭了。是不是第三次浪潮也像前两次一样,很快也会大潮退去,是不是对人工智能的未来今天的预测过于乐观了,人工智能第三次浪潮究竟是一个真正的产业大潮还是概念的泡沫,能够给我们带来什么?
1、人机交互
人和机器的交互中最重要的一点是什么?答案是输入信息。
在2010年,科大讯飞发布了讯飞语音输入法,从此引领了整个中国在手机输入法方面潮流,在过去的6年过程中,我们可以看到讯飞的输入法已经超过了4亿的用户,每个月月活超过了一个亿,而且在手机上输入的速度,达到了每分钟400个字极致的速度,,并且输入的准确成功率已经达到97%。
新一代人工智能改变了我们和机器之间的交互,特别是输入,得益于讯飞最领先的离线手写输入的引擎,现在可以让各种各样的智能设备识别我们手写下的文字。当启动机器拍摄,通过一个比较简单、快速的一个扫描的过程,机器就已经可以准确的把我们手写的或者打印好的的文字录入进去了。此外,如果我们忘记某些要书写的内容,也可以当场补进去。记者发现,通过对机器做出一个手势的体感交互,来进行光标的定位,就像我们在手机上的触控以及电脑上的鼠标是一样的,定位到这里,接下来用手写进行录入,我们可以看到这个就跟我们在手机屏幕上的这种手写有点类似,但是它是有一个区别的,它是一个隔空手写的方式,需要补充的文字就在机器上显示出来。
如果我们要输入大段的文字,这时候一个字一个字写可能还是比较累的,最高效、最自然就是用语音进行输入,我们只要面对机器轻松的通过语音进行输入,就是这么方便。跟传统的手机输入不同的是,我们还可以纯粹通过语音去进行文字修改。在输入的过程中,如果说想到了去添加标点或者做翻译做修改,我们这样的整个过程通过语音都可以完全实现。
此外,在同屏的语音转文字的技术方面,这几年来发展的更快、更准确、也更多语种。针对各种各样的环境,不同的行业,医疗,司法,推出大量的定制工作,软、硬件一体化方案,有效的提高了工作的效率。可以随时携带的便携翻译机,更是增加了国际友人之间的互译,做到无障碍交流。中维的翻译系统,非常好的服务于很多援疆干部与现场的维族同胞他们之间的亲密交流。
在智能家居方面,科大讯飞已经有超过3000家的合作伙伴,利用其推出的aiui使这种设备更好的能够与其进行交互。在这个过程中,其中最重要的电视产品,讯飞电视助理已经占据了整个市场80%以上的份额,所有的著名的电视品牌的厂商,包括我们的机顶盒厂商,包括我们的运营商和广电,都与讯飞建立了非常紧密的合作关系。
据悉,讯飞从整个系统集成和用户体验的角度出发,提供了整套的从芯片到后台的本地引擎到后面的云传输、语音服务和整个遥控器的整体解决方案,不同的解决方案可以对不同的客户形成一个非常好的支持,可以看到利用自然语音交互方式做成了遥控器,可以很好地将语音交互与按键控制结合在一起,无论是远场识别还是通过电视遥控器,都可以用语音来控制各种家电,同时,也可以让我们的电视点播变得更加方便和快捷。比如安徽卫视、中央一台、锦绣未央第十集、除了语音点播电视,还可以用语音打开音乐、教育、娱乐等多种应用;我想学英语,我想玩游戏,那打开游戏应用之后,还可以用语音进行各种指令操作,比如说出牌、抢地主等等。我要唱歌,来一首飞得更高,可以看到我们的歌曲为我们点拨出来同时,还可以通过音准、吐词、节奏等多个维度对我们的水平来进行打分。
值得关注的是,基于讯飞超脑强大的语义理解技术,我们也可以进行更加深度交互,我想看喜剧电影,刘德华的、刘德华和张学友的、今年的;当然了我们还有其它更加深度的交互,比如有什么好看的美国动画电影?跳过片头、音量60、快进到33分15秒、快进到33分15秒、跳到片尾、这首歌很好听,他在什么名字?等等。
2、智能汽车
在过去的10年过程中,讯飞运营智能语音技术,和很多的汽车厂商建立了非常紧密的联系,特别是科大讯飞的aiui发布以后,现在全世界有30多个国内外厂商和他们建立联系,超过100个车型,现在正在应用讯飞语音交互技术。
寻找目的地,是车上最常见的功能,我们可以说导航到清华大学、我要去北大、带我去紫禁城。各种不论地名的全称,别称和简称,基于aiui的飞鱼系统都可以正确的支持。除此以外,智能车载助手还支持上下文的对话视场景。比如:“我要去长城。请问您要去八达岭长城还是慕田峪长城?八达岭。选择八达岭长城,即将开始。附近有什么酒店?酒店价位150到278元,请问您想要什么价位的酒店?如果我们在路上想轻松一下,就可以说我想听交通台、换成音乐、安琥的天使的翅膀,我想听甜蜜蜜。请欣赏邓丽君的歌曲甜蜜蜜。鹿晗唱的,请欣赏鹿晗演唱的甜蜜蜜。小点声,大点声,暂停拨放等等。
如果晚上我们想约人一起出门,我们就可以说,打电话给rXXX。好的,即将为您接通。晚上想找个地方吃饭;已为您找到附近十个餐厅,中央财大附近的,在中央财经大学附近找到以下5个结果。我想吃好吃的火锅,还想看场电影;海底捞大钟寺,是否现在前往?好的,现在导航开始,前方去往目的地,海底捞火锅,大钟寺店停车场,就到这里。
通过以上对话交互可以看出,aiui的飞鱼系统首页具有降噪功能,提供了非常高质量的语音识别的效果,所有的过程都是非常的自然,不需要再去按键,在整个过程中,如果你想打断我们汽车的说话,随时可以,这就让我们有非常自然的用户体验。
更加重要的是,相比去年推出的aiui的系统,最新推出的aiui的飞鱼系统,在车载系统、跟系统的深度整合又上了一个新的台阶,围绕在车载环境下的主要的8项功能,包括智能导航,在线娱乐,故障提醒,车身控制,都进入了深入的调整。
据了解,为了使车里的生活更加丰富多彩,讯飞和中国移动、网易、携程、大众点评、美团等,建立了深度的连接,在车里面可以随时随地用这些服务。我们可以看到飞鱼助理确实就像我们所讲的,通过aiui,我们让汽车驾驶更安全、更智能、也更有趣。
3、智能机器人
在过去的十几年过程中,智能语音最大的一个应用就是用在客户服务,现在越来越多的银行、电信,他们后台的呼叫中心已经被替换成机器自动服务查询。据悉,在过去的十几年过程中,科大讯飞针对1万种的语音自动服务的产品进行了优化,现在已经占领了80%以上的市场份额,每日接听电话的数量达到了200万次,节省了25%的人力开销,那么利用这种非常先进的客户服务的能力,aiui的系统和各种智能服务机器人的组件进行结合,讯飞推出了最新的服务机器人。
在营业厅服务机器人方面的标杆自然要数讯飞的晓曼机器人。晓曼是科大讯飞首个用于银行网点的金融服务机器人。
科大讯飞将其世界领先的语音合成、语音识别、语义理解和人脸识别等技术运用到智能服务机器人本体上,结合麦克风阵列、3D摄像头、身份证读卡器、取号小票机等外设应用,以语音、触屏、动作等多模态的交互方式为用户提供优质的服务,在政府、金融、运营商、医疗等多个领域具有广阔应用前景。
4、教育
从中国人的理想来看,2500年来孔子就提出的因材施教,既能够脱离繁重的学业压迫,又希望每个人真的能够成才。要知道每个人的条件是不一样的,针对每一个人,采取不同的教学方法,只能说”理想很丰满,但现实很骨感”。
以英文的作文为例,我们都知道原来传统英文老师,因为作业非常难以批改,一般一个月才布置一次,而且每一次他只能给你一个分数,并不能给你细致的指出英文作文里面有哪些点你做的不好。但是利用讯飞超脑的自动作文评阅系统,现在就可以对不同的类型的错误都能给你指出来,而且给你一个精确的评分。对于语文、数学其实也是一样的,对于语文的作文,数学中的解答题,也可以把里面详细的内容,一一都给你指出来。
刘庆峰向记者指出,我们看到其实人工智能已经要改变我们很多的方面,比如说我们人机交互的方式,人工智能会有所改变,我们人与人之间交流的方式,人工智能也会有所改变,那么人工智能会改变我们出行的方式,人工智能会改变我们的教育,人工智能还会改变我们的医疗,改变我们的健康,改变我们很多的方面。
从2011年开始在语音识别领域崭露头角,科大讯飞是中国第一个把深度神经网络用到语音识别领域,并且在2011年,在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。2012年在图像识别中,深度神经网络开始异军突起;2014年机器翻译取得突破;今年,讯飞在一个又一个行业取得令人欣喜的成果,也是在这基础上,持续从算法创新,到应用创新和持续数据迭代的一个结果。(北方苍狼)返回搜狐,查看更多
人工智能的艰辛探索
一、教学目标和要求
知识目标:
1.了解人工智能产生的背景、意义、发展过程中的曲折及其背后的原因。
2.能够自主阐述人工智能发展中的三次浪潮。
3.了解我国人工智能的发展概况和现状。
能力目标:
了解人工智能艰辛的探索历程,辩证的认识人工智能对人类社会未来发展的巨大价值和潜在威胁,培养自觉维护和遵守人工智能社会化应用规范与法规的能力。
情感、态度与价值观:
通过本节课的自主阅读、交流和感知体验等教学活动,激发学生对人工智能诞生和发展历史的兴趣,感受人工智能踏浪前行的60年,了解我国人工智能发展的概况和现状,树立为中国富强而投身学习的人生观价值观。
二、教学方法和手段
本次课程主要是通过自主阅读,小组讨论,引导学生了解人工智能学科的诞生、人工智能发展的三次浪潮感受人工智能踏浪前行的的60年,结合学生较为熟悉的验证码案例,帮助学生认识图灵测试,通过完成课后练习题目,回顾本课所学,检验学生学习效果,拓展了解人工智能发展过程中出现的三大流派,教师主要起引导作用。
三、教学内容安排
本单元内容按中学教学时长40分钟开展,共计三课时,本次课用时1课时,主要讲授人工智能艰辛探索的历程,呈现科学技术发展的历程。
本节重点:
(1)能够自主阐述人工智能发展中的三次浪潮。
(2)了解我国人工智能的发展概况和现状。
本节难点:
了解人工智能产生的背景、意义、发展过程中的曲折及其背后的原因。
四、教学策略与评价
课堂以自主阅读、小组讨论为主要进行方式,再现人工智能技术随着时代的发展波澜起伏的过程,激励同学们从容面对挫折,不屈不挠努力奋进、勇于探索的科学精神。课程结束的评价绘制“人工智能发展历史的趋势图”并发表于班级空间,同时欣赏和点评其他同学趋势略,借鉴其他同学的优点改进自己的趋势图,养成分享知识的习惯。
五、 教学实施
教学背景分析
人工智能发展跌宕起伏,在60余年的时间里经历了三次浪潮。而学生对于人工智能的
、发展历程以及我国人工智能的发展尚不清楚。本节课学生将通过自主阅读和小组讨
论,了解人工智能的发展历程,了解人工智能产生的背景、意义、发展过程中的曲折及其
背后的原因,阐述人工智能发展中的三次浪潮,知道我国人工智能发展的概况和现状。
课前准备
教材,教学课件,学习单。
教学过程设计
新
课
讲
授
教师活动
学生活动
设计说明
环节一:新课引入
展示关于人工智能的猜想的图片,激发学生探究人工智能诞生和发展的兴趣,帮助学生快速进入课程主题
教师活动:
1.提问引入:提问学生是否知道关于智能机械的神话、猜想或相关的文学作品,邀请有所了解的同学分享。
2.展示西周时期能歌善舞的人偶图片和生化人图片,介绍早期人类关于人工智能的猜想。启发学生进一步思考:科学家们现在开展了哪些探索和实践工作呢?
学生活动:
1.跟随教师的思路,回忆关于人工智能的猜想的神话或文学作品,并与大家交流分享。
2.知道中国西周的偃师制造能歌善舞的人偶等关于人工智能猜想,产生探究人工智能诞生和发展的兴趣。
环节二:新知学习(一)人工智能学科的诞生
设计说明
教师活动:
1.组织学生阅读教材P16“一、人工智能学科的诞生”的内容,要求学生说出人工智能诞生的基础、出现的源头、研究历程中的里程碑分别是什么?“人工智能”一词何时被提出,并作为这门学科的正式名称呢?
2.组织学生阅读教材P17页“资料卡片”的内容,启发学生思考验证码为何是一类全自动区分计算机和人类的图灵测试?与常规图灵测试有什么不同呢?帮助学生拓展了解图灵测试。
学生活动:
1.跟随教师的思路,阅读教材P16“一、人工智能学科的诞生”的内容,了解人工智能诞生的基础、出现的源头、研究历程中的里程碑,知道“人工智能”一词被提出,并作为这门学科的正式名称的时间。
2.自主阅读,交流与讨论,拓展了解图灵测试。
通过自主阅读,小组讨论,引导学生了解人工智能学科的诞生;结合学生较为熟悉的验证码案例,帮助学生认识图灵测试。
环节三:新知学习(二)踏浪前行的60年
设计说明
教师活动:
1.组织学生自主阅读教材P18“人工智能的第一次浪潮”的内容,小组交流讨论并思考3个问题。
问题1.说一说早期人工智能发展取得了哪些成果?
问题2.了解在人工智能的第一次浪潮期间,各国政府以及研究者们对人工智能持何种态度呢?
问题3.人工智能发展的第一次浪潮结束的关键原因是什么?
(1)要求学生就近4人一组。
(2)提出小组任务,提示该任务过程中的核心要点和问题,阐述第一次浪潮取得的成果,政府和研究者对待人工智能的态度及第一次浪潮结束的原因。
(3)课堂巡视,解决小组合作中存在的问题。
(4)组织学生分组汇报。
2.总结归纳:人工智能发展的第一次浪潮中的发展历程。
3.通过图片和文字呈现,详细阐述人工智能发展的第二次浪潮。
4.组织学生自主阅读教材P19“人工智能的第三次浪潮”的内容,思考第三次浪潮中取得了哪些突破,发生了哪些关键事件。
(1)要求学生就近4人一组。
(2)提出小组任务,提示该任务过程中的核心要点和问题,阐述第三次浪潮中取得了哪些突破,发生了哪些关键事件。
(3)课堂巡视,解决小组合作中存在的问题。
(4)组织学生分组汇报。
5.总结归纳:第三次浪潮中的关键性事件,如神经网络深度学习、图像识别以及人机大战等相关成果。
6.总结人工智能发展,带领学生一起回顾人工智能踏浪前行的60年,引导学生分组讨论,在学习任务单问题1下方的空白处,绘制人工智能发展历程的趋势图。
(1)要求学生就近4人一组。
(2)提出小组任务,提示该任务过程中的核心要点和问题,三次浪潮分别取得了哪些突破,发生了哪些关键事件,曲折发展背后的原因等。
(3)课堂巡视,解决小组合作中存在的问题。
(4)组织学生分组汇报,教师进行点评总结。
学生活动:
1.自主阅读及小组讨论,了解并阐述人工智能发展的第一次浪潮。
(1)组织分工。
(2)开展任务。
(3)分小组汇报,汇报要点包括任务完成情况和过程体会。
2.跟随教师思路,总结人工智能发展的第一次浪潮的发展历程。
3.了解人工智能发展的第二次浪潮。
4.自主阅读及小组讨论,阐述人工智能第三次浪潮中取得了哪些突破,发生了哪些关键事件。
(1)组织分工。
(2)开展任务。
(3)分小组汇报,汇报要点包括任务完成情况和过程体会。
5.跟随教师思路,一起总结第三次浪潮的关键性事件。
6.回顾人工智能发展的三次浪潮,总结人工智能踏浪前行的60年。回顾总结60年来人工智能的发展历程,小组讨论与交流,在学习单问题1下方的空白处,绘制人工智能发展历程的趋势图。
(1)组织分工。
(2)开展任务。
(3)分小组汇报,汇报要点包括任务完成情况和过程体会。
通过学生自主阅读及小组讨论学习,了解人工智能发展的三次浪潮,感受人工智能踏浪前行的60年。
环节四:新知学习(三)中国人工智能的发展
设计说明
教师活动:
1.组织学生阅读教材P19-20“三、中国人工智能的发展”的内容,并简述我国人工智能的发展和现状,填写在学习单问题2下方的空白处,组织学生交流分享。
2.总结中国人工智能发展相关政策文件和学术研究成果。
学生活动:
1.自主阅读教材,阐述我国人工智能发展和现状,完成学习单问题2并交流分享任务完成情况。
2.了解中国人工智能发展相关政策文件和学术研究成果。
通过自主阅读、交流与讨论,了解我国人工智能的发展概况和现状。
环节五:拓展提升
设计说明
教师活动:
1.组织学生完成教材P21“基础练习”题目。
2.组织学生阅读教材P20-21“拓展阅读”材料,了解人工智能的三大流派,鼓励学生课下搜索资料,了解更多相关内容。
学生活动:
1.完成教材P21“基础练习”题目。
2.阅读教材P20-21的“拓展阅读”材料,了解人工智能的三大流派,课下搜索资料,了解更多相关内容。
通过完成课后练习题目,回顾本课所学,检验学生学习效果,拓展了解人工智能发展过程中出现的三大流派
课堂小结
通过本节课的自主阅读、交流和感知体验使同学们了解了人工智能产生的背景、意义和发展过程中的曲折及其背后的原因,了解了我国人工智能的发展概况和现状,了解我国人工智能发展的概况和现状,学习人工智能技术的目的就是为了今后我们能够顺利的走进智能社会,无障碍的工作与生活。
课后作业
1、 完成课后练习题目,拓展了展人工智能发展过程中出现的三大流派。
2、 人工智能的发展跌宕起伏,60余年来是如何发展的呢?结合教材中的阅读材料,自行查阅搜集相关资料,画一画人工智能发展历史的趋势图。
3、 点评班级空间的文章,完善自己的趋势图。
板书设计
教学反思
本次课程帮助学生了解了人工智能的发展历程及其背后的原因,了解了我国人工智能发展的概况和现状,促进学生关注人工智能技术在计算机视觉、自然语言处理等领域的应用,提前布置和规划后期利用开源硬件制作使用人工智能技术作品的任务,以终为始,加强和引导学生的学习
附本节学习任务单
《人工智能的艰辛探索》学习单
组别:
组员:
问题1:人工智能的发展跌宕起伏,60余年来是如何发展的呢?结合教材中的阅读材料,自行查阅并搜集相关资料,绘制人工智能发展历史的趋势图。
问题2:请结合我国人工智能发展,简述我国人工智能发展的关键事件。
学习单参考
问题1:人工智能的发展跌宕起伏,60余年来是如何发展的呢?结合教材中的阅读材料,自行查阅并搜集相关资料,绘制人工智能发展历史的趋势图。
问题2:请结合我国人工智能发展,简述我国人工智能发展的关键事件。
第3节《人工智能的艰辛探索》课件.pdf