博舍

人机交互的应用领域 人机交互和人工智能的差别是什么

人机交互的应用领域

自计算机以一个庞然大物的笨拙体态出现直到现在,它已经越来越紧密地融入了人们的日常生活,并已经被公认为解决医疗、教育、科研、环保等各类重大社会问题不可或缺的重要工具。在从人逐渐适应计算机再到计算机不断适应人的互动过程中,人机交互技术也不再局限于键盘输入、手柄操作,而是以更加新奇的方式出现:手指的微小动作、声波在空气中的振动、眼珠和舌头的转动,都可以实现信息传递,完成人与机器之间的“对话”。

什么是人机交互技术?

人机交互技术(Human-ComputerInteractionTechniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。

人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。

也指通过电极将神经信号与电子信号互相联系,达到人脑与电脑互相沟通的技术,可以预见,电脑甚至可以在未来成为一种媒介,达到人脑与人脑意识之间的交流,即心灵感应。

商用的各类人机交互技术

2008年,微软总裁比尔·盖茨提出“自然用户界面”(naturaluserinterface)的概念,并预言人机互动模式在未来几年内将会有很大的改观,电脑的键盘和鼠标将会逐步被更为自然、更具直觉性的触摸式、视觉型以及声控界面所代替。而随着技术的精进,“有机用户界面”(organicuserinterface)也开始悄然兴起——生物识别传感器、皮肤显示器,乃至大脑与计算机的直接对接,无疑都将给人类的生活带来重大影响。《未来学家》杂志5/6月号刊登的文章,就对当前正在研发或者已投入商用的各类人机交互技术进行了盘点。

触摸式显示屏

触摸式显示屏在很多领域已经被广泛应用,最为人熟知的就是安装在机场或者商场的Kiosk自助服务设备,游客或购物者通过手动触摸屏幕,就可以查询相关信息,办理登机手续,甚至购买报纸。

2007年,微软公司推出了“桌面”(Surface)计算机,带来了全新的触摸式人机交互模式。这款酷似咖啡桌桌面的平板电脑完全摒弃了鼠标和键盘,通过声音、笔或者触摸就可以完成编辑、浏览图片或者直接订餐等操作。其显示屏隐藏在硬塑料板底下,依靠一套摄像机系统捕捉人发出的指令动作,然后进行分析、理解并加以执行。更令人称奇的是,只要将手机、播放器等物品放到其表面,电脑就能自动识别并进行文件传输。由于“桌面”计算机的屏幕可以分割,并且使用了多点触控技术,可方便多达10个用户同时使用。

而今年6月,“桌面”将迎来一个强劲对手,索尼公司计划推出一款名为AtracTable的茶几电脑与之一较高下。AtracTable也可以与放在它表面的手机等设备进行交流互动。另外,该款电脑中还集成了年龄、性别、情绪等分析系统,可以智能识别使用对象。索尼的目标是将之推广到各种使用环境,包括游戏行业、工业、医疗市场和零售业等。

柔性显示屏

超薄、超轻的柔性显示屏已经走出实验室,很快就会进入市场“打江山”。很多评论人士认为,使用能够随意折叠卷曲的柔性显示屏制造的电子书就是未来的纸张。

目前电子书阅读器的柔性显示屏有多种类型,其中包括可以主动发光但却会给读者的眼睛带来刺激和伤害的有机发光二极管(LOED)显示屏、需要使用背景光的液晶显示屏(LCD)、以及用在亚马逊Kindle电子书阅读器上的由美国E-Ink公司利用电泳显示技术制造的电子纸。

不同的显示技术之间各有优劣,因而拥有不同的应用市场,比如,LOED显示屏的刷新率更快,而E-Ink公司的电子纸则更加节能。在将来,报纸、杂志甚至服装、墙面都可以变成显示屏,向我们展示一幅幅动态画面。

3D显示器

尽管3D电影早在90年前就已经问世,但2010年才算是真正的“3D元年”,索尼、松下和其他厂商纷纷宣布自己生产的3D电视机年内即可上市销售,将3D影像从电影院搬进客厅已是指日可待。

目前的3D电视机仍然需要观众佩戴特制的眼镜才可以收看节目。眼镜的规格大致分为主动式快门3D眼镜和偏光3D眼镜两种,并且没有通用的工业标准,由各厂商自行研制。

虽然产业界认为,近期3D电影在全球票房大卖,预示着家庭市场已经做好了迎接3D的准备,不过,普通观众是否能够忍受连续好几个小时戴着特制眼镜看电视还是个未知数。而据专家预测,无需佩戴眼镜就可收看节目的3D电视机大概还要再等10年左右才会推向市场。

视网膜显示器

视网膜显示器能够通过低强度激光或者发光二极管直接将影像投射到使用者的视网膜上,具有不遮挡视野的特点。

这一概念是在20多年前提出的,但直到近些年来技术进步才让各种不同的视网膜显示变得可行。比如边发射发光二极管,其比面发射发光二极管的光输出功率大,但比激光的功率要求低,将其应用于视网膜显示器,可提供一个亮度更高而成本更低的选择。与传统显示器相比,视网膜显示器的亮度-功率比更高,能耗也会相应地大幅降低。

视网膜成像的应用前景非常广阔,比如车载平视显示器,可将重要的驾驶信息投射在汽车的前风挡玻璃上,司机平视就可以看到,从而可以提高行车安全;此外还可为执行军事任务的士兵提供最优路径和战术信息,并且在医疗手术、浸入式游戏行业也大有作为。日本兄弟公司曾在2005年的日本“爱知世博会”上展示了全球首款视网膜显示器。该公司最近宣布,计划于今年发布一款使用红光、绿光和蓝光激光二极管的商用视网膜成像显示器。

地理空间跟踪

地理空间跟踪的应用潜力才刚刚开始展现,在未来几年中有望取得巨大的技术进步。智能手机配备的全球定位系统、定向仪和加速度计可以提供足够多的信息,来帮助使用者确定大概地点和方向。而技术的改进将有可能使跟踪的精度提高到误差不超出1毫米。

很多针对手机开发的现实增强应用,如基于位置的营销、旅游帮助和社交网络等,都使用了地理空间数据,可以提供基于使用者所处方位的关联信息。在未来几年内,随着跟踪定位精度进一步提高以及无线网络进一步提速,这块市场将会大幅增长。

动作识别

动作识别是一项正在发展中的技术,在很多方面都可得到应用,如可穿戴式计算机、隐身技术、浸入式游戏以及情感计算(一种可对人类的情感进行侦测、分类、组织和回应的系统或应用,可以帮助使用者获得高效而又亲切的感觉)等。过去大部分动作识别系统重点分析的是脸部和手部的动作,不过现在,研发人员也开始将关注点转移到身体姿势、步态和其他行为举止上来。

人机交互技术会在哪些领域出彩?

2016年春天,凭借机器学习打造的谷歌人工智能程序AlphaGo战胜了世界顶级围棋棋手李世石。这场胜利可谓AI技术发展史上里程碑式的事件。这一程序应用了深度神经网络,能够最大化地模拟人类思考的过程。

通过3000万棋局的自我对弈以及与专业棋手的较量,AlphaGo团队大大精进了这一智能程序的棋艺。看上去这个故事的主角似乎是机器学习,但是我们忽略了人机交互中人类获得的益处:在和AlphaGo较量的过程中,人类棋手的棋艺也能得到很大的提高。就像神经网络会让AlphaGo用人类的方式思考问题一样,在未来,和这样的智能程序的互动也会让人类从机器学习中提高已有的能力并获得新的知识。

从机器学习中不断学习新的知识和技能会对很多行业产生十分直接的影响。在未来,人机交互学习将主要从以下五大领域影响我们的生活。

教育

教育领域是最有机会从人机交互学习中受益的。举个例子,根据机器学习演化而来的自适应学习能够基于每个学生不同的学习习惯,为其量身打造最适合的学习方法。从教育领域巨头Person到创企DuoLingo都在利用这一方式打造个性化教育平台,DuoLingo开发的软件还能根据用户输入的内容提高自己的翻译能力。在目前这种在线教育和混合教育不断发展的时期,那些能够不断从人机交互学习中获益的公司就拥有了竞争优势。学习的定义也在不断的更新——无论是人类学习还是机器学习。

人力资源

人力资源招聘到管理的整个过程都为人机交互学习创造了一个理想的环境。很多创企都将机器学习用于企业的招聘过程中,谷歌的人力运营团队已经开始利用数据来优化人力资源的获取过程。通过机器学习来识别和预测人力资源的发展趋势和需求,我们将不断提升自身专业技能,而且还能让员工和机器算法积极对话、相互学习。

风险投资

在过去五年中,风投公司对那些人工智能领域创企的投资持续且稳定增长,但是这些投资还未“光顾”过机器学习领域。风险投资过程将人际关系、对投资行业的了解、投资者的感性直觉以及理性定量分析融为一体,这对于人机交互学习来说简直是一片发展沃土。

心理学与行为科学

研究表明,比起人类自己,机器算法能够更快速、更准确的预测人类的行为。随着机器学习不断发展,它有能力让我们对自己的想法和行为有更加清晰的认识,再反过来帮助我们改变这些行为。无论是治疗方案、日常运动计划还是对于退休生活的规划,行为干预所服务的整个行业都会深受人类与机器交互学习的益处。艺术

人机交互学习同样能够改变我们的创作过程——尽管这看似最不实用,但却是最开放的一环。机器学习不光可以进行分析,而且还能随时开启生成模式。它能够对现有事物进行识别,但同时也能创造新的内容:如视觉图像和音乐创作。

机器学习的确会给各个行业以及我们的工作带来影响,而且在不断取代我们生活中的某些部分。但是与此同时,我们的思考方式、学习习惯以及创作方式又会在同机器交互的过程中受到一些影响。在未来,人类学习和机器学习一定能产生良性互动,人类与机器的合作一定会更加紧密。

人机交互技术在各个领域的应用

(1)工作事故,健康与安全

包括事故与安全;事故调查;事故改造;健康与安全;健康人机工程;危险分析;健康与安全课题;健康与安全规则的应用;工业工作压力;机器防护;安全文化与安全管理;安全文化评价与改进;警示与提醒技术;安全概率分析;

(2)人体工作行为解剖学和人体测量解剖学;人体测量;人体测量和工作空间设计;生物力学;残疾人设计;姿势和生物力学负荷研究;工作中的滑倒、差错研究;背部疼痛;听觉障碍研究;

(3)认知工效学和复杂任务认知技能和决策研究;法律人机工程;团队工作;过程研究;

(4)计算机软件人机工程软件设计;软件发展;软件人机工程;执行和可用性;

(5)计算机终端:设计与布局计算机产品和外设的设计与布局;计算机终端工作站;显示屏设备与规则;显示屏健康与安全;DSE和手动操作;顺从测量;DSE人机评价;VDUs和办公环境人机工程研究;

(6)显示与控制布局设计显示与控制信息的选择与设计

(7)控制室设计控制台和控制室的布局设计;控制室人机工程;

(8)环境人机工程环境状况和因素分析;噪音测量;工作中的听力损失;热环境;可视性与照明;工作环境人机工程;振动;

(9)专家论证:多工作环境专家论证调查研究;法律人机工程;工业赔偿申诉;伤害诉讼;伤害原因;诉讼支持;

(10)人机界面设计与评价人机界面的设计与发展;知识系统;人机界面形式;HCI/MMI原型;GUI原型;

(11)人的可靠性人的失误和可靠性研究;人的失误分析;人因审查;人因整合;人的可靠性评价;

(12)工业设计应用信息设计;市场/用户研究;医疗设备;坐的设计与舒适性研究;座椅设计与分类;家具分类与选择;

(13)工业/商业工作空间设计工业工作空间设计;工业人机工程;工作设计与组织;人体测量学与工作空间设计;工作空间设计与工作站设计;警告、标签与说明;工作负荷分析;

(14)管理与人机工程变化管理;成本-利益分析;突发事故应变研究;人机战略实施;操作效能;操作负荷分析;标准化研究;人力资源管理;工作程序;人机规则和实践;

(15)手工操作负荷:安全与培训手工操作评价与培训;手工操作与举力;手工操作负荷

(16)办公室人机工程与设计办公自动化;办公室和办公设备设计;办公室设计人机工程;DSE人机工程;

(17)生理学方面和医学人机工程生理学;生理能力;医学人机工程;医学设备;心理生理学;行为期望;行为标准;

(18)产品设计与顾客人机工程销售与市场;产品设计与测试;产品中人机工程;产品发展;产品可靠性与安全性;产品缺陷;产品材质;服装人机工程;

(19)风险评估:多种工作状况风险与成本-利益分析;风险评估与风险管理;风险预测;总体骨骼、肌肉风险研究;

(20)社会技术系统与人机工程组织行为;组织变化;组织心理学;人机工程战略;社会技术系统;暴力评估与动机;

(21)系统分析

系统分析与设计;系统整合;系统需求;电信系统与产品;人机系统;Manprint;人员配备研究;三维人体模型;实验设计;系统设计标准与类别;通信分析;

(22)任务分析

任务分析与工作设计;任务分析与综合;团队协作;

(23)管理培训与人员培训

人机工程培训;整体培训;认知技能/决策分析;工程师培训;STUDIO中的训练;训练模型;培训需求分析;

(24)可用性评估

可用性评估与测试;可用性审核;可用性评估;可用性培训;试验与验证;仿真与试验;仿真研究;仿真与原型;

(25)用户需求与用户指导

用户文档;用户指导;用户手册与说明;用户界面设计与原型;用户需求分析与类别;用户实验管理;

(26)车辆与交通人机工程航空;直升机人机工程;头盔显示;乘客环境;铁路车辆与系统;交通设计;车辆设计;车辆人机工程;车辆安全性

(27)与工作有关的骨骼、肌肉问题骨骼、肌肉紊乱;重复劳动的疲劳损伤;与工作有关的骨骼、肌肉管理问题;上肢损伤;

(28)其它特殊的人机工程应用

原子能;军队人机工程;军队系统;过程控制;文化调查;调查与研究方法;自动语音识别

人机交互与智能的起源、本质

摘要:本文分析了人机交互与智能的哲学起源及科学起源,梳理了古代四大文明关注的不同焦点,即人物、人神、人人、人与环境之间的关系,由此导出了人机交互与智能的本质,分析了现代人机交互与智能中的一些重要概念,探讨了人机交互与智能中的自主性问题,研究了人机交互和智能的瓶颈,并由此提出了深度态势感知的概念,最后对人机交互与智能的发展进行了总结和展望。

关键词:人机交互,人工智能,自主性,态势感知,深度态势感知 

1.智能与交互的起源

霍金曾说过,在过去的20年里,人工智能一直专注于围绕建设智能体所产生的问题,即在特定的情境下,可以感知并行动的各种系统,在这种情况下,智能是一个与统计学,和经济学相关的理性概念。通俗地讲,这是一种做出好的决定计划和推论的能力。那么什么是交互与智能,我们将在下文中进行探讨。

人工智能或智能科学,其概念最早发源于哲学,早期有一批伟大的哲学家,一直在讨论什么是智能,什么是知识。迈克·波兰尼(MichaelPolanyi),他曾在20世纪60年代写过一部著名的著作:《TheTacitDimension》(《默会的维度》),提出“我们知道的越多,那么我们知道的越少”。同时他还认为我们知道的远比我们说出来的要很多(Wecanknow morethanwecantell)。波兰尼这句话里面,体现出了默会的知识、隐形的知识,在支配着我们不断的向显性的知识进行递进、进行演化。

第二个人是弗里德里希·哈耶克。弗里德里希·哈耶克在经济方面对世界的影响非常大,他曾拿过诺贝尔经济学奖。他一生当中,涉列了政治、社会、经济、文化、艺术、哲学和心理学,在认知科学方面,他有一本著作《TheSensoryOrder》(《感觉的秩序》)。在这本书中,他明确地提出了一个观点“Actionmorethandesign”即行为远比设计更重要,其大意即人的各种感觉,是通过行为来表征出来的,而不是故意设计出来的,后来的演化造成了设计出现。维基百科的创立人很推崇《TheSensoryOrder》这本书,认为是这本书,点醒了他创立了维基百科。

第三个是卡尔·波普尔,他是一个伟大的哲学家,提出了三个世界的观点,物理的、精神的、和人工的。他有一本非常经典的著作《科学发现的逻辑》,他提出科学不是证实是证伪,他认为科学是提出问题进行猜想,然后进行反驳,不断的试错,有科学的出现,而不是常规意义上的观察归纳,然后证实的实证机制。在归纳里面有很多的漏洞,因为归纳是不完全的归纳,波普尔就有针对性的对归纳进行了梳理。

人工智能的科学起源,通常认为人工智能的技术起源,是从1956年美国达特茅斯会议开始。但它的科学起源,可以最早追溯到曾任剑桥大学老师的查尔斯·巴贝奇,他是世界上做机械计算机的鼻祖,做了一台机械的计算机,计算Sin和Cos数值的大小,从此人类拉开了计算的帷幕。另一个是剑桥大学的伯特兰·罗素。罗素利用其哲学思想和他的数学基础,创立了一个很重要的哲学分支——分析哲学。分析哲学的至高点是维特根斯坦,2005年左右曾有一次世界哲学家投票,排名第一即是维特根斯坦。维特根斯坦的前半期写了一部重要的著作——《逻辑哲学论》。这部书里提出,语言是哲学的重要的工具,也是哲学的切入点。在此之前,哲学的发展有两个里程碑,第一个是关于世界本源的问题,即是物质的还是意识的,这个讨论了一千多年,后来笛卡尔开始研究用什么样的方法来认识世界是物质的还是意识的,提出二元论。在此之后,人们找了很多方法来研究哲学,但收效甚微,直到维特根斯坦,他改变了哲学的轨迹。他前半生研究关于语言的人工性,所谓人工性的语言就是标准化的语言,格式化的语言,是流程性的程序化的语言,而他的后半期主要否定了自己前半期的工作,开始研究生活化的语言,自然性的语言。认为真正的哲学是通过生活化的语言,来体现出哲学的深奥和哲学的意义。

2.历史中的智能与交互

在人类的文明的历史中,有过四大文明古国,在这四大文明古国里边最著名的,即古巴比伦和古埃及,这两个文明,几乎同时出现,它们是距今6000多年前,就已经有了国家、工具、文字出现,这两个文明直接导致了欧洲文明的起源。这两个文明主要是研究人和物之间的关系,例如水利、工具、一些制度、法律。这种人和物之间的关系,后来影响到了欧洲的一些地中海(希腊)文明,后来辐射到整个欧洲大陆,诞生了科学和技术,科学和技术的宗旨研究,就是人和物之间的关系。

除了这两个最早的文明以外,第三大文明就是古印度文明。古印度文明里面很重要的特质,就是研究人和神之间的关系。人神之间的关系,主要是人和抽象事物,不可掌控的一些事物之间的关系,在中东一带,诞生了世界所有最主要的宗教,像伊斯兰教、像基督教、印度教,佛教等等,都源于此,都是关于人和神之间关系的。

第四大文明是研究人和人之间关系,人和环境之间关系的一个重要的文明,即中华文明。目前世界上唯一一个保存的较完整、较好的文明,就是中华文明。中华文明体现的不是人和物,人和神之间的关系,是人和人之间如何融洽,人和环境之间如何和谐,天、地、人之间如何共生的问题。

在距今2500年以前,西方公认的科学之祖和哲学之祖,是泰勒斯,他和中国的老子、孔子差不多出现在同一时代,其思想体现在他的一句箴言里面即“waterisbest”(水是最好的)。水是一种物质,地球生物是海洋里诞生出来的,然后水又滋育的和哺育了人类,所以西方的科学和哲学一开始就和物质密切相关,而我们的老子对水也有阐述“上善若水”,孔子的“逝者如斯夫”,也是对水的一种感叹,但他们大多都拘泥于感性和伦理方面,所以东西方文明的差异从这几个代表性人物语言里边大家可见一斑。

   从上文可见在岁月的发展的历史长河当中,人类四大文明分别聚焦于人物、人神、人人、人与环境,相互之间的关系,而科学和技术的发展,和人和物之间的关联密切相关,所以,现代科学技术起源于欧洲,是顺理成章的,也是可以理解的。但是,目前来看,随着社会和人类不断的进步,人和人之间、人和环境之间的关系,日益提到日程上来,所以,现在整个世界的焦点,逐渐从西方转移到了以人人、人与环境为主的东方视角来。

3.智能与交互的本质

人和物之间的关系,是西方一个重要的研究方向,机器是人造物,所以人机交互,也是起源于这个西方。人机交互的本质,是共在,即“Beingtogether”。人把自己的优点,和机器的长处结合在一起,形成了一个交互的,互补性的联结,未来人工智能的发展方向,很可能是人机融合智能或人机混合智能,即把人的智慧和机器的智能结合在一起,形成一个更有力的,支撑性的发展趋势,这样不但研究人机交互的脖子以下的,即生理的问题,而且还会研究脖子以上的,即心理的或者大脑的问题。其实,人机交互或人机混合智能,都是不准确的词,最准确的词是人机环境交互系统,因为人和机器及物质,其交互是不完整的,是通过环境这个大系统,来进行沟通的,所以人机环境系统工程,可能是未来的,一个主要的研究方向。

那么,人工智能或智能的本质是什么?可以从人的成长经历或发展上看出一些端倪。一般来说胎儿在母亲腹中,就已经开始有了各种感觉,如听觉、嗅觉、味觉、触觉,已经开始和外部的环境及母亲腹中的内部环境进行交互,已经产生了一个,很简单的“我”的概念。然后,出生以后,因为视觉、听觉等感觉发育得不是很完善,更多的是用触觉来接触世界,了解他周围的一些事物,随着自主能力的产生,会试图摆脱大人的束缚,更愿意自己爬,自己走,不希望别人去扶。可以看到,这时候已经开始否定了,否定别人的帮助。据国内外最新的研究结果,小孩形成语言的时候,无论东方还是西方,除了被不断重复灌输的爸爸、妈妈这种词以外,自己先说出的,都是从第一个单词--动词“不”开始的,然后会发展到,说“没有”还有“别”这些词。“不”、“没有”、“别”这些词,就是孩子们成长的一个过程,在这个过程当中,就体现出人的智能,是从否定开始的,否定外部,否定自己,否定很多事物,来产生了某种智慧性的东西。需要注意,在人工智能里边,其否定机制,还远远没有产生,所以人工智能和人的智能,有很大的差异。

我们在研究过程中发现,人工智能的起点,第一个词是“是”,being”,即存在,客观的物质,这是西方的哲学的一个很重要的词,世界是物质的还是意识的,其中物质就是“being”。然后,关于人的智能和智慧,还存在着“Should”-应该。《三国演义》里面的“义”,就是“Should”,“应该”的意思,“仗义”的“义”也是“应该”的意思,“应该”这个词,在西方里边非常重要,在东方里边也很重视,这是东西方文明融合的一个交汇点。Should,翻译成哲学语言,就是意识的指向,即awareness、consciousness。另外还有want,人有want,即想干什么,而机器不会want,机器只会按照程序、指令进行操作,而人还有一个“能(can)”的问题,即能做还是不能做。机器没有这个问题,只是操作。

休谟在他的哲学体系里边,提出了很重要的“休谟之问”:“是”推不出“应该”,这句话的意思是从事实里推不出价值观。中国古代著名的一句话“天行健,君子必自强不息”是不成立的。天行健是一个事实,君子必自强不息,是一种价值观,二者不能划等号,这里面涉及到一个很重要的词--“change”,“变”,人会不断的“change”,而机器则不能,只会按部就班、因循守旧、刻舟求剑。我们认为这五个词是人工智能和人类智能很重要的差异。另外,人还有一个很重要的特质,即感知的恒常性,人在变化的外界环境当中通常能够保留对这个事物的本来面目的感知,例如某种颜色。在不同的背景下,会改变这种颜色的影响,但是人却会能够在这种变化当中,找到不变的那种感觉,而机器不然,机器它对外部变化的颜色,会有一个实时的反应,很难找到那种不变的东西。

4.现代人工智能与交互

    任何新的事物都有其产生的源泉,人机融合智能也不例外,人机融合智能主要起源于人机交互和智能科学这两个领域,而这两个领域起源都与英国剑桥大学有着密切的关系:1940年夏,当德国轰炸机飞向伦敦之际,人机交互与智能科学的研究序幕就被徐徐拉开了…英国人为了抵御德国人的进攻,开始了雷达、飞机、密码破译方面的科技应用工作,当时在剑桥大学圣约翰学院建立了第一个研究人机交互问题的飞机座舱(即著名的CambridgeCockpit)以解决飞行员们执行飞行任务时出现的一些错误和失误,另外剑桥国王学院的毕业生图灵领导了对德军“恩尼格玛”密电文的破译…事实上,早在19世纪,剑桥大学的查尔斯.巴贝奇和阿达.奥古斯塔(剑桥大学毕业生、诗人拜伦的女儿,世界第一位程序员)就开始合作机械计算机软硬件的研制,20世纪之后,数学家罗素、逻辑学家维特根斯坦(图灵的老师和朋友)都对智能科学的起源和发展做出了重大的贡献。

(剑桥最著名的老鹰酒吧是现代人机交互技术的发源地之一)

在现代的人工智能的发展,剑桥大学也起到了非常重要的作用,其中有三个代表性的人物,第一个就是阿兰·图灵,他提出了图灵测试和图灵机的思想,然后影响了整个世界人工智能发展的轨迹。第二个人就是著名的深度学习之父GeoffreyHinton,他曾是剑桥大学心理系的本科生,后来到了加拿大,继续做关于人工神经网络的研究,并提出了深度学习的概念和方法,人工智能因此而得到了复兴和现在的繁荣。第三个是AlphaGo之父DemisHassabis,他是剑桥大学计算机专业的本科毕业生,对推动人工智能的发展,也起到了非常重要的作用。

人机交互的研究始于二战时期,当时主要研究因为各种不合理的设计导致的飞机故障,开始主要应用在航空航天领域,后来逐渐扩展的社会经济的各方面。最近人机交互里面有一个比较热点的领域——态势感知(situationawareness,也叫情景意识)由曾任美国空军女首席科学家MicaR.Endsley提出。态势感知或情景意识的提出,对整个人机交互产生了巨大的影响。Endsley对态势感知的定义,是在一定的时间和空间内,对环境中的各组成成分,进行感知、理解,进而预测这些成分的随后变化状况。可以看出,在整个人类的发展过程当中,智能科学是一个涉及交叉学科,涉及心理学、计算机科学、神经科学、哲学、语言学等等,这些学科构成的一个完整的学科体系,可以总称为认知科学。

当前人机环境系统工程的发展迅猛,其定义为:人机环境系统工程,是研究在人、装备和环境系统之间,实现最优匹配的一个领域,涉及到信息的输入、处理、输出和控制,以及反馈,人机环境系统的整体设计,及其优化等方面的研究,研究的目的,是整个系统的高效、安全、健康、和谐、敏捷等。

当前在这一领域的研究中出现了很多分支,例如,人机交互、普适计算、情感计算等,并产生了很多相应的关键技术,如多模感知、上下文感知、情感智能、环境智能、认知智能、多模界面、感性界面,这些技术用来实现一个最基本的目标,即自然的人机交互。在自然的人机交互中非常重要的一点是数据。所有智能的产生与刺激和数据密切相关,所谓刺激,就是人感知到的外部的映射。所谓数据是机器接触到的外部的输入,通过这两个来产生相应的融合、理解,进而进行相应的反应和规划。

数据空间对计算机起着非常重要的作用,研究数据的多指向性(包括能指、所指)是当前人机领域的一个难点和瓶颈,同时数据的多指向性,是人机的难以有效融合的一个最重要的瓶颈,人可以理解一个数据的多指向,多含义,而机器不然,机器有规范,有规则,它只能从一个角度来看待这个数据。

当前人工智能的发展有三大主要标志:深蓝、沃森和Alpha系列,这三个系统都和数据有关,它们都是在处理过去的大量的数据、规则、规划。但是这三个最顶级的系统,都有一个很重要的问题,一个瓶颈问题,就是它只能“得形忘意”,而不能“得意忘形”。真正的人的智能需要临机决策、举一反三,而不是像计算机及当前弱人工智能按照套路去运算。人是算计,算计要比计算灵活的多,是一种可以横跨主客观参数的交互性泛计算。

5.智能与交互中的自主性问题

未来的人机交互及人工智能系统,有明确的发展方向,它包含四个方面:主动的推荐、自主的学习、自然的进化、自身的免疫。在这四个方面中自主性是非常重要的一个概念。

美军有一个深绿系统,其目的是借鉴深蓝系统的思想,将其映射到军事指挥和控制领域。它通过指挥员助手、水晶球和闪电战三个模块,整合出当前的和过去的战场态势,以及实时有效的指挥员辅助决策。这个系统里最重要的是自主性和主动推荐。自主和主动是人工智能或智能科学一个很重要的研究热点和难点。自主应该包括以下几方面:

第一,自主应具有记忆的功能,而不是存储,记忆是灵活的,能够通过相关无关的事物产生直觉,而存储则无法出现直觉,它只是符合逻辑的东西。

第二,自主应具有选择性。选择性是单向性的,即A选择B。

第三,自主应具有匹配性。匹配和选择最大的区别,就是匹配是双向性的,A可以选择B,B也可以选择A。

第四,自主应可以控制。没有控制和反馈,自主很难建立起来。

未来的人机交互及人工智能系统,它至少是人机环境系统的自主耦合,形成了一个认知智能环路系统。认知的意思就是信息的流动过程,包括输入、处理、输出和反馈这几个环节。

   人工智能的重要发展方向,是人机混合智能。强人工智能、迁移人工智能、通用人工智能,及类人人工智能,实现还相对较遥远,当前相对实现的途径就是人机混合智能。人机混合智能就是研究如何在人、机及环境系统之间,实现最优的智能匹配,人的智能加上机器的智能,涉及人机环境系统的整体设计,及其优化等方面的研究,研究的目的包括可靠、高效和敏捷等几个方面。它最主要的涉及到两个基本问题,一个是人的意向性和机器的形式化问题。所谓意向性,就是意识的指向。机器难以处理涉及到灵活、可改变的,甚至带有矛盾悖论性的事物,但是机器的长处在于它不疲劳、存储大、擅计算,并且能够准确及时处理形式化、符号化的东西,而这是人所不擅长的。所以,如何把机器的长处和人的一些优点充分的结合在一起,这是一个很重要的命题,也是人机混合智能的一个瓶颈,其中两者之间何时/如何相互介入及介入的反应时、准确率是这个瓶颈中的关键问题。

在人工智能和机器人领域有一个著名的悖论叫莫拉维克悖论,莫拉维克悖论指出:和传统假设不同,对计算机而言,实现逻辑推理等人类高级智慧只需要相对很少的计算能力,而实现感知、运动等低等级智慧却需要巨大的计算资源。说明当前人工智能领域很多问题不是仅仅靠提高计算能力就能解决的,这个悖论用哈佛大学心理教授Stevenpinker的一句话来说,就是困难的问题是简单的,简单的问题是困难的。

对于人工智能这个最终的悖论而言,意向性、意识是整个智能科学的瓶颈,可以看出,意识就是一种感知,这是情境感知。还有一种是非情境的感知,能够穿越时空,这是人的意识,机器则不然。

对于意识,著名心理学先驱,美国第一届的心理学协会的会长WilliamJames曾说过“人的智慧就是忽略的艺术”,人知道怎么忽略一些不重要的事物,而把精力聚焦到一些重要的,一些关键之处/特征之上,而机器不然,只擅长处理大数据,而不擅长处理小数据、假数据。

   “自我”的产生是意识最重要的一个基础,自我的概念实际上就是建立了一个坐标系,“自我”即坐标系的原点,人类都是以自我为原点度量周围世界与事物的。意识的出现往往会造“无中生有”和“有中生无”。无中生有,往往是只有外界的刺激所产生的数据形成数值,数值不但包括客观的数量,而且还形成了主观的赋值。比如说“1”里边,它既是一个单纯的客观的数值,同时“1”也是对自我有特殊意义的一个数,例如一杯茶,一条毛巾,里面有很多主观的一些情感化的赋予。第二,形成数值以后,需要提取有价值的东西即信息。信息就是有价值的数值或者数据,从信息里面可以获取知识,从知识里边提炼逻辑,也就是从0到1,从1到n的过程,正应了中国古代道教所说的:道生一、一生二、二生三、三生万物,它整个的过程就是无中生有的过程。有中生无,就是指逻辑产生意向,从意向性导出意识,就是觉察觉知,从意识里边,沉淀出潜意识,从潜意识升华为无意识的过程,也就是从n到1,从1到0的一个过程,万物归三、三归二、二归一、一归道之历程。

6.深度态势感知

通过意识或态势感知(情景感知)及情境化的东西和非情境化的东西的结合,我们提出一个新的概念,叫做深度情境意识,或深度态势感知(DeepSituationalawareness)。什么叫深度的态势感知,我们认为:这是一种人机智慧,既包括了人的智慧,也融合了机器的智能,是能指和所指,所谓能指,就是指事物本身。所谓所指就是事物本身所包含的语义和内涵,即涉及事物的属性。能指主要涉及到事物的感觉,又关联它们之间的关系,所指包括它们的知觉。所谓感觉,就是指对属性的这种映射,所谓知觉就是联系、理解。既能够理解事物原本之意,又能够明白弦外之音,是合情合理、通情达理的一个方式,是人机环境系统中各元素的主动的拓朴,处理跨情境的原型特征的一个空间。与Endsley态势感知概念的不同之处是,它关涉有限时空和数据/信息资源环境下的人、机、环境系统之间的交互,包含人的态势感知和机的态势感知及其之间的有机融合。

深度态势感知具体涉及的是感觉、知觉、规划和反馈那么四个环节,感觉,人的感觉和机器的这种输入有所区别,人的感觉里面包含了想象和真实的刺激,所以人的感觉是真实的和虚拟信息的叠加,知觉就是把这些信息串起来。所谓对事物的理解,就是看见了之间的各种联系。规划和反馈则是控制方面的两个重要术语。

另外,人的深度态势感知或深度情境感知中有一个很重要的机理——弥聚,就是能够把数理、地理、物理、生理、心理、伦理、法理、管理等方面的知识及时的准确的进行相应融合、分配、表征、延展,而机器只是从一个角度进行梳理,所以人机的差异在深度态势感知能力的弥聚效应。

人工智能发展到今天,它解决的主要的途径,就是形式化、符号化。当前人工智能在知识表示、问题的求解、自动的推理、机器学习、自然语言理解和模式识别方面进行了诸多工作,也进行了统一的认知结构化的处理。但当前人们对人工智能的未来,仍有很多的质疑和不满,主要原因在于有两个很重要的领域,尚未得到有效的开发,一个是神经科学,关于人类大脑的开发还没有得到非常突破性的成果。第二是认知心理学,这个领域也没有得到很好的发展。神经科学涉及到三个主要的方面,第一是神经的编码,第二是计算的回路,第三是神经的发育,这三个方面,都没有得到有效的这种研究和表征。认知心理学里中概念的发展,学习和记忆,和知觉的加工,也没有深刻的理解,所以,这种认知的滞后,进而映射到这个人工智能里面,产生了一些不良的反应,所以如何来实现这些学科的综合协调的发展,人机环境系统,很可能是进行协调和整理一个有效的工具。

在这个感性和理性的过程中,有一个很重要的方向,就是大家所熟知的可计算性理论。在可计算性理论里边有一个对立面——可算计性理论。所谓可计算性理论,就是指运用事先规定的规则,将一组数值,变换为另一组数值的过程,就是可计算的过程。而可算计性理论不但要处理合理性,还要处理非合理性,包括非理性的东西。它不但要处理逻辑性的东西,而且要非逻辑性的东西;不但要进行计算,而且还要进行算计,这些对立面的整合,可能是算计性理论的一个基础。在此基础上,需要对学习、理解、知识和概念进行重新定义。例如理解的概念是看见了联系叫理解,看不到联系叫不理解。对于人的学习,学和习不同,学是由内而外发出的主观性行为,习是练习,通过练习,来加强它的理解,而机器则不是学习,机器是输入,是赋值,是规则。

总 结

    本文中探讨了人机交互和人工智能的起源和瓶颈问题,人工智能和智能科学的发展,包括三个基本的阶段,第一个阶段是传统的人工智能,这个传统的人工智能已经有了游戏规则,它的基本的特质就是数学形式化的东西,加上再某一领域的展开。这里边还涉及到一个自动化的问题,其实很多问题是自动化的问题,不是人工智能的问题。自动化涉及的是结构化的数据处理,人工智能是非结构化的数据处理。第二个大的阶段是人机环境系统的交互领域,这个领域里边正在形成规则。这个规则主要体现在两个方面,第一个方面就是自动化的处理,第二个方面是弱人工智能。当前在这个领域里,还要加上各个行业和各个研究的指向。第三个领域就是未来人机融合智能系统领域,在这个领域里面,目前还没有游戏的规则,它主要的体现在人的智慧加上未来的强人工智能,或一些通用的人工智能。这个领域,还需要进行一些积极的探讨与多学科交叉研究。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇