博舍

自然语言处理在当今商业中的八大应用 人工智能自然语言处理领域的应用前景如何

自然语言处理在当今商业中的八大应用

了解自然语言处理如何演变为业务优化的推动者。

基于人工智能的工具现在统治着每个工业部门。有了丰富的社交媒体、组织和数字平台,产生的数据中不乏有用的资源。尽管企业一直在使用这些数据来满足他们的需要,但这些数据中更重要的部分(将近80%)是非结构化的,无法访问。这是自然语言处理(NLP)来挽救这种情况的地方。NLP是人工智能的一种应用程序,它为需要快速可靠地分析文本数据的公司提供了各种各样的应用程序。这有效地实现了人机交互,并允许对以前未使用的大量数据进行分析和格式化。

它赋予机器阅读、理解人类语言的能力,并从人类语言中获得意义。商业公司已经发现了这项技术的好处,并测试和执行了最有利的NLP应用,以推动商业智能的发展。目前,使用NLP,企业正在利用数据创造价值、分析市场、了解客户并获得竞争优势。据估计,2025年NLP市场规模将比2017年增长14倍,从30亿美元左右增长到430亿美元以上。

在过去的几年里,NLP在理论和实践上都取得了重大飞跃,融入了各种基于行业的解决方案。让我们来看看自然语言处理的一些广泛使用的商业应用。

1.聊天机器人

它们是NLP最普遍的用例,因为它们在处理客户支持请求和查询方面做得更好。他们充当支持的第一线,对请求进行分类,并将请求路由到适当的团队或部门。此外,聊天机器人为简单的客户问题提供虚拟帮助,并减轻不需要任何技能的低优先级、高周转率的任务。例如,ZomatoChatbox。

2.邮件过滤

这是NLP的另一个广泛使用的应用。在这种情况下,通过分析流经服务器的电子邮件中的文本,电子邮件提供商可以阻止基于垃圾邮件的电子邮件内容进入他们的邮箱。此外,它还增加了一层网络安全保护,还节省了时间。例如,Unroll.me。

3.招聘

NLP通过筛选简历,帮助招聘经理选择和筛选更好的候选人。自动寻找候选人的工具可以扫描申请者的简历,以提取所需的信息,并准确确定适合该工作的候选人。这将节省大量时间,并提供更有效的解决方案。例如,OracleTaleo。

4.神经机器翻译

是自然语言处理最古老的应用之一。在这一点上,机器翻译使用神经网络来翻译影响较小的内容,如电子邮件、法规文本等,并加快与合作伙伴的沟通以及其他业务交互。神经机器翻译工具使用双向递归神经网络(也称为编码器)将源语句处理成矢量,以供第二个递归神经网络(称为解码器)预测目标语言中的单词。例如,谷歌翻译。

5.情绪分析

也称为意见挖掘,NLP帮助识别客户的态度、情绪状态、判断或意图。这可以通过赋予文本极性(积极的、中性的或消极的),或者反过来努力识别语境的潜在情绪(高兴、悲伤、平静、愤怒)来实现。这使企业能够获得关于该组织及其服务的广泛公众意见。它还有助于进行有竞争力的比较,并在必要时对业务战略进行重要调整。例如,Repustate。

6.有针对性的广告

企业始终强调达到最大的受众数量,以增加潜在客户的机会。因此,NLP可以成为在正确时间、正确受众的正确地点智能定向和投放广告的极好来源。这是通过分析搜索关键字、浏览行为、电子邮件和社交媒体平台来在线寻找潜在客户来实现的。有针对性的广告主要依靠关键词匹配。为此,主要使用文本分析和文本挖掘工具。例如,ApacheOpenNLP。

7.文案

NLP可以通过完善内容营销策略来实现业务增长。它可以编写更符合你的品牌口碑的营销内容,并提供关于哪些信息对你的目标受众最具吸引力的见解-例如,阿里巴巴的人工智能文案。

8.内部威胁检测

基于NLP的内部威胁应用程序可以帮助确定通信中是否存在任何非法或恶意意图,并检测威胁模式以快速降低风险。这一点至关重要,因为数据泄露可能会给公司和客户带来巨大损失。例如,Splunk。

NLP目前渗透到每一家寻求推进其商业智能系统的企业。已经在上述情况下利用这些软件的公司的竞争优势日益增强,这应该是它们今天变得多么重要的动力。埃森哲建议,当业务组织开始设计和构建其NLP应用程序时,必须确保IT员工和实施合作伙伴拥有进行全面评估所需的带宽和专业知识,以便使NLP技术与业务目标保持一致。

 

人工智能在司法领域的应用

短短50年,司法(法律)人工智能的飞速发展令人惊叹,特别是近几年,人工智能大有取代法律人的趋势。在国外,人工智能应用于司法领域的例证可追溯至20世纪70年代,美国等发达国家研发了基于人工智能技术的法律推理系统、法律模拟分析系统、专家系统运用于司法实践。

我国最初将人工智能应用于司法是在20世纪80年代,由朱华荣、肖开权主持建立了盗窃罪量刑数学模型;1993年,赵廷光教授开发了实用刑法专家系统,具有检索、咨询刑法知识和对刑事个案进行推理判断、定性量刑的功能。

时至今日,随着我国智慧法院、智慧检务等重点工程的全面铺开,最高人民法院在2018年推出了“智慧法院导航系统”和“类案智能推送系统”,还有北京的“睿法官”智能研判系统、上海的“206”刑事案件智能辅助办案系统、河北的“智审1.0”审判辅助系统以及其他地方法院推出的人工智能产品,为法官审理案件提供了支持,全面提高了司法效率。

正如我们所看到的,司法人工智能一路走来,技术不断革新,愈发突破人类的认知极限。确实,人工智能在司法领域的应用前景十分广阔,很多学者甚至大胆猜测随着人工智能技术革命性的发展,法律人也将逐渐被取代。然而,尽管这一新兴事物激发了我们对未来的无限畅想,我们仍应保持清醒,在促进其发展的同时守住一些底线,不要抱有盲目的期待和开展毫无方向的研究,要在法律原则和伦理限度内客观评估、审慎使用。下文我们将对此展开详细的论述。

人工智能在司法领域的应用现状

(一)法律问答、信息处理数据化

司法人工智能在法律检索、信息处理上呈现电子化、数据化的趋势,并且这一趋势将如日中天地延续下去。如法律问答、诉前咨询、电子卷宗生成、远程立案等都属于在线信息处理技术,在此期间运用的人工智能没有自主思考过程,仍然由人进行实质化操作,其核心在于由传统的线下办案转为线上模式,为当事人及办案人员提供便利。其中法律问答机器人似乎与我们脑海中想象的人工智能更加接近,通过检索在机器人系统中提前设置好的固定提问模式来获取所需信息,其本身无法根据不同疑难问题产生额外答案,但对于日常一般案件所需还是可以满足的。

再如卷宗OCR识别、庭审语音识别、证据识别等属于感知智能技术,相较于传统的扫描、录音等技术有很大提升。以庭审语音识别为例,科大讯飞的灵犀语音助手特别针对中文口音问题进行了识别优化,语音识别率已能达到90%以上。与书记员在庭审中手动输入文字材料相比,庭审语音识别技术大大提高了庭审记录效率,经对比测试,庭审时间平均缩短20%至30%,复杂庭审时间缩短超过50%,庭审笔录的完整度达到100%。此外,这一技术的推广能够解决运用录音、录像技术记录庭审过程的最大弊端,即我国的方言问题,这就避免了后期因录音识别难度大所造成的理解困难。其次,识别转化后的电子书面材料与录音、录像这一载体相比,查阅起来也更加有针对性,更加方便快捷,正在起到解放书记员的作用。

(二)文书制作、类案推送自动化

在文书制作与类案推送上,司法人工智能发挥的作用比基础的信息处理就多了一些智能化的因素。对于大多数简单案件,如危险驾驶、小额借贷纠纷、政府信息公开等可以简化说理并且能够使用要素化、格式化裁判文书的案件,裁判文书自动生成系统能够通过OCR、语义分析等技术,自动识别并提取当事人信息、诉讼请求、案件事实等关键内容,按照相应的模板一键生成简式裁判文书。对于其他制式法律文书的生成更是不在话下,还能够自动纠错,因而大大缩短了起草文书的时间,减轻了法官的工作量,帮助法官提高办案质效。

例如河北高院研发的“智慧审判支持”系统,就包含这样的文书制作功能,于2016年7月上线,在河北194个法院应用,截至2017年6月,短短不到一年的时间共处理案件11万件,生成78万份文书。以此积累从而建立自己的案例信息库,通过分门别类、匹配标记达到类案检索,在法官办案时自动筛选以往相似度较高的案例,实现类案推送提醒,为法官对相似案件的审判提供参考。如此一来,能尽量避免“类案不同判”和“法律适用不统一”的问题,有利于统一本地的司法裁判尺度,防止裁判不公。

(三)案件分析、辅助裁判智能化

人工智能减轻了办案人员处理日常琐碎事务的负担,在这样的背景下,我们不仅希望人工智能在可量化、低效率的环节发挥作用,还期待能够进一步发挥其智能化的优势,从而提高司法效率。于是,将其应用于案件分析与裁判就成了一个重要议题。在案件分析的初级阶段,通过设置分流原则和调整繁简区分要素,智能分案系统能对各类案件进行精细化处理,在平台运转过程中,分别针对刑事、民事、行政等不同案件的特点,综合各项权重系数,科学测算每个案件所需的办案力量,帮助法院实现对案件的繁简分流,合理配置司法资源,缓和“案多人少”的压力。在案件的深度分析及辅助裁判上,北京法院的“睿法官”系统能在庭审前自动梳理出待审事实,生成庭审提纲,并推送到庭审系统中。上海“206系统”的最大亮点是证据标准、证据规则指引功能,这一功能实现了证据资料的智能审查,为办案人员提供了标准化指引。此外,阿里推出的“AI法官”针对交易纠纷类案件建立了整套审判知识图谱,能够迅速分析案情并在极短时间内向法官给出判案建议。

总之,司法与人工智能的深度结合在理论界讨论得热火朝天,对人工智能产品的应用某些方面已经走在了理论的前面,司法系统的改革亦是大势所趋。但这并不意味着目前的研究与应用是完全科学、有效的,对司法人工智能的应用空间及限度尚需细细推敲。

人工智能在司法领域的应用限度

(一)在广度上不能覆盖司法活动全程

目前,司法人工智能被集中运用于流程性重复低效劳动以及依据模型简单推理等环节,能够辅助处理事务性工作,在通用技术已然成熟的领域还是十分成功的,如在线方式的信息处理(信息电子化)以及语音识别技术的应用,确为司法活动提供了极大的便利。然而,我们发现,不管是在线信息处理还是语音识别,都是日常生活中已经广泛应用的技术,这几项应用的成功取决于成熟人工智能技术的普遍性适用。以语音识别为例,我们平时在智能手机中常用的语音输入法便是这一技术最普遍的体现,只是在庭审中对此功能开发的更加精准与完善了而已,虽然场景不同,但其本质是不变的。

由此可见,目前成功广泛应用的人工智能产品大多是将通用化的技术稍加完善,便移植到了部分司法活动中,而对于其他司法环节,如疑难案件的事实认定、评价证据的证明力度、法律解释等等,仅靠通用技术的成熟是无法满足其需求的,要通过非形式逻辑与司法经验等因素的灌输来“定制”专门化产品,使其达到能够应对大多数司法问题的水平,从而贯穿司法活动全程。关键就在于能否实现这种“定制”呢?这不仅意味着需要有高度发达的研发水平作为支撑,还需要将人工智能、法律知识、司法经验等多重因素深度融合,使人工智能具备法律人的逻辑与思维,其难度远远高于日常通用技术的开发。于是,如果期望人工智能技术覆盖司法活动全程,我们不难得出,这种“定制”是很难、甚至无法实现的。

(二)在深度上不能替代法官价值衡量

如上文所提到的,司法人工智能已经在信息检索、文书制作、智能识别、证据指引等方面得到了成功的推广应用,对于一些简单案件也可以实现辅助推理并提出量刑建议。其强大的数据处理能力大大减轻了法官从事日常琐碎工作的负担。虽然还有相关研究表明,将人工智能运用于预测裁判结果,得出的预测准确度远高于人类,但是就能如部分人群所追捧的那样,将人工智能取代法官吗?

人工智能是关于数据的技术,依赖于人类对它进行设计和编程,它只能对人类输入的已有知识和信息进行模式化的吸收和处理,尽管它对现有知识的掌握度远超人类,但致命的缺陷就在于它不能适应人类社会日新月异的变化。法律适用作为对现实社会的即时反映,在司法裁判的价值衡量中融入社会一般公正观念是一种常态,而这种价值衡量是一个十分复杂的过程,“带有人情味的价值判断”很难被机器所学习。而司法裁判是关于经验的艺术,美国大法官霍姆斯说过,法律的生命在于经验而不是逻辑,他要求法官根据社会生活的不断变化赋予每个案件独特的裁判价值,不要被固有的法律逻辑所束缚。这就需要在法律规范和生活之间有交互往返的认知过程,通过复杂的价值判断来获得结论。从这个角度来说,人工智能法官只能按照事先设置的形式化指令来裁判案件,亦步亦趋地跟随着人类的操控,没有人的参与和输入,机器学习不会自主发生,更不会有人的独立思维,也就无法满足法官在价值判断过程中的语境化需求。正如霍姆斯法官说得那样,法律不是纯粹的逻辑和极致的理性,在司法裁判中还应考虑经验、道德和温情。毕竟,只懂法律的人不一定能够胜任法官,更何况只懂法律的机器呢?

司法人工智能的应用前景与出路

(一)司法人工智能:好钢用在刀刃上

人工智能最大的优势就在于它直接服务于人,通过介入司法活动的各个环节,在信息储存、数据运算、简单推理等方面发挥着重要作用,办案人员借助这些辅助功能最大限度地将自身从重复性、事务性的工作中解脱出来,还能及时发现并纠正一些细节问题,从而能够将时间和精力真正投入到分析疑难案件本身,实现了司法资源的优化配置。不仅如此,人工智能介入司法环节还能够在办案过程中对法官的行为进行程序化约束,矫正法官的主观偏见,扩展法官的认知能力,减少法官因直觉等主观因素对价值判断形成的消极影响。

司法实践中,人工智能作为辅助工具带来便捷,但也仅限于服务法官、辅助法官。因此,对司法人工智能的研发要将重心放在其辅助功能上。并且,基于当前司法人工智能在通用技术领域的应用上已经取得了相应的成果,因而未来应当更倾向于针对司法活动的专业性特征,进行司法专用领域的技术开发。比如,国外的一些法院利用人工智能对案件结果进行预测,还将人工智能运用于审查专家证言的可采性上,为法官裁判案件提供指引和参考。我国在研发时也可以结合自身实际来开发相应的产品。此外,也可以针对我国部分法院开始应用的量刑推荐、审判偏离预警等功能进行进一步完善与推广。

技术是人类社会进步的重要力量,人类作为社会发展的主体,必须将技术为我所用。正所谓“君子性非异也,善假于物也”,只有懂得如何开发与利用司法人工智能,善于扬其长避其短,才能将人工智能的价值发挥到最大化,只有将这块好钢用在刀刃上,才能为司法、为人民创造更多的价值。

(二)人工智能法官:不可望也不可即

早在20世纪70年代,已有学者提出假设——人类法官是否能被机器法官所取代,以消除法律的不确定性?我国最高人民法院副院长贺荣给出了明确的答案:机器人大法官绝无可能出现。

事实上,无论是普通民众,还是在领域内深耕已久的专家,都对计算机、人工智能和机器人这些事物的概念难以详细地区分。但有一点众所周知,它们的运作本质都是“接收信息-处理信息-输出信息”这样一种计算过程,每一个步骤都需要确切的定义,存在“唯一正解”。而司法裁判的魅力却在于往往不追求非黑即白,每个具体的案件都有其独特的一面,除了追求客观与合法之外,其中隐含的人情世故、伦理道德错综复杂,需要有审判智慧和审判经验的法官进行心证和裁量。法律虽然是冰冷的,但适用法律的过程却蕴含着温情,比如“于欢案”中,杀死“辱母”者这样为母复仇的情节富有非理性的情感色彩,与我国自古以来“父之仇,弗与共戴天”的礼法观念不无关联,这些人情事理只有亲历了生活、接受过教育、感受过熏陶的人类法官才能体会和把握,而隔着冰冷屏幕的人工智能法官是无法体会其中之精妙的。此外,人工智能还面临着算法“黑箱”问题。司法裁判的过程,本身就是一个注重辩论和说理的过程,在庭审中,不仅双方的唇枪舌剑会给法官带来事实判断上的影响,一个交互的眼神、一个微妙的表情都会成为法官的捕捉点,我国西周时期就有“以五声听狱讼,求民情”的记载。而人工智能法官的判案过程则会是系统内部的数据处理和运算,得出的判决是一个“暗箱操作”的结果,我们对其中的运算过程一无所知,“黑箱”的封闭性决策直接与司法公开原则相违背,还可能会触发算法独裁和歧视,难免招致公众对判决结果的质疑,引发社会混乱。

更重要的是,我国宪法有明确规定,国家的一切权力属于人民,审判机关的权力由人民赋予,法官所行使的司法权实质上是人民主权理论下的公共权力。古代西方有这样一句法律格言:“法官只有一个上司,那就是法律。”在此公共授权的语境之下,法官在审判中享有绝对的权威,其他任何主体都不能左右法官的最终判决。从这个角度上来说,如果让人工智能取代法官,是将人民赋予的公共权力让渡给了一个机器,无异于放弃了人民的公共事业,而导向机器人的统治。机器人是否能够认可法律作为他的上司我们不得而知,但必然消解了司法裁判的意义,也破坏了司法公信,这是社会所不能接受和容忍的。

综上所言,人工智能法官取代人类法官这样的愿景,乍一听固然美好,但是却陷入了人工智能的万能论当中。司法裁判是理解的技艺,是一门价值衡量的艺术,其中蕴含的经验和智慧并非人工智能所能体悟。人工智能取代法官是一个不可望也不可即的遥远幻想,未来对司法人工智能的开发不能突破底线,毫无节制地利用人工智能改造审判系统只会为现代法治带来无可挽回的创伤。

结论

尽管人工智能热潮一次次席卷而来,不断突破想象、冲击认知,但我们不能盲目追捧,尤其在司法领域更应保持审慎和理性。对于司法环节中的一些事务性、重复性工作,无疑应当交给人工智能来处理,发挥其超强的整合运算功能,提高司法效率;对于司法活动中的核心权力,如审判权,则必须由法官独立行使,而人工智能因其自身认知和思维上的缺陷决定了其只能处于从属地位。此外,如果一旦将司法决策权交与人工智能,随之而来的算法黑箱、算法歧视必然对司法公正造成冲击,也是对人民主权和现代法治制度的消解。

未来,要坚守法官的主体地位和人工智能的辅助角色,对司法人工智能的研发也要在服务法官、辅助法官的路上继续前进,而不要误入取代法官的歧途。人工智能与司法的深度结合已是大势所趋,审时度势地做好这道司法人工智能的加法题,让“人工”和“智能”各归其位、各取所需、强强联合,才能为司法、为社会带来最大的价值,将司法高效与司法正义共同推进。

来源:《人民法治》杂志

作者:贾喆羽吕昭诗孙晓璞

原标题:《人工智能在司法领域的应用》

阅读原文

自然语言处理 NLP 的百年发展史

紧接着在1952年,生物学家阿兰·霍奇金(AlanHodgkin)和安德鲁·赫克斯利(AndrewHuxley)开发了一个数学模型来解释章鱼巨型轴突中神经细胞的行为,霍奇金-赫克斯利模型展示了人类的大脑如何利用神经元形成网络,首次将人类大脑的工作原理具象化地展示在世人面前。

这一系列颠覆性的研究成果在学术界引发轰动,激发了人工智能(AI)的思潮,同时也催生了自然语言处理(NLP)和计算机技术的发展。

NLP的早期理论基础

人们最早对NLP的探索始于对机器翻译的研究。1947年,美国科学家韦弗(W.Weaver)博士和英国工程师布斯(A.D.Booth)提出了利用计算机进行语言自动翻译的设想,机器翻译(MachineTranslation)从此步入历史舞台。

1957年,麻省理工学院的语言学教授诺姆·乔姆斯基(NoamChomsky)在他出版的《句法结构》一书中,革新了语言的概念,提出“要使计算机理解语言,就必须更改句子的结构。”

以此为目标,乔姆斯基创建了一种语法,称为“阶段结构语法”,该语法能够有条不紊地将自然语言句子翻译为计算机可以使用的格式。

1958年夏天,同样来自麻省理工学院的人工智能研究先驱约翰·麦卡锡(JohnMcCarthy)参与IBM资讯研究部的工作,研究符号运算及应用需求。但IBM旗下的Fortran表处理语言却未能支持符号运算的递归、条件表达式、动态存储分配及隐式回收等功能。

于是麦卡锡带领由MIT学生组成的团队开发了一门全新的表处理语言LISP,赋予了编程语言更强的数学计算能力。LISP语言后来也被称为人工智能的“母语”,成为早期人工智能研究人员的编程语言。

1964年,首个自然语言对话程序ELIZA诞生,该程序是由麻省理工学院人工智能实验室的德裔计算机科学家约瑟夫·维岑鲍姆(JosephWeizenbaum)使用一种名为MAD-SLIP的类LISP语言编写,运行在MIT实验室中36位的分时系统IBM7094(早期的晶体管大型计算机)上。

由于当时的计算能力有限,ELIZA只是通过重新排列句子并遵循相对简单的语法规则来实现与人类的简单交流。

用户通过电动打字机和打印机与程序进行远程交互,当用户键入一个句子并按Enter键时,消息被发送到服务端系统,ELIZA扫描邮件中是否存在关键字,并在新句子中使用该关键字以形成响应,返回打印给用户。

这种对话方式,给人的印象是计算机可以理解对话,又不必为对话提供任何新内容,仅用200行代码就产生了理解和参与的错觉。

在这一时期,虽然有了一定的理论基础以及像Eliza这样的初级产品,但在历时近12年并耗资近2000万美元后,机器翻译的成本还是远高于人工翻译,并且仍然没有任何计算机能够真正实现基本的对话。

于是在1966年,美国国家研究委员会(NRC)和自动语言处理咨询委员会(ALPAC)停止了对自然语言处理和机器翻译相关项目的资金支持,AI和NLP的发展因此陷入停滞。

此时,许多学者认为人工智能和自然语言处理的研究进入了死胡同。人类早期结合语言学与统计学对AI/NLP的初步探索以失败告终。

NLP的回归

直到1980年,在美国的卡内基梅隆大学召开了第一届机器学习国际研讨会,标志着机器学习研究在全世界的重新兴起。

在某种程度上来说,长达14年的真空期也让NLP界有时间冷静下来寻求新的突破。于是,早期的机器翻译概念被推翻,新的思想促进了新的研究。

早期的自然语言处理研究中,很流行语言学和统计学的混合,大多数NLP系统都使用复杂的“手写”逻辑规则。而现在,这一理念被纯粹的统计学所取代。

20世纪80年代,得益于计算能力的稳定增长以及机器学习的发展,研究人员开始对AI和NLP进行根本性的重新定位,用简单的近似法取代了深入的分析法,评估过程也变得更加量化。

经过一些挫折后,一种前馈神经网络模型MLP由伟博斯在1981年的神经网络反向传播(BP)算法中具体提出。当然BP仍然是今天神经网络架构的关键因素。

有了这些新思想,神经网络的研究又加快了。1985-1986年,一些神经网络研究学者先后提出了MLP与BP训练相结合的理念。

随后,一个非常著名的ML算法由罗斯·昆兰(RossQuinlan)在1986年提出,我们称之为决策树算法,更准确的说是ID3算法。这是另一个主流机器学习的重要里程碑。

与黑盒神经网络模型截然不同的是,决策树ID3算法也被作为一个软件,通过使用简单的规则和清晰的参考可以找到更多的现实生活中的使用情况。

决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。

决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。

决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。

决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。

语言模型简单来说就是一串词序列的概率分布。具体来说,语言模型的作用是为一个长度为m的文本确定一个概率分布P,表示这段文本存在的可能性。在实践中,如果文本的长度较长,P(wi|w1,w2,...,wi−1)的估算会非常困难。

因此,研究者们提出使用一个简化模型:n元模型(n-grammodel)。在n元模型中估算条件概率时,只需要对当前词的前n-1个词进行计算。

在n元模型中,传统的方法一般采用频率计数的比例来估算n元条件概率。当n较大时,机会存在数据稀疏问题,导致估算结果不准确。因此,在百万词级别的语料中,一般也就用到三元模型。

语言模型简单来说就是一串词序列的概率分布。具体来说,语言模型的作用是为一个长度为m的文本确定一个概率分布P,表示这段文本存在的可能性。在实践中,如果文本的长度较长,P(wi|w1,w2,...,wi−1)的估算会非常困难。

因此,研究者们提出使用一个简化模型:n元模型(n-grammodel)。在n元模型中估算条件概率时,只需要对当前词的前n-1个词进行计算。

在n元模型中,传统的方法一般采用频率计数的比例来估算n元条件概率。当n较大时,机会存在数据稀疏问题,导致估算结果不准确。因此,在百万词级别的语料中,一般也就用到三元模型。

为了缓解n元模型估算概率时遇到的数据稀疏问题,研究者们提出了神经网络语言模型。1997年,LSTM递归神经网络(RNN)模型被引入,并在2007年找到了语音和文本处理的利基市场。目前,神经网络模型被认为是NLP对文本和语音生成理解的最前沿研究。

2001年,法国AI专家约书亚·本吉奥(YoshioBengio)发表了一篇论文,提出了一种全新的语言神经网络模型。该模型使用前馈神经网络描述了一种不使用连接来形成循环的人工神经网络。

在这种类型的网络中,数据仅在一个方向上移动,从输入节点到任何隐藏节点,再到输出节点。前馈神经网络没有循环,与递归神经网络有很大不同。

本吉奥带来的全新思路启发了之后的很多基于神经网络的NLP学术研究,在工业界也得到了广泛使用,助力了NLP的应用在未来几年的加速落地。

此外,还有梯度消失(gradientvanishing)的细致分析,word2vec的雏形,以及如今实现的机器翻译技术都有本吉奥的贡献。

当代NLP的研究

经过长期的发展,自然语言处理(NLP)被人们系统地定义为人工智能中的一门分支学科。除了机器翻译与人机交互意外,NLP还包含以下高级功能的研究:

内容分类:语言文档摘要,包括内容警报,重复检测,搜索和索引。

主题发现和建模:捕获文本集合的主题和含义,并对文本进行高级分析。

上下文提取:自动从基于文本的源中提取结构化数据。

情绪分析:识别存储在大量文本中的总体情绪或主观意见,用于意见挖掘。

文本到语音和语音到文本的转换:将语音命令转换为文本,反之亦然。

文档摘要:自动创建摘要,压缩大量文本。

机器翻译:自动将一种语言的文本或语音翻译成另一种语言。

内容分类:语言文档摘要,包括内容警报,重复检测,搜索和索引。

主题发现和建模:捕获文本集合的主题和含义,并对文本进行高级分析。

上下文提取:自动从基于文本的源中提取结构化数据。

情绪分析:识别存储在大量文本中的总体情绪或主观意见,用于意见挖掘。

文本到语音和语音到文本的转换:将语音命令转换为文本,反之亦然。

文档摘要:自动创建摘要,压缩大量文本。

机器翻译:自动将一种语言的文本或语音翻译成另一种语言。

在2011年,苹果公司的Siri成为世界上第一个成功被普通消费者使用的NLP/AI助手之一。在Siri中,自动语音识别模块将所有的单词转换为数字解释的概念。

然后,语音命令系统会将这些概念与预定义的命令进行匹配,从而启动特定的操作。例如,如果Siri问:“您想听一下您的余额吗?”它会理解你将要回答的“是”或“否”,并采取相应的行动。

通过使用机器学习技术,所有者的口语模式不必与预定义的表达式完全匹配。对于NLP系统来说,声音必须合理地接近才能正确翻译含义。通过使用反馈循环,NLP引擎可以显着提高其翻译的准确性,并增加系统的词汇量。

训练有素的系统会理解“我在哪里可以得到大数据的帮助?”这样的字眼。“我在哪里可以找到大数据专家?”或“我需要大数据方面的帮助”,并提供适当的答复。

对话管理器与NLP的组合,使开发一个能够真正与人类对话的系统成为可能。2014年6月8日,一个名为尤金·古斯特曼(EugeneGoostman)的电脑聊天程序成功让参与测试的33%人类裁判相信它是一个13岁的男孩,成为有史以来首台通过图灵测试的计算机。

NLP的未来

近年来,在NLP领域中,使用语言模型预训练方法在多项NLP任务上都取得了突破性进展,广泛受到了各界的关注。

前文提到,目前神经网络在进行训练的时候基本都是基于后向传播(BP)算法,通过对网络模型参数进行随机初始化,然后通过BP算法利用例如SGD这样的优化算法去优化模型参数。

那么预训练的思想就是,该模型的参数不再是随机初始化,而是先有一个任务进行训练得到一套模型参数,然后用这套参数对模型进行初始化,再进行训练。

即通过在大量的语料上预训练语言模型,然后再将预训练好的模型迁移到具体的下游NLP任务,从而提高模型的能力。

得益于目前硬件算力的提升,预训练语言模型的参数规模呈指数倍增长。其中,GPT模型是OpenAI在2018年提出的一种新的ELMo算法模型,该模型在预训练模型的基础上,只需要做一些微调即可直接迁移到各种NLP任务中,因此具有很强的迁移能力。

2019年推出的GPT-2拥有15亿参数,到了2020年推出的GPT-3已经拥有惊人的1750亿参数,不仅能轻松通过图灵测试,还能完成包括写代码在内的大部分NLP任务。

神经网络之父、图灵奖获得者杰弗里·辛顿(GeoffreyHinton)表示,“鉴于GPT-3在未来的惊人前景,可以得出结论:生命、宇宙和万物的答案,就只是4.398万亿个参数而已。”

这一观点也引发了人们的广泛讨论,被认为是对NLP发展尽头的预言。当未来人类的算力不断突破极限时,包含全人类文明的GPT-N是否会是NLP的终点呢?返回搜狐,查看更多

人工智能技术应用的领域主要有哪些

参考链接:人工智能应用

随着智能家电、穿戴设备、智能机器人等产物的出现和普及,人工智能技术已经进入到生活的各个领域,引发越来越多的关注。那么,人工智能目前都应用在哪些领域,运用了怎样的技术原理呢?  

什么是人工智能? 

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是认知、决策、反馈的过程。  曾经有很多人戏称,人工智能就像一列火车,你苦苦期盼,它终于来了,然后它呼啸而过,把你抛在身后。虽然这是一种笑谈,但也反应了人工智能技术发展的迅速和无法想象的快,可能一个不小心,你就被远远甩在身后。 

人工智能技术的细分领域有哪些? 

 人工智能技术应用的细分领域:深度学习、计算机视觉、智能机器人、虚拟个人助理、自然语言处理—语音识别、自然语言处理—通用、实时语音翻译、情境感知计算、手势控制、视觉内容自动识别、推荐引擎等。 

1、深度学习 

 深度学习作为人工智能领域的一个应用分支,不管是从市面上公司的数量还是投资人投资喜好的角度来说,都是一重要应用领域。说到深度学习,大家第一个想到的肯定是AlphaGo,通过一次又一次的学习、更新算法,最终在人机大战中打败围棋大师李世石。百度的机器人“小度”多次参加最强大脑的“人机大战”,并取得胜利,亦是深度学习的结果。   

深度学习的技术原理: 

1.构建一个网络并且随机初始化所有连接的权重; 2.将大量的数据情况输出到这个网络中; 3.网络处理这些动作并且进行学习; 4.如果这个动作符合指定的动作,将会增强权重,如果不符合,将会降低权重; 5.系统通过如上过程调整权重; 6.在成千上万次的学习之后,超过人类的表现; 

2、计算机视觉 

计算机视觉是指计算机从图像中识别出物体、场景和活动的能力。计算机视觉有着广泛的细分应用,其中包括,医疗成像分析被用来提高疾病的预测、诊断和治疗;人脸识别被支付宝或者网上一些自助服务用来自动识别照片里的人物。同时在安防及监控领域,也有很多的应用…… 

计算机视觉的技术原理: 

计算机视觉技术运用由图像处理操作及其他技术所组成的序列来将图像分析任务分解为便于管理的小块任务。比如,一些技术能够从图像中检测到物体的边缘及纹理。分类技术可被用作确定识别到的特征是否能够代表系统已知的一类物体。 

3、语音识别 

语音识别技术最通俗易懂的讲法就是语音转化为文字,并对其进行识别认知和处理。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。 

语音识别技术原理: 

1、对声音进行处理,使用移动窗函数对声音进行分帧; 2、声音被分帧后,变为很多波形,需要将波形做声学体征提取,变为状态; 3、特征提起之后,声音就变成了一个N行、N列的矩阵。然后通过音素组合成单词; 

4、虚拟个人助理 

说到虚拟个人助理,可能大家脑子里还没有具体的概念。但是说到Siri,你肯定就能立马明白什么是虚拟个人助理。除了Siri之外,Windows10的Cortana也是典型代表。 

虚拟个人助理技术原理:(以Siri为例) 

1、用户对着Siri说话后,语音将立即被编码,并转换成一个压缩数字文件,该文件包含了用户语音的相关信息; 2、由于用户手机处于开机状态,语音信号将被转入用户所使用移动运营商的基站当中,然后再通过一系列固定电线发送至用户的互联网服务供应商(ISP),该ISP拥有云计算服务器; 3、该服务器中的内置系列模块,将通过技术手段来识别用户刚才说过的内容。 总而言之,Siri等虚拟助理软件的工作原理就是“本地语音识别+云计算服务”。 

5、语言处理 

自然语言处理(NPL),像计算机视觉技术一样,将各种有助于实现目标的多种技术进行了融合,实现人机间自然语言通信。   

语言处理技术原理: 

1、汉字编码词法分析; 2、句法分析; 3、语义分析; 4、文本生成; 5、语音识别; 

6、智能机器人 

智能机器人在生活中随处可见,扫地机器人、陪伴机器人……这些机器人不管是跟人语音聊天,还是自主定位导航行走、安防监控等,都离不开人工智能技术的支持。 

智能机器人技术原理: 

人工智能技术把机器视觉、自动规划等认知技术、各种传感器整合到机器人身上,使得机器人拥有判断、决策的能力,能在各种不同的环境中处理不同的任务。 

  智能穿戴设备、智能家电、智能出行或者无人机设备其实都是类似的原理。

7、引擎推荐 

不知道大家现在上网有没有这样的体验,那就是网站会根据你之前浏览过的页面、搜索过的关键字推送给你一些相关的网站内容。这其实就是引擎推荐技术的一种表现。 

Google为什么会做免费搜索引擎,目的就是为了搜集大量的自然搜索数据,丰富他的大数据数据库,为后面的人工智能数据库做准备。 

引擎推荐技术原理: 

推荐引擎是基于用户的行为、属性(用户浏览网站产生的数据),通过算法分析和处理,主动发现用户当前或潜在需求,并主动推送信息给用户的信息网络。快速推荐给用户信息,提高浏览效率和转化率。 

关于人工智能的展望 

除了上面的应用之外,人工智能技术肯定会朝着越来越多的分支领域发展。医疗、教育、金融、衣食住行等等涉及人类生活的各个方面都会有所渗透。 

当然,人工智能的迅速发展必然会带来一些问题。比如有人鼓吹人工智能万能、也有人说人工智能会对人类造成威胁,或者受市场利益和趋势的驱动,涌现大量跟人工智能沾边的公司,但却没有实际应用场景,过分吹嘘概念。 

转自:http://www.arduino.cn/thread-45848-1-1.html

人工智能技术在护理领域的应用现状与发展趋势

人工智能(artificialintelligence)是一门新型学科,在多个领域取得了令人瞩目的发展,许多国家已将人工智能提升到国家战略的高度。2017年7月我国颁布的《新一代人工智能发展规划》中指出要不断推行和运用人工智能模式下的治疗护理新手段、新模式,并且搭建精准快速的智能医疗体系。随着全球社会老龄化的日益加剧,就医群体数量不断增加,但护理人力资源极度紧缺,需要科技含量高的智能护理技术来满足社会对医疗护理服务的需求,减轻护理人员劳动强度,提升护理服务水平。与其他学科一样,护理学科也是人工智能技术运用中的重要辐射范围。人工智能技术的快速发展将对护理模式的改变产生重大而深远的影响,具有重要的意义[1-2]。

1护理人工智能技术发展概况

人工智能技术已逐渐影响国内外医疗行业的工作模式,其在疾病诊断、病理分析、新药研发、实践理论和中药辨识等方面已取得杰出成绩。由IBM公司研发的Watson将医师的诊疗经验与医疗大数据整合,并进行分析和判断,为医护人员提供辅助性的处理逻辑,成为全球先进的医疗人工智能系统代表[3]。护理人工智能技术目前主要应用于药品器械传递、患者移动、延伸护理和护理教育等方面,其可有效减轻医护人员的工作压力。

1.1人工智能技术在饮食护理中的应用

随着人口老龄化时代的到来,残疾人和失能老年人对护理的需求与护理人力资源缺乏的矛盾日益加剧。其中日常饮食护理是照护对象最重要的生活活动之一,护理人员需花费大量时间与被护理者交流,以了解照护对象喜欢的食物、适宜的喂食间隔等。这些护理工作将耗费大量人力和物力。自20世纪80年代,英美等发达国家先后研制出多种饮食护理人工智能机器人,这给残疾人和失能老年人的生活带来极大的便利,也有效减轻了护理人员的工作负担。日本神奈川工科大学研制了一款针对四肢瘫痪患者的进食辅助机器人,其由人机交互系统和辅助进食机器人系统组成,成功实现了人机交互功能,为四肢瘫痪用户提供了便捷的助餐条件[4],也为残疾人和失能老年人的日常饮食护理活动提供了有效的解决方案。

1.2人工智能技术在护理教育中的应用

教育人工智能(EAI)是人工智能技术与学习科学相结合而成的一个新兴领域[5]。护理教学系统中也逐渐引入了人工智能技术,与护理教学体系的智能性、迁移性和分布性等特点有效契合,使学习资源得到充分应用,为学生提供个性化的学习条件[6]。人工智能导师可以根据学生的学习兴趣、学习需求和学习习惯等为学生订制个性化学习计划[7]。智能测评可以对学生的学习表现进行评价,并且实时跟踪学生的学习表现。护理教育学习者可以通过数据挖掘建模了解和掌握学习结果与教学行为、学习资源、学习内容等变量之间的关系,从而更好地预测学习趋向[6]。

1.3人工智能技术在慢性疾病护理管理中的应用

随着生活水平的提高,慢性疾病成为国内常见疾病中最主要的死亡原因之一。将人工智能技术与医疗设备、移动计算和传感器技术等最新技术相结合,有可能创造和提供更好的慢性疾病护理服务[7]。目前基于移动应用的创新慢性疾病护理模式最早形成于美国。如医护人员通过自我监测的血糖应用帮助自制力强的患者自我管理,使之成为减少糖尿病患者低血糖的有效工具[8]。适合临床日常实践和慢性疾病自我管理的人工智能技术正在逐步建立,为提高患者的生活质量提供强有力的工具。

1.4智能病房

为了降低临床医护人员和患者的双重压力,2016年IBMWaston物联网(LoT)支持的智能病房于托马斯·杰斐逊大学医院推出[9]。该智能病房运用IBM的自然语言性能和认知计算,使患者能要求护理人员提供某种具体信息和协助其活动,甚至自己发出口令来进行灯光调节、温度调节和开启音乐等,从而营造舒适的病房环境。该智能病房还可以与患者互动交流,从而更好地协助医师和护理人员开展工作;同时,记录和存储的资料还可供日后医学检查[10]。为更有效地实现患儿危险预警,提高医护人员的早期风险预见性,洛杉矶儿童医院的新生儿重症监护病房自主研发了基于既往医疗数据分析的智能软件[9],以提高对重症患儿的照护质量。

2护理人工智能技术的发展机遇2.1帮助护理人员进行患者就诊前健康状况初步分析评估

临床护理评估主要包括患者入院身体评估、心理评估、风险评估、生活总自理能力评估及健康教育需求评估等。规范护理评估流程,使之更科学、全面,对于提高临床整体护理质量具有重要影响,而且也符合护理安全优先[11]的服务要求。人工智能技术的快速发展有望将医疗和护理的所有相关知识和经验汇聚在一个超级机器人身上,从而更高效、精准地将各项医疗及护理相关数据进行整合,为每位居民建立电子健康档案,并运用云平台、一体化等信息方法组建健康大数据。人工智能技术可帮助护理人员第一时间掌握患者个体化信息和差异性数据,有效做好护理评估和诊断工作[12]。此外,人工智能技术在帮助医护人员获取和管理患者信息的同时,还能从群体特征和个体特性方面通过智能分析、整理和归纳总结疾病预防、治疗、护理和康复的多种需求[13],提升护理人员的业务水平。我国的临床护理工作者应重视与护理健康评估相关的内容,如评价工具的开发与应用研究等,建立符合我国护理临床工作特点的健康评估工作流程和评价体系。

2.2缓解护理人力资源紧张局面

目前我国医疗卫生人力资源不足,尤其是护理人力资源缺乏。人工智能技术的支撑可有效提升临床护理工作效率,保障临床护理质量。随着信息化护理资源管理系统的实施,将护士工作站系统与掌上电脑(PDA)等移动终端设备有机结合,信息联网互通,改良护理评估、护理计划制定、护理措施实施和护理效果评价流程,将护理人员从反复重复操作、手工书写执行中解放出来,从而将更多时间用在对患者的实际护理中,提供优质护理服务[14]。借助人工智能技术完成患者身份匹配,能提高身份识别的准确率,减少用药、采血及其他护理操作失误,保障医疗护理安全。目前,患者的出院随访及延伸服务工作大多由护理人员完成,如由医疗机器人协助或独立完成可节约大量的人力和物力,有效提高现有人力资源的使用率,缓解目前面临的护理人力资源紧张的局面[15]。

2.3重构护理服务模式

人工智能技术的不断发展和政府政策导向将导致未来医疗护理服务模式发生巨变。通过智能化移动终端和可穿戴设备仪器的监测,及时发现健康状况异常的个体和人群,做到疾病早期识别,提前给予患者健康提示和专业建议,可有效将护理服务时间段前移,在患者发病就医前给予护理干预,真正做到未病先防、既病防变。对于部分初次发病的患者,可以第一时间通过智能化移动平台进行访问,通过医疗人工智能系统的互动沟通对健康状况进行预评估。在这种护理模式下,患者对实体医疗机构的依赖程度将大大降低,对信息化人工智能系统的医疗及护理支持的依赖将越来越高[16]。

3小结

随着人工智能技术的发展,其在健康领域的关注度越来越高,应用前景广阔,但仍需要广大医疗卫生工作者、计算机专家等跨领域协作,不断研发出更智能、便捷的应用,为医护人员提供更精准的辅助帮助,为患者带来更安全、品质更高的医疗护理服务。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇