博舍

人工智能:如何在机器学习、自然语言处理等领域发挥作用 人工智能在语言处理方面的作用

人工智能:如何在机器学习、自然语言处理等领域发挥作用

0分享至人工智能是指使机器具有类似于人类的认知、理解和决策能力的技术。大数据分析是指利用各种工具和方法对海量、多样、快速变化的数据进行处理、挖掘和应用的过程。两者之间有着密切的联系和互动,可以相互促进和增强。

机器学习:让机器从数据中学习

机器学习是人工智能的一个重要分支,它指的是让机器通过数据和算法来自动地学习和改进其性能的能力。机器学习可以分为监督学习、无监督学习、半监督学习和强化学习等类型,根据不同的目标和场景选择合适的方法。

大数据分析为机器学习提供了丰富而多样的数据源,使得机器可以从中获取更多的信息和知识,提高其学习效率和准确度。同时,大数据分析也需要借助机器学习来处理复杂而高维度的数据,发现其中的规律和价值,实现智能化的数据服务。

机器学习在各个行业和领域都有广泛的应用,例如:

1.在金融领域,机器学习可以用于信用评估、风险管理、欺诈检测、投资建议等方面,帮助金融机构提高效率和降低成本。

2.在医疗领域,机器学习可以用于诊断、预测、治疗、药物开发等方面,帮助医生和患者提高健康水平和生活质量。

3.在教育领域,机器学习可以用于个性化教学、智能评测、知识图谱等方面,帮助教师和学生提高教学效果和学习效率。

4.在电商领域,机器学习可以用于推荐系统、搜索引擎、广告投放等方面,帮助商家和消费者提高转化率和满意度。

自然语言处理:让机器理解和生成语言

自然语言处理是人工智能的另一个重要分支,它指的是让机器能够理解、分析、生成和交互人类使用的自然语言(如中文、英文等)的能力。自然语言处理涉及到语音识别、语义理解、情感分析、机器翻译、文本摘要、对话系统等方面,是人机交互的核心技术之一。

大数据分析为自然语言处理提供了海量而多元的语言数据,使得机器可以从中学习语言的规则和模式,提高其语言能力和智能水平。同时,自然语言处理也需要借助大数据分析来处理复杂而多样的语言数据,发现其中的意义和价值,实现智能化的语言服务。

自然语言处理在各个行业和领域都有广泛的应用,例如:

1.在社交媒体领域,自然语言处理可以用于舆情分析、内容审核、话题发现等方面,帮助企业和个人了解和管理网络舆论。

2.在智能助理领域,自然语言处理可以用于语音识别、语音合成、问答系统等方面,帮助用户实现便捷和智能的生活和工作。

3.在新闻媒体领域,自然语言处理可以用于新闻生成、新闻摘要、新闻推荐等方面,帮助媒体提高效率和质量。

4.在文学创作领域,自然语言处理可以用于诗歌生成、故事生成、歌词生成等方面,帮助作者提高创作灵感和水平。

图像识别:让机器看懂和创造图像

图像识别是人工智能的又一个重要分支,它指的是让机器能够理解、分析、生成和交互人类使用的图像(如照片、视频等)的能力。图像识别涉及到人脸识别、物体检测、场景分析、图像生成、图像编辑等方面,是人机交互的核心技术之一。

人工智能和大数据分析是当今时代最具前景和影响力的技术之一,它们相互依赖、相互促进、相互增强,为各个行业和领域带来了巨大的变革和价值。在机器学习、自然语言处理和图像识别等领域,人工智能和大数据分析展现了强大的能力和潜力,为人类提供了更智能、更便捷、更高效、更有趣的服务和体验。随着技术的不断发展和创新,人工智能和大数据分析将会在未来创造更多的奇迹和可能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.

/阅读下一篇/返回网易首页下载网易新闻客户端

人工智能的研究热点:自然语言处理

 人工智能(ArtificialIntelligence,简称AI)作为新一轮科技革命和产业变革的重要驱动力量,正在深刻地影响世界、改变世界。而自然语言处理(NaturalLanguageProcessing,简称NLP)已成为AI领域的研究热点,它推动着语言智能的持续发展和突破,并越来越多地应用于各个行业。正如国际知名学者周海中先生曾经所言:“自然语言处理是极有吸引力的研究领域,它具有重大的理论意义和实用价值。”

[[343420]]

 

NLP主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。而用自然语言与计算机进行通信,有着十分重要的实际应用意义,也有着革命性的理论意义。实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等;前者称为自然语言理解(NaturalLanguageUnderstanding,简称NLU),后者称为自然语言生成(NaturalLanguageGeneration,简称NLG)。因此,NLP大体包括了NLU和NLG两个部分。因为处理自然语言的关键是要让计算机”理解“自然语言,所以通常把NLU视为NLP,也称为计算语言学。

NLP融计算机科学、语言学、自动化、数学等为一体,是一门综合性的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。NLP并不是一般地研究自然语言,而是研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统;因而它是计算机科学的一部分。可以说,NLP是计算机科学、语言学、AI等关注计算机和自然语言之间的相互作用的领域。目前,人们对AI的需求也从计算智能、感知智能到了以NLP为代表的认知智能的层面。没有成功的NLP,就不会有真正的认知智能。因此,NLP被视为AI极具吸引力的研究领域以及AI必须优先解决的核心问题之一,也被喻为AI皇冠上的明珠。

由于AI包括感知智能(比如图像识别、语言识别和手势识别等)和认知智能(主要是语言理解知识和推理),而语言在认知智能起到最核心的作用。如果能把语言问题解决了,AI最难的部分也就基本解决了。美国微软公司创始人比尔·盖茨先生曾经表示,”语言理解是人工智能领域皇冠上的明珠“。前微软公司全球执行副总裁沈向洋先生也在公开演讲时说:“懂语言者得天下……下一个十年,人工智能的突破在自然语言的理解……人工智能对人类影响最为深刻的就是自然语言方面”。由于理解自然语言需要关于外在世界的广泛知识以及运用操作这些知识的能力,所以NLP也被视为解决AI完备(AI-complete)的核心问题之一。可以说,NLP目前是AI领域的关键核心技术,对它的研究也是充满魅力和挑战的。

NLP涉及的领域较多,主要包括机器翻译、语义理解和对话系统等。它目前面临四大挑战:一是在词法、句法、语义、语用和语音等不同层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可预测性;三是数据资源的不充分使其难以覆盖复杂的语言现象;四是语义知识的模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大的非线性计算。例如在对话系统中,深度学习目前已成为对话系统的一项基本技术;神经网络被应用于传统任务导向型对话系统的不同组成部分。近年来,端到端的框架不仅在非面向任务的聊天对话系统中流行,在面向任务的对话系统中也逐步流行起来,但是仍远非完美。又如在语义识别方面,需要对句法进行剖析,因此剖析在对话系统、信息抽取、语法检查中都起着非常重要的作用。

最早的NLP研究工作是机器翻译。1949年,美国知名科学家沃伦·韦弗先生首先提出了机器翻译设计方案。1954年,基于韦弗“翻译即解码”的机译思想,乔治敦大学进行了著名的“乔治敦实验”——利用IBM-701型计算机首次完成了英俄文本的自动翻译;这一实验的成功标志着机器翻译正式登上历史舞台。20世纪60年代,许多科学家对机器翻译曾有大规模的研究工作,耗费了巨额费用;但他们显然是低估了自然语言的复杂性,语言处理的理论和技术均不成熟,所以进展不大。当时的主要做法是存储两种语言的单词、短语对应译法的大辞典,翻译时一一对应,技术上只是调整语言的同条顺序。但日常生活中语言的翻译远不是如此简单,很多时候还要参考某句话前后的意思,需要上下文联系起来才能正确翻译——这就是机译技术难度高之所在。

大约20世纪90年代开始,NLP领域发生了巨大的变化。这种变化有两个明显的特征:(1)对系统的输入,要求研制的NLP系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。只有这样,研制的系统才有真正的实用价值。(2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。同时,由于强调了“大规模”和“真实文本”,所以下面两方面的基础性工作也得到了重视和加强:(1)大规模真实语料库的研制。大规模的经过不同深度加工的真实文本的语料库,是研究自然语言统计性质的基础;如果没有这样的语料库,统计方法只能是无源之水。(2)大规模、信息丰富的词典的编制工作。因此规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对NLP的重要性是很明显的。

系统的输入与输出这两个特征在NLP的诸多领域都有所体现,其发展直接促进了计算机自动检索技术的出现和兴起。实际上,随着计算机技术的不断发展,以海量计算为基础的机器学习、数据挖掘、数据建模等技术的表现也愈发优异。NLP之所以能够度过“寒冬”,再次发展,也是因为计算机科学与统计科学的不断结合,才让人类甚至机器能够不断从大量数据中发现“特征”并加以学习。不过要实现对自然语言真正意义上的理解,仅仅从原始文本中进行学习是不够的,我们还需要新的方法和模型。

目前存在的问题主要有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分析歧义、词语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有的不同含义等问题,尚无明确规律可循,需要加强语义学和语用学的研究才能逐步解决。另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。因此一个书面理解系统只能建立在有限的词汇、句型和特定的主题范围内;计算机的贮存量和运转速度大大提高之后,才有可能适当扩大范围。

由于语言工程、认知科学等主要局限于实验室,目前来看数据处理可能是NLP应用场景最多的一个发展方向。实际上,自从进入大数据时代,各大平台就没有停止过对用户数据的深度挖掘。要想提取出有用的信息,仅提取关键词、统计词频等是远远不够的,必须对用户数据(尤其是发言、评论等)进行语义上的理解。另外,利用离线大数据统计分析的方法进行NLP任务的研究是目前非常有潜力的一种研究范式,尤其是谷歌、推特、百度等大公司在这类应用上的成功经验,引领了目前大数据研究的浪潮。

NLP是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,已经广泛应用在电商、金融、物流、医疗、文化娱乐等行业客户的多项业务中。它可帮助用户搭建内容搜索、内容推荐、舆情识别及分析、文本结构化、对话机器人等智能产品,也能够通过合作,定制个性化的解决方案。由于理解自然语言,需要关于外在世界的广泛知识以及运用操作这些知识的能力,所以NLP也被视为解决强AI的核心问题之一,其未来一般也因此密切结合AI发展,尤其是设计一个模仿人脑的神经网络。

训练NLP文本解析AI系统需要采集大量多源头数据集,对科学家来说是一项持续的挑战:需要使用最新的深度学习模型,模仿人类大脑中神经元的行为,在数百万甚至数十亿的注释示例中进行训练来持续改进。当下一种流行的NLP解决方案是预训练,它改进了对未标记文本进行训练的通用语言模型,以执行特定任务;它的思想就是,该模型的参数不再是随机初始化,而是先有一个任务进行训练得到一套模型参数,然后用这套参数对模型进行初始化,再进行训练,以获得更好的预测性见解。

我们目前已进入一个以互联网为主要标志的海量信息时代,而这些海量信息大部分是以自然语言表示的。一方面,有关的海量信息可为计算机学习自然语言提供更多的“素材”;另一方面,这也为NLP提供更加宽广的应用舞台。例如,作为NLP的重要应用,搜索引擎逐渐成为人们获取信息的重要工具,出现了以谷歌、百度等为代表的搜索引擎巨头;机器翻译也从实验室走入寻常百姓家;基于自然语言处理的中文输入法(如搜狗、微软、谷歌等输入法)成为计算机用户的必备工具;带有语音识别的计算机和手机也正大行其道,协助用户更有效地生活、工作和学习。

现在,NLP领域已经有了大量的人工标注知识,而深度学习可以通过有监督学习得到相关的语义知识,这种知识和人类总结的知识应该存在某种对应关系,尤其是在一些浅层语义方面。因为人工标注,本质上已经给深度学习提供了学习的目标;只是深度学习可以不眠不休地学习,这种逐步靠拢学习目标的过程,可能远比人类总结过程来得更快、更好。这一点,从谷歌公司旗下DeepMind研究团队开发的围棋软件AlphaGo短时间内连胜两位人类围棋高手的事实,似乎能够得到验证。

深度学习在NLP中的应用非常广泛,可以说横扫NLP的各个应用,从底层的分词、语言模型、句法分析、词性标注、语音识别等到高层的语义理解、语用阐释、对话管理、知识问答等方面都几乎都有深度学习的模型,并且取得了不错的效果。有关研究已从传统的机器学习算法转变成更有表现力的深度学习模型,如卷积神经网络和回归神经网络。不过,目前的深度学习技术还不具备理解和使用自然语言所必需的概念抽象和逻辑推理能力,这方面还有待今后进一步的研究。

互联网搜索引擎已经有一段时间让人们使用会话语言和术语来在线搜索事物。现在,谷歌公司的云端硬盘用户已经可以使用这一功能。用户可以搜索存储在谷歌云端硬盘中的文件和内容,就像使用谷歌搜索提供的对云端硬盘内置NLP的新支持一样。该功能使用户可以使用通常用词组表达的查询以及在实际对话中将要使用的查询来更轻松地找到所需的内容。谷歌公司在在线和移动搜索、移动应用程序以及GoogleTranslate等服务中广泛使用NLP;该公司在这一领域的研究是为提高机器阅读和理解人类语言能力所做的更广泛努力的一部分。随着谷歌调整其算法,NLP应该会随着时间的推移变得更好。

英国剑桥量子计算公司(CQC)最近宣布,他们利用自然语言的“固有量子”结构,开辟了一个全新的可能应用领域。其通过将语法句子翻译成量子线路,然后在量子计算机上实现生成的程序,并实际执行问答。这是第一次在量子计算机上执行NLP。通过使用CQC的一流的、平台无关的可重定目标编译器t|ket??,这些程序在IBM量子计算机上成功执行并得到结果,整个突破朝着实现“意义感知”和“语法知悉”的NLP方向迈出了有意义的一大步--这是计算机时代早期以来计算机科学家及计算语言学家追寻的梦想。

美国哈佛大学医学院的研究人员借助NLP技术日前开发出一种工具,可以评估新冠肺炎(COVID-19)患者的病例、社交媒体和健康卫生数据。他们率先努力通过使用机器学习技术查看来自各种来源的数据和信息(包括患者记录、社交媒体和公共卫生数据)来寻找新冠肺炎病毒的解决方案。借助NLP工具,他们还可以搜索有关新冠肺炎病毒的在线信息,并了解爆发的当前位置。另外,研究人员还利用NLP技术对新冠肺炎、药物和疫苗等密集展开研究,同时包括临床诊断与治疗以及流行病学研究等。

中国阿里达摩院的NLP研究团队最近提出优化模型StructBERT,能让机器更好地掌握人类语法,加深对自然语言的理解。使用该模型好比给机器内置一个“语法识别器”,使机器在面对语序错乱或不符合语法习惯的词句时,仍能准确理解并给出正确的表达和回应,大大提高机器对词语、句子以及语言整体的理解力。这一技术已广泛使用于阿里旗下阿里小蜜、蚂蚁金服、优酷等业务。阿里达摩院的语言模型和阅读理解技术也被用于行业赋能,推进AI技术在医疗、电力、金融等行业的落地。据悉,StructBERT模型最近被评为全球性能最强的NLP系统。

根据市场分析机构MordorIntelligence的一份报告,2019年全球NLP市场价值为109亿美元,预计到2025年将达到348亿美元,复合年增长率为21.5%。该报告指出,在过去的几年中,深度学习架构和算法在市场格局中取得了令人瞩目的进步,而语音分析解决方案正在主导着这一市场,因为传统的基于文本的分析已不足以处理复杂的业务问题。

总之,随着互联网的普及和海量信息的涌现,作为AI领域的研究热点和关键核心技术,NLP正在人们的生活、工作、学习中扮演着越来越重要的角色,并将在科技进步与社会发展的过程中发挥越来越重要的作用。

文/林峰、于利(作者单位分别为美国波士顿大学工学院、日本名古屋大学理学部)

人工智能

博主github:https://github.com/MichaelBeechan博主CSDN:https://blog.csdn.net/u011344545

============================================概念篇:https://blog.csdn.net/u011344545/article/details/89525801技术篇:https://blog.csdn.net/u011344545/article/details/89526149人才篇:https://blog.csdn.net/u011344545/article/details/89556941应用篇:https://blog.csdn.net/u011344545/article/details/89574915下载链接:https://download.csdn.net/download/u011344545/11147085

============================================清华AMiner团队AMiner.org

从知识产业角度来看,自然语言处理软件占有重要的地位,专家系统、数据库、知识库,计算机辅助设计系统(CAD)、计算机辅助教学系统(Cal)、计算机辅助决策系统、办公室自动化管理系统、智能机器人等,全都需要自然语言做人机界面。长远看来,具有篇章理解能力的自然语言理解系统可用于机器自动翻译、情报检索、自动标引及自动文摘等领域,有着广阔的应用前景。随着自然语言处理研究的不断深入和发展,应用领域越来越广。文本方面的应用主要有:基于自然语言理解的智能搜索引擎和智能检索、智能机器翻译、自动摘要与文本综合、文本分类与文件整理、智能自动作文系统、自动判卷系统、信息过滤与垃圾邮件处理、文学研究与古文研究、语法校对、文本数据挖掘与智能决策以及基于自然语言的计算机程序设计等。语音方面的应用主要有:机器同声传译、智能远程教学与答疑、语音控制、智能客户服务、机器聊天与智能参谋、智能交通信息服务(ATIS)、智能解说与体育新闻实时解说、语音挖掘与多媒体挖掘、多媒体信息提取与文本转化以及对残疾人智能帮助系统等。此外,建立在自然语言处理技术基础之上的心理学、认知学、哲学、混沌学说的共同发展,将使人们对智能的起源问题有新的认识。如果把计算机网络和未来的网格看作是由机器组成的机器社会,那么一种属于机器的智能可能会因为人类的参与以及机器社会中各元素的相互作用而自然诞生。这样,机器必将能够通过“图灵测试”,达到“会思考”的层次。而有关智能机器的研究也会诞生一系列新的领域,比如,机器心理学和机器认知学等。其中,机器心理学主要研究机器的心理反应和意图。美国圣迭戈神经科学研究所研制的机器人DarwinVII,能够根据其感知对外部事物进行分类,并根据经验和知识采取相应的对策。然而,机器心理学的研究不能局限于此,人们还需要对机器的意识、知觉、思想、情感、情绪、创造力、机器社会、机器交流等方面进行研究,而这一切还需要计算机科学、心理学、神经科学的同步发展。我们选取一些自然语言处理应用较为频繁的场景进行介绍。

1、知识图谱

知识图谱能够描述复杂的关联关系,它的应用极为广泛,最为人所知的就是被用在搜索引擎中丰富搜索结果,并为搜索结果提供结构化结果体现关联,这也是google提出知识图谱的初衷。同时微软小冰、苹果siri等聊天机器人中也加入了知识图谱的应用,IBMWatson是问答系统中应用知识图谱较为典型的例子。按照应用方式,可以将知识图谱的应用分为语义搜索、知识问答、以及基于知识的大数据分析和决策等。语义搜索利用建立大队莫知识库对搜索关键词和文档内容进行语义标注,改善搜索结果,如谷歌、百度等在搜索结果中嵌入知识图谱。知识问答是基于知识库的问答,通过对提问句子的语义分析,再将其解析为结构化的询问,在已有的知识库中获取答案。在大数据的分析和决策方面,知识图谱起到了辅助作用,典型应用是美国Netflix公司利用其订阅用户的注册信息以及观看行为构建的知识图谱反映出英剧版《纸牌屋》很受欢迎,于是拍摄了美剧《纸牌屋》,大受追捧。

2、机器翻译

机器翻译是自然语言处理最为人知的应用场景,一般是将机器翻译作为某个应用的组成部分,例如跨语言的搜索引流等。目前以IBM、谷歌、微软为代表的国外科研机构和企业均相继成立机器翻译团队,专门从事智能翻译研究。如IBM于2009年9月推出ViaVoiceTranslator机器翻译软件,为自动化翻译奠定了基础;2011年开始,伴随着语音识别、机器翻译技术、DNN(深度神经网络)技术的快速发展和经济全球化的需求,口语自动翻译研究成为当今信息处理领域新的研究热点;Google于2011年1月正式在其Android系统上推出了升级版的机器翻译服务;微软的Skype于2014年12月宣布推出实时机器翻译的预览版、支持英语和西班牙语的实时翻译,并宣布支持40多种语言的文本实时翻译功能。尤其值得之注意的是,在“一带一路”这一发展背景下,合作沟通会涉及60多个国家、53种语言,此时机器翻译的技术应用显得尤为重要,语言的畅通是“一带一路”战略得以实施的重要基础。而机器翻译涉及到语义分析、上下文环境等诸多挑战,其发展道路还有很长一段路要走。

3、聊天机器人

聊天机器人是指能通过聊天app、聊天窗口或语音唤醒app进行交流的计算机程序,是被用来解决客户问题的智能数字化助手,其特点是成本低、高效且持续工作。例如siri,小娜等对话机器人是一个应用场景。除此之外,聊天机器人在一些电商网站有着很实用的价值,可以充当客服角色,例如京东客服jimi,有很多基本的问题,其实并不需要真的联系人工客服来解决。通过应用智能问答系统,可以排除掉大量的用户问题,比如商品的质量投诉、商品的基本信息查询等程式化问题,在这些特定的场景中,特别是会被问到高度可预测的问题中,利用聊天机器人可以节省大量的人工成本。

4、文本分类

文本分类是指根据文档的内容或者属性,将大量的文档归到一个或多个类别的过程。这一技术的关键问题是如何构建一个分类函数或分类模型,并利用这一分类模型将未知文档映射到给定的类别空间。按照其领域分类不同的期刊、新闻报道,甚至多文档分类也是可能的。文本分类的一个重要应用之处是垃圾电子邮件检测,除此之外,腾讯、新浪、搜狐之类的门户网站每天产生的信息分繁杂多,依靠人工整理分类是一项耗时巨大的工作且很不现实,此时文本分类技术的应用就显得极为重要。

5、搜索引擎

自然语言处理技术例如词义消歧、句法分析、指代消解等技术在搜索引擎中常常被使用。搜索引擎的职责不单单是帮助用户找到答案,还能帮助用户找到所求,连接人与实体世界的服务。搜索引擎最基本的模式是自动化地聚合足够多的内容,对之进行解析、处理和组织,响应用户的搜索请求找到对应结果返回。每一个环节,都需要用到自然语言处理。用百度举例,比如用户可以搜“天气”、“日历”、“机票”及“汇率”这样的模糊需求,会直接在搜索结果呈现结果。用户还可以搜索“范冰冰演过的电视剧”这样的复杂问题,百度都可以准确地回答。一方面,有了自然语言处理技术才使得搜索引擎能够快速精准的返回用户的搜索结果,几乎所有的自然语言处理技术都在搜索引擎中有应用的影子;另一方面,搜索引擎(例如谷歌商业帝国和百度巨头)在商业上的成功,也促进了自然语言处理技术的进步。

6、推荐系统

第一个推荐系统是1992年Goldberg提出的Tapestry,这是一个个性化邮件推荐系统,第一次提出了协同过滤的思想,利用用户的标注和行为信息对邮件进行重排序。推荐系统依赖数据、算法、人机交互等环节的相互配合,应用了数据挖掘技术、信息检索技术以及计算统计学等技术使用推荐系统的目的是联系用户和信息,帮助用户发现对自己有价值的信息,同时让信息能够展示在对它感兴趣的用户面前,精准推荐,用来解决信息过载和用户无明确需求的问题。推荐系统在音乐电影的推荐、电子商务产品推荐、个性化阅读、社交网络好友推荐等场景发挥着重要的作用,美国Netflix2/3的电影是因为被推荐而观看,Googlenews利用推荐系统提升了38%的点击率,Amazon的销售中推荐占比高达35%。

7、发展趋势

随着深度学习时代的来临,神经网络成为一种强大的机器学习工具,自然语言处理取得了许多突破性发展,情绪分析、自动问答、机器翻译等领域都飞速发展。下图分别是AMiner计算出的自然语言处理近期热点和全球热点。通过对1994-2017年间自然语言处理领域有关论文的挖掘,总结出二十多年来,自然语言处理的领域关键词主要集中在计算机语言、神经网络、情感分析、机器翻译、词义消歧、信息提取、知识库和文本分析等领域。旨在基于历史的科研成果数据的基础上,对自然语言处理热度甚至发展趋势进行研究。图中,每个彩色分支表示一个关键词领域,其宽度表示该关键词的研究热度,各关键词在每一年份(纵轴)的位置是按照这一时间点上所有关键词的热度高低进行排序。图14显示,情绪分析、词义消歧、知识库和计算机语言学将是最近的热点发展趋势。图15显示词义消歧、词义理解、计算机语言学、信息检索和信息提取将是自然语言处理全球热点。

参考文献[1]中文信息处理发展报告2016[2]李涓子,侯磊知识图谱研究综述.[J]山西大学学报2017[3]冯志伟.机器翻译研究.[M].北京:中国对外翻译出版社.2004[4]冯志伟.自然语言处理的形式模型[M].北京:中国科学技术大学出版社2010[5]吴军,数学之美[M].北京:人民邮电出版社2012[6]2006-2020年国家信息化发展战略[Z]中共中央办公厅、国务院办公厅2006[7]刘奕群,马少平,洪涛等搜索引擎技术基础[M]北京:清华大学出版社2010[8]韩家炜等,数据挖掘:概念与技术[M]北京:机械工业出版社2012

自然语言处理技术的作用和意义

原标题:自然语言处理技术的作用和意义

自然语言处理(NaturalLanguageProcessing,NLP)技术是人工智能领域中的一项重要技术,旨在使计算机能够理解、处理和生成人类自然语言。它的作用和意义在各个领域中日益凸显,具有以下重要作用:

文本理解与信息提取:NLP技术能够分析和理解文本内容,提取其中的关键信息。它可以帮助处理大量的文本数据,从中提取有用的信息,进行文本分类、关键词提取、命名实体识别等任务。这对于信息检索、数据挖掘和智能推荐系统等领域具有重要意义。语音识别与语音合成:NLP技术在语音识别方面具有重要应用。它可以将人类语音转换为文本,使计算机能够理解和处理语音输入。同时,NLP技术也可以将文本转换为自然流畅的语音,实现语音合成,为语音交互提供基础支持。机器翻译与跨语言交流:NLP技术在机器翻译领域具有重要作用。它可以将一种语言的文本转换为另一种语言,促进跨语言交流和跨文化交流。机器翻译技术的发展不仅对于个人使用具有意义,还在跨国企业、国际组织和学术界等领域发挥着重要作用。信息检索与问答系统:NLP技术可以帮助构建智能的信息检索和问答系统。通过对用户问题的理解和分析,NLP技术能够快速检索相关信息,并给出准确的答案或建议。这在互联网搜索引擎、智能助手和在线客服等方面具有广泛应用。情感分析与舆情监测:NLP技术能够分析文本中的情感和情绪信息,对人们的情感倾向进行评估和判断。这对于企业舆情监测、社交媒体分析和情感智能服务等领域具有重要意义。通过NLP技术,可以快速了解用户情感和舆论动向,做出相应的决策和调整。自然语言生成与智能对话:NLP技术不仅能够理解自然语言,还能够生成自然流畅的文本。它可以用于智能对话系统的开发,使计算机能够与用户进行自然的对话交流。这在虚拟助手、智能客服和语音助手等领域具有广泛应用。

综上所述,自然语言处理技术在文本理解、语音识别、机器翻译、信息检索、情感分析和智能对话等方面具有重要作用。它能够使计算机能够理解和处理人类自然语言,为人们提供更智能、便捷和个性化的服务,推动人机交互的发展和智能化应用的推广。返回搜狐,查看更多

责任编辑:

了解人工智能在语音方面、图像处理方面及自然语言方面的突破

有人说现在是人工智能的春天,有人说是夏天,还有人悲观一点,说是秋天,秋天的意思就是冬天马上就来了。

作为人工智能的学者,我们该怎么看待这件事情,我们能做些什么?不管大家怎么预测,至少今天还是一个人工智能的黄金时代。

为什么这么讲呢?接下来先给大家展示一些最近人工智能取得的成果,确实是之前十几年我们完全想不到的。

1、人工智能在语音方面的突破

小米电视日前推出主打”高性价比”的全球首款人工智能语音电视小米电视4A,只需一个语音按键,便可实现关键词搜索、热度排行、开启应用游戏等10类语音交互功能。无独有偶,长虹近期推出CHiQ人工智能电视新品Q5N和OLED电视新品Q5A系列,主打的功能还是语音控制。

实际上,在市面上海尔、TCL等已经推出了所谓的可进行语音搜索的人工智能电视。小米电视最重磅的功能是支持人工智能语音控制,号称老人孩子都能使用,可以用很自然的语言对电视进行声控。

智能语音正在向着私人助理机器人方向快速发展,在大数据、人工智能、机器学习等技术的支撑下,可为每个人量身定制自己的个性化私人助理。

私人助理会根据用户的行为和使用习惯,帮助用户网上购物、安排出行、调整设备、智能提醒、聊天解闷。

私人助理可以提供越来越多的线下生活服务,如订餐厅、订外卖、购买电影票、医院预约等操作。

2、人工智能在图像处理方面的突破

过不了多久,所有人都可以通过人工智能对一张图片或是对视频进行复杂的处理。举个栗子,SmileVector是一个推特机器人,

可以生成任何明星照片微笑的动图,如果输入一张人脸图片,它可以通过深度学习神经网络生成它们微笑的表情。

虽然这些图片也许并不完美,但它们完全是自动生成的,这是人工智能在图像处理领域的又一进步。

也许不久之后,图片、声音和视频造假都将变得容易。想象一下,假如新版本的Photoshop可以像用Word编辑文字一样轻松编辑图片,

你还会相信自己的眼睛吗?

SmileVector只是新技术的冰山一角,我们很难对现代人工智能多媒体处理技术做出全面的概述,但我们能够找出其中一些有意思的应用。

例如:从一张2D图片中创建3D面部模型;使用人类“模型”实时改变视频中人物的面部表情;改变图片中的光源和阴影;

为无声视频自动生成声音;在总统选举直播中让特朗普变成秃头;用视频剪辑“复活”朋友等等。这些事例只是其中的一小部分。

3、人工智能在自然语言方面的突破

通过互联网搜索引擎,发掘、建立语音信息数据库,利用云计算、大数据、自然语义分析、机器学习和深度神经网络技术进行语音信息聚类处理,

力求得到更准确的答案。在实际生活场景下,用户口语化表述更加多样,容易产生歧义,人机交互难度非常大。

微软在构建Bing和Azure过程中成熟应用了NLP,计算语义学,情感分析,逻辑或者统计机器学习,信号处理,大规模计算,云端存储和响应,

本地硬件加速等技术,所以Cortana实现了更加贴近生活的自然人机交互。Siri基于WolframAlpha,WolframAlpha是一个计算知识引擎,

而不是搜索引擎,用户在搜索框键入需要查询的问题后,该知识引擎将直接向用户返回答案,而不是返回一大堆网页链接。

前面说的这些语音、图像、语言,听起来还都是一些感知方面的东西。大家也知道,最近这段时间,

人工智能在一些传统我们认为可能很难由机器来取得成功的领域也获得了突破。比如腾讯已经在对战中加入人工智能,利用人工智能技术来打游戏。

碰到过的人都知道,这种游戏机器人虽然只能按既定的设置去完成游戏,但是能跟玩家完成简单的配合辅助等基本细节。

也许在我们眼里它只是达到了所谓“菜鸟”玩家的水准,一旦成熟,我相信它会发现一些平时我们自己都玩不出来的窍门。

大家都知道AlphaGo非常火,使用了深度增强学习的技术,经过了非常长的训练时间,引用了大量数据做self-play,

最终是以压倒性的优势,4:1战胜了当时的世界冠军李世石。在去年的IJCAI上面,AlphaGo主要的开发人员做了一个keynote,

说自战胜了李世石之后,AlphaGo并没有停下脚步,因为它是一个self-play的process,可以继续训练,只要给他足够的运算时间和样例,

它就可以不断地去训练。所以也能理解为什么今年年初Master重新回到大家视野里,可以对围棋高手60连胜,因为这个差距太大了。

这些事情都是以前人们觉得人工智能不可以去企及的领域。但正是因为这些计算机科学家、人工智能科学家不断地去模仿人的决策过程,

比如他们训练了valuenetwork,训练了policynetwork,就是怎么样根据现在的棋局去评估胜率,去决定下一步该走什么子,

而不是走简单的穷举,用这些valuenetwork来对搜索树进行有效的剪枝,从而在有限的时间内完成一个非常有意义的探索,

所有这些都是人工智能技术取得的本质的进展,让我们看到了一些不一样的结果。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇