AI赋能传统聊天机器人:对话式人工智能简史
一、简介“对话式人工智能”一词,启发了人们利用人工智能技术,使计算机解决方案能够以自然、互动的方式与人类沟通。它可以应用于多种不同场景,如客服聊天机器人、虚拟助手和通信系统等。它理解和回应人类语言的能力,彻底改变我们与机器、软件和应用程序的互动方式。
不论是通过文字、语音或其他形式的沟通,甚至包括视频或图像,对话式人工智能正在改变我们与数字世界或现实世界进行交流的方式。
对话式人工智能在我们的日常生活中变得越来越普遍。不论是在个人层面还是在职业层面,从电子商务网站上的客服聊天机器人,到我们手机上的虚拟助手或连接车辆中的智能语音系统。其潜在应用非常广泛,包括自动化例行任务、提高客户服务效率等等。一个意想不到但非常相关的对话式人工智能用例是在医疗保健领域的应用。一些健康中心正在使用聊天机器人对患者进行分类和提供个性化的健康建议,从而使医生能够专注于更复杂的病例。
随着技术的不断进步,我们在各行各业和不同的场景中看到更广泛的对话式人工智能应用。
二、对话式人工智能简史早期发展和里程碑聊天机器人或旨在模拟与人类用户对话的计算机程序的开发可以追溯到1960年代。事实上,技术史上第一个被引用的聊天机器人是ELIZA,它于1966年由麻省理工学院(MIT)的JosephWeizenbaum开发。ELIZA旨在模仿心理治疗师的语言模式,可以与人类用户进行简单的对话。它是聊天机器人的首批示例之一,为开发更高级的对话式AI系统奠定了基础。
这些早期的聊天机器人相对简单,只能处理有限数量的预编程响应。随着时间的推移,聊天机器人变得更加先进,现在能够响应更广泛的输入。
随着机器学习(ML)、自然语言处理(NLP)和自然语言理解(NLU)技术的出现,聊天机器人已经发展成为更高级的对话式AI系统。这些系统能够以更自然、更直观的方式理解和回应人类的语言,甚至可以进行更具互动性的对话。最重要的是,他们现在能够随着时间的推移学习和适应。因此,他们变得越来越有效率。他们往往越来越被接受,并且从那里开始,越来越多的人要求他们。
为了说明这一点,OpenAI(现在非常著名的ChatGPT3)于2022年11月推出的Chatbot在短短五天内就突破了100万用户。Netflix用了41个月,Facebook用了10个月,Instagram用了2.5个月……
今天,对话式人工智能系统被用于大量不同的环境中,远非它们在早期仅限于增强的常见问题解答功能。他们正在为彻底改变我们与数字世界交互和交换信息以及执行增值操作的方式做出贡献。这些系统使人们更容易、更方便地访问信息和完成工作。
创新的目的是改进现有的产品、流程或服务,或者创造新的产品、流程或服务,以更好的方式满足客户或社会的需求。它包括提高效率、降低成本、提高质量或开发新功能。对话式人工智能也不例外。
为了追溯这项技术所走的道路,以下是对话式AI发展史上的一些重要里程碑。它们展示了这些系统及其不断增强的能力所取得的令人瞩目的进步:
1960年:ELIZA是第一个被引用的聊天机器人,由麻省理工学院的JosephWeizenbaum开发。1972年:PARRY,一种模拟偏执狂个体思维的自然语言程序。因此,它总是误解他人的动机。帕里是第一个通过图灵测试的人。1997年:爱丽丝。(人工语言互联网计算机实体)是一种自然语言处理聊天机器人,由RichardS.Wallace开发。它在2000年的年度图灵测试竞赛中以“最人性化的计算机”获得了勒布纳奖。2005年:Apple的虚拟助手Siri发布,由法国科学家LucJulia博士共同创立。2010年:IBM的Watson(由90台服务器和21.6TB数据提供支持)参加了游戏节目Jeopardy!并击败人类冠军。2014年:Cortana在微软的Build开发者大会上首次亮相。直接集成到WindowsPhone设备和Windows10PC中。2014年:Facebook推出M以面对Siri和Cortana。M是一个虚拟助手,它使用机器学习来协助完成任务。2016年:Google发布了GoogleAssistant,“HeyGoogle”!,一款适用于Android设备的虚拟助手。2017年:带有Alexa虚拟助手的亚马逊Echo设备广受欢迎。2018年:OpenAI发布了GPT-2,这是一种具有生成类人文本能力的大规模语言模型。2022年:OpenAI发布GPT-3。它可用于语言任务,例如翻译、摘要、问答和文本生成。它甚至可以执行编码和翻译等任务,而无需对这些任务进行明确的培训。“很久以前,在一个很远很远的星系……”:C-3PO,一个主要为礼仪和礼仪而编程的人形机器人,旨在通过“六百万种交流方式”与有机体互动。在已探索的宇宙中也广为人知,他帮助卢克·天行者和他们的反抗军击败了帝国并恢复了银河系的自由。但那是一个完全不同的故事。各行业的使用现状谷歌的BERT、OpenAI的GPT-3和微软的Transformer等大规模语言模型的改进能力有能力从根本上改变会话人工智能领域,并使更高级的虚拟助手、聊天机器人和其他通信设备的开发成为可能系统。
许多不同领域都存在非常有趣的用例。其中,让我们注意,例如:
虚拟助手:例如Apple的Siri、GoogleAssistant和Amazon的Alexa,正变得越来越普遍,并且能够通过语音或基于文本的交互执行各种任务。这些系统使用NLP、NLU和机器学习技术来理解和响应用户请求。他们开始学习和改变,提高他们的沟通能力。客户服务聊天机器人:聊天机器人被广泛用于客户服务行业,以处理日常查询并向客户提供信息。这些系统能够全天候24/7处理大量交互,并且通常可以比基于规则的决策过程的人类客户服务代表更快地解决简单问题。语言翻译:有许多语言翻译系统(GoogleTranslate或DeepL,仅举几例)使用对话式AI来实现口头或书面交流的实时翻译。这些系统可用于各种环境,例如国际商务会议或日常生活,促进使用不同语言的人之间的交流。教育:也有许多教育平台使用对话式人工智能为学生提供个性化的学习体验。这些系统能够适应个别学生的需求和能力,并提供量身定制的指导和反馈。例如,CarnegieLearning使用AI和机器学习来帮助学生对数学和世界语言形成更深入的概念性理解。算法研究学生的习惯以个性化他们的学习体验。医疗保健:在医疗保健行业,对话式AI被用于对患者进行分类并建立初步诊断。聊天机器人可以提供症状检查并推荐行动方案,例如寻求进一步的医疗护理或在家自我护理。这些系统还可用于安排约会和补充处方。在英格兰,国家卫生服务局于2017年宣布与BabylonHealth(一家健康应用程序公司)达成协议,使用基于临床数据的算法驱动的聊天机器人,根据报告的症状在两分钟内对患者进行分类,无需人工干预。银行业:在银行业,聊天机器人被用来处理日常查询并协助完成账户管理和账单支付等任务。一些银行还使用对话式人工智能为客户提供个性化的财务建议和建议。保险:在保险行业,对话式人工智能被用来协助处理简单的任务,包括理赔处理和保单管理。正如银行所做的那样,保险公司也在使用聊天机器人为客户提供个性化的推荐和建议。零售:在零售行业,聊天机器人在向客户提供产品推荐、订单跟踪和许多简单的客户服务请求方面非常有用。它们还有助于提供个性化的购物体验,并为个别客户量身定制营销活动。人力资源:AI驱动的Chabot在执行招聘任务时非常有帮助,例如回答常见问题解答、根据报价和简历筛选候选人、安排面试、提供更新以及收集和整理简历。这减少了招聘人员的工作量,并使他们能够将更多时间花在需要同理心等人际交往能力的任务上。前10,000次对话的结果表明,Mya与92%的候选人有效互动。三、对话式人工智能的类型对话式AI领域由不同的主要组件组成,这些组件以特定特征区分。
聊天机器人是简单的计算机程序,旨在模拟与人类用户的对话,更可能以问答模式进行。在某些方面,它们可以比作稍微复杂的FAQ系统。它们可以集成到消息传递平台、移动应用程序和网站门户中,为客户提供基本服务或信息。例如,零售网站上的聊天机器人可以帮助客户浏览网站、推荐产品以及回答有关运输和退货的问题。
虚拟助手是会话式人工智能系统,旨在协助完成范围更广、更精细的任务,例如检查余额信息、确定商品是否有库存、评估订单状态、跟踪发货、安排约会、设置提醒、处理计算、与应用程序交互或提供各种信息。
可以通过各种设备访问它们,包括智能手机、智能扬声器和个人计算机。例如,苹果的Siri和亚马逊的Alexa都是虚拟助手的例子。他们的通信能力与自动化功能相结合。
语音助手是由语音命令激活的对话式人工智能系统。它们可用于控制其他设备、播放音乐和提供信息。它们也可以称为“声控助手”、“语音助手”、“口语界面”、“语音识别软件”或简称为“智能音箱”。随着智能音箱设备的出现,它们越来越受欢迎例如AmazonEcho、GoogleHome、AppleHomePod,语音控制的AI助手技术可以与其他智能设备集成,如家电、汽车等,实现对这些设备的语音控制。
语言生成AI系统范围内还包括其他形式的对话式AI。它们能够产生类似人类的文本或语音,可用于广泛的应用,例如语言翻译、自动写作和文本摘要。该列表在不断增长。
四、对话式人工智能的好处2016年,Gartner预测:“到2020年,普通人与机器人的对话将超过与配偶的对话”。知道这个悲惨的预测至少在2023年没有实现,让我们现在看看对话式AI如何改善客户服务、提高效率和生产力,增强企业的用户体验并节省成本。
对话式人工智能以多种方式为聊天机器人提供优质服务虚拟助手等解决方案具有知识库,而聊天机器人通常依赖常见问题解答文件。因此,聊天机器人从有限的脚本库和问答组合中提取信息。因此,这种方法仅限于产生预定的答案。
另一方面,所谓的“智能”或“智能”虚拟助手经过预先训练,知识面广,可以提供更丰富的对话基础。
他们倾向于解决问题,而不仅仅是回答简单的问题。例如,保险领域的智能数字助理正在成为数字顾问,陪伴客户并在他们提出索赔或跟进事件的过程中推荐下一个最相关的步骤。
最后,通过机器学习算法使用对话技巧、数据和模式分析,智能数字助理能够确定客户需求,并可以无缝地将他们引导到适合他们的服务。
对话式人工智能的主要好处之一是改善客户服务聊天机器人、虚拟助手和语音助手可用于回答客户问题、提供信息并帮助进行24/7故障排除。它还可以限定请求并在必要时将其重定向到人工操作员。
这提高了整体客户满意度,在某些情况下甚至可能提高忠诚度,因为客户能够快速有效地获得所需的帮助。例如,据JuniperResearch称,到2022年,零售、电子商务、银行和医疗保健领域的聊天机器人预计每年可节省超过80亿美元的成本。
对话式人工智能还可以提高工作场所的效率和生产力。例如,虚拟助手可以帮助安排会议、设置提醒以及执行其他会占用宝贵时间和精力的任务。这可以提高生产力并减少员工的工作量。
对话式AI也是一种产生更加个性化和引人入胜的用户体验的方法。例如,可以训练聊天机器人和虚拟助手了解用户的上下文和偏好,并提出个性化建议或提供定制信息。这可以提高用户参与度和满意度。顺便说一句,员工满意度作为客户满意度的对应物,也是可以通过对话式人工智能和相关智能自动化流程实现的目标。
了解全球公司每年在客户服务电话上花费超过1万亿美元的事实;很容易理解,对话式AI确实代表了降低成本的真正机会。例如,聊天机器人和虚拟助手可用于自动执行重复且耗时的任务,从而减少对人工的需求。这可以降低成本并提高客户服务效率。此外,对话式人工智能可以帮助企业识别和瞄准高价值客户,从而增加收入。
五、对话式人工智能的挑战与局限NLP和NLU限制自然语言处理和理解是人工智能的子领域,处理计算机和人类之间的自然语言交互。这些用于分析和理解人类生成的文本和语音数据的系统可能会受到人类语言的复杂性和可变性的挑战。这无疑使得在许多情况下难以理解语言数据的含义和意图。
例如,您是否知道当今世界上有超过7,000种语言在使用?就说话者的数量而言,汉语是最重要的,它本身就有13个变体。阿拉伯语有20个。换句话说,估计80%的在线内容仅以以下10种语言中的一种提供:英语、中文、西班牙语、日语、阿拉伯语、葡萄牙语、德语、法语、俄语和韩语。
这清楚地解释了一个事实,即自然语言系统的一个重要限制是处理惯用语表达,因为自然语言充满了习语、俚语和其他非文字表达形式。这些成语和俗语往往有多重含义,要根据上下文来理解。更不用说语言的技巧也取决于说话者的语调和意图,甚至是他们的手势或面部表情。从技术上讲,所有这些都可以通过视频获取并通过适当的AI算法进行分析。
除了口头语言的差异之外,NLP的主要限制之一是处理歧义。事实上,自然语言通常包含多种可能的解释,人工智能系统很难确定正确的解释。例如,如果客户写道:“我的订单需要帮助”,聊天机器人可能会问:“您的订单有什么问题?”但它可能无法理解客户是在寻求帮助来跟踪他们的订单,还是他们对收到的产品有疑问,或者他们是否想取消订单。
当然,NLP系统很难处理讽刺、讽刺和否定形式的使用。这些形式的比喻语言通常用于间接传达意义,从所使用的词语中并不能立即看出这一点。
一致的研究发现,即使是最先进的NLP系统仍然难以理解习语和比喻语言或用相同的词暗示的不同感受。计算机要真正像人类一样流畅地理解和解释人类语言,可能还有很长的路要走。
个性化和定制困难个性化和定制是对话式AI的关键方面,因为它们允许聊天机器人、虚拟助手和其他对话式AI系统理解和响应个人用户的独特需求和偏好。然而,实现真正的个性化和定制可能很困难,因为它需要人工智能系统对用户有深刻的理解,更不用说“深刻的感受”,并能够相应地调整其行为和反应。
处理大量数据以进行个性化和改编是一项重大挑战。事实上,有必要通过培训和完善人工智能系统来了解用户的需求和期望。
开发更强大的NLP的另一个主要障碍是数据可访问性。在处理共享包含个人信息的文档的限制时,情况变成了道德雷区。以临床领域的电子健康记录(EHR)来说明敏感主题的想法。必须谨慎处理数据,包括用户偏好、交互历史、人口统计、银行、行政或健康信息。
无论如何,提供真正个性化的体验需要谨慎处理用户的数据和隐私。事实上,用户可能不愿意向AI系统提供个人信息,并且可能不愿意与似乎对他们了解太多的AI系统进行交互。例如,看看我们有多不情愿,即使只是提供我们的电子邮件地址或电话号码,或者在打开相机时也是如此。
另一个挑战是处理人类行为的内在复杂性。随着时间的推移,个人可以改变他们的行为、偏好,甚至他们的个性;这使得人工智能系统很难跟上用户的步伐并提供真正个性化的体验。但说实话,人类代理面临着同样的困难。
在这方面,情绪分析可以提供很大的帮助。情感分析是自然语言处理(NLP)的一个子领域,涉及使用AI算法和方法从口头文本、书面文本或身体动作或面部表情中识别和提取主观信息。
此信息可以包括文档或演讲的整体情绪,以及该人表达的更具体的情绪和观点。情感分析中使用的技术主要基于词法分析、句法分析和ML算法(例如支持向量机和神经网络)。
情感分析可用于增强对话系统的功能,方法是让对话系统检测并响应用户在输入中表达的情感。例如,如果机器人能够检测到用户正在表达沮丧、不耐烦或不满,它可以以解决用户情绪的方式做出响应并尝试解决问题。
情感分析可能有助于监控用户反馈并了解用户的整体体验,这可用于进一步改进对话系统。
最近的研究表明,对于拥有庞大客户群的行业,客户关怀以及产品和服务的个性化是最重要的人工智能用例。您知道呼叫中心最常见的做法是在20秒内接听80%的电话吗?这使团队承受着维持良好客户满意度的压力。这个压力问题可以通过机器人释放等待队列端压力的简单请求来解决。这些行业包括旅游、酒店、消费品、零售和电信。
虽然基于人工智能的个性化背后的技术正在改进,但仍然很难以最佳方式设计它,而且大多数公司仍远未提供真正的个性化体验。
潜在的偏见偏差是当算法由于机器学习过程的错误假设而产生系统性偏差结果时出现的现象。不幸的是,人工智能具有人类偏见的倾向,无论它们是有意识的还是无意识的。这会导致种族主义、恐同、厌恶女性或任何其他类型的歧视行为。
这就是人工智能系统中的偏见如何做出对某些人群具有歧视性或不公平的预测或决定。这在对话式AI的背景下可能尤其成问题,因为这些系统通常用于做出决策或提供可能对人们的实时决策产生直接影响的信息。
数据和算法:偏差的两个主要来源数据也许对话式AI中最重要的偏见来源是用于训练系统的数据。当数据不能代表系统将要服务的人群时,可能会导致系统做出对某些人群不公平或歧视的预测或决定。此外,根据历史数据训练的对话式人工智能系统可能会延续过去存在的偏见,但应该予以纠正。
这是一个众所周知的例子。不幸的是,2018年,亚马逊为分析求职者简历而创建的招聘引擎被发现在招聘过程中对女性存在偏见。发生这种情况是因为招聘算法是根据过去十年提交的简历进行训练的,其中大部分属于男性。当审查该算法时,发现它会自动歧视女性。
算法对话式人工智能的第二个偏见来源是系统的设计和实施方式。例如,如果聊天机器人旨在提供客户服务,那么它应该能够理解并响应所有客户的需求,无论他们的背景或特征如何。但是,如果Chatbot不是为处理不同的语言、口音或方言而设计的,则可能会使某些人群难以与Chatbot进行交流,并降低其效率。
算法本身的设计可以重现人类行为的偏见。加州大学伯克利分校2019年的一项研究发现,“金融科技贷方”拒绝拉丁美洲人和非裔美国人面对面申请的频率比他们在相同条件下拒绝非少数族裔申请的频率高出约6%。一项研究表明,在2009年至2015年期间,贷方拒绝了大约100万份在没有歧视的情况下本应被接受的申请。
不幸的是,这些算法的设计似乎复制了这种歧视。
研究发现,语言模型容易出现相同形式的偏见,包括性别、种族和年龄偏见,这些偏见会影响这些系统的性能及其产生的结果。这些偏见应该用简单的方法来解决,包括更好的数据管理、算法透明度和更严格的监管。
如果有必要提醒它,算法是缺乏人性的,比如常识,尤其是同理心。
道德考量与偏见问题直接相关的是,在处理对话式AI时,道德考量至关重要。这些系统正在成为客户与品牌或公司之间的新用户界面,就像员工一样。因此,他们应该以有尊严和适当的方式行事。
随着对话式人工智能系统变得更加复杂并融入社会,确保以公平、透明和负责的方式开发和使用它们非常重要。事实上,2021年在华盛顿特区,国会议员要求企业评估用于医疗保健、住房、就业或教育等领域的自动化决策系统。法律要求雇主使用外部顾问进行独立评估。该法律确保他们的算法不会面临基于性别、种族或种族的偏见行为的风险。
系统不应根据种族、性别、年龄或其他特征歧视某些人群。本着同样的精神,确保它们是透明的至关重要,这样人们才能了解系统如何做出决策并可以提供反馈或提出疑虑。
使AI尽可能透明需要能够解释如何以及为何做出基于AI的决策。基于人工智能的决策过程必须符合并代表公司的价值观和道德规范。
另一个同样重要的考虑因素是数据隐私和安全。对话式人工智能系统依赖于大量个人数据的收集和分析。以保护个人隐私和安全的方式处理和存储数据至关重要。
多年来,所有利益相关者就道德原则达成了普遍共识。对话式AI必须安全、公平且对所有人都有益。它必须透明和负责,必须尊重个人的隐私和安全。必须将道德考虑纳入人工智能(包括数字助理)的整个开发和部署过程。
六、对话式人工智能的未来预测的进步和发展近年来,对话式AI取得了许多进展,许多专家认为,这项技术将继续发展,并在未来变得更加复杂。事实上,根据IDC研究总监DavidSchubmehl的说法,“对话式AI工具和技术市场在2020年显着增长……/……IDC预测到2025年整个市场的收入将接近79亿美元”。
最重要的进步之一是自然语言处理(NLP)和理解(NLU)能力的提高。最近的进步导致系统更加准确并且可以理解更广泛的语言。
另一个重要的进步是深度学习技术的发展,例如神经网络。这些技术使得在大量数据上训练AI系统并随着时间的推移提高它们的性能成为可能。该领域的最后一大步是由OpenAI使用ChatGPT执行的,ChatGPT是一种大型语言模型(LLM),经过大量数据训练,可以最准确地预测句子中接下来出现的单词。根据斯坦福大学的说法,“GPT-3有1750亿个参数,并且在570GB的文本上进行了训练[makingit]能够执行它没有明确训练的任务,比如将句子从英语翻译成法语,几乎没有训练示例”.
对话式人工智能领域的其他大公司包括谷歌、亚马逊、Facebook、微软和苹果等公司。他们都在大力投资对话式人工智能,并正在开发范围广泛的产品和服务,包括虚拟助手、聊天机器人和智能扬声器。另一方面,也有一些小众玩家,例如OpenAI,专注于开发更安全、对人类有益的AI。这些参与者正致力于开发尖端的对话式AI技术。
微软完全理解OpenAI的价值及其解决方案的潜力。据报道,2023年1月10日,他们计划在一轮融资中向OpenAI投资100亿美元。这将使OpenAI的价值达到290亿美元。
对话式AI的未来发展包括更多地使用AI支持的个性化和定制,以获得更量身定制的用户体验。另一方面,解决方案需要提高生成自然语言的能力,以实现更像人类的交互。这将导致更有效和准确的响应。第三,使用人工智能支持的情绪分析有望提高系统理解情绪并做出相应反应的能力。最后,还预计对话式人工智能系统将更多地集成到物联网(IoT)中。他们很快就能控制和管理家庭和其他环境(包括商业和工业生态系统)中的各种设备。
对行业和社会的潜在影响对话式人工智能的出现和智能通信系统的普及预计将在未来几年对社会产生重大影响。以下是一些潜在影响的示例:
随着对话式AI系统变得越来越复杂,它们有望通过24/7全天候对客户查询提供更快、更准确的响应来改善客户服务。对话式人工智能系统有望变得更加个性化和引人入胜,为用户提供量身定制的体验。
对话式人工智能系统将通过自动化重复性任务和减少人力需求来提高生产力和效率。理想的目标是让员工专注于需要人类技能的更复杂的任务,例如创造力、同理心、批判性思维或道德意识。他们还被期望为简单的查询提供更有效和准确的响应。这些改进将减少查找和访问信息所需的时间和精力。
如果你关注悲观的科幻小说般的预测,你会担心人工智能将开始接管许多曾经由人类完成的工作。其中一些预测认为人工智能技术的发展将导致广泛的失业和社会动荡。更不用说机器人接管世界了。
仔细观察对进步的恐惧和对变革的焦虑,就会发现每一项创新都会产生恐惧。第二次工业革命引入了电力等新能源形式,也带来了后来证明是毫无根据的恐惧。机器使用的增加将导致熟练工匠和工匠的工作机会减少。现实情况是,虽然一些工作确实由于机器使用的增加而变得过时,但也创造了许多其他工作,例如运输和制造等工厂工作。这同样适用于所有颠覆性的技术飞跃。
我们可以预见,人工智能技术系统将变得越来越复杂,甚至越来越像人类。这将使企业能够为用户提供更加个性化和引人入胜的体验。最后,它将有助于自动化更复杂的任务并为人类工作者节省时间。
七、结论随着自然语言处理和机器学习的进步,机器越来越有可能以一种感觉自然的方式回应人类语言。这导致了广泛的新应用和更高级的人机交互形式。
然而,尽管有这些潜在的好处,但要充分发挥对话式AI的潜力,还必须克服许多挑战。最大的挑战之一是开发能够以始终符合上下文的方式理解和响应人类语言的系统。这不仅需要对单词的含义有深刻的理解,还需要能够以更微妙的方式解释使用这些单词的上下文、意图和情感。
对话式AI的另一个限制是理解和响应开放式问题或模棱两可的查询的能力。有时人类使用的语言和词汇很难被系统理解并导致错误的答案。
更复杂的是,对话式人工智能系统还需要能够根据不完整的信息做出决策。这需要能够以适合特定环境的方式处理不确定性,这似乎更像是一种人类技能,而不是机械技能。至少到目前为止。
聊天机器人ChatGPT为何“出圈” 我们让它写了篇新闻稿
0分享至12月初,人工智能实验室OpenAI发布了一款名为ChatGPT的自然语言生成式模型,由于它能接住并解答网友的许多刁钻问题,一经问世就迅速引发关注,上线5天后,其体验用户已经突破100万。12月4日,马斯克在咨询该聊天机器人关于推特经营的建议并收到精准回复后直言其“好得吓人,我们距离强大到危险的人工智能更近了”。12月8日,新京报记者体验了ChatGPT。记者发现,相比市面上其他聊天机器人,ChatGPT的功能更加多样,例如它可以按照要求写诗、写讲话稿、新闻稿甚至写代码。此外,该聊天机器人的回答更为严谨,面对许多高难度问题,ChatGPT会老老实实回答“缺乏资料”或者“我只是一个语言模型”。东吴证券发布研报称,从受众和技术上看,ChatGPT在AI文字交互模型领域十分突出。与此前的模型相比,ChatGPT亮点主要包括:全面免费开发,用户只需输入文字,就可免费调用完成各种事情(如数学计算、debug、写信、生活问题解答等),实感体验为广泛讨论创造土壤;新增代码理解和生成能力,彰显技术实力的同时也拓宽了应用场景;加入道德原则。RLHF(一种通过人类反馈来强化学习的新技术)训练方式使ChatGPT能够识别恶意信息,识别后拒绝给出有效回答;支持连续对话等,“总体上,ChatGPT对话效果令人满意,新鲜感与实用价值使其快速走红。”ChatGPT:让你的聊天更有智慧(该标题为聊天机器人自己所起)“我想写一篇关于ChatGPT的文章,我给这篇文章起什么标题合适?”这是12月8日,新京报记者咨询ChatGPT的第一个问题。而该聊天机器人的回复也非常详细:它给记者写出了足足6个标题,并且表示“当然,这些标题都只是建议,最终还是要根据自己的文章内容和表达目的来决定”。回答显得非常人性化。△贝壳财经记者与ChatGPT对话而当记者继续咨询它能否以“ChatGPT:让你的聊天更有智慧”为标题写一篇新闻时,它也给出了肯定的答复,甚至在不到10秒钟的时间里就写出了作者为新京报社的一篇12月8日的新闻报道。不过记者发现,该聊天机器人在回答问题时有时并不会回答完整,但此时当提问者继续要求其完整回答时,它也完全可以“跟上”此前的聊天进度,这说明ChatGPT具备一定程度的记忆功能。△贝壳财经记者与ChatGPT对话记者了解到,目前市面上的人工智能语言模型并不少见,如谷歌BERT模型、阿里巴巴的PLUG模型、清华大学计算机系自然语言处理与社会人文计算实验室的中文诗歌生成系统“九歌”等,能够采用拟人化方式和用户自由对话的也有Character.AI(角色AI)等。但相比上述能够生成语言的模型,ChatGPT具有了更为强大的功能,其中就包括直接在回答中写代码。如当记者要求ChatGPT编写一段代码时,其很快生成了一段可以复制的代码文件。△贝壳财经记者与ChatGPT对话对于ChatGPT的回答,有互联网从业者对记者表示:“这段代码的基本结构是对的。”值得注意的是,对于ChatGPT和其他语言模型有何差别这一问题,该聊天机器人在接受记者提问时表示“主要区别在于它采用了更先进的自然语言处理技术,并在训练过程中使用了大量高质量的自然语言文本数据。这些都使得ChatGPT在处理文本信息方面更加精确,并能够取得更好的表现。此外,ChatGPT模型还采用了双向自注意力(bi-directionalself-attention)技术,这使得它能够更好地利用语料库中的信息,提高处理文本信息的效率。总之,ChatGPT模型与其他语言模型相比,具有更先进的技术,更好的处理文本信息的能力,以及更高的处理效率”。不过,记者通过测试发现,ChatGPT在一些地方也有不尽如人意之处。首先就是在具体问题的回答上,该聊天机器人仍然和具有专业经验的人士有明显差距。如当记者咨询一个北京旅游计划设计问题时,虽然ChatGPT很快列出了一个看似格式很工整的旅游计划,但可行性并不大:其给记者制定的旅游计划中,第一天下午从天安门乘坐地铁前往长城,第二天一早再乘地铁前往故宫,这在实际旅游中显然时间过于紧张。△贝壳财经记者与ChatGPT对话此外,当回答一些带有拟人化的问题时,ChatGPT会反复强调:“对不起,我是一个人工智能助手,没有意识和感知”。显然,在今年6月谷歌工程师布莱克·莱莫因在与谷歌智能聊天机器人LaMDA进行深聊后声称人工智能拥有感情,最终遭到谷歌辞退后,包括OpenAI在内的许多人工智能公司都采取了尽量避免其他人对聊天机器人产生误会的可能。OpenAI在官网表示,由于ChatGPT没有连接到互联网,它偶尔会产生不正确的答案,“它对2021年之后的世界和事件的了解有限,偶尔也可能产生有害指令或有偏见的内容。”此外,由于需要通过用户的反馈改进对话技术,该公司会记录用户在ChatGPT上的聊天数据,不过用户也可以对自己的对话内容进行删除。熟悉AI发展的互联网从业者李鸿儒对贝壳财经记者表示,随着技术的发展,目前最先进的语言模型几乎可以完美通过初步的图灵测试,“图灵测试是一种衡量人工智能与人类智能水平相似程度的方法,它要求人工智能必须能够以人类相似的方式与人类交流,且不能被人类轻易地区分出来。而当前人工智能语言模型的训练方式就是收集人类回答者在网上的公开数据,因此许多回答完全可以‘以假乱真’,毕竟它就是从真实的人类回答里衍生的。”值得注意的是,当记者咨询ChatGPT“是否存在可以通过图灵测试的AI”时,它的回答非常“谦虚”:“目前,虽然已经有一些人工智能系统能够在一定程度上与人类进行交流,但它们并不能完全模仿人类的智能。因此,目前还没有人工智能能够通过图灵测试。如果将来有一个人工智能能够通过图灵测试,那么它很可能会是一个由当前领先的人工智能研究机构,如OpenAI,DeepMind等所开发的系统。这样的人工智能将具有与人类智能相似的能力,能够以人类相似的方式与人类交流。但目前这样的人工智能还不存在,我们只能期待未来的发展。”技术进步怎样发生?OpenAI:使用人类反馈强化学习据了解,ChatGPT的前身为OpenAI此前的语言模型GPT-3,而GPT-3也经历了从1代到3代的演化。东吴证券认为,通过梳理前几代模型,ChatGPT之所以能实现如此革命性的变化,新技术RLHF训练方式的引用或是关键:从GPT到GPT-3:优化主要来自算力增加(烧钱)。GPT、GPT-2和GPT-3的算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。OpenAI在官网表示,ChatGPT是从GPT-3.5微调而来的,GPT-3.5是一种经过训练以生成文本的语言模型。ChatGPT通过使用人类反馈强化学习(RLHF)针对对话进行了优化,这是一种使用人类演示来指导模型实现所需行为的方法。在东吴证券看来,2022年OpenAI增加了人类对模型输出结果的演示,并在对结果进行排序的基础上训练,加上指令调整的帮助,虽然其只有13亿个参数,但回答准确率、道德表现却好于GPT-3。ChatGPT则加入了RLHF训练方式(相关论文2022年3月发表),根据ChatGPT,其每次对话平均费用在0.01-0.2美元,模型效果比InstructGPT又提升一个台阶,“我们认为新技术发展和应用将是AIGC工具出现革命性迭代更为重要的驱动。”李鸿儒告诉记者,GPT-3的部分训练是基于从互联网上搜集的数据,因此它的输出结果在与人类回答者极其近似之外,也经常受到偏见和不准确信息的影响。而在ChatGPT的训练上,训练师还会对机器人的回复选项打分排名,将更好的结果输回到模型中,通过以上奖励策略对模型进行微调并持续迭代,这样既可以避免受到不准确信息的影响,还能提供更连贯和更符合逻辑的对话能力。浙商证券则认为,ChatGPT模型的出现对于文字模态的AIGC(利用AI技术自动生成内容)应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、数据标注、自然语言处理(NLP)等。最后,当记者咨询ChatGPT“你能为人类的发展做出什么改变?请举例说明”这一问题时,该聊天机器人回答道:“ChatGPT能够提高人类的工作效率和生活质量。例如,ChatGPT可以帮助人们快速查找信息,可以帮助聊天机器人更好地与人交流,并且可以让人们在与人工智能交流时,感觉像是在与真正的人交流。此外,ChatGPT还可以应用于医疗、教育、法律、金融等领域,为人类的发展做出重大贡献。例如,在医疗领域,ChatGPT可以帮助医生快速查阅医学资料,为患者提供更好的诊疗建议。在教育领域,ChatGPT可以帮助教师快速查找教学资料,为学生提供更好的学习指导。在法律领域,ChatGPT可以帮助律师快速查找法律资料,为客户提供更好的法律建议。在金融领域,ChatGPT可以帮助投资人快速查找金融资料,为投资人提供更好的投资建议。总而言之,ChatGPT的应用可以使人类的工作效率得到极大提高,并为人类的发展做出重大贡献。”本文转自新京报贝壳财经作者:罗亦丹本文编辑:徐彦琳投稿、合作邮箱:xjbcmyj@bjnews.com.cn这些报道,向世界传播了12·13历史真相!“CPU大冤种栓Q”:2022年“十大网络流行语”“十大网络热议语”发布特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.
/阅读下一篇/返回网易首页下载网易新闻客户端ChatGPT 聊天机器人 人工智能革命从实验室走入公众生活
11月底,人工智能研究实验室OpenAI发布了ChatGPT聊天机器人首个测试版本,这是一款基于人工智能的新型聊天机器人,可以与人类进行对话,经过测试后,新款机器人便踏上了社交网站之旅,尤其是在推特平台上,OpenAI首席执行官SamAltman表示,聊天机器人推出一周内,试用客户已突破100万人。
OpenAI早些时候推出了Dall-E人工智能程序,这款程序使用人工智能将用户的文字转化为图像和创意艺术品,于2015年出现,得到了硅谷一些最著名的亿万富翁的资助,其中最著名的是埃隆·马斯克,他在三年后辞去了公司管理层的职务,旨在创建一个专注于人工智能发展的非营利组织。
在过去的几天里,推特平台上转载了数百张与“GBTChat”聊天机器人讨论的图片,几乎涵盖了所有话题,许多第一批用户都对这款聊天机器人的讨论、回答问题和写作的能力感到惊讶,机器人甚至还写过诗句、研究过文章,还写过一些笑话,甚至有人认为,这款机器人是软件和魔术的混合体!
与机器人聊天!(Shutterstock)在过去十年中,大多数聊天机器人实验都以失败告终,除非你为机器人选择最佳响应并消除其余响应,否则,它不会给人留下深刻印象,最近几年,已经有一些人工智能程序在特定任务上取得了成功,例如编写营销内容,但大多仅限于此任务,不能在为其指定的范围之外添加任何新内容,但ChatGPT看起来有所不同,而且可能比以前的机器人更聪明、更古怪、更敏捷。
ChatGPT机器人项目的目标是尝试使用人工智能使语音听起来更流畅和自然,就像人类对话一样,用户可以向机器人提问,它会用完整的句子进行回答,试图模仿与真人自然对话的节奏,但OpenAI公司不断警告说,答案并不总是正确或适当的。
OpenAI公司的理念是在所有防火墙到位之前,向公众发布这些原型,希望用户评论、反馈和评分将有助于根据机器人在现实世界中的互动来发现和解决问题,这似乎正在发生,虽然在推特上转载的与机器人对话的许多截图都是奇怪而令人兴奋的对话,但用户也发现了对这些对话有用的应用程序,有人说,这是第一款聊天机器人,它足够有趣,可以与之交谈,也足够有用,可以询问信息,还可以参与哲学讨论并在实际事务中提供帮助,例如,机器人似乎可以帮助程序员发现并修复代码中的错误,许多人还要求这款机器人用Python等语言编写代码。
这款机器人还可以用简单的方式向幼儿解释复杂的科学术语或概念,它似乎也擅长回答课堂作业中经常出现的开放式分析性问题,为此,用户要求这款机器人针对特定主题撰写适合研究的文章,结果令人印象深刻,由于人工智能技术,一些作家甚至期望学术文章以目前的形式结束。
向人类学习!支持聊天机器人的技术并不是全新的,基于“GPT-3.5”文本生成器,这是“GPT-3”版本的现代版本,在2020年由OpenAI推出时也引起了人们的关注,OpenAI是众多公司、学术实验室和独立研究人员之一,多年来,一直致力于创建更先进的聊天机器人,当然,这些系统不能完全像人类一样说话,但它们通常看起来是,或者这可能是它们未来的目标,有些人甚至期望它将取代我们所知道的传统搜索引擎,例如谷歌和其他搜索引擎。
谷歌本身最近也在开发自己的对话系统,称为LaMDA,这个系统在6月引发了巨大争议,因为该公司的一位工程师声称,与他交谈的人工智能具有人类意识,事情当然不是这样的,此外,但它抓住了公众的想象力,尽管谷歌并没有发布这个系统以供公众体验。
2018年,谷歌和OpenAI等实验室的研究人员开始设计神经网络,以所谓的“大型语言模型”分析大量数字文本,其中包括书籍、维基百科文章、新闻和在线聊天记录,通过识别人们关联单词、数字和符号的方式中的数十亿种不同模式,这些系统学会自己编写文本并生成响应。
有关于此,聊天机器人本质上是“大型语言模型”,它们使用算法来分析从这些在线资源中收集的大量文本,以听起来像人类的语言回答用户的请求,然而,大多数聊天机器人没有记忆,也没有被编程为记住或从以前的对话中学习,从某种意义上说,它将每个新请求都视为一个全新的页面,而这正是“ChatGPT聊天”机器人与其他机器人的区别所在。
(Shutterstock)新机器人会记住用户之前说过的话,因为它依赖于一种称为“从人类反馈中强化学习”的机器学习技术,这是一种允许软件从人类反馈和评估中学习的技术,在测试完机器人后,用户被要求对机器人的反应进行评分:它们是否令人信服、有用或正确?然后,使用强化学习技术,机器人利用这些评估来微调其系统,并更仔细地决定它会做什么和不会做什么。
简单来说,我们可以将“ChatGPT”机器人描述为一个人工智能系统,经过训练可以从从互联网上提取的大量文本中识别模式,然后,在人类的帮助下进行了更多的训练,以提供更好的对话和与人类更有用的对话。你得到的答案可能看起来很有说服力,甚至是可靠的,但它们可能是完全错误的答案,这正是OpenAI真正警告的事情。
ChatGPT聊天机器人盲点!这提醒我们,新的聊天机器人绝不像乍看起来那样完美,因为它的工作方式和生成答案的方式往往使其容易提供错误答案,即使在对人类来说似乎很简单的数学问题中。12月5日,世界上最著名的程序员云集网站之一StackOverflow的管理员,阻止用户分享ChatGPT聊天机器人生成的回复,他们解释说,机器人使用户可以很容易地提供现成的快速答案,并在网站上充斥着这些答案,乍一看似乎是正确的,但仔细检查后发现,这往往是错误的答案。
与谷歌有所不同,“ChatGPT”聊天机器人不具备爬取各种网站以获取当前事件信息的能力,而且它的知识仅限于它以前(2021年之前)学到的东西,这使得它的一些答案显得过时了,甚至OpenAI首席执行官SamAltman在他的推特帐户上的一条推文中发出警告说,机器人的能力非常有限,目前依靠它来做任何重要的事情都是错误的举动。
为了增加其使用的安全性,这款机器人被编程为默认拒绝“不适当的请求”,例如对非法活动给出答案,但是用户已经找到了绕过其中许多障碍的方法,包括将对非法活动的回答请求改写为理论思维实验,要求它写出涉及该活动的戏剧场景,甚至指示机器人禁用其安全功能。
据推测,评估这些机器人编程盲点以及它们如何被滥用于非法或恶意目的,应该是OpenAI向公众发布机器人版本进行测试目标的关键部分,未来的版本通常会关闭此类漏洞,以及你尚未发现的其他漏洞。
人工智能为大众服务!虽然人工智能研究人员可能熟悉高效的语言机器人,但通过免费、易于使用的界面向公众提供如此强大的工具,这几乎是第一次,因为你只需要在网站上创建一个帐户,并开始使用和试验新机器人,但要注意,“OpenAI”的服务尚未覆盖所有阿拉伯国家。
在人工智能图像生成器的激增中,同样的动态也很明显。同样,这些系统已经开发多年,但一直无法访问,但今年,像Midjourney和StableDiffusion这样的系统,让任何人都可以免费、轻松地使用这项技术,突然之间,人工智能艺术和绘画在互联网上无处不在。
几乎同时,出现了应用程序“LensaAI”,这是一款在iPhone和安卓设备上使用人工智能编辑照片的应用程序,这成为了最近这段时间大家最喜欢的新艺人,因此,你会发现,很多人的社交媒体头像突然看起来像动漫人物或油画,这款应用程序还使用了图像生成初创公司StabilityAI的一项称为“稳定扩散”的技术,并将你提供的照片变成艺术品。
这些产品不仅告诉我们人工智能技术的发展程度,也证明了这些技术的使用已经为普通大众和非专业人士所用,不再局限于实验室和大型公司,这能够以一种几年前无人可以想象的方式,改变我们未来的生活。