博舍

什么是人工智能 (AI) 怎么测试人工智能

什么是人工智能 (AI)

虽然在过去数十年中,人工智能(AI)的一些定义不断出现,但JohnMcCarthy在2004年的文章 (PDF,127KB)(链接位于IBM外部)中给出了以下定义:"它是制造智能机器,特别是智能计算机程序的科学和工程。AI与使用计算机了解人类智能的类似任务有关,但不必局限于生物可观察的方法"。

然而,在这个定义出现之前数十年,人工智能对话的诞生要追溯到艾伦·图灵(AlanTuring)于1950年出版的开创性作品"计算机器与智能"(PDF,89.8KB)(链接位于IBM外部)。在这篇论文中,通常被称为“计算机科学之父”的图灵提出了以下问题:“机器能思考吗?” 他在这篇文章中提供了一个测试,即著名的“图灵测试”,在这个测试中,人类询问者试图区哪些文本响应是计算机做出的、哪些是人类做出的。虽然该测试自发表之后经过了大量的审查,但它仍然是AI历史的重要组成部分,也是一种在哲学中不断发展的概念,因为它利用了有关语言学的想法。

StuartRussell和PeterNorvig随后继续发表了“人工智能:一种现代方法 ”(链接位于IBM外部),成为AI研究方面的重要教材之一。在这本书中,他们深入探讨了AI的四个潜在目标或定义,基于理性、思考和行动来区分计算机系统:

人类方法:

像人类一样思考的系统像人类一样行动的系统

理想方法:

理性思考的系统理性行动的系统

艾伦·图灵的定义可归入"像人类一样行动的系统"类别。

以最简单的形式而言,人工智能是结合了计算机科学和强大数据集的领域,能够实现问题解决。它还包括机器学习和深度学习等子领域,这些子领域经常与人工智能一起提及。这些学科由AI算法组成,这些算法旨在创建基于输入数据进行预测或分类的专家系统。

目前,仍有许多围绕AI发展的炒作,市场上任何新技术的出现都会引发热议。正如Gartner在其hypecycle技术成熟度曲线(链接位于IBM外部)中指出的那样,自动驾驶汽车和个人助理等产品创新遵循“一个典型的创新周期,从欲望膨胀到期望幻灭、到最终了解创新在市场或领域中的相关性和作用。”正如LexFridman在2019年麻省理工学院演讲中指出的那样(01:08:15)(链接位于IBM外部),我们正处于欲望膨胀高峰期,接近幻灭的谷底期。 

随着对话围绕AI的伦理道德展开,我们可以开始看到幻灭谷底初见端倪。如想了解更多关于IBM在AI伦理对话中的立场,请阅读这里了解更多信息。

【软件测试】如何测试人工智能软件?

人工智能(AI)经常成为头条新闻,它提供各种各样的可能性,使我们的生活更容易,并且它也能推动我们生活中各个领域的创新。在几乎所有领域都有人工智能应用的机会,包括家庭自动化、个人虚拟助理、自动化服务代理、欺诈检测、预防性维护、个性化体验、财务咨询、医疗保健建议等等。许多研究报告都预测人工智能和相关技术具有巨大的市场潜力。

但就像大多数新兴领域一样,人工智能的发展也并非一帆风顺——比如说无人驾驶汽车的致命交通事故、人工智能系统的种族主义反应、图像标签软件不恰当的标签等。这就提出了一个至关重要的问题——这些系统是如何进行测试的?更重要的是,我们是否已经准备好测试这些软件,并且让大家对使用人工智能进行一些重大决定时保持信心?

那么为什么我们需要担心测试策略呢?软件测试是一个先进并且是在不断进步的领域,已经存在了几十年。测试人工智能应用程序与其他传统应用程序有何不同?

答案是:基本的区别是很少的。

人工智能应用程序的特点是是不确定性和概率性、对大数据具有依赖性、随机性的输入/输出、难以预测所有应用场景、需要从过去的行为中不断自我学习。传统的方法和测试工具将不能满足测试这些系统的需要。

在了解需要测试的内容之前,让我们先了解基于AI的应用程序的基础组件。

所有人工智能系统都是由巨大而多样的数据驱动的,在做出任何决定之前都需要进行处理。这些数据可以是任何格式——文本、语音、图像、视频……来源也各不相同。这些数据可能是一次性摄入的,也可能是一个连续的过程。数据极其重要,是人工智能系统所采取的任何预测、决定或行动的基础。

接下来是机器学习系统或核心算法——这构成了人工智能系统的核心,因为系统是在这里训练来执行某些动作的。根据需要和上下文,这些算法可能在种类和复杂性上有所不同,可以组合多个算法来给出特定的期望输出。

最后,还有与第三方系统的接口。人工智能系统将被应用于其他更大的应用程序以满足最终的业务目标。

举一个例子:某个推荐系统可能无法实时地独立地工作,它将集成到一个互联网应用程序之中,为用户提供实时产品推荐。

现在,让我们看看在各个层级我们将如何进行测试。

1、在数据摄取层,验证系统能够接受来自各种来源和各种格式的数据是很重要的。其次,需要验证所摄入的数据是否按照目标系统所期望的格式转换。很少有查询来验证正确的数据和数据类型的摄入,但这将是有很用的,并且可以防止由于数据而出现的异常。

2、在选择算法时验证系统的准确性(在这里,对选择使用哪种算法不做讨论)。作为至关重要的一步,将基础数据七三开,用于培训和测试。它使用训练数据集来理解和建模系统行为,并使用测试数据来验证系统的准确性或响应。对于分类算法,可以通过计算分类精度或混淆指标来获得模型的准确性。像平均平方误差(MSE)、均方根误差(或RMSE)或R方可以用来评估回归算法的预测。

3、需要测试第三方接口。测试人工智能系统如何满足总体业务目标是很重要的。为了验证这一点,需要结束业务驱动的测试。

这些指导原则将帮助测试人员从这个方向开始。需要大量的努力来生成正确的测试数据,构建适当的测试模型,并确定正确的度量标准集,以将其与正在测试的系统相关联。机会是巨大的,我们准备得多么好,这一切都是不同的!

end

推荐阅读:

【软件测试】测试工程师应该如何设计一个完整的测试用例呢?

【软件测试】八年测试经验测试总监浅谈bug的那点事~

简体中文 人工智能内容检测器

免费的AI内容检测器BETA高精度多语言人工智能内容检测

0/5000

达到最大限制(5/星期)Smodin的AI内容检测准确度如何?Lenient:85%的AI文档被认为是AI内容,99%的人类文档被认为是人类。严格:95%的AI文档被认为是AI内容,95%的Human文档被认为是Human。免责声明:结果因语言而略有不同,来自我们自己的测试结果,实际结果可能会有所不同。Smodin的AI内容检测

Smodin的AI内容检测器是一种高级工具,可以区分人工编写的内容和ChatGPT、Bard或其他AI工具生成的文本。即使是专业作家、学生和教育工作者也依赖Smodin来筛选他们的作品以进行数字处理并确保其真实性。

任何人都可以通过上传他们的文本轻松地开始使用我们的服务。经过简单的分析后,我们的AI将确定文本的唯一性。我们的算法将快速生成一份报告,解决任何问题并提供改进文本的建议。

当您需要确保作品的原创性和真实性时,请考虑使用我们的AI文本检测器。使用此服务将帮助您避免剽窃或缺乏原创性的负面后果,例如失去声誉。这非常适合企业、教育工作者和学生使用。有效使用AI检测工具的推荐用法和技巧

将其用作预防措施:最好使用AI检测工具作为预防措施,以避免潜在的剽窃或内容操纵问题。确保在发布或提交之前检查文本,而不是事后依赖该工具作为补救措施。

将其用作补充:AI检测工具并不完美,可能无法捕捉到AI生成的文本的每个实例。因此,最好将它们作为您个人分析的补充,而不是完全依赖它们。

检查语气和风格的一致性:人工智能检测工具还可以帮助识别文本中语气或风格的变化。这对于希望确保其写作一致且流畅的内容创建者很有帮助。

了解局限性:虽然AI检测工具越来越好,但它们仍然存在局限性。他们可能无法区分高度复杂的人工智能生成的文本和具有相似风格的人类编写的文本。

为什么要使用AI内容检测工具?

AI内容检测工具确保文字作品的真实性和原创性。使用机器学习和算法可以很容易地伪造文本;这可能会导致剽窃并损害教育和职业生活中的声誉。像Smodin这样的人工智能内容检测软件可以通过分析文本并确定它是人工智能还是人类创造的来检测原创性。该软件通过建议如何改进他们的文本来帮助作者和其他内容创建者。

Smodin的Ai内容检测器有什么作用?确定文本是否部分或全部由AI模型(例如ChatGPT或其他机器学习模型)创建。确定人类参与文本创作的程度检测文本在语气或风格上是否存在不一致,这可能表明由AI模型生成的部分。将文本分类为完全由人类编写或包含由AI或GPT生成的部分。分析文本的情感并检测它是否由机器生成。确定文本的复杂程度并检测它是由AI语言模型还是人类创建的。检测文本是否包含AI生成文本中常见的事实错误。检测内容是由人编​​写的还是由计算机程序生成的。LikelyHuman编写的文本包含由AI或GPT生成的部分。它可能是人工编写的作品,其中包含由AI或GPT创建的部分。检查可能指示机器生成文本的拼写和语法错误其他支持的语言English(English)Arabic(عربى)Bengali(বাঙালি)Bulgarian(български)Catalan(Català)ChineseSimplified(简体中文)Croatian(Hrvatski)Czech(čeština)Danish(dansk)Dutch(Nederlands)Esperanto(Esperanto)Estonian(Eestikeel)Filipino(Filipino)Finnish(suomi)French(français)German(Deutsche)Greek(Ελληνικά)Hebrew(עברית)Hindi(हिंदी)Hungarian(Magyar)Indonesian(bahasaIndonesia)Italian(italiano)Japanese(日本語)Korean(한국어)Latvian(Latviešuvaloda)Lithuanian(Lietuvių)Malay(Melayu)Malayalam(മലയാളം)Marathi(मराठी)Norwegian(norsk)Polish(Polskie)Portuguese(Português)Romanian(Română)Russian(русский)Serbian(Српски)Slovak(slovenský)Slovenian(Slovenščina)Spanish(Español)Swedish(svenska)Tajik(Тоҷикӣ)Tamil(தமிழ்)Telugu(తెలుగు)Thai(ไทย)Turkish(Türk)Ukrainian(Українська)Urdu(اردو)Vietnamese(TiếngViệt)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇