采用大型语言模型的生成式人工智能 — DeepLearningAI 和 AWS 的全新实践课程
生成式人工智能风靡全球,新一波广泛采用人工智能的浪潮开始袭来,每种客户体验和应用程序都有可能通过生成式人工智能进行重塑。生成式人工智能可用于创建新内容和新想法,包括对话、故事、图像、视频和音乐。生成式人工智能由超大型机器学习模型提供支持,这些模型是根据海量数据(通常称为根基模型(FM))进行预训练后生成。
其中一部分FM又称为大型语言模型(LLM),通过在大量自然语言任务中接受数万亿个单字的训练而生成。这些LLM能够理解、学习和生成与人类生成的文本几乎没有区别的文本。不仅如此,LLM还可以参与互动对话,回答问题,总结对话和文档,并提供有效建议。它们可以为许多任务和行业的应用程序提供支持,比如营销创意写作、法律文件摘要、金融市场研究、医疗保健模拟临床试验以及软件开发代码编写。
各企业纷纷采取行动,将生成式人工智能集成到其产品和服务中。这增加了对数据科学家和工程师的需求,他们了解生成式人工智能以及熟知如何应用LLM来解决业务使用案例。
因此我很高兴地宣布DeepLearning.AI和AWS将在Coursera的教育平台上联合推出一门新的实践课程采用大型语言模型的生成式人工智能。数据科学家和工程师学习该课程后,可以精通如何为实际应用程序选择、训练、微调和部署LLM。
DeepLearning.AI由机器学习和教育先驱AndrewNg于2017年创立,其使命是通过提供世界一流的人工智能培训来发展全球人工智能社区并实现这些社区的互联互通。
DeepLearning.AI与来自AWS的生成式人工智能专家合作,包括ChrisFregly、ShelbeeEigenbrode、MikeChambers和我,为希望学习如何通过LLM构建生成式人工智能应用程序的数据科学家和工程师开发和提供这门课程。我们综合了Amazon、AWS和HuggingFace的各行业专家和应用科学家的意见,在AndrewNg的指导下研发了课程内容。
课程要点这是第一门专门针对LLM的Coursera综合课程,详细介绍了典型的生成式人工智能项目生命周期,包括确定问题范围、选择LLM、根据您的域调整LLM、优化部署模型以及集成到业务应用程序中。该课程不仅侧重于生成式人工智能的实践性,还重点介绍了LLM背后的科学性及其有效性。
按需课程分为三周的内容,包括大约16小时的视频、测验、实验和额外阅读内容。由AWS合作伙伴Vocareum主持的操作实验让您可以直接在课程提供的AWS环境中实际应用这些技术,包括使用LLM和探索其有效性所需的所有资源。
通过短短三周课程的学校,您就熟练地可以在业务和实际应用中使用生成式人工智能。让我们快速浏览一下每周的课程内容。
第1周—生成式人工智能使用案例、项目生命周期和模型预训练在第1周的课程中,您将学习为许多LLM提供支持的转换器架构,了解这些模型的训练方式,并考虑开发它们所需的计算资源。您还将学习如何在推理时使用提示工程和指定生成式配置设置指导模型输出。
在第一个操作实验中,您将为给定的生成式任务构建和比较不同的提示。在这项操作中,您将汇总多人之间的对话。例如,想象一下总结您与客户之间的支持对话。您将学习提示工程技术,尝试不同的生成式配置参数,并试用各种采样策略,从而研究出用于改进生成的模型响应的方法。
第2周—微调、高效参数微调(PEFT)和模型评估在第2周的课程中,您将学习通过微调过程使预训练模型适应特定任务和数据集的方法。通过一种称为高效参数微调(PEFT)的微调变体,您可以使用很小的资源(通常是单个GPU)对大型模型进行微调。此外,您还将了解用于评估和比较LLM性能的指标。
在第二个实验中,您将动手体验高效参数微调(PEFT),并将结果与第一个实验的提示工程进行比较。这种并行比较有助于您直观地了解不同技术对于LLM适应特定域的数据集和使用案例的定性和定量影响。
第3周—利用人类反馈强化学习(RLHF)、检索增强生成(RAG)和LangChain进行微调在第3周的课程中,您将学习利用“人类反馈强化学习”(RLHF)技术,让LLM的响应更加人性化,并符合人类的偏好。RLHF是提升模型诚实性、无害性和帮助性的关键方法。您还将学习例如检索增强生成(RAG)之类的技术以及例如LangChain之类的库,通过这些技术和库,LLM可与自定义数据来源和API集成,以进一步改善模型的响应。
在最后一个实验中,您将动手体验RLHF。您将使用奖励模型和称为近端策略优化(PPO)的强化学习算法对LLM进行微调,以提高模型响应的无害性。最后,您将评估模型在完成RLHF过程前后的无害性,直观地了解RLHF对于使LLM符合人类价值观和偏好的作用。
立即注册采用大型语言模型的生成式人工智能是一门为期三周的按需课程,面向想要学习如何通过LLM构建生成式人工智能应用程序的数据科学家和工程师。
立即注册采用大型语言模型的生成式人工智能。
– Antje
推动生成式人工智能走向商业化
生成式人工智能的商业化前景如何?在数字生态系统中的应用及其对中国互联网行业的颠覆性影响又将如何?麦格理资本亚洲数字化转型研究主管EsmePau就这些问题分享了她的观点。
生成式人工智能的成功将与人工智能基础设施、生态系统和监管支持密不可分。
生成式人工智能有着巨大的商业化前景,其在整个数字生态系统中的应用广度和深度正在不断扩展,尤其是在游戏、数字娱乐、数字广告、企业、生产力等领域。生成式人工智能有望将内容生成成本压减至趋近于零。
中美两国的生成式人工智能发展各有特色,双方的商业化进程将发生在两个不同的生态系统中,这与十多年前两国在搜索领域的发展异曲同工。
在2025年前,中国的人工智能市场规模将超过300亿美元。
中国各大互联网平台纷纷逐浪大语言模型商业化,以获取未来6-12个月的价值、提高生产力并创造新的增长动力。
但和任何变革性技术一样,生成式人工智能也存在挑战,比如需要应对错综复杂的监管要求。
鉴于生成式人工智能将创造巨大的价值,世界各地的监管机构竞相制定规则,对生成式人工智能的风险进行管控。
各国可以通过设置明确的制度框架,帮助互联网公司捕捉人工智能带来的巨大机遇。
这不仅有助于设定预期,还能促进创新。
我们预计,今年下半年生成式人工智能商业化将出现拐点,尤其是同期成本效率将提升,并且将在2024年迎来新的增长动力。
拥有全栈人工智能专业知识,以及深度消费者和企业流量的一体化互联网平台极有可能从中受益。
麦格理团队聚焦生成式人工智能提供全球前沿的最新洞见,并就其对互联网、软件、硬件和ESG等多个领域产生的巨大影响进行深入分析。
生成式人工智能:人工智能的下一个前沿
0分享至如今,我们很难错过围绕ChatGPT、StableDiffusion和其他形式的生成人工智能技术领域的所有令人兴奋的事情——基本上,这是人工智能的高级版本,可以生成与人类生成的内容没有区别的内容。女士们先生们,生成式人工智能是当今的流行词,在这篇文章中,我们将介绍它的一些基础知识,例如:什么是生成式人工智能?生成式人工智能背后的技术-生成式人工智能如何运作?生成式人工智能的应用生成式人工智能会抢走我的工作吗?生成式人工智能的未来什么是生成式人工智能?这是一个很难回答的问题,因为在ChatGPT推出几个月后,这个术语已经成为流行词。在此之前,我们已经熟悉了它臭名昭著的表亲——人工智能。当您使用人工智能创建新的文本、视频、音频、图像或任何形式的数据时,您可以将其分类为生成式人工智能。这是一个总括术语。任何时候人工智能被用来自行创造一些东西,我们称之为生成式人工智能。例如,像Midjourney这样的网站会根据用户的提示生成全新的图像。像这个:Midjourney平台上一位名叫Revanchist的用户要求建立一个“浮岛上的王国,被月光照亮的魔法所覆盖”人工智能完成了剩下的工作。令人印象深刻,不是吗?因此,在技术术语中,生成式人工智能是指一种人工智能,能够在没有人类明确指令或指导的情况下生成新的原创内容,例如图像、视频、音乐甚至文本。ChatGPT、Midjourney、StableDiffusion和DALL-E只是当今市场上的少数生成式AI工具。我们已经看到了ChatGPT的强大功能。那么现在,这些生成式人工智能工具的动力是什么?让我们看看幕后的情况。生成式人工智能如何运作?生成式人工智能的工作原理是使用复杂的算法,根据从大型数据集中学习到的模式和关系来生成新的原创内容。它通常使用无监督或半监督学习来处理大量数据并生成原始输出。例如,如果你希望你的人工智能能够像梵高一样画画,你需要给它提供尽可能多的这位艺术家的画作。生成式人工智能由神经网络提供支持,该网络能够学习艺术家风格的独特特征或特征,然后在出现提示时应用它们。这个过程也适用于可以生成文本、书籍、室内和时装设计、不存在的风景、音乐等的模型。如果您想了解生成式人工智能的工作原理,您需要熟悉的一些更常见的术语是:1.变分自动编码器(VAE):变分自动编码器(VAE)是一种人工智能算法,具有两个主要功能:编码和解码信息。VAE具有重建数据并将其存储在“潜在空间”中的能力,这使其成为一个强大的工具。通过使用神经网络,VAE能够进行自学,并且可以将输入数据转换为潜在空间,反之亦然。该模型接收x作为输入。编码器将其压缩到潜在空间中。解码器接收从潜在空间采样的信息作为输入,并生成尽可能与x相似的信息。2.神经网络:神经网络是人工智能中使用的算法,擅长识别数据模式。与人脑的众多神经元类似,神经网络由许多称为节点的虚构小单元组成。这些节点被组织成层,信息进入输入层,通过隐藏层,最终通过输出层离开。下面是神经网络的直观表示:更复杂的人工神经网络将具有多个层,其中一些是隐藏的。最基本形式的人工神经网络具有三层神经元。信息从一个流向下一个,就像在人脑中一样:输入层:数据进入系统的入口点隐藏层:处理信息的地方输出层:系统根据数据决定如何继续处理更复杂的人工神经网络将具有多个层,其中一些是隐藏的。3.生成对抗网络(GAN)简单来说,GAN是能够生成图像或音乐等新内容的计算机程序。GAN的目标是生成一种新颖的合成数据形式,与过去的数据非常相似。这是通过让两组神经网络在零和游戏中相互竞争来实现的。GAN有2个部分,称为生成器和鉴别器。想象一下,如果您想在GAN的帮助下画一只小狗的图片。生成器首先画出小狗的近似值,鉴别器尝试猜测它是否是由生成器生成的。如果鉴别器猜对了,那么生成器就会重新开始工作,逐渐更好地绘制图片。我们现在知道生成式人工智能有多么强大,并且对其工作原理也有了一些了解。那么,我们该何去何从?生成式人工智能的用例有哪些?我们赶紧来看看吧。生成式人工智能的应用:生成式人工智能可以创建各种内容。我们知道的就这么多。但在其他鲜为人知的领域,生成式人工智能将成为强大的颠覆者。这里是其中的一些:1.游戏开发和电影:CGI是一个利润丰厚的行业,价值数十亿美元,而生成人工智能提供了一个独特的用例。生成式人工智能允许在没有任何现有材料的情况下生成新的视频和图像。它将3D动画师的创造力与编剧的讲故事能力结合到一个强大的计算机程序中,提供了无限的可能性。这就是生成式人工智能所能提供的。2.内容创建/文本生成:对于任何作家来说,撰写产品描述都是一项非常单调且耗时的任务。然而,这是机器可以轻松完成的事情。GPT-3的创建者通过开发一种强大的人工智能工具来满足这一需求,该工具可以根据简短的提示生成大量文本。GPT-3的输出令人印象深刻,以至于内容审核者很难区分人类编写的文本和人工智能生成的文本。3、医药:可以训练强大的人工智能模型来生成具有特定特性的药物化合物或新分子,这有利于药物发现和开发。这种方法可以将研究所需的时间从几年缩短到几天甚至几个小时。事实上,人工智能技术在帮助制药公司Moderna开发冠状病毒大流行疫苗方面发挥了至关重要的作用。4、广告:如前所述,生成式人工智能可用于生成出色的图像。这些图像正在不断改进,在许多情况下,区分人类创作的艺术品和机器制作的艺术品是具有挑战性的。这项技术可以让较小的机构生成原创艺术作品,而这在以前只有拥有大量财力的团队才能实现。生成式人工智能会夺走我的工作吗?当ChatGPT于2022年11月令人兴奋地发布时,引起了广泛的恐慌。许多消息来源,包括YouTube视频、LinkedIn帖子、InstagramStories,甚至一些世界末日预言家,都声称内容创作和文案写作的时代已经结束。但是等一下,稳住你的马!不必担心像ChatGPT这样的生成式人工智能工具的出现,因为它们不太可能取代人类工人。相反,它们可以帮助提高效率。生成式人工智能擅长涉及模式识别和预测的任务,尤其是在自然语言处理(NLP)领域。重复性任务(例如制作产品描述)是使用生成式人工智能实现自动化的理想选择。可以将生成式人工智能视为对话式人工智能发展的下一个进步。生成式人工智能的使用在数据分析中越来越流行。这项技术使知识工作者能够优化他们的时间,使他们能够从正在分析的数据中获得更深入、更有洞察力的知识。生成式人工智能的未来在我撰写本文时,全球许多公司都在竞相将生成式人工智能技术纳入各自的产品中。最近,谷歌发布了自己的人工智能聊天机器人,名为GoogleBard,作为ChatGPT的替代品。Bard具有与ChatGPT类似的功能,并利用Google的LaMDA(对话应用程序语言模型)技术。与其他公司一样,微软也在与搜索竞争保持同步。在向开发ChatGPT的公司投资了数十亿美元后,微软已经开始向用户发送使用其基于ChatGPT的搜索引擎Bing的邀请。生成式人工智能的潜在应用领域每天都在扩大,这确实令人印象深刻。我们不能简单地忽视生成人工智能,而必须学会与之共存。正如史蒂芬·霍金曾经说过的:“智力是适应变化的能力。”感谢您抽出时间阅读。这只是我写第一篇文章的开始。我希望你喜欢阅读它。我认为这篇文章提供了宝贵的见解,并激发了您对人工智能未来的好奇心。请继续关注更多发人深省的内容和该领域令人兴奋的进展。不断探索,不断学习,不断拥抱人工智能的可能性!特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.
/阅读下一篇/返回网易首页下载网易新闻客户端