2023年人工智能领域发展七大趋势
2022年人工智能领域发展七大趋势
有望在网络安全和智能驾驶等领域“大显身手”
人工智能已成为人类有史以来最具革命性的技术之一。“人工智能是我们作为人类正在研究的最重要的技术之一。它对人类文明的影响将比火或电更深刻”。2020年1月,谷歌公司首席执行官桑达尔·皮查伊在瑞士达沃斯世界经济论坛上接受采访时如是说。
美国《福布斯》网站在近日的报道中指出,尽管目前很难想象机器自主决策所产生的影响,但可以肯定的是,当时光的车轮到达2022年时,人工智能领域新的突破和发展将继续拓宽我们的想象边界,其将在7大领域“大显身手”。
增强人类的劳动技能
人们一直担心机器或机器人将取代人工,甚至可能使某些工种变得多余。但人们也将越来越多地发现,人类可借助机器来提升自身技能。
比如,营销部门已习惯使用工具来帮助确定哪些潜在客户更值得关注;在工程领域,人工智能工具通过提供维护预测,让人们提前知道机器何时需要维修;法律等知识型行业将越来越多地使用人工智能工具,帮助人们对不断增长的可用数据中进行分类,以找到完成特定任务所需的信息。
总而言之,在几乎每个职业领域,各种智能工具和服务正在涌现,以帮助人们更有效地完成工作。2022年人工智能与人们日常生活的联系将会变得更加紧密。
更大更好的语言建模
语言建模允许机器以人类理解的语言与人类互动,甚至可将人类自然语言转化为可运行的程序及计算机代码。
2020年中,人工智能公司OpenAI发布了第三代语言预测模型GPT—3,这是科学家们迄今创建的最先进也是最大的语言模型,由大约1750亿个“参数”组成,这些“参数”是机器用来处理语言的变量和数据点。
众所周知,OpenAI正在开发一个更强大的继任者GPT—4。尽管细节尚未得到证实,但一些人估计,它可能包含多达100万亿个参数(与人脑的突触一样多)。从理论上讲,它离创造语言以及进行人类无法区分的对话更近了一大步。而且,它在创建计算机代码方面也会变得更好。
网络安全领域的人工智能
今年1月,世界经济论坛发布《2021年全球风险格局报告》,认为网络安全风险是全世界今后将面临的一项重大风险。
随着机器越来越多地占据人们的生活,黑客和网络犯罪不可避免地成为一个更大的问题,这正是人工智能可“大展拳脚”的地方。
人工智能正在改变网络安全的游戏规则。通过分析网络流量、识别恶意应用,智能算法将在保护人类免受网络安全威胁方面发挥越来越大的作用。2022年,人工智能的最重要应用可能会出现在这一领域。人工智能或能通过从数百万份研究报告、博客和新闻报道中分析整理出威胁情报,即时洞察信息,从而大幅加快响应速度。
人工智能与元宇宙
元宇宙是一个虚拟世界,就像互联网一样,重点在于实现沉浸式体验,自从马克·扎克伯格将脸书改名为“Meta”(元宇宙的英文前缀)以来,元宇宙话题更为火热。
人工智能无疑将是元宇宙的关键。人工智能将有助于创造在线环境,让人们在元宇宙中体会宾至如归的感觉,培养他们的创作冲动。人们或许很快就会习惯与人工智能生物共享元宇宙环境,比如想要放松时,就可与人工智能打网球或玩国际象棋游戏。
低代码和无代码人工智能
2020年,低代码/无代码人工智能工具异军突起并风靡全球,从构建应用程序到面向企业的垂直人工智能解决方案等应用不一而足。这股新鲜势力有望在2022年持续发力。数据显示,低代码/无代码工具将成为科技巨头们的下一个战斗前线,这是一个总值达132亿美元的市场,预计到2025年其总值将进一步提升至455亿美元。
美国亚马逊公司2020年6月发布的Honeycode平台就是最好的证明,该平台是一种类似于电子表格界面的无代码开发环境,被称为产品经理们的“福音”。
自动驾驶交通工具
数据显示,每年有130万人死于交通事故,其中90%是人为失误造成的。人工智能将成为自动驾驶汽车、船舶和飞机的“大脑”,正在改变这些行业。
特斯拉公司表示,到2022年,其生产的汽车将拥有完全的自动驾驶能力。谷歌、苹果、通用和福特等公司也有可能在2022年宣布在自动驾驶领域的重大飞跃。
此外,由非营利的海洋研究组织ProMare及IBM共同打造的“五月花”号自动驾驶船舶(MAS)已于2020年正式起航。IBM表示,人工智能船长让MAS具备侦测、思考与决策的能力,能够扫描地平线以发觉潜在危险,并根据各种即时数据来变更路线。2022年,自动驾驶船舶技术也将更上一层楼。
创造性人工智能
在GPT—4谷歌“大脑”等新模型的加持下,人们可以期待人工智能提供更加精致、看似“自然”的创意输出。谷歌“大脑”是GoogleX实验室的一个主要研究项目,是谷歌在人工智能领域开发出的一款模拟人脑具备自我学习功能的软件。
2022年,这些创意性输出通常不是为了展示人工智能的潜力,而是为了应用于日常创作任务,如为文章和时事通讯撰写标题、设计徽标和信息图表等。创造力通常被视为一种非常人性化的技能,但人们将越来越多地看到这些能力出现在机器上。(记者刘霞)
【纠错】【责任编辑:吴咏玲】国外最顶级的人工智能网站资源
1、大牛JasonBrownlee:https://machinelearningmastery.com/blog/2、AI趋势:https://www.aitrends.com/3、OPENAIhttps://openai.com/blog/4、Chatbothttps://chatbotslife.com/5、麻省理工学院新闻:http://news.mit.edu/topic/artificial-intelligence26、Google大牛:https://www.getrevue.co/profile/wildml7、顶级人工智能博客:https://www.artificial-intelligence.blog/8、Googleai:https://ai.google/research9、人工智能职业指南https://www.pinterest.com/ArtibaAi/career-guide-in-artificial-intelligence/10、很棒的问答论坛:https://www.quora.com/https://www.researchgate.net/最后推荐一个极度强大的谷歌学术https://scholar.google.co.uk/
论文复现查询:https://paperswithcode.com/
另外,偏学术论文的:1、https://arxiv.org/2、https://doaj.org/3、谷歌学术https://scholar.google.co.uk/4、学术门https://www.researchgate.net/5、印度国家数字图书馆(印度国家数字图书馆)https://ndl.iitkgp.ac.in/6、PQDT开放论文和学位论文(https://pqdtopen.proquest.com)
OpenAI发布最强的人工智能对话模型——ChatGPT,火出AI圈,给我们体验和思考
目录一、前言二、ChatGPT的技术原理 阶段一:基于冷启动的有监督策略模型 阶段二:基于奖励机制的训练模型 阶段三:采用强化学习来增强预训练模型三、使用案例四、思考问题一:ChatGPT如此强大,那未来可以商业化,孵化产品吗?问题二:ChatGPT会代替传统的搜索引擎吗?问题三:我们可以借鉴ChatGPT哪些方面呢?五、ChatGPT镜像六、参考文献一、前言12月1日,OpenAI公司官宣了其目前最强大的AI对话模型ChatGPT,最近几天极其火爆,朋友圈也都是案例,网上都是铺天盖地的ChatGPT相关案例和测试内容,效果确实非常震撼。上一次引起如此轰动的AI技术,NLP领域还是GPT3模型,那已经两年前的事情了,如今是恍如昨天。多模态领域则是DaLLE2、StableDiffusion为代表的Diffusionmodel,这也是最近火了大半年的AIGC模型,常见就是输入几个关键词,模型可以用作作画,而且水平似乎已经超过普通人。如今,AI的星火又传到了ChatGPT身上,它也是属于AIGC领域。AI泡沫逐渐破裂的今天,AIGC又给了AI一副济世良药。ChatGPT主要是基于GPT3.5来实现的,OpenAI官方也说明GPT4模型即将来临,也更加期待他的效果。看来AIGC将会成为AI行业的一丝希望和温暖,AIGC或许是AI奇点,AI下半场主角。
说回ChatGPT,我们主要从两个角度,一个是技术角度来聊聊,另一个是脑洞比较大的案例上,看看有哪些业务场景。
首先,ChatGPT到底是采用了怎样的技术,才能做到如此超凡脱俗的效果?既然chatGPT功能如此强大,那么它可以取代Google、百度等现有搜索引擎吗?如果能,那是为什么,如果不能,又是为什么?
其次,ChatGPT到底有哪些较好的案例,这些案例都说明什么问题?给了AI从业人员哪些思考?
图2022年gartner技术成熟曲线
现在访问ChatGPT官网至少需要满足以下两点:
1. ChatGPT账号
2. 特定地区(需要特定网络解决)
文章末尾提供了一个ChatGPT镜像,可直接访问,无需账号,无区域限制。
二、ChatGPT的技术原理官方博客中介绍到,ChatGPT是基于GPT-3.5(模型card:https://datalearner.com/ai-resources/pretrained-models/gpt-3-5 )微调的结果。ChatGPT是InstructGPT的兄弟模型(InstructGPT是官方训练的一个比GPT-3更好的遵循用户意图的语言模型,是基于OpenAI的alignmentresearch技术研发的,比GPT-3更强的语言模型)。
ChatGPT的训练使用了基于人类反馈的强化学习(ReinforcementLearningfromHumanFeedback,RLHF)。这点与InstructGPT一样,但是在数据收集方面有差异。OpenAI使用监督下的微调训练了一个初始模型:人类AI训练员提供对话,他们在对话中扮演双方—用户和人工智能助理。这可以让训练者接触到模型编写的建议,以帮助他们组成他们的回应。
接下来是张俊林老师的一段描述,感觉非常能够总结官网的介绍。
整体技术路线上,ChatGPT在效果强大的GPT3.5大规模语言模型(LLM,LargeLanguageModel)基础上,引入“人工标注数据+强化学习”(RLHF,ReinforcementLearningfromHumanFeedback,这里的人工反馈其实就是人工标注数据)来不断Fine-tune预训练语言模型,主要目的是让LLM模型学会理解人类的命令指令的含义(比如给我写一段小作文生成类问题、知识回答类问题、头脑风暴类问题等不同类型的命令),以及让LLM学会判断对于给定的prompt输入指令(用户的问题),什么样的答案是优质的(富含信息、内容丰富、对用户有帮助、无害、不包含歧视信息等多种标准)。
基于“人工标注数据+强化学习”,ChatGPT整体训练架构如下图所示。
图整体训练流程图
具体而言,ChatGPT的训练流程分为三个阶段:基于冷启动的有监督策略模型、基于奖励机制的训练模型、采用强化学习来增强预训练模型。
阶段一:基于冷启动的有监督策略模型靠GPT3.5本身,尽管它很强,但是它很难理解人类不同类型指令中蕴含的不同意图,也很难判断生成内容是否是高质量的结果。为了让GPT3.5初步具备理解指令中蕴含的意图,首先会从测试用户提交的prompt(就是指令或问题)中随机抽取一批,靠专业的标注人员,给出指定prompt的高质量答案,然后用这些人工标注好的数据来Fine-tuneGPT3.5模型。经过这个过程,我们可以认为GPT3.5初步具备了理解人类prompt中所包含意图,并根据这个意图给出相对高质量回答的能力,但是很明显,仅仅这样做是不够的。
阶段二:基于奖励机制的训练模型这个阶段的主要目的是通过人工标注训练数据,来训练奖励模型。具体而言,随机抽样一批用户提交的prompt(大部分和第一阶段的相同),使用第一阶段Fine-tune好的冷启动模型,对于每个prompt,由冷启动模型生成K个不同的回答,于是模型产生出了,….数据。之后,标注人员对K个结果按照很多标准(上面提到的相关性、富含信息性、有害信息等诸多标准)综合考虑进行排序,给出K个结果的排名顺序,这就是此阶段人工标注的数据。
接下来,我们准备利用这个排序结果数据来训练回报模型,采取的训练模式其实就是平常经常用到的pair-wiselearningtorank。对于K个排序结果,两两组合,形成(k2)个训练数据对,ChatGPT采取pair-wiseloss来训练RewardModel。RM模型接受一个输入,给出评价回答质量高低的回报分数Score。对于一对训练数据,我们假设人工排序中answer1排在answer2前面,那么Loss函数则鼓励RM模型对的打分要比的打分要高。
归纳下:在这个阶段里,首先由冷启动后的监督策略模型为每个prompt产生K个结果,人工根据结果质量由高到低排序,以此作为训练数据,通过pair-wiselearningtorank模式来训练回报模型。对于学好的RM模型来说,输入,输出结果的质量得分,得分越高说明产生的回答质量越高。
阶段三:采用强化学习来增强预训练模型第三阶段:采用强化学习来增强预训练模型的能力。本阶段无需人工标注数据,而是利用上一阶段学好的RM模型,靠RM打分结果来更新预训练模型参数。具体而言,首先,从用户提交的prompt里随机采样一批新的命令(指的是和第一第二阶段不同的新的prompt,这个其实是很重要的,对于提升LLM模型理解instruct指令的泛化能力很有帮助),且由冷启动模型来初始化PPO模型的参数。然后,对于随机抽取的prompt,使用PPO模型生成回答answer,并用上一阶段训练好的RM模型给出answer质量评估的回报分数score,这个回报分数就是RM赋予给整个回答(由单词序列构成)的整体reward。有了单词序列的最终回报,就可以把每个单词看作一个时间步,把reward由后往前依次传递,由此产生的策略梯度可以更新PPO模型参数。这是标准的强化学习过程,目的是训练LLM产生高reward的答案,也即是产生符合RM标准的高质量回答。
如果我们不断重复第二和第三阶段,很明显,每一轮迭代都使得LLM模型能力越来越强。因为第二阶段通过人工标注数据来增强RM模型的能力,而第三阶段,经过增强的RM模型对新prompt产生的回答打分会更准,并利用强化学习来鼓励LLM模型学习新的高质量内容,这起到了类似利用伪标签扩充高质量训练数据的作用,于是LLM模型进一步得到增强。显然,第二阶段和第三阶段有相互促进的作用,这是为何不断迭代会有持续增强效果的原因。
三、使用案例尽管官方对于ChatGPT的能力描述很简单,但是从实际大家使用的期刊来看,这个系统可以做的事情远超大家想象。这里我们会列举目前收集的ChatGPT的使用案例,供大家参考。
案例序号
案例名称
案例来源
1
生成AIPrompt
href="https://twitter.com/GuyP/status/1598020781065527296"https://twitter.com/GuyP/status/1598020781065527296
2
编写iOSSwiftUIAPP
href="https://twitter.com/avielgr/status/1598895550392197121"https://twitter.com/avielgr/status/1598895550392197121
3
学习技术
href="https://twitter.com/HamelHusain/status/1598834924848836609"https://twitter.com/HamelHusain/status/1598834924848836609
4
写出一个可以生成小鸟图片的Python脚本
href="https://twitter.com/bgavran3/status/1598857248536956928"https://twitter.com/bgavran3/status/1598857248536956928
5
写Javascript脚本
href="https://twitter.com/vertinski/status/1599099368472137729"https://twitter.com/vertinski/status/1599099368472137729
6
参与SAT考试
href="https://twitter.com/davidtsong/status/1598767389390573569"https://twitter.com/davidtsong/status/1598767389390573569
7
自然语言转成Latex
href="https://twitter.com/jdjkelly/status/1598021488795586561"https://twitter.com/jdjkelly/status/1598021488795586561
8
解释代码
href="https://twitter.com/goodside/status/1598129631609380864"https://twitter.com/goodside/status/1598129631609380864
9
改写故事
href="https://twitter.com/raphaelmilliere/status/1598469100535259136"https://twitter.com/raphaelmilliere/status/1598469100535259136
10
debugging代码
href="https://twitter.com/amasad/status/1598042665375105024"https://twitter.com/amasad/status/1598042665375105024
11
写计算机网络家庭作业
href="https://twitter.com/abhnvx/status/1598258353196929024"https://twitter.com/abhnvx/status/1598258353196929024
12
替代搜索引擎
href="https://twitter.com/RajJohri2019/status/1598492953764315137"https://twitter.com/RajJohri2019/status/1598492953764315137
13
创作短剧
href="https://twitter.com/rgodfrey/status/1598162900140445697"https://twitter.com/rgodfrey/status/1598162900140445697
14
创作食谱
href="https://twitter.com/stephsmithio/status/1598920887029628928"https://twitter.com/stephsmithio/status/1598920887029628928
15
反编译汇编代码
href="https://twitter.com/mahal0z/status/1598536939942006784"https://twitter.com/mahal0z/status/1598536939942006784
16
代写办公邮件
href="https://twitter.com/CubicleApril/status/1598753388895797282"https://twitter.com/CubicleApril/status/1598753388895797282
17
写年度总结报告
href="https://twitter.com/shanselman/status/1599073011050872832"https://twitter.com/shanselman/status/1599073011050872832
18
闲聊
href="https://twitter.com/t3dotgg/status/1598954493680713729"https://twitter.com/t3dotgg/status/1598954493680713729
19
撰写技术博客
href="https://twitter.com/goodside/status/1598235521675038722"https://twitter.com/goodside/status/1598235521675038722
20
逻辑推理问题
href="https://twitter.com/Robdeprop/status/1598285166971351040"https://twitter.com/Robdeprop/status/1598285166971351040
以上就是我们收集的关于ChatGPT的一些应用案例,很多内容都是重复的。不过从案例收集的结果来看。ChatGPT在编码上有很好的水平,同时在艺术创作、技术创作、办公、逻辑算术等方面都有很不错的表现。需要注意的是,ChatGPT是支持多轮对话的,它可以和你一起进行多次对话来修补回答。在写app和函数的案例中,如果你对答案不满意,可以要求怎么去修改它。这些案例让很多人认为这就是一个通用型人工智能的雏形,也是GPT-4的结果。
自己亲自体验了一把,玩嗨起来。
场景一:角色扮演:假如你是李白。看这作的诗集有模有样。
场景二:角色扮演:假如你是数学老师。
看这回答的问题还不错。
场景三:做数学题也很不错。
场景四:作为学校的老师,继续处理学生之间的矛盾。
四、思考问题一:ChatGPT如此强大,那未来可以商业化,孵化产品吗?目前来看这个模型是大公司的游戏,而且是超级巨头之间的游戏。对于中小型公司来说基本上不可能。原因有以下几点。
原因一:成本非常高,高到常人都想象不到。ChatGPT或GPT4的训练成本以及在线推理成本太高,导致如果面向真实搜索引擎的以亿记的用户请求,假设继续采取免费策略,OpenAI无法承受,但是如果采取收费策略,又会极大减少用户基数,是否收费是个两难决策,当然如果训练成本能够大幅下降,则两难自解。
马斯克在一条宣布chatgpt用过过百万的推下问运行chatgpt的成本,这个哥们估了个数字,大概每次对话请求要1~2美分,只是比较粗糙的估计,openai每天要花10万美元来提供这个服务,网上是这么说的。
原因二:OpenAI掌握着模型的核心技术,全球独此一份,意味着核心技术还是掌握在大厂的手中,毕竟这背后站着是微软。如果OpenAI或者微软不开源代码和模型,其他人估计也没办法站到巨人的肩膀上,只能跟在OpenAI身后进行跪舔才行。OpenAI和微软哪天不高兴了,不给你接口,不也玩不起来了。
原因三:ChatGPT算是一个基于Ai技术而实现的一个辅助引擎,其实就是通过大量的资料学习,打造出一个像搜索引擎一样可以回答问题工具。但是本身还是有很多错误的回答,关键它还会“一本正经胡说八道”。从网上的案例上来看,非常多的认知层面出错,没有办法认识自己的错误。如果说把它当成一个检索系统,给我们想要的答案,你需要验证回答的内容是否正确。表面上似乎没有问题,但实际上内容里面真真假假,假假真真。尤其对回答问题的置信度要求比较高的场景,用ChatGPT可能性不大。
问题二:ChatGPT会代替传统的搜索引擎吗?现阶段不会。我们先看看搜索引擎做哪些事情。
搜索引擎我们都不陌生,用户输入query和内容,搜索引擎提供有用信息。但是人们想要的是准确并且具体的内容,对搜索引擎的要求可是很严格的。不仅需要返回的结果正确,还不能返回太多无用干扰信息。
其次,想要研发出好用的搜索引擎,需要有强大的数据收集并进行标签分类的能力,这就涉及到人工智能技术、互联网、云端服务等各种技术的沉淀,想要实现突破就需要付出更多的时间。
再者,搜索引擎需要大量的内容生态能力以及商业化的能力。一个功能好用与否就看它拥有什么样的价值,内容生态能力是搜索引擎的关键,只有掌握足够多的内容,才能在用户使用时提供精准拥有的回答,帮助用户解决问题。
所以,我们可以看到,搜索引擎并不是一个ChatGPT模型能够完全代替的。抛开成本来说,ChatGPT本身是不具备这些能力。像谷歌、百度这类企业的搜索引擎已经足够成熟和好用。ChatGPT不能实现实质性的超越,那即使是推出也不会吸引到用户来使用,如果不能雪中送炭,景上添花意义不大。毕竟,搜索引擎最关键的就是,快速呈现精准信息的能力。
问题三:我们可以借鉴ChatGPT哪些方面呢?从ChatGPT模型本身来看,针对AI从业人员还是有很多借鉴的地方。
其一,模型体量不是越大越好,重点还是在数据质量。这一点估计大多数AI从业人员都会说。ChatGPT是基于GPT3.5,但是模型参数却只有1.6亿左右,并不是说几百亿,万亿参数模型。数据量主要是经过人工多层次筛选,并且对结果进行逐条人工校验,相当于人类在当一个“好老师”,不断调教“ChatGPT这学生”。模型不断的给出答案,AI训练师不断的给答案评分,并且打上不同的标签。形式上甚至采取交互式的方式。听说这个打标签和交互形式的工作,也就是AI调训师,OpenAI给出了69万美元的年薪。
其二,ReinforcementLearningfromHumanFeedback技术会快速蔓延到其它内容生成方向。这是一个新的技术点,可以跟其他的任务和场景进行结合起来。
其三,大模型时代到来,可能AI工程师已经不能仅仅借助过往的调模型经验了。未来一个好的算法工程师,一定是会洗数据,选数据,调模型,懂业务,懂AI架构,一个全能型选手。针对中小厂的从业人员,尤为重要。如此才能不被行业所淘汰。
针对AIGC应用场景,也同样有借鉴的地方。
其一,可能未来不会去区分不同的任务场景,万物皆可生成。绝大数的任务都是可以通过AIGC来实现。ChatGPT可以用来做编程、艺术创作、技术创作、办公、逻辑算术、函数调用。但他本质上还是一个AIGC模型。
其二,未来AIGC大概率会聚集在娱乐消费、自媒体、弱社交娱乐。因为对生成质量要求不是很高,然后互连网传播速度可以加快数据的产生,加快模型的迭代更新。弱社交娱乐可以提供情感寄托
其三,内容创作覆盖的范围非常广,把AI做为内容生产的工具,而不再聚焦于人。这个业务场景就会非常广泛:代码辅助生成、设计图纸、文稿生成、音视频、邮件等等。
五、ChatGPT镜像ChatGPT镜像,可直接访问,无需账号,无区域限制。
https://gpt.chatapi.art
感兴趣可以收藏下网址!
ChatGPT镜像
六、参考文献https://zhuanlan.zhihu.com/p/589533490
https://www.zhihu.com/question/570189639
https://openai.com/blog/chatgpt/
https://github.com/acheong08/ChatGPT