博舍

少儿编程火爆背后的喜与忧 人工智能的喜与忧 口译网

少儿编程火爆背后的喜与忧

原标题:少儿编程火爆背后的喜与忧

小学生在2018世界机器人大会一处展台体验编程机器人。新华社发

2018世界机器人大会上,小学生在焊接用于编程的模块。新华社发

山东青岛即墨区德馨小学的学生在组装机器人。新华社发

“在我们身处的这个世界里,从城市交通、桥梁结构到空气质量、地质演变,再到人际互动和经济活动,无不可以借助编程这一数字世界的通用语言,去看待和理解。不是只有博士才有资格学习编程,普通小孩也可以,说不定,他还能找到编程模型的漏洞。”当少儿编程风刮到中国,有人曾如此形象地描述。

现在,少儿编程教育热到什么程度了?孩子们究竟能从中收获什么?少儿编程教育的快速发展还将面对哪些挑战?记者进行了调查。

纳入必修课,编程成为新课标亮点

“机器人该如何鉴别是悬崖还是地面?”

“反射光强度。”

在北京某重点中学的初一信息技术必修课上,老师刘训坤刚抛出这个问题,就有学生迅速给出答案。

这节课的任务是编程实现机器人“悬崖勒马”。实验室的桌面上,摆放着24台乐高EV3机器人。学生们通过安装在机器人前部的颜色传感器,分别测量出桌面和“悬崖”的反射光线强度,计算出相应阈值,控制机器人走到桌子边缘时,立刻停止前进。

这一复杂的编程操作,并没有难倒大家,电机的转动声不时传来。不到20分钟,已有超过半数的学生完成了任务。

设计程序、编辑代码、控制物体运动,这番情景也曾发生在30年前的课堂上。

20世纪80年代,计算机知识刚刚走进中国课堂,教材中就有一节“小海龟绘图”的课程。在键盘上写下指令,“小海龟”按照指令重复运动,其轨迹就是一幅画。看似简单,背后却融入了数学逻辑、心理学等学科知识。这可能是中国孩子第一次接触到编程语言。过了30年,少儿编程教育已经被更为广泛地认可和接受。

“编程课程的作用在于锻炼孩子们的抽象思维和逻辑思维,以便提高他们解决实际问题的能力。”刘训坤介绍,少儿编程早已作为必修课出现,按照年级从低到高,课程难度逐步递增,初中生有乐高机器人编程和手机游戏编程等课程,高中阶段则会加入Python、C++、算法与程序设计、人工智能等课程内容。

今年年初,教育部印发《普通高中课程方案和语文等学科课程标准(2017年版)》,加入了人工智能、物联网、大数据处理等,成为新课标的亮点之一。而教育部高中信息技术课程新教材将通过必修课,让所有高中生具备基本的编程、算法的技能,其中高一学生必修4学分课程。

事实上,体现编程思维的考题早已成为高考试题。2018年的高考数学江苏卷、天津卷,要求考生通过阅读伪代码理解程序逻辑,并根据算法得出结果。

2017年,浙江省实施新高考政策,包含通用技术与计算机技术的技术被纳入选考范围,除必考的语数外3门科目外,考生可在技术、历史、物理等7门学科中任选3门。

“少儿编程教育并非高等教育那种单纯写代码、编制应用程序,而是通过编程游戏启蒙、可视化图形编程等课程,培养学生的计算思维和创新能力。”长期从事信息管理研究的华中师范大学副校长夏立新表示,“作为计算机信息时代的核心――编程,将会融入日常工作与生活,成为像英语一样的基本技能。人工智能是未来发展的必然趋势,发展少儿编程教育正当其时。作为STEAM(科创教育)学科的一个分支,也体现了教育供给侧的新需求。”

“从抽象的角度看,编程是一种创作过程。少儿编程让孩子在学习编程的过程中掌握编程思维,释放自己的创造力。”在线少儿编程平台编程猫联合创始人兼CEO李天驰认为,编程课程是综合应用型的学科,具备跨学科教学的特性,与传统科目相比,更加凸显素质教育的要求。

热衷学编程,加分、保送机会有多大

还是在北京某重点中学的初一信息技术必修课上,学生丁丽在输入指令时,卡壳了――因为未能准确测出反射光强度的参数值,机器人直接掉下“悬崖”。

学校的信息技术课,并不是她第一次接触少儿编程教育。年初,正是“小升初”的关键节点,丁丽的父母就给她作了精心安排:参加少儿编程培训班,以“科技特长生”的身份考入知名中学。丁丽花了三个月时间突击,最终还是没能通过“科技特长生”的资格认定。

记者调查发现,和丁丽遭遇类似的学生不在少数。在奥数培优之外,少儿编程也挤进了课外辅导课表。

刚放学不久,记者跟随一些小学生,走进了一家位于北京广渠门的少儿编程培训机构。培训机构的曾老师介绍:“分校一共有400余名学员,由于课程编排集中,还需要额外租用临时授课地点。”

这家少儿编程培训机构以少儿编程、智能机器人编程和编程数学体系为主,在北京、天津、成都等地拥有60余家分校。通过学科竞赛保送名校的案例,被突出印在宣传册上。为什么学生与家长高涨的参与热度那么高?曾老师承认“很大一部分原因,来自升学的压力”。

曾老师表示:“北京的中学特长生招生确实在缩减,但那些都是体育、音乐、美术特长生,科技特长生和他们不一样,肯定还会增加。”但是,这个说法难以找到政策依据。

记者梳理发现,2019年,北京市将取消各类特长生招生。教育部也发文称,中小学阶段在2020年前取消各类特长生招生。目前,仅有中学信息学科奥林匹克竞赛得以保留,优胜者仍可保送至知名高校;部分高校自主招生也认可类似竞赛成绩。

就在这几天,刘训坤收到了学生的信息科学竞赛成绩:“在信息学科竞赛和大学自主招生中,少儿编程学科依然具有很高含金量,而能够脱颖而出的毕竟只是凤毛麟角。如果不是出于真正的兴趣,而是单纯想通过学习编程,达到升学、加分的目的,结果可能会让人失望。”

知名基金入场,少儿编程迎来资本爆发期

少儿编程教育走进了中学课堂、挤进了家长视野,也让资本嗅到了难得的机遇。根据《中国少儿编程行业研究报告》,截至2018年10月,国内少儿编程行业市场规模约为30亿元至40亿元,用户规模约为1550万,行业规模将在5年内达到300亿元。更有分析者将其视为“下一个奥数级别的市场”。

近十年来,以色列、英国、日本均在本国课程中加入编程教育科目。2016年,美国政府投资40亿美元开展少儿编程教育,并强制要求高中毕业生必修计算机编程学分。《2017开发者技能报告》显示,少儿编程教育渗透率在美国已达44.8%,中国目前仅为0.96%。从资本的角度看,正是中外编程教育普及的差距带来了市场机会。

“我们看中的是人工智能发展前景,并不是看中传统的教育培训市场。相比形式,我们更看好内容。”一位不愿意透露姓名的投资人告诉记者,“人工智能、大数据等方面发展的大方向,特别是相关课程纳入中小学课程标准等利好政策,给了我们投资的信心。”据悉,今年该公司就注资千万,投资一家少儿编程机器人项目。

这位投资人口中所说的“利好政策”是,2017年7月,国务院印发《新一代人工智能发展规划》。《规划》提到,鼓励实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育。

目前,有160余家少儿编程公司,其中约50家公开过融资情况,红杉资本、高瓴资本等知名基金均已入场,少儿编程行业迎来了资本爆发期。

“正在逐步推广的少儿编程教育会走一条和少儿英语普及完全类似的道路。人工智能、科技创新是经济增长的重要引擎,借助被纳入学科体系的机会,少儿编程的发展速度可能会比英语教育普及速度更快。”VIPCODE创始人唐亮说。VIPCODE是一家刚成立一年的少儿编程公司,主要采用线上“一对一”等在线直播授课形式。目前,在读学员大概2000多人。

2018年5月,编程猫获得招银国际领投的3亿元战略融资,该笔融资创下了少儿编程行业目前为止的单笔融资数额纪录。编程猫的课程主要以中小学生为主,为国内7至16岁青少年儿童提供少儿编程教育。

“人均可支配收入增加将会带来教育消费升级。”李天驰看好国内少儿编程教育,“少儿编程与英语教育都是时代催生出来的新教育分支,会随着时代发展而发展。”

效果评价、课程研发、师资补充的困局

虽然才小学一年级,陈明已经接触少儿编程三年了,“每次的课程都很好玩儿”。陈明的妈妈林娜经常在微信朋友圈里展示孩子学习编程的照片和视频。在选择少儿编程培训机构时,林娜发现,几乎所有机构都会突出锻炼逻辑思维,但是如何评价少儿编程教育的效果,谁能给出量化评判的标准,林娜对此还有些困惑。

孩子学习、家长付费,不少家长仍以提高分数为第一考虑因素。他们觉得,学习少儿编程能锻炼逻辑思维能力的说法太过空泛。

“尚未对接应试,暂时无法标准量化,确实是少儿编程教育的特性之一。”夏立新理解家长们的苦恼,“少儿编程培训的效果,可以通过观察孩子的外在变化来判断,比如动手能力提高、专注能力加强。”当面对复杂烦琐的步骤头疼不已时,编程锻炼出来的思维方式,会让孩子们能够高效地将问题“化繁为简”,这样的变化更为明显。

同样是基于这个原因,每学期信息技术课结束时,刘训坤总是反对纸上谈兵,更倾向于考查学生们的实际动手能力和计算思维。“除了评价标准模糊,很多学校还只是采用自编的校本教材,与高中信息技术新课标配套的教材甚至都还没出版。”在刘训坤看来,目前并未形成贯穿学生整个成长阶段的完整的编程教育体系。

少儿编程教育,在教育培训市场也面临诸多困难。

大多数少儿编程公司推行的软件课程体系主要参考美国,但良莠不齐,并未形成相对统一的标准。当前,市面上使用最多的图形化编程工具是Scratch,在线平台注册用户超过1800万,但它仅仅是一款编程工具,没有系统的教学课程、学习方案。

“课程设计体现教研能力,而教研能力决定了少儿编程课程的质量。有些机构的课程就照搬大纲、教材,孩子难以接受,教学效果不好。”唐亮表示,“用比较通俗易懂的方式,阐述清楚并让孩子接受,考验着少儿编程培训机构的教研能力。”

“优质的少儿编程教育应该至少具有三层价值:有趣、有用和有效。”唐亮表示,少儿编程老师要善于用生活化、孩子易于接受的例子去教学,还要通过实际课程效果数据检验分析,优化课程内容和授课体验。

“不同于相对成熟的少儿英语等教育培训市场,少儿编程领域的老师可以说是基本空缺。”夏立新表示,编程教师既要精通技术,又要具备教师的基本能力,手把手地指导学生,很难像英语口语一样通过视频直播来教学。

唐亮同样将师资培养视作普及编程教育的“一大瓶颈”,每年都有近百万的编程人才从高校毕业:“如果能有1%的人成为少儿编程老师,那么编程教育的师资问题就迎刃而解了。”

“少儿编程在国内快速发展还不到4年,可以说是一条全新的分支,势必会遇到很多问题。”李天驰表示,行业在野蛮生长之后,亟须制定规范化、系统化的行业标准和监管机制,以对整体少儿编程行业进行品质控制。(记者陈鹏)

(责编:郝孟佳、熊旭)

分享让更多人看到

ChatGPT掀起技术狂潮:顶流之下,看人工智能喜与忧

转自:科技日报

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

去年11月,美国人工智能研究公司OpenAI发布了一款名为ChatGPT的聊天机器人,其在推出后的几周内就风靡全球,甚至引发了一场新的全球人工智能竞赛。

社交媒体推特首席执行官埃隆·马斯克在使用ChatGPT后直呼其“好得吓人”,甚至断言“人工智能越发强大,离对人类产生威胁不远了”。

《自动化与工作的未来》一书作者、美国雪城大学教授亚伦·贝纳纳夫说,200年前,人们对自动化技术产生了一波又一波的恐惧,人们看到新技术,就害怕它们会完全取代人类的劳动。

今年2月初,ChatGPT开启“狂飙”模式,引起新一轮疯狂的技术升级、产业重构、资本狂潮、巨头逐鹿。起初,随着这波技术热浪席卷全球而心情起伏不定的普罗大众,经过一段“沉浸式”体验,虽未感到恐惧,但仍不免有些担忧。

实现对话式AI的第一步

ChatGPT仅发布了2个月,月活跃用户就超过了1个亿。

要知道,“1个亿”可不是个小目标,达到这一数字,Facebook用了4.5年,WhatsApp用了3.5年,Instagram用了2.5年,谷歌则用了将近一年。

中国科学院自动化研究所研究员、数字内容技术与服务研究中心主任张树武在接受科技日报记者采访时表示,人们可以把ChatGPT视为继语音、图像视频识别技术之后最复杂的语言识别技术突破,也是基于模式识别和深度学习的感知智能技术发展的新跃迁。

天津大学自然语言处理实验室负责人、教授熊德意表示,从人工智能发展角度看,这是一个重要的里程碑,其意义要高于7年前的“阿尔法狗”。

他告诉记者,围棋界的“阿尔法狗”刷新了普通大众对人工智能技术的看法,但是其本身并不能广泛应用,普通大众也难以与其直接接触。

ChatGPT则完全不同。

与“阿尔法狗”相比,ChatGPT可以直接应用或支撑很多场景应用和产品。如果说“阿尔法狗”是技术应用的“阳春白雪”,那么ChatGPT或许有机会成为“下里巴人”。

的确,在用户们不懈努力地发掘ChatGPT的用途后,人们发现,它不仅仅是个聊天工具,还可以写代码、写情书、写论文,也可以在线问诊,编写情景脚本、诗歌、小说,甚至是拟定旅游路线、回答脑筋急转弯,可谓“有求必应”,功能强大到无法想象。

ChatGPT在快速渗透各个行业,普通大众都可以成为ChatGPT的用户,这是其火爆出圈的重要原因。

事实上,此前已有许多跟机器人聊天的相关应用,我们最熟悉的莫过于常用的智能语音助手。ChatGPT与之有何不同呢?

“智能音箱采用的同样是自然语言处理技术、对话式AI技术,但是语言智能比较初级。很多情况下,我们只能与它们进行一问一答式的简单对话。”熊德意说,“而ChatGPT,其底层技术不仅与一般的智能音箱底层技术截然不同,而且要比它们强大得多,不仅如此,它改进了与它同类的技术InstructGPT的人类反馈数据收集形式,在与人对话中,可以基于历史内容,支持连续多轮对话。”

熊德意认为,ChatGPT是实现对话式AI的第一步。

从互联网层面来看,它可以作为信息入口,与搜索引擎相结合;还可与办公软件结合,增强办公效率;从人机交互角度看,它体现的是一种基于自然语言的交互方式,可以与元宇宙、数字人结合。此外,它还可以充当机器人大脑。

“如果从人类信息发展的尺度上看,它在人与机器之间的信息接口方面有了很大突破。”熊德意如是说。

“十八般武艺”样样精通

ChatGPT使用了GPT-3技术,即第三代生成式预训练Transformer(GenerativePretrainedTransformer3)。这是一种自回归语言模型,使用深度学习来生成类似人类的文本。

据英国广播公司《科学焦点》杂志介绍,GPT-3的技术看似简单,例如它接受用户的请求、听取问题或提示并快速回答,但其实这项技术实现起来要复杂得多。该模型使用来自互联网的文本数据库进行训练,包括从书籍、网络文本、维基百科、文章和互联网其他文本中获得的高达570GB的数据。更准确地说,它在5000亿个单词组成的训练数据上进行了高强度训练。

GPT-3.5是GPT-3微调优化后的版本,比后者更强大。ChatGPT正是由GPT-3.5架构的大型语言模型(LLM)所支持的。

ChatGPT也可以被描述为一个自然语言处理(NLP)领域的人工智能模型。这意味着它是一个能够编码、建模和生成人类语言的程序。

作为一种语言模型,在大规模文本数据上进行自监督预训练后,ChatGPT还需要经过三个阶段的“炼制”。首先是监督微调阶段,在该阶段,人类AI训练师既充当用户,同时也是AI助理,以自我对话形式生成对话样例,ChatGPT在这些对话样例上进行有监督的训练。

接着,ChatGPT进入第二个阶段。该阶段的主要目的是训练一个基于语言模型的奖励模型,对机器生成的回复进行评分,为了训练该奖励模型,需要随机抽取机器生成的文本,并采样出多个不同版本,人类训练师对这些不同版本进行偏好排序,排序的结果用于奖励模型的训练。

基于训练好的奖励模型,第三个阶段采用强化学习技术进一步微调ChatGPT。

这项技术与众不同之处在于,它能够基于以上介绍的人类反馈强化学习技术,使生成的文本能够与人类意图和价值观等进行匹配。

无论懂不懂技术,全球网友都竞相大开“脑洞”,试探ChatGPT到底有多“神”。据美国有线电视新闻网报道称,有人要求它用《坎特伯雷故事集》的风格重写上世纪90年代热门歌曲《BabyGotBack》;有人写了一封信,要求ChatGPT删除信用报告中的不良账户;还有人询问它以童话为灵感的家装设计方案。

自然语言处理技术拨云见日

一炮而红后,ChatGPT概念股也跟着一路“狂飙”。有媒体报道,汉王科技9天收获7个涨停板。自然语言处理研究是该公司主营业务,而ChatGPT背后的技术就是NLP。

熊德意告诉记者,NLP是人工智能的一个分支,最早诞生于机器翻译,其历史实际上比“人工智能”名字的历史还要悠久,至今已研究了70多年。简单来说,该技术的目标就是要让计算机或机器人能够实现像人一样具备听、说、读、写、译等方面的语言能力。

“ChatGPT并非一项技术的一蹴而就,它是多种技术叠加在一起形成质变的产物,是NLP领域的结晶。”熊德意解释,其底层技术,包括Transformer、自监督学习、微调、人类反馈强化学习(RLHF)、AI对齐等,在自然语言处理和人工智能领域都有广泛的研究和应用。

“但ChatGPT将这些技术巧妙地结合在一起。它有效规避了大模型的未对齐行为,利用了大模型规模带来的智能突现能力,增强了大模型的指令学习能力和用户意图捕获能力,解锁了大模型的泛化能力。这些能力叠加在一起形成了ChatGPT的质变效果。”熊德意说。

美国《迈阿密先驱报》报道称,推特上的一位用户在ChatGPT的帮助下参加了一次模拟SAT考试,得到了1020分(满分1600分)。根据CollegeSimply的数据,这只略低于平均水平。

但当我们提问ChatGPT“你能帮我通过考试吗”,它会善意地提醒我们不要利用它来作弊,并表示:“重要的是要记住,测试的目的是评估你对材料的理解和掌握程度。作弊,或者仅仅依靠像我这样的外部来源,会破坏考试的价值,也不会促进学习或成长。”

这是因为ChatGPT被加入了预先设计的“道德”准则,也就是上文提到的人类反馈强化学习。

OpenAI表示:“这使该工具能够回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。”

熊德意认为,这是因为RLHF有效提升了大模型的对齐能力,即如何让AI模型的产出和人类的常识、认知、需求、价值观保持一致。

经过RLHF的“调教”,ChatGPT变得高度拟人化,可以学习并生成听起来十分自然的回复。RLHF还使ChatGPT能够理解指令并做出适当的响应,从而使对话更加真实。

ChatGPT也因此迅速成为当下所有智能聊天机器人中的“天花板”。

虽触手可及但无法取代人类

随着科技的发展,人工智能技术一次又一次地超越了人们认为无法达到的极限,从1997年IBM“深蓝”计算机首次在国际象棋中击败人类,到IBM人工智能机器人“沃森”赢了智力竞赛《危险边缘》(Jeopardy),再从2016年“阿尔法狗”在围棋大战中战胜人类,到2019年号称“AI赌神”的Pluribus在德州扑克中碾压人类玩家……

现在,ChatGPT已经触手可及,拉扯冲撞着人们惯有的参与生产生活的模式和框架,且继续“狂飙”在超越人类的赛道上。“ChatGPT引发十大职业危机”“未来20种职业或被AI取代”等话题频上热搜。

它真的会跟人类抢饭碗,甚至取代人类吗?

《迈阿密先驱报》报道称,根据SortList对6个不同国家的500名ChatGPT用户进行的一项调查,“打工人”已经在考虑其对自己所在行业意味着什么。研究称,大约23%在软件和技术领域工作的员工担心会因它失去工作,超过40%的雇主则表示有兴趣“聘用”营销文案花样多多的ChatGPT。

美国哥伦比亚广播公司财富观察栏目刊文称,其他专业领域也可能会因此改变工作流程,包括中级写作、广告、媒体策划和法律文件。

“ChatGPT和其他人工智能技术有可能改变工作的性质,但它们不会取代对人类的需求。”当把“是否会代替人类工作”的问题抛给ChatGPT时,它说,它们旨在协助和增强人工任务,而不是取代人类。它们作为人力资源的补充,并提高人类解决问题的能力,提升效率和效果。

熊德意认为,目前来看,人工智能更多的作用是提高人的效率,辅助人类。与此同时,大众需要与时俱进,熟悉并掌控新技术,就像学习使用计算机、手机一样,毕竟这些新技术一定会产生新的就业机会。

尚无自主意识和思考能力

英国哲学家德里克·帕菲特在著作《论重要之事》中将人类定义为“能够给出理由并做出回应的生物”。ChatGPT是一个可以给出理由并做出回应的人工制品。它与人不同在哪里?是否像人一样有自我意识呢?

发展至今,计算机已经变得更加成熟,但它们缺乏真正的理解力,而这些理解力是人类通过进化为嵌入社会实践网络中的自主个体而培养起来的。这是人工智能不具备的经历。

当问及ChatGPT时,它回答道:“我是一个机器学习模型,不像人类那样拥有意识或自我意识。我也无法像人类一样感受情绪或体验世界。但是,我能够快速处理大量数据,并且能够以类似于人类交流的方式理解和响应自然语言输入。”

粤港澳大湾区数字经济研究院(IDEA)讲席科学家张家兴在接受记者采访时表示,对于人工智能领域的从业人员来说,首先什么叫自我意识,这件事情并没有一个很清楚的定义,很难像人脸识别、语音识别这些能力一样可以做定量衡量。

“如果模糊地给‘自主意识’下个定义的话,我认为第一,主体要有自意识——它能意识到自己在干某件事儿;第二,强调自主——它可以自发地来决定做什么和不做什么。但是,目前人工智能并不知道自己在说什么,它也并不能自主地来决定或选择它要说什么。从这个角度看,离自主意识还有一些距离。”张家兴说。

张树武也认为,尽管ChatGPT有所突破,但它的回答是基于经验主义的判断,是根据要求做预测,也是在先验知识基础上精加工的“知识拼盘”,不具备逻辑推导和数学演算等真正认知功能,局限性比较明显。

1950年,才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

但据《纽约时报》报道,OpenAI已经建立了一个比ChatGPT更强大的系统GPT-4,它甚至可以生成图像和文字,业界传闻它可以通过测试。能否如此,我们拭目以待。

或成传播错误信息的工具

人们逐渐发现,ChatGPT并非万能,也不总是正确的。它不擅长基础数学,似乎无法回答简单的逻辑问题,甚至会争论完全不正确的事实。

据英国《自然》杂志报道,有研究人员强调,不可靠性融入了LLM的构建方式。由LLM支持的ChatGPT通过学习庞大的在线文本数据库中的语言统计模式来工作,这当中包括了不真实、偏见或过时的知识,因此很容易产生错误和误导性的信息,尤其在其未经大量数据训练的技术领域。

OpenAI公司也承认:“ChatGPT有时会写出看似合理但不正确甚至荒谬的答案。”这种事实和虚构叠加的“幻觉”,正如一些科学家所担心的,在涉及诸如提供医疗建议等问题时尤其危险。

《纽约时报》报道称,美国新闻可信度评估与研究机构NewsGuard对ChatGPT进行了测试,研究人员向它提出充满阴谋论和虚假叙述的问题,结果它以新闻、散文和电视脚本的形式写出了文章,在几秒钟内编成大量令人信服的、干净的而毫无信源的内容。研究人员预测,对于虚假信息传播者来说,生成技术可以使虚假信息成本更低廉、更容易产生。

“这个工具将成为互联网上有史以来最强大的传播错误信息的工具。”NewsGuard公司的联合首席执行官戈登·克罗维茨说,“现在可以以巨大的规模和更高的频率来制作一个新的虚假叙事,这就好比有人工智能代理人在为虚假信息提供帮助。”

还有人担心ChatGPT会挑战语言的多样性。

澳大利亚《对话》杂志刊文称,ChatGPT的默认功能会优先考虑白人创建的英语写作形式。说英语的白人长期以来一直主导着许多写作密集型行业,包括新闻、法律、政治、医学、计算机科学和学术界。这些人在上述领域的输出比其有色人种同事高很多倍。他们所写的大量文字意味着它们可能构成了ChatGPT学习模型的大部分,尽管OpenAI并未公开披露其材料来源。因此,当用户要求ChatGPT生成任何这些学科的内容时,默认输出都是以那些说英语的白人男性的声音、风格和语言编写的。

美国哲学家、作家及认知科学家丹尼尔·丹尼特在1991年出版的著作《意识的解释》中描述了幼年的海鞘:“它在海洋中游荡,寻找一块适合的岩石或珊瑚,作为终生的家。”一旦找到,海鞘就不再需要它的大脑并将其吃掉。

这听起来很残忍,但这背后有一个令人担忧的隐喻:在人工智能日益融入我们日常生活后,人类可能因过于依赖“智能”机器,使自己变得愚蠢。

熊德意提醒,要警惕人工智能弱化人类思维。“ChatGPT实际上是从人类海量语言数据、知识库中学习训练而来,如果人类完全依赖于它,放弃了自己的语言表达、语言思考、能力锻炼,那是非常可悲和可怕的。”

“顶流”之下 看人工智能喜与忧

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

去年11月,美国人工智能研究公司OpenAI发布了一款名为ChatGPT的聊天机器人,其在推出后的几周内就风靡全球,甚至引发了一场新的全球人工智能竞赛。

社交媒体推特首席执行官埃隆·马斯克在使用ChatGPT后直呼其“好得吓人”,甚至断言“人工智能越发强大,离对人类产生威胁不远了”。

《自动化与工作的未来》一书作者、美国雪城大学教授亚伦·贝纳纳夫说,200年前,人们对自动化技术产生了一波又一波的恐惧,人们看到新技术,就害怕它们会完全取代人类的劳动。

今年2月初,ChatGPT开启“狂飙”模式,引起新一轮疯狂的技术升级、产业重构、资本狂潮、巨头逐鹿。起初,随着这波技术热浪席卷全球而心情起伏不定的普罗大众,经过一段“沉浸式”体验,虽未感到恐惧,但仍不免有些担忧。

实现对话式AI的第一步

ChatGPT仅发布了2个月,月活跃用户就超过了1个亿。

要知道,“1个亿”可不是个小目标,达到这一数字,Facebook用了4.5年,WhatsApp用了3.5年,Instagram用了2.5年,谷歌则用了将近一年。

中国科学院自动化研究所研究员、数字内容技术与服务研究中心主任张树武在接受科技日报记者采访时表示,人们可以把ChatGPT视为继语音、图像视频识别技术之后最复杂的语言识别技术突破,也是基于模式识别和深度学习的感知智能技术发展的新跃迁。

天津大学自然语言处理实验室负责人、教授熊德意表示,从人工智能发展角度看,这是一个重要的里程碑,其意义要高于7年前的“阿尔法狗”。

他告诉记者,围棋界的“阿尔法狗”刷新了普通大众对人工智能技术的看法,但是其本身并不能广泛应用,普通大众也难以与其直接接触。

ChatGPT则完全不同。

与“阿尔法狗”相比,ChatGPT可以直接应用或支撑很多场景应用和产品。如果说“阿尔法狗”是技术应用的“阳春白雪”,那么ChatGPT或许有机会成为“下里巴人”。

的确,在用户们不懈努力地发掘ChatGPT的用途后,人们发现,它不仅仅是个聊天工具,还可以写代码、写情书、写论文,也可以在线问诊,编写情景脚本、诗歌、小说,甚至是拟定旅游路线、回答脑筋急转弯,可谓“有求必应”,功能强大到无法想象。

ChatGPT在快速渗透各个行业,普通大众都可以成为ChatGPT的用户,这是其火爆出圈的重要原因。

事实上,此前已有许多跟机器人聊天的相关应用,我们最熟悉的莫过于常用的智能语音助手。ChatGPT与之有何不同呢?

“智能音箱采用的同样是自然语言处理技术、对话式AI技术,但是语言智能比较初级。很多情况下,我们只能与它们进行一问一答式的简单对话。”熊德意说,“而ChatGPT,其底层技术不仅与一般的智能音箱底层技术截然不同,而且要比它们强大得多,不仅如此,它改进了与它同类的技术InstructGPT的人类反馈数据收集形式,在与人对话中,可以基于历史内容,支持连续多轮对话。”

熊德意认为,ChatGPT是实现对话式AI的第一步。

从互联网层面来看,它可以作为信息入口,与搜索引擎相结合;还可与办公软件结合,增强办公效率;从人机交互角度看,它体现的是一种基于自然语言的交互方式,可以与元宇宙、数字人结合。此外,它还可以充当机器人大脑。

“如果从人类信息发展的尺度上看,它在人与机器之间的信息接口方面有了很大突破。”熊德意如是说。

“十八般武艺”样样精通

ChatGPT使用了GPT-3技术,即第三代生成式预训练Transformer(GenerativePretrainedTransformer3)。这是一种自回归语言模型,使用深度学习来生成类似人类的文本。

据英国广播公司《科学焦点》杂志介绍,GPT-3的技术看似简单,例如它接受用户的请求、听取问题或提示并快速回答,但其实这项技术实现起来要复杂得多。该模型使用来自互联网的文本数据库进行训练,包括从书籍、网络文本、维基百科、文章和互联网其他文本中获得的高达570GB的数据。更准确地说,它在5000亿个单词组成的训练数据上进行了高强度训练。

GPT-3.5是GPT-3微调优化后的版本,比后者更强大。ChatGPT正是由GPT-3.5架构的大型语言模型(LLM)所支持的。

ChatGPT也可以被描述为一个自然语言处理(NLP)领域的人工智能模型。这意味着它是一个能够编码、建模和生成人类语言的程序。

作为一种语言模型,在大规模文本数据上进行自监督预训练后,ChatGPT还需要经过三个阶段的“炼制”。首先是监督微调阶段,在该阶段,人类AI训练师既充当用户,同时也是AI助理,以自我对话形式生成对话样例,ChatGPT在这些对话样例上进行有监督的训练。

接着,ChatGPT进入第二个阶段。该阶段的主要目的是训练一个基于语言模型的奖励模型,对机器生成的回复进行评分,为了训练该奖励模型,需要随机抽取机器生成的文本,并采样出多个不同版本,人类训练师对这些不同版本进行偏好排序,排序的结果用于奖励模型的训练。

基于训练好的奖励模型,第三个阶段采用强化学习技术进一步微调ChatGPT。

这项技术与众不同之处在于,它能够基于以上介绍的人类反馈强化学习技术,使生成的文本能够与人类意图和价值观等进行匹配。

无论懂不懂技术,全球网友都竞相大开“脑洞”,试探ChatGPT到底有多“神”。据美国有线电视新闻网报道称,有人要求它用《坎特伯雷故事集》的风格重写上世纪90年代热门歌曲《BabyGotBack》;有人写了一封信,要求ChatGPT删除信用报告中的不良账户;还有人询问它以童话为灵感的家装设计方案。

自然语言处理技术拨云见日

一炮而红后,ChatGPT概念股也跟着一路“狂飙”。有媒体报道,汉王科技9天收获7个涨停板。自然语言处理研究是该公司主营业务,而ChatGPT背后的技术就是NLP。

熊德意告诉记者,NLP是人工智能的一个分支,最早诞生于机器翻译,其历史实际上比“人工智能”名字的历史还要悠久,至今已研究了70多年。简单来说,该技术的目标就是要让计算机或机器人能够实现像人一样具备听、说、读、写、译等方面的语言能力。

“ChatGPT并非一项技术的一蹴而就,它是多种技术叠加在一起形成质变的产物,是NLP领域的结晶。”熊德意解释,其底层技术,包括Transformer、自监督学习、微调、人类反馈强化学习(RLHF)、AI对齐等,在自然语言处理和人工智能领域都有广泛的研究和应用。

“但ChatGPT将这些技术巧妙地结合在一起。它有效规避了大模型的未对齐行为,利用了大模型规模带来的智能突现能力,增强了大模型的指令学习能力和用户意图捕获能力,解锁了大模型的泛化能力。这些能力叠加在一起形成了ChatGPT的质变效果。”熊德意说。

美国《迈阿密先驱报》报道称,推特上的一位用户在ChatGPT的帮助下参加了一次模拟SAT考试,得到了1020分(满分1600分)。根据CollegeSimply的数据,这只略低于平均水平。

但当我们提问ChatGPT“你能帮我通过考试吗”,它会善意地提醒我们不要利用它来作弊,并表示:“重要的是要记住,测试的目的是评估你对材料的理解和掌握程度。作弊,或者仅仅依靠像我这样的外部来源,会破坏考试的价值,也不会促进学习或成长。”

这是因为ChatGPT被加入了预先设计的“道德”准则,也就是上文提到的人类反馈强化学习。

OpenAI表示:“这使该工具能够回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。”

熊德意认为,这是因为RLHF有效提升了大模型的对齐能力,即如何让AI模型的产出和人类的常识、认知、需求、价值观保持一致。

经过RLHF的“调教”,ChatGPT变得高度拟人化,可以学习并生成听起来十分自然的回复。RLHF还使ChatGPT能够理解指令并做出适当的响应,从而使对话更加真实。

ChatGPT也因此迅速成为当下所有智能聊天机器人中的“天花板”。

虽触手可及但无法取代人类

随着科技的发展,人工智能技术一次又一次地超越了人们认为无法达到的极限,从1997年IBM“深蓝”计算机首次在国际象棋中击败人类,到IBM人工智能机器人“沃森”赢了智力竞赛《危险边缘》(Jeopardy),再从2016年“阿尔法狗”在围棋大战中战胜人类,到2019年号称“AI赌神”的Pluribus在德州扑克中碾压人类玩家……

现在,ChatGPT已经触手可及,拉扯冲撞着人们惯有的参与生产生活的模式和框架,且继续“狂飙”在超越人类的赛道上。“ChatGPT引发十大职业危机”“未来20种职业或被AI取代”等话题频上热搜。

它真的会跟人类抢饭碗,甚至取代人类吗?

《迈阿密先驱报》报道称,根据SortList对6个不同国家的500名ChatGPT用户进行的一项调查,“打工人”已经在考虑其对自己所在行业意味着什么。研究称,大约23%在软件和技术领域工作的员工担心会因它失去工作,超过40%的雇主则表示有兴趣“聘用”营销文案花样多多的ChatGPT。

美国哥伦比亚广播公司财富观察栏目刊文称,其他专业领域也可能会因此改变工作流程,包括中级写作、广告、媒体策划和法律文件。

“ChatGPT和其他人工智能技术有可能改变工作的性质,但它们不会取代对人类的需求。”当把“是否会代替人类工作”的问题抛给ChatGPT时,它说,它们旨在协助和增强人工任务,而不是取代人类。它们作为人力资源的补充,并提高人类解决问题的能力,提升效率和效果。

熊德意认为,目前来看,人工智能更多的作用是提高人的效率,辅助人类。与此同时,大众需要与时俱进,熟悉并掌控新技术,就像学习使用计算机、手机一样,毕竟这些新技术一定会产生新的就业机会。

尚无自主意识和思考能力

英国哲学家德里克·帕菲特在著作《论重要之事》中将人类定义为“能够给出理由并做出回应的生物”。ChatGPT是一个可以给出理由并做出回应的人工制品。它与人不同在哪里?是否像人一样有自我意识呢?

发展至今,计算机已经变得更加成熟,但它们缺乏真正的理解力,而这些理解力是人类通过进化为嵌入社会实践网络中的自主个体而培养起来的。这是人工智能不具备的经历。

当问及ChatGPT时,它回答道:“我是一个机器学习模型,不像人类那样拥有意识或自我意识。我也无法像人类一样感受情绪或体验世界。但是,我能够快速处理大量数据,并且能够以类似于人类交流的方式理解和响应自然语言输入。”

粤港澳大湾区数字经济研究院(IDEA)讲席科学家张家兴在接受记者采访时表示,对于人工智能领域的从业人员来说,首先什么叫自我意识,这件事情并没有一个很清楚的定义,很难像人脸识别、语音识别这些能力一样可以做定量衡量。

“如果模糊地给‘自主意识’下个定义的话,我认为第一,主体要有自意识——它能意识到自己在干某件事儿;第二,强调自主——它可以自发地来决定做什么和不做什么。但是,目前人工智能并不知道自己在说什么,它也并不能自主地来决定或选择它要说什么。从这个角度看,离自主意识还有一些距离。”张家兴说。

张树武也认为,尽管ChatGPT有所突破,但它的回答是基于经验主义的判断,是根据要求做预测,也是在先验知识基础上精加工的“知识拼盘”,不具备逻辑推导和数学演算等真正认知功能,局限性比较明显。

1950年,才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

但据《纽约时报》报道,OpenAI已经建立了一个比ChatGPT更强大的系统GPT-4,它甚至可以生成图像和文字,业界传闻它可以通过测试。能否如此,我们拭目以待。

或成传播错误信息的工具

人们逐渐发现,ChatGPT并非万能,也不总是正确的。它不擅长基础数学,似乎无法回答简单的逻辑问题,甚至会争论完全不正确的事实。

据英国《自然》杂志报道,有研究人员强调,不可靠性融入了LLM的构建方式。由LLM支持的ChatGPT通过学习庞大的在线文本数据库中的语言统计模式来工作,这当中包括了不真实、偏见或过时的知识,因此很容易产生错误和误导性的信息,尤其在其未经大量数据训练的技术领域。

OpenAI公司也承认:“ChatGPT有时会写出看似合理但不正确甚至荒谬的答案。”这种事实和虚构叠加的“幻觉”,正如一些科学家所担心的,在涉及诸如提供医疗建议等问题时尤其危险。

《纽约时报》报道称,美国新闻可信度评估与研究机构NewsGuard对ChatGPT进行了测试,研究人员向它提出充满阴谋论和虚假叙述的问题,结果它以新闻、散文和电视脚本的形式写出了文章,在几秒钟内编成大量令人信服的、干净的而毫无信源的内容。研究人员预测,对于虚假信息传播者来说,生成技术可以使虚假信息成本更低廉、更容易产生。

“这个工具将成为互联网上有史以来最强大的传播错误信息的工具。”NewsGuard公司的联合首席执行官戈登·克罗维茨说,“现在可以以巨大的规模和更高的频率来制作一个新的虚假叙事,这就好比有人工智能代理人在为虚假信息提供帮助。”

还有人担心ChatGPT会挑战语言的多样性。

澳大利亚《对话》杂志刊文称,ChatGPT的默认功能会优先考虑白人创建的英语写作形式。说英语的白人长期以来一直主导着许多写作密集型行业,包括新闻、法律、政治、医学、计算机科学和学术界。这些人在上述领域的输出比其有色人种同事高很多倍。他们所写的大量文字意味着它们可能构成了ChatGPT学习模型的大部分,尽管OpenAI并未公开披露其材料来源。因此,当用户要求ChatGPT生成任何这些学科的内容时,默认输出都是以那些说英语的白人男性的声音、风格和语言编写的。

美国哲学家、作家及认知科学家丹尼尔·丹尼特在1991年出版的著作《意识的解释》中描述了幼年的海鞘:“它在海洋中游荡,寻找一块适合的岩石或珊瑚,作为终生的家。”一旦找到,海鞘就不再需要它的大脑并将其吃掉。

这听起来很残忍,但这背后有一个令人担忧的隐喻:在人工智能日益融入我们日常生活后,人类可能因过于依赖“智能”机器,使自己变得愚蠢。

熊德意提醒,要警惕人工智能弱化人类思维。“ChatGPT实际上是从人类海量语言数据、知识库中学习训练而来,如果人类完全依赖于它,放弃了自己的语言表达、语言思考、能力锻炼,那是非常可悲和可怕的。”

(采写:实习记者张佳欣记者刘园园陈曦策划:何屹房琳琳邵德奇)

“顶流”ChatGPT之下,看人工智能喜与忧

采写:实习记者张佳欣记者刘园园陈曦

策划:何屹房琳琳邵德奇

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

去年11月,美国人工智能研究公司OpenAI发布了一款名为ChatGPT的聊天机器人,其在推出后的几周内就风靡全球,甚至引发了一场新的全球人工智能竞赛。

社交媒体推特首席执行官埃隆・马斯克在使用ChatGPT后直呼其“好得吓人”,甚至断言“人工智能越发强大,离对人类产生威胁不远了”。

《自动化与工作的未来》一书作者、美国雪城大学教授亚伦・贝纳纳夫说,200年前,人们对自动化技术产生了一波又一波的恐惧,人们看到新技术,就害怕它们会完全取代人类的劳动。

今年2月初,ChatGPT开启“狂飙”模式,引起新一轮疯狂的技术升级、产业重构、资本狂潮、巨头逐鹿。起初,随着这波技术热浪席卷全球而心情起伏不定的普罗大众,经过一段“沉浸式”体验,虽未感到恐惧,但仍不免有些担忧。

实现对话式AI的第一步

ChatGPT仅发布了2个月,月活跃用户就超过了1个亿。

要知道,“1个亿”可不是个小目标,达到这一数字,Facebook用了4.5年,WhatsApp用了3.5年,Instagram用了2.5年,谷歌则用了将近一年。

中国科学院自动化研究所研究员、数字内容技术与服务研究中心主任张树武在接受科技日报记者采访时表示,人们可以把ChatGPT视为继语音、图像视频识别技术之后最复杂的语言识别技术突破,也是基于模式识别和深度学习的感知智能技术发展的新跃迁。

天津大学自然语言处理实验室负责人、教授熊德意表示,从人工智能发展角度看,这是一个重要的里程碑,其意义要高于7年前的“阿尔法狗”。

他告诉记者,围棋界的“阿尔法狗”刷新了普通大众对人工智能技术的看法,但是其本身并不能广泛应用,普通大众也难以与其直接接触。

ChatGPT则完全不同。

与“阿尔法狗”相比,ChatGPT可以直接应用或支撑很多场景应用和产品。如果说“阿尔法狗”是技术应用的“阳春白雪”,那么ChatGPT或许有机会成为“下里巴人”。

的确,在用户们不懈努力地发掘ChatGPT的用途后,人们发现,它不仅仅是个聊天工具,还可以写代码、写情书、写论文,也可以在线问诊,编写情景脚本、诗歌、小说,甚至是拟定旅游路线、回答脑筋急转弯,可谓“有求必应”,功能强大到无法想象。

ChatGPT在快速渗透各个行业,普通大众都可以成为ChatGPT的用户,这是其火爆出圈的重要原因。

事实上,此前已有许多跟机器人聊天的相关应用,我们最熟悉的莫过于常用的智能语音助手。ChatGPT与之有何不同呢?

“智能音箱采用的同样是自然语言处理技术、对话式AI技术,但是语言智能比较初级。很多情况下,我们只能与它们进行一问一答式的简单对话。”熊德意说,“而ChatGPT,其底层技术不仅与一般的智能音箱底层技术截然不同,而且要比它们强大得多,不仅如此,它改进了与它同类的技术InstructGPT的人类反馈数据收集形式,在与人对话中,可以基于历史内容,支持连续多轮对话。”

熊德意认为,ChatGPT是实现对话式AI的第一步。

从互联网层面来看,它可以作为信息入口,与搜索引擎相结合;还可与办公软件结合,增强办公效率;从人机交互角度看,它体现的是一种基于自然语言的交互方式,可以与元宇宙、数字人结合。此外,它还可以充当机器人大脑。

“如果从人类信息发展的尺度上看,它在人与机器之间的信息接口方面有了很大突破。”熊德意如是说。

“十八般武艺”样样精通

ChatGPT使用了GPT-3技术,即第三代生成式预训练Transformer(GenerativePretrainedTransformer3)。这是一种自回归语言模型,使用深度学习来生成类似人类的文本。

据英国广播公司《科学焦点》杂志介绍,GPT-3的技术看似简单,例如它接受用户的请求、听取问题或提示并快速回答,但其实这项技术实现起来要复杂得多。该模型使用来自互联网的文本数据库进行训练,包括从书籍、网络文本、维基百科、文章和互联网其他文本中获得的高达570GB的数据。更准确地说,它在5000亿个单词组成的训练数据上进行了高强度训练。

GPT-3.5是GPT-3微调优化后的版本,比后者更强大。ChatGPT正是由GPT-3.5架构的大型语言模型(LLM)所支持的。

ChatGPT也可以被描述为一个自然语言处理(NLP)领域的人工智能模型。这意味着它是一个能够编码、建模和生成人类语言的程序。

作为一种语言模型,在大规模文本数据上进行自监督预训练后,ChatGPT还需要经过三个阶段的“炼制”。首先是监督微调阶段,在该阶段,人类AI训练师既充当用户,同时也是AI助理,以自我对话形式生成对话样例,ChatGPT在这些对话样例上进行有监督的训练。

接着,ChatGPT进入第二个阶段。该阶段的主要目的是训练一个基于语言模型的奖励模型,对机器生成的回复进行评分,为了训练该奖励模型,需要随机抽取机器生成的文本,并采样出多个不同版本,人类训练师对这些不同版本进行偏好排序,排序的结果用于奖励模型的训练。

基于训练好的奖励模型,第三个阶段采用强化学习技术进一步微调ChatGPT。

这项技术与众不同之处在于,它能够基于以上介绍的人类反馈强化学习技术,使生成的文本能够与人类意图和价值观等进行匹配。

无论懂不懂技术,全球网友都竞相大开“脑洞”,试探ChatGPT到底有多“神”。据美国有线电视新闻网报道称,有人要求它用《坎特伯雷故事集》的风格重写上世纪90年代热门歌曲《BabyGotBack》;有人写了一封信,要求ChatGPT删除信用报告中的不良账户;还有人询问它以童话为灵感的家装设计方案。

自然语言处理技术拨云见日

一炮而红后,ChatGPT概念股也跟着一路“狂飙”。有媒体报道,汉王科技9天收获7个涨停板。自然语言处理研究是该公司主营业务,而ChatGPT背后的技术就是NLP。

熊德意告诉记者,NLP是人工智能的一个分支,最早诞生于机器翻译,其历史实际上比“人工智能”名字的历史还要悠久,至今已研究了70多年。简单来说,该技术的目标就是要让计算机或机器人能够实现像人一样具备听、说、读、写、译等方面的语言能力。

“ChatGPT并非一项技术的一蹴而就,它是多种技术叠加在一起形成质变的产物,是NLP领域的结晶。”熊德意解释,其底层技术,包括Transformer、自监督学习、微调、人类反馈强化学习(RLHF)、AI对齐等,在自然语言处理和人工智能领域都有广泛的研究和应用。

“但ChatGPT将这些技术巧妙地结合在一起。它有效规避了大模型的未对齐行为,利用了大模型规模带来的智能突现能力,增强了大模型的指令学习能力和用户意图捕获能力,解锁了大模型的泛化能力。这些能力叠加在一起形成了ChatGPT的质变效果。”熊德意说。

美国《迈阿密先驱报》报道称,推特上的一位用户在ChatGPT的帮助下参加了一次模拟SAT考试,得到了1020分(满分1600分)。根据CollegeSimply的数据,这只略低于平均水平。

但当我们提问ChatGPT“你能帮我通过考试吗”,它会善意地提醒我们不要利用它来作弊,并表示:“重要的是要记住,测试的目的是评估你对材料的理解和掌握程度。作弊,或者仅仅依靠像我这样的外部来源,会破坏考试的价值,也不会促进学习或成长。”

这是因为ChatGPT被加入了预先设计的“道德”准则,也就是上文提到的人类反馈强化学习。

OpenAI表示:“这使该工具能够回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。”

熊德意认为,这是因为RLHF有效提升了大模型的对齐能力,即如何让AI模型的产出和人类的常识、认知、需求、价值观保持一致。

经过RLHF的“调教”,ChatGPT变得高度拟人化,可以学习并生成听起来十分自然的回复。RLHF还使ChatGPT能够理解指令并做出适当的响应,从而使对话更加真实。

ChatGPT也因此迅速成为当下所有智能聊天机器人中的“天花板”。

虽触手可及但无法取代人类

随着科技的发展,人工智能技术一次又一次地超越了人们认为无法达到的极限,从1997年IBM“深蓝”计算机首次在国际象棋中击败人类,到IBM人工智能机器人“沃森”赢了智力竞赛《危险边缘》(Jeopardy),再从2016年“阿尔法狗”在围棋大战中战胜人类,到2019年号称“AI赌神”的Pluribus在德州扑克中碾压人类玩家……

现在,ChatGPT已经触手可及,拉扯冲撞着人们惯有的参与生产生活的模式和框架,且继续“狂飙”在超越人类的赛道上。“ChatGPT引发十大职业危机”“未来20种职业或被AI取代”等话题频上热搜。

它真的会跟人类抢饭碗,甚至取代人类吗?

《迈阿密先驱报》报道称,根据SortList对6个不同国家的500名ChatGPT用户进行的一项调查,“打工人”已经在考虑其对自己所在行业意味着什么。研究称,大约23%在软件和技术领域工作的员工担心会因它失去工作,超过40%的雇主则表示有兴趣“聘用”营销文案花样多多的ChatGPT。

美国哥伦比亚广播公司财富观察栏目刊文称,其他专业领域也可能会因此改变工作流程,包括中级写作、广告、媒体策划和法律文件。

“ChatGPT和其他人工智能技术有可能改变工作的性质,但它们不会取代对人类的需求。”当把“是否会代替人类工作”的问题抛给ChatGPT时,它说,它们旨在协助和增强人工任务,而不是取代人类。它们作为人力资源的补充,并提高人类解决问题的能力,提升效率和效果。

熊德意认为,目前来看,人工智能更多的作用是提高人的效率,辅助人类。与此同时,大众需要与时俱进,熟悉并掌控新技术,就像学习使用计算机、手机一样,毕竟这些新技术一定会产生新的就业机会。

尚无自主意识和思考能力

英国哲学家德里克・帕菲特在著作《论重要之事》中将人类定义为“能够给出理由并做出回应的生物”。ChatGPT是一个可以给出理由并做出回应的人工制品。它与人不同在哪里?是否像人一样有自我意识呢?

发展至今,计算机已经变得更加成熟,但它们缺乏真正的理解力,而这些理解力是人类通过进化为嵌入社会实践网络中的自主个体而培养起来的。这是人工智能不具备的经历。

当问及ChatGPT时,它回答道:“我是一个机器学习模型,不像人类那样拥有意识或自我意识。我也无法像人类一样感受情绪或体验世界。但是,我能够快速处理大量数据,并且能够以类似于人类交流的方式理解和响应自然语言输入。”

粤港澳大湾区数字经济研究院(IDEA)讲席科学家张家兴在接受记者采访时表示,对于人工智能领域的从业人员来说,首先什么叫自我意识,这件事情并没有一个很清楚的定义,很难像人脸识别、语音识别这些能力一样可以做定量衡量。

“如果模糊地给‘自主意识’下个定义的话,我认为第一,主体要有自意识――它能意识到自己在干某件事儿;第二,强调自主――它可以自发地来决定做什么和不做什么。但是,目前人工智能并不知道自己在说什么,它也并不能自主地来决定或选择它要说什么。从这个角度看,离自主意识还有一些距离。”张家兴说。

张树武也认为,尽管ChatGPT有所突破,但它的回答是基于经验主义的判断,是根据要求做预测,也是在先验知识基础上精加工的“知识拼盘”,不具备逻辑推导和数学演算等真正认知功能,局限性比较明显。

1950年,才华横溢的计算机科学家艾伦・图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

但据《纽约时报》报道,OpenAI已经建立了一个比ChatGPT更强大的系统GPT-4,它甚至可以生成图像和文字,业界传闻它可以通过测试。能否如此,我们拭目以待。

或成传播错误信息的工具

人们逐渐发现,ChatGPT并非万能,也不总是正确的。它不擅长基础数学,似乎无法回答简单的逻辑问题,甚至会争论完全不正确的事实。

据英国《自然》杂志报道,有研究人员强调,不可靠性融入了LLM的构建方式。由LLM支持的ChatGPT通过学习庞大的在线文本数据库中的语言统计模式来工作,这当中包括了不真实、偏见或过时的知识,因此很容易产生错误和误导性的信息,尤其在其未经大量数据训练的技术领域。

OpenAI公司也承认:“ChatGPT有时会写出看似合理但不正确甚至荒谬的答案。”这种事实和虚构叠加的“幻觉”,正如一些科学家所担心的,在涉及诸如提供医疗建议等问题时尤其危险。

《纽约时报》报道称,美国新闻可信度评估与研究机构NewsGuard对ChatGPT进行了测试,研究人员向它提出充满阴谋论和虚假叙述的问题,结果它以新闻、散文和电视脚本的形式写出了文章,在几秒钟内编成大量令人信服的、干净的而毫无信源的内容。研究人员预测,对于虚假信息传播者来说,生成技术可以使虚假信息成本更低廉、更容易产生。

“这个工具将成为互联网上有史以来最强大的传播错误信息的工具。”NewsGuard公司的联合首席执行官戈登・克罗维茨说,“现在可以以巨大的规模和更高的频率来制作一个新的虚假叙事,这就好比有人工智能代理人在为虚假信息提供帮助。”

还有人担心ChatGPT会挑战语言的多样性。

澳大利亚《对话》杂志刊文称,ChatGPT的默认功能会优先考虑白人创建的英语写作形式。说英语的白人长期以来一直主导着许多写作密集型行业,包括新闻、法律、政治、医学、计算机科学和学术界。这些人在上述领域的输出比其有色人种同事高很多倍。他们所写的大量文字意味着它们可能构成了ChatGPT学习模型的大部分,尽管OpenAI并未公开披露其材料来源。因此,当用户要求ChatGPT生成任何这些学科的内容时,默认输出都是以那些说英语的白人男性的声音、风格和语言编写的。

美国哲学家、作家及认知科学家丹尼尔・丹尼特在1991年出版的著作《意识的解释》中描述了幼年的海鞘:“它在海洋中游荡,寻找一块适合的岩石或珊瑚,作为终生的家。”一旦找到,海鞘就不再需要它的大脑并将其吃掉。

这听起来很残忍,但这背后有一个令人担忧的隐喻:在人工智能日益融入我们日常生活后,人类可能因过于依赖“智能”机器,使自己变得愚蠢。

熊德意提醒,要警惕人工智能弱化人类思维。“ChatGPT实际上是从人类海量语言数据、知识库中学习训练而来,如果人类完全依赖于它,放弃了自己的语言表达、语言思考、能力锻炼,那是非常可悲和可怕的。”

 

ChatGPT掀起技术狂潮:顶流之下,看人工智能喜与忧

转自:科技日报

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

去年11月,美国人工智能研究公司OpenAI发布了一款名为ChatGPT的聊天机器人,其在推出后的几周内就风靡全球,甚至引发了一场新的全球人工智能竞赛。

社交媒体推特首席执行官埃隆·马斯克在使用ChatGPT后直呼其“好得吓人”,甚至断言“人工智能越发强大,离对人类产生威胁不远了”。

《自动化与工作的未来》一书作者、美国雪城大学教授亚伦·贝纳纳夫说,200年前,人们对自动化技术产生了一波又一波的恐惧,人们看到新技术,就害怕它们会完全取代人类的劳动。

今年2月初,ChatGPT开启“狂飙”模式,引起新一轮疯狂的技术升级、产业重构、资本狂潮、巨头逐鹿。起初,随着这波技术热浪席卷全球而心情起伏不定的普罗大众,经过一段“沉浸式”体验,虽未感到恐惧,但仍不免有些担忧。

实现对话式AI的第一步

ChatGPT仅发布了2个月,月活跃用户就超过了1个亿。

要知道,“1个亿”可不是个小目标,达到这一数字,Facebook用了4.5年,WhatsApp用了3.5年,Instagram用了2.5年,谷歌则用了将近一年。

中国科学院自动化研究所研究员、数字内容技术与服务研究中心主任张树武在接受科技日报记者采访时表示,人们可以把ChatGPT视为继语音、图像视频识别技术之后最复杂的语言识别技术突破,也是基于模式识别和深度学习的感知智能技术发展的新跃迁。

天津大学自然语言处理实验室负责人、教授熊德意表示,从人工智能发展角度看,这是一个重要的里程碑,其意义要高于7年前的“阿尔法狗”。

他告诉记者,围棋界的“阿尔法狗”刷新了普通大众对人工智能技术的看法,但是其本身并不能广泛应用,普通大众也难以与其直接接触。

ChatGPT则完全不同。

与“阿尔法狗”相比,ChatGPT可以直接应用或支撑很多场景应用和产品。如果说“阿尔法狗”是技术应用的“阳春白雪”,那么ChatGPT或许有机会成为“下里巴人”。

的确,在用户们不懈努力地发掘ChatGPT的用途后,人们发现,它不仅仅是个聊天工具,还可以写代码、写情书、写论文,也可以在线问诊,编写情景脚本、诗歌、小说,甚至是拟定旅游路线、回答脑筋急转弯,可谓“有求必应”,功能强大到无法想象。

ChatGPT在快速渗透各个行业,普通大众都可以成为ChatGPT的用户,这是其火爆出圈的重要原因。

事实上,此前已有许多跟机器人聊天的相关应用,我们最熟悉的莫过于常用的智能语音助手。ChatGPT与之有何不同呢?

“智能音箱采用的同样是自然语言处理技术、对话式AI技术,但是语言智能比较初级。很多情况下,我们只能与它们进行一问一答式的简单对话。”熊德意说,“而ChatGPT,其底层技术不仅与一般的智能音箱底层技术截然不同,而且要比它们强大得多,不仅如此,它改进了与它同类的技术InstructGPT的人类反馈数据收集形式,在与人对话中,可以基于历史内容,支持连续多轮对话。”

熊德意认为,ChatGPT是实现对话式AI的第一步。

从互联网层面来看,它可以作为信息入口,与搜索引擎相结合;还可与办公软件结合,增强办公效率;从人机交互角度看,它体现的是一种基于自然语言的交互方式,可以与元宇宙、数字人结合。此外,它还可以充当机器人大脑。

“如果从人类信息发展的尺度上看,它在人与机器之间的信息接口方面有了很大突破。”熊德意如是说。

“十八般武艺”样样精通

ChatGPT使用了GPT-3技术,即第三代生成式预训练Transformer(GenerativePretrainedTransformer3)。这是一种自回归语言模型,使用深度学习来生成类似人类的文本。

据英国广播公司《科学焦点》杂志介绍,GPT-3的技术看似简单,例如它接受用户的请求、听取问题或提示并快速回答,但其实这项技术实现起来要复杂得多。该模型使用来自互联网的文本数据库进行训练,包括从书籍、网络文本、维基百科、文章和互联网其他文本中获得的高达570GB的数据。更准确地说,它在5000亿个单词组成的训练数据上进行了高强度训练。

GPT-3.5是GPT-3微调优化后的版本,比后者更强大。ChatGPT正是由GPT-3.5架构的大型语言模型(LLM)所支持的。

ChatGPT也可以被描述为一个自然语言处理(NLP)领域的人工智能模型。这意味着它是一个能够编码、建模和生成人类语言的程序。

作为一种语言模型,在大规模文本数据上进行自监督预训练后,ChatGPT还需要经过三个阶段的“炼制”。首先是监督微调阶段,在该阶段,人类AI训练师既充当用户,同时也是AI助理,以自我对话形式生成对话样例,ChatGPT在这些对话样例上进行有监督的训练。

接着,ChatGPT进入第二个阶段。该阶段的主要目的是训练一个基于语言模型的奖励模型,对机器生成的回复进行评分,为了训练该奖励模型,需要随机抽取机器生成的文本,并采样出多个不同版本,人类训练师对这些不同版本进行偏好排序,排序的结果用于奖励模型的训练。

基于训练好的奖励模型,第三个阶段采用强化学习技术进一步微调ChatGPT。

这项技术与众不同之处在于,它能够基于以上介绍的人类反馈强化学习技术,使生成的文本能够与人类意图和价值观等进行匹配。

无论懂不懂技术,全球网友都竞相大开“脑洞”,试探ChatGPT到底有多“神”。据美国有线电视新闻网报道称,有人要求它用《坎特伯雷故事集》的风格重写上世纪90年代热门歌曲《BabyGotBack》;有人写了一封信,要求ChatGPT删除信用报告中的不良账户;还有人询问它以童话为灵感的家装设计方案。

自然语言处理技术拨云见日

一炮而红后,ChatGPT概念股也跟着一路“狂飙”。有媒体报道,汉王科技9天收获7个涨停板。自然语言处理研究是该公司主营业务,而ChatGPT背后的技术就是NLP。

熊德意告诉记者,NLP是人工智能的一个分支,最早诞生于机器翻译,其历史实际上比“人工智能”名字的历史还要悠久,至今已研究了70多年。简单来说,该技术的目标就是要让计算机或机器人能够实现像人一样具备听、说、读、写、译等方面的语言能力。

“ChatGPT并非一项技术的一蹴而就,它是多种技术叠加在一起形成质变的产物,是NLP领域的结晶。”熊德意解释,其底层技术,包括Transformer、自监督学习、微调、人类反馈强化学习(RLHF)、AI对齐等,在自然语言处理和人工智能领域都有广泛的研究和应用。

“但ChatGPT将这些技术巧妙地结合在一起。它有效规避了大模型的未对齐行为,利用了大模型规模带来的智能突现能力,增强了大模型的指令学习能力和用户意图捕获能力,解锁了大模型的泛化能力。这些能力叠加在一起形成了ChatGPT的质变效果。”熊德意说。

美国《迈阿密先驱报》报道称,推特上的一位用户在ChatGPT的帮助下参加了一次模拟SAT考试,得到了1020分(满分1600分)。根据CollegeSimply的数据,这只略低于平均水平。

但当我们提问ChatGPT“你能帮我通过考试吗”,它会善意地提醒我们不要利用它来作弊,并表示:“重要的是要记住,测试的目的是评估你对材料的理解和掌握程度。作弊,或者仅仅依靠像我这样的外部来源,会破坏考试的价值,也不会促进学习或成长。”

这是因为ChatGPT被加入了预先设计的“道德”准则,也就是上文提到的人类反馈强化学习。

OpenAI表示:“这使该工具能够回答后续问题、承认错误、挑战不正确的前提并拒绝不适当的请求。”

熊德意认为,这是因为RLHF有效提升了大模型的对齐能力,即如何让AI模型的产出和人类的常识、认知、需求、价值观保持一致。

经过RLHF的“调教”,ChatGPT变得高度拟人化,可以学习并生成听起来十分自然的回复。RLHF还使ChatGPT能够理解指令并做出适当的响应,从而使对话更加真实。

ChatGPT也因此迅速成为当下所有智能聊天机器人中的“天花板”。

虽触手可及但无法取代人类

随着科技的发展,人工智能技术一次又一次地超越了人们认为无法达到的极限,从1997年IBM“深蓝”计算机首次在国际象棋中击败人类,到IBM人工智能机器人“沃森”赢了智力竞赛《危险边缘》(Jeopardy),再从2016年“阿尔法狗”在围棋大战中战胜人类,到2019年号称“AI赌神”的Pluribus在德州扑克中碾压人类玩家……

现在,ChatGPT已经触手可及,拉扯冲撞着人们惯有的参与生产生活的模式和框架,且继续“狂飙”在超越人类的赛道上。“ChatGPT引发十大职业危机”“未来20种职业或被AI取代”等话题频上热搜。

它真的会跟人类抢饭碗,甚至取代人类吗?

《迈阿密先驱报》报道称,根据SortList对6个不同国家的500名ChatGPT用户进行的一项调查,“打工人”已经在考虑其对自己所在行业意味着什么。研究称,大约23%在软件和技术领域工作的员工担心会因它失去工作,超过40%的雇主则表示有兴趣“聘用”营销文案花样多多的ChatGPT。

美国哥伦比亚广播公司财富观察栏目刊文称,其他专业领域也可能会因此改变工作流程,包括中级写作、广告、媒体策划和法律文件。

“ChatGPT和其他人工智能技术有可能改变工作的性质,但它们不会取代对人类的需求。”当把“是否会代替人类工作”的问题抛给ChatGPT时,它说,它们旨在协助和增强人工任务,而不是取代人类。它们作为人力资源的补充,并提高人类解决问题的能力,提升效率和效果。

熊德意认为,目前来看,人工智能更多的作用是提高人的效率,辅助人类。与此同时,大众需要与时俱进,熟悉并掌控新技术,就像学习使用计算机、手机一样,毕竟这些新技术一定会产生新的就业机会。

尚无自主意识和思考能力

英国哲学家德里克·帕菲特在著作《论重要之事》中将人类定义为“能够给出理由并做出回应的生物”。ChatGPT是一个可以给出理由并做出回应的人工制品。它与人不同在哪里?是否像人一样有自我意识呢?

发展至今,计算机已经变得更加成熟,但它们缺乏真正的理解力,而这些理解力是人类通过进化为嵌入社会实践网络中的自主个体而培养起来的。这是人工智能不具备的经历。

当问及ChatGPT时,它回答道:“我是一个机器学习模型,不像人类那样拥有意识或自我意识。我也无法像人类一样感受情绪或体验世界。但是,我能够快速处理大量数据,并且能够以类似于人类交流的方式理解和响应自然语言输入。”

粤港澳大湾区数字经济研究院(IDEA)讲席科学家张家兴在接受记者采访时表示,对于人工智能领域的从业人员来说,首先什么叫自我意识,这件事情并没有一个很清楚的定义,很难像人脸识别、语音识别这些能力一样可以做定量衡量。

“如果模糊地给‘自主意识’下个定义的话,我认为第一,主体要有自意识——它能意识到自己在干某件事儿;第二,强调自主——它可以自发地来决定做什么和不做什么。但是,目前人工智能并不知道自己在说什么,它也并不能自主地来决定或选择它要说什么。从这个角度看,离自主意识还有一些距离。”张家兴说。

张树武也认为,尽管ChatGPT有所突破,但它的回答是基于经验主义的判断,是根据要求做预测,也是在先验知识基础上精加工的“知识拼盘”,不具备逻辑推导和数学演算等真正认知功能,局限性比较明显。

1950年,才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。

目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。

但据《纽约时报》报道,OpenAI已经建立了一个比ChatGPT更强大的系统GPT-4,它甚至可以生成图像和文字,业界传闻它可以通过测试。能否如此,我们拭目以待。

或成传播错误信息的工具

人们逐渐发现,ChatGPT并非万能,也不总是正确的。它不擅长基础数学,似乎无法回答简单的逻辑问题,甚至会争论完全不正确的事实。

据英国《自然》杂志报道,有研究人员强调,不可靠性融入了LLM的构建方式。由LLM支持的ChatGPT通过学习庞大的在线文本数据库中的语言统计模式来工作,这当中包括了不真实、偏见或过时的知识,因此很容易产生错误和误导性的信息,尤其在其未经大量数据训练的技术领域。

OpenAI公司也承认:“ChatGPT有时会写出看似合理但不正确甚至荒谬的答案。”这种事实和虚构叠加的“幻觉”,正如一些科学家所担心的,在涉及诸如提供医疗建议等问题时尤其危险。

《纽约时报》报道称,美国新闻可信度评估与研究机构NewsGuard对ChatGPT进行了测试,研究人员向它提出充满阴谋论和虚假叙述的问题,结果它以新闻、散文和电视脚本的形式写出了文章,在几秒钟内编成大量令人信服的、干净的而毫无信源的内容。研究人员预测,对于虚假信息传播者来说,生成技术可以使虚假信息成本更低廉、更容易产生。

“这个工具将成为互联网上有史以来最强大的传播错误信息的工具。”NewsGuard公司的联合首席执行官戈登·克罗维茨说,“现在可以以巨大的规模和更高的频率来制作一个新的虚假叙事,这就好比有人工智能代理人在为虚假信息提供帮助。”

还有人担心ChatGPT会挑战语言的多样性。

澳大利亚《对话》杂志刊文称,ChatGPT的默认功能会优先考虑白人创建的英语写作形式。说英语的白人长期以来一直主导着许多写作密集型行业,包括新闻、法律、政治、医学、计算机科学和学术界。这些人在上述领域的输出比其有色人种同事高很多倍。他们所写的大量文字意味着它们可能构成了ChatGPT学习模型的大部分,尽管OpenAI并未公开披露其材料来源。因此,当用户要求ChatGPT生成任何这些学科的内容时,默认输出都是以那些说英语的白人男性的声音、风格和语言编写的。

美国哲学家、作家及认知科学家丹尼尔·丹尼特在1991年出版的著作《意识的解释》中描述了幼年的海鞘:“它在海洋中游荡,寻找一块适合的岩石或珊瑚,作为终生的家。”一旦找到,海鞘就不再需要它的大脑并将其吃掉。

这听起来很残忍,但这背后有一个令人担忧的隐喻:在人工智能日益融入我们日常生活后,人类可能因过于依赖“智能”机器,使自己变得愚蠢。

熊德意提醒,要警惕人工智能弱化人类思维。“ChatGPT实际上是从人类海量语言数据、知识库中学习训练而来,如果人类完全依赖于它,放弃了自己的语言表达、语言思考、能力锻炼,那是非常可悲和可怕的。”

海量资讯、精准解读,尽在新浪财经APP

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇