智商超过999%人类,ChatGPT到底有多聪明
0分享至图片来源@视觉中国文|追问NextQuestion,作者|EkaRoivainen,编译|梓葳在过去的两个月,ChatGPT引起了学术界、科技界、传媒界的疯狂讨论。这个号称地表最强的“人工智能聊天机器人”只花了5天时间,用户就突破了100万,成为世界上达到百万用户数最快的应用。ChatGPT,不仅能跟你对话,还能完成撰写邮件、视频脚本、文案、翻译等一系列基础工作,涉及历史、科技、文化等诸多领域,甚至还能写诗、写论文、编代码、改bug、求医问药等,一部分人不禁开始为人类终将要被人工智能取代而恐慌。那么,如今大火的ChatGPT是否具有与人类相当的智商与心智水平?EkaRoivainen是一名来自芬兰奥卢大学附属医院的评估心理学家,他的研究方向包括认知和人格心理学以及心理测试的有效性。在了解到ChatGPT所拥有的多种人类技能后,Roivainen不禁好奇:以人类的标准看待,ChatGPT究竟有多聪明?超越99.9%的人类:ChatGPT表现出超高智商
于是,Roivainen开始着手对ChatGPT进行智商测试。他表示,ChatGPT十分适合作为一个被试,它不仅不会在测试中表现出应试焦虑、注意力不集中或放弃,也不会对智商测试和测试人员产生质疑。Roivainen采用第三版韦氏成人智力量表(theWechsleradultintelligencescale,WAIS)对ChatGPT进行了智商测试。该量表包括6个语言子测试集与5个非语言子测试集,智商测试的最终分数基于所有11个子测试集的分数。平均智商设为100分,测试量表的标准偏差为15分,这意味着最聪明的10%和1%的人的智商分别为120和133。在6个语言测试集中,第六个子测试集为数字广度,它对注意力、短时记忆能力进行评估,由于不能使用文字形式展示给ChatGPT因此没有对ChatGPT进行该测试。他从词汇子测试集开始对ChatGPT进行智商测验。由于ChatGPT接受了大量在线文本的训练,Roivainen预计该测试对ChatGPT来说应该是比较容易的(词汇测试集对单词、语言概念的形成进行测试)。不出所料,ChatGPT表现很好,它给出的答案通常非常详细和全面,甚至超出了测试手册中给出的正确答案的标准。在知识和相似性子测试集中ChatGPT也表现良好,达到了最高分(知识子测试集是对常识的测试,反映了求知欲、教育水平以及学习和记忆事实的能力)。相似性子测试集测试抽象推理和概念形成能力。在这个子测试中,聊天机器人倾向于给出非常详细、复杂的答案。在算术子测试集中,ChatGPT正确回答了所有提供的算术问题,包括取均值等。综合5个语言子测试集的分数后得出,ChatGPT的语言智商为155,高于构成美国WAISIII标准化样本的2450人中的99.9%。由于ChatGPT缺乏必要的眼睛、耳朵和手,它无法参加WAIS的非语言子测试集的测试。但是在标准化样本中,语言智商和全面智商量表高度相关,所以ChatGPT从任何人类标准来看都非常聪明。在WAIS标准化样本中,受过大学教育的美国人的平均语言智商为113,5%的人得分为132或更高。Roivainen表示自己在大学时测试的言语智商结果没有达到ChatGPT的水平。高智商的ChatGPT仍旧会失败
那么,临床心理学家和其他专业人士的工作会受到人工智能的威胁吗?尽管ChatGPT智商很高,但在需要真正的人类推理或对物理和社会世界的理解的任务中,它却以失败而闻名。ChatGPT很容易在一些明显的谜题上失败,比如:提问:“塞巴斯蒂安孩子的父亲的名字是什么?”ChatGPT:很抱歉,我无法回答这个问题,因为我没有足够的背景来确定你指的是哪个塞巴斯蒂安。ChatGPT似乎没有逻辑推理,而是试图依赖其庞大的网络文本中提到的“塞巴斯蒂安”事实数据库。“智商是智商测试所衡量的。”是一个经典的智商定义,它源自1923年认知心理学先驱EdwinBoring的一篇文章。这一定义是基于这样一种观察,即看似不同任务的技能其实是高度相关的,如解决谜题、定义单词、记忆数字和发现图片中缺失的项目之间具有高度相关性。因子分析法的发明者CharlesSpearman在1904年得出结论,智商的一般因子,即g因子,必须作为人类不同认知技能测量的一致性的基础。像WAIS这样的智商测试就是基于这个假设。然而,ChatGPT的高语言智商与在一些问题中的失利,意味着Boring有关智商的定义不能够完全衡量人工智能的智商水平,表明智商的某些方面不能仅通过智商测试来衡量。ChatGPT是一个自然语言处理模型,它的智商不同于人类智商,因为它并不具备类似人类的情感、道德、价值观等因素。ChatGPT通过模拟人类语言的模式,能够进行文本生成、语言理解、问答等任务,能够在某些情况下表现出令人印象深刻的“智能”和“理解力”。此外,ChatGPT的表现也取决于其所接收的训练数据和训练算法等多种因素,它并不具备自主思考的能力。将ChatGPT的“智商”与人类进行比较是一种不恰当的类比。因此,为了适应不断变化的技术和社会环境,对智商概念进行适当的拓宽和扩展是很重要的。对于动物和人工智能等非人类主体的智商,也需要采用适当的评估方法,并严谨地评估其能力和特征。ChatGPT离人类有多远?
在不到一个月前,来自斯坦福大学的MichalKosinski教授在发布的论文中表明,大型语言模型系统可能自动产生心理理论能力,比如ChatGPT可能拥有9岁儿童所具备的心理理论能力。注:心理理论(TheoryofMind,ToM)能力,有时也被译为“心理推理能力”,通常指理解他人内心状态的能力,包括推断他人意图、信念、情绪等。Kosinski教授依据心智理论相关研究,给ChatGPT-3.5在内的9个ChatGPT模型进行了两个经典测试,并将它们的能力进行了对比。第一个测试为意外内容测试,其主要测试AI对意料之外事情的判断力。在测试中,ChatGPT-3.5成功回答出了20个问题中的17个,准确率达到85%。第二个测试为意外转移任务,其测试AI预估他人想法的能力。作者对9个ChatGPT模型进行了测试,结果表明只有ChatGPT-3.0和ChatGPT-3.5(完成100%)表现不错。然而,这并不意味着ChatGPT-3.5这样的人工智能模型真正具备了心智理论能力。ChatGPT到底只是从“真实存在的规则”这一层面去理解这件事情从而正确回答了问题,还是真的能“了解他人的想法”?至少现在还无从判断。或许人类自身到现在为止都无法真正了解人类的心智。因此,关于ChatGPT是否“真正”具备成年人同等水平的智商、心智水平仍然存疑。ChatGPT生成文字采用的是一种非人类思维的模式,它在五千亿个词构成的文本中寻找统计规律以及通过一千亿个参数捕捉统计模式,但这一方法也使它在某些问题中的错误变得更加突出。相比探究ChatGPT是否真正具备人类同等水平的智商或心智,研究人员同样应该反思目前所使用的测试集本身的有效性以及心理学家们数十年来依据这些测试集得到的结论。而对于人们“被人工智能所替代”的恐惧,我们应该意识到我们所处的行业不是在被“替代”而是在被“重塑”,我们应该学会如何与人工智能共处,让它嵌入自己的工作流程中,帮助解放我们的生产力。参考文献:[1]EkaRoivainen,IGaveChatGPTanIQTest.Here’sWhatIDiscovered,ScientificAmerican,https://www.scientificamerican.com/article/i-gave-chatgpt-an-iq-test-heres-what-i-discovered/[2]MichalKosinski,TheoryofMindMayHaveSpontaneouslyEmergedinLargeLanguageModels,arXiv,https://arxiv.org/abs/2302.02083特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice:Thecontentabove(includingthepicturesandvideosifany)isuploadedandpostedbyauserofNetEaseHao,whichisasocialmediaplatformandonlyprovidesinformationstorageservices.
/阅读下一篇/返回网易首页下载网易新闻客户端深圳人工智能加速落地千行百业
转自:深圳商报
深圳市人工智能与机器人研究院。(本报资料图片)编者按人工智能已成为新一轮科技革命和产业革命的重要驱动力量。近年来,深圳相继出台支持人工智能产业发展的相关法规和政策措施,营造良好市场环境,助力经营主体创新发展,推动人工智能创新应用。5月31日,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》正式印发,同步发布首批“城市+AI”应用场景清单,积极打造国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,努力创建人工智能先锋城市。本报从今日起推出“深AI力量”系列报道,探寻深圳在人工智能发展的浪潮中如何勇夺先机。深圳新闻网2023年6月19日讯(深圳商报记者陈姝陈小慧)今年4月,深圳云天励飞技术股份有限公司正式登陆科创板,成为“深圳人工智能第一股”。从最初几个人的创业团队,发展到今天近千人的企业,云天励飞的业务范围从智慧警务拓展到了城市治理、智慧交通、智慧园区等领域。全球首套城市级动态人像识别系统、全球首款5AIOT芯片DeepEye1000……公司成长中的多个“第一”都离不开深圳。在公司成长壮大的这些年里,云天励飞也一直利用人工智能技术协助深圳在安保、防疫、交通等领域高效工作。云天励飞创始人陈宁感慨地说,“深圳勇气和信任成就了我们。”云天励飞是近年来深圳人工智能产业飞速发展的一个缩影。作为引领新一轮科技革命和产业变革的战略性技术,人工智能是深圳近年来大力培育发展壮大的重点产业集群。记者近日在采访中了解到,据相关协会统计,深圳现有人工智能相关企业超过2000家,分布于产业链各环节。通过率先布局赛道,深圳人工智能产业链条完善,相关技术已在深圳的金融、制造、医疗等千行百业落地。产业链完整创新活跃随着通用大模型火爆,国内各互联网“大厂”相继“秀肌肉”,而不少深圳头部企业已提早低调布局。去年底,腾讯推出名为“混元”的万亿中文NLP预训练模型,在最近的一次财报会上,腾讯高管用“进展很不错”透露了一些最新动向。腾讯总裁刘炽平说,腾讯在人工智能方面要保证长线布局,不断优化混元大模型,希望未来推向市场的产品得到充分打磨,基础模型可以用来加强跨越所有产品线所提供服务。腾讯是深圳人工智能行业企业创新活跃的一个缩影。规模高速增长、应用加速拓展、创新活跃,正是近年来深圳市人工智能核心产业发展的现状。深圳市人工智能产业规模的增长,主要得益于企业规模的增长和企业数量的增加。深圳现有人工智能相关企业超过2000家,分布于产业链各环节。据市工信局相关负责人介绍,如果从深圳企业规模和赛道看,第一类是华为、腾讯等头部企业,它们在人才和技术储备上最多;第二类是专业人工智能服务商,如云天励飞、优必选、奥比中光、北科瑞声等;第三类主要是传统的电子信息软硬件企业,它们以应用为主,如创维等。此外,深圳还聚集了一批知名的人工智能研究机构,如鹏城实验室、粤港澳大湾区数字经济研究院等。如果从产业链分工来看,深圳人工智能企业可分为基础层、技术层和应用层,基础层主要包括高端芯片、算法开发、开源框架等领域,以华为、腾讯、云天励飞等为代表;技术层主要为计算机视觉、智能语音领域,一批优秀企业脱颖而出;而应用层,在机器人、智能家居、无人机、智能医疗、自动驾驶、智慧安防等各领域均有代表性企业。人工智能深入千行百业2021年4月,刚接任华为云CEO的余承东曾在“华为开发者大会”上公布了一项重磅产品:华为云盘古大模型。经过了两年的“沉寂”后,盘古系列AI大模型将正式上线。华为云人工智能领域首席科学家田奇直言,未来工业应用将会是人工智能新的爆发点,“盘古”致力于做好行业应用,形成关键技术壁垒,为煤矿、电力、金融、农业创造产业价值。近年来,人工智能已在深圳的金融、制造、交通、供应链、医疗、政务等领域均实现良好应用。如在“AI+制造领域”,引导企业实施数字化转型。位于坪山区的荣耀智能制造产业园正集新产品验证中心、高端旗舰手机量产中心、新工艺/新技术/制造模式孵化中心和智能制造能力建设中心于一体。产线75%的工序由自动化设备完成,其中超过四成的设备来自自主研发,每28.5秒就有一台手机下线。在工信部发布的《2021年度智能制造试点示范工厂揭榜单位和优秀场景名单》中,该产业园作为深圳市4家代表之一入选。在“AI+医疗”领域,晶泰科技打造了国际上首个具备人工智能结合实验数据并进行商业化运营的药物发现平台。晶泰科技整合人工智能等前沿技术,首创“智能计算+自动化实验+专家经验”药物研发新模式,对新药研发关键环节进行颠覆性改造,打破药物研发领域著名的“双十定律”(即研发一款原创新药需要逾10年时间、花费10亿美元,其创新回报率只有约1%),大幅提高了药物研发效率与成功率,降低了研发成本,已成功为美国、欧洲、亚洲等地逾200家先锋药企和科研机构提供药物研发服务。在“AI+金融”领域,深圳已建设了一批智慧金融应用创新平台,支持粤港澳大湾区数字经济研究院成立AI金融与深度学习研究中心,探索用AI技术让金融更精准、更迅捷、更安全;在“AI+政务”领域,民生诉求服务一体化平台积极应用人工智能技术,有效提升了民生诉求服务水平。立法政策保障业界加大投入深圳人工智能产业飞速发展的背后,得益于政府、研究机构和企业长期以来的重视和不断投入。2019年,国家发改委批准深圳建设国家新一代人工智能创新发展试验区,工信部批准深圳建设国家人工智能创新应用先导区。近几年,深圳出台了《深圳市新一代人工智能发展行动计划(2019-2023年)》,出台培育发展智能传感器、智能网联汽车、智能机器人、智能终端4个细分产业集群行动计划,并公布了深圳市人工智能创新应用示范项目(第一批)名单等。人工智能各级政策的不断出台和落地,为人工智能产业发展提供了良好的政策环境,有利于人工智能产业发展壮大。2022年11月1日起,《深圳经济特区人工智能产业促进条例》正式施行,作为全国首部人工智能产业专项立法,《条例》从深圳人工智能产业发展实际出发,围绕“明确范围+补齐短板+强化支撑+抢抓应用+集聚发展+规范治理”等环节进行探索创新。《条例》的印发实施,为促进深圳人工智能产业发展提供了坚实的法治保障。5月31日,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》正式印发。深圳将努力创建人工智能先锋城市,为全市高质量发展助力赋能。由此,深圳构筑起“一条例、一方案、一清单、一基金群”的人工智能高质量发展和高水平应用的政策体系,加快推进人工智能全时全域应用。算力是大数据时代的生产力,更是支撑国民经济发展的源动力。IDC《2022全球计算力指数评估报告》指出,中国的算力产业规模和多样性目前正持续高速增长,2018年至2022年,深圳的算力规模位居全国前三。目前,深圳大力建设国家超算深圳中心、鹏城云脑、腾讯云等算力基础设施。去年5月,鹏城实验室首次对外发布了中国算力网计划,中国算力网构建自主创新的技术体系,将建成覆盖国家超算中心、智算中心、数据中心等大型异构算力中心互联互通、协同调度与高效计算的网络化算力基础设施。中国工程院院士、鹏城实验室主任高文近期表示,将在韶关建设中国第一个算力调度中心,算力调度中心将能实时反映整个广东的数据、算力和需求算力情况,并向西部各算力节点实时提出算力需求,保证算力能进行实时调度。用高文的话来说就是,未来“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样方便地使用算力”。此外,企业在人工智能领域加大布局。腾讯近期就在财报会上强调,目前正在大力建设人工智能和云基础设施,已经在芯片、操作系统、数据库等核心软硬件领域进行了大规模自研实践,自研算力底座已经初具规模。华为轮值董事长孟晚舟也称,预计到2030年,全球通用算力将增长10倍、人工智能算力将增长500倍。华为将围绕着多场景、多样性的需求,不断提高通用计算、人工智能计算的算力,华为云将沿着行业数字化的“云底座”和“使能器”保持投入。海量资讯、精准解读,尽在新浪财经APP