ChatGPT成为执业医师的路还有多远
0分享至今年年初最热门的话题之一便是风靡整个互联网的人工智能ChatGPT,它能熟练准确地理解问题句子语法逻辑并作出正确的回答,在许多领域得到了应用。ChatGenerativePre-trainedTransformer(ChatGPT)是一类被称之为回归语言模型的大型语言模型(LLM)中的最新成员,是一个1750亿参数的自然语言处理模型,可以对用户输入生成对话式响应,无论是写论文还是回答网友问题、生产段子还是修改计算机程序代码,其表现出来的性能都令人惊叹。2022年12月24日在JMIRMedEduc杂志的一项研究中首次探索了ChatGPT人工智能能否通过美国执业医师考试,从而在可见的未来能应用到患者问诊互动、健康知识查询、临床查询等相关软件中,以及代替医师对患者问诊做出诊断。在这项研究中,研究人员旨在量化ChatGPT评估医学知识的主要能力(生物医学、临床、流行病学和社会行为科学知识),以及通过美国医学执照考试(USMLE)第1项和第2项以临床知识为中心的2个数据库。测试1侧重于基础科学及其与医学实践的关系,而测试2侧重于这些基础科学的临床应用。研究人员还将ChatGPT在这些考试中的表现与前代人工智能(2个LLM、GPT-3和InstructGPT)的表现进行了比较。此外,为了进一步评估ChatGPT作为模拟医学导师的能力,研究人员定性地检查了ChatGPT在逻辑论证以及使用内部(题目信息)和外部信息(题目外的知识)来回答的完整性和正确率。结果显示,在AMBOSS-Step1、AMBOSS-Step2、NBME-Free-Step1和NBME-Free-Step2这4个医学数据库的测试中,ChatGPT的准确率分别为44%(44/100)、42%(42/100)、64.4%(56/87)和57.8%(59/102)。ChatGPT在所有数据库中的平均表现优于前代人工智能InstructGPT8.15%左右,而GPT-3的表现与随机机会相似(类似人类随机选择答案)。在AMBOSS数据库进行的问题难度测试中,随着AMBOSS的问题测试难度增加,ChatGPT的准确性显著下降(P=0.01),从1级较低难度问题的64%(9/14)准确率下降到第5级较高难度问题的0%(0/9)准确率,在处理较复杂困难的测试题目上跟人类相似。在回答问题的质量评估上,研究人员通过逻辑推理的存在、内部题干信息理解和外部信息收集归纳三个指标来评估ChatGPT的回答质量。研究人员发现ChatGPT提供的每个回复都提供了对其答案选择的合乎逻辑的解释,与回复的正确性无关。此外,在NBME-Free-Step1和NBME-Free-Step2数据库中,ChatGPT在96.8%(183/189)的问题中使用了问题的内部信息。最后,对于NBME-Free-Step1数据库,92.9%(52/56)的正确回答和48.4%(15/31)的错误回答使用了问题之外的信息(差异为44.5%;P/阅读下一篇/返回网易首页下载网易新闻客户端AI大模型来了,人工智能抗癌之路到底还有多远
撰写Mi
审核Joan
排版Joan
人类与肿瘤的抗争之路也是人类不断将科学技术应用于癌症诊断和治疗之路。从公元前埃及人发现肿瘤至今,人类花了几千年的时间,从发现肿瘤到认识肿瘤,从手术根治到放疗、化疗,再到靶向治疗,癌症治疗越来越多地融入了化学、物理、生物学的最新成果。试想下,当年如果没有麻醉术和无菌术辅助的原始手术,肿瘤切除手术将是多么痛苦和危险。步入21世纪,电脑、互联网的出现,让人类进入信息时代和网络时代,而最近几年,人工智能技术的成熟和普及,也涌现出一大批AI医疗企业。数字医疗、智能医疗逐渐成为我们生活的一部分.最新的科技医疗服务和产品有哪些?又该如何认识这些高科技与医疗的新产品和新服务?
1、第一类:医疗信息化
医疗信息化:是指利用通讯技术、计算机技术、网络技术、物联网技术、大数据等技术手段,将医疗业务数据化、数字化、可视化,提高医疗机构服务水平、管理效率和管理决策能力,实现以患者为中心的医疗信息化体系。医疗信息化,由医院信息系统(HIS)、临床管理信息系统(CIS)、公共卫生信息系统(GIS)、药品管理信息系统(PMS)等构成。简而言之,在医疗流程相关的领域,电脑和网络广泛使用,医生与护士的工作效率大幅提高,更多的病患更快被医治。对于普通患者,医疗信息化最直观感受是,之前医生龙飞凤舞的手写病例和药品清单,被清晰的打印体取代,不同医院的电脑都连接到国家医保中心,即便异地就医,也能快速报销;此外,几乎每家医院都能通过公众号或小程序预约挂号,报告查询……这些都得益于互联网的普及。
2、第二类:人工智能的兴起
人工智能,尤其是图像识别的相关算法逐渐成熟,相关技术开始广泛应用于癌症的检测、诊断、治疗和护理。比如人工智能可以通过分析患者的症状、体征、影像学和生化检查结果等,辅助医生进行癌症的检测和诊断,辅助医生制定个性化的治疗方案,甚至辅助医生调整治疗策略和剂量等。在2023年ASCO年会上,也出现了人工智能的身影。9132号摘要,就是一项专门使用人工智能算法(DEEPIO)预测免疫检查点抑制剂,在非小细胞癌中的疗效。
实验证明:与单一的PD-L1(一种蛋白质)评估相比,AI与PD-L1联合评分特异性提高32%。在科技圈,有很多知名的跨国企业涉足医疗领域。比如IBMWatsonHealth全球多个国家广泛应用,GoogleHealth成为移动终端的24小时贴身“保镖”,而苹果的腕表功能也日渐强大,测心跳、脉搏、血氧,堪比一个随身携带的诊疗仪器。
Paige.AI是美国首个获得FDA批准的AI病理学产品,用于帮助医生分析癌症病理图像,以及发现新的治疗方法和药物,成为美国首个获得FDA批准的AI病理学产品。此外,Enlitic获得多项专利的认可,可辅助医生进行癌症诊断和治疗规划,还可以用于自动化病历审核、辅助临床决策和预测病情发展趋势等。类似的,CaptionHealth则扮演了心血管疾病辅助能手。
2022年人工智能进入了下半场。
2022年,以chatGPT为代表的人工智能大模型迅速火爆出圈。它不仅能根据聊天的上、下文进行互动,还可以真正像人类一样用来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码、写论文等高难度任务。在医疗领域,人工智能从之前的记录、分析、辅助治疗,逐渐演进到生成、创造信息阶段,这将大幅提高医生的诊疗效率。最近,在医疗领域人工智能大模型影子也随处可见。比如,CarbonHealth公司的新AI工具(GPT-4创建患者护理说明),可以通过使用亚马逊的转录服务来转录医疗记录和患者预约,并且可以在不牺牲准确性的情况下以更快的速度完成转录。这一工具的推出,将带来更高效、更准确的转录服务,帮助医疗机构更好地管理患者信息和提高医疗服务质量。微软研究人员展示了LLaVA-Med模型,该模型主要用于生物医学方面的研究,可根据CT、X光图片等推测出患者的病理状况。据了解,微软已与一批医院合作,获得了一整套数据集训练多模态AI模型。在具体表现看,LLaVA-Med在部分指标上领先于业界其他先进模型”。
3、第三类:远程医疗
过去三年,疫情让人们逐渐习惯口罩生活,出行不便成为一种必然,反复隔离,让线上问诊逐渐普及。在线医疗则从过去的小众服务方式,一跃成为占比半数的医疗服务,此后随着习惯被长时间固话,催生了庞大远程医疗市场。
据MarketsandMarkets报告,预计这一市场将从 2022年的估计878亿美元达到2027年2857亿美元,复合年增长率为 26.6%,而同一时期其他行业增速持平甚至是负增长。但远程医疗公司表现却有着云泥之别!Teledoc、AmericanWell提供的服务并没有稀缺性,在疫情逐渐放缓后,增长驱动力不足,也就瞬间被打回原形。而被安卓“医疗界LinkedIn”Doximity,已经被华尔街列为长期成长股。远程医疗的本质是优质医疗资源与患者的连接器,以变现医生的平台化的营业收入,展现了强大的未来发展可能性,也体现了其企业价值在于其核心业务及竞争力,而非基于市场热潮或是风口。再比如MOREHealth,通过十年积累完成了跨境领域的法律、平台搭建,并基于此不断拓展业务版图,成为唯一拥有国际远程诊疗的的顶级医疗服务平台。MOREHealth爱医传递获得了美国《健康保险流通与责任法》认证,严格保护病患和医疗信息的安全。目前,MOREHealth爱医传递合作的医疗专家覆盖全球综合排名前10、儿科排名前5的各大医疗机构,已建立100,000+国际权威医生资源库,覆盖肿瘤、心脑血管、神经、儿科、妇产科和罕见病等领域。
自2014年进入中国以来,MOREHealth爱医传递得到中国众多知名三甲医院和广大医生的认可和采用,截止目前已经完成上万例患者的国际会诊服务,用户满意度达到95%以上。与同类服务相比,MOREHealth爱医传递更侧重远程平台,这无疑切中了用户痛点。在会诊后的治疗中,超过95%的患者继续在国内进行后续治疗,无需海外就医,帮助患者平均节省医疗开支50万元人民币以上;即便选择海外就医,由于在国内进行更好的前期准备,平均节省治疗时间21天,平均节省治疗费用20万元人民币。可靠安全的平台,庞大专业的在线国际医疗团队,以及高性价比的运营模式,是MOREHealth爱医传递收获用户超高满意度的关键性原因。
科技改变医疗将是未来医疗的必然,无论是医疗信息化,还是人工智能赋能医疗,亦或是远程医疗,都是提高医疗效率的重要加速器。但在目前看,人工智能大模型在医疗领域的深度使用,或许仅仅是个开始,远不及远程医疗和医疗信息化对医疗行业的影响力。科技总会带来无限可能,相信不远的未来,AI大模型或将成为医疗信息化和远程医疗的标配,到时,各种科技融合的医疗体验,更值得大家期待。
生成式人工智能:距离军事领域全面应用有多远
原标题:生成式人工智能:距离军事领域全面应用有多远作者:申峥峥、束折
来源:中国军网
自2022年11月以来,以ChatGPT为代表的生成式人工智能引爆网络,引起了教育、新闻、娱乐和艺术等多个行业的广泛关注和热烈讨论。如今,生成式人工智能已经能够以高逼真度对人的认知、偏好、情感、行为等多维度进行相似性模拟,并且在功能层面通过与人交互产出和人类的常识、需求、价值观有较高匹配度的强人工智能制品。从AI绘画、AI聊天,到AI编程,生成式人工智能似乎离我们越来越近,影响着我们日常生活的方方面面。
与此同时,也有人提出了一个不容回避的问题:生成式人工智能距离在军事领域全面应用还有多远?
要回答这个问题,首先我们得了解支撑生成式人工智能快速兴起的三个核心要素:
一是基于海量数据的强化学习预训练。生成式人工智能之所以能够为用户带来媲美真人的交互体验,关键在于采用了基于海量数据的强化学习预训练,其中除了大规模的公开语料数据外,主要通过大量人工标注数据进行以人类主观偏好引导下的有监督学习,从而实现对人类认知机制的深度模拟。然而在军事应用层面,由于缺少现代化战争的实战经验,大量数据来源于日常训练和演习,直接影响到人工智能训练效果;此外,训练数据尚未开展人工标注工作,数据的可用性和可解读性差,难以有效支持强化学习预训练。
二是支撑人工智能大模型的开放式交互训练。ChatGPT的兴起揭开了人工智能大模型时代的序幕,当前ChatGPT拥有了多达1750亿个模型参数,谷歌最新推出“通才”大模型PaLM-E拥有世界最大规模的5620亿参数。生成式人工智能在面对复杂度高、专业性强的领域语言结构,需要通过与专业型用户的频繁交互,不断调整优化其大模型参数。然而,在军事领域想开展如此大规模的交互调参工作有巨大难度和工作量。
三是人机交互中的低互信成本限制。目前ChatGPT仍然是黑盒模型,尚不能对其内在算法逻辑进行分解,无法保证其不会产生攻击甚至伤害用户的表述,因此主要是在民用低互信成本限制领域推广使用。而人工智能军事应用最大的矛盾点就是伦理问题,由于技术复杂性和信息不透明性,使得用户无法清晰了解输入和输出之间的必然因果关联,产生的结果无法完全掌控和信任,使其在军事领域的全面深度应用举步维艰。
展开全文由此可见,不管是技术应用层面,还是道德伦理层面,生成式人工智能在军事领域的全面应用似乎还比较遥远。但是,从世界范围看,在提升战场的人机交互能力、加快信息处理速度等辅助决策上,生成式人工智能技术已经开始应用,并有较大的发挥空间和提升潜力。笔者认为,任何一项技术的推广应用一方面是技术本身的发展进步,另一方面是适应技术发展的外部环境支持,生成式人工智能在军事领域的全面应用需要在法律道德规范、数据基础储备、计算能力建设、多源交互环境等多方面发力,厚积薄发,才有望让其为人类更好地服务。
关注公众号了解更多
会员申请请在公众号内回复“个人会员”或“单位会员
欢迎关注中国指挥与控制学会媒体矩阵
CICC官方网站
CICC官方微信公众号
《指挥与控制学报》官网
国际无人系统大会官网
中国指挥控制大会官网
全国兵棋推演大赛
全国空中智能博弈大赛
搜狐号
一点号返回搜狐,查看更多
责任编辑: