剑指“癌中之王”!Science Advances:人工智能+多组学手段助力胰腺导管腺癌的早期检测
剑指“癌中之王”!ScienceAdvances:人工智能+多组学手段助力胰腺导管腺癌的早期检测2022-01-0415:20·生物探索「胰腺导管腺癌(PDAC)」是致死性最高的癌种之一,其特点是进展迅速、转移快、早期诊断困难、术后复发率高,因此被称为“癌中之王”。
「胰腺导管腺癌(PDAC)」是致死性最高的癌种之一,其特点是进展迅速、转移快、早期诊断困难、术后复发率高,因此被称为“癌中之王”。很多患者诊断为PDAC时已处于疾病晚期,错过手术治疗的时机,五年生存率极低。PADC之所以很难早期诊断,主要有三个原因:首先,胰腺的解剖位置使肿瘤隐匿,不易被发现。其次,患者的早期症状(如体重减轻、疲劳、腹部和背部疼痛和不适)不够特异,无法明确诊断。再者,目前已有的胰腺癌非侵入性检测方法尚不成熟。因此,寻找更有效的检测PDAC的方法很有必要。
代谢组学(metabolomics)可以收集、检测和分析对生物活性和病理条件高度敏感的各种小分子代谢物,准确、稳健和低成本的代谢组学检测方法为未来的疾病诊断提供了希望。近年来,越来越多的研究借助人工智能的方法,对组学数据进行分析并建立合适有效的检测或验证模型,应用于疾病诊断、分型及疗效预测。
机器学习(machinelearning,ML)与代谢组学结合诊断是当前一个极具吸引力和前景的概念,但以往的工作主要集中在模型构建上,而不是选择关键的代谢物进行疾病检测。近日,北京大学基础医学院尹玉新教授团队与中科院、中国人民解放军总医院合作者应用机器学习结合脂质组学和多组学技术综合分析胰腺导管腺癌(胰腺癌)的代谢特征,开发出人工智能辅助的PDAC血清代谢检测方法,在超过1000例的大型外部验证队列以及包含胰腺良性病变的前瞻临床队列中分别实现了86.74%,85.00%的分类检测准确性,其检测效能显著优于CA19-9与CT检查。该项题为“Metabolicdetectionandsystemsanalysesofpancreaticductaladenocarcinomathroughmachinelearning,lipidomics,andmulti-omics”的研究于2021年12月22日在ScienceAdvances杂志在线发表。研究成果(图源:ScienceAdvances)在大多数医疗应用程序中,ML方法通常是在一个数据集上进行评估的。相比之下,ML辅助代谢性PDAC检测方法已经由一个大型外部验证队列(n=1003)进行了测试和评估,表明了该方法性能的稳定性。处理速度快和精度高的特点使得这种PDAC检测方法在未来的具有很好的应用潜力。传统上,代谢组学或脂质组学的数据维数降低和生物标志物筛选主要是基于方差分析(ANOVA)、最小二乘判别分析(PLS-DA)。本研究创新性地应用了基于支持向量机(SVM)的贪心算法(greedyalgorithm),在血清脂质组学数据的特征选择上表现出了优异的性能。对1033例不同阶段的PDAC患者进行测试发现,该方法在大型外部验证队列中准确率为86.74%,曲线下面积(AUC)为0.9351,前瞻性临床队列中准确率为85.00%,AUC为0.9389。ML辅助代谢型PDAC检测方法在验证研究训练数据集&内部验证数据集&外部验证数据集&前瞻性临床队列中的ROC曲线(图源:ScienceAdvances) 在选择的特征代谢物中有17种类型的脂质,包括4种溶血磷脂酰胆碱(LPC)、7种磷脂酰胆碱(PC)、3种鞘磷脂(SMs)、1种溶血磷脂酰乙醇胺(LPE)、1种磷脂酰乙醇胺(PE)和1种甘油二酯(DG)。LPC、PC和PE参与甘油磷脂代谢,SMs参与鞘脂代谢。组织蛋白质组学和单细胞测序分析显示,在PDAC细胞中甘油磷脂和鞘脂代谢途径被扰乱。这些代谢产物的一系列变化可能反映了PDAC起始和发育过程中脂质代谢及相关信号转导途径的改变、癌细胞的增殖和凋亡抵抗。本研究中将ML分析的血清脂质组学、组织蛋白质组学、单细胞测序等技术相结合,从外周循环血液和组织空间脂质组学的整合角度来表征PDAC的脂质代谢特征。挑选出来的17种特征脂质代谢物的离子色谱图(图源:ScienceAdvances)本工作建立了代谢组学结合ML和贪心算法的方法,利用ML细化了靶向代谢组学的疾病检测程序。目前除CA19-9外,PDAC诊断尚无可用的基于液体的检测方法。然而,CA19-9检测亦有明显局限性,如良性胰胆疾病患者由于胆道梗阻也会表现为CA19-9升高,易被误诊为胰腺癌。ML辅助的代谢性PDAC检测方法具有准确、高灵敏度、微创(以血清为基础)和无放射性的特点,可能有助于临床医生更全面、更准确地进行PDAC诊断以及后续治疗。因此,将其纳入目前的诊断方法可能对PDAC高危患者的常规诊断程序起到补充作用。「当然,这项研究的一些局限性。」该模型选取的特征还不能区分PDAC的早期或晚期阶段,也不能用来预测PDAC患者的预后。并且该方法主要是基于东亚人群进行,是否适用于其他人群中PDAC的检测还有待进一步研究。运用代谢组学数据还必须考虑到其他代谢性疾病如肥胖、糖尿病与PDAC之间的关系,否则ML辅助代谢性PDAC检测方法的性能可能会受到代谢相关混杂因素的影响。该方法,还应结合CA19-9、腹部超声、CT等现有的检测手段,对PDAC筛查和检测结果做出谨慎解释。参考资料:[1]WangG,YaoH,GongY,etal.Metabolicdetectionandsystemsanalysesofpancreaticductaladenocarcinomathroughmachinelearning,lipidomics,andmulti-omics.SciAdv.2021Dec24;7(52):eabh2724.doi:10.1126/sciadv.abh2724.Epub2021Dec22.PMID:34936449.关键词:胰腺导管腺癌人工智能阅读原文分享到:织梦二维码生成器相关新闻美国限制出售避孕药,每2022-07-2854天26个涨停板!「妖股」2022-01-14Delta和Omicron的混血儿"D2022-01-13抗击新冠病毒又一助力!2022-01-11Cell子刊:糖尿病治疗新突2022-01-10超星人工智能,语言与伦理尔雅答案
超星尔雅人工智能语言与伦理章节测试答案徐英瑾
1.1
1【多选题】对人工智能常见的误解有哪些?()AD
A、人工智能就是机器学习
B、机器学习只是人工智能中的一个方向
C、人工智能最近十年受到深度学习的驱动较多
D、人工智能就是深度学习
2【判断题】哲学思维对于人工智能的重要性表现在,哲学所强调的批判性思维有助于认清人工智能发展中的问题。()对
3【判断题】深度学习在人工智能领域的表现并不突出。()X
1.2
1
【单选题】计算机之父是()。B
A、约翰·麦卡锡
B、艾伦·图灵
C、赫尔伯·西蒙
D、马文·明斯基
2
【单选题】人工智能与计算机学科的关系是()。C
A、计算机学科的主要驱动力是人工智能研究
B、计算机是人工智能研究的一个领域
C、人工智能是计算机学科的一个分支
D、人工智能与计算机学科没有联系
3
【单选题】人工智能作为一门学科的建立时间是()。A
A、1956年
B、1930年
C、1960年
D、1952年
4【多选题】下列哪些选项是符号AI的技术路线()?AD
A、通用问题求解器
B、深度学习
C、机器学习
D、贝叶斯网络
5【判断题】符号AI是将人的思维通过逻辑语言制成流形图让计算机去执行。()对
6【判断题】通用问题求解器需要寻找全局最优解。()X
7【判断题】符号AI无法面对人类经验的变动性。()对
1.3
1
【单选题】()是现在新出现的人工智能的研究方向。D
A、深度学习
B、人工神经元网络
C、贝叶斯网络
D、类脑人工智能
2
【单选题】深度学习中的“深度”是指()。B
A、计算机理解的深度
B、中间神经元网络的层次很多
C、计算机的求解更加精准
D、计算机对问题的处理更加灵活
3【多选题】人工神经元网络与深度学习的关系是()。AC
A、人工神经元网络是深度学习的前身
B、深度学习是人工神经元网络的一个分支
C、深度学习是人工神经元网络的一个发展
D、深度学习与人工神经元网络无关
4【多选题】人工神经元网络的运作可以粗略分为()三个层面。ACD
A、输入层
B、映射机制
C、中间处理层
D、输出层
5【判断题】符号AI不是人工智能的正统。()X
6【判断题】人工神经元网络是对人类的神经元运作进行一种非常粗糙的数学模拟。()对
7【判断题】相比于人工神经元网络和深度学习,类脑人工智能对人类大脑的神经回路具有更深入的了解。()对
1.4
1
【单选题】深度学习的实质是()。B
A、推理机制
B、映射机制
C、识别机制
D、模拟机制
2【多选题】符号AI的问题在于()。BCD
A、缺少推理必要的信息
B、把推理所依赖的公理系统全部锁死
C、缺少推理的灵活性
D、会遭遇“框架问题”
3【判断题】推理的本质是在信息不足的情况下能够最大程度的得到最靠谱的结论。()对
4【判断题】计算机具有触类旁通的能力,可以根据具体语境对事件进行分类。()X
5【判断题】人工神经元网络会遭遇“框架问题”。()X
1.5
1
【单选题】日本五代计算机泡沫关注的核心问题是()。D
A、人工神经元网络
B、符号AI
C、贝叶斯网络
D、自然语言处理
2【判断题】制造人工智能的规划、计划和方案本身应该能根据情况的变化进行自我调整。()对
2.1
1【多选题】目前对人工智能的发展所持有的观点有()。ACD
A、乌托邦论
B、模块论
C、末世论
D、泡沫论
2【判断题】现在的人工智能系统都是专用人工智能而非通用人工智能。()对
2.2
1
【单选题】一个真正的通用人工智能系统应具备处理()问题的能力。A
A、全局性
B、局部性
C、专业性
D、统一性
2
【单选题】目前的人工智能研发的动力主要来源于()。B
A、科学
B、商业
C、学术
D、军事
3【判断题】现有的人工神经元网络或深度学习无法处理全局性问题。()对
4【判断题】人工神经元网络只需要很少的数据便可掌握处理特定问题的能力。()X
2.3
1
【单选题】能够推进人工智能智能的研究最好方法是()。C
A、继续完善深度学习
B、提升计算机处理数据的能力
C、研究人类自己的智能
D、研发通用人工智能
2【多选题】下列哪些选项属于通用智力因素?()ABCD
A、短期记忆
B、流体智力
C、晶体智力
D、反应速度
3【判断题】类脑人工智能是指模拟人类大脑的人工智能。()X
4【判断题】人类自己的智能体现了通用性。()对
2.4
1【多选题】以下哪些选项属于自然智能?()ABC
A、植物
B、动物
C、细菌
D、机器
2【多选题】智能的特点是()。AC
A、能对环境进行灵活的应对
B、能够不断创新
C、具有十分牢固的记忆力
D、经济高效
3【判断题】智能与神经元网络的存在具有必然关系。()X
4【判断题】类脑人工智能及人工神经元网络只是智能展现的一种形式。()对
2.5
1
【单选题】提出强人工智能与弱人工智能的人是()。A
A、约翰·塞尔
B、彼得卡鲁瑟斯
C、杰瑞·佛多
D、埃隆·马斯克
2【判断题】通用人工智能就是强人工智能。()X
3.1
1
【单选题】深度学习的数据材料来源于()。D
A、人工搜集
B、已有数据库
C、抽样调查
D、互联网
2
【单选题】大数据技术的样本空间是()。C
A、针对所有相关数据
B、需要确立样本范围
C、不做样本控制
D、以上都不对
3【判断题】统计学研究首先要确立样本空间,进行合理抽样,然后估测出相关的情况。()对
4【判断题】当前的主流人工智能是通向真正的通用人工智能的康庄大道。()X
3.2
1
【单选题】大数据所搜集到的用户群体都是()。A
A、具有线上行为的用户
B、具有线下行为的用户
C、参与调研的用户
D、不参与调研的用户
2
【单选题】人类心智比较容易适应()环境。B
A、大数据
B、小数据
C、多数据
D、单一数据
3【多选题】技术问题背后还有着()问题BC
A、如何取样
B、社会的公平正义
C、社会的价值导向
D、健康的网上习惯
4【判断题】由于大数据只能体现出数量而不能进行质量上的判断,所以在采样并不完整的情况下给出的结论未必准确。()对
5【判断题】大数据会使人类的行为逐渐趋同。()X
3.3
1
【单选题】“节俭性理性”是()提出的。B
A、赫伯特·西蒙
B、吉仁泽
C、司马贺
D、拉普拉斯
2
【单选题】
利用自己的认知本能来进行判断的思维算法是()。C
A、
科学法
B、
逻辑法
C、
捷思法
D、
大数据
3【多选题】绿色人工智能是指()。ABC
A、对环境友好
B、所需数据小
C、消耗资源少
D、效率高
4【判断题】面临信息过载的情况,最好的判断方法是通过本能运用原始算法。()对
5【判断题】大量信息的提供,尤其是彼此矛盾的信息的提供并不会导致我们的思维过载。()X
6【判断题】赫伯特·西蒙提出了有限理性理论。()对
3.4
1
【单选题】过度开采社会人文资源,是指在大数据的环境下对()的侵犯。A
A、个人隐私
B、大众心理
C、个人的行为规范
D、大众消费习惯
2【判断题】大数据无法维持人类社会的隐私和公开之间的张力平衡。()对
3【判断题】深度学习就是一种绿色人工智能。()X
4.1
1
【单选题】在人工智能的所有子课题中,所牵涉范围最广的是()D
A、机器视觉
B、非确定条件下的推理
C、机器听觉
D、自然语言处理
2【多选题】真正的通用人工智能系统具有把握()的能力。BD
A、专业性
B、跨领域
C、局部性
D、全局性
3【判断题】语言是检测人工智能是否真正厉害的试金石。()对
4【判断题】机器语言的特点是有丰富的修辞手段。()X
4.2
1
【单选题】聊天机器人ELIZA的运作,很大程度上采用了将计就计的策略,它本身并没有一个完整的()。C
A、神经元
B、符号建模
C、语义建模
D、数据库
2【多选题】下列属于行为主义心理学家的是()。AB
A、约翰·华生
B、博尔赫斯·斯金纳
C、巴普洛夫
D、冯特
3【判断题】图灵测验本身具有浓重的行为主义色彩。()对
4【判断题】聊天机器人某种程度上具备人类的心智。()X
4.3
1
【单选题】SHRDLU系统实际上是一个()。A
A、积木系统
B、语义模型
C、人工装置
D、人工神经元网络
2
【单选题】SHRDLU系统是由()发明的。D
A、杰瑞·佛多
B、约翰·塞尔
C、赫伯特·西蒙
D、特里·威诺格拉格
3【判断题】SHRDLU系统预设了在哲学上语词和外部对象具有对应关系。()对
4【判断题】外在主义的语义模型在哲学上的意思是每个语词的真正含义都要通过与其对应的外在对象来加以编码。()对
4.4
1
【单选题】语言不仅仅是句法问题,更是()。A
A、语义
B、结构
C、音韵
D、逻辑
2
【单选题】实际的翻译中有时要破坏句子原有的句法结构,根据()重新组织句子。B
A、音韵
B、意义
C、逻辑
D、效果
3【多选题】乔姆斯基认为人类的语法都有哪两个层面?()BD
A、语义层面
B、深层语法
C、句法层面
D、浅层语法
4【判断题】大数据对于语言学习来说,其解释能力非常有限。()对
5【判断题】0-3岁的小孩通过贫乏的语言样本就能够进行有效的语言学习,说明了基于大数据的心智模型是有问题的。()对
4.5
1
【单选题】可以用来界定因果关系的是()。C
A、贝叶斯公式
B、先验概率
C、后验概率
D、归纳逻辑
2
【单选题】把归纳逻辑抬到
剩余60%内容付费后可查看本部分为付费内容,支付后可查看如遇无法购买,请复制网址,换个浏览器打开即可支付5元已支付?输入手机号查看图灵测试与人工智能
“机器能否拥有智能,为了回答这个问题我们应该首先定义‘机器’和‘智能’。一种可能性是根据大多数普通人的日常理解去定义这两个概念,但这样做是危险的。……在这里我并不打算定义这两个概念,而是转而考虑另一个问题,它与原问题密切相关,同时可以被更清楚无疑地表达。……(图灵测试的描述)……可能有人会说这项测试对机器而言过于严格——毕竟人类也无法反过来成功伪装成机器,这只需检查算术的速度和正确度即可辨别。难道被认为拥有智能的机器就不能表现出和人类不同的行为么?这是一个很有力的反对意见,但至少不管怎样,假如我们有能力制造出一个可以成功通过测试的机器的话,也就无需为这个反对意见烦恼了。”
借助集合的概念我们可以更容易地理解图灵测试与人工智能的关系。如图1所示,“所有智能行为”对应的集合和“所有人类行为”对应的集合既有交集又互有不同。在全部智能行为中有一些是人类靠自身无法做到的(比如计算出国际象棋中白棋是否必胜),但无论如何人类都被认为是有智能的,因此,在各方面都能达到“人类水平”—也就是完成两个集合的交集部分—就应该被认作是“拥有智能”的。[4]另一方面,人类行为并不总是和智能相关。图灵测试要求机器全面模拟“所有人类行为”,其中既包括了两个集合的交集,也包括了人类的“非智能”行为,因此通过图灵测试是“拥有智能”的一个有效的充分条件。
图灵本人对机器能够通过他的测试相当乐观,他大胆预测“到2000年左右时,一台拥有1GB内存或类似规模的计算机可以在接受普通人5分钟的询问之后,使他们的判断正确率不超过70%”。然而直到2014年的今天,仍然没有任何机器被公认为已经通过图灵测试。有趣的是,这一失败事实反而还带来了一个我们再熟悉不过的应用-图形验证码。(每一次输入验证码都是一次图灵测试!)
图灵测试问题的进展缓慢与目前人工智能学界对图灵测试这个“充分条件”的研究热情不高有关。[5]这一部分上由于主流人工智能研究与图灵测试所追求的目标之间存在差异,同时也因为图灵测试本身难度巨大。下面我们通过人工智能研究的三个重要特征来进一步讨论图灵测试与人工智能之间的异同,以及为什么图灵测试不大可能在短时间内解决。
一、主流人工智能研究关注智能体的外部行为,而不是产生该行为的内部过程
在这方面图灵测试的思想和人工智能学界是完全一致的。只关注外部行为是一个典型的功能主义/行为主义风格的做法,事实上这也是一个人工智能经常被外界所指摘的地方。严格的“主观思考”定义要求智能体具有自我意识。但一方面,从严格的科学方法讲,我们甚至并不真的确定是否有客观证据证实“意识”的存在。更重要的是,人们发现智能行为和主观思考完全可以被看作是两个独立的问题来考虑,二者并不必要纠缠在一起。具体来说,可以从数学上证明任何一台数字计算机的行为都可以用查表的方式机械地模拟。假设我们真的制造了一台具有“意识”的机器A,我们总可以制造另一台机器B以查表的方式来机械地模拟A的内部运行,问题是B是否具有意识?如果每一台“拥有”意识的机器都能被一台B这样的“机械查表式”的机器所模拟,那么我们就无法通过外部行为来断定一个机器在内部上是真的在“思考”还是只是在模拟“思考”的过程,[6] 因此“是否拥有意识”从行为主义的角度也就成了相对独立的“另外一个问题”。同时,“拥有意识的机器总可以被没有意识的机器模拟”也说明“拥有意识”并不能给机器带来额外的“行为能力”,这进一步降低了“拥有意识”在行为主义者眼中的重要性。
基于外部行为与主观思考之间的独立性,主流人工智能研究和图灵测试把实现外部行为作为唯一目标,这样的观点被称为弱人工智能观点。我们知道每个学科的研究都基于一个“基本假设”展开。比如支撑物理研究的基本假设是“万物运转都受一套普适的、永恒的规律所约束”,而物理研究的目的“只是”找出这套规律是什么。类似的,“弱人工智能假设”(weakAIhypothesis)认为经过良好设计的计算机可以表现出不低于人类智能水平的外部智能行为。可以说主流人工智能研究是以弱人工智能假设为出发点,研究如何实现这样一个计算机。
二、主流人工智能研究关注如何模拟人类的纯粹智能活动,而不是全部脑力活动
就像前面提到的,人类的脑力活动(mentalprocess)不仅包括智能,同时具有情感、审美能力、性格缺陷、社会文化习惯等等一系列“非智力特征”。因为图灵测试的模仿对象是普通人,事实上它对这些非智力特征的要求甚至可能还高过对纯粹智力的要求——作为一个普通人,他/她完全有可能对国际象棋一窍不通,但却不大可能从照片分辨不出美女/帅哥来。
当然,“非智力特征”的引入本身并不妨碍图灵测试成为一个有效的充分条件,但除非我们假设所有这些“非智力特征”都是拥有智能之后的必然产物,否则不得不承认图灵测试确实在机器智能这个核心问题之外加入了过多充满挑战却又显得不那么相关的因素。就像《人工智能》这本经典教科书里写到的,“航空领域试图制造性能良好的飞机,而不是使飞机飞得如此像鸽子以至于可以骗过其他鸽子。”人工智能研究确实应该更多关注与智力活动相关的抽象功能和一般原则。
三、人工智能的最终目标是能够综合适应“人类所在环境”的单一智能体,而不是专门解决特定数学问题的算法
在这一点上图灵测试与人工智能研究的最终目标也是一致的,只不过现有的人工智能水平离这一目标还相去甚远。事实上“综合模拟人类的智力活动”正是人工智能区别于其他计算机科学分支的地方。我们通过比较人工智能软件与传统软件来说明这一点。首先从最广义的角度看,传统软件也应属于人工智能的范畴:实际上很多早期的计算机科学家,比如图灵,就是以人工智能为动力展开对计算机科学的研究。所谓“计算”本来就是诸多人类智能活动中的一种。一个从未接触过计算机的人也许很难说清“从一个数列中找出所有素数”和“从一张照片中找出一只狗”哪个更有资格代表“智能”(前者属于传统软件范畴,后者属于传统人工智能范畴)。但另一方面,传统软件并不代表人工智能的全部内涵。粗略讲,我们可以认为传统软件对应了这样一类“计算问题”,它们的共同特点是,问题本身是用一个算法(或非构造性的数学描述)来描述的,而对它们的研究主要关注在如何找到更好的算法。[7]而我们称之为“人工智能问题”的问题可以理解为另一类“计算问题”,它们的共同特点是无法用算法或从数学上对问题进行精确定义,这些问题的“正确答案”从本质上取决于我们人在面对这类问题时如何反应。对于人工智能问题,我们可以基于数学模型或计算模型来设计算法,但问题的本质并不是数学的。
通用人工智能(ArtificialGeneralIntelligence)基于弱人工智能假设,以全面模拟人类的所有智力行为为目标。注意到图灵测试作为一个充分条件,是不可能在通用人工智能真正实现之前得到解决的。另一方面,可以说现有每一个AI分支的成功都是通过图灵测试的必要条件,而它们中的大部分还没有达到“人类水平”。因为我们不可能穷尽所有人类智能行为,必须依赖有限个具有通用性的模型和算法来实现通用智能。目前人们仍然只能基于一些简单初等的模型来设计学习、推理、和规划算法。这些AI分支的研究都默认基于针对自己领域问题的弱人工智能假设,而支撑这些子领域研究的动力往往是其巨大的社会实用价值。它们固然已经在很多具体应用领域成绩斐然,但看起来离图灵测试所要求的水平仍然相差甚远。