院士专家共议:生物信息学的下一个十年
转自:中国科学报
“十年来,数学、计算机与生命科学交叉领域发生了显著的变化,如今伴随着大模型、人工智能等给我们提出了巨大挑战,也到了学科必须‘交叉’的时候,这无论对现代科学的发展,还是服务国家战略需求,都是非常重要的。”中国科学院院士、中国科学院数学与系统科学研究院研究员马志明为青年科研人员鼓舞打气。
近年来,ChatGPT等深度学习大模型的诞生,给几乎各个学科领域带来了新的机遇(代码看不懂?ChatGPT帮你解释,详细到爆!)。基于数据、信息而生的生物信息学无疑将迎来新的变化,它的下一个十年在哪里?
近日,第十届“数学、计算机与生命科学交叉研究”青年学者论坛在北京举行,来自数学、计算机与生命科学交叉领域的院士专家、优秀中青年学者与广大学生参加会议,共同交流生物信息学的前沿进展,展望生物信息学科的发展未来。
“暗箱”待开
在人类生物医学发展史上,遗传密码的破解,使得生物医学从此进入了大数据时代,生物信息学进入“快车道”。
“这是划时代的变化,生物医学从描述进入到用数据刻画的时代,数据带来了巨大的信息。”中国科学院院士陈润生说,上世纪90年代,他参加了人类基因组和水稻基因组分析,那时,生物信息学还比较“冷门”。(陈润生院士:中国生物信息学启蒙、传承的三十年「大江大河」)
而事实上,生物信息学对生命科学研究带来了一场变革。
陈润生举例说,基于大数据的大规模测序,我们能够更好地抵御未来烈性传染病对人类的侵害;基于大数据,医生就有了准确地靶向判断,那么严重的肿瘤也是可防治的。“大数据带来大信息牵引的精准医学,已经成为新一轮国家科技竞争的战略制高点。”
“但大数据带来了新的挑战,那就是我们并不了解它的生物医学本质。”陈润生指出,以生物组学大数据为例,它是复杂的、不同尺度、多维度和异质化的,比如病例是用自然语言写的,生理生化指标是波形的,胸片是影像的,而组学数据是字符串形式的。那么,这些不同标记来度量的量,如何能够协调统一来共同分析,这是大数据分析的一个难题。此外,数据指标是动态和非线性的。
“随着越来越多的表征疾病的数据产生,我们需要理解疾病是怎么发生的,什么是导致疾病的因素,这就好比‘暗箱’,而要打开它,需要用人工智能对生物医学数据进行深度挖掘。”陈润生说。
大模型的出现,或许是生物信息学新的变革的开始。
陈润生表示,大模型的工作方式是必然会深入到各个环节,但不需重造,更多的是利用,未来大模型和生物医学是更高层次的结合,“推动大模型向真实的大脑学习,不仅仅是训练它的学习量,更多的是深刻看清脑的复杂结构组成。”
大科学引领大发现
打开“暗箱”的工作,单靠一个学科或领域并不现实。正如中国科学院院士贺福初所说,生物信息学的未来,更多需要数学和系统科学等学科的深度参与,这也可能将生物信息学带往新的方向。
贺福初呼吁,未来要进一步探索生命科学理论或基本规律。
“大科学时代产生了大数据,能够形成规律性的总结吗?”贺福初表示,只有在数学等其他科学的基础之上,才可能将大数据提炼出信息,发现大知识和重要原理。
事实上,这在2000多年前就已有印证,古希腊毕达哥拉斯学派相继发现:算术的本质是“绝对的不连续量”,音乐的本质是“相对的不连续量”,几何的本质是“静止的连续量”,天文学的本质是“运动的连续量”。他们因此认为,数学是通向理性世界的必备工具。
后来的科学发展也表明,数学作为整个自然科学的基础,奠定了很多学科“大发现”的基石。
自从生命科学进入大数据时代,关于生命的基因组数据增长速度是摩尔定律的四倍。然而,在贺福初看来,基因组无法解释生命的生老病死。
“时空各异,基因组相同;生老病死,基因组不变。”贺福初表示,众多生命现象无法从基因组层面得以阐明,必须通过蛋白质组在时间、空间上的动态变化,发掘生命现象的本源与本质。
基于此,由贺福初领衔的“人体蛋白质组导航计划”,使命是解读人体蛋白质组构成原理与变化规律,实现蛋白质组学驱动的医学范式转变,共创智慧医学新时代。
“科学大发现时代离不开学科交叉。”贺福初强调,生命科学将借助数学、计算科学与人工智能进入大发现时代。
下一个十年需要更多年轻人
前辈的指导与鼓舞给年轻人带去了更多的信心。
“数学、计算机与生命科学交叉研究”青年学者论坛共同主席、中国科学院数学与系统科学学院研究员张世华告诉《中国科学报》,十年前,他还是一名助理研究员,那时,每个领域的学者都不少,但在交叉学科里缺少交流的机会和平台。于是,他与中国科学院遗传与发育生物学研究所研究员王秀杰一起倡导发起组织论坛,加强从事“数学、计算机与生命科学交叉研究”青年学者之间的联系,交流生命科学与计算生物学研究领域的最新成果。
当年的很多“初出茅庐”的年轻人和学生,如今都已成为数学、计算机与生命科学交叉领域里的中流砥柱,他们希望在生物信息学的下一个十年里迎接更多的年轻力量。
北京大学生物医学前沿创新中心研究员张泽民曾供职于高新技术企业,他对产业和学术都有着深刻的感受,在他看来,“生物信息学领域技术总在变,但它的科学思维和目标是一直不变的,所以无论技术如何变化,我们关注的焦点在于如何把数据的信息变成知识,从数据和新技术中挖掘更多的机会。”
在人工智能大模型时代,生物数据几乎六个月翻一番,生物信息学会有哪些变化?
同济大学生命科学与技术学院教授张勇表示,生物信息学可能更多的从实验学科向理论学科转变、从理科向工科化转变。
“如何把大模型应用在生命科学领域,首先要了解数据,其次更重要的是提出一个好问题,这比关注模型本身可能更重要。”北京大学生命科学学院研究员高歌说。
陈润生指出,伴随着大数据在生物、医学中的深度应用,伴随着物质资源向数据资源的不断迁移,未来十年对生物信息的需求会越来越迫切、越来越广泛。为此,加强生物信息学的学科建设,鼓励源头创新,培养人才队伍是非常重要的。同时,也期待生物信息学领域研究人员在科技创新和国家经济社会发展中做出更多更大的贡献。
往期精品(点击图片直达文字对应教程)机器学习
人工智能简史 第2版
链接:pan.baidu.com/s/1xTCH_lUrtZVmG5bPLWuWmQ?pwd=fjpk
提取码:fjpk
1.人工智能专家尼克重磅作品全新升级;2.全方位解读人工智能的来龙去脉,一线专家细数行业经典与成败得失;3.把科学的故事讲得富于思想性,把技术的问题讲得颇具趣味性;4.获得第七届中华优秀出版物图书奖、第八届吴文俊人工智能科技进步奖,入围央视“2017年度中国好书”,获选第十三届“文津图书奖”推荐图书;5.新版全书修订,新增章节,补充人工智能演进路线图和人物关系图。
内容简介《人工智能简史》全面讲述人工智能的发展史,几乎覆盖人工智能学科的所有领域,包括人工智能的起源、自动定理证明、专家系统、神经网络、自然语言处理、遗传算法、深度学习、强化学习、超级智能、哲学问题和未来趋势等,以宏阔的视野和生动的语言,对人工智能进行了全面回顾和深度点评。第2版中每章都有新增内容,并增加了全新的第13章,整理了人工智能几大派别的演化路线和人物的继承关系,有助读者阅读方便。本书极具专业性、思想性和趣味性,既适合缺少专业背景的读者了解人工智能的来龙去脉,作为人工智能的启迪之书,也适合专业人士了解人工智能鲜为人知的历史,提供深入学习的指导。
作者简介尼克,曾任职于哈佛和惠普,后创业投资,2016年创立乌镇智库。无论忙闲不忘读书写字,作品多发表于《上海书评》,并有著作《UNIXSYSTEMV内核剖析》和《哲学评书》。
目录目录第1章达特茅斯会议:人工智能的缘起11.背景22.达特茅斯会议73.AI历史的方法论114.会议之后165.预测未来:会有奇点吗?22第2章自动定理证明兴衰纪271.自动定理证明的起源282.罗宾逊和归结原理363.项重写384.阿贡小组和马库恩395.符号派的内部矛盾:问答系统和归结原理的失落416.几何定理证明与计算机代数437.定理证明系统和竞赛488.哲学问题519.现状5510.结语57第3章从专家系统到知识图谱691.费根鲍姆和DENDRAL702.MYCIN733.专家系统的成熟754.知识表示765.雷纳特和大知识系统816.语义网847.谷歌和知识图谱86第4章第五代计算机的教训931.背景942.理论基础:逻辑程序和Prolog973.五代机计划和五代机研究所1004.并发Prolog1035.美国和欧洲对日本五代机计划的反应1056.结局和教训1097.日本还有机会吗:日本下一代人工智能促进战略111第5章神经网络简史1131.神经网络的初创文章1142.罗森布拉特和感知机1203.神经网络的复兴1254.深度学习129第6章计算机下棋简史:机定胜人,人定胜天1351.机器下棋史前史1362.跳棋插曲1373.计算机下棋之初1384.“深蓝”1445.围棋和AlphaGo146第7章自然语言处理1491.乔治敦实验1502.乔姆斯基和句法分析1513.ELIZA和PARRY1584.维诺格拉德和积木世界1655.统计派又来了1726.神经翻译是终极手段吗?1747.问答系统和IBM沃森1758.回顾和展望177第8章向自然学习:从遗传算法到强化学习1831.霍兰德和遗传算法1842.遗传编程1893.强化学习1914.计算向自然学习还是自然向计算学习1975.计算理论与生物学198第9章哲学家和人工智能2031.德雷弗斯和《计算机不能干什么》2042.塞尔和中文屋2113.普特南和缸中脑2144.给哲学家一点忠告217第10章人是机器吗?——人工智能的计算理论基础2231.丘奇-图灵论题:为什么图灵机是最重要的发明?2252.相似性原则:另一个重要但不太被提及的计算理论思想2303.超计算2344.BSS实数模型2355.量子计算2376.计算理论的哲学寓意2407.超计算和人工智能242第11章智能的进化2491.大脑的进化2502.能源的摄取和消耗2513.全社会的算力作为文明的测度2544.人工智能从哪里来?2565.人工智能向哪里去:会有超级智能吗?257第12章当我们谈论生死时,我们在谈论什么?265第13章总结273附录1图灵小传281附录2人工智能前史:图灵与人工智能295附录3冯诺伊曼与人工智能301附录4计算机与智能309后记343参考文献347人名对照361
查看全部↓