博舍

人工智能和科学发现相互赋能的新范式:AI+Science 读书会启动 人工智能的出现对哲学的启示

人工智能和科学发现相互赋能的新范式:AI+Science 读书会启动

导语

 AI+Science是近年兴起的将人工智能和科学相结合的一种趋势。一方面是AIforScience,机器学习和其他AI技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。另一方面是ScienceforAI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。

集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(JureLeskovec教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(MaxTegmark 教授指导),共同发起以“AI+Science”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。读书会从2023年3月26日开始,每周日早上9:00-11:00线上举行,持续时间预计10周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。

读书会背景

科学对于人类社会的发展具有根本性的推动作用。它让我们更加深刻地认识自然,从最基本的粒子,到原子、分子,从复杂的生物,再到浩瀚的宇宙。掌握了科学的工具,我们也能更好地改造自然。从开发新药物分子、新材料,到解决气候变化问题,从设计航天器,到操控可控核聚变。而在这其中,AI将发挥越来越核心的作用。

AI+Science是近年兴起的一个前沿而激动人心的研究方向。它一方面通过开发新的AI和机器学习方法,解决上述科学中的重要问题(AIforScience)。另一方面,在科学(尤其是物理学)中长期积累的重要概念,也能为机器学习提供全新的视角和方法(ScienceforAI)。

AI+Science是将人工智能和科学相结合的一种趋势,旨在利用机器学习和其他AI技术来解决科学研究中的问题。在此过程中,复杂系统理论是一个非常重要的概念,因为许多科学领域都与复杂系统有关。AI+Science中提到的技术可以通过对复杂系统的建模和分析来帮助科学家更好地理解和研究复杂系统。利用AI+Science可以构建高精度的复杂系统模型,并对这些模型进行仿真和优化。集智俱乐部在2020年曾组织了以「复杂系统自动建模」为主题的读书会,从复杂系统理论出发,借助人工智能方法和技术,揭开人工智能的黑箱。

读书会框架介绍

本次读书会,我们将详细探讨AI+Science中的重要分支,在每一个分支中探讨重要的问题,当前前沿方法,以及待解决的开放性问题。在AIforScience下,我们将着重探讨以下三个分支:AI用于科学仿真,AI用于科学设计,以及AI用于科学发现。在ScienceforAI,我们将着重探讨物理启发下的生成模型,以及物理启发下的学习理论。

领域发展背景

科学发现和创新传统上依赖于观察、建模、提出理论和实践。如今,算力强大的计算机和收集大量高分辨率实验数据的先进仪器正在成为产生知识的新引擎。更多的挑战来自于考察这些数据,将其转化为信息,进而转化为知识——这是单靠人类无法完成的任务,只有与强大的机器和算法结合才能推动这场AI+Science革命。人工智能和机器学习将从根本上改变科学发现,让复杂的推理不再受人类经验的限制,我们才刚刚开始理解由此带来的各种可能性。

机器学习已经彻底改变了许多科学领域,解决了一系列重大问题:预测天气、模拟星系碰撞、为黑洞拍照、预测蛋白质结构、设计优化核聚变反应堆、自动化药物发现,甚至像科学家一样进行科学发现,识别复杂系统中的对称性和守恒律。重大挑战的解决方案通常涉及多个学科,因此,AI+Science也是一个多学科交叉探索的前沿方向,吸引了来自计算机科学、数学、物理学、化学、生物学等各个领域的探索者。其中有两位研究者格外引人瞩目:物理学方向的MaxTegmark和计算机科学方向的JureLeskovec。

MaxTegmark是麻省理工学院物理学教授、未来生命研究所(FutureofLifeInstitute)创始人。在学术生涯的早期阶段,MaxTegmark专注于宇宙学和量子信息的研究,利用基于信息论的数据分析工具进行宇宙微波背景辐射实验,结合最新观测数据和理论修正我们的宇宙学模型。现阶段,他的研究重点是将物理学和机器学习联系起来:AIforphysics,physicsforAI,利用基于物理的技术更好地理解生物和人工智能;同时也关注人工智能安全和可解释性。他在《穿越平行宇宙》一书中阐述了自己的“数学宇宙假说”(Mathematicaluniversehypothesis),在《生命3.0》中表达了对智能和未来生命终极形式的想象。个人主页:https://space.mit.edu/home/tegmark/。

MaxTegmark

JureLeskovec是斯坦福大学计算机科学学院副教授,在图网络领域做出众多贡献,是图表示学习方法node2vec和GraphSAGE框架的贡献者之一。他的研究领域是大型互联系统的应用机器学习,致力于建模各种尺度系统中复杂丰富的关系结构、图和网络,从细胞中蛋白质的相互作用到社会中人类之间的相互作用。应用领域包括常识推理、推荐系统、计算社会科学和计算生物学,特别是药物发现。个人主页:https://cs.stanford.edu/people/jure/。

JureLeskovec 

发起人团队介绍

吴泰霖,斯坦福大学计算机科学系的博士后研究员,由JureLeskovec教授指导。他从麻省理工物理学博士毕业,其毕业论文主题为AIforPhysicsandPhysicsforAI,本科毕业于北京大学。他的研究兴趣为AI+Science,包括开发机器学习方法用于大规模科学和工程仿真,开发神经符号方法用于科学发现,以及由科学问题启发的表示学习(运用图神经网络、信息理论和物理等方法)。他的工作发表在NeurIPS、ICLR、UAI等顶级机器学习会议以及物理学顶级期刊上,并被MITTechnologyReview报道。他是美国国家科学院院刊(PNAS)、NatureCommunications、NatureMachineIntelligence、ScienceAdvances等顶级期刊的审稿人。

个人主页:https://tailin.org/

扈鸿业,现作为哈佛量子计划研究员(HQIFellow),就职于哈佛大学物理系与哈佛大学量子计划。2022年在加州大学圣地亚哥分校获得物理博士学位(导师尤亦庄教授),2016年在北京大学获得物理学士学位(导师吴飙教授)。主要研究兴趣为量子计算,变分量子算法,量子态层析理论,生成型神经网络与无监督学习,强化学习,量子纠错码,量子多体物理,量子最优控制理论等。博士期间曾获得UCSD物理系挑战奖,NASA-USRA费曼奖学金,幺正基金(unitaryfund)奖金。

个人主页:https://scholar.harvard.edu/hongyehu

刘子鸣,目前是麻省理工学院(MIT)物理系博士生,导师是MaxTegmark。此前2020年他从北京大学获得物理学士学位。他的研究兴趣在AI和物理的交叉:一方面AIforPhysics,利用AI工具自动化物理规律和概念的发现;另一方面PhysicsforAI,利用物理启发构建AI理论和更具可解释性的模型。

个人主页:https://kindxiaoming.github.io/

报名参加读书会

本读书会适合参与的对象

基于AI+Science的相关学科研究,特别是对AI+Science研究中的模型、方法有浓厚兴趣的一线科研工作者;

能基于读书会所列主题和文献进行深入探讨,可提供适合的文献和主题的朋友;

能熟练阅读英文文献,并对复杂科学充满激情,对世界的本质充满好奇的探索者;

想锻炼自己科研能力或者有出国留学计划的高年级本科生及研究生。

本读书会谢绝参与的对象

为确保专业性和讨论的聚焦,本读书会谢绝脱离读书会文本和复杂科学问题本身的空泛的哲学和思辨式讨论;不提倡过度引申在社会、人文、管理、政治、经济等应用层面的讨论。我们将对参与人员进行筛选,如果出现讨论内容不符合要求、经提醒无效者,会被移除群聊并对未参与部分退费,解释权归集智俱乐部所有。

运行模式

本季读书会预计讨论分享8-10次,按暂定框架贯次展开;

每周进行线上会议,由1-2名读书会成员以PPT讲解的形式领读相关论文,与会者可以广泛参与讨论,会后可以获得视频回放持续学习。

举办时间

从2023年3月26日开始,每周日早上9:00-11:00,持续时间预计10周。我们也会对每次分享的内容进行录制,剪辑后发布在集智斑图网站上,供读书会成员回看,因此报名的成员可以根据自己的时间自由安排学习时间。

参与方式

此次读书会为线上闭门读书会,采用的会议软件是腾讯会议(请提前下载安装)。在扫码完成报名并添加负责人微信后,负责人会将您拉入交流社区(微信群),入群后告知具体的会议号码。

报名方式

第一步:扫码填写报名信息。

扫码报名

第二步:填写信息后,付费299元。

第三步:添加负责人微信,拉入对应主题的读书会社区(微信群)。

本读书会可开发票,请联系相关负责人沟通详情。

针对学生的退费机制

读书会通过共学共研的机制,围绕前沿主题进行内容梳理和沉淀,所以针对于学生,可以通过参与共创任务,获取积分,积分达到退费标准之后,可以直接退费。

加入社区后可以获得的资源

在线会议室沉浸式讨论:与主讲人即时讨论交流

交互式播放器高效回看:快速定位主讲人提到的术语、论文、大纲、讨论等重要时间点

高质量的主题微信社群:硕博比例超过80%的成员微信社区,闭门夜谈和交流

超多学习资源随手可得:从不同尺度记录主题下的路径、词条、前沿解读、算法、学者等

参与社区内容共创任务:读书会笔记、百科词条、公众号文章、论文解读分享等不同难度共创任务,在学习中贡献,在付出中收获。

共享追踪主题前沿进展:在群内和公众号分享最新进展,领域论文速递

参与共创任务,共建学术社区

PS:具体参与方式可以加入读书会后查看对应的共创任务列表,领取任务,与运营负责人沟通详情,上述规则的最终解释权归集智俱乐部所有。

阅读材料

AIforscientificsimulation

@FredericoFiuza

推荐人:吴泰霖

科学仿真(scientificsimulation)是科学中的核心任务之一。从微观的量子物理、化学、材料科学、生命科学,到宏观的流体力学、等离子体物理、气象学、天文学,它们都需要对一个大型的复杂系统进行模拟,以准确预测系统未来的演化,以及更好地控制和优化这个系统。传统的基于第一性原理的方法往往需要极大的计算量(比如需要上百万CPUhours),其准确度也有待提高。AI用于科学仿真(AIforscientificsimulation)的目标是通过机器学习的方法构建代理模型(surrogatemodels),以极大提高科学仿真的速度和准确度。

在AI用于科学仿真中,无论是微观还是宏观,以下的几点是核心问题:

对称性和守恒律:如何设计机器学习的模型架构使得物理系统的对称性和守恒律能被严格遵守?

多尺度和多分辨率:很多系统的时空动力学横跨多个尺度和分辨率,往往某些部分非常动态,需要非常精细的分辨率来准确模拟,而其他部分则比较静态。如何设计机器学习的模型架构能够达到准确度和计算量的合理权衡?

大规模特性:当需要模拟系统的自由度有上百万甚至上亿时,如何设计模型以降低计算量,或者让机器学习的架构能够适应这样大规模的特性?

长时预测的准确性:很多系统的模拟需要用相同的模型自回归地预测几十步甚至上千步,在这个过程中,模型的预测误差会累积,导致在自回归中机器学习模型的输入会来自分布外(out-of-distribution)。如何降低长时预测的误差,提高准确性?

由于任务的复杂度,AI用于科学仿真也能为机器学习和计算机科学提供全新的挑战,在如何设计全新的结合对称性的神经网络、表示学习、泛化理论、高性能计算、不确定性量化(uncertaintyquantification)等方面有很多全新的机会。

文章列表:

Lam,R.,Sanchez-Gonzalez,A.,Willson,M.,Wirnsberger,P.,Fortunato,M.,Pritzeletal“GraphCast:Learningskillfulmedium-rangeglobalweatherforecasting.”ArXiv

推荐语:DeepMind提出的一个用图神经网络作为代理模型来实现中程天气预报(7天)。其模型超越了开发了几十年的传统方法天气预报的准确度。其使用的多尺度图神经网络架构和训练方法有借鉴意义。

Li,Z.,Kovachki,N.B.,Azizzadenesheli,Ketal.(2021b).“FourierNeuralOperatorforParametricPartialDifferentialEquations”.InternationalConferenceonLearningRepresentations(ICLR).

推荐语:本文提出了基于傅里叶变换的神经算子(neuraloperator)架构,能够实现函数空间之间的直接映射。其在偏微分方程的模拟中具有很好的准确率,并且能够实现superresolution。

Pfaff,T.,Fortunato,M.,Sanchez-Gonzalezetal.(2021).“LearningMesh-BasedSimulationwithGraphNetworks”.InternationalConferenceonLearningRepresentations(ICLR)

Wuetal.(2023)“LearningControllableAdaptiveSimulationforMulti-resolutionPhysics”.InternationalConferenceonLearningRepresentations(ICLR)

推荐语:第一篇文章(Pfaffetal.)提出了MeshGraphNets,能够很好地进行基于网格的模拟(mesh-basedsimulation),能够用于流体力学、计算机图形学等物理仿真领域。

第二篇文章(Wuetal.)本文针对众多科学仿真中的多分辨率的问题,提出了一个新的方法,用一个MeshGraphNet学习系统的演化,另一个MeshGraphNet学习空间局域的再网格化(remeshing),实现准确率和计算量的合理权衡。

Jumperetal.“HighlyaccurateproteinstructurepredictionwithAlphaFold”.Nature

推荐语:本文提出了著名的AlphaFold2.0,其对蛋白质三维构象的预测的准确度极大超越了其他方法。

DeepPotentialMolecularDynamics:ascalablemodelwiththeaccuracyofquantummechanics,PhysicalReviewLetters

推荐语:本文提出了DeepPotentialMolecularDynamics的方法用于分子模拟。其模型包含系统的所有自然对称性,其准确率达到了量子力学精度。

Satorrasetal.(2021)“E(n)EquivariantGraphNeuralNetworks”.InternationalConferenceonLearningRepresentations(ICLR)

推荐语:本文提出了等变图神经网络,将空间平移和旋转的等变性(equivariance)植入到图神经网络的设计中,实现了在分子性质预测的优越性能。其将对称性植入神经网络的设计的思想值得学习。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇