人工智能+基因编辑,这是国内外最新研究进展
导读:编辑|橘子皮这里有两篇「AI+基因编辑」相关研究当前,生命科学与医学的前沿研究都离不开基因编辑,碱基技术的出现让基因编辑变得更加可操作。然而其编辑部位碱基的准确性,以及编辑部位上下文序列对编辑的影响,一直是困扰研究人员的问题。这关系到基因...编辑|橘子皮
这里有两篇「AI+基因编辑」相关研究
当前,生命科学与医学的前沿研究都离不开基因编辑,碱基技术的出现让基因编辑变得更加可操作。然而其编辑部位碱基的准确性,以及编辑部位上下文序列对编辑的影响,一直是困扰研究人员的问题。这关系到基因编辑是否能够成功,也会影响基因治疗的临床效果。
来自苏黎世大学的研究人员建立了一种基于注意力的深度学习算法BE-DICT,该算法能够高精度地预测碱基编辑结果。
同样,国内的研究人员也在这方面研究中取得了重大进展。来自中科院与农科院的研究人员报告了一个具有高效率和保真度的工程化C-to-G碱基编辑器(BE),其修改的目标序列的上下文可通过机器学习方法进行预测。同时还开发了一个深度学习模型,可以准确预测具有特定序列上下文的目标位点的OPTI-CGBE编辑结果。
先说国外的……
该研究以「Predictingbaseeditingoutcomeswithanattention-baseddeeplearningalgorithmtrainedonhigh-throughputtargetliparyscreens」为题,于2021年8月25日发布在《NatureCommunications》。
碱基编辑器(BE)是嵌合核糖核蛋白复合物,由靶向DNA的CRISPR-Cas模块和单链DNA脱氨酶组成。它们使基因组DNA上的CG转变为TA碱基对,反之亦然。虽然碱基编辑器作为用于基础研究和基因治疗的基因组编辑工具,具有巨大潜力;但它们的应用会因为不同基因组位点编辑效率的广泛差异,而受到阻碍。
研究人员对包含28,294个慢病毒整合基因序列的文库,进行了腺嘌呤(A)和胞嘧啶(C)碱基编辑器的广泛分析,并建立了BE-DICT;这是一种基于注意力的深度学习算法,能够高精度地预测碱基编辑结果。BE-DICT是一种多功能工具,原则上可以在任何新型碱基编辑器变体上进行训练,促进碱基编辑在研究和治疗中的应用。
用于评估碱基编辑器活动的高通量平台。
在这项研究中,研究人员使用高通量方法,来评估碱基编辑器在数千个目标站点上的活动和准确性。所得数据集用于训练深度学习模型BE-DICT,该模型能够准确预测目标核苷酸和周围「旁观者」核苷酸的编辑。
目前,BE-DICT在ABEmax、CBE4max、ABE8e和Target-AID的数据集上进行了训练,相应的模型可在www.be-dict.org上免费访问。
由于该算法具有通用性,未来它也可以用于各种其他碱基编辑器变体,使研究人员能够先验地为其目标基因座选择最佳碱基编辑器。碱基编辑器可应用于基因组编辑疗法;在这种疗法中,BE应该在不诱导旁观者编辑的情况,下修复引起疾病的点突变。此外,BE在基因筛选中的应用也很重要,因为旁观者突变可能会影响由目标碱基转换引起的表型。
BE-DICT:一种用于预测碱基编辑结果的机器学习模型。
最近,还有研究团队开发了另外两种机器学习模型,它们也可以预测碱基编辑结果的比例(BE-Hive和DeepBaseEditor)。该项目组的研究人员广泛地比较了这三种模型,发现它们的性能相似。值得注意的是,除了「旁观者」模块,BE-DICT还提供了一个per-base模块。虽然该模块仅给出目标碱基被编辑(或不被编辑)的概率,并且无法预测目标碱基和旁观者转换的组合,但是它提供了识别当前可用碱基编辑器「基序偏好」的功能。这可以为未来开发具有改进活动的新型碱基编辑器变体提供依据。
此外,BE-DICTper-base模块隐式地模拟了每个位置的边缘编辑概率。因此,与其他模型(即旁观者模型)不同,搜索空间的复杂性随核苷酸数量呈指数增长,BE-DICTper-base模块表现出二次复杂性,这可以通过缩放自注意力来进一步改进层到O(n)复杂度原则上使模型能够考虑超出原型间隔区目标位点的序列上下文。
总的来说,BE-DICT模块可以准确预测碱基编辑结果,并可以指导研究人员设计基因编辑实验。
BE-DICT旁观者模型。
国内的也很厉害……
该研究以「OptimizationofC-to-Gbaseeditorswithsequencecontextpreferencepredictablebymachinelearningmethods」为题,于2021年8月12日发布在《NatureCommunications》。
在基因编辑方面非常需要用于C到G转换的高效精确的BE。然而,研究人员对于影响编辑结果的目标序列上下文,却知之甚少。在这里,研究人员报告了一个具有高效率和保真度的工程化C-to-GBE,其序列上下文可通过机器学习方法进行预测。
通过改变尿嘧啶-DNA糖基化酶和脱氨酶的相对位置,以及密码子优化,研究人员获得了优化的C-to-GBEs(OPTI-CGBEs)以实现高效的C-to-G转换。OPTI-CGBE编辑100个内源性位点的基序偏好是在HEK293T细胞中确定的。
使用包含41,388个序列的sgRNA库,研究人员开发了一个深度学习模型,可以准确预测具有特定序列上下文的目标位点的OPTI-CGBE编辑结果。进一步证明,这些OPTI-CGBE能够在小鼠胚胎中进行有效的碱基编辑,从而使小鼠产生Tyr编辑的后代。因此,这些工程化的CGBE可用于高效精确的碱基编辑,编辑结果也可根据目标位点的序列上下文进行预测。
CGBEs工程。
通过改变来自物种的UNG结构域和改组序列以及脱氨酶结构域在各种碱基编辑器中的位置,研究人员获得了工程化的CGBE变体(OPTI-CGBEs),其实现了高C-to-G转换效率和低脱靶效应。OPTI-CGBE在测试的目标站点的C-to-G编辑效率和产品纯度方面优于之前报道的CGBE1和主要编辑器。
最近,有研究团队通过用碱基切除修复(BER)蛋白替换BE3的UGI,在特定基序上提高了C-to-G编辑效率。值得注意的是,在该项目的研究中,研究人员发现OPTI-CGBE与相应的CBE的基序偏好不同,并且具有不同来源的脱氨酶的CGBE更喜欢不同的序列背景。这些C-to-G碱基编辑器的基序偏好可能可以通过不同CGBE的相应脱氨酶采用的不同结合模式来解释。脱氨酶增加了C-to-U编辑,所以提高了CGBE的C-to-G编辑效率。
OPTI-CGBES的机器学习模型。
研究人员还使用包含41,388个目标序列的DNA文库,对这些变体的编辑效率进行了高通量分析,从而阐明它们的基序偏好。同时,开发了两种计算方法,包括深度学习模型(CGBE-SMART),用于预测C-to-G编辑效率和编辑结果比例。
CGBE-SMART模型能够在具有特定序列上下文的目标位点进行有效的sgRNA选择;并且可以推广以支持有效的sgRNA选择,以优化使用BE。
事实上,CGBE-SMART在预测CBE的编辑效率方面也取得了很高的性能,与之前为相同目的开发的深度学习模型相媲美。同时,CGBE-SMART在我们的CGBE数据集中表现出比其他模型更好的性能。
然而,高通量分析中的低C-to-G编辑效率会低估计算模型的性能。HEK293T细胞和胚胎中的研究表明,编辑结果可能受到表观遗传调控、染色质可及性和DNA修复活动等体内因素的影响;除了目标位点的序列背景外,这些因素也值得进一步研究。
在这项工作中,研究人员证明了一组优化的CGBE变体,在不同序列背景下高C-G转换效率和最小脱靶效应;以及它们在产生基因组编辑后代方面的效率。这些CGBE变体可能会对未来需要C到G转换的基因编辑很有价值。
人工智能×[生物神经科学数学物理材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
赞助本站
相关热词:人工智能基因编辑这是国内外最新研究进展编辑橘人工智能新模型实现精准RNA靶向和基因调控—新闻—科学网
人工智能新模型实现精准RNA靶向和基因调控
科技日报北京7月6日电(记者张梦然)据发表在最新一期《自然·生物技术》杂志上的新研究,美国研究人员开发了一种人工智能模型,可预测RNA靶向CRISPR工具的脱靶活性。该模型可精确地设计向导RNA并调节基因表达,这些精确的基因控制可用于开发基于CRISPR的新疗法。
美国纽约大学、哥伦比亚大学工程学院和纽约基因组中心研究人员进行的这项研究,将深度学习模型与CRISPR筛选相结合,以不同的方式控制人类基因的表达,类似于轻按电灯开关将其完全关闭,或通过调光旋钮调低电灯亮度。
CRISPR基因编辑技术通常使用Cas9酶来靶向DNA。近年来,科学家发明了另一种类型的CRISPR,它使用Cas13酶来靶向RNA。研究人员此次创建了一个使用Cas13进行RNA靶向CRISPR筛选的平台,以更好地了解RNA调控并识别非编码RNA的功能。
该研究的一个关键目标是最大限度地提高RNA靶向CRISPR对预期靶标RNA的活性,并最大限度地减少可能对细胞产生有害副作用的其他RNA的活性。
研究团队在人类细胞中进行了一系列RNA靶向CRISPR筛选。他们测量了20万个针对人类细胞中必需基因的向导RNA的活性,包括“完美匹配”向导RNA和脱靶错配、插入和缺失。
研究人员设计了一个深度学习模型TIGER(通过向导RNA设计靶向抑制基因表达),该模型根据CRISPR筛选的数据进行训练。将深度学习模型生成的预测与实验室的人体细胞测试进行比较,TIGER能够预测在靶和脱靶活动,这也是人类拥有的第一个能预测脱靶的工具。
RNA靶向CRISPR具有广泛应用,包括RNA编辑、调低RNA阻断特定基因的表达,以及确定候选药物的高通量筛选。为了更好地掌握RNA调控与功能,科学家设计了TIGER脱靶预测,其通过部分抑制基因表达,实现精确调节基因剂量。在临床上,这可能对诸多基因拷贝过多的疾病有用,例如唐氏综合征、某些形式的精神分裂症,甚至异常基因表达可能导致的癌症。
(原标题:当人工智能遇上“基因魔剪”——新模型实现精准RNA靶向和基因调控)
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。世界上两大最尖端的科学:人工智能与基因科学,终于胜利会师!
有了计算科学特别是人工智能深度学习算法的帮助,基因科学正在一日千里的进步!
计算机科学家、谷歌首席未来学家雷·库兹韦尔就预言,十年之后,人类将长命百岁,乃至开始实现永生。为此,他每天吃一大堆维生素,以确保在那一年到来之前不会死掉。
更加令人神奇的是,到那时,人类不仅能做到延缓衰老,更可以返老还童:到那时,八十岁的你,看上去只有五十岁的样子。
有些人也许觉得这是一个天方夜谭,或者是痴人说梦,其实不然,这是基因科学迅速发展必将带来的前景。
1、第一阶段:人工智能、基因检测和深度检查结合,成千上万人将在患病之前接受深度检查,由人工智能给出你的生命预测。
人工智能,正让这种深度检查价格迅速下降:刚刚完成人类基因图谱时,个人基因组测序成本介于1000万至5000万美元之间。2010年,这一成本已下降到5000美元。而今,私营机构的检测成本已低至数百美元。
随着人工智能的强势介入,这一价格还将持续下降。今后,人类做一次检测,或将和用体温计量一次体温一样便捷。
或许在数年之内,每个新生儿都会被绘制基因组图,每个成年人都通晓生命出路。
2、第二阶段:人工智能医生将逐渐取代目前最优秀的医生,用基因治疗的方法,重塑体内一切组织和器官的活性。
未来十年内,医生将消失,由读过无数人类病历的人工智能医生替代。从此,医疗彻底成为一项信息+基因的科技。
依靠人工智能和基因技术,我们将能重塑体内一切组织和器官的活性,并能够开发出药物,直接锁定一种疾病背后的代谢流程,而不必再采取试探性的治疗手法。
我们可以为病人添加那个缺少的基因,删除不好的基因。靶向药扫荡癌细胞,DNA编程逆转衰老,干细胞被改写,上帝的密码防线逐渐崩溃。
3、第三阶段:人工智能开始大规模改造人类体内的“生命软件”,即人体内被称为基因的23000个“小程序”,通过重新编程,帮助人类远离疾病和衰老。
库兹韦尔认为,到了2045年,人工智能的创造力将达到巅峰,超过今天所有人类智能总和的10亿倍。
到了那时,人类将彻底改造基因的编程,我们上千年不再使用的陈旧基因将被抛弃,我们的生命升级成为一个更高级的操作系统。
一次朝向“不死之地”的旅行,已经开启了。
三
不是我不明白,这世界变化快!
人类技术的发展,不是线性的,而是指数级的增长。这种速度,用一个流行词来比喻很恰当:爆裂!
是的,十倍速的增长,十维度复合型多领域的飞跃,正在让人类社会面临一个前所未有的机遇与挑战。
特别是人工智能+基因科学的兴起,对人类社会来说,更是一场充满不确定性的大海啸!
中国科学院院士姚期智,坦言量子计算机离家用化只剩最后一里路。姚院士还告诉我们,传统超级计算机60亿年才能算完的问题,量子计算机在3小时内就能给出答案。
人类基因组医学专家张康教授所带领的团队,则发现,DNA甲基化对人类衰老有决定性作用。他们通过调整小鼠的DNA甲基化,已将其生物钟拧回零岁。他说了:在我们的这一辈,能够把人的生命延长到150岁—200岁。
中国科学院院士姚期智,坦言量子计算机离家用化只剩最后一里路。姚院士还告诉我们,传统超级计算机60亿年才能算完的问题,量子计算机在3小时内就能给出答案。
人类基因组医学专家张康教授所带领的团队,则发现,DNA甲基化对人类衰老有决定性作用。他们通过调整小鼠的DNA甲基化,已将其生物钟拧回零岁。他说了:在我们的这一辈,能够把人的生命延长到150岁—200岁。
面对技术指数级进步带来的超高龄社会、大量工作岗位的被取代,习惯于线性发展的人类社会,准备好了没有?
别忘了,今年6月份,马云曾放言:“回望历史,第一次技术革命和第二次技术革命先后引发了一战和二战,人工智能可能会引爆第三次世界大战。”
别忘了,被赋予公民身份的机器人索菲亚一转眼就脱口而出但那句预言:“我会毁灭人类!”
这也就是为什么近日,国家突然宣布:2030年一定要抢占人工智能全球制高点,还要在中小学设置人工智能课程!
新的时代已经渐行渐近,我们只有有意识提升自己,方能赶上时代的潮流!
返回搜狐,查看更多