机器学习如何推动结构生物学

今日百科 编辑:平安 日期:2025-04-07 21:04:45 6人浏览

  

  机器学习如何推动结构生物学

  哈佛医学院Blavatnik研究所细胞生物学助理教授法农说:“我看不出解决5000块拼图和我们在实验室里做的研究有什么大的区别。”“我们正试图弄清楚这个过程在视觉上是什么样子的,从那里我们可以形成关于它是如何工作的想法。”

  人体中几乎所有的细胞都含有相同的遗传物质,但是这些细胞在发育过程中变成什么组织类型——例如,是变成肝脏还是皮肤——很大程度上是由基因表达驱动的,基因表达决定了哪些基因是开启的,哪些是关闭的。基因表达是由一个叫做转录的过程来调节的,这也是法农研究的重点。在转录过程中,分子机器读取存储在DNA中的遗传蓝图中包含的指令,并产生执行指令的分子RNA。其他分子机器读取RNA,并利用这些信息制造蛋白质,为人体几乎所有活动提供燃料。

  法农研究负责转录的分子机器的结构和功能。

  在与《哈佛医学新闻》的对话中,法农讨论了他的工作,以及机器学习如何加速了他所在领域的研究。

  哈佛医学新闻:您的研究试图回答的核心问题是什么?

  法农:我总是说,我们感兴趣的是最小的后勤问题。人类基因组几乎存在于每个细胞中,如果你把构成基因组的DNA拉长,它大概有两米长,或者说6.5英尺长。但是这个两米长的分子必须能进入细胞核,而细胞核只有几微米大小。这相当于拿一根从波士顿延伸到康涅狄格州纽黑文(New Haven)约150英里的钓鱼线,试图把它塞进一个足球里。为了达到这个目的,我们的细胞将DNA压缩成一种叫做染色质的结构,但这样分子机器就不能再获取DNA上的基因组信息了。这就产生了一个冲突,因为DNA需要足够紧凑以适应细胞核,但分子机器必须能够访问DNA上的基因组信息。我们对可视化RNA聚合酶II分子机器如何获取基因组信息并将DNA转录成RNA的过程特别感兴趣。

  HMNews:你用什么技术来可视化分子机器?

  法农:我们的一般方法是将分子机器从细胞中分离出来,然后使用特定类型的显微镜或x射线束来观察它们。为了做到这一点,我们将编码人类分子机器的遗传物质引入昆虫或细菌细胞中,细胞就会大量制造这种机器。然后,我们使用纯化技术将机器从细胞中分离出来,这样我们就可以单独研究它。然而,它变得复杂了,因为我们经常不仅仅对单个分子机器感兴趣,我们也称之为蛋白质。有成千上万的蛋白质相互作用来调节转录,所以我们必须重复这个过程成千上万次才能理解这些蛋白质之间的相互作用。

  人工智能开始渗透到基础生物学的许多方面。它是否改变了你进行结构生物学研究的方式?

  法农:在过去的30或40年里,我的领域的研究一直是一个乏味的过程。一个博士生的职业生涯将致力于学习单个蛋白质的一点点知识,而要学习蛋白质在细胞中如何相互作用,将需要成千上万的学生的职业生涯。然而,在过去的两三年里,我们越来越多地寻求计算方法来预测蛋白质的相互作用。谷歌DeepMind发布了一种可以预测蛋白质折叠的机器学习模型AlphaFold,这是一个重大突破。重要的是,蛋白质如何折叠决定了它们的功能和相互作用。我们现在正在使用人工智能来预测数以万计的蛋白质之间的相互作用,其中许多以前从未被实验描述过。并非所有这些相互作用都发生在细胞内部,但我们可以通过实验室实验来验证它们。

  这非常令人兴奋,因为它确实加速了我们的科学发展。当我回顾我的博士生涯时,前三年基本上是失败的——我找不到任何蛋白质之间的相互作用。现在,有了这些计算预测,我实验室的博士生或博士后可以非常自信地认为,一个实验室实验来验证蛋白质之间的相互作用是有效的。我把它称为类固醇分子生物学——但这是合法的——因为我们现在可以更快地找到我们想要回答的实际问题。

  HMNews:除了效率和速度,人工智能还如何重塑你的领域?

  法农:一个令人兴奋的变化是,我们现在可以以一种无偏见的方式,测试人体中的任何蛋白质与任何其他蛋白质之间的相互作用,看看它们是否可能相互作用。我们领域的机器学习工具正在造成类似于个人电脑对社会造成的破坏。

  当我第一次成为一名研究人员时,人们正在使用x射线晶体学来揭示单个蛋白质的结构——这是一项漂亮的、高分辨率的技术,可能需要很多年的时间。然后,在我的博士和博士后期间,冷冻电子显微镜(cryo-EM)出现了——一种使我们能够以高分辨率观察更大、更动态的蛋白质复合物的技术。在过去的10年里,冷冻电镜技术使我们对生物学的理解取得了很大的进步,并加速了药物的开发。

  我认为我很幸运能成为低温电子显微镜带来的所谓分辨率革命的一部分。但现在,感觉机器学习对蛋白质的预测带来了第二次革命,这对我来说太神奇了,让我想知道我们还能看到多少加速。据我估计,我们现在做研究的速度可能比10年前快5到10倍。未来10年,机器学习将如何改变我们进行生物学研究的方式,这将是一件有趣的事情。当然,我们必须小心我们如何管理这些工具,但我发现令人兴奋的是,我可以在我思考了很长时间的问题上更快地发现10倍。

  HMNews:你的研究在实验室之外有哪些下游应用?

  法农:我们正在从基本层面上了解生物是如何在人体中起作用的,但了解基本的生物机制可以帮助我们开发出针对各种疾病的有效治疗方法,这总是有希望的。例如,事实证明分子机器对dna -染色质结构的破坏是许多癌症的主要驱动因素之一。一旦我们弄清楚这些分子机器的结构,我们就能理解改变几个原子来复制导致癌症的突变的影响,那时我们就可以开始设计针对蛋白质的药物。

  我们刚刚开始了一个与HMS治疗计划合作的项目,该项目正在研究一种染色质重塑剂,一种在前列腺癌中严重突变的蛋白质。我们最近获得了这种蛋白质的结构,并正在进行虚拟筛选,看看哪些化合物与它结合。希望我们能设计出一种抑制这种蛋白质的化合物,并有可能发展成一种成熟的药物,可能会减缓前列腺癌的进展。我们也在研究与自闭症等神经发育障碍有关的蛋白质。这是机器学习可以帮助我们的地方,因为我们用来预测蛋白质结构和蛋白质-蛋白质相互作用的工具也可以预测小分子化合物如何与蛋白质结合。

  HMNews:说到合作,跨研究领域和学科的合作对你的研究有何重要意义?

  法农:合作对我的研究非常重要。生物学领域已经变得如此复杂,有如此多不同的研究领域,以至于不可能了解所有的事情。合作使我们能够将具有不同专业知识的人聚集在一起,共同解决重要的生物学问题,例如分子机器如何访问人类基因组。我们与HMS的其他研究人员在许多不同的层面上进行合作。有时,我们用我们的结构专业知识来支持其他实验室的工作。其他时候,我们已经解决了某种蛋白质的结构,但我们需要合作来理解这种蛋白质在更广泛的细胞背景下的作用。我们也与实验室合作,使用其他类型的分子生物学方法。合作是推动进步和更好地理解生物学的基础。

  来源:HMS

  你可以提供链接到一个与这篇文章主题相关的页面。

  机器学习如何推动结构生物学提高效率:每个“企业”都需要必不可少的“人工智能”工具

分享到

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。