来源:《百度网》 2022-11-05
颜宁全职回国的消息刷屏了。据报道,她将辞去美国普林斯顿大学教职,全职回到国内,出任深圳医学科学院创始院长。
颜宁与昔日导师、同样从普林斯顿辞职回国的施一公一同被视为爱国科学家的典范。她未满30岁即从普林斯顿大学博士毕业并回到清华大学任教,成为“清华最年轻教授”。2017年,颜宁离开清华,受邀加入普林斯顿大学,在国内引起讨论和猜测,她本人甚至背上“叛国”的议论。也有观点认为,颜宁是因为在国内评不上院士而出走。
如今颜宁全职回国,公众讨论的话题自然也离不开家国情怀、中美两国科研条件与人才评价体系等话题。
普林斯顿大学给予颜宁的是雪莉·蒂尔曼终身讲席教授席位,这样的头衔即使在美国本土教授中也是顶级的。2019年和2021年,颜宁分别当选美国国家科学院和美国艺术与科学院的外籍院士。如此之高的身份地位,并非如一些人所猜测,在美国“混不下去”。
我们不妨留心一项数据的变化:国际三大顶级科学期刊(Cell, Nature, Science,下文称CNS)的发文数量。这也是评价基础科学,尤其是生物医学领域研究成果的一项重要指标:
2015年-2018年,颜宁每年的CNS发文数量均在3篇以上,2019年更是达到了5篇,但从此之后开始下滑,2020年为4篇,2021年为2篇,而今年已经到了11月,只发表了1篇。
是个人不够努力?还是美国给予的科研条件与人力支持不足?当这些因素都被排除后,一名某一细分领域内知名科学家的产出断崖式下降,原因只有一个:
颜宁所从事的结构生物学研究,或许已经“凉了”。
01 何为结构生物学?
我们对蛋白质这一名词并不陌生,但它绝不仅仅满足营养需求。人体内的激素、酶、受体、抗原等物质多数都是蛋白质,它们参与了许多疾病和大多数生理活动的进程,也可以成为药物靶点。组成生物体的氨基酸实际上只有20多种,但它们以最多可达上千个分子的数量任意排列组合,并以各种复杂的方式折叠、连接后,可以形成数以亿计的蛋白质。每一种蛋白质的氨基酸组成和结构都是独一无二的,也决定了它在生物体内的性质和作用。
而结构生物学的主要任务,就是勾勒出每一种蛋白质的三维结构,分析出它由哪几种氨基酸组成,又是以何种方式折叠和连接的。诺贝尔奖得主费曼曾半开玩笑地说:“许多基础的生物问题是非常容易解决的,只要能看到它们就行。”在结构生物学发展起来以前,科学家只能通过不断的试验验证蛋白质这种大分子物质在生理活动中扮演的角色,而结构生物学发展起来之后,科学家得以“看到”蛋白质的微观世界,进而更加快速准确地推断出其性质和作用。
结构生物学的意义也是不容忽视的,从脑内淀粉样蛋白质变性沉积导致的阿尔茨海默病,到病毒包膜蛋白逃避免疫识别,都可以从蛋白质结构的角度突破。解析细胞表面蛋白和受体的结构,还有助于开发新的药物。
然而,蛋白质结构的复杂性和数量之多,决定了这是一项需要大量物力和时间投入的工作。结构生物学发展初期,科学家通过X射线解析蛋白质结构。X射线穿过蛋白质晶体时会在照相板上留下衍射图像,显示出晶体内部的原子排列规律。经过多次照射和数学计算,最终可以推断出蛋白质的结构。
通过这种方式,科学家在1960年首次解析出了抹香鲸肌红蛋白的结构,这在当时是极具颠覆性的成果。在之后的几十年内,科学家解析出了更多蛋白质的结构,包括核糖体、ATP酶、肌动蛋白、氧化还原酶、RNA聚合酶等重要物质,也开启了结构生物学的黄金时代。
但在结构相对简单的蛋白质都被解析完毕后,X射线的缺陷愈发显露出来。X射线每次只能从一个角度穿过蛋白质晶体,留下一个角度的衍射图像,而科学家需要成百甚至上千个角度的图像才能组合出一种蛋白质的结构雏形。之后,他们还需要进行大量的数学计算,完善蛋白质的精确结构。即使在有计算机辅助的情况下,这项工作仍然非常耗费时间。此外,X射线还会带来图像分辨率过低的问题。
冷冻电镜的出现解决了这些问题。它可以将蛋白质样品冷冻在一层非晶体的玻璃态冰膜中,保持蛋白质在自然状态下的结构,并且通过冷冻瞬时捕捉到蛋白质在不同状态下的近生理构象,节省了多角度获取图像和数学计算的时间。加上高分辨率的冷冻电镜和不断发展的图像算法技术,如今科学家能够勾勒出更加清晰和复杂的蛋白质三维结构。
除去价格高昂这一因素,冷冻电镜可谓完美,无异于结构生物学领域的“第二次工业革命”。在其支持下,目前全球的几千名结构生物学家已经解析出19万种蛋白质的结构。
然而,一家英国科技公司推出的AI技术,击碎了所有结构生物学家对“第二春”的幻想。
02 飞速发展的AIphaFold,让结构生物学成了“天坑中的天坑”
都说选择比努力更重要,基础科学研究更是如此。如果多年前颜宁能够预料到今天AI的发展,想必她一定不会选择结构生物学这一细分领域。
2020年12月1日,被誉为“蛋白质奥林匹克竞赛”的国际蛋白质结构预测竞赛(CASP)上传出一条震动整个生物医学界的消息:一项名为ALphaFold的AI技术获得了冠军,它能够基于氨基酸序列精准预测蛋白质的三维结构,准确性可与冷冻电镜相媲美。
在多篇科学报道中,AIphaFold的胜利被称为“50年来的重大突破”。这源于诺贝尔化学奖得主克里斯蒂安·安芬森(Christian Anfinsen)1972年提出的大胆假设:所有蛋白质的结构都完全由氨基酸序列决定。
不论这一假设是否真的成立,AIphaFold的胜利都为实现这一假设创造了可能。
而开发AIphaFold的公司想必大家都听说过——DeepMind,就是开发出AIphaGo,接连击败李世石和柯洁两位世界最顶尖围棋手,甚至让柯洁在比赛中痛哭的那家英国科技公司。除了会下围棋,DeepMind旗下的AI技术还实现了史上最快的矩阵乘法计算速度,解决了一个50年来悬而未决的数学问题,提出过两个数学猜想,并在量子水平描述物质、控制核聚变、癌症筛查、解析古文字、预测天气等领域都有建树。
在“蛋白质奥赛”上夺冠后不久,DeepMind又火速推出了第二代AlphaFold,它能够以原子水平的准确度预测自然界约2/3的蛋白质结构。公司还联合欧洲分子生物学实验室(EMBL-EBI)开放了AlphaFold2预测的蛋白质数据库。到今年7月,这一数据库的蛋白质结构已经从100万个扩展到了2亿个,仅用了一年时间就翻了200倍,并且涵盖了自然界几乎所有的蛋白质。
而我们在前文提到,AIphaFold出现之前,全球数千名结构生物学家花费数十年时间,只解析出了19万种蛋白质的结构。过去需要最少也需要几个月的工作,如今只需几秒就可以完成。
如此飞快的提速对整个生物医学界来说可谓惊喜,意味着科学家无需再耗费大量时间解析蛋白质结构,而是可以像把玩模型一般,对任一种蛋白质的结构细细端详,从中挖掘出新的细微发现。
但对结构生物学家来说,AIphaFold的胜利无异于“失业”的警钟。如果说从前的他们是蛋白质结构的探路者,那么在AIphaFold面前,他们最多只是检验预测结果是否准确的质检员。
03 AI冲击下,结构生物学如何求生?
其实,AIphaFold的胜利并非无迹可寻。早在2018年的“蛋白质预测奥赛”上,它就成功答对了43个蛋白质折叠问题中的25个,成为当年的冠军,而第二名只答对了3个问题。
从本质上说,AIphaFold和冷冻电镜都属于提高蛋白质结构解析效率的变革性工具,只是AIphaFold的颠覆性要明显强得多。结构生物学界也早已经意识到,不论冷冻电镜亦或AI都只是研究工具,并开始进行研究方向的调整。
RNA剪接体结构,是当下结构生物学最热门的研究方向之一。RNA剪接是真核生物遗传信息传递中涉及中心法则的关键一环,而这一过程需要RNA剪接体的参与。如果RNA剪接体异常,就有可能发生基因剪接错误,导致人类疾病的产生。研究发现,30%的人类遗传紊乱和多种癌症都与某些基因的错误剪接有关。
解析RNA剪接体,有助于找到基因相关疾病背后的元凶。然而,RNA剪接体是一种分子量巨大、高度动态变化的分子机器,其构象复杂且多变。如果把蛋白质结构比作一帧画面,那么RNA剪接体的结构之复杂,相当于一部无数帧画面组成的电影。即使是预测出2亿种蛋白质结构的AIphaFold2,目前也无法完成这样复杂的工作。
要完整地拼接出这样一部电影,不仅需要记录下每一帧画面,还需要找到每一帧画面的变化速度,这在结构生物学中被称为分子动力学。这在现有技术手段之下仍是无法研究的,需要借助更多生物物理技术、计算生物学手段去探索,不仅是结构生物学家未来研究的方向,也是他们与AI合作的契合点。通过AI技术,可以发现RNA剪接体动态变化背后的驱动力,甚至模拟外力(电场、磁场、各种长度的波等)对生物大分子的影响,促成新的发现。
实际上,在一些学术含量较高的平台上,存在对颜宁及其昔日导师施一公研究成果的质疑。有生物学背景的人士指出,解析蛋白质结构不过是给蛋白质“打上标签”,或是利用冷冻电镜给蛋白质“拍照”,这类型研究与发现信号通路、揭示分子机制的研究带来的价值相差甚远。
这或许也是结构生物学应该反思的问题,或是说未来推进的方向——让结构生物学从结构回归生物。结构生物学不应该止步于解析大分子物质的结构,还要探究这些大分子物质在人体生理活动中发挥的作用,以及它们如何导致人类疾病的发生。
AIphaFold的胜利不是结构生物学的终结,反而可能是它全新的开始。