AI、蛋白世界与可逆转的未来
2023-02-08
来自:
威海海洋生物
浏览次数:189
11月8日,2022年“互联网之光”博览会在乌镇开幕,其中,对阿尔茨海默病的识别、干预和治疗获得了全场瞩目。
同样,在11月10日落幕的第五届中国进口博览会上,对于帕金森病患者的治疗同样成了全场焦点,无论是使用脑深部电刺激(Deep Brain Stimulation,DBS)的物理治疗技术还是使用第三代COMT抑制剂的奥吡卡朋进行药物治疗,虽然无法做到治疗,但是这些都让帕金森病患者看到了正常生活的曙光。其实,像是阿尔茨海默病、亨丁顿氏舞蹈病、帕金森病等会给患者带来巨大的生理或心理痛苦的疾病有一个统一的疾病来源,那就是蛋白质错误折叠。蛋白质是生物体内功能的执行者,人体内的任何功能,从催化化学反应到抵御外来侵略都是蛋白质作用的结果,蛋白质折叠是生命活动的基本过程。随着对一些疑难病与罕见病研究的深入,研究人员发现只有蛋白质折叠形成正确的三维空间结构才可能具有正常的生物学功能,如果这些生物大分子的折叠在体内发生了故障,形成了错误的空间结构,不但将丧失其生物学功能,还会导致上面这些疾病的发生。细胞作为生命体的基本单位,每个活细胞执行功能的背后,都有大量的通过特殊途径折叠的蛋白质在执行着非常专一的任务,但是如果此生物功能的源头出现了错误就会引起麻烦,一个细胞的日常活动充满着潜在的隐患,出现错误会引起严重的后果。从细胞的死亡(如:神经变性疾病)到癌细胞不受控制的生长,为保证细胞的正常生活,细胞的各部分在执行各自任务时,往往通过各种层次的“质量控制”(Quality Control)来识别、纠正和防止错误的发生。在内质网和分泌路径的下游细胞器中,有多种质量控制机制以保证在细胞生命过程中蛋白质表达的准确性,因为只有那些能够通过严格选择程序的蛋白质才能达到相应的靶组织和细胞器。因此,了解如何防止错误折叠,以及如何拯救错误折叠的蛋白质成为分子生物学领域非常重要的研究课题,这些研究与人类罕见病与疑难杂症的治疗息息相关,譬如“渐冻症”,这个困扰了传奇物理学家史蒂芬·霍金一生的罕见病就是生物科学家力图通过解构蛋白质解构来解决的一种疾渐冻症(即肌萎缩侧索硬化),顾名思义,会让患者表现出进行性加重的骨骼肌无力、萎缩等,就像是一点点被冻住了一样。这种疾病非常残忍,它会让患者在不失去思考能力的同时丧失行动能力。2014年,全世界掀起一场旨在关注渐冻症并为其患者捐款的公益活动——ALS冰桶挑战赛”(ALS Ice Bucket Challenge),总捐款超过2亿美金。2019年,这项挑战的发起者皮特弗雷茨在家人陪伴下离世,此前,他经历了与ALS长达7年的抗争。经过科研人员多年的研究,发现解开这副可怖枷锁的钥匙可能就在核孔蛋白(Neucleoporins)上。科研人员们认为渐冻症和核孔蛋白组成的核孔复合体有着极强的关联,如果能够进一步了解核孔蛋白和核孔复合体,我们就有可能找到治疗渐冻症的方案。然而确定核孔复合体的结构并不容易。核孔复合体由超过1000 条、30多种不同的核孔蛋白组成,每条蛋白的大小只有数纳米,这些蛋白质以极其复杂的结构折叠并相互交错。即便使用显微镜技术也很难对这样复杂的结构进行有效观察,这对于生物学家们造成了很大的障碍。令人欣喜的是,哈佛大学吴皓实验室的彼得罗·丰塔纳 (Pietro Fontana)团队在英国人工智能科研公司DeepMind开发的蛋白质预测模型AlphaFold的助力之下,在2022年攻克了核孔蛋白这一天文级难题。
丰塔纳的研究团队取得了关键性的进展:他们不仅成功预测出了之前没有被探究清楚的一批核孔蛋白的结构,还绘制出了核孔复合体的胞质环(Cytoplasmic Ring)的模型图。该团队还在《科学》上发表题为“核孔复合体胞质环的结构”(Structure of cytoplasmic ring of nuclear pore complex by integrative cryo-EM and AlphaFold )的论文。
丰塔纳表示:“我们通过冷冻电镜技术拿到了核孔复合体高分辨率的密度图,然后借助AlphaFold 结构预测,搭建出核孔复合体胞质环的精细模型……我认为AlphaFold 已经完全改变了结构生物学。”这一历史性的生物信息学突破,为攻克像渐冻症等罕见、难治的神经退行性疾病,重新点亮了希望。有意思的是,如此重要的发现和研究,对于 AlphaFold 来说倒像是一件“信手拈来”的事情。2021 年7 月,DeepMind 这一谷歌旗下的人工智能公司就在《自然》中发表文章称,其深度学习程序AlphaFold 已经预测出了35 万种蛋白质结构,涵盖了约98.5% 的人类蛋白质组和20 种生物的蛋白质,并开源了它的数据库。这一举动在生物学和计算机两大领域掀起波澜,并在当年入选《自然》年度科学事件。科学家认为,DeepMind 预测蛋白质3D 结构的深度学习程序将颠覆生物学,让药物发现与蛋白质结构预测加速升级。仅一年后,AlphaFold 的数据库就实现了200 倍扩容,截至目前,地球上已知的所有生物(包括动物、植物、细菌、真菌等)总共2.14 亿种蛋白质的结构都已经被AlphaFold 预测出来。蛋白质是生命的基石,决定着细胞里发生的事情。蛋白质由多种氨基酸组成,这些氨基酸序会自主折叠成稳定的3D 结构,这种结构决定了蛋白质如何工作及其性能。针对某种病原体的小分子药物研发,是通过将治疗分子附着在病原体上抑制其功能而起作用的。身处“后疫情时代”,投资界的关注为整个生命科学的研究注入了无限的动力,生命科学领域具体技术的研发屡获突破性进展,尤其在基因组测序、AI蛋白质折叠、疫苗研究方面表现突出,人们都渴望这些代表未来的新技术能够尽快把人们的生活带回正轨,而科学家们也正在这些全新的研究领域披荆斩棘,这也非常符合《麻省理工科技评论》的预测。2022 年,“AI蛋白质折叠”入选《麻省理工科技评论》“全世界十种突破性技术”。几十年来,实验室实验一直是获得良好的蛋白质结构的主要手段。一开始,科学家们使用X 射线束照射结晶的蛋白质,然后将衍射光转化为蛋白质的原子坐标。通过这种方法,我们在20 世纪50 年代确定了蛋白质的完整结构,随后有大量的蛋白质结构在实验室里被还原出来。在过去10年里,科学家们则多使用冷冻电子显微镜成像等技术,直接观察病毒蛋白,进而一步步推敲出蛋白质3D结构。虽然使用计算机预测蛋白质结构在二十世纪八九十年代便出现了,但这些早期尝试并未成功。AlphaFold 的诞生更是改变了整个“游戏格局”,媒体称它的出世“照亮了整个蛋白质宇宙”。
科学家们都获益于 DeepMind 将数据库开源之举,不同领域的研究者们都能够自由探索其潜能,其应用能从药物发现到蛋白质设计再到复杂生命起源研究等场景不断延伸。蛋白质结构预测比赛(Critical Assessment of Techniques for Protein Structure Prediction,CASP)评委、马克斯·普朗克发育生物学研究所的演化生物学家安德烈·卢帕什(Andrei Lupas)说,AlphaFold帮他发现了困扰他数十年的一种蛋白质的结构。他认为AlphaFold将改变他的工作方式和他要解决的问题。“它将改变医学,改变研究,改变生物工程,改变所有。其他科学家也正在利用AlphaFold 的数据库搜索潜在的新蛋白质家族,以扩充人们对蛋白质结构和功能的认知,他们中有人正试图发现新的食塑酶,以期解决白色污染问题。全世界的结构生物学家也是AlphaFold技术的受益人,因为以前他们每年要花大量的时间来做无意义的预测和筛选工作,而现在则从这些繁重的工作中解放出来了。本来每年只有几十个获得的结构等待研究,而现在有几十亿个,大大提升了研究范围。AI在此刻与人类科学家一起,为人类更美好、更健康的未来同频共振。新冠疫情的发生,为社会生产生活带来了巨大的改变,也成为了AI的试金石。新冠病毒的重要确认手段之一就是通过核酸检测的方式,通过提取疑似病例体液中的核酸序列,与目标病毒比对,确定有无病原体感染。然而,与疑似病例的病毒样本进行全基因组序列分析比对费时费力,而通过人工智能的手段,可以代替人力完成初筛工作,大幅提高检测效率。在药物发现阶段,人工智能也能够在靶点筛选和化合物合成与筛选两个场景下有效发挥作用。这些都是AI为我们前往更光明的未来填充的加速剂。