AI解构蛋白质可能给生物学和医学带来飞跃

作者:yunmu  于 2020-12-2 08:01 发表于 最热闹的华人社交网络--贝壳村

通用分类:其它日志

在第14 届全球蛋白质结构预测竞赛(Critical Assessment of protein Structure PredictionCASP)上,谷歌旗下的AI公司DeepMindAI AlphaFold大展雄风。它可从蛋白质的氨基酸序列中又快又准地预测该蛋白质的三D结构,这可能给生物学甚至医学带来新的飞跃

按照中心法则, 生命密码是由 4 种碱基组成的DNA支配的。这 4 种碱基通过排列组合,翻译出 64 3个相邻mRNA结成的密码子,每个密码子代表某种氨基酸。 在这些密码子的指令下,20 多种氨基酸以不同的排列组合构成数亿种不同的蛋白质。除了不同氨基酸的排列组合,更重要的是氨基酸链的 3D 结构,决定着不同蛋白质的功能。这些蛋白质功能有机地结合为活体,并形成丰富多彩的生命活动。

蛋白质的 3D 结构在一定程度上决定了蛋白质在体内的作用。例如,胰岛素受体位于脂肪细胞, 骨骼肌细胞和肝细胞上, 它是由2个细胞外α亚基及其各自连接的β亚基组成的折叠蛋白质,能识别血液和组织液中的胰岛素, 在糖代谢方面发挥重要功能。

又如, 新冠刺突的中和抗体也是折叠成特定结构的蛋白质, 它靶向新冠病毒刺突蛋白受体的结合区域。而该区域是刺突蛋白与人体细胞上的ACE2受体结合的关键位置。该抗体通过与新冠病毒表面的特异性抗原相结合,防止它们与细胞上表达的ACE2受体结合。这一功能可防止新冠病毒进入细胞而感染未受染的人类细胞。

知道结构后会更好地了解蛋白质功能的作用机理。因此,提高或精准测定蛋白质三D 结构的技术多次获得了诺贝尔化学奖。例如,1962年授与了解决血红蛋白三D结构的测定;1985年授予X射线晶体衍射的新方法;2017 年授高分辨率结构测定的冷冻电子显微镜技术的新发明。因为测定3D 结构仍然费钱耗时难精准,顶级科学期刊也热衷于发表某个蛋白质解构的成果。

不过,借助于X射线晶体学, 核磁共振, 和价值数千万美元的冷冻电镜等技术来确定完整的蛋白质结构,通常花费数月甚至数年才能解构一个蛋白质。所以, 在人类已知的数亿个蛋白质中,只有大约千分之一的结构已经被准确测定了。如果按照这些技术走下去, 不知猴年马月才能把全部蛋白质解构。

DeepMind公司于2014年被Google6亿美元的价格收购,现在拥有约1000名员工,收购后由AlphabetGoogle的母公司)提供资金支持。该公司的研发投入巨大但是一直未能实现盈利。

但是, 该公司已经以创造可以玩Space Invaders和围棋等游戏的AI系统而闻名于世,在科学界也有一定的影响。现在,它与Facebook AI ResearchMicrosoftOpenAI等一起成为全球AI竞赛的领导者之一。AlphaFold的性能也标志着DeepMind的转折点。

AlphaFold在百余支参与CASP竞赛的队伍中一马当先,脱颖而出。CASP历时数月,定期发放比赛所使用的蛋白质给参赛者,各参赛团队有数周时间来研究和提交其结构预测。然后,一组独立的科学家使用度量标准来评估预测结果。评估者在评分时并不知道这些作品是属于那一个团队的。

CASP另外安排使用传统耗时的方法来测定参赛者使用蛋白质的结构,并把它们作为评估的黄金标准,这对参赛者是保密的。如果一参赛团队提交的预测结构和标准的相似度越高,那它的得分也就越高。

总体而言,与两年前的上一次CASP相比,今年对结构的预测准确度增加了,但是大部分进展应归功于AlphaFold。例如,在被定为中等难度的蛋白质靶标上,其他团队的最佳表现通常为75分左右,而AlphaFold得分大约为90分。另外,大约一半的参赛团队总结他们的方法时提到了“深度学习”,这表明人工智能正在对该领域产生广泛的影响。

DeepMind 17万多种已知蛋白质结构的数据和进化信息训练AlphaFold的神经网络,AlphaFold将深度学习与张力控制算法结合,对这些蛋白质结构的数据进行归纳总结。 也就是说,  正是结构生物科学家多年的劳心劳力的研究积累,才为AlphaFold的成功打下了一定的基础。

AlphaFold可以独立预测氨基酸的 D 结构后, 研究人员把它学会的本事来测定新的蛋白质的结构。它通过预测蛋白质主链的角度, 它的氨基酸之间的距离, 及它们之间化学键的角度, 结合蛋白质折叠的物理结构, 然后调整结构预测的氨基酸位置。成熟的神经网络只需数小时就能预测出一个蛋白质的结构。可以说, 它有望成为了解蛋白质结构的主要工具。

理论上,这些氨基酸的三D结构决定着蛋白质的功能。若能根据蛋白质的氨基酸序列测出大量未知蛋白质结构,人类可以更清楚地了解和疾病相关蛋白质的作用,以及它们是如何造成伤害的,并设计出新的蛋白质来抗击疾病。例如,可以据此设计新的蛋白质来解决环境中塑料污染的问题。它也有助于人类加速了解细胞的组成和运作规律,推进一些新药的研发。这将改变生物学研究,改变生物工程,它或许也将提升医学。

主要参考资料

https://www.nature.com/articles/d41586-020-03348-4

https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

 

 


高兴

感动

同情

搞笑

难过

拍砖

支持
3

鲜花

刚表态过的朋友 (3 人)

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

yunmu最受欢迎的博文
  1. 妙药神菜马齿苋 [2020/08]
  2. 饥不择食 鹿和菜果 [2020/09]
  3. 多强和多久的活动才能抵消一天静坐对身体的害处 [2019/04]
  4. 说亚洲人阴茎小是没有事实的偏见 [2021/10]
  5. 为什么糖化血红蛋白高于6.5%定为糖尿病但美国医师学会的控糖目标是7-8% [2019/03]
  6. 日本人比美国人身体活动少吗? [2019/08]
  7. 美国房子和房产税 [2021/06]
  8. 成年移民能把英语学到母语水平吗? [2020/09]
  9. 机器人会取代医生吗? [2019/07]
  10. 美国新冠病毒感染者概况和中国的比较类似 [2020/03]
  11. 自杀是因为心理素质太差吗 [2019/04]
  12. 为什么亚裔大学毕业生的优秀率低于白人毕业生 [2019/04]
  13. 德州兴起和加州减速 [2021/04]
  14. 多数营养补充剂和延年益寿无关 [2019/07]
  15. 遗传风险不会影响生活方式对心血管疾病的作用 [2019/08]
  16. 新冠新热点巴西青壮年死亡比例高 [2020/05]
  17. 东亚人是否对新冠病毒较为易感? [2020/02]
  18. 1918西班牙大流感及它与新冠肺炎的异同 [2020/03]
  19. 在去年12 月或9月样本中检出新冠抗体的意义 [2020/12]
  20. 拉丁裔的新冠表现和健康饽论 [2020/06]
  21. 浅谈基础疾病和新冠病情 肥胖可能不增加病亡风险 [2020/04]
  22. 如果死的是华人会是什么结局? [2020/06]
  23. 2020年美国10大死因及它们的一些关系 [2022/02]
  24. 为什么受到伤害的是华人? [2020/09]
  25. 这次大选民调比2016年的失准 [2020/11]
  26. 神经病和里根总统遇刺 [2020/09]
  27. 我们应该怒向歧视而不是躲避歧视 [2020/05]

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2013 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2024-3-25 07:02

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部