文/观察未来科技
7月28日,deepmind 公司与欧洲生物信息研究所(embl-ebi)的合作团队公布了生物学领域的一项重大飞跃。
研究人员利用人工智能(ai)系统 alphafold 预测出超过 100 万个物种的 2.14 亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。
早在1972年,诺贝尔化学奖得主christian anfinsen博士就在诺奖颁奖典礼上提出,蛋白质的氨基酸结构应该能完全决定其三维结构。但由于氨基酸可能形成的蛋白质构象是个天文数字,通过计算预测蛋白质结构难度极高。而利用传统的实验手段(例如x射线晶体学)解决该问题,时间消耗以及价格都十分惊人。
对于此次公布的全新数据,deepmind与embl-ebi团队表示,在超过2亿个蛋白质结构预测中,大约35%的结构具有高精度,达到了实验手段获取的结构精度;80%的结构可靠性足以用于多项后续分析。
实际上,alphafold预测的许多结构都很可靠,能在很多情况下替代实验解析的结构。其他情况下,研究人员会用alphafold的预测结果验证和解读实验数据。不可靠的预测结果很快就能知道,其中一些源于蛋白质固有的无序性质,这种无序意味着蛋白质本身没有固定的形状,至少在没有其他分子的情况下是无序的。这一突破将加速新药开发,并为基础科学带来全新革命。
值得一提的是,自发布至今,alphafold 已产生令人难以置信的影响。它是 deepmind 构建的最复杂的人工智能系统,需要多项关键创新,并已应用到多种下游任务中。alphafold2 可以在原子精度上准确地预测蛋白质的结构,它不仅为生物学中 50 年来的重大挑战提供了米乐体育官网app入口的解决方案,也证明了:人工智能可以极大地加速科学发现,进而推动人类进步,这一点意义重大。这让生物学领域也真正参与和见证了科技的力量,并提醒生命科学的研究人员们——彻底转变思考方式。
当前,deepmind 已经开源了 alphafold 的代码,并在《自然》杂志上发表了两篇深度论文,引用量已超过 4000。此外,deepmind 还与 embl-ebi 合作设计了一种帮助生物学家使用 alphafold 的工具,并共同发布了 alphafold db。
不过,目前的alphafold仍有提升的空间。伦敦大学学院的tomek wlodarski 博士提出,如何开发模型来预测蛋白质如何折叠,而不仅是预测最终的结构,是研究团队接下来要解决的问题。deepmind的科学团队主管pushmeet kohli博士也指出,现阶段他们正在提升alphafold的准确性与性能:“我们试图理解这些蛋白质的行为、它们如何与其他蛋白质互作。”