Sveriges mest populära poddar
聊聊Sci

796-DIAMOND DeepClust:蛋白质宇宙超大规模聚类方法

26 min15 april 2026
这份研究介绍了一种名为 DIAMOND DeepClust 的超快速蛋白质序列聚类算法,旨在解决生命科学领域日益增长的大规模蛋白质数据组织难题。该工具利用级联聚类和并行计算技术,成功将 190 亿个蛋白质序列分类,其运行速度和灵敏度均显著优于传统的 MMseqs2 等软件。通过对这种“蛋白质宇宙”的深度降维,研究者发现这种大规模聚类能显著提升 AlphaFold2 在蛋白质结构预测上的准确性。该方法为地球生物基因组计划等全球性科研项目提供了必要的技术支撑,使处理数万亿级序列成为可能。作者还公开发布了这一庞大的聚类数据库,为探索演化规律和识别新蛋白质提供了宝贵资源。

References:

  • Buchfink B J, Barbé É, Ashkenazy H, et al. Clustering the protein universe of life using DIAMOND DeepClust[J]. Nature Methods, 2026: 1-4.

聊聊Sci med 淼淼Elva finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.