Evo 2 是一款突破性的生物学基础模型,旨在通过深度学习解码生命全域的复杂遗传信息。该模型基于全新的 StripedHyena 2 架构,在包含 9 万亿个 DNA 碱基对的庞大数据集上训练而成,并具备高达 100 万令牌的超长上下文窗口。它能够以单核苷酸分辨率精准预测基因变异(如 BRCA1 突变)的功能影响,而无需特定任务的微调。通过机械可解释性分析,研究人员证实 Evo 2 已掌握了诸如外显子边界、转录因子结合位点及蛋白质结构等核心生物学特征。此外,该模型展现了卓越的生成能力,能够自主设计具有生物合理性的线粒体、原核及真核基因组序列。最终,该研究通过开源模型参数与代码,为加速生物系统设计和理解生命复杂性提供了强有力的工具。
References:
- Brixi G, Durrant M G, Ku J, et al. Genome modelling and design across all domains of life with Evo 2[J]. Nature, 2026: 1-13.
Fler avsnitt av 聊聊Sci
Visa alla avsnitt av 聊聊Sci聊聊Sci med 淼淼Elva finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.
