这篇文章介绍了一种名为TITAN的多模态全玻片基础模型,旨在推动计算病理学领域的发展。这种基于Transformer的模型使用了大规模数据集(包含335,645张全玻片图像)进行预训练,并结合了视觉自监督学习和病理报告及合成描述的语言对齐。TITAN的核心优势在于能生成通用的玻片特征表示,有效解决了现有模型在处理大型图像规模和数据受限(尤其是针对罕见疾病)方面的复杂挑战。综合评估结果显示,TITAN在形态学分类、分子预测和预后分析等多种临床任务中,表现显著优于其他玻片编码器。此外,其多模态能力解锁了关键功能,例如零样本诊断和在组织切片与临床报告之间的快速跨模态检索。
References:
- Ding T, Wagner S J, Song A H, et al. A multimodal whole-slide foundation model for pathology[J]. Nature Medicine, 2025: 1-13.
Fler avsnitt av 聊聊Sci
Visa alla avsnitt av 聊聊Sci聊聊Sci med 淼淼Elva finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.
