2025年6月6日,复旦大学生命科学学院田卫东教授课题组在 Genome Medicine期刊在线发表了题为《PhenoDP: Leveraging Deep Learning for Phenotype-Based Case Reporting, Disease Ranking, and Symptom Recommendation》的研究论文。该研究开发了一种新颖的表型驱动诊断工具 PhenoDP,融合大型语言模型(LLM)与对比学习技术,显著提升了孟德尔遗传病的诊断效率与准确率,为临床罕见病辅助诊断提供了高效、智能的解决方案。
研究背景
单基因遗传病(孟德尔疾病)影响全球约8%人口,早期精准诊断对改善患者预后具有重要意义。然而,由于表型信息的
完整性与疾病表征的复杂性,现有表型驱动诊断工具在疾病排序与症状推荐上仍面临挑战。PhenoDP正是为解决这些瓶颈而提出的新一代诊断辅助工具。
图1 PhenoDP框架组成与算法流程
PhenoDP包含三大核心模块(图1):
Summarizer:基于蒸馏训练的Bio-Medical-3B-CoT模型,输入HPO术语,输出高质量、以患者为中心的临床摘要,提升症状的可解释性。
Ranker:融合IC值、Phi系数和图卷积网络(GCN)三种相似性计算方法,实现精准疾病排序,特别在复杂疾病中表现突出。
Recommender:基于对比学习优化的Transformer模型,智能推荐区分疾病所需的关键症状,提高诊断精度与置信度。
图2 Summarizer的知识蒸馏示意图
性能评估与对比分析
作者在四类模拟数据和三套真实数据集(共计5996个真实病例)上系统评估了PhenoDP的性能:
模拟数据集:在所有难度类型下,PhenoDP的Top20覆盖率和平均倒数排名(MRR)均为第一,分别比次优方法提高11.7%和12.6%。
真实数据集:在三组独立真实患者数据中,PhenoDP的Top1准确率分别高出8.1%、8.6%、2.6%。
症状推荐能力:在目标疾病原本排序为第2/3的病例中,使用PhenoDP推荐的新症状后,有78.1%的病例目标疾病升至第一位,远优于GPT-4o(53.4%)和PhenoTips(23.3%)。
图3在真实数据集上对Ranker的评估结果
图4对Recommender的评估结果
案例分析:免疫缺陷病IMD103
研究以IMD103为例,初始排序中该疾病与其他免疫缺陷病(如IMD25)分数接近。PhenoDP的Recommender成功推荐出区分性症状“淋巴结病”,使IMD103得分显著上升并拉开与相似疾病的差距;而GPT-4o和PhenoTips推荐的症状缺乏区分度,甚至导致排序错误。
实用性与未来应用
PhenoDP已开源发布(https://github.com/TianLab-Bioinfo/PhenoDP),支持一键生成结构化报告,输出临床摘要、候选疾病列表与症状推荐结果,便于医生快速决策与后续诊断。模块化设计还便于未来集成基因信息、电子病历或进一步优化语义建模。
综上,PhenoDP通过深度学习技术革新了表型驱动的诊断流程,为罕见病诊断提供了高效、精准的解决方案。该工作有望加速临床决策,改善患者预后。
复旦大学生命科学学院计算生物学系直博生温宝乐为本文第一作者,田卫东教授为通讯作者。该研究得到了国家自然科学基金的支持。
原文链接:https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-025-01496-8#Sec37