你是否想过,人工智能能够像预测天气一样预测你未来的健康状况? 最新发表在《自然》杂志上的研究给出了肯定答案。一个名为Delphi-2M的AI模型,仅凭个人病史就能预测1000多种疾病的发病风险,准确度甚至堪比专业临床评估工具。
这项突破性研究来自德国癌症研究中心和欧洲分子生物学实验室的合作团队,他们修改了著名的GPT架构,创造出了这个能够理解疾病发展历程的AI系统。
研究人员发现了语言和疾病发展之间的惊人相似性:正如单词在句子中的排列有规律可循,疾病在人生不同阶段的出现也遵循着某种模式。基于这一洞见,团队对GPT-2模型进行了三大关键改进:
• 用连续年龄编码替代位置编码——疾病发展是连续过程,不是离散事件;
• 增加时 间预测头——预测下一个疾病事件及其发生时间;
• 调整注意力掩码——处理同时发生的多种疾病情况;
Delphi-2M在UK Biobank的40万参与者数据上训练,并在另外10万人身上验证了其预测能力。结果显示,该模型对97%的疾病诊断都表现出了预测能力(AUC>0.5),其中对死亡风险的预测准确率高达0.97。
特别令人印象深刻的是,Delphi-2M在丹麦190万人群体中的外部验证也取得了成功,无需任何参数调整就能直接应用,证明了其强大的泛化能力。
Delphi-2M最引人注目的能力是生成未来健康轨迹。研究人员让模型基于60岁前的健康数据,模拟了每个人未来的疾病发展路径。结果显示,这些模拟轨迹与真实情况高度吻合。
模型能够准确反映不同生活方式对健康的影响。吸烟、饮酒和BMI高低人群的疾病负担变化在模拟中得到了真实再现,为个性化健康干预提供了科学依据。
通过分析模型的嵌入空间,研究人员发现了疾病之间有趣的内在联系。在模型的“疾病地图”上,相同类型的疾病会自然聚集,如糖尿病常与它引起的视网膜病变、神经病变聚集在一起。
研究还揭示了疾病影响的持续时间差异:癌症对死亡率的影响会持续数年,而败血症的影响则在短期内急剧下降。这一发现与传统的流行病学分析结果一致,验证了模型的可信度。
研究同时揭示了健康数据中存在的偏见。UK Biobank参与者相比一般人群更富裕、教育程度更高,且白人比例过高。Delphi-2M学会了这些偏见,预测结果中也反映了这些不平等。
数据来源的不平衡也影响了预测:主要在医院记录的疾病(如败血症)在预测中更倾向于出现在有住院史的人群中,这可能是模型过度依赖数据收集方式而非真实生物学规律。
Delphi-2M代表了医疗AI的新方向。未来的扩展可能包括整合基因组数据、代谢组学信息、医学影像甚至可穿戴设备数据,打造全方位健康预测系统。
实际应用场景包括:识别最需要诊断检查的人群、发现那些尚未达到常规筛查年龄但高风险的人群,以及为医疗资源规划提供数据支持。
研究人员谨慎指出,这类模型目前更适合辅助医疗决策而非直接用于治疗,但在医疗系统规划和政策制定方面已有巨大潜力。
随着AI技术的不断发展,我们正迈向一个能够 更精准预测健康风险的未来。Delphi-2M只是开始,下一代模型可能会直接从自由文本中提取信息,甚至与大型语言模型结合,为每个人提供更个性化的健康指导。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。