2026年4月23日,OpenAI正式推出面向医生的AI工具ChatGPT for Clinicians,向所有经过身份验证的美国执业医师、执业护士、医师助理和药剂师免费开放。该工具基于GPT-5.4大模型构建,专注于循证医学赛道,在全新发布的医疗评测基准HealthBench Professional上,以59.0分的总分全面超越人类医生的43.7分——即便后者拥有无限时间和联网权限。通用大模型巨头正用“免费+更优性能”的打法,向已估值120亿美元的垂直赛道领军者发起正面冲击。
精准复刻循证医学赛道:ChatGPT for Clinicians的五大核心功能
当业内人士看到ChatGPT for Clinicians的功能清单时,感觉似曾相识。
这款免费医生版ChatGPT的核心能力与OpenEvidence高度重合。第一,免费开放先进医疗AI模型,帮助医生处理日常文书工作和医学研究,无需额外付费。第二,依托循证医学能力,AI能够从权威审核的医学资料中快速分析临床病例,提供诊断判断建议。第三,将重复性医疗工作封装为固定模板,医生可一键生成转诊单、诊疗授权书、患者须知等文档。第四,高效完成医学期刊文献检索与汇总,AI自动筛选权威资料,数分钟内生成标注完整引用的专业报告。第五,临床学习积分同步——医生日常使用AI查询、解答临床问题时,合规的专业内容查阅记录可自动折算为继续医学教育学分,无需单独整理材料或额外上课。在数据安全方面,OpenAI承诺对话内容不用于模型训练,符合条件的账户还可通过业务伙伴协议获得HIPAA合规支持。

不过,在同类功能之上,GPT-5.4带来了更强的底层模型能力与安全验证。据美国医学会最新调查,已有72%的医生将AI应用于临床实践,较去年的48%大幅跃升。OpenAI发言人Karan Singhal透露,过去一年临床医生使用公共版ChatGPT的频率已翻倍。ChatGPT for Clinicians正是对这一需求的结构化回应——将通用大模型的能力精准封装为医疗工作流工具。
性能碾压人类医生,OpenEvidence面临“碾压+免费”双重夹击
ChatGPT for Clinicians一推出便引发热议,不仅因为功能复刻,更在于它已在医生实测和基准测试中碾压人类。
安全性是医疗AI的第一道门。OpenAI组建了数百名医生顾问团队,持续审核AI的每一条医疗相关回复。正式上线前,医生顾问累计实测6924次真实对话,覆盖临床诊疗、文书撰写、医学研究等全场景。最终数据显示,99.6%的模型回答被医生判定为安全且准确。
性能层面,OpenAI同步推出了HealthBench Professional全新医疗评测基准。该基准由60个国家的262名医生构建,包含5000组高仿真多轮医疗对话,融合了262位医生制定的48,562项评分标准。其中约三分之一内容为专业“反向测试”,模拟最难红队对话,场景复杂度是普通对话的3.5倍,专门用于排查模型漏洞。

在HealthBench Professional上,采用GPT-5.4的医生专用工作空间综合得分达到59.0。作为对比,人类医生得分为43.7(不设答题时间限制,允许联网查阅)。基础版GPT-5.4得分为48.1,Anthropic Claude Opus 4.7为47.0,谷歌Gemini 3.1 Pro为43.8,xAI Grok 4.2为36.1。也就是说,专为临床优化后的GPT-5.4比通用版本高出近11分,比人类医生高出15.3分。在真实来源引用测试中,ChatGPT for Clinicians引用正确医学来源的频率甚至高于人类医生。
这个定价策略对OpenEvidence构成了结构性冲击。OpenEvidence过去几年以“对医生免费”的模式积累了约74万名注册医师(占全美执业医师约45%),2025年年化收入突破1.5亿美元,估值达到120亿美元,其商业模式本质是向制药公司和医疗器械公司收取B端营销费用。OpenAI以“免费+更强性能”入场,且自带GPT-5.4的品牌效应和用户基础,很可能在未来数月内迅速分流用户,对OpenEvidence的用户增长和广告收入空间形成压制。OpenEvidence的优势在于先发积累、高频使用习惯和广告变现闭环,但通用AI巨头凭借底层模型优势和品牌号召力正面切入垂直赛道的现象,正在更多行业上演。对专注于单一赛道的垂直AI公司而言,建立防守壁垒的窗口正在快速收窄。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。