医疗影像辅助诊断被业界认为是人工智能(AI)在卫生健康领域最快落地的场景之一。
截至2024年6月,可查证的医学影像AI相关第三类注册证已批92张,单家企业最多持有13张。
然而看似繁花似锦的背后,是“活得不舒服、没有商业模式”的企业、散在的医院应用、未被改变的工作效率与人力成本。
其根源在于技术供给与临床核心需求之间出现了严重的结构性错位。
AI影像软件已展现出显著的技术潜力。部分先进模型在特定疾病诊断任务中的准确率超过90%,为提升医疗效率、改善医疗资源分配不均带来了新希望。
以肺部疾病影像诊断为例,AI能够快速、精准地识别X光、CT影像中的结节、炎症等病变,其速度和准确性在某些场景下甚至超越了人类医生的平均水平。
然而获得注册证只是商业化的起点,而非终点。王振常院士一针见血地指出,当前医学影像AI产品的根本性缺陷在于:其功能设计与医学影像科真实工作流程及临床需求严重脱节。
临床需要的并非针对单一病灶的孤立识别,而是对特定解剖区域(如心脏、腹部)进行整体评估的服务。
医疗数据涵盖患者大量敏感隐私,从基本身份信息到详细病史、诊断结果,一旦泄露将对患者权益造成严重侵害。
数据传输、存储、使用环节都面临着黑客攻击、内部人员违规操作等风险。
医生对AI诊断结果往往持谨慎态度,AI“黑箱”式的决策过程让医生难以洞悉诊断依据,影响其对结果的采信。
多数医疗AI模型基于深度学习算法,其决策过程如同“黑箱”。当AI诊断系统判定某患者肺部结节为恶性时,医生无法从模型输出中清晰了解其判断依据。
市场上充斥着肺结节软件、脑梗死软件等聚焦单病种、单征象的碎片化工具。
合理的临床试验统计学设计能保证最大限度地控制偏倚、减少试验误差、提高试验质量。
主要目的是评估医学影像人工智能医疗器械在预期适用范围下的辅助检测诊断学性能,并观察产品的可用性与安全性。
具体包括分诊提示、异常识别、疾病类型分析、病程阶段分析以及提供辅助诊断结果等,确认产品优于/等效于/非劣于已上市同类产品。
随机平行对照设计采用随机、平行对照、开放、评估者盲法临床试验设计,符合要求的影像图片随机分为产品阅片组和对照组,分别进行阅片,并比较阅片结果。
交叉自身对照设计是医学影像AI器械试验的主要设计类型。在这类试验中,应采用目标疾病病灶诊断或检出的“金标准”、已上市的同类诊断器械、临床认可的“临床参考标准”。
多阅片者多病例设计(MRMC) 是一种适用于医学影像AI器械临床试验的新设计类型,阅片者随机分为不同组,每组对应不同的阅片模式顺序。
自身配对设计中,同一个受试者影像样本接受两种不同诊断方法进行诊断,来评估新的诊断技术的诊断性能及准确性。
诊断性试验的定性指标选择上,在有金标准的情况下,灵敏度和特异性是诊断试验的首选评价指标。ROC曲线下面积(AUC)可用于比较不同产品或阅片模式的诊断效能。
在没有金标准时,可通过比较AI器械诊断结果与“临床参考标准”的诊断结果之间的一致性来评估AI器械的性能。
定量指标的临床意义需由临床专家确定,例如骨龄等。
在医学影像AI器械的临床试验中,评价指标常为灵敏度和特异度,可基于灵敏度计算阳性组的样本量,基于特异度计算阴性组的样本量。
若前瞻性收集受试者影像样本,在计算得到阳性组/阴性组样本量后,还需除以目标人群阳性率/阴性率方可得到每组的受试者数。
对于MRMC研究设计,样本量估计通常分为病例和阅片者数量两部分,影响样本量的参数可以概括为试验效应、变异和相关三部分。
随机化能够保证受试者有相同概率被分配到试验组或对照组,能够控制各种未知和已知因素的影响。
医学影像AI器械临床试验随机化策略通常包括影像样本的随机抽样、阅片者随机分组和阅片顺序的随机分配。
理想情况下,要求临床试验都尽可能做到完整设盲,即受试者、研究者和评价者都不知道分组信息。而医学影像AI器械临床试验中,有时难以实现受试者或研究者的设盲,此时应采取评估者盲法。
我国已在AI医疗影像的核心技术上具有领先优势,需整合AI医疗科技企业、医院、科技及卫生健康主管部门等共同研究制定AI医疗影像应用指南中国标准,提升AI医疗影像技术应用质量。
鉴于临床医疗数据既涉及患者隐私,又是支撑国家公共健康管理的重要资源,需平衡好数据安全保护与开放应用的关系。
应采取严格的数据加密和访问控制措施,对临床医疗数据实现有效监管与合规使用。
AI医疗影像可结合患者的临床医疗数据及个人健康数据进行诊断、分析,并制定精准的治疗方案。
应顺应AI医疗影像的发展趋势,加快医疗服务模式智慧化变革,推动以AI医疗影像为基础的专病中心建设、多学科联合诊疗。
科研人员正致力于开发可解释的AI算法,通过可视化技术,将AI诊断过程中的特征提取、决策逻辑以直观方式呈现给医生。
例如在影像诊断中,以热力图形式展示AI关注的影像关键区域及对诊断结果的影响程度,帮助医生理解AI决策依据,逐渐消除对“黑箱”的疑虑。
医疗AI产品在进入临床广泛应用前,需进行大规模、长时间的临床验证试验,与传统诊断方法对比,积累大量临床数据,证明其诊断准确性、可靠性。
针对医生开展AI技术培训,使其深入了解AI诊断原理、优势与局限性,在实践中逐渐熟悉并掌握与AI协同工作的方法。
未来医疗AI将融合更多前沿技术,如物联网、区块链、5G等。
区块链技术保障医疗数据的不可篡改与可追溯性,进一步提升数据安全。
医疗AI将从目前主要集中的诊断领域,向疾病预防、治疗方案制定、康复管理等全流程延伸。
在疾病预防阶段,通过分析人群健康大数据,预测疾病流行趋势,为公共卫生决策提供依据。
在治疗方案制定环节,AI根据患者个体特征、病情及过往治疗案例,为医生提供个性化治疗方案建议。
临床验证方案设计是连接AI影像软件注册上市与临床广泛采纳的关键桥梁。它不仅是技术验证的科学要求,更是建立临床信任的核心环节。
随着可解释AI技术的突破,香港理工大学团队开发的新系统能够详细解释自己的思考过程,就像一位经验丰富的医生在教学查房时的表现。
这种透明性正是建立临床信任的关键。
参考资料:
CSDN博客:《医疗AI再突破:辅助诊断准确率超90%,但落地医院仍面临数据安全与临床信任难题》
手机网易网:《医学影像AI:繁荣下的困局与系统性破局之道——基于王振常院士的临床洞见》
腾讯新闻:《香港理工大学团队突破医学AI黑盒:让机器“边看边想”诊断胸片,准确率堪比专家还能解释推理过程》
CSDN博客:《生成式AI在医学影像中的应用:现状、挑战与未来》
腾讯新闻:《多向发力,为AI医疗影像发展赋能》
盛恩医药-医疗器械CRO:《医学影像人工智能医疗器械临床试验设计思路》
瑞旭集团:《CT类肺结节人工智能软件临床试验设计要素 - 案例分析》
微博文章:《《医学影像人工智能医疗器械临床试验的统计学设计要点专家共识》解读》
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。