数据是AI模型训练的核心“原料”。在4月29日第八届数字中国建设峰会“高质量数据集和数据标注”主题活动中,由国家数据局指导的全国数据标准化技术委员会重磅宣布:将以标准化体系为引擎,通过三大分类体系打造高质量数据集,为人工智能发展筑牢数据根基。
一类为“通识数据集”,包含面向社会公众、无需专业背景即可理解的通用知识,主要用于支撑通用模型落地应用。
一类为“行业通识数据集”,包含面向行业从业人员、需要一定专业背景才能理解的行业领域通用知识,主要用于支撑行业模型落地应用。
一类为“行业专识数据集”,包含面向特定业务场景相关人员、需要较深的专业背景才能理解的行业领域专业知识,主要用于支撑业务场景模型落地应用。
简单举例,互联网百科、问答等为“通识数据集”;行业研究机构报告等为“行业通识数据集”;医院科室特定疾病病例等为“行业专识数据集”。
01医疗质量的高低决定数据资产化的成败
2024年11月,首都医科大学宣武医院完成北京市公立医院首笔医疗数据交易,点燃行业创新引擎。短短三个月内,多家医院迅速响应,争相布局医疗数据资产化赛道。然而,我们在盘点医疗数据资产化案例中发现,许多医院想要将医疗数据资产化,但实践之路却荆棘密布。究其根源,问题出现在医疗质量这一关键环节。医疗数据资产化从患者入院诊疗的第一刻就已启动。唯有夯实医疗质量底座,才能让医疗数据真正成为驱动行业升级的“硬核资产”。
第十四届全国政协委员、工业和信息化部原副部长王江平在中国医学发展大会表示,医疗领域是AI应用的“高压地带”,这源于其三大特殊性。一是数据敏感性。医疗数据包含生理指标、病史、诊疗记录等敏感信息,直接关联个人生命权和隐私权。二是结果不可逆性。生成式AI的“幻觉”问题在医疗场景中可能导致严重问题。王江平坦言:“我们必须清醒认识到,一次错误诊断可能直接危及生命,医疗AI应用必须追求‘零失误’。”三是责任主体复杂性。对于AI参与医疗决策导致损害问题,需以“权责清单”等形式清晰界定责任,避免出现“技术出错、操作失误、患者买单”的困局。
02医疗数据迈向资产之路的三道关卡
医疗数据的重要性不言而喻,它广泛应用于临床决策支持、疾病预警预测与早期诊断、个性化诊疗、健康管理等多个领域。借助健康医疗数据互联互通体系的搭建,医疗数据不仅能提升医疗服务品质,还能推动医疗资源的合理配置,助力医院实现运营效率与效益的双提升。但想要将这些庞大的数据转化为真正的资产,绝非易事,必须跨越数据要素资源化、数据资源资产化、数据资产价值化这三大关键关卡。
在数据要素资源化的阶段,数据的采集、存储与处理堪称重中之重。医院需系统性开展数据全流程管理——从精准采集、严格质控,到科学分类、深度集成,再到清洗优化、安全防护及可视化分析,每个环节既是医疗质量的显性标尺,更是决定数据能否转化为资产、在市场中实现价值的核心变量。若数据采集存在缺漏或偏差,后续分析便如同空中楼阁,难以支撑有效应用。唯有夯实这一阶段的工作,医疗数据才能突破原始资源的桎梏,真正迈向资产化的大门。
医疗行业数据具有高价值与高敏感性的双重特点,从“数据资源”到“数据资产”的转变面临许多难题。当前,多数医疗机构对医疗数据的管理仍存在诸多短板:数据管理意识淡薄,数据质量参差不齐,合规风险难以把控,应用场景模糊不清,再加上医疗数据入表缺乏明确指引,导致数据难以发挥其应有的价值,制约了医疗数据的智能化应用进程。不少医院开始寻求破局之路。借助人工智能技术优化医院数据资产管理,已成为提升医疗数据基础质量的新趋势。众多医院积极探索,通过提升数据质量与复用效率,成功将海量医疗数据整合为具有深度价值的医疗大数据,并运用智能工具高效完成数据资源化进程。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。