4月16日下午,深圳市罗湖区举办医疗语料成果发布会,面向全国AI医疗企业与科研机构发布发布了首批体检健康、体重管理、超声医学影像三大专项语料库,并出台《罗湖区医疗语料库使用管理规则》。

作为全国率先推进“基层医疗集团改革”的区域,如今的罗湖正积极推动医疗数据从“沉睡资源”转化为“创新要素”。
语料筑基:三大临床级语料库率先落地
作为AI的关键“燃料”,高质量数据集已成为驱动数字经济、赋能产业高质量发展的核心要素,在医疗领域更是如此。
以超声影像为例,传统影像结果以单张片子的形式存储在医院系统中。对于医疗AI企业而言,这些临床数据以及医院专家的专业诊断是极其宝贵的数据资源,是模型训练所必需的基础输入。
去年6月,罗湖区率先宣布推动共建市区两级医疗数据语料库,将为人工智能企业提供公共医疗数据。十个月过去,三大临床级语料库在发布会现场率先落地。
体检健康语料库定位为全民健康的“数字档案库”,应用超2万份体检语料,可精准捕捉各年龄段、各类体质人群的健康变化规律,为AI健康风险评估、慢病早期筛查提供可靠数据支撑,推动医疗服务从“治已病”向“防未病”转变。
体重管理语料库定位为慢病防治的“精准干预库”,通过构建超2000例、覆盖减重全流程的语料库,形成从评估、计划、干预到效果跟踪的完整闭环,支撑AI模型开发个性化干预方案,破解“千人一方”的减重困境。
超声医学影像语料库定位为临床诊断的“智能辅助库”。从3万例原始数据中精选2000例超声影像,覆盖各类异常典型征象,可用于提升AI辅助诊断系统效能,助力优质医疗资源下沉基层。
据了解,这三大语料库具备全量汇聚、全科精标、全链孵化、全程可控等鲜明特点,实现了数据资源的集约整合、专家标准的精细标注、场景应用的全链赋能与安全合规的全程管控,均为临床级高质量语料。
罗湖区政务服务和数据管理局局长曾德怀对记者透露,目前罗湖与市人民医院、罗湖医院集团联合启动的医疗语料中心正在加快开展建设,尚有病理、放射质控、GCP、CT、DR等五大语料库在加速标注中,未来将形成八大方向梯次推进的专业语料库矩阵。
合规护航:配套用数管理机制
发布会上同步出台的《罗湖区医疗语料库使用管理规则》,设置了分类申请、全程合规、成果可带的核心规则。
分类申请
科研机构和人工智能企业走不同通道。科研机构向区卫生健康局申请,提交科研项目立项文件、合作协议、伦理审查意见等材料;企业向行业主管部门申请,提交申请表、资质证明、安全承诺书和技术安全方案。 全程合规 坚持数据不出域,对“谁在用、用多少、怎么用”做到全流程可追溯。所有数据使用行为均有日志记录,确保合规审计有据可查。 成果可带 原始语料不出空间、不落地、不复制,企业训练完成后仅可导出模型成果,带走的是算法能力,留下的是数据安全。
区政务服务和数据管理局负责人表示,这套规则的核心理念是“用得好也要管得住”,让企业和科研机构在合规框架下安心用数、放心创新。
生态聚力:战略签约多方合作联动 数据库的发布只是起点,落地应用才是关键。在发布会现场,罗湖区科技和工业信息化局与深智城、迈瑞医疗、至知创新研究院完成医疗语料供数签约。值得注意的是,三家分属人工智能创新企业、医疗器械龙头企业、科研机构,形成了从技术研发到场景落地的完整链条。

此外,罗湖区政务服务和数据管理局与深圳数据交易所也达成了医疗语料流通战略合作。据了解,双方将在数据确权、定价机制、流通规则等方面展开深度探索。

“数据的价值在于流动,生态的活力在于开放。”区政务服务和数据管理局负责人表示。而医疗语料库作为数据要素市场的核心基础设施,将有力赋能软件与信息服务、人工智能、生命健康等战略性新兴产业,为罗湖集聚更多科技企业、人才团队和资本要素。
罗湖区委常委、副区长冯健表示,高质量语料库不仅服务于当前AI医疗场景落地,更与罗湖正在加快建设的“3+3+4”产业体系紧密呼应。
记者了解到,未来,随着政策、数据、场景、机制的全面就位,罗湖将以医疗语料库为核心引擎,持续扩容数据总量、开放应用场景、牵引产业集聚。全力推动“数据+算法+场景+产业”的深度融合,逐步实现从数据供给到场景赋能、再到产业牵引,形成“以数引产、以产聚链、以链兴城”的产业生态闭环。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。