方案名称:
智慧医疗手术视频自动化标注算法
提供企业:
苏州柏川数据科技有限公司
方案类别:
行业大模型创新(医疗大模型)
所属领域:
医疗
具体场景:
手术视频自动化标注
2025人工智能与数据技术应用创新大赛结果:
二等奖
案例介绍
本项目是一套用于手术导航技术的自动化标注算法。算法以Segment Anything Model 2 (SAM2)为核心技术底座,结合手术场景特点,构建了“人工预标关键帧-大模型自动补标-人工校验优化”的半自动化工作流。该算法可以高精度标注动脉、静脉、气管、淋巴结等器官组织,以及超声刀、分离钳、电凝切割器等十余种医疗器械。该算法的最终标注结果准确率超过90%,可以高效积累智慧医疗需要的数据,提高手术导航技术的感知和理解能力,进而提升手术安全性和翻台率。
具体应用场景
本项目应用于医疗行业,目前具体使用场景聚焦于胸外科肺部手术。算法直接服务于智能手术导航系统的研发,以及手术教学培训、手术流程数字化分析。
过往的智慧医疗数据标注主要依赖具备深厚医疗背景的专业人员逐帧标注视频中的解剖器官和手术器械,存在人力成本高、周期长、一致性难保证等痛点。此外,在复杂的肺部手术中,动脉、静脉、气管等关键组织常常被脂肪、其他组织或器械遮挡。传统导航依赖术前影像,无法反映术中组织的真实动态变化。而且,手术依赖医生的视觉判断和专业经验,在狭小或充满血污的视野中,手术操作难度大、时间长,极大消耗医生精力体力。
本项目将人工标注频率从每帧标注优化至每240帧仅需标注一个关键帧,大幅降低了人工标注工作量,解决了医疗数据标注的“卡脖子”问题。应用到临床手术上,则可以通过精准的语义分割能力,实时识别并标注出手术视频中的各种解剖组织,为医生提供精准的手术导航。
技术创新特点
该项目算法的技术特点在于以SAM2大模型为引擎,通过“预处理-人工关键提示-双轮迭代推理”的创新流程设计,实现了专家智慧与AI效率的最佳结合。
采用SAM2.1-Hiera-Large版本作为基础模型,该模型在处理复杂场景和细节轮廓方面表现出色。
该算法也并非完全端到端的自动化,而是设计了一套将专家知识与大模型批量处理能力相结合的半自动化流程,包括数据预处理与降帧优化、人工预标关键帧、Mask预处理与质量增强等环节,确保在效率与精度间取得最佳平衡。
采用两次自动补标的迭代式推理策略(第一次自动补标即粗标——人工校验与提示增强——第二次自动补标即精标),显著提升了手术视频标注的连贯性和准确性。
在创新性模型适配与增强方面,成功将通用视觉分割大模型SAM2应用于高难度、高动态的医疗手术视频场景,突破了其在自然图像上的应用边界。针对医疗数据特性,创新性地引入了基于SAM2的Mask平滑预处理技术,有效解决了人工预标轮廓边缘毛刺问题。
在迭代式推理方面,设计了“关键帧引导的双轮自动补标”机制。首次推理后,通过人工筛选优质结果帧融入提示序列,进行第二次精推理,极大地增强了模型在整个视频序列中的时序一致性和分割精度。
在模式创新优化资源配置方面,该模式显著降低了对资深标注人员数量的依赖,通过算法赋能,使有限的专家资源能覆盖和管理更大规模的数据标注项目,从根本上解决了医疗AI领域高质量数据标注成本高昂、效率低下的核心瓶颈。
应用效果与推广成效
在市场表现上,该算法已部署某家医疗科技公司,按照客户验收标准实现准确率90%以上。
在盈利模式上,商业模式灵活,可采用项目制收费(针对特定医院或研究机构的定制化标注项目)与SaaS订阅服务(提供在线标注平台供客户使用)相结合。接收益来自标注服务费用,长期则可通过沉淀的海量标注数据,衍生出预训练模型售卖、AI辅助诊疗模块授权等增值服务。
在商业前景上,短期来看,市场将集中于服务AI医疗公司和科研机构。中长期而言,随着技术成熟与法规完善,该算法产生的精准结构化数据将直接赋能手术机器人实时导航、术中实时决策支持、高端应用,商业价值巨大。
编辑评价
苏州柏川数据科技有限公司专注人工智能“数据+”基座服务,为自动驾驶、大模型、具身智能、智慧医疗、智慧城市等AI应用场景提供全链条数据解决方案,核心产品包括多模态数据服务、具身智能数据服务、三维重建方案等。作为技术型数商,企业拥有6项已授权专利、27项实质审查中专利。本项目以SAM2大模型为核心,研发手术视频自动化标注算法,构建半自动化标注工作流,可精准标注解剖组织与手术器械,标注准确率超 90%。项目有效解决医疗数据标注成本高、效率低等痛点,技术创新性强,临床应用与商业推广价值显著。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。