近年来,随着ChatGPT、DeepSeek等大模型技术的快速发展,人工智能正在以前所未有的速度进入医疗行业。从智能问诊、报告解读到辅助诊断、健康管理,各类AI应用不断涌现,“医疗大模型”也逐渐成为智慧医院建设中的热门关键词。然而,在医疗场景持续深入落地的过程中,行业开始发现一个新的问题:仅具备对话和问答能力的大模型,已经难以满足复杂医疗业务的实际需求。
当患者询问检查结果时,AI需要能够主动查询医院系统;当医生需要制定诊疗方案时,AI需要综合分析病历、检验、影像等多源数据;当医院开展慢病管理时,AI还需要持续跟踪患者状态并主动发起干预。这些任务显然已经超出了传统聊天机器人的能力边界。
在这样的背景下,“医疗智能体(Medical Agent)”开始成为医疗人工智能发展的新方向。近期发表于《中国数字医学》的《医疗智能体研究与应用进展》一文,对医疗智能体的发展现状、核心技术架构及应用趋势进行了系统梳理。本文将结合论文内容,对医疗智能体的底层技术逻辑进行拆解,帮助大家理解:医疗AI为什么正在从“大模型时代”迈向“智能体时代”。
医疗智能体 让AI从“会回答”走向“会做事” 医疗智能体是面向卫生健康领域,以大语言模型(Large Language Model,LLM)为核心,具备规划、记忆、工具调用及行动能力的人工智能系统。 与传统医疗AI相比,其最大的区别在于不仅能够理解问题、生成答案,还能够自主完成复杂任务。 例如,在智能问诊场景中,传统AI更多承担知识问答的角色;而医疗智能体则可以根据患者描述主动追问病情、调用知识库进行分析、结合诊疗规范完成推理,并进一步生成后续处理建议。 在报告解读、辅助诊断、健康管理、互联网医院服务等场景中,医疗智能体同样展现出比传统AI更强的任务执行能力。从本质上看,医疗智能体正在推动医疗人工智能从“工具型AI”向“执行型AI”演进。 政策与需求双轮驱动 医疗智能体迎来发展窗口期 从产业发展角度来看,医疗智能体的兴起不仅源于技术突破,也与政策推动和临床需求密切相关。 近年来,国家层面陆续出台多项人工智能相关政策。《国务院关于深入实施“人工智能+”行动的意见》《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》等文件明确提出,要加快推动人工智能与医疗卫生深度融合。 根据相关规划,到2027年,智能终端、智能体等应用普及率将超过70%,重点发展“模型即服务(MaaS)”“智能体即服务(Agent as a Service)”等新业态,并形成一批面向专病专科的垂直大模型和智能体应用。 与此同时,全球范围内针对人工智能的监管体系也在不断完善。例如,欧盟《人工智能法案》已将医疗人工智能明确纳入高风险应用领域,对模型透明性、安全性和责任归属提出更严格要求;我国《网络安全法》等相关法规同样强调人工智能伦理规范建设和安全监管要求。可以看到,医疗智能体的发展正在进入“技术创新”与“规范治理”同步推进的新阶段。 医疗智能体的核心架构 构建“感知—决策—执行”闭环 那么,一个医疗智能体究竟是如何工作的? 其底层本质是一个以大语言模型为决策中枢,通过规划、记忆、工具调用与行动模块协同工作的闭环系统。 当用户发起任务后,智能体首先对任务进行理解和分析,随后制定执行计划、调用所需资源、完成任务执行,并根据执行结果持续优化后续决策。整个过程类似于医生在临床工作中的思考模式,因此也被概括为“感知—决策—执行”闭环。
从技术层面来看,医疗智能体主要由五大核心模块构成。
1. 大语言模型:医疗智能体的“大脑” 大语言模型(LLM)是医疗智能体最核心的组成部分。通过海量文本预训练和自监督学习,大模型能够掌握医学知识、语言规律以及复杂语义关系,并形成较强的上下文理解和推理能力。 在医疗智能体架构中,大模型承担着任务理解、意图识别、决策生成以及整体编排的职责,相当于整个系统的“大脑”。无论是患者咨询、诊疗辅助还是运营管理任务,最终都需要由大模型完成理解和决策。但仅有大模型并不足以支撑复杂医疗场景,因此还需要其他能力模块协同工作。 2. 规划能力:让AI具备临床思维 在真实医疗场景中,许多任务都具有较高复杂度,很难通过一步完成。因此,医疗智能体需要具备规划(Planning)能力。规划模块的核心作用,是将复杂任务拆解为多个可执行子任务,并根据执行结果动态调整策略。目前较常见的方法包括思维链(Chain of Thought,CoT)、思维树(Tree of Thought,ToT)以及ReAct(Reasoning and Acting)框架等。 以“胸痛待查”为例。智能体不会直接给出诊断结果,而是会按照临床思维路径逐步推理:首先评估生命体征是否稳定;随后分析心电图及相关检查结果;进一步鉴别心源性与非心源性疾病;最后形成诊疗建议。这种逐步推理的过程,不仅提升了诊断准确率,也增强了决策过程的可解释性。 3. 记忆能力:让AI拥有持续认知能力 如果说规划能力决定智能体如何思考,那么记忆能力则决定智能体能够记住什么。论文将智能体记忆划分为短期记忆和长期记忆两类。 短期记忆主要用于保存当前任务中的上下文信息。例如,在多轮问诊过程中,智能体能够持续记住患者提到的“咳嗽3天”“午后低热”“咽痛”等信息,从而保持对话连续性,避免重复询问。 长期记忆则更多依赖向量数据库、知识图谱以及检索增强生成(RAG)等技术实现。通过长期记忆机制,智能体能够快速检索患者既往病史、检查记录、过敏信息以及临床指南等内容,为连续诊疗和长期健康管理提供支持。 可以说,记忆系统是医疗智能体实现个性化服务的重要基础。 4. 工具调用与行动能力:让AI真正连接现实世界 这是医疗智能体区别于传统大模型最关键的能力之一。 因为真实医疗业务涉及大量外部系统和工具,仅依靠模型自身知识远远不够。因此,智能体需要通过标准化接口连接医院HIS、EMR、LIS、PACS等业务系统,并根据任务需要调用相应工具。 近年来,随着模型上下文协议(MCP)等新型标准的发展,医疗智能体正在逐步实现对异构系统资源的统一发现、描述和调用。在此基础上,行动模块进一步将决策结果转化为具体执行行为。 例如:查询检查结果、生成病历摘要、发起患者随访、推送健康宣教、触发风险预警等。 与此同时,行动结果又会作为新的输入反馈给系统,形成持续优化的认知循环。强化学习(RL)所采用的“试错—反馈—优化”机制,也正在被广泛应用于这一过程之中。 从单智能体走向多智能体协同 随着医疗场景复杂度不断提升,单一智能体逐渐暴露出知识覆盖面有限、任务处理深度不足以及并发能力受限等问题。 特别是在多学科联合会诊(MDT)、全病程管理、医院运营管理等复杂场景下,越来越多研究开始探索多智能体协同架构。 其核心思想是构建多个具备明确分工的智能体角色,通过共享上下文和协同决策共同完成复杂任务。 例如:导诊智能体负责患者分流、问诊智能体负责病情采集、诊断智能体负责疾病推理、随访智能体负责院后管理、运营智能体负责资源调度。多个智能体之间通过主从式、流水线式等协同模式共同工作,从而实现比单一智能体更强的综合能力。 医疗智能体如何部署落地? 随着医疗智能体逐渐进入实际应用阶段,其部署模式也呈现出多样化特征。总结了当前较为主流的四种部署方式: ● 公有云部署适用于医学科普、健康咨询等低敏感场景,具有部署快速、成本较低的优势; ● 私有化部署则是当前医院最主流的模式,所有模型和数据均保留在院内环境中,更符合医疗数据安全要求; ● 混合云模式兼顾安全性与成本优势,将敏感数据保留在本地,将计算密集型任务放在云端处理; ● 边缘计算模式则将轻量化智能体直接部署在床旁设备或移动终端,实现低延迟和实时响应。 未来,不同部署模式将根据医疗机构规模、数据安全要求以及业务需求长期共存。 从发展历程来看,医疗人工智能正在经历一次重要转变。过去,行业关注的是“大模型能不能回答问题”;而今天,越来越多人开始关注“AI能不能真正完成工作”。 医疗智能体以大语言模型为核心,通过规划、记忆、工具调用和行动能力的深度融合,构建起完整的“感知—决策—执行”闭环,让人工智能从单纯的信息生成工具逐步成长为能够参与医疗业务流程的数字助手。 下一篇文章,我们将继续结合论文内容,深入解析医疗智能体在智慧医院中的典型应用场景,以及其在患者服务、辅助诊疗、医院运营管理等领域的实践价值。 内容来源:《中国数字医学》2026第21卷第5期-医疗智能体研究与应用进展。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明智慧医疗网的内容为智慧医疗网原创,转载需获授权。