中山大学附属第八医院:基于大语言模型的手术操作记录自动编码系统

发布时间:2025-12-15
浏览次数:

一 项目概括

  随着医疗改革的不断深入,病案首页作为医保支付和国家公立医院绩效考核的主要依据,编码质量越来越受到重视。中山大学附属第八医院和哈尔滨工业大学(深圳)立足于当前医疗信息化发展对病案编码效率、同质化和准确性的迫切需求,以中文手术操作记录的ICD自动编码为研究重点,共同研发了“基于大语言模型的手术操作记录自动编码系统”(下称智码系统)。

  本项目率先提出了一种以大语言模型为核心的自动编码解决方案,充分发挥大语言模型在自然语言理解和文本生成中的强大能力,旨在实现手术记录的结构化和标准化,为医疗行业的数据处理提供智能化支持。同时还聚焦解决中文手术操作记录中的长尾分布和数据资源不足问题。通过两阶段标注法,明确文本中的证据信息,将编码过程显式化,并结合多样化数据增强技术,提升模型对不同场景和少样本条件的适应能力。同时,跨语言迁移技术的引入有效弥补了中文医疗环境中权威知识库缺乏的劣势,使模型能够借助英文ICD知识扩展其应用能力。此外,系统设计中对可解释性和领域特化的特别关注,使得模型不仅能够实现高效编码,还能为结果溯源和验证提供支持,从而构建了一套兼具创新性和实用性的自动编码框架,为医疗信息化发展提供了重要保障。

二 建设与开发

  1.需求分析阶段,明确任务目标

  在需求分析阶段,明确任务目标,即通过自动化手段将中文手术操作记录文本映射到ICD标准编码,实现高效、准确的多标签分类功能。针对医疗行业中手术记录数据存在表达不统一和质量参差不齐的特点,项目团队采集了多科室、多类型的真实手术记录数据(以心血管内科的冠状动脉支架置入术,骨科的脊柱融合术为切入点),并针对敏感信息进行了脱敏处理。为保障数据标注的准确性和高效性,采用了两阶段标注法,显式呈现了支持编码的关键语句和相关逻辑。这种标注方法不仅为后续的模型训练奠定了坚实基础,还有效揭示了手术记录数据中的长尾分布特性,为模型的设计优化提供了重要依据。

2.模型设计阶段,确定核心技术

在模型设计阶段,选择大语言模型作为核心技术,结合多样化指令扩展技术,使模型能够全面模拟实际编码场景。通过设计五种输入输出格式的训练指令,模型被要求完成从提取证据片段到生成编码结果等多种任务。为进一步提升模型的适应能力,项目团队采用了多样化数据增强策略,结合知识学习、专项训练和全流程训练方法,生成多样化的训练数据,不仅缓解了小样本条件下的模型性能问题,还增强了模型对长尾分布编码的处理能力。此外,通过跨语言迁移技术,将英文ICD知识融入中文任务中,有效弥补了中文高质量数据不足的短板,同时利用指令微调策略,优化模型在复杂场景下的表现。

1.jpg

3.系统集成阶段,以实践为导向

在系统集成阶段,设计并实现了一个完整的自动编码系统架构,包括模型调用、编码结果展示和用户交互等功能模块。系统经过全面的测试验证,确保其在实际医疗场景中具备高效性、稳定性和可解释性。特别是对长尾分布的编码处理进行了重点测试,验证了系统在常见和罕见编码任务中的性能表现。此外,研究团队注重根据实际应用中的反馈优化系统,使其能够适应不同医疗机构的病案撰写风格和数据管理需求。整个研发流程以实践为导向,注重系统的扩展性与通用性,为未来推广应用提供了强有力的技术保障。

三 关键技术

1.专家经验引导,思维链微调

本项目提出了两阶段标注法,使编码过程更加显式化。这种方法模拟了人工编码员在工作中通过识别关键证据片段和映射编码结果的实际操作流程,不仅提升了模型对标注数据的理解能力,还增强了编码结果的可解释性。在实际应用中,系统输出的不仅是编码结果,还包含相应的证据片段,这使得用户可以轻松溯源并验证结果的准确性。该方法的应用显著降低了模型对大规模标注数据的依赖,为解决医疗场景中数据标注难的问题提供了全新思路。

2.领域大模型基座,医学知识图谱融合

在大语言模型基座的选择上,本项目采用了团队自主研发的医疗领域大语言模型。其基座模型在预训练时融入了医学病案和医学知识书籍以及项目技术团队开放的大规模中文医学知识图谱CPubmed-KG。最终以290亿token的预训练数据以及167万指令数据训练了医疗领域的专项大语言模型。

3.数据增强策略,长尾分布优化

针对医疗数据标注成本高、数据分布不均的特点,本项目设计了知识学习、专项训练和全流程训练的多样化数据增强策略。通过生成多种指令格式的训练数据,模型能够在少样本环境下获得优异的泛化能力,同时对多种编码情境表现出更强的适应性。此外,数据增强方法还特别针对手术操作记录中存在的长尾分布问题,通过提高模型对罕见编码的学习能力,有效提升了其在特定领域和边缘场景中的表现,为医疗行业中自动编码的落地应用提供了技术保障。

4.跨语言增强,编码能力快速构建

为弥补中文ICD自动编码任务中高质量数据不足的问题,本项目引入了跨语言迁移技术,将英文ICD知识与中文任务对齐,使模型能够从国际权威知识中获益。通过这种方法,模型不仅扩展了知识范围,还显著增强了对中文任务的适应能力。同时,本项目对特定领域进行了优化,例如心脏病和脊柱外科等手术记录编码场景。针对这些领域的长尾分布特性,模型经过专门的训练和调整,成功实现了领域特化能力的突破,进一步提高了系统的可靠性和实用性。

5.系统可解释性设计,结果溯源验证

在自动编码结果的输出设计中,本项目特别增加了可解释性要求,模型不仅生成编码结果,还提供了对应的文本证据片段。这种增强设计使得编码结果的溯源和验证更加直观可靠,有助于实际应用中用户对结果的快速判断和调整。此外,这种设计还降低了系统应用的信任门槛,使医疗机构能够更安心地采用该自动编码技术,提升了技术在真实场景中的落地能力和应用价值。通过将可解释性融入系统的核心功能,项目为医疗数据的标准化和智能化处理提供了更优的解决方案。

四 应用效果

智码系统与日常工作融为一体,已于2024年11月在中山大学第八附属医院(深圳福田)病案管理科落地使用,编码员采取人机联合方式从2个术种快速扩大到全部术种进行编码,智能编码准确率高于90%,有效地提高了病案管理科的工作效率,基本实现手术编码同质化。

进行人机联合编码后,编码准确率和效率获得大幅提升:模型实施前后,由资深编码员对部分疑难手术编码进行人工质控后,发现编码错误率下降70%以上,准确率大幅提升。在编码效率方面,编码员按日均编码40份,每天工作8小时计算,平均每份病历编码条数8.973条(含诊断、手术和操作)。人工编码平均速度为80.241秒/条,自动编码系统平均速度为0.712秒/条,人机联合编码平均速度为6.377秒/条,整体效率提升10倍以上。

五 发展规划

本项目开发的智码系统,在实际应用中,实现了大幅降低编码错误、大幅缩短编码时间,基本解决了病案手术编码的效率、同质化和准确性问题。这一创新解决方案为医疗行业的数据处理提供了智能化支持,具有重要的实际应用价值。

为更好地推广到其他医院使用,已经全面适配华为的昇腾系列推理机,将智能编码大模型适配至华为的推理服务器上,定期更新模型,不断提高编码准确率,提升编码员的使用体验。

智码系统直接服务于医疗单位、医疗主管部门和医保部门,赋能病历和编码质量,为医疗改革辅助决策提供不可或缺的高质量病案数据。

(来源:CHIMA 2025医院新兴技术创新应用典型案例集)