赵霞:基于大语言模型的电子病历应用
今年1月发布的DeepSeek R1大语言模型,以其强大的语言理解和推理生成功能燃起了医疗行业的AI应用热潮。大型语言模型(简称“LLM”)是以海量文本数据为训练基础、基于深度学习架构的人工智能模型,能够理解自然语言语义并生成连贯文本。LLM通常包含数十亿至数千亿参数,能捕捉语言的统计规律、词语语义与上下文关联,可处理文本生成、翻译、问答等多种自然语言处理(NLP)任务。与传统的NLP技术相比,在广泛的NLP任务中,LLM表现出理解词语语义和语言上下文,以及类人文本的生成能力。
在电子病历(EMR)的应用中,以自然语言文字描述的EMR文档比例超过70%,在病程记录、护理记录、手术记录、医患沟通文书等核心环节,EMR文档占接近100%。LLM的出现,为EMR的应用装上了智慧的大脑,赋予了强大的智能。有学者使用PubMed和Web of Science统计发现,2022年12月-2024年5月这一年半的时间里,发表的LLM用于电子病历(EHR/EMR)的相关研究达到6328项。由此可见,将LLM强大的识别、推理和生成能力应用于EMR,将为EMR的产生、应用和管理带来巨大的变革。
LLM的主要功能
下表列出LLM可以提供的基本功能。
基于LLM的EMR应用
通过上述功能的单独或组合使用,LLM可以用于大量的临床诊疗场景,例如医生辅助诊断、患者个性化诊疗、病历质量控制等。医疗文书质控智能辅助场景中,就需要组合应用实体识别、信息抽取、文本分类、文本比对、生成等基本功能。基于LLM的EMR应用通常包括:
1.辅助诊疗:基于对EMR的理解和推理,构建患者360视图,为医生提供诊断、治疗、风险和预后的辅助决策支持;
2.病历生成:基于临床场景(查房、手术、检查等)、跨系统信息整合(医生工作站、手术系统、影像和检验系统等)、语音或提示词输入等输入模式的病历生成;
3.个性化诊疗:综合EMR的临床组学、影像组学和DNA组学的多维度和多模态数据,生成患者个性化治疗建议;
4.病历质控:基于病历规范、诊疗指南、合理用药等知识和规则,对病历的完整性、逻辑性、符合性、合理性、安全性和潜在风险的核查;
5.数据分析:检索、识别和提取EMR的关键信息(医学术语、诊断编码、检查与药品名称等),生成结构化摘要、知识图谱、多模态融合等形态,实现EMR数据的高效利用;
6.医学科研:多维度、多模态EMR数据分析处理,发现疾病关联、药物疗效、病程预后、隐含规律等知识,辅助医护人员开展医学研究;
7.医患交流:基于患者EMR的个性化医患交流,包括诊疗咨询、用药事项、康复指导、复检提醒和随访等,以及LLM与患者的人机交流;
8.隐私保护:检索和发现个人隐私信息和敏感信息,屏蔽或替换患者姓名、身份证号等隐私内容,敏感信息脱敏;
9.未来医疗:包括诊疗流程智能化重构、个性化的精准医疗、医疗生态跨学科协同,以及基于LLM的EMR应用、技术、伦理、安全和可解释性的协同演进。
随着AI技术的快速发展,医院正处于一个从信息化向数智化转型时期,要把握机遇,积极拥抱AI技术,推动基于LLM的电子病历EMR广泛和深度应用。
作者简介
赵霞,CHIMA委员,中国人民解放军南部战区总医院信息中心主任,高级工程师,生物医学工程学博士,硕士研究生导师。