北京积水潭医院:基于多院区的VMware vSphere升级替代与信创转型实践
首都医科大学附属北京积水潭医院(以下简称“医院”)是以骨科、烧伤科为重点学科的三级甲等综合医院,拥有7个国家临床重点专科。医院老院区位于新街口,随着回龙观和新龙泽两个新院区相继建设,决定引入现代化的国产IT基础设施,逐步推进新院区的信息中心数字化建设和老院区的IT基础设施改造,同时探索VMware虚拟化国产替代与信创转型,并实现多院区资源的统一纳管与网络安全加固。
建设背景与目标:推进VMware国产替代,加强多院区数据安全并实现资源统一管理
医院原采用“物理机+集中式存储”架构承载HIS数据库,以及“VMware虚拟化+集中式存储”架构承载其他业务系统,其中为保障业务连续性,集中式存储均进行了双活建设。
随着互联网+医疗业务相继建设和业务系统不断扩展,医院逐渐意识到,已有的基于VMware虚拟化的建设方案难以满足医院信息部门在运维管理、信创转型、成本管理和数据安全等方面的多种需求。
● 运维复杂,故障处理难:目前使用的VMware虚拟化版本不一致,在部署运行的十余年间发生过多次主机、存储硬件和证书类故障。某次故障中,某院区的VMware主机突然出现无法登录VMware vCenter界面的情况。整个故障处理历时4天,排查过程曲折,报错不明确,运维人员先后怀疑证书、客户端版本等问题,虽进行一一排查和重置,但某项关键服务依然无法启动。最终,通过新建虚拟机、安装相同版本vCenter、备份数据库并还原至新库、对新的vCenter进行镜像配置等一系列操作,故障才得以解决。此次故障虽不影响内部虚拟机运行,但运维人员无法对其进行统一管理和监控,影响运维工作开展。
● 难以满足信创要求:医院作为国家“2+8+N”信创战略的重要机构,需尽可能采用核心技术自主可控的国产IT信息技术。而VMware自身即为国外厂商,基于VMware虚拟化的架构也无法兼容国产服务器和操作系统,制约了医院信创资源池的建设进度。
● 订阅成本逐步提升:随着VMware调整订阅模式和产品组合,在VMware授权上的成本大幅增长,对高内核服务器带来较大的成本压力。
数据安全风险高,管理复杂:传统数据中心安全架构多以边界防护为主,难以应对虚拟化环境下的内部渗透,缺乏内网流量可视化与精细化控制。同时,多院区和多平台并存的情况以及数据互访的需求,导致整个平台的安全策略管理十分复杂、配置低效,依赖手工操作,难适应业务动态变化需求。
基于以上挑战,在规划新院区建设与老院区改造时,明确提出了3个建设目标:
● 推进VMware国产化替代:加快VMware虚拟化替代进程,实现原有VMware环境中业务系统的平稳迁移,并在后期逐步推进信创探索。
● 全面强化数据安全与合规能力:落实国家信息系统网络安全等级保护2.0要求,构建基于零信任架构的精细化安全策略,通过虚拟网络微分段与流量可视化技术,提升系统内部安全防护水平,确保患者数据与医疗信息在全生命周期内安全可控。
● 多院区资源的统一纳管:构建集中管控平台,打通异构资源池,实现多院区算力、存储等基础资源的统一纳管、动态调度,实现跨院区资源统一管理与弹性扩展,推动数据共享与业务高效协同。
建设实践:VMware替代与信创转型“三步走”
为了确保整个建设项目的平稳落地,医院采用了“逐步推进、风险可控”的建设策略,通过3个阶段逐步引入国产IT基础设施,实现新院区所有业务系统和老院区部分业务系统的VMware替代,并在后期基于国产超融合平台探索部分业务的信创转型。
1.验证阶段:在新龙泽院区的DMZ区小规模部署国产超融合平台,以降低对核心业务的影响。
2.大规模部署与信创试点阶段:
● 回龙观院区:以超融合架构为核心支撑重要生产业务系统运行,实现了包括HIS和EMR在内的全业务系统上企业云。同时,基于国产C86架构CPU构建信创资源池,进行信创探索。
● 新街口老院区:以超融合架构支撑PACS等对存储性能和访问效率要求较高的业务系统。
3.多院区管理与信创推进阶段:构建统一的管理平台,实现了对三个院区基础架构资源的集中管理和高效运维。同时,在新街口院区增设信创资源池,实现异构资源池统一管理。
阶段一:构建新龙泽院区DMZ区超融合资源池
在评估验证国产超融合产品的性能、稳定性、运维支持能力、信创兼容性、数据安全保护能力等多个方面后,医院选择了某国产超融合产品作为IT基础设施底座。为验证该产品的原生虚拟化对VMware虚拟化的生产级替代能力,医院引入3节点国产超融合一体机承载DMZ区的互联网医疗业务,主要服务于公众号小程序的业务(包括小程序互联网诊疗、挂号、视频问诊三个板块),支撑 10+台业务虚拟机。
阶段二:新院区数据中心建设和信创探索
基于阶段一的验证,医院以国产超融合作为主要技术路线,在回龙观院区和新街口老院区进一步开展建设工作:
1.回龙观院区:
● 建设基于国产超融合的数据中心:部署近30节点集群,承载包括HIS和EMR在内的全院业务系统。
● 信创转型探索:基于国产C86架构CPU构建超融合信创集群,承载业务前置机,实现新院区的信息化和一体化建设(宿主机和管理平台均使用国产操作系统)。
● 构建分布式防火墙:引入原生于虚拟化平台的流量监控机制,实现全流量采集、协议解析和实时分析。此外,每个集群均配备专属的防火墙控制单元,确保控制层具备高可用性,从架构上规避因共用控制器导致的单点失效隐患。
2.新街口院区:引入国产超融合集群,承载PACS等对存储性能和访问效率要求较高的业务系统。
阶段三:多院区一“云”多芯资源池建设
构建多院区统一的管理平台,实现了对三个院区基础架构资源的集中运维管理。此外,在新街口院区,进一步推进信创转型进程,基于国产C86架构CPU构建国产超融合信创集群,并利用国产迁移工具实现了从VMware虚拟化平台到信创超融合集群的便捷迁移。国产超融合平台能够兼容当前的医疗业务系统,迁移后业务系统可稳定运行,性能卓越,实现了CPU及操作系统的信创过渡,构建了传统X86和C86统一运维管理的一“云”多芯资源池。
经验分享:VMware 迁移规划与问题处理
在替代VMware虚拟化平台时,医院采用国产迁移工具执行了虚拟机跨平台迁移。该迁移工具可在保障业务连续运行的前提下完成首次全量数据同步,后续可通过多次在线的增量数据同步,大幅降低最终切换时的停机时间,实现对业务停机窗口的灵活控制。即使迁移过程中出现主机断电或网络中断的情况,也可利用该迁移工具数据快照与断点传输的特性保证原始数据的可靠性与传输效率。
在实际操作过程中,医院总结出一套成熟的迁移管理经验:
1.迁移前对虚拟机进行全面备份,防范数据丢失风险。
2.科学评估网络带宽与传输稳定性,合理制定迁移顺序与时间安排。
● 迁移顺序:从次要到主要,从少量到批量。
● 时间选择:业务低峰期,在迁移后及时测试业务。
3.加强与业务科室的沟通协作。根据业务特点选择合适的迁移时间,确保迁移后的系统顺利承接业务,保障各项功能平稳过渡。
在迁移过程中也遇到一些难以快速实现迁移的场景,建议有相同需求的用户重点关注:
● 32位系统无法迁移(主要是Windows 2000/2003):这些虚拟机可选择暂时先跑在VMware架构内,之后择机重新创建符合64位的系统,再开展迁移工作。
● 外接认证设备的软件密保失效:若服务器部署了基于软件形式的外接认证设备,在对其进行迁移后,虽然硬件环境未改变,但软件密保失效,导致服务无法正常使用。最终联系厂商重新制作了一个外接认证设备,用于迁移后虚拟机的认证授权,因此建议在虚拟机迁移前对业务进行密保环境的评估。
建设成果
● 平稳推进IT基础设施的国产化建设:从VMware替代到信创转型,从新建集群到业务迁移,稳步推进IT基础设施国产化的深度和广度,同时实现基础设施的现代化升级。
● IT资源统一纳管,提升运维效率与业务连续性:构建了覆盖全院区的集中运维监控体系,实现了IT资源的统一纳管与状态可视化。通过一套平台,能够实时掌握各院区业务系统运行状况,即使出现问题也可快速定位故障并调配资源,避免了原先耗时的手动故障处理,有效提升了运维效率与业务连续性。
● 数据安全保护升级:通过虚拟网络微分段与流量可视化技术,提升系统内部安全防护水平,确保患者数据与医疗信息在全生命周期内的安全可控,有效落实国家信息系统网络安全等级保护2.0要求。
● 降低总拥有成本:国产超融合在网络与安全、灾备与管理上可按需进行投入,且支持3节点起步,可降低数字化建设难度与总拥有成本。
作者简介
王闻星 北京积水潭医院信息中心主任助理
李梓赫 北京积水潭医院信息中心助理工程师