零中断迁移+两级分层架构:山东第一医科大学附属肿瘤医院PACS存储国产化落地实践

发布时间:2026-07-03
浏览次数:

始建于1958年的山东第一医科大学附属肿瘤医院(山东省肿瘤防治研究院、山东省肿瘤医院,以下简称 “山东省肿瘤医院”)是国内肿瘤诊疗标杆机构、省级肿瘤防治研究中心,具备跨省区医疗服务能力,在全国肿瘤专科领域影响力显著。医院拥有质子放射治疗系统、磁共振引导加速器等一批代表国际先进水平的图像引导高端放疗设备,率先引入国内肿瘤专科医院首台光子计数CT,持续提供高质量肿瘤诊疗服务。

随着光子计数CT等高端影像设备投入,医院PACS系统呈现单文件小、总量大、并发高、增长快特征,传统进口分布式存储面临文件管理上限不足、I/O性能劣化、网络争抢、维保昂贵、自主可控性弱等问题。在医疗数字化与国产化战略双重驱动下,构建高性能、低成本、自主可控、平滑扩展的新型存储架构成为大型肿瘤专科医院的刚需。本文以山东省肿瘤医院PACS存储改造为例,系统阐述国产化导向的架构设计、网络重构、小文件优化及零中断迁移实施方法。

数据激增倒逼存储架构升级

随着新一代医学影像设备的广泛应用,医院PACS系统面临前所未有的数据压力。肿瘤患者以增强检查为主,多为薄层扫描,传统CT单次增强扫描数据量约1-1.5GB,文件数量平均约3000张。2025年,医院光子计数CT、能谱CT等高端设备陆续投入使用。以光子CT为例,单次增强扫描产生的原始数据容量高达15GB,文件数量平均超过8000张,其单次扫描总数据量约为常规CT的12倍,文件数量亦数倍增长。PACS系统月均数据增量由过去的10TB激增至30TB,存储空间告警频发,数据传输效率显著下降。

伴随患者检查量持续攀升,影像数据积压问题愈发严重:由于日间数据吞吐量饱和,部分影像设备直至夜间22:00仍未完成当日图像上传;而在凌晨无人监管时段,设备常因超时而自动终止上传任务,导致次日数据拥堵进一步加剧。患者检查后,等待超24小时才能获取报告,就诊体验大打折扣。

医院信息中心先后尝试多项优化措施,但优化效果未达预期:初期调整PACS并发进程数,反而加剧停传、数据挤压问题;后续聚焦网络稳定性与带宽,为阅片室单独布设网线,升级门诊楼网络设备,更换汇聚交换机、楼层接入交换机及全新光纤,通过增设前置机分流设备上传压力、提升医生阅片下载效率,但核心问题仍未有效解决。

1.jpg

图1 加载故障照片

更为严峻的是,各个影像设备对存储资源的争夺日益激烈,导致医技科室在影像调阅时频繁出现卡顿,临床报告调取延迟,直接影响诊疗效率。

经深入分析,医院信息中心发现,上述问题并非由单一设备故障引发,而是“软件—硬件—网络”协同层面的系统性瓶颈。为此,信息中心联合业务软件厂商、硬件厂商、临床医技科室,共同开展全流程诊断,构建“业务数据流程图+物理拓扑图+数据结构图”三张图可视化模型,精准定位根因,并形成包含问题清单、优化方案、迁移方案、成本风险测算的《PACS系统健康度评估报告》,为后续改造提供科学依据。

梳理调研情况,精准剖析核心问题

基于上述调研结果,医院精准剖析当前系统面临的五大核心问题。

1.系统架构高度集中

PACS软件、影像平台等核心系统的上传、调阅、归档等操作均集中于同一套存储设备,且所有服务器会话连接汇聚于单一存储节点,系统自动归档持续产生大量小文件迁移,造成同一套存储设备读写放大,随着影像设备数量增长及数据量的增加,存储性能持续劣化,传输等待时间不断延长。

2.jpg

图2 现有PACS业务软件数据流与物理拓扑图

2.存储系统已达极限

医院每日新增影像文件超200万个,单份大小介于57KB至800KB之间,累计总量已突破24亿个。而原架构中进口分布式存储系统基于传统层级文件检索机制,单个目录下仅支持2亿文件管理上限,远不能满足当前需求。同时,其通用文件传输协议未针对医疗小文件场景优化,在频繁的文件创建与删除过程中,产生了约40%的额外元数据操作与I/O资源开销。实测显示,影像调取耗时从常规2秒延长至15秒,业务高峰期阅片延迟率高达63%。

3.jpg

图3 PACS海量小文件面临的挑战与不同文件系统解决方案对比

3.网络架构存在冲突

PACS业务网络与存储网络共用同一物理链路。当多台设备以多并发模式上传大容量数据时,极易抢占PACS调阅带宽,引发存储响应延迟,造成业务卡顿。

4.综合成本居高不下

原进口设备采购单价高昂,当前所需扩容容量为初期的3倍,意味着预算需增加300%以上。此外,每年维保费用占设备购置成本的10%以上。由于原厂为境外企业,国内服务网点稀少,技术支持存在时差与语言障碍,平均故障响应时间长达2–3个工作日,修复周期常超48小时,严重影响业务连续性。

5.扩展能力受限

传统一体式存储架构难以平滑扩展,该型号存储的硬件已经停产,目前将面临数据大规模迁移甚至业务中断风险,无法支撑医院未来5年的数据增长需求。

优化解决方案:构建国产化驱动的新型存储体系

针对上述痛点,医院确立“两级存储搭建、统一平台管理、国产化架构适配”的升级思路,从软件、硬件、网络三大维度系统重构数据基础设施,坚持“安全稳定、自主可控、可持续低成本扩展”的原则,最终选定基于ARM架构的国产化软件定义存储方案。

1.分层存储架构,兼顾性能与成本

为应对PACS系统中不同业务场景对存储性能的差异化需求,规避同一套存储间的归档读写放大问题,医院创新采用“全闪+混闪”两级分层存储架构,从设计源头实现资源隔离与效能优化。

全闪存分布式存储:采用全NVMe硬盘构建高性能在线存储池,专用于PACS活跃影像数据,保障医技科室在海量小文件场景下的高速上传、实时审片与报告签发。

混合闪存分布式存储:构建PB级全量影像归档池,用于长期保存历史数据与影像中心备份,实现性能与成本的最优平衡。

4.jpg

图4 原有架构与优化后架构对比

2.网络架构重构,消除带宽争抢

分布式存储摒弃传统TCP/IP万兆互联方案,全面部署RoCEv2无损网络。存储节点间端到端时延从150μs降至9.8μs;通过PFC(Priority Flow Control)流量控制机制,将存储流量优先级设为最高,在40Gbps带宽下实现零丢包传输。

同时,为所有虚拟机及物理服务器新增独立网卡,构建与业务网完全隔离的专用存储网络,形成影像设备传输与临床调阅分流隔离的网络架构,彻底解决多业务场景下网络架构不合理的现状。

5.jpg

图5 网络优化示意图

3.小文件处理能力突破

协议深度优化:选择对SMB协议进行定制化改造的存储,消除读写放大效应。实测显示,单台PACS服务器影像上传效率从每秒7张提升至45张,性能提升6.4倍,有效缓解临床调阅延迟问题。

元数据管理革新:经技术论证,多活分布式元数据架构更契合医院业务的持续发展需求。该技术可将20亿级文件元数据分散存储于多个节点,真正做到能随节点增加提升性能,多活元数据通过哈希值直接定位物理位置,实现毫秒级检索。200层深目录的响应时间稳定控制在1.2秒内,较传统系统提升12倍。

小文件智能聚合:当前主流新存储系统在处理医院海量影像数据时,可将1MB以下小文件聚合成64MB逻辑单元;部分先进的存储技术还具备冷热数据智能合并能力。该技术通过减少文件I/O操作量,显著提升OPS性能指标,使机械硬盘顺序读写占比从17%提升至92%,大幅优化影像批量上传效率。

4.国产化与可持续发展并重

综合评估后选择软硬解耦、基于ARM芯片的国产化软件定义存储方案。

软硬解耦:避免因硬件停产导致扩容困难,确保未来十年无需大规模数据迁移即可平滑扩展。

ARM架构优势:多核并行架构与精简指令集在I/O密集型场景下效率更高,供应链更稳定,不受外部因素制约。

成本与服务优势:经综合测算,国产化设备购置成本较同配置进口产品降低约30%-40%,且年维保费用仅为进口产品的50%-60%。更重要的是,国产化厂商提供7×24小时现场服务,故障响应≤2小时,解决周期≤12小时,并支持定期巡检与远程升级,保障系统长期稳定运行。

迁移实施:三阶段策略保障“零中断”

在本次PACS存储系统的升级改造项目中,数据迁移是整个工程的关键环节。为支撑未来业务发展对性能与容量的更高要求,项目需将现有老旧存储系统中的海量医学影像数据完整、安全、高效地迁移至新部署的PACS存储架构:其中,在线活跃数据迁移至高性能全闪存存储系统,以保障高并发访问下的低延迟与高吞吐;历史归档数据则迁移至大容量混合闪存存储系统,兼顾成本效益与长期保存需求。

为最大限度降低迁移过程对临床业务的影响,项目组采用了自主研发定制的小文件自动迁移工具。该工具支持基于策略的错峰调度与带宽限速机制,有效避免了因迁移任务争抢网络与I/O资源而导致的系统性能波动。同时,通过多目录并行挂载方式,充分发挥分布式存储系统的横向扩展能力与聚合带宽优势,显著提升整体迁移效率。

为实现业务“无感知”平滑切换,项目依托现有院内DNS解析服务与多路径读写切换机制,在不修改PACS系统数据库中已有文件存储路径的前提下,完成新旧存储系统的无缝过渡。此举彻底规避了因路径变更引发的应用适配、数据引用失效等风险,确保整个切换过程“零停机、零中断”,部署与迁移示意图如下。

6.jpg

图6 新存储部署与数据迁移规划方案

本次迁移实施严格遵循准备、执行、验证三阶段策略。

第一阶段:业务接管与源端准备

首先,将新存储系统挂载并接入生产环境,由其正式接管新增业务写入,确保业务连续性不受影响;随后,将原存储系统设置为只读模式,防止迁移过程中产生新的增量数据干扰数据一致性。同时,充分利用PACS软件内置的“水位线”特性,对源端冗余或低效存储的数据进行在线压缩,显著减少实际需迁移的数据总量。

第二阶段:自动化迁移与完整性校验

部署并配置小文件自动迁移工具,设定源/目标存储连接参数、传输速率上限、并发线程数等关键策略。启动迁移任务后,工具自动扫描源目录结构,按预设规则高效传输文件,并根据PACS业务负载动态调整迁移带宽与并发度,实现实时资源协同调度。迁移全程通过可视化监控平台追踪进度、速率及异常告警。迁移完成后,自动执行全量数据校验,包括文件数量、总容量、MD5/SHA校验和比对,确保目标端数据与源端完全一致。

第三阶段:透明切换与业务验证

数据迁移与校验确认无误后,通过更新DNS记录,将PACS系统访问域名所解析的IP地址由原存储切换至新存储系统。由于文件路径结构保持不变,上层应用与数据库无需任何配置修改,即可无缝访问新存储中的全部数据,真正实现“业务无感、路径透明”的切换目标。同时,在PACS系统内随机选取不同时间阶段的50份影像数据,人工调阅验证,核对患者信息与影像数据的一致性。

在整个迁移过程中,系统始终保持至少两份有效数据副本(源端+目标端),并通过校验机制与回滚预案,确保“数据零丢失、操作可追溯”。最终成功达成“零业务中断”的核心迁移目标。

迁移规模与性能表现:海量小文件高效迁移

本次数据迁移对象为PACS系统中的海量医学影像文件,单文件大小集中在50KB至600KB之间,具有典型的小文件密集型特征。进口分布式存储4节点集群(总容量35TB实时在线影像、归档影像356T),迁移目标为国产化分布式存储平台。整个过程依托10GbE高速网络环境,未出现带宽瓶颈。下表对比了常见迁移方式在关键指标上的差异:

表1 迁移工具性能测试与功能对比表

7.jpg

从对比可见,传统复制方式如Ctrl+C/V或FastCopy虽具备一定效率,但普遍存在缺乏智能调度、不支持断点续传、频繁元数据操作损耗大等短板,尤其在面对PB级小文件迁移时极易造成资源争抢与业务干扰。

实测数据显示,在10GbE网络环境下,定制迁移工具平均传输速率高达185.73 MB/s,文件处理速度达1,773.18个/分钟,远超传统工具。其操作简便、策略灵活、稳定性强的特点,使其在跨品牌、大容量、高并发的医疗国产化迁移场景中展现出卓越的适应性与工程价值。最终实现一个月高效迁移400TB数据,“零业务中断、零数据丢失” 的迁移目标,圆满完成PACS存储架构升级改造。

成效与价值:打造医疗国产化新范式

上线后试运行期间,信息部门对各个影像科室走访后,收集业务科室体验反馈,系统成功实现“随拍随传、随传随阅”的效果,即便在日增200万张影像的业务高峰下,系统可支撑24亿份海量小文件高效稳定运行。

日常业务层面,改造后影像上传效率提升6.4倍,患者等待时间由2小时缩短至20分钟内,大幅提升医院运转效率与患者就医体验。

本次升级全面解决PACS系统长期存在的性能瓶颈与成本难题,实现核心技术自主可控。作为国内肿瘤专科医院中首个完成PACS全栈国产化存储升级的实践案例,山东省肿瘤医院为医疗行业提供了可复制、可推广的“国产化+效能”融合范本,有力推动信息技术与医疗业务深度融合,为医疗领域国产化落地提供重要示范。

作者简介

张新斌,山东第一医科大学附属肿瘤医院质量管理部信息中心负责人,兼任山东省卫生健康网络安全与信息技术应用创新专业委员会副主任委员、山东省青年医务工作者协会医疗大数据分会副主任委员等社会职务。

(山东第一医科大学附属肿瘤医院质量管理部信息中心张晨明、范齐鸣、魏崇琪对本文亦有贡献)