北医三院:大数据应用有效支撑临床科研

  自2009年新医改启动以来,医疗大数据应用一直是各大医院探索的主要方向。一般大型三甲医院有上百个系统在线运行,这些系统可能来自十几个厂商,由于缺乏信息表达、交换、处理的统一标准,且整个数据体量庞大、类型复杂,符合大数据的基本特征。

  而从医院实际需求角度看,临床业务对医疗质量控制、科研分析研究及信息共享的需求十分迫切。当这些来自一线的需求摆到医院信息主管面前,对医疗大数据应用的探索也正式启航。

  破解多源异构数据之困

  经过十多年HIS建设,北医三院基础设施和应用系统已形成一定规模,陆续建成了包括门诊和住院医生工作站、检验系统、护理系统、手术麻醉、影像系统等在内的临床信息系统。以电子病历为核心的临床数据已积累到一定数量级。对临床数据的深挖利用是北医三院当前的重点工作。

  目前,北医三院日均门诊量达16000人次,医院现有床位1740张,住院周转率较快,人均住院6.37天。医院信息化建设已初具集团化规模优势,医院本部及四个分支机构现有服务器近140台,业务网、办公网终端设备近4000台,包括推车150台、PDA300多台,此外还有HIS、CIS、OA等丰富的软件资源。

  北医三院信息管理中心副主任计虹认为,针对多源异构数据的大数据分析需要四步实现:一是集合多个数据集,二是解决不同类型数据的融合、关联,三是按一定标准进行统一存储,四是将数据进行综合关联分析后以不同的主题来展现。

  具体到北医三院实际情况,计虹表示:“如何对六年积累的大量临床业务数据进行有效利用,我们也做了很多尝试性探索。在我看来,医院数据利用系统的建设有三大目标:加强日常管理、追踪指标检测以及持续的医疗质量改进。”

  探索临床业务数据服务

  目前,北医三院面向临床业务系统建设了临床业务数据平台。“建设基本思路是基于HL7的临床事件模型,消除中间件技术,最终建立一个完善的架构体系。”计虹表示,“在这个体系中,底层就是各个应用系统,中间是统一的适配器做数据整合、集中存储,顶层是临床智能分析系统CI,对医疗质量、运行指标进行分析,最终实现服务临床和管理业务的目标。”

  据计虹介绍,北医三院临床业务数据平台建设分为数据整合、数据存储、数据分析、数据展现四个步骤。

  1.数据整合

  医院数据是来自在线库、历史库以及本院库、分院库等的异构数据,这些数据来自HIS、LIS、EMR、NIS、PACS等不同IT服务商。数据整合的目的是通过对多源异构数据进行整合,将数据标准化,建立临床数据中心、可监测的分析指标体系以及追诉体系,实现对多源异构数据的有效管理。同时建立以患者为中心,以时间为逻辑关系,基于事件的连续性的数据集,实现异构系统和异构数据的对接。

  计虹强调:“在建设临床业务数据平台的过程中我们发现标准化的问题在医院确实令人头疼,缺乏标准会极大降低数据的利用率。标准化越早做,你的数据有效利用越有价值。”

  2.数据存储

  基于MongoDB与Hadoop分布式大数据技术实现分布式的数据存储,为复杂的临床数据分析构建多个分布式数据计算节点,更适用于临床数据的多维表达。“通过在应用中对比实体机和虚拟机的运算,我们发现实体机堆叠式的运算方式更适合大数据的运算,要比虚拟化服务器性能高。当然,虚拟化可提高前台应用的安全性,但就大数据这种分布式运算而言,用实体机堆叠式方式效果更好。”计虹表示。

  3.数据分析

  数据分析包括逻辑配置、分析引擎、数据封装三个步骤。

  第一步是逻辑配置。逻辑配置需要依据个案指标、群组指标、分析断面、群组数排除四大类进行配置。

  第二步是分析引擎。分析引擎需要对关键临床事件进行鉴定,激活对于临床个案、病历的分析引擎来计算分析形成结果并进行数据展现,再基于临床数据中心形成的临床病历资源的子集建立灵活的临床或科研分析断面,最后将结果数据封装传递到前端。

  第三步是数据封装。按照对应的临床事件进行封装,将多源数据归集,建立数据统一的适配器来完成临床数据的标准化。数据增量的方式分别采用了两种方式:大于30天的数据采用批量型适配的配置定时加载,小于30天的数据做在线库的增量适配器定时增量采集,减少对在线库的压力。

  4.数据展现

  临床数据模型是整个数据中心的基础,数据展现正是围绕临床事件展开的。“我们建立了包括门诊、急诊、处方、结算、入院等64个临床事件,以急诊的临床事件为例:一个患者来了,他要就诊、办手续、诊断、医嘱、转科等,要对这些事件进行整合。将数据按时间轴展开,最终为医院业务部门提供运营监测、医疗质量、科研分析、重点人群等多维度展现。”计虹表示。

  基于临床业务数据平台,北医三院建立了全院级的应用以提高医疗质控的能力和效率,实现了对运行指标的监测。一方面,通过建立医疗多中心,让系统去考虑需要多科会诊的问题;另一方面,通过建立科室级的应用为科研提供支撑。

  整合影像异构数据

  对医院而言,影像数据更多是非结构化数据,包括CT、核磁、超声、内镜、核医学影像等信息,更符合大数据特征。

  “北医三院PACS数据年增长量达15TB。”计虹表示。跨科室、跨院的影像文档如何实现统一管理?海量影像数据如何进行有效整合?如何建立影像数据统一管理平台,实现更集中的展现形式?

  计虹介绍说:“我们搭建了一个影像数据的集中管理平台,集成了PACS、RIS、超声、内镜、病案、核医学等影像数据,实现了影像文档的采集和集中管理。该系统基于时间轴管理,所有记录按历史先后顺序展现,再分类排列。这种模式的确大大方便了临床医生的使用。同时数据应用平台也能支持科研需求,可以使用关键词进行全文检索、类似病历的聚合等功能。未来,我们还将对协同诊疗、跨院区、区域化的影像互认等领域进行探索。”

  “医院有效挖掘数据价值一定要以临床业务来推动数据的应用水平。”结合数据应用平台建设的经验,计虹强调,“系统好坏不仅仅是技术问题,因为数据利用不同于前端应用系统,它与临床的专业化程度息息相关。数据利用的好坏绝大部分取决于临床管理部门的需求是否明确和细化。如果使用人员描述不清,指标定义不明确,信息技术人员就无法配合实现,这也会影响数据利用的有效价值。因此,管理与临床部门有这个意识是好事,但医院数据利用平台建设的成功需要管理人员与临床学科密切配合、科研人员的深入研究,才能将医院数据挖掘与利用真正落地。”

  本报记者 洪蕾

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: