【IT168 应用】说起医院,可能绝大多数的平头老百姓都有一种莫名的畏惧,因为“看病难”。“看病难”的原因也许有很多,如确诊难、重复检查、多花钱以及流程繁琐等等。但你是否有想过未来到医院看病将是怎样的情况呢?
利用大数据分析解决“看病难”
也许是这样的,你进行常规体检的时候,就会提醒你需要到医院进行针对性检查,到任何一家正规医院检查之后,很快就能找到病因,并根据你以往的患病信息,为医生提供参考的治疗方案和建议。需要创伤性手术的话,马上筛选出符合条件的医院,到另一家医院进行住院治疗或者因为其他原因需要转院的话,你并不需要重复检查,你的病历会随之转移到新的医院。而需要异地专家支援的话,也许专家也不必到现场,远程操控就可以。术后休养根据每个人不同的情况可能会有不同的建议可供参考,术后的健康追踪也不一定非要到特定的医院进行,也许就近医院就可进行。
这很像是异想天开吗?借助现代化的IT技术手段,这一切实现起来其实并不难。如果用大数据的概念来看的话,其可简单地被分为三个过程,即数据搜集、数据分析和结果输出。当然,看似简单的背后通常有一系列的技术挑战,但并非不可解决。从目前来看,其最核心的问题落在了大数据之上。如何把医疗大数据转换为经济价值,即“关键是怎么能够提取出与诊疗有关的数据”。
大数据的来源有很多,诸如公共卫生系统(妇幼、防疫、血站等)、院内系统,及对两种系统融合的区域卫生平台。各种来源的数据集中起来可能会产生大量的数据,这之中不仅有病人主索引系统中的结构化数据,PACS系统中还存在Dicom、JPG文件,甚至手术系统中的视频文件,以及用于病历中的XML文件等等,这些都是医疗医用中重要的数据类型。
各种来源的数据集合起来就会达到几十TB甚至上百TB的数据规模,可预见的是,随着医疗信息化进程的推进,其数据量将会越来越庞大,这仅仅是存储空间需求,要将这些数据最大限度利用,就需要对数据进行处理和分析,以回馈出具有参考意义的结果。
曙光医疗大数据方案整体设计
作为国内最具知名的IT解决方案厂商之一,曙光公司的大数据战略,正致力于解决各行业海量数据带来的难题,并发挥其潜在的价值。医疗信息化,这个关乎民生的工程,也是国家的重点建设项目之一,引起曙光的重点关注是必然的。
对医疗数据的采集、存储、分析和展示是曙光医疗大数据方案的核心。结合当前医院的业务,以及向医疗信息化进军所存在的问题,曙光提出了针对医疗大数据的整体设计模型,具体如下图所示:
曙光公司提出的医疗大数据模型有大数据制程平台和大数据应用平台两部分构成。大数据支撑平台是医疗大数据应用的基础环境,利用大数据管理的手段对不同的基础硬件、基础软件、开发平台从架构上进行规划,从而满足医疗行业大数据应用平台的需求。
大数据应用平台则通过建立一套信息化、标准化、智能化的决策支持应用系统,可方便医疗管理机构及医疗服务机构进行卫生管理和决策指导。曙光的医疗大数据系统主要为医疗卫生规划指导、监督管理、资源协调、疾病防控等方面提供服务。
分步解析:曙光大数据支撑平台与大数据应用平台
大数据支撑平台的主要作用是搜集数据,对数据进行存储、处理等操作,并对大数据应用平台提供数据支撑,其是医疗大数据方案中最为核心的部分之一。根据作用的不同,曙光将其分解为基础设施层、数据存储层、数据处理层、应用层和管理层。具体如下图所示:
对于所有的IT解决方案而言,基础设施是不可或缺的一环。在曙光的医疗大数据解决方案中也是一样,基础设施层是曙光专为大数据定制的服务器及网络构成的集群组成,是构建大数据应用的硬件平台。
数据存储层则是基于曙光并行数据库系统、曙光Hadoop发行版以及标准数据库实现。用来存储从每个医疗数据源收集来的海量结构化和非结构化数据。其对象包括医疗机构、社康、门诊,以及区公卫机构,医疗机构的HIS、LIS、PACS;社康HIS、CIS、CHSS以及公卫疾控系统、传染病上传系统等等数据构成总体架构的最基本的数据源。数据源通过医疗机构、社康、公卫等机构的前置机进行数据采集,然后通过内置路由网关传输到数据平台,实现分散数据的集中存储和管理。
数据处理层则是对数据进行处理,包括数据清洗、校验以及转换等过程。被处理的数据最终转化成符合医疗卫生信息化标准的卫生综合数据,标准数据经过ETL后存入医疗中心数据仓库,为大数据应用做数据准备。
数据应用层则是为大数据应用平台提供类型丰富的访问接口,包括Search API、Pig、Hive QL以及曙光专为用户设计的SJDBC(类JDBC)和UDF(用户自定义函数)接口,方便用户的使用。
曙光大数据支撑平台针对医疗行业大数据应用特点,采用多项曙光创新的结构化与非结构化数据一体化处理、并行处理、SQL/MapReduce统一执行引擎、分布式容错及自动故障处理、复杂数据类型关联分析、多IP通路负载均衡、处理任务断点执行、动态扩展等技术,从服务器、网络、操作系统到软件层逐层优化,保证系统具有高性能、高可靠、易扩展、易使用等特点,同时曙光为大数据支撑平台设计了图形化的统一管理系统,简化用户的管理和维护工作。
大数据应用平台概览
曙光医疗大数据应用平台将医疗卫生数据中心仓库的数据经过ETL后,集中到数据集市,数据集市中的数据经过OLAP和数据挖掘分析引擎处理后,应用于大数据的报表展现、卫生数据统计、决策分析、数据挖掘、疾病预警、预测等。通过应用系统,提供给使用者直观展示。
其应用方向可包括医疗收入、患者负担、工作负荷、工作效率、疾病监控等多个主题。各主题分析都基于大数据技术构建,通过采集不同医疗机构业务系统数据,对各项医疗业务进行汇总统计、构成分析、对比分析、因素分析、增量函数分析等,并通过各种图表形象、直观的表达出来,能够有效的反映医疗管理机构或服务机构的整体运营、管理等情况。同时有利于管理层正确分析并做出有效决策,强化医卫管理,优化资源配置、控制不合理因素。
小结
曙光针对医疗行业所推出的大数据解决方案,旨在建设一套信息共享化、决策智能化、管理科学化的医疗大数据应用系统。通过该系统,可以对治疗安全质量、医疗收入、患者负担、工作负荷、工作效率、疾病监控、在线监管等多个角度进行探索。其有效地将医疗质量安全目标分解到具体监控指标,通过管控指标的设置与分发,事中进行环节质控与监测,事后进行对标总结与PDCA持续优化改进,使医疗管理从被动型、粗放型的管理,转向前瞻性、主动性和精细化的管理。