存储 频道

让健康随行 曙光医疗大数据方案解析

  分步解析:曙光大数据支撑平台与大数据应用平台

  大数据支撑平台的主要作用是搜集数据,对数据进行存储、处理等操作,并对大数据应用平台提供数据支撑,其是医疗大数据方案中最为核心的部分之一。根据作用的不同,曙光将其分解为基础设施层、数据存储层、数据处理层、应用层和管理层。具体如下图所示:

曙光大数据支撑平台与大数据应用平台

  对于所有的IT解决方案而言,基础设施是不可或缺的一环。在曙光的医疗大数据解决方案中也是一样,基础设施层是曙光专为大数据定制的服务器及网络构成的集群组成,是构建大数据应用的硬件平台。

  数据存储层则是基于曙光并行数据库系统、曙光Hadoop发行版以及标准数据库实现。用来存储从每个医疗数据源收集来的海量结构化和非结构化数据。其对象包括医疗机构、社康、门诊,以及区公卫机构,医疗机构的HIS、LIS、PACS;社康HIS、CIS、CHSS以及公卫疾控系统、传染病上传系统等等数据构成总体架构的最基本的数据源。数据源通过医疗机构、社康、公卫等机构的前置机进行数据采集,然后通过内置路由网关传输到数据平台,实现分散数据的集中存储和管理。

  数据处理层则是对数据进行处理,包括数据清洗、校验以及转换等过程。被处理的数据最终转化成符合医疗卫生信息化标准的卫生综合数据,标准数据经过ETL后存入医疗中心数据仓库,为大数据应用做数据准备。

  数据应用层则是为大数据应用平台提供类型丰富的访问接口,包括Search API、Pig、Hive QL以及曙光专为用户设计的SJDBC(类JDBC)和UDF(用户自定义函数)接口,方便用户的使用。

  曙光大数据支撑平台针对医疗行业大数据应用特点,采用多项曙光创新的结构化与非结构化数据一体化处理、并行处理、SQL/MapReduce统一执行引擎、分布式容错及自动故障处理、复杂数据类型关联分析、多IP通路负载均衡、处理任务断点执行、动态扩展等技术,从服务器、网络、操作系统到软件层逐层优化,保证系统具有高性能、高可靠、易扩展、易使用等特点,同时曙光为大数据支撑平台设计了图形化的统一管理系统,简化用户的管理和维护工作。

24
相关文章