【IT168 应用】随着大数据在医疗与生命科学研究过程中的广泛应用和不断扩展,其数量之大和种类之多令人难以置信。比如:一个CT图像含有大约150MB的数据,而一个基因组序列文件大小约为750MB, 一个标准的病理图则大得多,接近5 GB。如果将这些数据量乘以人口数量和平均寿命,仅一个社区医院或一个中等规模制药企业就可以生成和累积达数个TB甚至数个PB级的结构化和非结构化数据。
在中国,2010年,国家公布的“十二五”规划中指出要重点建设优异、省级和地市级三级卫生信息平台,建设电子档案和电子病历两个基础数据库等诸项目标,也就是推进医疗信息化的“3521”工程。过去由于缺少统一的电子病历系统(EMR)标准,中国的电子病历系统发展比较缓慢,医院之间不能实现共享病患信息共享,医疗服务水平也因此受到影响。为改善这一现状,国家会逐渐加大对电子病历的投入,适应这一趋势,各级医院也将加大在数据中心,IT外包等领域的投入。而随着医疗信息数据的几何倍数增长,医院信息存储将越来越受到重视,医疗信息中心的关注点也将由传统“计算”领域转移到“存储”领域上来。
有“弊”就有“利”
对于许多医疗和生命科学机构而言,努力控制大数据造成的呈螺旋上涨的成本、复杂性和风险已经成为一个至关重要的问题。然而,从另一个角度来看,医疗大数据能够带来的收益要远远超出管理它们的成本,如开放新的具有医疗价值的信息源、提高诊断准确性和速度、预测疾病和健康形态,以及取得生命科学创新的不同见解。美国管理咨询公司麦肯锡全球研究院(MGI)预测,如果美国的医疗行业能够有效利用不断增长的大数据来提高效率和质量,那么每年可创造超过3000亿美元的额外价值。而且,在欧洲的发达国家中,仅在提高运行效率一项上,政府行政管理部门就可以利用大数据节省1000亿欧元以上的费用。1
对于大多数成功的医疗机构来说,利用大数据已经成为提高生产力、改进护理水平、增强竞争力、加快增长和创新的关键策略。那么,我们该如何在两方面进行平衡,实现可观的效果和利润呢?
答案存在于数据经济学中,即如何使从数据中获取价值的成本低于数据能产生的效益?如果我们能够有效地将数据存储、处理和保护成本降至最低,然后利用尖端技术将数据转化成支持临床需要与业务增长的可执行信息,我们就能实现最高的数据经济效益。
医疗大数据的挑战
然而,如何有效地将大数据存储成本降至最低,是企业和IT领导者,尤其是内容驱动的医疗和生命科学企业面临的根本性挑战。因为除了数据数量和形态的迅速增加,医疗数据还需要越来越长的保留期。患者的病历可能需要保存70或80年,甚至更长。许多情况下,病历还必须以原始格式永久保存,以满足法规遵从的要求。同样,生命科学研究机构有选择性的选择价值足以保留和维护数十年的数据,以期为新研究提供依据。
另外,许多医疗与生命科学研究机构在竭力应对资源紧张、持续的业务增长和新医疗技术带来的挑战。事实上,存储消费速度加快,存储资产未得到充分利用,对空间的持续需求以及动力和冷却成本的增加,都推动了总体拥有成本的不断攀升。而且,一旦存储系统的安全性出现问题,导致医疗数据丢失,医院会面临更严重的局面。对于研究机构来说,数据存取是创新和竞争力的核心。这样看来,文件数据不断增长导致的管理成本提升被认为是当今全球5000强公司面临的五大难题之一,这种结论就不足为奇了。 2
医疗行业应对大数据的理想基础架构
要实现最高数据经济效益,关键是能够对包括结构性数据和非结构性数据在内的所有医疗大数据进行集成,实现集中管理和更好的资源配置。为了整合医院不同部门或不同生命科学系统的大数据,实现最充分的信息搜索和共享,理想的存储架构必须是一个适用块数据、文件和内容的集成系统,并且拥有强大的容量、性能和吞吐量,在处理、移动和访问多个大型数据集和大量数据(数量常常达到数个TB甚至是PB)时能够保持运行的一致性。为了尽量降低存储成本并满足临床业务需要,理想的存储架构还必须支持临床创新的数据互操作性,必须能够智能分层,根据访问频率、临床价值和实际存储成本自动完成数据分布。这种动态分层功能有助于进一步提高容量利用和资源配置水平,从而全面优化存储资源的成本效率。
HDS文件和内容解决方案
HDS文件和内容解决方案由Hitachi Content Platform、Hitachi NAS Platform,、Hitachi Data Discovery Suite 以及Hitachi Data Ingestor组成,可以满足在医疗和生命科学研究领域中存储、管理、保护和搜索各类数据最严苛的要求,无论这些数据是pdf文件、医学影像还是病患人口数据。另外,Hitachi Clinical Repository(HCR)为管理业务和健康数据、固定内容和图像,应对DICOM/HL7数据读取、数据整合、数据挖掘和数据分布这些独特挑战而设计的。它由Hitachi Content Platform(HCP)和DICOM/HL7网关组成,可基于HDS平台、客户解决方案或合作伙伴的应用平台使用。这些解决方案所具有的独特功能包括:
集成存储 – 文件、内容和块服务在单一管理界面中融合。通过跨平台创建存储池和利用虚拟化,客户可以简化管理,提高利用水平,并恢复或延长现有资产的使用寿命。
智能分层 – 动态分层存储架构通过预定义存储层、数据索引和制定自动将数据迁移到对应层的策略管理基于文件的数据(如pdf文件或医学影像)。通过自动将活跃数据迁移到适当的平台,你可以优化磁盘要求【例如:在低成本的SATA硬盘里存储更多数据,同时减少在费用高昂的光纤通道、SAS或固态硬盘(SSD)上存储数据】。这一策略根据精确的业务运行需求管理内容,不仅使文件和内容存储更有效更加智能化,还提高了整个存储系统的成本效率。
存储优化 – 动态分层使闲置容量可以轻松得到再利用,重新确定现有资产用途以延长使用寿命,并自动将非活跃数据迁移到具有复制功能的内容仓库。这使容量效率和利用率达到最大化,同时可以减少备份卷,并且能够优化存储资产的投资回报率。
内容感知搜索 – 本地自动感知能力可以识别所存储数据的相关性。对使用单一接口的多种资源还可以进行联合查询,以便搜索数据并提供索引。内容感知搜索实现了文件和内容服务的真正同化,以满足法律监管和企业要求,并可以管理内容引发的迁移和其他整体数据活动。
低成本存储 – 通过集中建立存储池、跨系统智能扩展和利用动态分层自动完成数据迁移,减少了管理节点,提高了存储资产的使用经济效率,也降低了对硬件的要求。管理、备份、容量规划、动力和冷却成本随之降低,这些使固定资本(CAPEX)和 运营成本(OPEX)都大大降低。事实上,已经有数据证明HDS文件和内容解决方案最高可节省25%的管理成本和60%的备份成本。
边缘到核心存储 - 中心医院还可以选择为偏远的医疗中心提供无缝的边缘到核心的数据访问支持,增强临床医师间的协作,通过进行有效控制来实现免备份存储,。
HDS文件和内容解决方案旨在帮助相关机构管控好大数据环境,利用统一、可扩展的管理平台简化大数据存储复杂性、整合资源促进利用,调动数据以满足业务需求,改进数据保护以提高合规性水平并降低风险。目前,包括江苏省人民医院、武汉市普爱医院、无锡第二医院 、中山大学附属第一医院、郑州大学附属第一医院以及南京东南大学附属中大医院等在内的国内众多医疗机构均已采用了HDS的相关解决方案。这些解决方案的目的是通过将可丰富企业价值、提高效率和竞争力的数据转化为可执行的信息,最终从根本上使医疗与生命科学机构能够实现非常好的的数据经济效益。
附:IDC Health Insights最新调查显示,亚太地区69%的医疗行业IT决策人员编制预算投入到云计算领域中。其中,50%以上表示将继续加大投入,而没有机构会缩减预算。