【IT168 资讯】日前,众志和达正式发布了面向大数据运算场景和数据分析挖掘应用市场的全新一体机产品---SureSave BDP1000大数据一体机,该产品集数据计算平台、系统管理监控、数据挖掘分析、结果可视化呈现以及行业大数据应用接口等功能于一体,以灵活定制、高拓展、简便易用的特性帮助用户从容应对大数据的挑战,从而摆脱基于大数据的分布式计算、数据库配置、机器学习、可视化呈现等繁琐的工作,以更加迅速、简便的获取业务决策依据。
众志和达(英文SOUL),是中国信息存储、数据安全与应用领域领先的解决方案与服务提供商,拥有超过15年的中国本土市场经验和3000多家最终用户。
SOUL以满足云计算、大数据时代企业客户需求为目标,坚持自主创新,拥有基于自主知识产权的SoC(Storage-on-Chip芯片级存储)技术、SureSave智能化存储与保护管理、分布式存储与计算管理等核心技术,提供海量数据的存储、保护与云计算、大数据等应用解决方案,为现代IT应用提供高速、安全、可靠、弹性的基础架构,将数据与计算的价值充分发挥。
大数据驱动变革 传统IT架构面临难题
大数据(Big Data)的热潮席卷全球,越来越多的行业和用户通过相关案例,已经逐渐理解大数据并产生了各自的分析需求,然而面对庞大的海量数据和复杂的运用环境,如何开展数据挖掘与分析工作,是传统IT架构面临的难题。
目前已经有大量的政府部门和企业,正在积极建设与其业务应用紧密相关的大数据分析平台,SOUL与用户进行前期调研与沟通,发现仍然有很多用户采取传统IT架构进行数据分析,随着数量的增长和数据子集的复杂程度增加,传统手段已经很难解决大数据的实时分析问题。
面临大规模、海量数据需要快速的分析能力,传统IT开展数据分析往往会由于时间太长或者费用太高而变得困难。大数据分析的数据源呈现出多样化的特点,特别是快速增长的海量非结构化数据,而传统的数据库、数据仓库的手段很难支撑对于非结构化数据的实时分析,为了解决这个问题,用户通常采取汇总数据或者抽样数据来做分析,但是这样往往会照成数据延时,而抽样数据同样会降低了整体数据准确性,降低了数据的分析价值。
SureSave BDP1000大数据平台实现了海量数据存储与运算两者的有效整合,无论是结构化数据和非结构化数据,都有相应手段能应对和支撑,提升了数据分析效率和决策价值。
SureSave BDP1000大数据一体机提供了更加便捷有效、灵活快速的多数据集分析与挖掘技术,通过前期数据需求调研,采用软硬件实现数据的收集、组织和整理,用户现有数据能够直接导入大数据平台中开展分析和挖掘,减少了用户硬件设施选购部署、软件定制开发周期以及程序员研发成本;更能以不同视角从所有数据中挖掘出最具价值的信息,这些信息通常不容易在其处于原始格式的时候被发现,基于全样本的数据挖掘为用户开拓了更为广阔的视野,从而能够更为全面、精确的制定发展战略。
五项大数据应用功能 构建大数据挖掘周期
SureSave BDP1000大数据一体机包含数据计算平台、数据管理监控、数据挖掘分析、结果可视化呈现和行业大数据应用接口五项大数据应用功能,涵盖了所有大数据分析与挖掘所需的功能与组成部分,提供了从基础数据到结果展现,一整套端到端的完整大数据解决方案。
数据计算平台,提供软硬件一体化框架,在设备中包含了用于分布式计算的软硬件产品,采用灵活的组合与定制化选件,满足不同项目的数据分析和挖掘的需求,针对具体应用环境采取定制化组合,包括分布式文件系统,计算存储,分布式框架,交换网络等模块。
数据管理监控,管理和监控分布式系统的节点资源使用情况的,可以针对系统进行分布安装和下线维护等管理工作。智能化的分布式系统,实现了从自动部署、节点监控、数据安全、安全审计等一系列流程的智能化管理,增加分布式系统的可关联性。并且不同厂商的系统与配置往往千差万别,智能化的数据管理监控,降低了节点失效与系统故障的风险,可以更加有效的运维现有节点,并降低了系统的运维与管理工作难度。
数据挖掘分析,建立在以数据计算平台、数据管理监控为基础的运算平台之上,开始导入数据集在大数据处理机之中,当数据装载完成后,就可以进行数据分析。通过沟通、理解用户需求,建立适合于用户自身的算法和模型。虽然目前已经有很多的用户有算法的能力,但数据分析只是通过传统数据库完成,而算法和模型并没有实现分布化,需要将用户的数据模型由单机模式迁移至分布式模式;对于没有提供算法能力的用户将有按照其数据分析的要求,设计并部署相应的算法,并提供在分布式框架之上的数据挖掘和分析任务,通过任务队列导入大数据分析平台之中,需要参与的数据源进行运算和分析,并产生最终结果。
结果可视化呈现,包括可视化建模、可视化开发、实时数据更新、结果呈现等关键步骤,结果可以有多种形式展现,可以文本文件、或带有结构化特征的文件,以多重的方式呈现给用户。如果条理简单的数据,将直接提供结果文本;如果运算结果涉及因素较多,变化频率高,静态文件不适合于发布,则通过合理的框架展现,以可视化动态分析,实现实时的动态数据分析结果,并基于Web浏览器的页面展示体现。通过动态的可视化界面,可以更加直接理解和应用相关结果数据。
行业大数据应用接口,为医疗、公安、制作、新媒体等不同行业的应用提供接口,针对用户的数据集、应用类型,系统中的结构化数据与非结构化数据类型,提供数据分析的数据集进行导入,实现用户现有应用的无缝衔接。
SureSave BDP1000大数据一体机实施步骤依据大数据发掘周期,从前期系统调研,到整个平台的部署、优化、数据导入、算法以及挖掘任务的设计,到数据计算系统平台的部署和运行,再至最终结果数据的可视化呈现,解决了传统IT架构难以解决的大数据分析和挖掘的难题。
菜单式灵活定制 全面满足大数据分析需求
SureSave BDP1000大数据一体机产品包含了硬件、软件和服务三个部分,硬件包含控制节点、数据节点和交换网络;软件包含分布式文件系统、分布式组件、数据挖掘分析模块和可视化呈现工具;服务包含系统调研、理解数据、软件安装部署优化、数据挖掘分析和可视化呈现。
SureSave BDP1000大数据一体机的硬件、软件和服务提供个性化的定制方式,能够按照用户实际需求,单选或多选其中任意选项,以菜单式选项简化了大数据分析与挖掘工作,降低了大数据应用的复杂性与整体成本,帮助用户更加快捷的开展业务数据分析。
SOUL为大数据时代打造了安全可靠、高效灵活的分布式大数据分析与挖掘解决方案,以智能化、可拓展的开放式系统设计,辅助用户实现从传统IT应用向云计算、大数据应用的平滑迁移,从而更加快速开展大数据资产的分析、挖掘、管理,并从中获取商业机会与竞争优势。