存储 频道

EMC为企业提供基于Hadoop的大数据分析

  • EMC今天针对Apache Hadoop开源软件作为企业就绪的大数据工具,宣布了一项有关软件发布、集成和支持的全面战略。

  • EMC推出了世界上第一个定制的、高性能的、Hadoop数据协同处理设备,面向结构化和非结构化数据。

  • EMC推出了EMC® Greenplum® HD社区版和EMC Greenplum HD企业版。EMC Greenplum HD企业版是一个完整的平台,在简单的Apache Hadoop软件发布包之外,还包括安装、培训、全球支持和增值服务。

  • EMC与12家领先合作伙伴开展合作,将有助于实现实时数据交互等技术创新,提高可靠性,使Hadoop的部署和使用更容易。

  【IT168 资讯】EMC公司于5月9日-12日在美国拉斯维加斯举办第11届年度EMC World大会,全球各地1万多名客户、合作伙伴、技术人员、媒体、博客作者和分析师出席大会。今年大会的主题是“云计算适逢大数据”。

EMC为企业提供基于Hadoop的大数据分析
▲EMC董事长兼CEO乔图斯发表了主题为“云”与“大数据”的碰撞的演讲

  EMC公司针对常用于数据密集型分布式应用的Apache Hadoop开源软件,宣布了一项有关软件发布、集成和支持的全面战略,为客户提供了最强大、最高效率的方法,充分挖掘大数据的价值。这项战略发布,将进一步巩固EMC的领先地位。EMC今天还推出了世界上第一个定制的、高性能的Hadoop专用数据协同处理设备——Greenplum HD数据计算设备(Data Computing Appliance)。

EMC为企业提供基于Hadoop的大数据分析
▲展区内,参会网友从液晶显示屏了解Greenplum

  该设备结合了Hadoop和EMC Greenplum数据库,从而在一个单一、无缝的解决方案中实现了结构化和非结构化数据的协同处理。此外,EMC还推出了面向Hadoop的EMC Greenplum HD社区版和EMC Greenplum HD企业版软件。加之目前已经有12家领先合作伙伴的产品通过了相关认证,今天的发布将有助于实现实时数据交互等技术创新,提高可靠性,并使Hadoop的部署和使用更容易。

EMC为企业提供基于Hadoop的大数据分析
▲参会网友参加Greenplum技术讲座

  Apache Hadoop已经迅速成长为首选的、适用于非结构化数据的大数据分析解决方案。企业正在从瞬息万变的商业环境中寻求机遇,他们发现大数据分析能带来竞争优势。基于Hadoop、利用商品化硬件对海量的结构化和非结构化数据进行批处理,给数据分析领域带来了深刻的变化。通过挖掘机器产生的非结构化数据中蕴藏的知识,企业可以做出更好的决策,促进收入增长,改善服务,降低成本。

  EMC Greenplum HD产品系列能帮助企业利用大数据分析。与今天市场上那些臃肿复杂的工具和解决方案相比,该系列产品不会增加任何额外开销和复杂性。Greenplum HD软件有社区版和企业版两种版本,是一个完整的平台,在简单的Apache Hadoop软件发布包之外,还包括安装、培训、全球支持和增值服务。

  EMC为Hadoop提供的独特价值和功能包括:

  • EMC Greenplum HD数据计算设备 —— 在Greenplum HD数据计算设备中,Apache Hadoop与Greenplum数据库实现了无缝集成。该解决方案支持Hadoop外部表格,因此使用户能访问驻留在Hadoop分布式文件系统(HDFS)上的数据,而无需物化数据。从Greenplum到HDFS,管理员可以并行读写文件,实现快速、简单的数据共享。借助强大的Greenplum SQL以及可访问HDFS数据的先进分析功能,可执行跨平台分析。这个整合式解决方案提供了业界惟一一个完整的大数据分析平台。

  • EMC Greenplum HD企业版 —— 该企业版与Apache Hadoop软件实现了100%的接口兼容性。通过保持与Hadoop的接口兼容性,该企业版提供无缝的应用可移植性,同时为更大型的企业提供了所需的先进功能,包括:

  o 数据管理功能,如快照和广域复制;

  o 利用本机网络文件系统(NFS)接口进行简单的数据加载和访问;

  o 端到端可管理性,包括简单的集群部署、自动故障检测和通知、多站点管理以及滚动升级。

  • 最重要的是,EMC Greenplum HD企业版提供这些功能的同时,还提供了2倍到5倍于Apache Hadoop标准打包版的性能。

  • EMC Greenplum HD社区版 —— 该社区版100%通过了的开源认证,100%支持由HDFS、MapReduce、Zookeeper、Hive和HBase组成的Apache Hadoop软件。EMC Greenplum提供针对名字节点(Name Node)和作业跟踪器(Job Tracker)的容错能力,在标准Hadoop配置中,这两者都是单一故障点。

  除了Hadoop相关的产品,EMC还与12家公司一起,建立了一个生机勃勃的、强大的合作伙伴生态系统。这12家公司是Concurrent、CSC、Datameer、Informatica、Jaspersoft、Karmasphere、Microstrategy、Pentaho、SAS、SnapLogic、Talend和VMware。获得这么广泛的支持表明,EMC为Hadoop创造了价值。信任EMC的技术公司和企业现在也可以同样信任开源数据分析工具了。

  EMC全球服务部已经开发出了一整套的专业服务、支持及培训课程,帮助客户应用EMC Greenplum数据计算设备,加速采用数据仓库和业务分析。其中包括一项新的企业业务分析评估服务,可以帮助客户实现高级分析的识别、部署、优化和操作化,支持关键业务计划。此外,EMC将帮助客户完成数据迁移和合并任务,将客户的Oracle、Teradata以及其他现有数据库系统迁移和合并到Greenplum数据计算设备上。

  支持证言:

  Evaluator Group高级合伙人John Webster:

  “在从传统数据仓库向大数据分析的转变过程中,Hadoop发挥了重要作用。EMC的Hadoop商用化战略旨在为企业用户简化和增强Hadoop,以使Hadoop成为企业必须拥有的实时数据分析工具。”

  Gartner公司Eric Thoo、Donald Feingerg、Ted Friedman和Andreas Bitterer撰写的研究报告:《2010年数据管理和集成领域独具特色的厂商》:

  “在商业机构中使用Hadoop的数量在上升。我们认为,在很多情况下,Hadoop的采用是在业务数据分析部门中‘悄悄’进行的,很少或没有得到IT部门的支持。随着Hadoop在企业内使用量的上升且日益进入关键任务领域,对支持和其他服务的需求也会增加。”

  EMC公司数据计算部总裁兼总经理Bill Cook:

  “EMC有责任帮助客户实现大数据所能实现的一切,无论是结构化还是非结构化数据。关系数据库有机会为结构化数据带来价值,Hadoop也有机会为非结构化数据带来价值。很多企业客户需要同时挖掘结构化和非架构化数据的价值,在我们合作伙伴的帮助下,我们能满足客户这种需求,同时还能满足他们对高可用性、容错以及企业级支持和服务的需求。”

  上市

  EMC Greenplum HD社区版、EMC Greenplum HD企业版和EMC Greenplum HD数据计算设备计划于今年第三季度上市。

  在线跟踪EMC World

  • 如需了解EMC World 2011的最新信息,请访问:www.emc.com/emcworld2011

  • 有关EMC World的连续报道和大会进展,请关注:http://twitter.com/emcworld和http://twitter.com/emccorp。

  • EMC中国官方微博将实时转播大会的最新报道:http://weibo.com/emcgreatchina

  • EMC World主题演讲和重要议程的视频回放,会在演讲结束的很短时间内上传到http://facebook.com/emccorp,供EMC的Facebook粉丝观看。

0
相关文章