【IT168 资讯】EMC公司今天在EMC World 2012上宣布,1000节点集群Greenplum数据分析工作台(Greenplum Analytics Workbench)已经上线,该工作台将作为一种实验室环境使用,以加速大数据创新的步伐。Greenplum数据分析工作台的主要用途之一是,作为一种验证环境,验证Apache Hadoop代码库的可扩展性。EMC Greenplum事业部与Apache软件基金会展开了积极合作,以确保运用该数据分析工作台得到的数据分析结果能提供给开源社区,进而利用该工作台的资源进一步加速Hadoop的发展,使其成为革命性的大数据技术。来自全球数家领先软件及硬件公司的技术为Greenplum数据分析工作台提供了基础架构。
▲
Greenplum数据分析工作台将用来测试横向扩展基础架构技术的限制,并用来探索大数据分析的各种应用方式。无论是与富有远见的学术机构就数据密集型研究项目展开合作,还是与大数据应用开发商合作,Greenplum事业部都准备让该数据分析平台为数据领域最具创新精神的思想家服务。
该1000节点集群也将供Greenplum的Hadoop培训及认证级成员使用。Greenplum将提供一套全面的Hadoop培训课程,向学员提供运用Hadoop所需的知识和编程技能,首批公开提供的课程将于今年夏天推出。Greenplum Hadoop培训课程的独特之处是,任何成功完成该课程的个人都将获准使用该1000节点集群,并将其作为一种沙箱环境使用。
Greenplum数据分析工作台是数家硬件和软件工作合作的结果,这些公司旨在共同促进Apache Hadoop的发展,使其成为大数据分析的重要工具。这些公司包括:
- • EMC
- • 英特尔
- • Mellanox Technologies
- • 美光
- • 希捷
- • 超微
- • Switch
- • VMware
除了1000多个硬件节点(或通过增加虚拟机达到10000个节点),该试验台集群还包括24PB的物理存储系统。如果将有记载以来人类全部书面作品转变成电子数据保存,那么24PB接近这些作品数据量的一半。
客户及合作伙伴引言:
美国加州大学圣地亚哥分校圣地亚哥超级计算机中心大规模数据系统研究中心(CLDS)主任Chaitan Baru
“加州大学圣地亚哥分校大规模数据系统研究中心(CLDS)于5月8日至9日在美国圣何塞举办了大数据基准研讨会(Workshop on Big Data Benchmarking),在为大数据应用开发业界标准基准方面,该研讨会激起了极大的热情。大数据基准社区已开始自发形成,以在大数据基准领域取得进展。就帮助该社区在这一重要领域取得进步而言,Greenplum的1000节点集群将起到极其重要的作用,并将对企业界和科学应用领域产生重要影响。”
Mellanox Technologies公司业务拓展副总裁Amir Prescher
“我们的系统已成为有史以来最大的Hadoop试验台集群的一部分,而且我们为实现这一领先的Hadoop非结构化数据分析解决方案提供了关键组件,这些都令我们倍感振奋。新的Greenplum数据分析工作台采用了我们的解决方案,将Hadoop作业的运行时间缩短到了原来的1/2,从而优化了大数据应用的效率。Greenplum数据分析工作台采用了我们的10/40GbE和FDR 56Gbps InfiniBand互连解决方案,其中包括我们的非结构化数据加速器(UDA)软件,该软件增强了我们解决方案的互连能力,使互连具有低延迟、高吞吐量、低CPU开销和远程直接存储器存取(RDMA)的特色。”
超微计算机公司国际销售副总裁Wally Liaw
“EMC Greenplum数据分析工作台的背后,是1000个数据节点的基础架构和整合性资源,我们为该基础架构和整合资源做出了自己的贡献,以期在Hadoop开发人员社区中加速技术创新和新应用开发。我们的企业级服务器平台具有最高的性能,采用了开放标准和经济实惠的架构,适用于海量结构化和非结构化数据分析。在大数据科学不断发展的今天,能为全球Hadoop社区提供日益增强的支持,令我们倍感振奋。”
EMC高管引言:
EMC公司Greenplum事业部高级产品副总裁兼共同创始人Scott Yara
“我们非常高兴地宣布,Greenplum数据分析工作台上线了。随着越来越多的公司开始进行大数据分析,基于Hadoop的海量数据批处理,加上连续测试,已经变得至关重要了,这样的数据处理和测试能促进更好、更快的数据分析。”
关于EMC公司Greenplum事业部
Greenplum是EMC公司的一个事业部,以构建大数据分析的未来为己任。Greenplum的数据科学团队凭借出色的技能开发出了众多突破性的产品,以加速大数据分析的进步,并帮助全球企业实现机构敏捷性,成为以数据为主导的、有预见性的企业。Greenplum事业部提供的产品包括:Greenplum统一数据分析平台(Greenplum® Unified Analytics Platform)、Greenplum数据计算设备(Greenplum® Data Computing Appliance)、Greenplum数据库(Greenplum® Database)、Greenplum数据分析实验室(Greenplum® Analytics Lab)、Greenplum® HD和Greenplum® Chorus™。这些产品体现了开放系统、云计算、虚拟化和社交协作的威力,能帮助全球企业利用数据获得更深入的洞察力并从数据中获得更大的价值。