存储 频道

红象云腾:Hadoop大数据领域一支精英军

  【IT168 资讯】数据,已经渗透到当今每一个行业和业务领域,成为不可或缺的生产因素。人们对于海量数据的挖掘和应用,预示着新一波生产率增长和消费者盈余浪潮的到来。大数据在众多行业的应用已有时日,而随着近年来互联网和信息业的发展,也逐渐引起了人们的关注。如同云时代的到来一般,大数据的趋势也同样不可逆转。

  Hadoop是Apache软件基金会发起的一个项目,它是一种分布式数据和计算的框架,很擅长存储大量的半结构化的数据集以及分布式计算。在大数据分析以及非结构化数据蔓延的背景下,Hadoop受到了前所未有的关注。

  5月11日-13日,第八届中国数据库技术大会(DTCC 2017)在北京国际会议中心隆重召开。作为国内最受关注的数据库技术交流大会,本届DTCC共吸引了近5000名IT人员到会交流。在13日上午的“Hadoop生态系统”分会场上,中国Hadoop大数据厂商红象云腾的董事长童小军向大家分享了海量结构化和非结构化大数据Hadoop集群规划方案。

红象云腾:Hadoop大数据领域一支精英军
▲红象云腾董事长童小军

  在演讲中,童小军先生分享了一个规模超上千个节点Hadoop集群的硬件规划、软件规划、网络规划以及应用规划设计,综合考虑了集群头节点的高可用设计,元数据的备份恢复设计,读写流量分离、多租户、安全审计设计、集群冗余设、结合应用场景,结构化(文本和数据表)和非结构化数据(影像)的等不同并行处理方式,并探索深度学习和Hadoop分布式融合等规划。

  红象云腾为中国Hadoop大数据厂商,致力于将大数据技术带入更多企业,研发有红象-CRH 系列产品。红象大数据平台为该公司的核心产品,具备分布式存储和计算等基础功能。同时在在线(Online),近线(NearLine),离线(OffLine)三大应用场景做场景优化,为用户提供全场景的大数据平台解决方案。

  童小军同样向大家介绍了红象大数据基础软件,该基础软件采用分布式文件系统,分布式搜索引擎,分布式数据仓库,分布式内存计算引擎等核心组件作为本项目的大数据存储和计算基础运行平台和底层支撑。红象云腾高速检索组件CHIRUS(藏羚羊),技术架构加速现有Hadoop+Spark生态体系,性能测试报告秒级返回速度比SparkSQL快30倍。

  红象云腾的市场定位在基础设施大数据,作为大数据平台底层,Hadoop已经成为大数据标准,广泛应用于国防、公安、银行、通信、能源、航天、工业、城市公共管理等领域,并且是系统的关键支撑系统。而且红象云腾已经成为支持国产芯片最多的发行版,目前支持OpenPower、ARM、X86、飞腾、龙芯、申威等国产芯片产业链。

  红象云腾产品功能涉及分布式存储、分布式计算、分布式数据库以及分布式数据挖掘。产品具有跨平台、多场景、多兼容和一站式等特性。获得了包括IBM、微软、英特尔、英伟达、红帽等国际知名厂商以及中标软件、红旗、浪潮等国内知名厂商合作伙伴的认可。

0
相关文章