存储 频道

Teradata周俊凌:挖掘"大数据"的大价值

  【IT168 专稿】云计算的热潮仍然方兴未艾,大数据理念已经悄然浮出水面。“大数据有很多方面的要素,包括Volume、Variety、Velocity、value四个V。大数据并不仅仅意味着你存储了多少数据,而且还包括存储的是哪一类的数据,以及这些数据之间的关系等要素。”

挖掘不可估量的信息价值
▲Teradata公司首席客户官周俊凌在2011年大数据世界论坛上发表演讲

  Teradata公司首席客户官周俊凌在2011大数据世界论坛的专访现场告诉IT168编辑:“对于大数据来讲它的规模并不是最重要的,最重要的是怎么利用大数据,比如怎么样利用大数据给公司带来利益。”

  挖掘不可估量的信息价值

  周俊凌先生是Teradata数据库原创工程师之一,为Teradata天睿公司及NCR公司(Teradata天睿公司前母公司)累计服务达29年之久,最早是Teradata 数据库技术开发、专业服务和客户支持的研发先锋,如今则在Teradata担任首席客户官一职,作为数据挖掘领域的咨询服务专家,帮助客户在采用Teradata解决方案后成功实施,取得满意的成果,获得高投资回报。今天数据仓库领域已经发展到数十亿美元的市场规模。

挖掘不可估量的信息价值
▲Teradata公司首席客户官周俊凌阐述数据挖掘和商业智能的价值

  “当公司刚开始业务运营时,对他们来说,信息是非常重要的,这让他们知道用什么样的资源去战胜一些大的企业。他们可以用更好的技术、信息去降低成本,这样,就涉及到了数据分析。” 周俊凌谈到。

  数据分析与挖掘可以为企业带来不可估量的信息价值,例如,可以利用数据中心对市场进行细分,了解到非常详细的信息,也可以知道消费者作为一个个人,而不是作为一群人到底需要什么。

  “如果你使用平常的数据作为做决定的依据的话,这个决定很可能就是一个平常的决定,所以需要更多的数据细节来做更多的决策。如果考虑到更多更加详细的信息,你就能够做出更好的决策。”

  大数据时代的新挑战

  数据仓库市场领域一直诸强环伺,例如IBM收购了Netezza,惠普收购了Vertica,Oracle则整合SUN的硬件平台推出Exadata数据分析一体机,除了这些传统的综合IT服务供应商外,连独立存储供应商EMC也收购了GreenPlum,希望在数据仓库领域分一杯羹。与此同时, Sybase、CA、Informix、Microsoft等也并非等闲之辈。

  在云和大数据的冲击下,数据仓库市场的厂商也面临新的挑战。然而,新的技术发展趋势背后往往蕴含着巨大的机遇,显然TeraData已经预先做好了充分的准备。

  “在过去12个月里,Teradata进行了多项并购,带来了很多新的技术,包括并购Aster Data和Aprimo公司,Aprimo主要做整合行销管理业务,Aster Data则擅长与高级分析和管理各种非结构化数据领域。”周俊凌谈到。

  根据周俊凌的介绍,Teradata一直持续创新传统的企业级数据仓库(EDW)产品线,在对接大数据时代的同时,仍然会继续在传统的BI领域提高数据处理能力,从而更容易适应大数据管理。例如,通过数据访问频率高低确认数据温度,进行数据压缩,适应大数据的分析要求,使数据管理更容易。

  Teradata的产品包括适应超高规模数据容量要求的硬件平台产品(Teradata 1000),据称可以压缩35PB的数据。特别适用一些结构性数据和非结构性数据的分析。同时,Teradata还开发了很多能够进行数据统计和分析的软件包,包括将Hadoop等架构整合到Teradata数据仓库之中,可以基于目前的Teradata企业级数据仓库(EDW)接口使用。此外,Teradata还提供了基于云的架构,能够使用Amazon ec2, 为客户提供安全的存储产品,用来存储公司防火墙以外的、存储在云端的数据。

  周俊凌尤其强调收购Aster Data对Teradata的意义:“Aster Data在大数据分析方面的能力很强,其SQL-MapReduce技术能够帮助企业处理大量非结构化数据。”

  Aster Data的旗舰产品是一款能够在并行群集上运行的行列混合型数据库,名为nCluster。SQL-MapReduce则是Aster Data正在研究的专利技术,由能够处理结构化数据的常规数据仓储技术和处理非结构化数据的大型数据处理技术混合而成。目前许多著名的互联网公司都在使用Aster Data的工具软件来分析点击流量、社交网连接、推荐和个性化设置以及检测欺诈点击流量,包括LinkedIn、Comscore、Akamai、MySpace等。

  全面迎接云时代

  云和大数据的演进趋势不仅仅影响到企业的研发路线,实际上,对企业运营的方方面面都有着潜移默化的渗透。周俊凌对此也深有体会:“我们过去主要是以产品或者专业服务为中心的,没有所谓的软件平台等等,目前这方面发生很多变化,这是新的挑战和要求。”

  周俊凌认为,如何基于云的趋势,把业务数据与云结合在一起,提供业务开发的能力,是Teradata目前面临的挑战。包括一些产品已经不再是自己去存储和开发,而是都放在云环境下存储。技术产品推向市场的方式与以往相比,也发生了很大变化。

  云环境也给数据库提供商带来技术上的挑战,包括如何保证存储安全性,身份识别的健全性,都关系到数据的存储方式。“例如,现在企业数据都是放在全球任何一个地方,而不是放在某一个国家里面,这就带来关于数据主权的问题,可能有一些国家和政府不允许把数据放在其他国家,这都是一些挑战,需要从技术上解决安全等问题。Teradata在这方面越来越成熟了,目前为很多用户提供云的管理服务。”

1
相关文章