HAVEn大数据引擎升级
本次广州CIO高峰论坛上,惠普再次对大数据解决方案HAVEn进行更新与升级。其中很重要一项,就是新版的HP Vertica分析平台——HP Vertica Dragline。
惠普Vertica 分析平台是HP HAVEn大数据分析平台的关键组件,惠普中国区副总裁、惠普软件集团大中华区总经理于志伟认为Vertica最大的优势就是实时计算,可以实现OLAP的实时性数据分析,比OLTP更进一步。
“在应用传统数据库的时候,我们会发现很难做到实时性跟大容量兼得。Vertica的出现就基于这两点问题,Vertica处理的数据量非常大,查询速度非常快,是因为在后台应用了一些比较特别的技术,比如MPP,还有一些高压缩和无节点共享的技术,因而在进行计算的时候能做到真正的定型数据。”惠普软件集团应用管理技术总监王慧慧补充。
据介绍,本次HP Vertica Dragline包括以下几个方面:
来自惠普Maverick项目技术,能显著提升了在线查询的能力,在获得定向分析和个性化分析的数据后计算其中的指标,在个别查询的基础上大幅提升常用查询或并发查询的速度和性能。惠普动态负载管理(HP Dynamic Workload Management)能够识别并适应各种查询的复杂性(包括简单查询、特殊查询以及长时间运行的高级查询),并动态地分配恰当的资源量。
扩展的SQL-on-Hadoop搜索和成本优化存储,使Vertica Dragline无需数据迁移,并支持更多格式的数据搜索,包括Parquet、Thrift、Avro和CEF,用户能够更快速且轻松地摄取、搜索和可视化更多数据,同时还能以更加经济的方式使用多个存储层——在Hadoop中存储较旧和较少分析的生产批量数据,而无需迁移数据或使用任何接口。
广泛、专业的分析能力,基于丰富的数据库内分析,HP Vertica Dragline包括一个新的语义分析引擎(适用于微博或任何短篇的自由式文本),并增强地理空间分析能力,能够将情感数据和定位数据与业务数据相结合,帮助企业了解网络用户对特定品牌、产品或服务的感受。
文本搜索在一系列文本数据上实现基于搜索的分析,这些文本数据包括机器日志和针对短篇文本的语义分析,例如微博或产品评论。