存储 频道

CommVault全球CEO谈统一数据管理

CommVault统一的数据管理体系则将界面与底层架构统一,以一个统一的平台实现多种数据管理操作,从而节省用户的总体成本开销。由于共享底层的架构,很多源代码各功能模块都可以共享(比如数据的传输,对于备份、归档、快照、迁移等操作都要用到),所以可以大大节省开发资源,避免不必要的重复劳动,只要在相关功能方面开发新的代码即可,在保证统一性的同时,加快了新功能模块的开发进度。“统一、整合”这可以说是CommVault产品体系的核心架构,不同的数据管理模块构建于一个公用技术引擎(CTE,Common Technology Engine)之上,它们之间通过数据可分类与内容可搜索机制((Data Classification and Content Search Enabler)相联,并统一受控于智能操作平台(Intelligent Operations Management),而所能提供的功能模块包括了备份/恢复、快速恢复、持续数据复制(保护)、数据迁移、数据归档、存储资源管理等。

在谈到CommVault所独有的索引文件技术时,其产品管理总监梅立宏举了实际的例子,某个人将一个文件发送给15位同事时产生的副本数:收件人将文件保存到个人系统之后,可能还复制一次文件作为备份,按规定第二次复制,第三次复制用于灾难恢复。这样,将单个文件发送给15个人可能产生60个文件副本:15个有意副本和另外45个无意副本。个人在共享文件时无意中创建数不尽的数据文件副本,使问题更加复杂。

而让CommVault骄傲的地方恰恰在此,文件备份时会建立两套索引,一个是一级备份数据的索引,记录了备份数据的关键信息;另一个是二级备份索引,记录着索引的信息。一级索引分布在各备份服务器上,使用C-TRIEVE数据库进行检索,二级索引则相当于一级索引的索引,使用微软SQL数据库进行检索。这其中,二级索引的数据将一直累加,而一级索引相当于一个索引的缓存(Cache),为了保证索引的效率,其内建的索引条目将被限制在一定数量,当超过这一数量,将把最不常用的索引信息删除,日后若需要寻找相关的数据,可从二级索引库中进行查询。

采用分布式关系式结构而非传统的目录式索引结构,可大大提高检索的效率,而且它还将数据的索引与数据一起保存到备份介质中(比如磁带、光盘等),也就是说,即使一级索引与二级索引都被破坏了,用户还可以从备份介质中找到索引信息,虽然恢复的速度要比一、二级索引还在时慢,但这种设计使得数据可恢复性大提高。而且由于这种机制使得索引的精细度可以大大提高,从而可以细化恢复的颗粒度,使精确而快速的定点恢复数据成为了可能。

CommVault采用两级索引模式,是因为CommVault相信,一切的数据备份、保护操作都是为了在需要使用数据的时候,能够快速恢复。而在恢复管理中,有效的索引无疑是一大利器。CommVault的分布式索引方案,使快速检索和快速恢复成为可能。

CommVault数据管理的不同之处在于,其不仅仅是对存储设备固有功能的调用,而是创建了一个统一的服务平台来建立和调用CommVault的功能。CommVault提供了一个具有集成能力的通用技术引擎CTE来跨越三个层面的数据管理:恢复管理、数据保护和归档管理。这种独特的能力具有节省费用、使用方便的优势。CommVault的QiNetix是包含所有上述功能的统一软件产品,是统一的源代码,在一个GUI用户界面下就能管理数据恢复、保护和归档,具有统一的索引,只要一个策略就能完成数据在不同存储层之间的传输。
0
相关文章