【IT168 专稿】在服务器诞生之后的一段时间里,并没有独立的存储器,所谓的存储只不过是服务器之中的一块硬盘。但是随着服务器在各行业中的广泛普及,各个数据中心对于数据存储的需求变得非常大,而且数据中心的结构也变得十分复杂,这也对存储提出了更高的要求,DAS、NAS和SAN也纷纷应运而生。
虽然服务器通过DAS、NAS、SAN连接的存储设备早已不是单一的硬盘而是磁盘阵列,但是目前的操作系统和应用识别存储设备的方法,还是和早期服务器识别一块硬盘的方法没有区别。也就是说,操作系统和应用认为它们连接的磁盘阵列是一块容量固定的“硬盘”。其实,现在的存储阵列子系统,容量都不是固定的,构成存储的都是一个一个的逻辑单元,不过即便这样,每个逻辑单元也还是被系统和应用当成固定容量的物理单元。
对于操作系统和应用而言,存储识别方法的改进短期内恐怕还有些困难。传统的存储识别方法,在大量服务器和存储器的数据中心会带来很多隐性成本,因为存储空间一旦被分配,其容量都是固定的,不管这些空间是否被真的使用,整个系统都会认为多余的空间已经没有了,需要另外添加磁盘。而今天,自动精简配置(Thin Provisioning)有望从根本上解决这种识别问题,减少数据中心的构建成本。下面我们就来详细讨论一下自动精简配置是如何工作的,以及自动精简配置部署需要注意的问题。
什么是自动精简配置?
自动精简配置是一种存储管理的特性,核心原理是“欺骗”操作系统,让操作系统认为存储设备中有很大的存储空间,而实际上的物理存储空间则没有那么大。举一个例子,在部署了自动精简配置之后,存储系统可能显示有2TB的逻辑单元,而实际上只有数百GB的物理空间可被分配。除了操作系统,应用也认为有很多剩余空间,尽管其中大部分空间都是虚拟出来的。而随着应用写入越来越多的空间,物理存储利用率也会越来越高。这项技术不会出现早先的有大量空间闲置,却还无法使用的现象。
具体而言,如果应用读了一个从来没被写过的区域,自动精简配置将提供一个零缓冲带(ZEROES Buffer。)
如上图所示,服务器识别存储设备的时候,看到的并不是真实空间,而是由自动精简配置虚拟出来的卷。而且只有当服务器写入存储的时候,真实的空间才会被分配。所有的虚拟空间都是零填充的缓冲区。当然,随着越来越多的数据被写入,实际存储空间也可以随需扩展。
这种技术的优势在于,可以自动扩展已经分配的存储卷。同时,我们也发现这种方式可以使用户使用接近100%的存储空间。因为所有的真实空间分配都与应用写入数据一一对应。另一个自动精简配置的优点在于和远程镜像结合的时候,可以节省镜像的空间和带宽。采用传统镜像方法,在最初部署块级别远程镜像的时候,整个卷都被WAN传输。而使用了自动精简配置,管理员则可以只传输被使用了的空间。这可以极大的减少建立镜像的时间,同样的,自动精简配置也可以使用低成本的通信线路来传输数据,而且由于传输的数据空间减小,带宽的占用也有所降低。