热点追击：自动精简配置详解-存储专区

热点追击：自动精简配置详解

作者：吴子超编辑：李隽 2008-01-22 00:00

【IT168 专稿】在服务器诞生之后的一段时间里，并没有独立的存储器，所谓的存储只不过是服务器之中的一块硬盘。但是随着服务器在各行业中的广泛普及，各个数据中心对于数据存储的需求变得非常大，而且数据中心的结构也变得十分复杂，这也对存储提出了更高的要求，DAS、NAS和SAN也纷纷应运而生。

虽然服务器通过DAS、NAS、SAN连接的存储设备早已不是单一的硬盘而是磁盘阵列，但是目前的操作系统和应用识别存储设备的方法，还是和早期服务器识别一块硬盘的方法没有区别。也就是说，操作系统和应用认为它们连接的磁盘阵列是一块容量固定的“硬盘”。其实，现在的存储阵列子系统，容量都不是固定的，构成存储的都是一个一个的逻辑单元，不过即便这样，每个逻辑单元也还是被系统和应用当成固定容量的物理单元。

对于操作系统和应用而言，存储识别方法的改进短期内恐怕还有些困难。传统的存储识别方法，在大量服务器和存储器的数据中心会带来很多隐性成本，因为存储空间一旦被分配，其容量都是固定的，不管这些空间是否被真的使用，整个系统都会认为多余的空间已经没有了，需要另外添加磁盘。而今天，自动精简配置（Thin Provisioning）有望从根本上解决这种识别问题，减少数据中心的构建成本。下面我们就来详细讨论一下自动精简配置是如何工作的，以及自动精简配置部署需要注意的问题。

什么是自动精简配置？

自动精简配置是一种存储管理的特性，核心原理是“欺骗”操作系统，让操作系统认为存储设备中有很大的存储空间，而实际上的物理存储空间则没有那么大。举一个例子，在部署了自动精简配置之后，存储系统可能显示有2TB的逻辑单元，而实际上只有数百GB的物理空间可被分配。除了操作系统，应用也认为有很多剩余空间，尽管其中大部分空间都是虚拟出来的。而随着应用写入越来越多的空间，物理存储利用率也会越来越高。这项技术不会出现早先的有大量空间闲置，却还无法使用的现象。

具体而言，如果应用读了一个从来没被写过的区域，自动精简配置将提供一个零缓冲带(ZEROES Buffer。)

如上图所示，服务器识别存储设备的时候，看到的并不是真实空间，而是由自动精简配置虚拟出来的卷。而且只有当服务器写入存储的时候，真实的空间才会被分配。所有的虚拟空间都是零填充的缓冲区。当然，随着越来越多的数据被写入，实际存储空间也可以随需扩展。

这种技术的优势在于，可以自动扩展已经分配的存储卷。同时，我们也发现这种方式可以使用户使用接近100%的存储空间。因为所有的真实空间分配都与应用写入数据一一对应。另一个自动精简配置的优点在于和远程镜像结合的时候，可以节省镜像的空间和带宽。采用传统镜像方法，在最初部署块级别远程镜像的时候，整个卷都被WAN传输。而使用了自动精简配置，管理员则可以只传输被使用了的空间。这可以极大的减少建立镜像的时间，同样的，自动精简配置也可以使用低成本的通信线路来传输数据，而且由于传输的数据空间减小，带宽的占用也有所降低。