2 一个新的存储类别:集群存储
直接连接存储 (DAS)、存储区域网络 (SAN) 和网络连接存储 (NAS) 都是典型的存储方法,大多数 IT 管理人员在谈到存储架构时都会想到它们。今天,第四种存储方式——集群存储出现了。

集群存储架构可以将两个或多个存储设备集结到一起,使其在行为上表现得像一个实体。集群存储可以细分为三种类型:
——双向简单故障转移集群
——命名空间聚合
——带有分布式文件系统 (DFS) 的集群存储
双向简单集群:过去在存储行业中,“集群”是指在一对冗余节点(“节点”定义为服务器/控制器磁头和磁盘)之间的主动故障转移。尽管更准确的说这种方式是一种冗余技术而非集群技术,但 NAS供应商通常称其为“双向集群”。双向集群激起了继续改进旧式和传统单头存储架构的容错和冗余性能的需求。通常,这些解决方案能使一个控制器磁头接替故障控制器磁头,并允许新控制器磁头继续访问和写入故障控制器的数据卷。内在的限制性能和可扩展性、小型文件系统规模、管理复杂性以及实现高可用性的相对较高的成本是这一方式的主要制约因素。加上非结构化数据的迅速增长,这些解决方案明显不能满足企业发展的未来需求。

命名空间聚合:实质上,这些类型的集群存储解决方案构成了将存储管理连为一体的一块玻璃或薄板。这些解决方案完全基于软件(即软件虚拟化)或是软件与硬件的组合(即设备和开关),并创建了存储资源的单一命名空间和集群,它们看起来像一个大型数据管理池。一般来说,这些解决方案会启用包括 NAS 服务器或存储设备集群的“综合树”,把各存储仓库向网络用户呈现为一个整体(一个统一的命名空间),并将数据归到任何既定仓库中。换句话说,通过它们创建的网关,可以重新定向几种不同文件和异构系统以便从公共点进行访问。此类解决方案能够把横跨不同磁盘卷的文件布局(块级拆分数据)控制在某个特定仓库——而不是构成集群的所有仓库,同时仍然允许不同存储层之间的数据移动,且客户端中断有限。尽管从最初成本角度来看,这种架构方法有时不乏吸引力,但 IT 管理员仍在管理、发展和配置“存储孤岛”(异构型存储仓库),不过现在他们又多了一个虚拟化层。最终,这种解决方案会带来更高的复杂性、更重的管理负担以及更高的长期运营成本。

带有 DFS 的集群存储 :第三种类型是分布式集群存储,它是超越 N 向简单集群和命名空间聚合的自然发展。分布式集群存储是一种网络存储系统,它允许用户组合和添加存储节点,所有这些节点皆访问同一个数据池。这些解决方案直接驻留在存储层上,其中文件系统可以完全分布在任意数量的节点/存储控制器。由于软件驻留在存储层上,因此它可以完全控制数据在构成集群的所有存储节点中的布局(数据块级拆分),乃至每个数据块的 ECC 纠错水平。这与命名空间聚合/虚拟化产品形成了对比,后者只控制特定存储仓库写入哪些数据。智能软件可以使节点对称和分布均衡,从而使集群作为一个统一的智能团队协同工作,同时每个节点可以独立运行,并与其他节点进行通信以传输文件,从而满足用户的需求。集群中的每个节点都是一个连贯的对等体,也就是说每个节点都了解对方的一切信息。由于分布式集群存储的这些特征,与上述任何其他解决方案相比,它的可用性、可靠性、可扩展性、总吞吐量以及易管理性最高。
三种集群存储解决方案在数据控制方式上的差异
