存储 频道

可安装的文件系统(7)

 
2)     采用集中式直接访问方法的数据共享
 
集中式数据共享的概念,基于前面所讨论具有多对一关系的可安装文件系统,即在多个与S A N连接的服务器上实现数据/文件层功能,而只在一个智件系统的能存储子系统中实现单一的分配层进程。图1 3 - 1 8给出了这种方法的工作示意图。
 
实际上,在这种方法中后端存储处理器的作用就像一个小粒度数据存储子系统,可以向主机系统提供锁定、缓存和语义集成服务。从概念上来说,这种方法最困难的部分,是对于主机系统和存储处理器之间通信的理解。
 
Retrieve公司采用集中式直接访问方法开发了相关的硬件和软件产品。主机系统和后端存储子系统之间的数据传送,涉及到了小粒度的数据单位,它比块大但小于文件单位。主机系统通过一个可安装文件系统转换和格式化这些小粒度数据的传送,而后端子系统完成分配层功能。通过将控制信息封装在一个未用的S C S I字段中,进行主机系统和智能后端子系统之间的通信。封装在该S C S I字段中的控制信息,可以被用于解释和处理I / O请求的后端处理器识别。
 
在这种方法中,智能后端存储子系统也有可能成为一个瓶颈。对于大多数系统,包括前面讨论过的文件访问管理器,可以通过镜像或备用系统克服这种问题。
3)     采用分布式直接访问方法的数据共享
 
在所讨论的三种模式中,采用分布式直接访问方法的模式是最难于掌握和理解的,但是它可能具有最好的伸缩性和数据可用性。这种方法主要基于前面所讨论的可安装文件系统数据/文件层与分配层之间的多对多关系。
 
这种方法中的网络因素是很明显的,因为它的数据是跨多个后端存储子系统进行传送的。一般的想法是,被传送的数据以小粒度单位按组分类放在一起,分布到S A N上的智能存储处理器中。接收存储子系统管理它们本地的存储空间,完成分配层的功能。客户系统端的可安装文件系统包含一个高级的分配控制器,用来实现在S A N中分布数据的算法。
 
超级服务器公司Tricord Systems,目前已将他的业务专门定位于这种可安装文件系统的开发。在他的方案中,客户系统所执行的算法基于R A I D数据分布。按照其说法,基于对象R A I D的概念是指跨用于完成文件系统分配层功能的智能存储子系统分块数据对象。它所采用的分块算法,可提供这种跨客户的网络文件系统所要求的一致性。
 
因为缺乏更好的术语,这里暂时将这种文件系统称作阵列结构文件系统(A S F S)。正如R A I D磁盘子系统可以跨多个磁盘分块数据,A S F S也可以跨多个智能后端存储处理器分块文件和数据库数据,还能在处理中包括冗余的保护。
 
对于文件系统,人们最为关心的一个方面是跨多个存储处理器分块目录和文件的方式。根目录存储在一个统一的位置上,而其他目录实体分布在整个网络中。文件被分成更小粒度的子单位,通过网络分块这些子单位,由存储子系统分配相应的存储空间并像本地数据实体一样进行管理。它的文件读写均以分块的方式进行,这有助于获得很快的性能。从定义上说,大多数数据是通过并行操作读写的。图1 3 - 1 9给出了在一个A S F S文件系统中文件和目录的分布示意图。
        
0
相关文章