【IT168 专稿】2013年4月10日,一年一度的英特尔IDF大会又与我们相约在了北京国家会议中心,这已经是连续第7个年头在中国首发,英特尔IDF 2013大会的主题为“未来,用‘芯’体验”,以宣示英特尔更加以用户体验为核心,立足英特尔架构继续扩大和深化产业合作,全面推动计算技术创新、芯片制造创新、应用体验创新、终端形态创新和云端智能创新,以强大的计算能力开启一个全新的个性化体验新时代。
随着海量数据的不断爆发,原有的主流存储介质——磁盘,在用户可接受的成本之下已经越来越难满足用户的性能需求,于是另外一种存储介质应运而生,那就是SSD(固态硬盘),占据了绝大部分SSD市场份额的英特尔一直在不遗余力地改进SSD的工艺和性能,另一方面又在不断推进SSD在企业级数据中心的应用。
尽管现在SSD已经普遍流行了,越来越多的用户已经认识到SSD所带来的性能优势,并开始接受让SSD进入数据中心。但这一产品在企业级环境的应用并没有想象中的那么简单,每一个新事物总会遭遇到各种的难题,SSD也不例外。对于传统的机械磁盘(HDD)而言,不管是技术、工艺还是应用模式都已经非常成熟,应用相对比较简单清晰。但SSD则不一样,不同的产品,其总会遭遇到不同的难题。英特尔认为,仅仅用性能去考量SSD是不全面的,对于企业级环境而言,仅仅凭IOPS去评估SSD的优劣是不科学的。英特尔认为更重要的是服务质量,即Qos。
服务质量(Qos)可以简单理解为SSD性能的一致性。其并不是单纯的带宽、IOPS或者平均延迟,而是这些因素综合到一起后的SSD的平均性能。在企业级应用环境下,每一秒的延迟都有可能给业务带来极大的影响,关于这一点,可能大多数人都或多或少有所了解,具体可参见谷歌和ebay关于网页延迟的报告。对于要求完事俱掌握手中的企业级数据中心而言,SSD性能的一致性就显得尤为重要。
▲如上图所示,左侧的IOPS成绩虽然在大多数情况下都能符合用户对于性能的需求,但其性能波动较大,用户无法掌控,所以不能很好地满足企业级应用。而右侧的性能明显才是企业级所需。
英特尔认为,造成这种现象的原因在于SSD内部的NAND闪存。众所周知,SSD的寿命主要焦点在于NAND闪存的质量,即NAND的可擦鞋次数(耐久性),为了提高NAND闪存的耐久性和数据的安全性,通常SSD都会具有碎片整理、防干扰算法、数据维持算法以及损耗均衡等功能,而这些功能将影响SSD的服务质量。
没有一种解决方案是功能较多的,SSD也不例外,其在企业级的性能发挥还需要参考前端的应用模式。英特尔认为目前普遍存在的困难包括随机写工作负载高于顺序工作负载;小数据块写高于大数据块写;写工作负载高于读工作负载;读写混合工作负载高于纯读或者读为主的工作负载;并且,深队列明显高于浅队列。结合这些具体的应用,再加上SSD本身的碎片整理等功能,使得SSD的服务质量难以保证。
并且,在企业级环境中,通常会同时使用多个SSD,大量线程的同时读写操作比较频繁,如果其中某个SSD出现足够大的延迟(例如碎片整理造成的),因为RAID组的缘故,这些线程就会等待,直到其恢复。并且与机械磁盘不同之处在于,SSD的延时是不对齐的,这也就是说,SSD的Qos影响是累加的。例如在一个密集随机读写混合工作负载环境中,同一个RAID组中的某块SSD因为碎片整理等功能会导致SSD本身的性能下降,进而使得整个RAID组的性能下降。当这块SSD的碎片整理完成之后,其性能又会恢复。但也许紧接着下一次就是同个RAID组中的另一块SSD需要进行碎片整理。这就使得整个RAID组的性能是曲线式上下波动,而并非线性。
▲如上图所示,图左为90ms的延迟分别对写事务量带来的影响;图右则是不同延迟对一万个写事务量带来的影响。
除了服务质量(Qos)以外,SSD耐久性也是让企业用户比较头疼的问题。因为SSD本身设计所带来的写入放大因子(WAF)将给SSD的耐久性带来极大的影响,因为在去年的IDF大会上,英特尔者重讲解了这一问题,在此就不再细讲。
情节很老套,既然找到了问题的原因,那么英特尔必然就会推出相应的解决方案。针对企业级数据中心应用环境,英特尔特别推出了DC S3700系列SSD,除了大多用户关注的高耐久性之外,其进一步保证了服务质量(Qos)。
除了DC S3700系列SSD之外,为了帮助用户更加简单地提高SSD在企业级环境中应用的简易性,其还发布了一个新的软件工具——Intel CAS换成加速软件。能够极大地提高英特尔DC S3700系列SSD和910系列PCIe SSD在企业级环境中应用的服务质量。