存储 频道

短视频“崛起”背后的数据中心存储架构

  【IT168 资讯】过去二十年,从看文字资讯,到后来看图片集锦,再到现在看视频,互联网内容不断更新迭代,信息量变得越来越大、可视性也越来越强。短视频也因此应运而生,并且迅速占据我们工作、生活之余的大部分碎片时间,目前,单独一个短视频平台的日播放量就能高达到100亿次。

  在短视频业务快速扩张的背后,是各种技术的不断革新包括移动终端性能的提升,移动网络的提速,当然还有后端计算平台的日益强劲和稳健。

  当我们从看图时代转向视频时代时,数据中心又需要什么样的变革来适应新的业务应用?

  开展短视频业务前,你需要先了解这些数字

  每月PB级的数据存在哪?

  相对于文字和图片,视频的存储需要更大的空间。以国内某短视频平台的对外公开数据来看,其平台注册用户超过5亿,日活跃人数8000万,每天新增的段视频数量1000万,按照1条57s的视频大小6MB左右来算,仅从存储的视频容量来看,平台每月新增的短视频容量都将超过1PB。那我们再算下,按照单块硬盘8T,每台服务器12块硬盘,那么每月仅为了存储这些视频就新增12台服务器。

  如何面对80%的“冷”却不可舍弃的数据?

  视频行业,不论是短视频,还是直播,又或是视频网站,他们的数据都有着一个共同的特点——数据的热度不均且变化较快。比如据统计,大部分上传的数据的高热度状态仅能保持1周甚至更短的时间。在数据中心中热数据、温数据和冷数据占总数据量的比例约为5%、15%、80%。冷数据也可以被叫做“低价值度的数据”,因为它们占用着大部分的存储空间,但是通常不会再产生价值(被观看)。

  但是,从一方面来看短视频从本质上来讲类似QQ空间、微信朋友圈,是一种记录生活的平台,因此平台需要保证保有的数据不会被删除,因此这80%的数据成为“没有价值”但是不能被舍弃的“鸡肋”数据。

  如何安全且低成本地保存这些低价值度的视频数据?

  高功耗的存储服务器将带来居高不下的运营成本

  服务器产品在维护阶段具有周期长、维护成本高的特点,一般而言2年的维护成本就会超过购买成本。所以在设备运行过程中降低耗电量和简化维护成了必须重视的工作。

  目前国内大部分的存储服务器仍是采用通用服务器的配置,并没有针对温冷数据的存储应用进行优化。因此目前大多数数据中心中的存储系统都处于低负载却高功耗的状态,如何把存储集群的功耗降下来,是把数据中心从成本中心转为利润中心的关键之一。

短视频“崛起”背后的数据中心存储架构
▲浪潮SA5224M4存储集群

  短视频背后的数据中心需要怎样的存储架构

  计算和存储分离,让专业的机器做专业的事

  短视频背后的数据中心架构其实并不是特别复杂,从视频采集端到客户端,编解码、用户特征分析由专门的计算节点完成;CDN节点负责热点视频的缓存加速和分发;高密度的存储节点用于存储平台的视频数据。

短视频“崛起”背后的数据中心存储架构

  CDN节点,考虑如何让热点数据最快发出

  由于视频流量大,因此CDN节点所承载的吞吐量较大,因此对于存储容量和扩容的便捷度要求更高。另外由于CDN需要存储的数据热度不一,比如1年前的自拍视频,和最热网红的最新出品的点击率有天壤之别。因此,视频数据需要分级存储,将不同热度数据放在不同的存储介质中,充分发挥部件的利用效率,提升存储能效比。

  对于CDN服务器的选择,通常会需要计算和存储两类服务器来支撑:计算型主要用于处理分发任务等,CPU采用较高主频即可,对于内存和硬盘容量的要求并不高;存储型则用于在关键节点的数据存储和快速分发,因此要求IT架构中需要大容量的SSD或者高速HDD来应对。

  在服务器的选择上可以考虑浪潮SA5212M5这种计算存储均衡类服务器,。在存储性能上,SA5212M5搭配12块大容量SATA硬盘,单块容量达到8T,单机可容纳96T的CDN数据,满足CDN集群的庞大数据容量需求。而对于相对热的数据,SA5212M5中可加入的4块2.5寸SSD盘位,将提升系统整体响应速度,经实测,使用SSD固态硬盘后单台服务器的服务能力提升了1倍以上。

  高密存储节点,考虑如何提升存储能效比

  作为存储节点的高密度服务器本身不需要太高的计算处理性能,因此可以选择基于Intel Xeon-D处理器家族的SA5224M4机型,搭配单颗D-1521 CPU,借助Xeon-D的SOC特性和低功耗优势,通过大容量8T硬盘的使用,以追求更优的TCO收益。

  从实际测试数据来看来看,搭载D-1531 CPU的SA5224M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。一般服务器的生命周期为三年,这样算下来,1000台的存储服务器集群就能节省下至少1050万的电费。

  高硬盘IO和网络IO

  在短视频的传递链条中,从用户端上传的视频可以直接存入4U36盘位组成的存储集群中,并通过分布在各地的CDN节点传送给用户端观看,这样自然对后端存储服务器的硬盘IO表现有着较高的要求。而目前应用的SA5224M4机型,其36盘位顺序写的总带宽接近4.8GB,顺序读接近6GB,有力支撑了这种硬盘高IO读写的性能需求。此外,借助SA5224M4的板载万兆优势,可构建起10Gb的内部高速互联网络,保障了数据访问和传输所需的网络带宽。

  更高的机柜部署密度

  同时,衡量服务器的磁盘密度不仅要看每U空间支持的磁盘数量,更要放在机房供电环境下评估单机柜支持的磁盘密度。基于Intel Xeon-D平台的集成性和低功耗优势,在20A的机柜中,42U的空间内,SA5224M4可部署9-10台,单机柜磁盘部署密度提升25%,即以往双路4U36需要部署5个机柜的磁盘密度,当前4个机柜就能解决。不仅提高了单机柜供电利用效率,更减少了租赁机柜的数量,节省服务器生命周期内的运营成本。

短视频“崛起”背后的数据中心存储架构
▲基于Xeon-D平台的浪潮SA5224M4高密存储服务器

  短视频无疑是2017年投资的风口,在互联网巨头争相布局的同时,不妨审视一下自己的数据中心:你真的为海量视频资源找到理想的存储选择了吗?

0
相关文章