【观察】西部数据持续创新存储架构,引领存储迈入精细化运营时代

申耀的科技观察 @ 2020/12/29


申耀的科技观察

读懂科技,赢取未来!


毫无疑问,作为推动数字经济发展的核心基础设施和重要支撑,数据中心承担了数据存储、数据价值挖掘的关键作用,特别是5G、云计算、大数据、移动互联网、人工智能等新技术、新应用的发展无不以海量数据为依托,再加上数字化转型已深入渗透到各行各业,因此稳定、高效、绿色的数据中心正在成为越来越多行业的“强刚需”。

在此背景下,包括新型智能数据中心、智算中心等下一代数据中心概念“应运而生”,这无疑对下一代数据中心基础设施架构提出了全新的挑战,而存储架构作为其中最为关键的部分,其对数据中心性能和成本的影响至关重要,这也意味着传统数据中心过去相对僵化的规划和建设模式,高功耗、高投入的运营方式也走到了刻不容缓的变革阶段。

西部数据公司副总裁兼中国区业务总经理刘钢

在西部数据副总裁兼中国区业务总经理刘钢看来:“快速演进的数据中心新场景,对存储基础架构赋予了新的要求,未来通过分层存储架构的创新,实现数据中心的精细化运营,完成数据中心的提质降本增效将是大势所趋。”

从这个角度来说,西部数据通过存储精细化运营重塑下一代数据中心意义和价值重大,一方面是在“新基建”提速的背景下,存储精细化运营全新理念的提出为下一代数据中心的建设指明了方向;另一方面,通过存储架构新一轮的创新,也会为下一代数据中心的建设提供了更多极具价值的参考依据和行动建议。
 
存储精细化运营新时代

我们知道,数据中心建设具有基础特性明显、投资大、产业带动强、符合智慧城市、民生工程和数字经济发展等特点,正日益成为市场中的热点,而中国的数据中心建设在过去几年也实现了突飞猛进的增长,同样这也给企业级存储架构带来严重挑战。

这些挑战包括几个维度:如容量既要快速增长,性能也要成倍增加,还要考虑时延与吞吐量;同时,数据中心建设也在追求极致TCO,越来越多的用户希望用更少的资金投入,更低的管理维护成本,以实现更好的回报率;此外,功耗也日益重要,随着各地数据中心绿色节能政策的持续加码,数据中心PUE值的达成率要求也会越来越严格。

对此,刘钢表示:“如果把容量、性能、成本,这三者的组合看成一个三角形的话,会发现目前市场上没有一种存储能够满足所有的需求,因此要达成这样的一个目标,就需要创新存储架构,目前西部数据在分层存储、分解式存储以及分区存储领域都正在进行持续的探索与创新,我们希望通过这种精细化的分层和管理,让数据中心客户能够更加从容地化解遭遇的挑战。”

第一,是分层存储,指的是在“存储金字塔”中根据应用场景的不同划分为五层,从低到高依次为:极冷存储、冷存储、温存储、热存储和极热存储,通过为每个分层提供差异化的产品以满足不同的需求,最终满足客户的实际需求。(参考:《西部数据:再定义分层存储架构,赋能数据中心新基建》)

 
“当把存储分层之后,我们会发现在每一层都能找到相应的介质来更好地满足客户的需求,而把它们叠加到一起就能实现既有大容量,还能提高性能,同时也可以降低整体的成本,可谓一举三得。”刘钢说。

第二,是分解式存储,数据中心在过去几年已达成一个共识,那就是未来的演进趋势将是“软件定义,硬件重构”,其实存储也是一样,这就催生出了一种被称之为可组合的分解式架构。

具体来说,未来存储系统的发展将会呈现出一种开放可组合兼容的分解式架构,其中作为计算核心的服务器被分解为DPU、GPU、FPGA、Memory、Flash、Disk、Tape等器件与CPU内存的资源组合,这些资源可以以全闪存阵列、混闪、磁带冷存储等形式,通过虚拟化技术结合场景进行组合,需要的时候对外提供,不需要的时候返还给资源池,从而让更高性能的资源被服务器共享,进而达到弹性伸缩的效果。

 
第三,是分区存储,分区存储技术也正为数据中心客户带来更加高效的规模架构。在西部数据分区存储技术的支持下,客户可以充分利用在SMR HDD上实现的最大的存储容量,以及在融入新兴分区命名空间(ZNS)标准的NVMe SSD上,实现更好的耐久性、可预测的低延迟和QoS性能,最终有效的减少数据存放低效能现象的发生。

不难看出,无论是分层存储、分解式存储还是分区存储,都是西部数据倡导的存储细分和精细化的一种呈现形式,其中分层存储能让每一层都能找到相应更好的介质,实现整体的优化;分解式存储架构,能够让资源更好地被服务器享受;而分区存储,则让固态硬盘有更好的性能表现。而在这背后,西部数据也正通过存储架构的持续创新,让整个存储变得更有效,性能更好,总体拥有成本更低,由此引领存储迈入了精细化管理和运营的新时代。

让精细化实现降本增效

刘钢认为,下一代数据中心建设如果要适应高密度,低PUE值的严格要求,就需要将存储精细化规划和运营的理念引入其中,由此才能让整个数据中心得以更加长远的发展。

例如,目前很多企业的招标采购中,通常都要求HDD以8TB为主,而这种通过采用统一的硬盘容量来实现“降本增效”的方式,往往效果不是最佳的,因此西部数据建议行业用户从8TB升级到10TB,其实反而能提供更优TCO;而云数据中心客户从14TB升级到18TB,同样也能取得更好的TCO。

 
测试数据显示,同样对于一个数据中心服务器的配置,当行业客户从8TB往10TB迁移,不仅仅容量会提升25%,同时服务器的使用量会减少20%,功耗每TB减少21%,运营下来TCO会减少10%。“由于功耗降低了21%,事实上客户长期的运营成本还会更低,西部数据有一个客户就实现了TCO降低15%的效果。”刘钢说。

因此,无论是行业客户还云数据中心客户在建设下一代数据中心时,提前做好存储精细化的管理至关重要。同样,为了满足客户未来存储不断升级的需求,西部数据也提前做好了应对的准备,全新的SMR HDD Ultrastar DC HC650作为业内领先的20TB HDD解决方案,就能够通过更高的存储密度和电源效率,为不断扩展的企业和云数据中心提供了更低的TCO。

值得提一提的是,在今年10月西部数据已经与全球领先的协作平台Dropbox公司携手针对其特定机箱配置进行内部测试,采用业界首发的Ultrastar 20TB SMR HDD替换原有CMR HDD后存储密度增加了10%-20%,节约了20%的TCO,帮助Dropbox公司以更好的TCO实现了更高的存储密度,且不会影响其6亿多在线用户的数据持久性和可用性,真正成为了Dropbox未来构建EB级存储平台中的重要基石。

Dropbox作为率先认证Ultrastar 20TB SMR HDD的企业之一,多年来在存储平台开发的各个阶段都持续地与西部数据开展合作。Dropbox通过部署西部数据的大容量20TB SMR HDD进一步节省了成本,为用户提供更大的价值。相信西部数据和Dropbox在未来会继续携手推动云基础架构的极限。

 
在分层存储的场景应用中,西部数据Ultrastar DC SN640 SSD就能够针对混合应用场景,提供高达469K的IOPS,适用于70%读30%写的混合工作负载;此外,西部数据Ultrastar DC SN840 SSD,则能够针对高性能计算场景,提供50%读和50%写的工作负载,具备高达780K的IOPS,能够始终确保负载着关键业务应用服务器的稳定运行。

刘钢说:“对很多行业客户而言,稳定性某种程度上高于性能的需求,这就需要企业级固态硬盘集成NAND Flash、SSD控制器和固件于一体,才能有利于性能和稳定的极致优化,而西部数据恰好具备企业级固态硬盘的纵向集成优势,这让我们提供的企业级固态硬盘有着非常好的一致性表现。”

据了解,无论是主流的Ultrastar DC SN640 SSD还是高性能的Ultrastar DC SN840 SSD都使用了西部数据自主研发的固态硬盘控制器,控制器中有两块芯片,分别处理前端FTL(Flash Transition Layer)和后端FM(Flash Management)。前端的FTL芯片包含多个独立的处理器,同时处理I/O输入输出及内部的后台优化工作,而后端FM芯片也包含独立处理器多通道管理NAND Flash,同时西部数据针对固件也做了专门的优化,由此为行业客户提供了稳定性最好的、性能最优的企业级固态硬盘。

 
值得一提的是,在可组合的分解式架构领域,西部数据也做了大量的探索与创新,西部数据最新推出的OpenFlex Data24 NVMe-oF JBOF,就可以将高性能Ultrastar DC SN840 SSD延展到整个低延迟以太网数据结构中,提供高达368TB的共享存储容量,由此让高性能的存储资源能够被更多的服务器共享,而这个创新的分解式架构,不仅适用于存储领域,也适用于AI的GPU以及针对异构环境的FPGA。

由此可见,西部数据之所以能够引领存储迈入精细化管理和运营的新时代,背后的关键是西部数据是业内少有的能够提供全线存储产品和适应不同场景解决方案的公司,从NAND颗粒、个人PC中的硬盘再到云数据中心中的高容量企业级硬盘、企业级固态硬盘,以及高密度、高性能的JBOD&JBOF、NVMe-oF新型系统,这些领先的闪存和硬盘全线存储方案都能为客户通过存储架构的创新,实现精细化存储管理运营,进而重塑下一代数据中心提供重要的“底座”支撑。

技术创新与本地化提速

当然,在创新这件事上,西部数据从来是永不止步的。对西部数据而言,创新并不是一句简单的口号。事实上,西部数据也用50年的持续创新的历史,证明和验证了自身的生存能力、发展能力、创新能力依然强劲。

目前,西部数据技术创新的方向除了领先的存储介质、控制器、磁头和固件等产品外,还涵盖软件、处理、互联、存储、机械和制造等多个方面,这让西部数据拥有了面向未来提供更领先解决方案的信心和实力。

 
刘钢表示:“目前数据中心最大的瓶颈就在存储上,因此存储除了系统层面的优化工作之外,存储盘本身也有很多创新和优化的工作可以做。”

例如,当存储有了缓存,有了分层的划分之后,AI在存储硬盘领域也就有了更多的用武之地。一个典型的应用场景是,如何将数据归为冷数据还是热数据,其实并不是由人决定的,而是可以通过AI和大数据来分析,决定数据应该处在那一层,通过使用场景判断它在那一层,这里面其实就有很多工作可以展开。

而随着大型数据中心越来越大以及边缘数据中心的数量急剧增加,数据中心运维难度不断攀升,在这方面西部数据也有专门的硬盘健康管理系统,帮助数据中心客户更好的实现管理和运维。”

与此同时,近来年业界也提出了“可计算存储”的愿景,即在原有的存储介质(比如NVMe SSD)上叠加计算单元(比如FPGA),并由该计算单元加速跟存储直接相关的计算任务,由此实现CPU计算任务的卸载和“分担”,同样西部数据也在硬盘层面通过开放接口的方式,让更多的合作伙伴能够基于开放的API展开创新。

更为关键的是,如何适应中国市场需求,为不同行业、不同规模、不同业务需求的中国用户,开发出可以帮助他们在数字化转型时代的产品和解决方案,一直也是西部数据针对中国市场时考量的重点。

据介绍,今年7月,西部数据旗下的全资子公司——晟碟半导体(上海)有限公司就举行了晟碟半导体三期扩建暨综合配套项目开工仪式,此次扩建的出发点就是为中国客户提供更加先进的解决方案以满足不断增长市场需求,用高性能、高品质产品实现对中国市场客户的承诺。

 
除此之外,西部数据也通过上海的实验室跟更多的本地公司,包括服务器厂商和方案提供商,做更多的系统级和应用级的优化。“未来我们还会加大这部分的合作力度,不仅把产能和核心技术带到中国市场,同时更多地扩大跟中国市场的合作伙伴在系统级和应用级上合作,让产品和解决方案能够更好的满足中国客户的需求。”刘钢最后说。

总的来看,随着国家“新基建”的提速,以及新的技术发展趋势和市场全新的需求都赋予整个存储市场更大的活力和挑战,而在此过程中,西部数据始终坚持“The Leader of The Data Infrastructure”的定位,通过存储精细化的运营理念,持续进行存储架构的创新,以及针对中国市场不断加大投入,提速本地化的发展,都让它在未来的存储乃至下一代数据中心基础设施领域中,实现强势领跑都会起到更加关键的作用,同样也会为数据中心和“新基建”的建设贡献出更高的价值。



申耀的科技观察,由科技与汽车跨界自媒体人申斯基创办,18年企业级媒体工作经验,专注产业互联网、企业数字化、渠道生态以及汽车科技内容的观察和思考。



English:[observation] Western data has continuously innovated storage architecture, leading storage into the era of refined operation

淘宝精选