每经记者中科曙光:范芊芊 每经编辑:文多
在电影《流浪地球2》中中科曙光,出现中科曙光了一台“2058年中科曙光的计算机”,它可满足数万座发动机协同运作,并支撑“数字生命”计划所需算力。这台新型计算机的“原型”来源于中科曙光还未正式发布的“缸式”新型浸没液冷计算机。中科曙光及旗下公司曙光数创在液冷技术领域已探索多年,这一技术目前被广泛用于构建绿色数据(算力)中心。
计算、存储、网络被称为数据中心的三大IT基础设施,也是数据中心耗电量的重要来源,为了解决数据中心节能减碳问题,中科曙光旗下公司曙光数创推出浸没式相变液冷方案为服务器“降温”。去年,中科曙光则推出了曙光ParaStor液冷存储系统为存储器“降温”,打造存算一栈式液冷方案。
目前,由中科曙光参与建设的众多液冷数据中心,一年节省电能达2亿度,节省的这些电能可满足12.5万个中国家庭全年用电,相当于减少66157吨二氧化碳的排放。
数据中心究竟有多耗电?
国家“东数西算”工程启动已有一年,全国各地的数据中心项目正在紧锣密鼓地建设中,以满足数字经济时代日益增长的算力需求。作为新基建的重要组成部分,算力已经成为拉动数字经济增长的一辆重要马车,是新的生产力。
但与此同时,数据中心也被业内称为耗电大户。中国电子技术标准化研究院数据显示,2021年全国数据中心能源消耗达到2166亿千瓦时,这相当于超1亿个中国家庭的全年用电量。在“双碳”战略目标的背景下,如何在保障数据中心稳定高效运营的前提下节能减排,成为业界和学界研究的重点。
数据中心为何耗电量大?在曙光云计算集团首席战略架构师王建波看来,数据中心的耗电体现在两个方面,一方面是数据中心所承载的提供算力服务的IT设备,另一方面则是保障IT设备稳定运行的制冷设备。
服务器、存储、网络被称为数据中心基础设施的三大件。在一座超大型数据中心里,数层高楼,数千平方米的土地上,仅密密麻麻排列着的服务器就数以万计,这些设备24小时不停歇运行,以支撑上游应用场景,其中一张提供算力的GPU卡的功率都有几百瓦,可想而知一座数据中心的能耗量是一个天文数字。
随着应用场景对算力的种类数量和质量精度等要求越来越高,服务器的耗电量将越来越大。王建波告诉记者,(服务器)处理性能越强,集成度越高,耗电量同样也就越大,这是一种相辅相成的关系。“例如一块单晶硅片上集成的数字电路越密集,其处理能力越强,但耗电量也越大。”
保障IT设备稳定运行的其他设备则包括除湿、散热等设备。在业内,为了精准计算数据中心的能源利用率,将数据中心消耗的所有能源与IT负载消耗的能源的比值称为PUE(Power Usage Effectiveness),PUE值越低,意味着能源利用率越高。
要实现数据中心的节能减排,则要从降低PUE值来入手。工信部印发的《新型数据中心发展三年行动计划(2021-2023年)》中,明确指出到2023年底,新建大型及以上数据中心PUE降低到1.3以下,严寒和寒冷地区力争降低到1.25以下。
如何给服务器“降温”?
那么如何降低数据中心PUE值?耗电量最大的服务器是节能降碳的重点,冷却则是关键一环,一方面高温可能会使服务器停止运行,另一方面温度越高则意味着降温需要消耗的电量越大。“数据中心制冷主要有几种方式,如风冷、液冷等,其中PUE达到1.1以下的基本依靠液冷。”王建波告诉记者。
所谓液冷,是指用流动液体将计算机内部元器件产生的热量传递到计算机外,以保证计算机工作在安全温度范围内的一种冷却方法,目前液冷技术分为冷板式、喷洒式和浸没式。
早在2011年,中科曙光便开始节能液冷技术的探索与研究,其浸没式相变液体方案被应用于全国多个数据中心。
在成都中科曙光参建的一座“绿色数据中心”,机房的服务器就采用了曙光数创的浸没式相变液冷方案。记者了解到,包含CPU(中央处理器)、GPU(图形处理器)等元器件在内的服务器被直接浸没在一种电子氟化液中,不断冒出沸腾的小气泡,这些小气泡带着热量进入装有冷水的冷却装置,待温度下降后再循环回到服务器,而吸收了热量的热水则随着管道进入外部的冷却塔。
所谓浸没式相变液冷方案,关键词是“浸没”和“相变”。王建波告诉记者,区别于冷板式液冷,浸没式相变液冷方案不是将散热最多的关键元器件放入液体中,而是将服务器整体浸没在液体中。相变则是指物质状态发生改变,高温使上述电子氟化液在50摄氏度左右便沸腾转化为气体,继而与冷水进行热交换。
上述散热方式能带来哪些益处呢?一方面由于上述液态高分子材料沸点较低,该解决方案可使CPU等主要芯片运行温度下降10摄氏度左右,从而额外带来10%~30%的应用性能提升,同时温度变化幅度减小,也提升了数据中心运行的稳定可靠性中科曙光;另一方面该解决方案去掉了空调系统以及对应的风冷基础设施,建设成本降低,使数据中心实现全年自然冷却,风扇风机能耗降低接近100%,相较于风冷总能耗降低约30%。
另外,区别于其他液冷技术,由于将服务器整体浸没,以及采用气体的形式带走热量,浸没式相变液冷方案采用高密度部署,可为机房节省85%左右的空间。这也就意味着同样面积的机房内能够放置更多的服务器,从而提高运算效率,同样数量的服务器则可以放置在更小的空间内,从而降低能耗。
王建波举例说,例如原来(一定数量的服务器)需要放在五层楼里,每层楼需要放置照明灯、空调等,采用上述方案现在可以放在两层楼里,就可以节约三层楼的电力开销。
如何给存储系统“降温”、给生产节能降耗?
除了服务器,存储系统同样是数据中心耗电量较大的设备。中国数据中心节能委员会的一项研究表明,数据中心IT设备系统所产生的功耗中,服务器系统约占50%,存储系统约占35%。因此,存算一栈式液冷方案成为实现数据中心“深度绿色化”的关键一环。
为此,中科曙光在去年推出了曙光ParaStor液冷存储系统,这也是业内首个液冷存储系统,其将冷板液冷方案与存储技术结合。相比风冷模式,液冷存储系统性能提升超过20%,以EB级单位存储设施的耗电量为例,相比风冷模式,采用液冷存储一年可节电450万千瓦时,减少1493吨二氧化碳排放。
相较于服务器,内存、机械硬盘等存储关键部件采用液冷方案的难点在哪儿?王建波告诉记者,通用的电子元器件要放到一种液体里,而且要支持热插拔(带电插拔),其中有很多技术性的突破。“比如我把CPU内存储器取下来,取下来之后口要尽快封闭,否则就连电了,在插拔一瞬间还不能让液体进去,这里面都有很多突破性的设计。”
例如,中科曙光所设计的液冷存储方案中,在硬件设计时,保证硬盘盘盒与液冷箱体的接触面积满足机械硬盘的散热需求,并且硬盘的插拔操作不会带来散热接触面的变化,增加了液冷循环系统后,仍能保持硬盘的独立热插拔。
从计算与存储两个维度助力数据中心行业绿色低碳、节能减排的同时,中科曙光在自身产品的生产方面同样注重绿色节能。
据悉,曙光智能制造基地从产品设计开发、原材料选用、生产工艺验证、包装优化到回收利用全面贯彻绿色制造理念,不良品率、运营成本较早先生产线分别下降了20%、33%,单位产值能耗降低30%。
王建波告诉记者,基地全部采用无灯工厂,机器人生产作业,生产可靠性提升。据了解,基地采用先进的国产机器人和数字孪生技术实现自动化生产和智能监控,工厂自动化率达95%以上,平均每90秒便可组装一台高端服务器产品。
(实习生罗艺对本文亦有贡献)
每日经济新闻