人工智能时代的绿色发展:性能密集型应用的当务之急

更新时间:2022-04-07点击数:文字大小:

本文观点认为,随着先进的人工智能AI和IT工作负载不断推高计算需求,可持续性数据中心战略可以节省成本并提高性能。

作者:Michael McNerney

1649308572227484.png

图:Supermicro市场营销与网络安全副总裁Michael McNerney

数据中心在慢慢地损害我们的环境——全球皆是如此。虽然受益于冷却方法的不断创新,数据中心的用电量仍然稳居全球电力消耗的2-3左右[i][ii],根据联合国的数据[iii],电子废弃物的数量不断增长,达到了每年5000万吨以上,而其中只有20的硬件被妥善回收。

随着技术的持续发展,计算机变得前所未有的强大,然而遗憾的是,其电耗也极为惊人。半导体行业在处理性能方面取得了令人瞩目的进步,但随之而来的是两个显著的负面后果。持续的性能提升需要付出巨大的代价是耗电量和发热量的增加,而今旧硬件也正以前所未有的速度成为落伍过时的产品。这种情况引发了人们对于数据中心耗电量和电子废弃物问题的担忧。

那么,数据中心怎么做才能消除这些有害的影响呢?企业须开始为数据中心优先考虑绿色环保的解决方案。随着技术的进步,绿色数据中心的发展动力已经从「注重环保的意识」变成了「兼顾成本效益」。从目前的数据中心电耗和成本来看,我们可以发现,即便10的效率提升也能够对企业的经济和生态效益产生巨大的影响。如果明年全球数据中心的能耗保持在300太瓦时左右[iv][v],那么按照全球平均商业用电成本0.127美元/千瓦时计算[vi],能源效率提高10意味着全球企业能够节省38亿美元的数据中心能源成本。

减少数据中心采用以化石燃料发电对环境造成破坏的最佳方法,或许是直接弃用化石燃料。商业客户导向的可再生能源计划涵盖了公用事业自身发电、第三方购电协议PPA和可再生能源信用额度REC。数据中心运营商可以根据自己的需要选用非化石燃料发电的能源,从而减少排放到大气中的温室气体。

企业开始注重环境保护,同时兼顾提高效率和节省成本。事实上,通过简单地降低用电量就能够降低运营费用,从而增加利润。通过评审其设施的电源使用效率PUE、服务器密度、进气口温度和电子废弃物数量,企业开始了解到,欠佳的数据中心建设、运营和维护会对自己的利润和环境造成不利影响。许多数据中心的服务器进气口温度是低于厂商规定的,因此,简单地调高温度就能够大幅降低空气冷却用电成本。

通过充分考虑各种长期因素,以及仅升级其设施的关键组件,数据中心运营商可以有效地提高性能、降低成本和减小环境足迹。

善用液体冷卻技术

企业可以考虑的一种办法是升级他们的冷却系统,从空气冷却解决方案过渡到液体冷却解决方案。最新的硬件和计算系统给大多数数据中心带来了严重的冷却问题。空气冷却方法在散热量和散热速度方面存在局限。简单地加快冷却风扇的速度无法解决这个问题,各项局限开始暴露出来。

液体的热导系数比较高,因此散热的效率和效果优于空气。此外,液冷设计还能够更好地将热量排出系统,而不会像空气冷却那样在服务器机箱内反复对流。这是因为液冷设计是封闭式的,热量可以在一个地方导入液体,而在另一个地方从液体和系统中排出。虽然现有的空气冷却服务器有实施液冷技术的可能性,但通常来说可行性很低。然而,通过与服务器厂商合作,许多但不是全部服务器可以改为采用液冷技术,通过降低风扇的运行速度及显著减少数据中心的空调来降低用电量。

数据中心大多没有配备液冷系统,这意味着安装基础设施的初始资本支出成本会比较高,但运营成本要低得多。传统空气冷却装置的电源使用效率往往非常差劲,需要消耗大量的能源为空调和通风系统供电,以获得所需的气流。从耗电成本/处理性能比的角度来看,它的效率十分低下。若使用直接冷却芯片这样的液冷方案,数据中心的电耗则可以降低40。

除了提高成本效益和降低温室气体排放之外,液冷还有助于改善性能。通过优化冷却方式,CPU、GPU和内存等将不会那么快达到热极限和启动降低转速。对于专注于需要极高性能水平的尖端高性能计算HPC和人工智能AI应用的一些企业而言,这一点显得尤其重要。

密度、可分解式组合设计和数据中心设计

下一个层面的考虑因素是机柜和数据中心本身的设计。现代数据中心通常包含成百上千机柜的服务器和存储系统,因此每个机柜哪怕极小的效率提升最终都会通过整个数据中心显著放大效果。

对于企业而言,最容易投资改善的一个领域是增加机柜的密度。服务器越多,不仅意味着可用于业务应用的计算、存储和内存越多,而且还可以提高成本效益。在较小的空间中,实施热/冷通道会比较容易,因为热废气集中在一个较小的空间内,便于快速通风和冷却。这使得HVAC能够更有效地运行,在提高效率的同时减少用电量。因此,数据中心应采用热/冷通道设计,以便尽量减少废气热和进气冷的混合,以免增加总体的空调用电量。

服务器本身的机械设计也不容忽视。如果其中存在任何气流阻塞的情况,那么风扇就需要多做工才能获得同样的冷却效果,这样不仅会增加用电量,而且还有可能影响性能。此时,适当移动服务器机箱内的组件便可最大限度地减少障碍和增加气流。此外,在确保微处理器处于安全运行状态的同时尽量降低风扇的速度,也有助于节省每台服务器的能耗。

全新的可分解式组合设计服务器系统在这个方面能够做出重大贡献。这种服务器采用模块化设计,各个子系统均可独立升级,如:内存、存储、计算、电源等等。即使只是减少系统内外部的电缆数量也有助于降低气流阻塞。其实,网络线和电源线通常安排在系统后部,正是为了避免阻塞气流。可去发掘一些不同于标准服务器的系统,它们的电缆数量要少得多,甚至完全不依赖电缆。这些设计提供企业更多的选择性,可用来判断服务器有哪些层面可作调整并只须更换必要部件,保留那些无需更换的硬件。

这种更为有效的硬件资源运维方式打破了每3至5年进行“叉车式升级”的数据中心模式,可以实现更具可持续性的基础设施,也就是说,可以仅升级或更换服务器和系统的问题元件。这种方法能够大幅提高成本效益,并且非常环保。资本支出的减少和硬件的回收/再利用,同时还意味着报废服务器所产生的电子废弃物也大为减少。可分解式组合的服务器允许子系统单独升级,而无需更换整台服务器。若仅更换必要的子系统CPU、内存、存储和网络,电子废弃物的数量将会大幅度减少。企业可以根据工作负载的需求,查看并确定何时对各个子系统执行不同类型的升级。

环保教育培训

我们可以做到鱼与熊掌兼得——既保护地球,又提高企业的效益。尽管如此,为了实现更环保的未来,我们仍需携手努力,做出各种明智的选择并落实那些积极影响行业足迹的方法。此外,这个行业也需要大量的教育培训,帮助企业认识到环保型数据中心的重要性和优势。

企业可以采用各种各样的技术和解决方案来应对数据中心对环境的不利影响,同时获得优化性能的双重优势。如果我们立即采取适当的行动,那么我们的数据中心将不再损害环境。

[i]Green Data Centers are Imperative for Enterprise Success | Blog | Digital Realty

[ii]https://www.iea.org/reports/data-centres-and-data-transmission-networks

[iii]https://www.unep.org/news-and-stories/press-release/un-report-time-seize-opportunity-tackle-challenge-e-waste

[iv]https://www.science.org/doi/10.1126/science.aba3758

[v]Data centers 2018. Efficiency gains are not enough: Data center energy consumption continues to rise significantly

[vi]Pricing of Electricity by Country » Updated February 2022

作者简介

Michael McNerney是Supermicro的市场营销与网络安全副总裁。他在企业级硬件领域积累了20多年的丰富工作经验,并在产品战略和软件设计方面创造了优秀的业绩。在加入Supermicro之前,Michael还曾在Sun Microsystems和惠普公司担任过领导职务。


关于我们 | 联系方式 | 招聘信息 | 版权申明 | 广告服务 | 联系我们 |

免责声明:本站为非营利性网站,部分图片或文章来源于互联网如果无意中对您的权益构成了侵犯,我们深表歉意,请您联系,我们立即删除