电子发烧友网报道(文/李弯弯)近几年,随着对算力的需求快速提升,数据中心的建设也在加速,然而,同时作为算力的载体,数据中心也面临非常严峻的能耗问题。
数据显示,2020年,全国数据中心共耗电2045亿千瓦时,占全社会用电量的2.7%,到2025年,这个数字预计将会达到5%。
为此,工信部提出,2022年全国新建大型数据中心PUE要达到1.4以下。PUE值是数据中心的实际能耗与计算能耗的比值。PUE 值越接近1,代表绿色程度越高、能源浪费越少。
那么如何降低PUE值呢?Google此前对媒体表示,许多数据中心用在非计算,比如冷却和电力转换的能源几乎与为其服务器供电的能源一样多。而Google则通过AI推荐系统,将这种开销减少到只有12%,PUE值达到1.12。
2016年,Google DeepMind共同开发了一款AI推荐系统,来提升Google数据中心的能源效率。这一 AI系统直接控制数据中心制冷,同时接受数据中心运营商的专家监督。
这个系统是怎么工作的呢?每隔五分钟,Google的云AI就会用数千个传感器对数据中心冷却系统拍摄快照,并将其输入Google的深度神经网络。
该网络接下来就会预测潜在行动的不同组合将如何影响未来的能源消耗,然后AI系统开始确定哪些行动能最大限度减少能耗,同时具有高度安全性,之后,这些行动被送回数据中心,由本地控制系统验证、实施。
在中国也有不少AI解决方案用于新建的数据中心上,华为是第一家用AI帮助数据中心在冷却环节做复杂决策的企业。大数据与AI的结合,让华为数据中心找到了算法的最优解。
2018年5月,华为把iCooling能效优化技术方案部署在廊坊云数据中心的1500个机架上,节省了8%的电力消耗,年平均PUE从1.42降低至1.26,每年可省下630多万度电。
这套系统的逻辑是,系统从700多个监控点、传感器中收集数据,然后对数据与系统PUE数值、能效之间的关联度进行分析,识别出最重要的21种变量后,再对深度神经网络进行训练,建立动态的PUE模型。最终,这套PUE模型的预测准确性达到99.5%。
有了它,华为边缘AI推理平台Atlas 200可在1分钟内,从40万中初始组合中找出最佳的制冷策略,准确性和速度远超资深数据中心工程师的能力。
基于华为自建大型节能数据中心的能力,以及iCooling等软件解决方案的技术优势,华为参与了多了外部数据中心的建设。
2019年12月,中国移动宁夏数据中心(中卫)正式投产时,定位于超大规模、绿色节能的世界一流数据中心。在第一阶段冬季自然冷却的场景下,华为iCooling AI能效优化技术,帮助该数据中心的总能耗降低了3.2%,每年可节电40多万度。当AI学习能力得到进一步增强,数据中心负载提升和制冷方式的切换,其目标是完成每年节省600万度电的任务。
采用AI技术,数据中心的PUE值已经大幅降低,比如华为乌兰察布云数据中心,采用间接蒸发冷却解决方案和iCooling能效优化技术,年均PUE降低至1.15,与传统冷冻水解决方案相比,该数据中心每年可节省耗电量超过1600万度。再比如,贵安华为云数据中心在2021年9月投入使用时,对外宣布的PUE是1.12,相当于大部分的电力资源都在数据中心中被利用起来。
百度阳泉数据中心也引入了AI技术,其深度学习模型根据室外天气湿度、温度和负荷,自主判断并切换制冷模式、预冷模式和节约模式这三种冷水机组运行模式。此外,阳泉数据中心的AI智能预警功能,可以根据负载预判设备的运行情况,然后给出维护策略,单体数据中心的年均PUE最高可降至1.08。
另外,AI技术在数据中心的应用,除了调整PUE、降低能耗,还有利于数据中心的运营和管理。数据中心的日常运维,有50%的人力消耗在巡检工作中,华为设计的数据中心AI无人巡检方案,远程抄表、图像识别、声音识别等多种技术,可让90%的人工巡检内容转变成自动化、远程无人处理。
除此之外,华为基于自动驾驶技术的AI-Robot ,已经从图像/声音/气味识别、温度云图、资产管理等维度,自主规划路线,实时上报巡检信息,并生成巡检报告。
评论留言