微軟和Meta效仿Google 利用AI技術幫助安全運行其數據中心
數據中心驅動著數十億人每天使用的應用程序、網站和服務,對於建造和維護它們的工人來說,可能是一個危險的地方。工人們有時不得不在數據中心通電時對其電氣設備進行維修。他們可能會接觸到氯氣等化學品,氯氣被用作計算機和服務器的液體冷卻系統中循環水的消毒劑。2015年6月,在北卡羅來納州梅登的一個蘋果數據中心發生氯氣洩漏後,5人不得不被送往醫院。
由於技術和規則的進步,數據中心比以前更安全,但為了尋求前瞻性的解決方案,一些科技巨頭表示,他們正在探索如何應用人工智能來預防安全問題。例如,微軟正在開發一個人工智能係統,分析一系列來源的數據,並為數據中心建設和運營團隊生成警報,以”防止或減輕安全事故的影響”。一個互補但相關的系統也在開發中,試圖檢測和預測對數據中心建設進度的影響。
“這些舉措都處於早期測試階段,預計今年晚些時候將開始擴展到我們的生產環境中,”微軟的一位發言人表示。
Meta公司還聲稱正在研究人工智能如何預測其數據中心在可能導致不安全工作環境的”極端環境條件”下的運作方式。該公司表示,它一直在開發物理模型來模擬極端條件,並將這些數據引入負責優化整個服務器的功耗、冷卻和氣流的AI模型。
“我們有來自數據中心的大量運營數據,在一些地區,頻率很高,服務器、機架和我們的數據大廳都有內置的傳感器,”Meta的一位發言人表示。”每台服務器和網絡設備,承擔不同的工作負載,將消耗不同數量的電力,產生不同數量的熱量,並使數據中心內的空氣流通量不同。我們的基礎設施團隊收集每台服務器的所有數據,然後開發出人工智能模型,可以在數據中心分配我們的服務器和機架,並將工作負載發送到這些服務器中,以優化性能和效率。”
當然,除了安全之外,公司還有相應的動機來確保數據中心保持在高峰狀態。因為停機是昂貴的–而且越來越頻繁。根據IT諮詢公司IT正常運行時間研究所2020年的一項調查,三分之一的數據中心所有者和運營商承認在過去12個月中經歷了一次重大的故障。六分之一的人聲稱,他們的故障使他們的損失超過了100萬美元,這比2019年的十分之一要高出不少。
Meta在全球有20多個數據中心在運行,包括在德克薩斯州和密蘇里州的新項目,估計總共花費16億美元。與此同時,微軟管理著200多個數據中心,並表示在可預見的未來,它將每年建設50至100個新的數據中心。
人工智能還有望在數據中心找到通常不為人知的能源–也就是成本–節約的機會,這是對企業有吸引力的另一個方面。2018年,Google聲稱,由其DeepMind子公司開發的人工智能係統能夠比其數據中心的歷史能源使用量平均節省30%的能源。一方面,Meta和微軟都表示,他們現在正在使用人工智能來實現類似的能源調整目的。
微軟在2021年底推出了人工智能”異常檢測方法”,利用電氣和機械設備的遙測數據,衡量和緩解數據中心內的異常用電和用水事件。該公司還在使用基於人工智能的方法來識別和修復數據中心內電錶的問題,並確定放置服務器的理想位置,以盡量減少浪費的電力、網絡和冷卻能力。
Meta公司則表示,它一直在利用強化學習來減少它為冷卻目的而泵入數據中心的空氣量。(強化學習是一種人工智能係統,通過試驗和錯誤來學習解決問題)。該公司的大多數數據中心使用室外空氣和蒸發冷卻系統,使優化氣流成為一個高度優先事項。
減少環境足跡是能源調節型人工智能係統的一個額外優勢。根據環境調查機構的一份報告,2020年,數據中心消耗了全球電力需求的約1%,並貢獻了所有二氧化碳排放量的0.3%。而典型的數據中心每天使用300萬至500萬加侖的水,與一個擁有3萬至5萬人口的城市的用水量相同。
微軟此前曾表示,它計劃在2025年前讓其所有的數據中心100%使用可再生能源運行。Meta公司聲稱在2020年實現了這一壯舉。