新加坡兩家銀行因資料中心過熱而無法處理交易
新加坡位於赤道以北緯一度(137 公里)處,四季分明,溫度和氣壓均勻,全年濕度較高。如果在系統升級過程中出現問題,熱帶氣候就會為島上的資料中心帶來挑戰。10 月14 日,星展銀行和花旗銀行遭遇IT 故障,影響了新加坡數百萬筆支付交易。銀行應用程式癱瘓,伺服器無法連接,兩家銀行的客戶幾乎無法支付購物或接收付款。
這個城市國家非常依賴數位銀行系統,而政府當局現在正從不同的、更謹慎的角度來考慮這種方法。
新加坡國務部長Alvin Tan在議會問答環節中證實,10 月的故障導致星展銀行和花旗銀行提供的網路銀行服務全部或部分無法使用。問題的根本原因後來被確認為兩家銀行使用的Equinix 資料中心的冷卻系統失靈,導致伺服器溫度升高,超過了最佳運作條件。
Tan 本週一表示,這次故障導致81 萬次訪問嘗試失敗,250 萬次支付和ATM 交易失敗。根據Equinix 的說法,過熱問題是由於承包商在計劃的系統升級過程中發出了”關閉冷水緩衝罐閥門”的錯誤信號造成的。
星展銀行和花旗銀行為這種情況準備了一些備份計劃,但結果證明這些計劃完全沒有派上用場。新加坡政府表示,由於”網路配置錯誤”,星展銀行無法到達其備份資料中心,而花旗銀行則出現了一些未說明的連線問題。
這兩家金融機構並未遵守新加坡金融管理局(MAS)關於關鍵IT 系統復原能力的要求。新加坡金融管理局規定,關鍵銀行體系的非計劃性停機時間在12 個月內不得超過4 小時,而10 月的問題顯然超出了這一限制。
新加坡備援公司Acronis 的資訊安全長Kevin Reed 認為,Equinix 本應為其伺服器配備冗餘冷卻系統。里德說,正如星展銀行和花旗銀行的案例所清楚表明的那樣,事件往往不是一個單一的問題,而是”一連串相互關聯的事件”。
部長也對新加坡金融市場的”數位優先”方針發表了一些看法。消費者和企業應該意識到與無紙化貨幣相關的風險,公司當然也應該在伺服器和應用程式不可用時提供替代支付方案。