Facebook在長達數小時的宕機事故中走出來 服務正在逐漸恢復
週一,Facebook、Instagram和WhatsApp發生了近6個小時的重大故障,之後,這家社交媒體巨頭的旗艦服務正在蹣跚恢復。 Facebook、Instagram、WhatsApp、Messenger和Oculus VR在美國東部時間上午11:30左右一度從互聯網上全部消失,原因似乎是Facebook的DNS伺服器配置錯誤。
經過近六個小時的停機,Facebook的服務開始重新出現在一些使用者面前,但預計在一段時間內不會完全恢復。
正如Cloudflare的一篇博文所詳述的那樣,這個問題可以追溯到邊界網關協定(BGP)的更新出了問題,影響了流量路由並導致域名系統(DNS)的故障。 BGP是一個網路用來向其他網路公佈其存在的系統,並據此對流量進行路由。 如果沒有Facebook公佈的路由資訊,DNS解析器就無法對 facebook.com 和 instagram.com 等IP地址的查詢作出回應。
據報導,一位正在從事恢復工作的消息人士告訴記者,BGP更新阻止了對Facebook系統的遠端訪問,這意味著場外技術人員無法及時完成恢復工作。 那些能夠訪問受影響系統的人也無法進行修復,一切只能交給時間慢慢解決。
《紐約時報》報導說,安全工程師說他們無法接觸到受影響的伺服器,因為他們的數位身份認證系統同時也停止了工作,這使問題更加複雜。 更不用說其他員工報告說,Facebook的內部通信平臺Workplace也隨著大範圍的故障而下線,使他們之間難以及時聯絡。
《泰晤士報》獲得的一份內部備忘錄顯示,Facebook向其位於加州聖克拉拉的數據中心派出了一隊員工,試圖對伺服器進行”手動重置”。 這一努力顯然起了作用,因為服務正在慢慢恢復。