上雲鼻祖Netflix因泰森拳賽大規模宕機員工週末不想加班修bug
在日前備受矚目的泰森與保羅拳擊比賽期間,Netflix平台卻遭遇了大規模服務中斷。這場賽事對Netflix訂閱用戶免費開放,但直播過程中頻繁出現緩衝和錯誤提示,導致用戶體驗極差。根據Downdetector.com記錄,共有13895份中斷報告,其中86%的投訴與視訊串流問題有關。
Netflix作為雲端運算的先驅,擁有深厚的技術積累,但這次中斷問題讓許多用戶開始質疑Netflix應對高流量直播的能力。
值得一提的是,這兩天Hacker News上正熱議一起Netflix「並發」生產事故,前Netflix員工Matthew Hawthorne分享了一個案例。
故障同樣也發生在周五下午,Netflix的工程師解決並發問題的方式並不是先進行相應的擴容,而是寫了個自動隨機終止實例的程序以避免週末加班。
等到週一,再由客戶端團隊部署修復補丁,重新啟用自動縮放功能。
而且他也以該解決方案的實用性自豪,也同時慶幸這個方案讓他們「度過了一個輕鬆的周末」。
對此有網友打趣說,“我認為這正是雲端運算勝出的最佳例證之一。實例出現問題?直接銷毀它,然後啟動一個新的。讓亞馬遜團隊來解決問題吧。”