CrowdStrike創辦人還是藍屏死機的慣犯對2010年麥克菲大規模藍屏死機事件負責
本週五CrowdStrike 發布的軟體更新導致全球850 萬台Windows 設備藍屏死機,由於多個關鍵行業使用CrowdStrike 提供的安全軟體,藍屏事件發生後產生的潛在影響不可估量。
但萬萬沒想到導致藍屏死機還能是個慣犯,有網友注意到CrowdStrike 創始人喬治庫爾茨(George Kurtz) 自2004 年開始就出任邁克菲高級副總裁兼風險管理總監理;在2009 年10 月時成為知名安全軟體麥克菲(McAfee) 的技術長;到2011 年10 月離開被英特爾收購的麥克菲創立了CrowdStrike 公司。
2009 年7 月麥克菲發布的病毒庫更新DAT5664 版會將Windows 中的多個正常檔案當做病毒殺掉,當時受影響的主要是Windows XP 系統,這些系統關鍵檔案被刪除後導致藍屏死機。
2010 年4 月麥克菲發布的病毒庫更新DAT5958 版再次出現誤殺問題,此次誤殺麥克菲將Windows 核心檔svchost.exe 標記為病毒並殺掉,這直接導致了全球範圍內大量Windows XP 系統藍屏死機。
身為麥克菲技術長的喬治庫爾茨對這些問題負有直接管理責任,不過幾次事件後麥克菲口碑直線下滑,到2011 年2 月英特爾宣布收購麥克菲,到2011 年10 月喬治庫爾茨離開麥克菲。
這麼來看當時作為全球第二大殺毒軟體的麥克菲最後被賣身給英特爾,喬治庫爾茨應該也同樣需要承認責任,如果他真的對自己的工作負責或許也不會出現如此多的藍屏死機問題。
目前在一些論壇上有專業用戶在分析這次CrowdStrike 藍屏死機事件的原因,也就是程式碼中存在的問題引起藍屏死機,但這應該不是關鍵,關鍵問題在於CrowdStrike 發布更新都沒有進行測試。
正常來說發佈軟體更新即使是簡單的病毒庫更新也應該由開發或QA 團隊進行測試,即使測試沒問題發布更新時也應該灰度更新,即1%、5%、10%、20%、50 %、100% 這樣逐漸覆蓋用戶,這樣可以避免更新有問題影響太多用戶。
顯然這次CrowdStrike 是直接將軟體更新發佈給所有客戶的,但凡開發團隊自己測試或透過1% 灰階更新也很容易發現問題,因此這屬於流程上的嚴重漏洞。
所以程式碼中存在什麼問題導致藍屏死機不是大問題,未來CrowdStrike 可能還會再次出現同樣的錯誤代碼,但如果發布流程不改善的話,未來則可能還會再次引起大規模的藍屏死機事件。
這次藍屏事件讓全球多個大型企業損失慘重,由於這些企業通常會購買保險,因此有些企業已經開始向保險公司提出索賠,然而CrowdStrike 可能並不會向任何客戶賠償損失。