戴爾惠與發布修復固件避免企業級SSD遭遇四萬小時運行故障
不到一年,戴爾(Del)和惠與(HPE)再次鬧出了有關固態硬盤的嚴重固件缺陷。受影響的企業級SSD可能在運行滿4萬小時後遭遇故障,並導致數據全部丟失。慶幸的是,兩家公司已經及時地發布了固件更新,以避免7*24小時運行的客戶遭受不必要的損失。
雖然分別宣布和修復了這一固件缺陷,但問題似乎源於同一上游供應商(閃迪/ SanDisk 代工)。
Blocks&Files 指出,固件錯誤很是低級,修復起來也比較簡單,但其對企業客戶的影響仍然相當於一場地震。
據悉,DELL EMC固件修復了涉及Assert功能,其能夠檢查驗證循環緩衝區的索引值是否有誤。
然而問題固件並未檢查為N 的最大值,而是選擇了N-1 。在部署了固件修復之後,這一錯誤將被修正為N 。
此前,Dell EMC 交付過許多出現故障的SAS-12Gbps 企業級驅動器,容量從200GB 到1.6TB 不等。所有這些驅動器都需要刷入D417 版固件更新,以避免4 萬小時“猝死”。
同時,HPE 這邊出貨了大量帶有缺陷固件的800GB 到1.6TB 的驅動器,然後又被用到了眾多服務器和存儲設備產品線上:
受影響的HPE 設備包括ProLiant、Synergy、Apollo 4200、Synergy 存儲模塊、D3000 存儲機櫃和StoreEasy 1000,它們都需要刷新固件以確保穩定運行。
儘管HPE方面不願披露受影響的驅動器產品的代工廠,但Dell EMC這邊已經坦承為閃迪(SanDisk),目前已被納入西部數據(Western Digital)麾下。
從Blocks&Files發布的HPE的MO1600JVYPR SSD照片來看,HPE那邊的問題產品,顯然也需要閃迪來背鍋。
在不到一年的時間裡,業內再次見到了由SSD 固件引發的致命缺陷。去年下半年的時候,HPE 在使用不同系列的驅動器時遭遇了類似的32768 小時’猝死門’。鑑於當前的SSD 已經變得足夠可靠,可平穩度過多年的服役期限,後續我們或許會見到更多與固件有關的長期影響。