不到一年,戴尔(Del)和惠与(HPE)再次闹出了有关固态硬盘的严重固件缺陷。受影响的企业级 SSD 可能在运行满 4 万小时后遭遇故障,并导致数据全部丢失。庆幸的是,两家公司已经及时地发布了固件更新,以避免 7*24 小时运行的客户遭受不必要的损失。虽然分别宣布和修复了这一固件缺陷,但问题似乎源于同一上游供应商(闪迪 / SanDisk 代工)。
Blocks&Files 指出,固件错误很是低级,修复起来也比较简单,但其对企业客户的影响仍然相当于一场地震。
据悉,DELL EMC 固件修复了涉及 Assert 功能,其能够检查验证循环缓冲区的索引值是否有误。然而问题固件并未检查为 N 的最大值,而是选择了 N-1 。在部署了固件修复之后,这一错误将被修正为 N 。此前,Dell EMC 交付过许多出现故障的 SAS-12Gbps 企业级驱动器,容量从 200GB 到 1.6TB 不等。所有这些驱动器都需要刷入 D417 版固件更新,以避免 4 万小时“猝死”。同时,HPE 这边出货了大量带有缺陷固件的 800GB 到 1.6TB 的驱动器,然后又被用到了众多服务器和存储设备产品线上:受影响的 HPE 设备包括 ProLiant、Synergy、Apollo 4200、Synergy 存储模块、D3000 存储机柜和 StoreEasy 1000,它们都需要刷新固件以确保稳定运行。尽管 HPE 方面不愿披露受影响的驱动器产品的 代工厂,但 Dell EMC 这边已经坦承为闪迪(SanDisk),目前已被纳入西部数据(Western Digital)麾下。从 Blocks&Files 发布的 HPE 的 MO1600JVYPR SSD 照片来看,HPE 那边的问题产品,显然也需要闪迪来背锅。
在不到一年的时间里,业内再次见到了由 SSD 固件引发的致命缺陷。去年下半年的时候,HPE 在使用不同系列的驱动器时遭遇了类似的 32768 小时‘猝死门’。鉴于当前的 SSD 已经变得足够可靠,可平稳度过多年的服役期限,后续我们或许会见到更多与固件有关的长期影响。