實戰分享:IBM x3650 M4 Server RAID 5硬碟損壞,如何快速拯救重要資料?

故障狀況:公司 File Server 掛點

硬碟廠牌:IBM
硬碟型號:x3650 M4 Server

事發經過

公司某天接到一通來電,電話那頭先生告知全公司重要的 File Server 掛點了,僅知道共 10 顆 300GB SAS 硬碟,做甚麼樣的 RAID等級 當時並不曉得。

客戶詢問我們處理的速度可以多快,當下我僅告知他會盡全力協助,由於客戶正在高鐵上,通話有點斷斷續續,我們就這樣結束這通電話。

過了約 2 ~ 3 小時,公司的 LINE 突然來一段訊息,我馬上想到是早上與我聯繫的先生,我們利用 LINE 不斷來回了解客戶目前故障狀況。

客戶著急找到可以協助救援的廠商
客戶著急找到可以協助救援的廠商

客戶告知我因為接近年終關係,有些會計帳務資料急需處理,並說一回到台北會與我們聯繫。

其實這天晚上剛好是我們公司的尾牙聚餐,LINE 突然跳出客戶訊息,客戶想要送件請我們協助處理,我們雖在尾牙,但客戶願意直接將 10 顆硬碟送至我們手上,於是當晚我們在大直的萬豪酒店門口收下客戶的硬碟組。

我們跟客戶約在大直萬豪酒店收件
跟客戶約在大直萬豪酒店收件

因為客戶急需 RAID 內部資料,隔天週六一大早工程師就將硬碟一顆顆檢查,一般我們週六是沒有上班,為了此案件工程師也很配合加班處理。

在整個檢測過程中,也不斷與客戶聯繫,讓客戶能安心。

延伸閱讀:RAID 資料救援費用:鉅亨科技這樣的收費方式給客戶最大保障!

救援過程

此客戶使用 IBM x3650 的 Server 作為全公司的 File Server,首先我們先將 10 顆硬碟陸續透過設備作 Clone ,目的就是要保留硬碟最原始狀況。

在 Clone 過程發現有 2 顆硬碟有磁頭損壞現象,我們將故障磁頭更換後,再上到設備進行 Clone。

起先客戶描述此組 RAID 的狀況是
「共有 12 顆 SAS 硬碟,前面 2 顆硬碟做 RAID 1 作為 OS開機系統,後面 10 顆為組成RAID 6,作為 File 儲存區 。」工程師朝著客戶提供的資訊進行 RAID 組態的分析,
搞了半天發現這資訊是錯誤的。

實際上的 RAID 組合狀況是:
5 顆硬碟組成第一組 RAID 5,另外 5 顆硬碟組成第二組 RAID 5,找到正確組合後,順利透過軟體將 RAID 組合起來。

最後再修正 NTFS 檔案資訊,成功看到 RAID 資料進行存取!可喜可賀!

客戶心得

感謝工程師假日為我們加班作業,將重要資料全數救出!甚至資料救援比例達到 99%。由於資料量多達 3TB,我們又急用資料,於是工程師將儲存裝置直接拿到我們公司進行檔案傳輸,完成資料交付,非常感謝!!