萬盛學電腦網

 萬盛學電腦網 >> 硬盤故障 >> 硬盤檢測失敗故障分析與實戰解決

硬盤檢測失敗故障分析與實戰解決

為了將大量多媒體文件放到網上去發布,單位最近新買了一台hpt DL385服務器,同時購買了一台HP Smart Array 500 G2磁盤控制陣列卡,配置了10塊容量為146GB的1萬轉scsi硬盤,在筆者打算將這10塊SCSI硬盤做成RAID 5,以便讓磁盤陣列系統擔負起保存大量多媒體信息的任務。想到做到,筆者迅速將服務器機箱外殼打開,然後將HP Smart Array 500 G2磁盤陣列卡小心翼翼地插入到服務器主板的PCI插槽裡(電腦自動關機),接著把SCSI數據線纜的一頭與磁盤陣列卡連接,另外一頭與插滿10塊SCSI硬盤的磁盤控制陣列櫃直接連接;接下來接通磁盤控制陣列櫃電源,等到其中的所有硬盤信號燈閃爍狀態穩定後,再接通服務器主機電源,這樣一來服務器就會自動開始執行檢測操作。

  在檢測過程中,筆者發現windows系統先是識別到了安裝在插槽1位置處的磁盤陣列卡,之後又對其中的硬盤進行了初始化掃描操作,但是當掃描操作結束後,筆者發現安裝在磁盤控制陣列櫃中的所有硬盤信號燈都變成了紅色,同時系統還彈出提示說檢測不到邏輯硬盤和物理硬盤。筆者不放心,重新啟動了一下計算機系統,並在啟動過程中及時按下了F8功能鍵,進入到磁盤陣列參數配置界面,並在其中執行了查看邏輯盤命令,可是系統依然提示沒有找到可用的邏輯硬盤,看來安裝在磁盤控制陣列櫃中的10塊SCSI硬盤真沒有被系統識別到。

  考慮到10塊SCSI硬盤是通過磁盤控制陣列櫃來與計算機相連的,只要任意一塊硬盤發生損壞,或者SCSI信號線纜、磁盤控制陣列卡中的任意一個損壞的話,都會導致計算機系統無法檢測到硬盤。為了消除硬盤檢測失敗故障,筆者只好從可能的因素著手,來對多方面因素進行逐步排查:

  首先筆者將連接磁盤控制陣列櫃與安裝在計算機PCI插槽中的陣列卡的SCSI線纜拔了下來,然後將該線纜的一端直接與計算機主板中的SCSI端口相連,而不與磁盤陣列卡相連,另外一端仍然與磁盤控制陣列櫃相連,然後接通計算機電源,讓Windows服務器系統重新對硬盤進行檢測掃描,結果筆者發現所有的SCSI硬盤都能被Windows服務器系統正確掃描識別到,同時屏幕上還顯示出每塊硬盤的詳細參數信息,包括硬盤的生產廠家、具體型號、容量大小以及所用的SCSI標識號,這樣的結果至少能表明SCSI連接線纜是正常的,而且磁盤控制陣列櫃的工作狀態也是正常的。

  在排除了磁盤控制陣列櫃與SCSI信號線纜因素後,下面筆者又將排查的重點“鎖定”在磁盤控制陣列卡上。為了檢驗磁盤控制陣列卡究竟有沒有發生損壞,筆者特意向其他部門臨時借用了一塊工作狀態正常的HP Smart Array 500 G2磁盤陣列卡,來將計算機原配的磁盤陣列卡替換掉;可是,當筆者用SCSI信號線纜將工作正常的磁盤陣列卡與磁盤控制陣列櫃直接連接起來,並接通計算機電源後,發現Windows服務器系統在檢測掃描硬盤時,仍然發生了失敗故障,而且故障症狀與先前產生的症狀幾乎是一模一樣,到了這裡(電腦自動關機)筆者基本認定磁盤控制陣列卡也沒有任何問題。既然磁盤控制陣列櫃、陣列卡以及SCSI信號線纜都沒有問題,那安裝在磁盤控制陣列櫃中的10塊SCSI硬盤,為什麼不會被Windows服務器系統正確掃描、識別到呢?

  經過上面的逐步排查後,現在導致硬盤檢測失敗故障的唯一可能因素就是有部分硬盤發生損壞了;為了驗證自己的猜想,筆者將安裝在磁盤控制陣列櫃中的所有硬盤全先拔了出來,然後重新在磁盤控制陣列櫃中只安裝一塊硬盤,並接通計算機電源進行掃描測試,結果發現Windows服務器系統竟然能夠掃描識別到該硬盤。按照相同的操作方法,筆者又在磁盤控制陣列櫃中新增加了一只硬盤,並接通計算機電源進行掃描測試,測試結果也是正常的;依此類推,當筆者加入第六塊硬盤進行測試時,發現Windows服務器系統又找不到硬盤了;當將第六塊硬盤排除在外,同時依次加入其他硬盤繼續測試時,發現測試結果都很正常。

  到了這裡(電腦自動關機),筆者基本認定安裝在磁盤控制陣列櫃中的10塊SCSI硬盤,之所以不能被Windows服務器系統掃描識別到,是因為第六塊硬盤自身存在硬件故障,導致了與它安裝在一起的其他硬盤都不能被系統識別到;當將該故障硬盤剔除掉,或者重新更換新的硬盤替換故障硬盤後,安裝在磁盤控制陣列櫃中的10塊SCSI硬盤又能被系統全部掃描檢測到了。 硬盤檢測失敗故障分析與實戰解決
copyright © 萬盛學電腦網 all rights reserved