硬盤是目前PC系統中最主要的存儲設備,同時硬盤是PC系統中出故障率最高的部件。用戶在使用硬盤過程中,硬盤出現故障怎麼辦呢?如果還在質保期內,當然是盡量找到銷售商要求保修。但現在大多數IDE硬盤質保期只有一年,而大多數用戶都希望一個硬盤能使用三年以上。如果質保期過後硬盤出了故障,就得考慮更換或對它進行修理。
筆者這幾年來一直從事硬盤維修工作,經常與國內外的同行交流,查閱過大量的外文專業資料,研究使用過多種專業的硬盤修復工具,成功修復了近萬個硬盤。在這裡,筆者與讀者探討一些硬盤缺陷及其修復原理,同時介紹並解釋一些專業修復硬盤軟件中常用到的概念。但筆者暫不探討在各種作系統下硬盤中的數據結構問題及數據恢復問題,而是直接探討硬盤本身的缺陷問題。
一、缺陷的分類
如果經檢測發現某個硬盤不能完全正常工作,則稱這個硬盤是“有缺陷的硬盤(Defect Hard Disk)。
根據維修經驗,筆者將硬盤的缺陷分為六大類
①壞扇區(Bad sector),也稱缺陷扇區(Defect sector)
②磁道伺服缺陷(Track Servo defect)
③磁頭組件缺陷(Heads assembly defect)
④系統信息錯亂(Service information destruction)
⑤電子線路缺陷(The board of electronics defect)
⑥綜合性能缺陷(Complex reliability defect)
1.壞扇區(也稱缺陷扇區)
指不能被正常訪問或不能被正確讀寫的扇區。一般表現為:高級格式化後發現有“壞簇(Bad Clusters);用SCANDISK等工具檢查發現有“B標記;或用某些檢測工具發現有“扇區錯誤提示等。
一般每個扇區可以記錄512字節的數據,如果其中任何一個字節不正常,該扇區就屬於缺陷扇區。每個扇區除了記錄512字節的數據外,另外還記錄有一些信息:標志信息、校驗碼、地址信息等,其中任何一部分信息不正常都導致該扇區出現缺陷。
多數專業檢測軟件在檢測過程中發現缺陷時,都有類似的錯誤信息提示,常見的扇區缺陷主要有幾種情況:
①校驗錯誤(ECC uncorrectable errors,又稱ECC錯誤)。系統每次在往扇區中寫數據的同時,都根據這些數據經過一定的算法運算生成一個校驗碼(ECC=Error Correction Code),並將這個校驗碼記錄在該扇區的信息區內。以後從這個扇區讀取數據時,都會同時讀取其校檢碼,並對數據重新運算以檢查結果是否與校檢碼一致。如果一致,則認為這個扇區正常,存放的數據正確有效;如果不一致,則認為該扇區出錯,這就是校驗錯誤。這是硬盤最主要的缺陷類型。導致這種缺陷的原因主要有:磁盤表面磁介質損傷、硬盤寫功能不正常、校驗碼的算法差異。
②IDNF錯誤(sector ID not found),即扇區標志出錯,造成系統在需要讀寫時找不到相應的扇區。造成這個錯誤的原因可能是系統參數錯亂,導致內部地址轉換錯亂,系統找不到指定扇區;也有可能是某個扇區記錄的標志信息出錯導致系統無法正確辨別扇區。
③AMNF錯誤(Address Mark Not Found),即地址信息出錯。一般是由於某個扇區記錄的地址信息出錯,系統在對它訪問時發現其地址信息與系統編排的信息不一致。
④壞塊標記錯誤(Bad block mark)。某些軟件或病毒程序可以在部分扇區強行寫上壞塊標記,讓系統不使用這些扇區。這種情況嚴格來說不一定是硬盤本身的缺陷,但想清除這些壞塊標記卻不容易。
2.磁道伺服缺陷
現在的硬盤大多采用嵌入式伺服,硬盤中每個正常的物理磁道都嵌入有一段或幾段信息作為伺服信息,以便磁頭在尋道時能准確定位及辨別正確編號的物理磁道。如果某個物理磁道的伺服信息受損,該物理磁道就可能無法被訪問。這就是“磁道伺服缺陷。一般表現為,分區過程非正常中斷;格式化過程無法完成;用檢測工具檢測時,中途退出或死機,等等。
3.磁頭組件缺陷
指硬盤中磁頭組件的某部分不正常,造成部分或全部物理磁頭無法正常讀寫的情況。包括磁頭磨損、磁頭接觸面髒、磁頭擺臂變形、音圈受損、磁鐵移位等。一般表現為通電後,磁頭動作發出的聲音明顯不正常,硬盤無法被系統BIOS檢測到;無法分區格式化;格式化後發現從前到後都分布有大量的壞簇,等等。
4.系統信息錯亂
每個硬盤內部都有一個系統保留區(service area),裡面分成若干模塊保存有許多參數和程序。硬盤在通電自檢時,要調用其中大部分程序和參數。如果能讀出那些程序和參數模塊,而且校驗正常的話,硬盤就進入准備狀態。如果某些模塊讀不出或校驗不正常,則該硬盤就無法進入准備狀態。一般表現為,PC系統的BIOS無法檢測到該硬盤或檢測到該硬盤卻無法對它進行讀寫作。如某些系列硬盤的常見問題:美鑽二代系列硬盤通電後,磁頭響一聲,馬達停轉;Fujitsu MPG系列在通電後,磁頭正常尋道,但BIOS卻檢測不到;火球系列,系統能正常認出型號,卻不能分區格式化;Western Digital的EB、BB系列,能被系統檢測到,卻不能分區格式化,等等。
5.電子線路缺陷
指硬盤的電子線路板中部分線路斷路或短路,某些電氣元件或IC芯片損壞等。有部分可以通過觀察線路板發現缺陷所在,有些則要通過儀器測量後才能確認缺陷部位。一般表現為硬盤在通電後不能正常起轉,或者起轉後磁頭尋道不正常,等等。
6.綜合性能缺陷
有些硬盤在使用過程中部分芯片特性改變;或者有些硬盤受震動後物理結構產生微小變化(如馬達主軸受損);或者有些硬盤在設計上存在缺陷……最終導致硬盤穩定性差,或部分性能達不到標准要求。一般表現為,工作時噪音明顯增大;讀寫速度明顯太慢;同一系列的硬盤大量出現類似故障;某種故障時有時無等等。
二、廠家處理缺陷的方式
用戶在購買硬盤時,一般都通過各種工具檢測硬盤沒有缺陷後才會購買。而且,在質保期內可以找銷售商將硬盤退回廠家修理。那麼,廠家如何保證新硬盤不會被檢測到缺陷呢?返修的硬盤又如何處理缺陷呢?首先,讓我們來認識硬盤工廠的一些基本處理流程:
1.在生產線上裝配硬盤的硬件部分,用特別設備往盤片寫入伺服信號(Servo write)。
2.將硬盤的系統保留區(service area)格式化,並向系統保留區寫入程序模塊和參數模塊。系統保留區一般位於硬盤0物理面的最前面幾十個物理磁道。寫入的程序模塊一般用於硬盤內部管理,如低級格式化程序、加密解密程序、自監控程序、自動修復程序等等。寫入的參數多達近百項:如型號、系列號、容量、口令、生產廠家與生產日期、配件類型、區域分配表、缺陷表、出錯記錄、使用時間記錄、S.M.A.R.T表等等,數據量從幾百KB到幾MB不等。有時參數一經寫入就不再改變,如型號、系列號、生產時間等;而有些參數則可以在使用過程中由內部管理程序自動修改,如出錯記錄、使用時間記錄、S.M.A.R.T記錄等。也有些專業的維修人員可以借助專業的工具軟件,隨意讀取、修改寫入硬盤中的程序模塊和參數模塊。
3.將所使用的盤片表面按物理地址全面掃描,檢查出所有的缺陷磁道和缺陷扇區,並將這些缺陷磁道和缺陷扇區按實際物理地址記錄在永久缺陷列表(P-list:Permanent defect list)中。這個掃描過程非常嚴格,能把不穩定不可靠的磁道和扇區也檢查出來,視同缺陷一並處理。現在的硬盤密度極高,盤片生產過程再精密也很難完全避免缺陷磁道或缺陷扇區。一般新硬盤的P-list中都有少則數十,多則上萬個缺陷記錄。P-list是保留在系統保留區中,一般用戶是無法查看或修改的。有些專業的維修人員借助專業的工具軟件,可以查看或修改大部分硬盤中的P-list。
4.系統調用內部低級格式化程序,根據相應的內部參數進行內部低級格式化。在內部低級格式化過程中,對所有的磁道和扇區進行編號、信息重寫、清零等工作。在編號時,采用跳過(skipped)的方法忽略掉記錄在P-list中的缺陷磁道和缺陷扇區,保證以後用戶不會也不能使用到那些缺陷磁道和缺陷扇區。因此,新硬盤在出售時是無法被檢測到缺陷的。如果是返修的硬盤,一般就在廠家特定的維修部門進行檢測維修。
小知識:什麼是硬盤的磁道和扇區?磁道是磁盤一個面上的單個數據存儲圓圈。如果將磁道作為一個存儲單元,從數據管理效率來看實在是太低了,因此,磁道被分成若干編上號的區域,稱之為扇區。這些扇區代表了磁道的分段(如圖)。在PC系統中,通過標准格式化的程序產生的扇區容量都為512字節。這裡大家需注意的是“扇區與“簇的關系,“簇是作系統在讀或寫一個文件時能處理的最小磁盤單元,一個簇等於一個或多個扇區。
下一頁
本文共 2 頁,第;;[1][2]頁