萬盛學電腦網

 萬盛學電腦網 >> 電腦故障維護 >> 隨機性死機故障分析與排除

隨機性死機故障分析與排除

  隨機性故障是計算機使用過程中經常遇到的一種常見故障,由於出現死機的故障不確定,所做操作性質不固定,而且死機發生時,顯示的現象也不統一,所以故障發生的范圍不易確定,給維修工作帶來了一定的難度。
  根據大量的維修實例分析總結,隨機性死機故障產生的原因主要是以下三個方面:
  一、環境因素
  環境因素對於機器的正常運行有著很大的影響。計算機對環境的要求主要包括:溫度、濕度、電網干擾、電磁沖擊、外界振動沖擊、靜電、接地系統、供電系統等方面內容。其中尤以溫度、濕度、靜電、接地系統、供電系統對機器的正常運行影響最大。由於機器工作環境,如灰塵、潮濕引起芯片間線路短路或插拔件接觸不良,都有可能引起系統死機。根據實際維修統計,環境因素造成的隨機性故障占故障總數的10%左右。
  二、軟件原因
  軟件系統引起的隨機性死機包括兩種情況。一是病毒破壞,雖然有時可以通過冷、熱啟動再次啟動機器,但運行不久又會死機。二是應用軟件與操作系統不完全兼容,它們之間有沖突或者與硬件固有特性發生沖突,這種死機大多沒有鍵盤響應,只能通過冷啟動再次啟動機器。
  對於軟件原因造成的隨機性故障的檢查方法是,可以使用干淨的引導盤重新引導機器後,再運行殺毒軟件清除病毒。對於應用軟件與操作系統有沖突,建議采用修改程序配置與改變機器硬件配置相結合的方法解決。根據實際維修統計,軟件原因造成的隨機性故障占故障總數的20%左右。
  三、硬件原因
  硬件系統引起死機,主要是由於機器內部元件質量、兼容性或匹配不當引起的。通常包括:
  1.可插拔芯片接觸性故障。主板上有一些可插拔芯片接觸不良,這類故障極易發生在CPU芯片、內存芯片以及各種擴展槽上,另外,AGP擴展槽普遍存在插不緊的問題。
  2.芯片工作時序不匹配。在一個電路中如果幾個芯片共同完成一個功能,而幾個芯片之間的執行速度不匹配,當一個信號在芯片內部通過邏輯變換,傳輸所需的延時時間比較長,就容易產生時序故障。或時序電路的控制時間關系要求比較嚴格,偶爾發生時序信號漂移,這種情況最常見於組裝的兼容機。此外,由於采用了不同廠家的板卡或芯片也存在不完全兼容的現象,時鐘頻率過高,也是造成死機的原因。
  3.熱穩定性差。所謂的熱穩定性差是指機器在開始時運行正常,運行一段時間後,隨著芯片溫度的上升,開始出現死機。關機後,冷卻休息一段時間後開機又可以正常工作,之後又出現死機。其主要原因還是在於元器件本身質量不過關。
  4.芯片驅動能力差。因為每個芯片的扇出值是固定的,在電路設計中要求芯片的輸出信號驅動的芯片數必須小於允許的扇出值。如果芯片的扇出值不滿足其額定指標,當系統或某個電路連接較多設備時,就會造成芯片工作死機。這種故障經常出現在主板上的I/O接口、內存的地址或數據驅動芯片。
  5.抗干擾能力差。芯片的電源線和地線在印刷電路板上的布線寬度過小,線與線之間距離過近或芯片之間的電平匹配不好,使傳輸信號有“振蕩”或“反射”造成信號干擾,使芯片具有抗干擾能力而引起系統死機。根據實際維修統計,硬件原因造成的隨機性故障占故障總數的70%左右,是造成隨機性故障的主要原因,也是本文重點介紹的部分。
  四、隨機性故障分析與維修方法
  該類故障的檢查原則是,首先根據故障現象,推斷出故障的性質,然後根據這種推斷,利用萬用表、邏輯筆、示波器等工具,檢查硬件線路上的相應信號是否有隨機的干擾或時序漂移等現象,如果有則找到相應的硬件進行維修和更換。
  首先檢查是否有接觸性故障。在關機狀態下取下各種擴展卡,用手指卡住板卡邊緣輕輕彎折、敲打,然後在開機通電狀態下,用手指按壓板卡邊緣、主板上的CPU插座、內存條以及各種插頭或插座,如果在某個情況下機器可以啟動,則說明發生了接觸性不良故障。
  如果經反復試驗證明不是接觸性故障,就要檢查是否控制電路的時序故障。重點檢查:
  1.系統控制電路芯片。主要是地址總線和數據總線芯片,ALE的地址鎖存信號,以及主板上的南、北橋芯片等其它門陣芯片。
  2.系統內存控制電路、驅動電路。主要是RAM的行選通信號RAS、列選通信號CAS、行列地址轉換控制信號和內存數據讀出驅動、內存芯片速度匹配關系。

copyright © 萬盛學電腦網 all rights reserved