交換機運行中出現故障是不可避免的,但出現故障後應當迅速地進行處理,盡快查出故障點,排除故障,這是維護人員應盡的職責。但是要做到這一點,就必須了解交換機故障的類型及具備對故障進行分析和處理的能力。為此,本文就交換機常出現的故障類型及分析處理的方法作一簡要的介紹。
1 故障分類
從筆者多年來維護程控交換機的經驗和在工作中遇到的故障來看,交換機的故障一般分為以下類型,如表1所示。
具體類型是:
(1)電路板損壞
電路板上的元器件受損或基板不良,造成電路板不能正常工作。
(2)硬件工注不合適
硬件工注是為減少電路板的種類,而在電路板上設置的一組或幾組開關,用以定義該電路板的工作狀態或在系統中所處位置,如硬件工注設置得不正確,必會導致該電路板工作不正常。
(3)電路板塊類型不合適
硬件更新後,同一名稱的電路板塊可能有多種不同的型號。在一般情況下,新型號電路板的功能會兼容舊型號電路板的功能,但舊型號的電路板的功能就不一定能兼容新型號電路板的功能了。
(4)機架、模塊的問題
機架、模塊用於承載電路板,按其在系統中的位置被分為處理機系統的機架、模塊,交換系統的機架、模塊和維護管理系統的機架、模塊等。這些機架、模塊也會出故障。
(5)設備供電的問題
整流器提供的-48V直流電被分配到每一個機架及相關的設備上,機架內的電源分配系統負責向模塊供電,而每一模塊上的電源電路板,都能根據模塊內各電路板所需的電壓進行調整,然後配送到每一塊電路板上。但在這一過程中,任意環節出現問題,都有可能造成供電的故障。
(6)連接電纜和配線架跳線的問題
連接電纜和配線架的跳線是用來連接模塊、機架和設備用的,如果這些連接電纜內的纜芯或跳線發生了短路、斷路或虛接,就會形成通信系統的故障。
(7)程序BUG
軟件程序設計存在著缺陷。
(8)系統數據錯誤
系統數據,包括軟件工注,用於對整個系統進行定義。如系統數據出現錯誤,也會造成系統全方位的故障,對整個交換局產生影響。
(9)局數據錯誤
局數據是根據交換局的具體情況而定義的。當局數據出現錯誤時,也會對整個交換局產生影響。
(10)用戶數據錯誤
用戶數據對每一個用戶的情況進行定義,如果用戶數據被錯誤設置,出現用戶數據錯誤,會對某個用戶產生影響。
2 故障分析和處理的方法
不同的故障會有不同的表現形式,故障分析的目的就是要通過分析故障現象,找出故障的原因和確定故障的地點,以對故障進行排除。為了使故障分析工作有條不紊和有章可循,需要在故障分析中參照故障分類表的級別,逐步推進。首先是按一級分類,確定是軟件故障還是硬件故障,然後根據二級、三級分類進行遞推。第五級分類都有很多測試的方法,一些常用的測試方法有:
(1)排除法
根據故障現象,羅列出故障發生的可能性,然後逐步排除。在羅列故障可能性的時候,要盡可能全面一些,不要有遺漏。排除可能性時要從簡而繁,避免無效勞動。這種方法的邏輯性較強http://.,可以應對各種各樣的故障,但缺點是對維護人員的要求較高,要求維護人員對交換系統有全面深入的了解。
(2)對比法
用本系統正常運行的設備或他局正常的設備作基准,對比故障設備和正常設備之間的區別,找出故障所在。這種方法簡單易行,對軟件故障的排查尤為有利,但缺點是用途有限,特別是一些故障無法找到有效的對比基准。
(3)替換法
用正常的設備去替換有懷疑的設備,這種方法主要用於對硬件設備故障的處理。替換時應注意正常設備的型號、類型及硬件工注是否與欲替換的設備完全相符。
以上幾種方法,在實際運用中,有時是交替使用的,目的是為了迅速准確地找出故障點。
下面結合故障處理來說明故障分析和處理的方法。
故障(1)
故障現象:某新局開通後,一些用戶在出局呼叫時,經常呼叫不成功,用話務統計監測時,發現出局呼損過大,近30%,且不分局向。
故障分析:此故障現象無法明確判定出是軟件故障還是硬件故障,也沒有可比對參照的設備,所以無法使用對比法和替換法,只能使用排除法來處理。
由於該故障與呼叫有關,與用戶無關,不會影響用戶的其他呼叫,所以可以排除用戶電路和交換系統方面的因素。但根據呼叫流程,可以分析出與出局呼叫相關的硬件設備有用戶電路、局間中繼電路、收發碼器和交換系統,與出局呼叫相關的軟件系統有用戶數據、局間中繼局數據和收發碼器局數據等。這樣,依據由簡入繁的原則,可首先進行局是中繼電路的測試,結果沒有發現什麼問題,於是又對收發碼器進行測試,發現有近25%的收發碼器不能使用,且都集中在相同的模塊上。但對這些不能使用收發碼器按號碼檢查其局數據的設定時,並沒發現有什麼問題,至此可以肯定,該故障屬於硬件方面的問題(集中在相同的模塊上)。於是對硬件模塊和所連接的設備進行了檢查,並用對比法,將有不能使用收發碼器的模塊與收發碼器正常工作的模塊相比較,才發現是其控制電路板的型號不正確。待更換了正確型號的控制電路板後,故障即被排除。
故障(2)
故障現象:某局一個中央處理機模塊不能在雙機狀態下運行,由人工輸入雙機命令返回的信息是,中央處理機模塊備用側不能正常工作;用診斷命令對備用側進行診斷的提示信息是,備用側一部分電路板不正常。
故障分析:該故障明顯地屬於硬件的故障。於是按照故障信息的提示,首先運用替換法,將備用側的電路板更換掉。但是,電路板更換後,故障現象並沒消失。就是說,真正的故障點不在備用側的電路板上,造成備用側故障的原因,有可能是機架、模塊、供電及連接設備等。於是又用排除法對這些設備逐步進行排查,特別是找出了中央處理機模塊的工作說明書,仔細分析其由單機轉向雙機的過程,並由人工發雙機命令,先由主用側接收數據,然後由主用側通過主被控制電路板向備用側發送集合,讓被用側進行自檢等。這一過程如備用側正常,就會回復主用側,並做好接收主用側信息的准備。如主用側收到備用側正常回復的信息,就會向備用側傳送現行數據,實現雙機運行。然而現在的問題是,主用側沒有收到備用側正常回復的信息。是什麼原因呢是主用側根本就沒向備用側發出雙機指令還是備用發出的正常回復信息主用側收不到呢這些都與主用側主備控制電路板的傳遞有關。為此,通過再啟動,強http://.制轉換中央處理機模塊的主備用設備,並更換了原主用側的主備控制電路板,故障現象就消失了。
此故障的類型即為電路板損壞故障。
故障(2)
故障現象:某局城建產設局間中繼電路設施,但在硬件設施安裝完畢後,輸入局數據時出現了差錯,即出現了局數據存儲狀態錯誤的提示。
故障分析:該故障按故障類型,很明顯為軟件故障,是無法使用替換法的。為此,根據由簡入繁的原則,先采用了對比法,即打印出相關的局數據與他局進行比較,很愉就在內存管理表中發現了可疑點。由於局數據內存管理表是按照起始地址、終了地址、存儲空間、剩余空間來管理的。而該局內存管理表中剩余空間的數值比存儲空間的數值大了很多,很明顯是局數據的管理出了問題。於是用機器碼修改命令,調整了局數據內存管理表,就排除了這個故障,使局數據的運行達到了正常。
3 結束語
故障的現象是多樣的,故障的原因也是多樣的,同一故障,可能有多種不同的故障現象。同一故障現象,也可能有多種不同的原因。例如,用戶電路板的故障,既可以表現為用戶無蜂音、雜音、錯號,也可表現為單通、無振鈴等。而且,同樣是用戶無蜂音的現象,其原因也可能是配線架接觸不良,用戶模塊有問題或是交換系統的問題等等。所以,要求在進行故障分析的時候,一定要盡可能全面、詳盡地了解故障現象和靈活地運用故障分析 方法。同時,要做好分析記錄,整理和記下每一次故障分析、處理的全過程,以積累經驗,不斷提高故障處理的水平http://www.xsyzj.cn。