過年過節也是網絡管理員、工程師最忙的時候,偏偏在這種時候,網絡設備不聽話,動不動就故障。小編搜羅了一些Cisco路由器故障診斷技術,包括常用命令的使用,以及如何根據錯誤消息查找故障,希望在您的網絡環境出現故障時,及時定位故障並解決故障...
1 引言
本文以CISCO路由式網絡為基礎,介紹使用診斷工具對Cisco路由器進行故障診斷的方法。限於篇幅,我們所介紹的內容和示例主要是基於IP報文的,基於IPX和Appletalk等協議的診斷技術與此類似。
2 故障診斷與排除命令
Cisco ISO操作系統軟件提供了一組功能豐富的命令,可以用來進行故障查找與排除、問題診斷以及性能檢測。命令大致可以分為兩類:show命令和debug命令。同時,還包含一組用於連接這兩類命令的clear命令。下面我們分別講解各命令
2.1 show命令
在這一節中,我們將講述最常用的show命令,闡述這些命令的輸出以及這些命令適用於解決的故障類型。為了敘述清楚,這些命令被分為全局系統命令、與接口相關的命令和與協議相關的命令。我們僅討論最常使用的命令。
全局系統命令
本節將列出與路由器軟件和硬件相關的輸出命令,其中包括存儲區和電源。show version命令是最基本的命令之一,它顯示路由器本身以及其所使用的軟、硬件的基本信息。show hardware命令的功能與show version命令類似。
命令的輸出信息包括:IOS的版本、路由器持續運行的時間約23周、最近一次重啟動的原因、路由器主存的大小、共享存儲器的大小、閃存的大小、IOS映像的文件名,以及路由器從何處啟動等信息。show version命令顯示了路由器的許多非常有用的信息。在解決問題時,通常應該從這個命令開始收集數據。
如果路由器的多個接口同時丟失報文,則可能由於路由器內存不足或者CPU過載。用戶可以使用show memory命令檢查內存利用率(如下所示)。CPU利用率可以使用show process命令檢查。
show memory的前兩行顯示了存儲器的一般信息,它表明系統有足夠可用的內存。同時它還顯示內存中沒有碎片,因為在13.03兆字節可用內存中最大的可用塊接近11.25兆字節。內存碎片表明內存被劃分為了許多不連續的塊。它將導致內存的利用率降低,嚴重時可能產生內存錯誤從而也嚴重影響路由器的性能。
現在看一看路由器中有許多內存碎片的情形(如下所示)。此時我們有足夠多的可用內存(8.4兆字節),但是其中最大的塊僅為0.5兆字節。連續內存中沒有足夠大的可用塊,這有可能導致嚴重的內存分配問題。這些問題有時表現為一個或多個接口間歇性的丟失報文。此時路由器產生內存碎片錯誤消息。
使用命令show memory free,用戶可以看到可用內存被劃分為許多很小的碎片。需要注意的是,路由器中存在一定數量的內存碎片是正常的。雖然並沒有一個很嚴格的界限來劃分內存碎片的可接受程度,但是可用塊的大小至少應該不小於可用內存的一半。用戶可以通過重新啟動路由器來解決這個問題。在重新啟動時,系統重新分配內存和緩存空間。此時,用戶應該監視內存分配的過程。如果再次發生類似的情況,則應該咨詢Cisco TAC。
用戶可以使用show process cpu命令檢查路由器的CPU是否過載。該命令將給出路由器CPU的利用率,同時顯示路由器中不同進程的CPU占用率。在下述示例中,路由器的CPU工作正常。在通常情況下,在5分鐘內CPU的平均利用率小於60%是可以接受的。如果懷疑CPU利用率出現了問題,則需要不斷地監視這一參數,因為它可能在短時間內發生變化。最好每10秒鐘使用一次該命令。通過這種方法,可以清楚地了解CPU利用率的波動情況。