能不能期望我們每一位網管員都能夠解決網絡運行中出現的所有問題呢?通過多年網絡管理的總結認為,如果預先采取一定的措施,並且使用正確的故障診斷方法,那麼回答是肯定的。下面給出了一個較為完整的過程,敬請各位同行批評指正。
及時更新網絡圖
首先應該繪制一個網絡方框圖。這個文檔的作用是為從事故障診斷的人員提供一個關於網絡布局和配置的全部信息的單一來源。網絡圖上包含的主要內容有:
*路由器的連接圖;
*設備的序號、型號及端口情況;
*使用的路由協議(如RIP、OSPF等);
*IOS版本(用於具有何種性能查找和判別);
*已安裝的模塊;
*訪問控制列表;
*地址(網絡地址和序號,MAC地址更好);
*交換機(型號);
*集線器(Hub型號);
*所有配置的拷貝。
當網絡使用發生變化時,要及時更新網絡圖。如果沒有更新網絡圖,那麼您的網絡圖的用處就要大打折扣,這將是非常危險的。如果出現這種情況,您必須馬上繪制一幅新的網絡圖,而不是依賴那個不能反映實際情況的老的網絡圖。
當網絡以通常方式運行時,必須符合網絡性能的基線。基線用來記錄網絡在低、中和高使用量時的信息量。它建立了一個網絡運行性能的記錄,該記錄可以用來進行比較,以確定是否出現問題。網絡運行性能基線中包含以下主要內容:
*網絡上運行了哪些協議;
*每個協議使用的帶寬百分比;
*每個協議的峰值使用量和平均使用量;
*數據包的大小以及每種大小數據包的百分比;
*循環冗余校驗(Cyclical Redundancy Check,CRC)發現的錯誤的峰值和平均值;
*網段每秒鐘傳輸的信息幀的峰值和平均值;
*是否存在超長的數據包;
*沖突域每秒產生的沖突的峰值和平均值;
*網段運行的峰值和平均值。
故障診斷方法與步驟
正確地確定問題是解決問題的關鍵。下面我們按照順序介紹故障診斷方法、步驟。應該注意的是這些步驟往往是相互重疊的,而且解決問題的方法實質上是循環式的。
⑴確定網絡問題的性質;
⑵收集有關的情況並對問題進行分析;
⑶分析問題產生的原因;
⑷設計一個解決問題計劃;
⑸實現這個解決問題計劃;
⑹評估該解決問題計劃產生的結果;
⑺重復上面的操作,直到問題得到解決;
⑻將解決方案記入文檔資料。
確定網絡問題的性質實際上就是要提出問題。即“誰出了問題,是什麼問題,何時產生和出現在何處”這樣的形式。這些問題可能會多次出現,您可以 向用戶、網管員、以及遇到或者了解問題的其他人詳細提問:誰受到了問題的影響?是單個用戶還是存在共性的一組用戶,甚至是整個網絡中的所有用戶呢?
若是單個用戶可能出現下列若干問題中之一:
*物理層問題,包括發生故障的網絡電纜。可用Ping來測試;
*在特定主機上的硬件故障。用Ping 127.0.0.1或Ping本機地址來檢測;
*軟件加載不正確或者崩潰了,尤其是網絡協議出了問題。可重裝軟件或刪除網絡協議後重新加載網絡協議;
*主機地址或者子網掩碼設置不正確。可修正主機地址和子網掩碼;
*默認網關配置不正確。可用Tracert檢測,重新修正默認網關。
擁有公共屬性或者遇到問題的一組用戶可能出現下列若干問題:
*網絡設備(比如集線器或者交換機)發生了故障;
*路由器接口發生故障;
*服務器發生故障;
*訪問列表設置錯誤;
*VLAN配置錯誤。
在我們知道“誰出了問題”後,就要集中精力解決:這個問題有何表現?是沒有連接還是只有部分連接的問題,或者是根本沒有連接的問題呢?如果是沒有連接的問題,那它就屬於: