有“大量工具”可以輔助管理員發現網絡什麼時候出故障了,同時也幾種方法可以用來應對這些警報。但是哪種方法是最佳的呢可以說,沒有。沒有任何一種方法適用於所有情況。本文將闡述故障修復中所使用的幾種方法,以及在什麼情況下它們不足以作為永久修復的手段。
基本上故障修復的方法有兩(電腦沒聲音)種,自上而下和自下而上。現在,我們將探討自上而下的方法,而在下一章節中,我們將探討自下而上的方法。
在自上而下的方法中,我們從OSI協議棧的最上層開始分析。我們要先測試應用是否正常工作,然後ping服務器,等等。直到我們到達協議棧的最底層,也就是物理層。這個方法最適用於多用戶進行服務台呼叫的情況。物理層問題幾乎很少可能成為影響所有用戶的問題,當然,除非遇到服務器連接問題時。這個方法可以用來確定應用或服務器是否DOWN了、變慢了,或者其它某些原因沒有響應網絡命令。為了有效地運行,它往往是在某種工具或者網絡監控應用協助下工作的,這些工具和應用是可以提供某種有規律和可操作的數據。在
可操作的數據可能是簡單的ping,可能所有監控通過SNMP陷阱傳輸的位錯誤和其它錯誤的結果都是主機無法訪問。然而,真正的目的是確定錯誤的起因。為了有效地實現,必須有一個系統故障修復計劃。這當然不只包含重啟服務器。如果服務器出現故障,那麼它一定是由於某些原因引起的。雖然原因可能是內存洩露、處理器過度使用,或者其它問題,但是重啟只能作為臨時方法,而非根本的解決方案。因此,這時的可操作數據是什麼呢就是能夠提供足夠有用和明確的信息來確定行動計劃的數據。
大多數管理軟件包和監控工具允許網絡管理員設置超出性能外的可接受范圍的限制。想要掌握應該在哪裡(電腦自動關機)可以為特定問題設置限制是需要不斷地探索的。設置值過低將會造成警報過密,設置過高將會導致系統死機。盲目地接受默認設置可以導致工具利用率不高。任何時候部署管理軟件,我都建議花點錢接受培訓。最理想的培訓是請通過軟件包認證的人來做實地培訓——在實際環境中。這樣我們就可以刪除不想要或者不需要的模塊,同時優化能為我們提供最好信息的模塊。帶寬消耗大的應用和負載高的服務器最好進行更多的調優。
管理軟件的另外一個優點是它能夠查詢不同的設備和在報告工具中保留數據統計和變化趨勢。以前,我們必須根據服務器軟件和激活的電子器件來雙擊各種不同接口上的每台交換機來查看 ,至今很多環境仍然采用這種方法。這太繁瑣了!現在,只要一個工具,就可以對趨勢分析和綜合流量報告進行導出、排序操作等等。這些也可以用來調整新的設備和升級(這只是一個附加功能)。趨勢分析和利用模型的一個優點是它允許我們確定哪些服務器可以受益於多網卡。同時,它也允許我們將交換機進行分組,這樣我們就可以平http://www.xsyzj.cn衡每台交換機的總數據包,同時就不會出現有的交換機負載過高而有些使用不足。而且它還有助於我們了解各種類型的數據包的流向,從而可以對它們進行優化。
網絡故障——自上而下的故障修復方法