當前網絡迅速發展,並承載了許多重要的商業應用和服務,同時網絡用戶也越來越多。在這種網絡環境下,網絡工程師除了要完成諸如將設備添加至網絡的簡單任務外,更多時候他們還需要去即時處理和解決一些復雜的網絡問題,以保證網絡正常快速地運行。
本白皮書討論了技術人員經常可能遇到的十個網絡問題,並介紹了它們的現象、原因和解決辦法。
問題 1 – 端口無法連接網絡
現象: 將電腦、電話、無線接入點或打印機插入牆壁上的網絡插孔,而網絡連接不正常。交換機端口的連接指示燈和網卡的連接指示燈都不亮。
原因: 若沒有修復牆壁插孔上的網絡連接,則時常會發生掉線或無法連接的問題。在許多企業中,只有那些經常使用的連接才被修復。當移動了辦公室或會議室後,有時會發現那些不常使用的網絡插孔並沒有被測試過,或是那些無法連接的插孔可能是由於登記錯誤導致的。此外,交換機端口可能被強制關閉。
解決辦法: 檢查和確認交換機端口是否已被激活,且網絡連接已被修復過。當任何設備被移動到辦公室時,請務必對新的網絡連接進行測試,確保他們能夠正常工作。就IP電話而言,也有可能是電話的電源供應不足。
問題 2 – 無法獲取到 IP地址
現象:網絡癱瘓或出現故障而不能正常運行。操作系統可能會提示客戶端當前無法從DHCP服務器獲取到IP地址。檢查網卡的狀態後,發現沒有分配IP地址。
原因:沒有收到來自DHCP服務器分配的IP地址。DHCP服務器的IP地址耗盡、服務器的服務癱瘓了、終端設備可能被配置為使用靜態IP地址而不是通過DHCP分配、終端設備的DHCP請求從來沒有到達服務器端,這些都可能導致客戶端無法獲取到IP地址。
尤其是如果一個新的設備配置一個虛擬局域網(VLAN),沒有建立與服務器的服務請求連接時,設備肯定不能獲取到IP地址。即將一個新設備配置到一個VLAN時,若沒有將DHCP請求中繼到DHCP服務器,就會導致請求不能發送到DHCP服務器端。
解決辦法: 關鍵問題是多少用戶出現了同樣的問題,一個用戶還是多個用戶?如果只有一個用戶受到影響,那麼請確認該客戶端的網絡設置是否配置為使用動態主機配置協議(DHCP)。
下一步,檢查交換機的端口被劃分到哪個VLAN,檢查屬於該VLAN的其他設備能否獲取到IP地址。如果他們也不能獲取到IP地址,問題原因可能是路由器沒有將DHCP請求轉發到DHCP服務器。如果多個子網內的許多設備都出現了這個問題,那麼可能是DHCP服務器出現了問題,即服務器的DHCP服務可能沒有運行,或者它的IP地址已經耗盡。
問題 3 – 無法連接到應用服務器
現象: 當用戶試圖打開一個應用程序時,系統可能會提示無法連接到該應用程序服務器。當使用電子郵件應用或客戶關系管理(CRM)應用時可能會出現這種問題。反映到服務台的常見投訴是網絡癱瘓了,而這可能並不是真正的原因。
原因: 許多原因都可能導致客戶端無法連接到應用服務器。關鍵是需要詢問用戶這個問題是經常發生,還是斷斷續續發生?如果用戶終端已獲取了一個正確的IP地址,那麼可能是用戶和服務器間的路由有問題。這種情況下,可以通過一個簡單的ping測試來驗證。如果連接時斷時續,則可能是由於服務器太繁忙,而不能及時響應客戶端的請求所導致的。
解決辦法: 如果使用ping測試後發現路由沒有問題,那麼請檢查服務器的負載和資源。檢查服務器是否正忙於執行一個諸如備份的任務?如果不是這樣的話,請檢查客戶端和服務器之間的網絡負荷,且側重關注廣域網連接(如果有的話)。
通常,客戶端和服務器之間的網絡利用率過高也可能導致客戶端能連接到應用服務器。最好的辦法是使用一個SNMP工具來監測這些鏈路上的網絡使用率。另外,尋找所有交換機和路由器上的以太網錯誤,這些錯誤可能導致客戶端與服務器間的數據包丟失。
問題 4 –VLAN配置錯誤
現象:當在網絡上建立諸如無線寬帶或IP電話的新服務時,通常要用VLAN來隔離其與其他用戶間的流量。這就要求對承載這些服務的交換機端口配置正確的VLAN。如果VLAN配置不正確,那麼這個服務可能無法正常運行。IP電話如果沒有經來電管理設備注冊授權過,那麼連接到該電話的個人電腦可能就無法連接到關鍵服務器,或者無線用戶可能沒有獲取到適於該無線環境的正確IP地址。
原因: 沒有對承載這些服務連接的交換機進行正確配置。也許在公司內部並沒有溝通好配置哪些端口來支持新服務。
解決辦法:通過測試,驗證該端口支持哪些VLAN。若條件允許,使用一個VLAN標簽生成特定VLAN的業務,檢查這個端口上是否配置了VLAN。通過檢查DHCP服務器提供的IP地址,來確定VLAN配置在了哪些端口上。另外,檢查交換機的配置來驗證VLAN配置。
問題 5 – 雙工方式不匹配
現象: 網絡能夠連接,而雙工方式不匹配,會導致網絡性能很差。這種情況下,交換機和網卡的鏈路指示燈都是亮著的。而網絡性能卻受到很大的影響,吞吐量會下降到100Kbps或者更低水平。
原因: 網絡連接的一側設備工作在全雙工(能夠同時發送和接收數據)模式下,而另一側的設備工作在半雙工(在同一時刻只能執行發送或接收)模式。全雙工側的設備不需要等待即可不斷發送數據,不論對方能否收到數據它都會發送。
半雙工側設備在發送前必須等待,直到它不接收數據才能開始發送。這意味著全雙工側設備有可能會中斷半雙工方的數據傳輸,造成半雙工側中止傳輸。如果傳輸被中止,將需要重傳這個數據幀。這將大大減少半雙工側設備所能使用的帶寬。
解決辦法: 一般情況下,若網絡兩側設備的雙工方式不相互匹配,采取的常用辦法就是把網絡連接的一側設備(通常是交換機)強制配置為全雙工,而讓另一側設備(例如個人電腦)配置為自適應網絡鏈路狀態。
理想的情況是:自適應功能能夠確認對方的全雙工設置,並與這個鏈路設置相匹配。然而事實卻未必如此。被強制設置為全雙工模式的設備不再發送正確的信號。而網絡另一側的設備恰恰需要這些信號來確定鏈路的速度和雙工方式,以及自適應對方鏈路設置。
因此,在這種情況下,需要自適應鏈路的設備不得不去猜測鏈路的雙工方式。在不能確認雙工方式的情況下,自適應功能將默認鏈路狀態為半雙工方式。這就是大多情況下,網絡發生雙工方式不匹配的主要原因。為了解決這個問題,需要將網絡上所有的連接都設置為自適應——除非你確實有別的原因。 在這些事件中,如交換機間的連接,一定要將兩側設備設置為全雙工。
問題 6 – 應用性能緩慢
現象: 應用程序運行緩慢。它可能在某一界面上凍結或在訪問數據時停止運行。通常情況下,網絡鏈路狀態不佳是造成這些問題的主要原因。
原因: 確定網絡應用程序的性能問題可以幫助服務器維護人員定位問題源。許多問題都可能導致應用程序運行緩慢。其中最常見的原因是在服務器在生產時間進行備份操作,數據庫服務器的響應緩慢,以及網絡中丟包情況較嚴重。對於一位網絡技術員來說,最重要的事情就是首先確定是服務器還是網絡造成了響應速度緩慢。
要確定這一點,可以從一個客戶端捕獲流量。尋找客戶端和服務器之間的任何重傳數據包。如果存在重傳現象,則表示網絡傳輸過程中有數據包丟失,這會嚴重影響應用程序的性能。如果客戶端和服務器之間不存在任何重傳,問題可能出在服務器上,這種情況下可以嚴格監測服務器。
解決辦法: 在追蹤一個故障時,雖然數據包分析儀的使用比較困難,他們往往都配有簡單計數器,可以顯示TCP重傳。使用該計數器可以幫助我們確定客戶端和服務器之間的網絡是否存在數據包丟失的現象。
查找客戶端和服務器之間的任何交換機和路由器的以太網錯誤(幀檢測序列錯誤,校准錯誤或碰撞),這些錯誤都能引起丟包現象。如果沒有錯誤,則觀察廣域網上是否有因鏈路利用率過高而導致的丟包現象。
問題 7 – 打印故障
現象:有時候也會出現打印故障。打印機也許沒有問題,而發送到打印機上的任務可能不能正常執行。
原因: 首先需要確定是否只有一位用戶遇到了這個問題,還是幾位用戶都遇到了同樣的問題。如果只有一位用戶遇到了,那麼可能是他的電腦沒有正確連接到打印服務器。如果不是這個原因,則可能是客戶端與打印機間的網絡連接有故障。數據包丟失可能會導致打印問題,打印機上的網絡連接故障也可能會引起打印問題。
解決辦法: 檢查打印機的配置,確保它有一個正確的IP地址,並且可以連接到打印服務器(如果打印服務器和打印機是分離開的)。有時,更新打印機驅動程序也能夠解決打印問題。總體來說,需要確保打印機是網絡可達的,以及所有打印機驅動程序是最新的。
問題 8 –電纜故障
現象: 客戶的電腦終端能夠連接到網絡,網絡性能卻很差。電腦終端可能根本無法連接網絡。
原因: 在當今網絡,千兆鏈路連接到桌面系統是常見的。千兆鏈路需要四對電纜,所以任何性能低於5類線的電纜都不能支撐千兆連接。對於比較老舊的建築物,必須考慮到這個問題。另外,任何數量的電纜如果退捻(通常靠近RJ- 45端口或接線板)可能會導致信號的損失。這將導致交換機端口或網卡出現幀檢測序列錯誤(FCS)。
解決辦法: 當出現由於電纜問題造成的網絡故障時,大多數情況下,都需要更換電纜。如果是由於電纜無捻導致的,那麼重新加捻電纜一般能夠解決這個問題。當需要承載如千兆鏈路或以太網供電的新技術時,必須使用5類電纜或者更好的電纜。
問題 9 – DNS 故障
現象: 用戶不能訪問互聯網或關鍵應用。可能是網絡癱瘓了。
原因: 問題可能歸咎於域名服務(D