一、當最後100米無線化
所有對網絡故障維護有較長期經驗的人都清楚,早期網絡大概75%左右的故障來自於物理連接故障,也就是來自於網線或物理接口。後期伴隨綜合布線理念的貫徹與執行,制造工藝的提升,線纜與接口質量的提升,這一故障的比例大幅度降低了。那麼當我們的最後100米無線化之後,網線和物理接口會出現什麼樣的情況呢?
1.1 靈活性的大躍進與技術本身的退步
首先我們應該有一個明確的認識,無線WLAN網絡事實上是網絡靈活性的提升和網絡技術的倒退。從技術角度講,WLAN本身將網絡技術倒退了至少5-10年,即從交換式以太網年代退回到共享式以太網年代。這種倒退從物理介質角度而言尤甚,因為在當前的交換式以太網技術中,每個用戶是獨享傳輸介質的,但是在無線技術中,所有的用戶共享物理信道,只要用戶間相互可見,無論有多少個AP,所有工作在同一頻點的用戶共享相同的物理介質。這就是典型的同軸共享式以太網或基於HUB的共享式以太網的特征。
那麼在共享式以太網裡需要考慮的物理數據碰撞、網絡用戶量與數據量規模無法無限擴展等問題重新歸來,因此網絡排錯時需要考慮的因素增加了。
1.2 便捷性與管理復雜度的雙重提升
相較以太網,WLAN在提升便捷性的同時,其傳輸介質發生了明顯的變化,從現在幾乎絕對可信的銅纜和光纖變為絕對不可信的頻譜資源,因此,管理無線網絡的網管人員除必須擁有管理以太網絡必備的充足TCP/IP知識外,還必須理解無線網絡中的射頻知識,例如對信噪比、信號強度、發射功率、天線增益、干擾等概念的真正理解,以及對802.11協議的獨特特性,例如重傳的概念的真正理解。管理無線網絡對網管員的知識體系提出了新的挑戰,並且對接入介質的管理復雜度呈幾何級提升。
1.3 從管理“有”到管理“無”
傳統以太網是有線網絡,所有的連接是可見的,某個終端連接到具體哪個設備是明確的。而無線網絡的連接是不可見的,某個終端在整個的接入過程中會不斷的發生切換,從一個接入設備切換到另外一個接入設備。在某些極端情況下,設備會在兩個不同的接入AP之間一分鐘之內切換幾十甚至上百次,並且這種切換完全由客戶端決定,傳統網管軟件的刷新速率已經完全無法把握這種情況,這無疑成為如何進行無線網絡管理所需解決的又一個重點問題。
二、摩托羅拉系統將無線故障排查可視化
2.1 無線網絡拓撲的可視化
不一樣的無線網絡拓撲。當討論有線網絡拓撲圖時,我們只需將客戶端簡單地連接到接入交換機的物理接口即可。但是在無線裡同一個AP還需要討論其ESS/BSS的問題,因此拓撲圖應該是客戶端接入了哪一個BSS,然後這個BSS接入到哪一個ESS。所以,無線網絡的拓撲圖與有線網絡的拓撲圖是完全不同的。
2.2 不同的物理狀態
在無線領域中,沒有明確的線纜連接,只有無線區域的覆蓋好壞,而且無線網絡的動態特征導致這種覆蓋好壞是變化的。因此,我們需要實時熱圖來監控整個無線網絡,使其真正的可視起來。
2.3 物理層排錯
在物理層排錯時,大家普遍認為無線的干擾是網絡質量的罪魁禍首。但是事實上,無線網絡中的資源利用率和干擾強度的組合才是真正的問題所在,而且干擾不僅僅是WLAN對WLAN的干擾,還包括其它同頻干擾,例如微波、2.4GHz無線電遙控射頻信號或者藍牙信號。因此,在物理層排錯中,我們必須對所有的干擾源進行分析,同時對其資源利用率進行監控。僅僅通過網上某些免費的工具是不能夠真正定位問題所在的。
舉一個簡單的例子,大家隨便找兩個AP,將其設定在同一個信道上,然後把它們的發射功率調到最大,物理間隔僅10厘米。用傳統軟件看,這種干擾是極強的。但是如果有一個AP上有用戶,另外一個AP上一個用戶都沒有,或者即使兩個AP都有用戶,在AP的競爭策略設定合理、用戶流量不大的情況下,我們的上網感知仍然會相當好。
相反,如果我們將兩個AP之間的距離拉遠到30米,每個AP上都接入用戶,並且采用大流量,此時,用傳統軟件看到的干擾會較小,但是實際的使用感知卻非常差。
還有一種情況,如果我們只使用一個AP,並讓幾個用戶同時接入,在用戶處在互相不可見的位置同時觀看高質量視頻時,所有用戶的感知都會很差。但在這種情況下,傳統軟件會認為這是沒有干擾的。
摩托羅拉系統選擇對整個無線網絡的整個物理層實現完整的呈現,包括各個信道的干擾強度、信道使用率以及是否有非WLAN的干擾。在下圖的示例中,信道11的干擾高達-25dBm,但是利用率只有5%,而信道1的干擾在-40到-50dBm之間,接口利用率卻高達100%,而且是持續的微波干擾。在這種情況下,信道1干擾小,但基本是不可使用的。信道11干擾極強,卻一定是客戶體驗最好的。因此,物理層可視化在無線網絡中是非常重要的。
2.3 您真的知道網絡的情況嗎?
在傳統以太網中,如果用戶出現玩游戲頻繁“卡”的情況,那麼,查看一下互聯網出口的擁塞程度和用戶Ping DHCP服務器的響應時間,就基本可以定位問題所在了。但是對於無線網絡而言,頻繁“卡”很有可能是無線和有線雙重因素導致。
如果是響應較慢,需要定位是無線慢還是有線慢;如果是無線慢,還要確認是哪種無線因素導致了緩慢。那麼,到底是由於干擾、沖突、,無線網絡整體性能不足還是覆蓋不合理的頻繁漫游切換導致了這個問題呢?
有些時候,由於無線網絡是共享式的,我們在無線中只要有一個或幾個用戶是低速率用戶,整體網絡性能就會大幅度的下降。在20個終端中部分是802.11n AP的網絡(如18個802.11n加2個802.11b),其整體網絡性能可能遠遠低於20個均是802.11g的網卡。因此,如果一個用戶玩游戲卡,很有可能是另外一個用戶的網卡速率低造成的。
另外,如何排查用戶在兩個AP間頻繁切換的問題呢?如何排查用戶的性能是由於干擾造成的呢?對於無線網絡的排錯需要看一個信道、一個用戶、一個BSS的整體情況,而不是僅僅排查某個用戶。
摩托羅拉系統通過一個界面可以遠程的了解數據的信號噪聲比(干擾)、用戶的重傳(空口負載情況)、數據傳輸速率(是否有低速率用戶影響了整個網絡性能)、用戶的傳輸信道分配(是否用戶短時間內在兩個不同信道內發射,也就是在頻繁漫游),完全可視化地監控全部可能存在的故障。
如果網管人員不足、無法實時監控時,摩托羅拉系統可以定義網絡質量劣化的兩大重要指標——傳輸速率和重傳率的門限,對網絡進行實時監控,一旦指標超越門限值即可通過告警了解到這一情況,並且通過對歷史數據的詳細分析確認網絡故障的具體原因。
例如從附圖中網管員了解過去24小時中的不同類型報文比例,如果將這一趨勢分析放大到季度或者年度,我們又可以分析網絡趨勢,及時調整網絡以避免問題的大規模爆發。
三、通過故障排查可視化確保網絡的真正可用性
網絡最後100米由WLAN接管是大勢所趨,應用的多終端協同化是大勢所趨,關鍵應用效率提升通過移動應用方式實現也是大勢所趨。無線網絡技術倒退是實際情況,無線網絡的物理介質脆弱是實際情況,無線網絡不可視也是實際情況。
要求無線網絡完全無故障是不現實的,在這樣的實際要求下,無線網絡故障排查的高效率是我們必須提供的,尤其是將關鍵應用部署於無線之上的機構。