案例背景
某公司原本使用某運營商的互聯網業務,使用各種應用都沒有問題。更換另一運營商的互聯網業務後,發現登錄QQ經常多人同時掉線,各個樓層、辦公室均出現過這種情況,但浏覽網頁及其他應用均沒有問題。用戶曾經直接把PC接到出口防火牆上測試,仍出現此情況,因此懷疑是運營商的互聯網業務有故障。
用戶的網絡環境示意圖如下:
用戶租用了50Mbps的裸光纖專線連接互聯網,在防火牆上實現NAT轉換功能。本案例在筆記本部署科來網絡分析系統,連接到用戶的辦公網絡抓包分析掉線的原因。
案例分析
在用戶的防火牆觀察出口流量,雙向流量均不到20Mbps,可以判斷不是流量過大而導致QQ掉線的。
ping運營商的互聯接口不丟包,ping QQ的服務器(183.60.48.247),有少量丟包,卻不掉線,說明少量丟包並不會造成QQ掉線。
在PC端發現QQ掉線後,大約1秒就自動恢復連接。而平時因網絡丟包或時延大而導致的掉線,會等若干秒才能連上。用科來網絡分析系統進行分析,發現掉線是由QQ服務器Reset TCP連接導致的。這也就能解釋為何掉線後能立即連上。抓包截圖如下:
為防止這個Reset是網絡中間的安全設備假冒QQ服務器發出的,特查看該Reset包的TTL是否與之前的包一致。查看後發現,收到的Reset包TTL值均為50,可以判斷不是中間設備假冒QQ服務器發出來的Reset。
分析結論
通過以上數據分析,我們可以判斷用戶QQ掉線與運營商網絡無關,是QQ服務器由於某種原因主動Reset中斷了用戶的會話。