萬盛學電腦網

 萬盛學電腦網 >> 網絡應用技術 >> 應用教程 >> 如何解決常見網絡突發問題

如何解決常見網絡突發問題

   任何網絡系統都有出現故障的時候,可能發生在測試階段,也可能發生在系統剛剛上線,還可能發生在已經穩定運行很多年的系統上。這些系統出現故障所帶來的負面影響可大可小,小到一個終端的軟件無法使用,大到整個網絡癱瘓……

  網絡突發問題的例子比比皆是,2012年的雙十一凌晨剛過,在第1分鐘內,全國有超過1000萬名獨立客戶“湧入”淘寶,淘寶總部的網絡一度陷入癱瘓,遭到了網友們诟病,支付寶被”搶癱”,好不容易進入支付過程,支付寶提示系統繁忙,經過反復嘗試,花費用戶很長時間實現支付。而京東當天流量暴漲,大量用戶登錄。結果京東商城的服務器被大流量沖垮,服務器也癱瘓。

  作為以網絡為主體的公司,難免會碰到各種各樣的網絡突發問題,如何解決這些問題已經成為所有企業都關注話題。本期IT大智慧就讓筆者帶大家了解一下常見網絡突發問題的解決方案。

如何解決常見網絡突發問題 三聯

  硬件損壞

  服務器硬件故障是導致企業網絡突發問題最大原因之一,由於X86服務器和台式機有著很多相似之處,無論是從前期部署、中期維護到後期管理都有著不少相同點。因此,X86服務器盡管有著成熟穩定的架構體系,也不免出現“罷工”。特別是企業負載應用得多了,遇到的故障是很平常的事情。較為常見的服務器硬件故障有處理器故障、內存故障、硬盤故障、線纜連接故障、電源、管理模塊以及網卡故障等。而解決這些故障最簡單的辦法就是選擇一些品牌質量過硬,服務較好的廠商.

  目前,像戴爾PowerEdge 12G系列、聯想ThinkServer系列,IBM System系列、HP ProLiant系列都能為企業用戶提供經久耐用的產品,當然如果您的企業資金較為緊張,也可選用曙光等國產品牌服務器來滿足您的需求。

  而服務方面,能夠提供金牌服務的戴爾應該算是最讓人省心的服務器品牌,以戴爾PowerEdge 12G系列為例,其支持3年專業支持和 (7x24) 4小時上門服務和安裝Dell PowerEdge服務器、Microsoft Windows操作系統服務,能夠以最專業的服務和最快捷的上門服務快速解決企業用戶服務器問題。

  高溫宕機

  不少中小企業服務器由於需要控制成本並沒有在機房托管,這也就帶來一些不穩定因素,比如機房溫度、斷電、瞬間電流過大等情況。筆者認識一位IT運維人員,其在某企業擔任系統工程師職位,在前不久,該公司發生了一次較大故障,故障成因很簡單,就是由於空調物理機損壞,導致多台服務器過熱,部分業務中斷。在更換新的空調之後問題得以解決。當然,在沒有更換之前,當時也采用了一些"笨辦法",比如使用大功率的風扇、開啟機房的排氣窗等等,暫時緩解了空調損壞造成的不良影響。

  出現故障的同時必然會造成一些業務的中斷,可想而知,若是故障得不到及時的處理,那麼公司網絡將會處在一個"癱瘓"的狀態,這將是很可怕的事情,後果不堪設想。那麼如何解決類似於高溫宕機這樣的問題呢?

  對於類似故障處理,大概遵循以下幾個大的方向。首先,機房中應安裝有溫度報警系統,溫度達到閥值後會直接報告給相關運維人員;其次需要IT運維人員收到報警巡檢或定期巡檢;再次,IT運維人員應檢查是否誤報;在確認報警內容屬實進行相應處理;最後檢查是否有預案,如有則按照預案處理,如無則盡快聯系廠商處理,同時對此事備案。

  在處理問題環節,如果在自身團隊無法處理的時候,會及時和廠商聯系,獲取更專業的支持。

  以戴爾新風冷卻解決方案為例,其不僅具備高散熱能力和可靠性等優勢,還使得方案中的服務器、存儲和網絡設備允許用戶在更高溫度條件下安全、穩定的運行,避免因高溫宕機“罷工”。

  瞬間高流量壓力

  就像本篇一開始所說,由於瞬間流量過高導致的服務器宕機的例子比比皆是,就連耗資三億多12306購票網站也在春節、國慶前後出現宕機意外,據不完全統計,每年春運時間僅鐵道客運流量便高達4億人次,如此高的瞬間流量難免讓一個網站無法承受。

  既然是全國交通購票系統網站,由國家鐵道部親自操刀主辦,又投入如此大的經費,每每關鍵時刻出現問題,很多時候不得不讓人心存疑慮。從技術角度而言,也許是因為服務器數量不足,技術不夠完善等等。若說這一網站真正發揮功效的時候可謂屈指可數,十一和春節是中國最為重要的兩個節日,也是人們出行高峰時節,但僅僅因為服務器數量原因而增加設備,難免在年中其它時間顯得浪費。下面就讓我們來一起看看網站瞬間高流量壓力問題應如何解決。

  首先我們先來熟悉一下這兩個名詞:負載均衡、應用交付。

  負載均衡:(又稱為負載分擔),英文名稱為Load Balance,其意思就是將負載(工作任務)進行平衡、分攤到多個操作單元上進行執行,例如Web服務器、FTP服務器、企業關鍵應用服務器和其它關鍵任務服務器等,從而共同完成工作任務。負載均衡設備不是基礎網絡設備,而是一種性能優化設備。

  應用交付:就是指應用交付網絡(Application Delivery Networking,簡稱ADN),它利用相應的網絡優化/加速設備,確保用戶的業務應用能夠快速、安全、可靠地交付給內部員工和外部服務群。從定義中可以看出應用交付的宗旨是保證企業關鍵業務的可靠性、可用性與安全性。

  采用負載均衡方案後,可實現支持海量並發訪問、高可用、高擴展性與管理特性、高可靠性、智能負載、高伸縮性、安全性等多種優勢集一身,可以較低成本解決較多瞬間高流量壓力。

  應用交付一方面能夠在用戶與應用之間建立一條快速、安全、穩定的訪問通道,能保證眾多的用戶對應用系統的訪問的穩定性的同時,還能夠保證用戶對應用訪問的速度和安全性;另一方面,應用交付功能的復合和集中能夠減少的企業的硬件的采購維護成本,同時提高了企業應用系統的運行效率,提高客戶滿意度。

  其實對於12306網站而言,不止宕機一個問題存在,也同樣不止可以通過負載均衡及應用交付等設備進行解決,這裡僅僅只是挑選了其中一個問題點來進行說明,還有更多其它問題還需要相關人員進行分析處理,在這裡就不做過多的討論了。

  黑客攻擊

  分布式拒絕服務攻擊(DDoS)是目前黑客經常采用而難以防范的攻擊手段。它的英文全稱為Distributed Denial of Service。DDoS攻擊的主要目的是讓指定目標無法提供正常服務,甚至從互聯網上消失,是目前最強大、最難防御的攻擊之一。

  目前DDoS攻擊方式主要有三類,包括:

  第一類以力取勝,海量數據包從互聯網的各個角落蜂擁而來,堵塞IDC入口,讓各種強大的硬件防御系統、快速高效的應急流程無用武之地。這種類型的攻擊典型代表是ICMP Flood和UDP Flood,現在已不常見。

  第二類以巧取勝,靈動而難以察覺,每隔幾分鐘發一個包甚至只需要一個包,就可以讓豪華配置的服務器不再響應。這類攻擊主要是利用協議或者軟件的漏洞發起,例如Slowloris攻擊、Hash沖突攻擊等,需要特定環境機緣巧合下才能出現。

  第三類是上述兩種的混合,輕靈渾厚兼而有之,既利用了協議、系統的缺陷,又具備了海量的流量,例如SYN Flood攻擊、DNS Query Flood攻擊,是當前的主流攻擊方式。

  目前對於DDoS攻擊,乃至其他類型的黑客攻擊, SonicWALL網絡安全設備能提供不錯的多核UTM(統一威脅管理)解決方案,它提供了企業級深度包檢測,並且不會明顯影響網絡吞吐量。可將強大的深度包檢測防火牆與多層保護技術和一套高可用性功能相結合,為在分布式網絡環境、校園網絡和數據中心進行企業級部署提供了大范圍的可擴展的解決方案。SonicWALL網絡安全設備克服了現有安全解決方案的各種局限性,它能實時地對每一個數據包執行整體掃描,以檢測當前出現的內部及外部威脅。NSA系列提供了入侵防御、惡意軟件保護以及應用智能、控制和可視化功能,同時提供了突破性性能。對於DDoS等黑客攻擊手段有著很好的防御效果。

  對於網絡突發問題,僅僅是解決還是不夠的,預防才是正道之途。構建數據容災備份系統,把發生網絡突發問題後的損失降到最低,不管具體是什麼突發問題,做好預案和備案最重要,以防止這種問題再次發生,或者再次發生後,也可以極為快速地去解決問題。總地來說,對網絡突發問題,主要的工作是幕後積累。台上十分鐘,台下十年功,沒有充分的資源准備,沒有足夠的應急演練,沒有豐富的處理經驗,網絡突發問題將是所有人的噩夢。

copyright © 萬盛學電腦網 all rights reserved