寬帶業務快速發展,給傳統電信業和IT業帶來了深刻的變革。多業務、多網絡的融合已經成為不可逆轉的趨勢。寬帶城域網作為城域網內的主要網絡實體將成為3G、NGN以及其它新興增值業務的承載平台。
3G、NGN這類實時的語音和視頻應用,要求城域網提供服務質量保證和類似於傳統電信技術99.999%的電信級網絡可靠性要求。同時,激烈的競爭也推動運營商向客戶提供類似SLA有服務質量保證的服務,網絡可靠性是其中的首要也是最重要的指標。通過提高網絡的可靠性,運營商可以通過提供差別化的服務,在運營商之間的競爭中占居有利的地位,進一步樹立和鞏固企業的品牌形象。
城域網路由器的可靠性體現在以下兩個方面,一個是設備層的可靠性,另一個是網絡層的可靠性。網絡可靠性是城域網路由器可靠性保障的一個重要內容,由於傳統的路由器協議收斂比較慢(IGP在秒級,BGP在分鐘級),不能滿足承載實時業務的需求。網絡可靠性也是城域網路由器新技術比較活躍的領域。
目前新出現的網絡層可靠性技術主要有IP路由快速收斂、端到端LSP備份、MPLS快速重路由、平穩重啟等。
IP路由快速收斂
IP動態路由是最基本的網絡層可靠性保障機制,是IP路由網絡與生俱來的功能。IP動態路由協議負責進行網絡層IP轉發路徑計算,在鏈路或者節點發生故障導致原數據轉發路徑中斷時,路由協議對數據轉發路徑進行動態重新計算,雖然各種路由協議通過采用不同的機制,其響應時間有差別,但是平均水平在秒一級。對於傳統IP業務這個恢復時間可以接受,但是對於承載實時業務等多業務的電信級IP網來說要求毫秒級恢復響應時間,傳統IP動態路由技術和這一要求有很大差距。
在傳統路由協議的基礎上,進行改進可以縮短IP路由協議的故障響應時間,這些措施主要是加快路由協議的收斂。加快路由協議收斂速度可以分為鏈路故障檢測、路由重計算、路由信息更新等幾個方面考慮。通過加快鏈路之間Hello消息的發送頻率,加快SPF計算速度和為路由更新消息設定高優先級,路由協議可以快速發現、處理故障,並且准確快速地進行路由更新,加快路由協議的收斂,通過優化IGP路由協議可以實現小於1s的收斂。
另一種加快路由協議收斂的方法是采用IGP和EGP對網絡進行合理的層次規劃,IGP進行域內設備的路由,EGP(BGP4)承載外部路由,兩種路由之間進行有效隔離,不相互進行重分配。IGP和BGP的合理分工,形成了一個層次化的路由結構,域內和域間路由協議的收斂相互獨立,互不影響,可以實現最快速度收斂。
LSP保護切換
保護切換是ITU-T采用的術語,保護切換技術對於提高MPLS網絡的可用性和穩定性具有關鍵意義。保護切換一般對受保護LSP路由的預計算和資源的預分配,所以可以保證在LSP連接失效或者中斷後可以快速重新獲得網絡資源。
目前技術的發展只可以支持對點到點LSP的保護切換,保護可以采用兩種方式:1+1保護和1:1保護。
1+1保護使用一條專用的備份LSP作為主LSP保護,在IngressLSR處,主LSP和備份LSP橋接在一起,主LSP上的流量復制到備份LSP上同時傳送到EgressLSR,EgressLSR根據故障指示參數的取值,選擇接收主備LSP上的流量。
1:1保護時也使用專用的備份LSP作為主LSP的保護,但是主備LSP不同時傳送相同的流量,備份LSP在主LSP工作正常的前提下可以傳送其它流量,流量的保護切換裁決在IngressLSR進行。
MPLS快速重路由(FRR)
為了滿足諸如像視頻會議電視這一類業務的實時應用,必須對這些流量提供類似於傳統SDHAPS毫秒級的LSP保護能力。
LSP保護切換技術,需要信令協議的介入,故障點到恢復點的故障指示信令傳遞引入了不必要的網絡恢復延時。MPLS快速重路由技術可以實現在沒有信令介入情況下,由故障檢測點直接對故障鏈路流量根據預先設定的保護路徑進行重定向,恢復點即為故障點。多數的快速重路由方案依賴預先建立的備份通道,當網絡恢復點檢測到網絡故障時,它要做的工作就是簡單地更新LSP交換表,使流量從故障端口的LSP切換到預先在正常端口建立的LSP內。
快速重路由的優勢除了可以提高保護恢復的速度外,通過有選擇的在網絡薄弱環節配置保護能力,避免了在可靠網絡重復保護、無謂消耗核心網絡資源。MPLS快速重路由技術提供50ms內的保護切換,可以作為SDHAPS保護機制的替代。
MPLS快速重路由采用如下配置過程:
首先,在LSP的入口處即LSR1,使用一條用戶命令激活MPLS保護切換功能;LSR1向LSP路徑上的所有LSR發送信令,每個LSR都計算出一條旁路下一跳LSR的備份LSP,LSP快速重路由配置即完成。當LSP路徑上的某個LSR檢測到下游故障時,由該LSR在本地將流量切換到備份 LSP內。
在IETF中有多種快速重路由的方案,主流的兩種保護方式為鏈路保護和節點保護,其解決問題的思路和復雜度各異,目前該技術還沒有形成正式的RFC.
平穩重啟(Gracefulrestart)
引起控制平面重啟的可能因素包括:軟件升級、軟件Bug或者硬件故障,無中斷重啟可以做到控制平面重啟時,數據平面無間斷轉發。但是如果控制平面故障,對等路由器將重新計算路由,旁路故障路由器,數據平面的不間斷轉發就沒有意義,而且故障路由會擴散到整個網絡范圍。在MPLSVPNPE路由器上如果發生這種情形,其結果是災難性的。
控制平面平穩重啟技術可以有效解決這個難題,采用該技術的路由器在控制平面發生故障時,可以通知鄰近路由器繼續使用原路徑進行數據轉發,同時重啟路由器重新和鄰近路由器建立路由狀態,保證在重啟過程中業務可用性,最小化單個設備重啟對整個網絡的影響。
在平穩重啟的過程中路由器不保存相關的協議狀態,所以引起的重啟軟件故障不會延續到重啟後。
平穩重啟是新特性,很多舊設備無法支持,所以可以在局部子網內支持該特性的設備上使用。
在網絡邊界,運營商邊界路由器面對眾多客戶,而且一般都沒有冗余措施,最適合使用平穩重啟技術。網絡核心一般都采用冗余路徑進行保護,而且帶業務重啟容易造成路由環,所以不建議在網絡核心采用平穩重啟技術。