如何提高城域網路由器網絡層可靠性
網絡可靠性是城域網路由器可靠性保障的一個重要內容,由于傳統(tǒng)的路由器協(xié)議收斂比較慢(IGP在秒級,BGP在分鐘級),不能滿足承載實時業(yè)務的需求。網絡可靠性也是城域網路由器新技術比較活躍的領域。
目前新出現(xiàn)的網絡層可靠性技術主要有IP路由快速收斂、端到端LSP備份、MPLS快速重路由、平穩(wěn)重啟、RPRIPS等。
IP路由快速收斂
IP動態(tài)路由是最基本的網絡層可靠性保障機制,是IP路由網絡與生俱來的功能。IP動態(tài)路由協(xié)議負責進行網絡層IP轉發(fā)路徑計算,在鏈路或者節(jié)點發(fā)生故障導致原數(shù)據轉發(fā)路徑中斷時,路由協(xié)議對數(shù)據轉發(fā)路徑進行動態(tài)重新計算,雖然各種路由協(xié)議通過采用不同的機制,其響應時間有差別,但是平均水平在秒一級。對于傳統(tǒng)IP業(yè)務這個恢復時間可以接受,但是對于承載實時業(yè)務等多業(yè)務的電信級IP網來說要求毫秒級恢復響應時間,傳統(tǒng)IP動態(tài)路由技術和這一要求有很大差距。
在傳統(tǒng)路由協(xié)議的基礎上,進行改進可以縮短IP路由協(xié)議的故障響應時間,這些措施主要是加快路由協(xié)議的收斂。加快路由協(xié)議收斂速度可以分為鏈路故障檢測、路由重計算、路由信息更新等幾個方面考慮。通過加快鏈路之間Hello消息的發(fā)送頻率,加快SPF計算速度和為路由更新消息設定高優(yōu)先級,路由協(xié)議可以快速發(fā)現(xiàn)、處理故障,并且準確快速地進行路由更新,加快路由協(xié)議的收斂,通過優(yōu)化IGP路由協(xié)議可以實現(xiàn)小于1s的收斂。
另一種加快路由協(xié)議收斂的方法是采用IGP和EGP對網絡進行合理的層次規(guī)劃,IGP進行域內設備的路由,EGP(BGP4)承載外部路由,兩種路由之間進行有效隔離,不相互進行重分配。IGP和BGP的合理分工,形成了一個層次化的路由結構,域內和域間路由協(xié)議的收斂相互獨立,互不影響,可以實現(xiàn)最快速度收斂。
LSP保護切換
保護切換是ITU-T采用的術語,保護切換技術對于提高MPLS網絡的可用性和穩(wěn)定性具有關鍵意義。保護切換一般對受保護LSP路由的預計算和資源的預分配,所以可以保證在LSP連接失效或者中斷后可以快速重新獲得網絡資源。
目前技術的發(fā)展只可以支持對點到點LSP的保護切換,保護可以采用兩種方式:1+1保護和1:1保護。
1+1保護使用一條專用的備份LSP作為主LSP保護,在IngressLSR處,主LSP和備份LSP橋接在一起,主LSP上的流量復制到備份LSP上同時傳送到EgressLSR,EgressLSR根據故障指示參數(shù)的取值,選擇接收主備LSP上的流量。
1:1保護時也使用專用的備份LSP作為主LSP的保護,但是主備LSP不同時傳送相同的流量,備份LSP在主LSP工作正常的前提下可以傳送其它流量,流量的保護切換裁決在IngressLSR進行。
MPLS快速重路由(FRR)
為了滿足諸如像視頻會議電視這一類業(yè)務的實時應用,必須對這些流量提供類似于傳統(tǒng)SDHAPS毫秒級的LSP保護能力。
LSP保護切換技術,需要信令協(xié)議的介入,故障點到恢復點的故障指示信令傳遞引入了不必要的網絡恢復延時。MPLS快速重路由技術可以實現(xiàn)在沒有信令介入情況下,由故障檢測點直接對故障鏈路流量根據預先設定的保護路徑進行重定向,恢復點即為故障點。多數(shù)的快速重路由方案依賴預先建立的備份通道,當網絡恢復點檢測到網絡故障時,它要做的工作就是簡單地更新LSP交換表,使流量從故障端口的LSP切換到預先在正常端口建立的LSP內。
快速重路由的優(yōu)勢除了可以提高保護恢復的速度外,通過有選擇的在網絡薄弱環(huán)節(jié)配置保護能力,避免了在可靠網絡重復保護、無謂消耗核心網絡資源。MPLS快速重路由技術提供50ms內的保護切換,可以作為SDHAPS保護機制的替代。
MPLS快速重路由采用如下配置過程:
首先,在LSP的入口處即LSR1,使用一條用戶命令激活MPLS保護切換功能;LSR1向LSP路徑上的所有LSR發(fā)送信令,每個LSR都計算出一條旁路下一跳LSR的備份LSP,LSP快速重路由配置即完成。當LSP路徑上的某個LSR檢測到下游故障時,由該LSR在本地將流量切換到備份LSP內。
在IETF中有多種快速重路由的方案,主流的兩種保護方式為鏈路保護和節(jié)點保護,其解決問題的思路和復雜度各異,目前該技術還沒有形成正式的RFC。
平穩(wěn)重啟(Gracefulrestart)
引起控制平面重啟的可能因素包括:軟件升級、軟件Bug或者硬件故障,無中斷重啟可以做到控制平面重啟時,數(shù)據平面無間斷轉發(fā)。但是如果控制平面故障,對等路由器將重新計算路由,旁路故障路由器,數(shù)據平面的不間斷轉發(fā)就沒有意義,而且故障路由會擴散到整個網絡范圍。在MPLSVPNPE路由器上如果發(fā)生這種情形,其結果是災難性的。
控制平面平穩(wěn)重啟技術可以有效解決這個難題,采用該技術的路由器在控制平面發(fā)生故障時,可以通知鄰近路由器繼續(xù)使用原路徑進行數(shù)據轉發(fā),同時重啟路由器重新和鄰近路由器建立路由狀態(tài),保證在重啟過程中業(yè)務可用性,最小化單個設備重啟對整個網絡的影響。
在平穩(wěn)重啟的過程中路由器不保存相關的協(xié)議狀態(tài),所以引起的重啟軟件故障不會延續(xù)到重啟后。
平穩(wěn)重啟是新特性,很多舊設備無法支持,所以可以在局部子網內支持該特性的設備上使用。
在網絡邊界,運營商邊界路由器面對眾多客戶,而且一般都沒有冗余措施,最適合使用平穩(wěn)重啟技術。網絡核心一般都采用冗余路徑進行保護,而且?guī)I(yè)務重啟容易造成路由環(huán),所以不建議在網絡核心采用平穩(wěn)重啟技術。
評論