診治IP網(wǎng)絡(luò)故障解決方案
第二種方式是業(yè)務(wù)隨路檢測,直接對業(yè)務(wù)流進(jìn)行度量,典型代表是ITU-T Y.1731標(biāo)準(zhǔn)中定義的丟包統(tǒng)計(jì)功能,其原理簡單地說就是“包守恒”,體現(xiàn)在以下的公式:
接收報(bào)文數(shù)量 = 發(fā)送報(bào)文數(shù)量
具體實(shí)現(xiàn)上,發(fā)送方和接受方都對業(yè)務(wù)流進(jìn)行計(jì)數(shù)統(tǒng)計(jì),發(fā)送方定時(shí)將計(jì)數(shù)發(fā)送到接收方,由接收方進(jìn)行核對,核對出錯(cuò)即是故障發(fā)生。
第三種是業(yè)務(wù)分析。這種方式度量業(yè)務(wù)數(shù)據(jù),并和預(yù)定義的標(biāo)準(zhǔn)閾值進(jìn)行對比,如針對IPTV業(yè)務(wù),采用專用硬件掛接在設(shè)備端口上,直接度量網(wǎng)絡(luò)上IPTV流量的vMOS值等業(yè)務(wù)指標(biāo)。這種方式需要采用DPI等方式,對實(shí)際業(yè)務(wù)報(bào)文進(jìn)行采樣統(tǒng)計(jì)或深度解析,按照業(yè)務(wù)已經(jīng)定義的預(yù)期,分析其是否出現(xiàn)問題。該方式的優(yōu)點(diǎn)是真實(shí),缺點(diǎn)是設(shè)備部署和維護(hù)的成本高。
這三種方式不是非此即彼的關(guān)系,需要根據(jù)業(yè)務(wù)SLA目標(biāo),綜合采購、維護(hù)成本等因素進(jìn)行考慮和選擇。
另外,控制平面和轉(zhuǎn)發(fā)平面是互相有影響的,控制平面的運(yùn)行直接影響轉(zhuǎn)發(fā)平面的流量分布,可能會導(dǎo)致設(shè)備、鏈路的擁塞、故障等。因此,華為將控制平面與轉(zhuǎn)發(fā)平面的預(yù)期建立和現(xiàn)狀檢測進(jìn)行了綜合與疊加,提供“路徑+流量”的IP可視化方案,提供全面的故障監(jiān)控和定位能力。
針對告警多的問題,華為在與中國移動的告警優(yōu)化的合作中,通過對告警定義、告警級別的梳理,使城域網(wǎng)的日故障工單下降了50倍,每天的告警工單數(shù)量從500余條下降到10條左右,大大降低了工單處理的工作量。針對無告警的問題,如鏈路誤碼、鏈路閃斷、器件失效和路由錯(cuò)誤等常見疑難故障,以往需要幾小時(shí),甚至是幾天時(shí)間才能排查,通過華為IP可視化方案,內(nèi)部測試已經(jīng)可做到分鐘級的故障定位,該方案正在一些運(yùn)營商網(wǎng)絡(luò)上進(jìn)行試點(diǎn)運(yùn)行,已經(jīng)取得一定成效,為幫助運(yùn)營商降低維護(hù)難度,有效縮短故障恢復(fù)時(shí)長夯實(shí)了基礎(chǔ)。
評論