測試儀器解決無線網(wǎng)絡(luò)問題
1引言
蜂窩移動通信的網(wǎng)絡(luò)結(jié)構(gòu)大體可分為終端、基站、基站控制器和MSC幾大網(wǎng)元。它們之間的接口稱之為Um,Abits,A接口。任何一個網(wǎng)元或接口出現(xiàn)問題,都會導(dǎo)致無線網(wǎng)絡(luò)故障。各式各樣的天饋系統(tǒng)、直放站、塔放、五花八門的無線衰落環(huán)境、數(shù)量驚人的Abit2MB接口和CIC電路,以及眼花繚亂的手機終端等,使得查找無線網(wǎng)絡(luò)故障變得錯綜復(fù)雜。在這里,“準(zhǔn)確定位、迅速打擊”說的不是“外科手術(shù)式”軍事打擊,而是移動通信“特種兵”(運維和網(wǎng)絡(luò)優(yōu)化通信工程師)的夢想。本文將通過幾個實際案例來說明如何巧妙利用手頭的儀器來查找復(fù)雜的無線網(wǎng)絡(luò)問題。
2裝備
“工欲善其事,必先利其器”。對于運維和網(wǎng)絡(luò)優(yōu)化通信工程師來說,為了解決復(fù)雜的問題,必要的測試設(shè)備是必需的。下面的這些儀器是經(jīng)??赡苡玫降摹把b備”。
?。?)手機綜合測試儀RSCMU200。用于測試手機射頻和協(xié)議性能。能模擬基站,BSC,交換網(wǎng)元,可設(shè)置無線網(wǎng)絡(luò)參數(shù),支持GSM/(E)GPRS,CDMA/EV-DO,WCDMA/HSPA信令測試。
?。?)音頻分析儀RSUPV。用于測試手機的音頻性能。含GSM,WCDMA,CDMA手機音頻測試軟件,可以同時產(chǎn)生2路0~200kHz的單音或多音信號、同時分析2路0~250kHz的音頻信號,直接顯示音頻頻率,電平,THD,SINAD等指標(biāo)。
(3)手持式多功能頻譜儀RSFSH。用于頻譜、天饋線測試和干擾查找。支持的測試項目有VSWR測試,斷點測試,GSM,WCDMA,CDMA信道功率測試,頻譜分析,增益測試,干擾測試等。
(4)路測軟件RSROMES+掃頻儀RSTSMx。用于網(wǎng)絡(luò)覆蓋測試和干擾查找。可控制多臺測試手機和掃頻儀測試。支持 GSM/(E)GPRS,CDMA/EV-DO,WCDMA/HSPA網(wǎng)絡(luò),能直接輸出GSM同、鄰頻干擾小區(qū),GSM,CDMA,WCDMA遺漏鄰小區(qū),導(dǎo)頻污染數(shù),實時Layer3消息。
3實際案例
3.1案例1
?。?)問題:多臺GSM手機某日早上在本地開機后顯示“未注冊SIMCard”,而這些手機里的SIM開之前都能正常工作。把SIM卡換到別的手機后故障依舊,但讀卡器讀取SIMCard用戶信息正常。
?。?)分析:HLR遺漏IMSI信息,網(wǎng)絡(luò)阻斷,SIM卡問題,都會導(dǎo)致注冊失敗。查找該問題需要協(xié)調(diào)各個部門,且工作量很大。但我們巧妙地利用路測軟件ROMES和手機綜測儀CMU200,通過跟蹤手機的Layer3消息當(dāng)場就很快地找到了故障。
?。?)方法:把待測SIM卡放入受控于ROMES軟件的GSM測試手機中,在當(dāng)前網(wǎng)絡(luò)環(huán)境下開機、嘗試注冊,實時記錄測試手機注冊失敗的 Layer3消息(見圖1)。連接屏蔽箱和CMU200的射頻端口,測試手機放入屏蔽箱(見圖2)。設(shè)置CMU200工作在GSM900頻段,不鑒權(quán),參數(shù)為通用設(shè)置。開機,關(guān)上屏蔽箱,此時屏蔽箱中僅存在CMU200發(fā)射的信號,手機仍然無法注冊,狀態(tài)不變,因此可以排除Abits口以上設(shè)備或參數(shù)原因。使用標(biāo)準(zhǔn)測試卡更換原SIM卡后,重復(fù)相同操作,開機后成功注冊,ROMES實時記錄了測試手機的Layer3注冊消息(見圖3)。通常手機開機注冊的過程應(yīng)該是這樣的(見圖4):
圖1失敗的位置更新消息
圖2CMU200與屏蔽箱連接測試手機
圖3成功的位置更新消息
圖4GSM手機開機注冊流程
圖5音頻分析儀與CMU200配合測試手機音頻性能
圖6用ROMES加上TSMx來查找干擾
手機開機后首先搜尋上次關(guān)機SIM卡儲存的頻率,如果無法找到,會在整個支持的GSM頻段尋找電平最強的信號,鎖定頻率后,完成同步、接收系統(tǒng)消息。
隨后手機啟動IMSI配置程序,通知系統(tǒng)其進入激活狀態(tài)。
手機啟動IMSI程序有兩種方法:IMSI鑒別或TMSI和LAI鑒別。
當(dāng)手機首次啟用新SIM卡開機、手機轉(zhuǎn)移到了另外一個PLMN區(qū)、手機移動到了另外一個剛復(fù)位的VLR和VLR刪除了此手機數(shù)據(jù)的時候才會使用IMSI鑒別方式,即在注冊過程中需要手機把IMSI傳送給MSC。
其它情況時,應(yīng)該使用TMSI和LAI鑒別方法。即通過手機把上次通訊時記錄的TMSI和LAI發(fā)送到目的地VLR(即開機所在地VLR),目的地VLR 按照原LAI查詢到初始地VLR,通過初始地VLR按照原TMSI查詢到IMSI及鑒別組信息,目的地VLR使用此鑒別組向手機發(fā)送隨機號碼鑒別,如果手機響應(yīng)鑒別成功,目的地VLR按照得到的IMSI,向HLR申請得到用戶完整數(shù)據(jù),接著目的地VLR向手機發(fā)送認證確認消息,從而完成了注冊過程。
手機SIM卡把新的LAI記錄,之后即可提供通信服務(wù)。
對比正常和故障情況(見圖1,圖2,圖3),可以發(fā)現(xiàn):
正常情況下注冊是符合規(guī)范的。任何手機為了向系統(tǒng)通知其準(zhǔn)備激活,開機后的位置更新方式應(yīng)該采用“IMSI附著”的類型,手機鑒別的方式可按情況選用“TMSI和LAI”或“直接發(fā)送IMSI”的方式。為了保密,通常不采用“直接發(fā)送IMSI”的方式。
故障手機不但在開機后位置更新方式采用了“一般位置更新”類型,在手機鑒別方式上還選擇了“直接發(fā)送IMSI”的方式。通?!耙话阄恢酶隆鳖愋陀糜诳臻e手機從一個LAC區(qū)移動到另一個LAC區(qū)時的位置更新,僅作LAI的更新,不需要IMSI的認證。因此,當(dāng)手機開機后如果采用了此種方式,手機就不會發(fā)送 IMSI或TMSI,目的地VLR就沒有途徑得到手機的IMSI及鑒別組信息,既無法從HLR得到手機用戶完整數(shù)據(jù),也沒法向手機發(fā)出鑒別消息,因此目的地VLR只能通過MSC發(fā)出拒絕手機的位置更新申請的消息,拒絕的理由只是簡單地歸類為HLR查詢不到IMSI,導(dǎo)致手機出現(xiàn)“未注冊SIMCard”的現(xiàn)象。
什么導(dǎo)致了位置更新類型的變化?最值得懷疑的對象就是儲存著鑒別信息、存儲著決定位置更新類型的程序SIM卡。在更換了SIM卡后,注冊、通訊恢復(fù)正常。是何原因?qū)е铝嗽瓉鞸IM卡的設(shè)置改變?SIM卡實際就是一張存儲卡,存儲著手機正常通訊需要的程序及信息,其內(nèi)容在特定的條件下可讀、可寫。當(dāng)某個誘因出現(xiàn)時,就有可能誘發(fā)程序出錯。是否由于系統(tǒng)升級或開通了新的PLMN導(dǎo)致故障發(fā)生,需要進一步調(diào)查,但是最重要的是通過使用RS的無線儀表,在沒有查網(wǎng)絡(luò)端的前提下就準(zhǔn)確地完成了定位,迅速地解決了問題。
3.2案例2
(1)問題:某批用于EV-DORevA無線網(wǎng)絡(luò)的UIM卡插入AT后開機不能上網(wǎng)。
?。?)分析:HLR遺漏IMSI信息導(dǎo)致AT無法注冊,AT鑒權(quán)失敗,AN與AT參數(shù)協(xié)商失敗,UIM卡等問題,都會導(dǎo)致AT與AN不能建立會話連接——即不能上網(wǎng)。為了快速查找問題,我們使用了無線綜測儀CMU200。
?。?)方法:一般EV-DO的AT上網(wǎng)的流程為:AT在PRL上查詢是否支持EV-DO及EV-DO的優(yōu)先頻點。如果支持EV-DO,AT調(diào)整頻率到EV-DO的優(yōu)先頻點(一般為37),開始與AN作會話參數(shù)協(xié)商。如果會話協(xié)商成功,AN會分配一個惟一接入代號UATI給AT,AN也同時獲得了 AT提供的SessionSeed和ESN,為會話連接做準(zhǔn)備。AT發(fā)出會話連接申請,EV-DO的AAA鑒權(quán)服務(wù)器要求AT按照CHAP協(xié)議輸入用戶名和密碼,完成接入EV-DO網(wǎng)絡(luò)的鑒權(quán)。接著PDSN也會要求客戶按照CHAP協(xié)議輸入互聯(lián)網(wǎng)接入用戶名和密碼,完成上網(wǎng)鑒權(quán)。隨后建立PPP連接,實現(xiàn)上網(wǎng)功能。分析問題需要重現(xiàn)故障現(xiàn)象。由于待測試AT不能與ROMES相連,所以無法從AT端監(jiān)測。因此需要搭建一個測試環(huán)境,從AN側(cè)來確定問題所在。我們采用了案例1中的CMU200+屏蔽箱的方案。
在CMU200上設(shè)置AN的頻率為37,設(shè)置Subtype為2,支持EV-DORevA版本,下行功率-70dBm,AT開機后發(fā)現(xiàn)AT與CMU200(AN)不能完成會話協(xié)商。
CMU200側(cè)偵測到5個為一組的功率從低到高不斷循環(huán)的信號,與CMU200ProbesperSequence的定義值5相符合,因此認為這就是AT 發(fā)出的接入試探。由此判斷AT已正常發(fā)出無線信號,但是由于物理層承載的協(xié)議參數(shù)無法在AT與AN之間通過協(xié)商達成一致,導(dǎo)致了無法進入Session Open狀態(tài),從而無法建立會話連接。
進一步了解得知此批UIM只能用于指定區(qū)域的固定上網(wǎng)點,通過設(shè)置10位(16進制)的SectorID實現(xiàn)鎖定指定區(qū)域的目的。
按照ANSI41規(guī)范,SectorID為6位字長(16進制)。修改CMU200中的SectorID format為人工指定格式,并按照UIM廠商提供的信息輸入10位Sector ID后,AT與CMU200順利完成會話協(xié)商,成功連接。
到指定區(qū)域驗證,事實果然如此。
3.3案例3
(1)問題:經(jīng)常收到某區(qū)域的GSM客戶投訴:存在單通情況。
?。?)分析:由于單通現(xiàn)象出現(xiàn)的概率一般不高,如果需要重現(xiàn)故障、查找導(dǎo)致單通的原因需要耗費大量的人力、時間。無線鏈路上、下行不平衡,基站載波故障,基站基帶板件故障,BSC聲碼器故障,天饋線故障,無線干擾,基站Abits口存在環(huán)回,交換機的回音抑制器故障,BSC與MSC的A接口 CIC不對應(yīng)等都會引起單通現(xiàn)象。因此,一般從最簡單、最大可能性的測試做起,使用簡潔的方法,爭取用最少的時間、最少的人力解決問題。
?。?)方法
分析問題發(fā)現(xiàn),出現(xiàn)投訴的區(qū)域分屬不同的基站覆蓋區(qū)域,但是卻同屬一個BSC,因此某個基站的無線、硬件故障的可能性不大。因此,排查的主要對象落在了手機、區(qū)域干擾和BSC,MSC上。
最容易實施的是檢測投訴客戶手機。在此案例中,更換手機后測試多次仍然存在此故障,可確定不是手機原因。如果懷疑是手機引起的單通,則可以使用 RS的音頻分析儀UPV測試手機音頻收發(fā)電路。如圖5所示,在CMU200與手機建立連接后,運行UPV的手機音頻測試軟件,可以自動得到手機的音頻發(fā)送響度(SLR)、接收響度(RLR)及頻率響應(yīng)曲線等量化指標(biāo),從而驗證手機的音頻電路。
既然此案例已經(jīng)確定問題在無線網(wǎng)絡(luò),接著可以先查找是否存在區(qū)域干擾。使用ROMES軟件控制掃頻儀TSMx在問題區(qū)域查找是否存在同、鄰頻干擾(見圖6),查找結(jié)果為無干擾。
然后就需要作最耗費時間和精力的CIC測試。通常需要一個工程師從交換側(cè)把A接口鎖剩兩個CIC(保留1路控制信令鏈路),另外兩個射頻工程師負責(zé)撥號、接通、人工說話、人工接聽、人耳監(jiān)聽是否存在單通。如果存在單通,此時即可定位此兩個CIC存在問題,接著測試下兩個CIC,如此往復(fù),鎖定有問題的 CIC后即可排除故障。但是,CIC的數(shù)量非常龐大,并且為了不影響用戶使用,只能深夜進行,需要耗費非常多的時間和精力。
如果能巧妙利用ROMES路測軟件,就可以節(jié)省人力和時間。方法是:使用ROMES軟件控制兩臺測試手機,一臺測試手機A的麥克風(fēng)線路連接到了 PC的聲卡音頻輸出端,另一臺測試手機B耳機線路連接到了自帶小型功放的臺式音箱的音頻輸入端,PC循環(huán)播放一段音樂通過音頻線路送到A的音頻接收端,手機A受 ROMES控制,自動循環(huán)撥通B手機,呼叫經(jīng)過基站,然后到BSC,接著連接到交換機,交換機會分配鎖剩的兩個CIC與BSC連接,建立通話。音樂因此也送到了自動接聽的測試手機B的耳機線路上,同時也送到了音箱的音頻輸入端,這時音箱即會播放PC播放的音樂。工程師只需要聆聽音箱是否正常發(fā)聲,即可判斷此兩個CIC是否存在問題。如果正常,關(guān)閉這兩個CIC,打開下兩個CIC,繼續(xù)檢查。由此往復(fù),整個過程只需要一個工程師連續(xù)操作。交換工程師如果使用了一個自動鎖定、自動解鎖的程序,測試CIC效率更會得到極大的提高。
采用這一改進方法,只使用了約1h即找到了存在硬件故障的CIC電路,鎖定此CIC后順利解決了單通問題。
按照上述案例方法,還可舉一反三地變換出各種符合實際情況的測試方案。如果能巧妙利用測試儀表靈活、方便、多功能的特性,就可以幫助我們快速、準(zhǔn)確、有效地定位移動通信無線網(wǎng)絡(luò)故障、巧妙解決復(fù)雜網(wǎng)絡(luò)問題。
評論