數(shù)據(jù)倉(cāng)庫(kù)在移動(dòng)通信企業(yè)經(jīng)營(yíng)分析系統(tǒng)中的應(yīng)用
4 經(jīng)營(yíng)分析系統(tǒng)中數(shù)據(jù)處理的實(shí)現(xiàn)
一般來(lái)說(shuō),在企業(yè)構(gòu)建分析型系統(tǒng)之前,都會(huì)已經(jīng)存在若干的業(yè)務(wù)系統(tǒng)。來(lái)自這些系統(tǒng)的數(shù)據(jù)代表了企業(yè)目前的業(yè)務(wù)狀況。這些數(shù)據(jù)一般是高粒度的,即達(dá)到非常細(xì)節(jié)的程度(例如移動(dòng)通信行業(yè)里面的詳細(xì)通話記錄等)。來(lái)自移動(dòng)業(yè)務(wù)系統(tǒng)的實(shí)時(shí)數(shù)據(jù)是企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的最重要的數(shù)據(jù)來(lái)源,但是,在這些數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,必須經(jīng)過(guò)抽取、轉(zhuǎn)換、加載等多個(gè)工序的處理。
典型的數(shù)據(jù)抽取接口包括數(shù)據(jù)庫(kù)接口和文件接口,對(duì)于不同的數(shù)據(jù)平臺(tái)、不同源數(shù)據(jù)形式、不同性能要求和業(yè)務(wù)量的源數(shù)據(jù)以及不同數(shù)據(jù)量的源數(shù)據(jù),采取不同的數(shù)據(jù)抽取接口。數(shù)據(jù)轉(zhuǎn)換是指從業(yè)務(wù)系統(tǒng)中抽取的源數(shù)據(jù)根據(jù)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)模型的要求,進(jìn)行數(shù)據(jù)的轉(zhuǎn)換、清洗、合并、拆分、匯總等處理,保證來(lái)自不同系統(tǒng)、不同格式的數(shù)據(jù)的一致性和完整性。數(shù)據(jù)加載就是將從數(shù)據(jù)源系統(tǒng)中抽取轉(zhuǎn)換后的數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中。數(shù)據(jù)加載策略要考慮加載周期以及數(shù)據(jù)追加策略方面的問(wèn)題。
對(duì)于數(shù)據(jù)的抽取與轉(zhuǎn)換過(guò)程中發(fā)現(xiàn)的錯(cuò)誤數(shù)據(jù),在加載到數(shù)據(jù)倉(cāng)庫(kù)的同時(shí),打上錯(cuò)誤數(shù)據(jù)的標(biāo)簽,并結(jié)邏輯上集中存放。
目前,移動(dòng)通信行業(yè)已經(jīng)建立起自己的BOSS(Business Operation Support System)系統(tǒng),對(duì)自身的計(jì)費(fèi)系統(tǒng)和客戶服務(wù)系統(tǒng)等專業(yè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行了整合。這就是經(jīng)營(yíng)分析主要的數(shù)據(jù)源。
經(jīng)營(yíng)分析數(shù)據(jù)處理的意義在于通過(guò)處理,一方面提高數(shù)據(jù)的質(zhì)量;另一方面,使數(shù)據(jù)從適應(yīng)業(yè)務(wù)系統(tǒng)(OLTP)的數(shù)據(jù)模式轉(zhuǎn)換為適應(yīng)分析系統(tǒng)的數(shù)據(jù)模式。
5 經(jīng)營(yíng)分析系統(tǒng)中數(shù)據(jù)分析的實(shí)現(xiàn)
數(shù)據(jù)分析技術(shù)是建立在一定的數(shù)據(jù)基礎(chǔ)上的,進(jìn)行分析的方法通常包括:OLAP分析、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析、聯(lián)機(jī)挖掘(OLAM)等。需要說(shuō)明的是,數(shù)據(jù)分析技術(shù)不一定要建立在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上,但有了數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)分析的效率和能力將大大提高。
移動(dòng)通信企業(yè)經(jīng)營(yíng)分析系統(tǒng)分析部分的邏輯結(jié)構(gòu)主要分三部分:服務(wù)器,其中包括網(wǎng)絡(luò)應(yīng)用服務(wù)器與查詢服務(wù)器兩個(gè)模塊;以Client/Server方式的客戶端;以Web方式的客戶端。
網(wǎng)絡(luò)應(yīng)用服務(wù)器可以讓客戶在網(wǎng)上查詢、集中管理客戶、報(bào)表的安全性和可適應(yīng)得報(bào)表。查詢服務(wù)器按照預(yù)定時(shí)間自動(dòng)進(jìn)行查詢處理并通過(guò)E-mail、網(wǎng)絡(luò)、打印機(jī)和Web分發(fā)報(bào)表。
移動(dòng)通信企業(yè)經(jīng)營(yíng)分析系統(tǒng)的主界面顯示的是近一季度全公司各種業(yè)務(wù)的業(yè)績(jī)水平。具體的分析主題可以通過(guò)主界面進(jìn)行一些功能模塊選擇,主要分為長(zhǎng)話流向分析,時(shí)段分析,消費(fèi)水平分析3個(gè)功能模塊。
通過(guò)對(duì)各種角度的需求分析,總結(jié)分析內(nèi)容的一般細(xì)化方法。主題的劃分實(shí)際上與分析內(nèi)容的范圍直接相關(guān),主題劃分清楚后,下一步就是細(xì)化分析以及根據(jù)分析內(nèi)容的性質(zhì)確定它在數(shù)據(jù)倉(cāng)庫(kù)中的位置。通常維元素對(duì)應(yīng)分析角度,而度量對(duì)應(yīng)分析關(guān)心的具體指標(biāo),在數(shù)據(jù)倉(cāng)庫(kù)中體現(xiàn)在話費(fèi)數(shù)額,通話張數(shù),通話時(shí)長(zhǎng)等方面。一個(gè)指標(biāo)究竟是作為維元素、度量還是維屬性,取決于具體的業(yè)務(wù)需求,但從實(shí)際操作中可以總結(jié)出如下的概念性經(jīng)驗(yàn):作為維元素或維屬性的通常是離散型的數(shù)據(jù),只允許有限的取值;作為度量的是連續(xù)型數(shù)據(jù),取值無(wú)限。如果一定要用連續(xù)型數(shù)據(jù)作為維元素,則必須對(duì)其按取值進(jìn)行分段,以分段值作為實(shí)際的維元素,就像為了取消費(fèi)水平為維元素,就對(duì)客戶群的消費(fèi)水平進(jìn)行分段。判斷分析指標(biāo)是作為維元素還是維屬性時(shí),則需綜合考慮這個(gè)指標(biāo)占用的存儲(chǔ)空間與相關(guān)查詢的使用頻度。需要強(qiáng)調(diào)的是,在細(xì)化分析內(nèi)容的過(guò)程中,務(wù)必解決指標(biāo)的歧義問(wèn)題。在不同報(bào)表中以及在業(yè)務(wù)訪談中同一名稱的指標(biāo),是不是在同樣條件限定下,通過(guò)同樣方法提取或計(jì)算得到的,它們之間的相互關(guān)系是什么,這些問(wèn)題都必須從熟悉業(yè)務(wù)的分析人員那里得到準(zhǔn)確、清晰的答案,否則將影響到模型設(shè)計(jì)、數(shù)據(jù)提取、數(shù)據(jù)展現(xiàn)等多個(gè)方面。
6 結(jié)語(yǔ)
本文分析和探討了在移動(dòng)通信企業(yè)中建立基于數(shù)據(jù)倉(cāng)庫(kù)的經(jīng)營(yíng)分析系統(tǒng)的若干問(wèn)題,并進(jìn)行了相關(guān)的設(shè)計(jì)。但討論尚不全面,需要在工作中繼續(xù)研究。
移動(dòng)通信企業(yè)日益增多的信息數(shù)據(jù)無(wú)疑是一個(gè)巨大的聚寶盆,通過(guò)對(duì)數(shù)據(jù)的不斷分析研究,挖掘出更深層次的內(nèi)容找出更多有價(jià)值的規(guī)律,需要企業(yè)各層面的人員共同協(xié)作、長(zhǎng)期參與,而這給移動(dòng)通信企業(yè)帶來(lái)的效益也將是源源不斷的。
評(píng)論