基于ACELP語音編譯碼算法的軟件實現(xiàn)及應(yīng)用
摘要:文中針對Tetra通信系統(tǒng)中采用的ACELP算法,分析了該算法的基本原理,介紹了其算法基于VC++6.0的軟件實現(xiàn)過程,重點闡述了ACELP在網(wǎng)絡(luò)通信中的實現(xiàn)及應(yīng)用情況。
本文引用地址:http://www.ex-cimer.com/article/201610/306455.htm隨著通信技術(shù)的快速發(fā)展,語音編碼技術(shù)發(fā)展越來越迅速、應(yīng)用越來越廣泛。TETRA(Terrestrial Trunked Radio)集群通信系統(tǒng)是歐洲電信標(biāo)準(zhǔn)協(xié)會ETSI制定的數(shù)字集群移動通信標(biāo)準(zhǔn)。近幾年發(fā)展很快,其產(chǎn)品已被包括我國在內(nèi)的世界多個國家廣泛采用。TETRA承載的語音通信業(yè)務(wù)采用ACELP語音編碼算法,該算法是一種改進型的CELP,它繼承了傳統(tǒng)CELP的主要優(yōu)點,并克服了其缺點。傳統(tǒng)CELP用固定的隨機碼本來逼近語音信號的余量信號,缺乏靈活性,不能很好地控制碼本的頻域特性。ACELP采用代數(shù)碼本結(jié)構(gòu),不僅降低了碼本的存儲量和搜索量,還提供了頻域控制函數(shù),從而增強了碼本的靈活性和多樣性,能更好地逼近余量信號,保證了高質(zhì)量的語音服務(wù)。該算法占用帶寬較小,其編碼速率僅為4.567 kbps,同時編碼語音質(zhì)量高,特別適合多媒體語音通信使用。目前該算法已有許多在嵌入式系統(tǒng)中實現(xiàn)的方案,但由于編譯環(huán)境以及硬件條件的限制,應(yīng)用不夠靈活方便,因此本文基于Visual C++軟件編程技術(shù),采用服務(wù)器與客戶端網(wǎng)絡(luò)通信模式,在服務(wù)器端采用聲卡對語音信號進行實時AD采樣,對采樣數(shù)據(jù)進行ACELP語音編碼處理,并將編碼后數(shù)據(jù)通過網(wǎng)絡(luò)實時發(fā)送到客戶端;在客戶端實時接收服務(wù)器端發(fā)送的語音編碼數(shù)據(jù)并進行軟件譯碼處理,同時將譯碼后數(shù)據(jù)采用聲卡進行實時播放,從而實現(xiàn)基于ACELP算法的網(wǎng)絡(luò)語音通信。
1 ACELP語音編譯碼算法的基本原理
ACELP是一種改進的代數(shù)碼本激勵線性預(yù)測算法,該算法要求輸入語音信號為8 kHz采樣、16比特量化,信號以30 ms分幀,每一幀分為4個子幀,每個子幀7.5 ms,每幀數(shù)據(jù)編碼后為137比特,包括線性預(yù)測參數(shù)、基音延遲T、最佳碼本索引和最佳增益參數(shù)。編碼器原理框圖如圖1所示。
編碼過程主要由短時預(yù)測、長時線性預(yù)測、碼本搜素和增益計算等組成。其中短時預(yù)測提取聲道濾波器的LPC系數(shù)并進行插值和量化;長時線性預(yù)測通常分為開環(huán)基音分析和閉環(huán)基音分析兩步,開環(huán)基音分析每幀數(shù)據(jù)(30 ms)處理一次,采用自相關(guān)法估算基音周期,按較低基音延遲優(yōu)先的原則獲取基音周期的大致范圍,閉環(huán)基音分析基于子幀完成,每7.5 ms處理一次,以獲取基音周期的準(zhǔn)確值;碼本搜索和增益計算主要用于計算合適的碼本和增益,使重建語音的質(zhì)量具有更高的清晰度和自然度。
解碼過程就是將線性預(yù)測參數(shù)、基音延遲T、最佳碼本索引和最佳增益參數(shù)等各個編碼參數(shù)等從編碼比特流中提取出來,重構(gòu)輸出信號和各個濾波器,最后得到重構(gòu)語音。解碼過程以分幀為單位進行。首先將LSP矢量轉(zhuǎn)換為LP濾波器系數(shù),然后通過基音延時查找基音的整數(shù)和分?jǐn)?shù)分量,將激勵進行解碼,對解碼后的激勵信號通過后基音濾波器送入合成濾波器,得到合成信號。合成信號經(jīng)過共振峰后濾波器和增益放大單元控制得到語音信號。其ACELP解碼原理框圖如圖2所示。
2 ACELP語音編譯碼算法的軟件實現(xiàn)概述
根據(jù)ACELP語音編譯碼算法原理.本文基于VC++6.0軟件平臺,采用面向?qū)ο笏枷?,編制CTetra_ACELP_Cod類和CTetra_ACELP_Dec類分別實現(xiàn)語音信號編、譯碼。另外,本文采用動態(tài)鏈接庫方式對編譯碼類進行封裝,接口簡潔,使用方便。
2.1 CTetra_ACELP_Cod編碼類
該類為ACELP語音編碼類,主要實現(xiàn)對輸入該模塊的8 kHz采樣,16比特量化的語音樣點數(shù)據(jù)流進行編碼,類的主要函數(shù)定義如下:
其中Init(TETRA_ACELP_COD_PARAM*pCodParam)函數(shù)完成編碼模塊初始化工作,TETRA_ACELP_COD_PARAM結(jié)構(gòu)體參數(shù)實時存儲編碼過程中相關(guān)參數(shù)。void PreProcess(Word16 signal[],Word16 lg)函數(shù)完成待編碼語音信號幀的預(yù)處理。ACELPCod(Word16 signal[],Word16parm[],TETRA_ACELP_COD_PARAM*pCodParam)函數(shù)完成語音編碼處理,signal[]參數(shù)為待編碼的語音樣本幀數(shù)據(jù),parm[]為編碼后參數(shù)。Prm2 bi ts(Word16 prm[],Word16 bits[])函數(shù)實現(xiàn)編碼參數(shù)到比特流的轉(zhuǎn)化。
2.2 CTetra_ACELP_Dec編碼類
該類為ACELP語音譯碼類,主要實現(xiàn)對輸入該模塊編碼數(shù)據(jù)幀(137比特幀長)進行譯碼處理,輸出8KHz采樣,16比特量化的語音數(shù)據(jù)。類的主要函數(shù)定義如下:
其中Init(TETRA_ACELP_DEC_PARAM*pDecParam)函數(shù)完成譯碼模塊的初始化工作,TETRA_ACELP_DEC_PARAM結(jié)構(gòu)體參數(shù)實時存儲譯碼過程中相關(guān)參數(shù)。Bits2prm(Word16 bits[],Word16 prm[])函數(shù)實現(xiàn)137比特幀數(shù)據(jù)到ACELP編碼參數(shù)的轉(zhuǎn)化。ACELPDec(Word16 parm[],Word16 synth[],TETRA_ACELP_DEC_PARAM*pDecParam)函數(shù)完成編碼參數(shù)的譯碼處理。編碼參數(shù)通過ana數(shù)組返回。PostProcess(Word16 signal[],Word16 lg)對合成語音進行后處理工作。
2.3 動態(tài)鏈接庫封裝接口介紹
其中bits為137比特編碼比特幀,signal為240*16bits的語音樣點數(shù)據(jù),pCodParam和pDecParam為編、譯碼過程中的中間結(jié)構(gòu)體參量。
3 ACELP編譯碼算法在網(wǎng)絡(luò)通信中的應(yīng)用
采用網(wǎng)絡(luò)服務(wù)器、客戶端通信模式,將ACELP編譯碼模塊應(yīng)用到網(wǎng)絡(luò)語音通信中,最終實現(xiàn)了基于ACELP算法的網(wǎng)絡(luò)語音通信。具體通信過程為:服務(wù)器端采用聲卡以8 kHz采樣,16比特量化方式對語音信號進行實時采集,對采集到的語音信號每240樣點作為一幀送入ACELP編碼模塊進行壓縮編碼,壓縮后編碼數(shù)據(jù)幀長為137比特,每幀數(shù)據(jù)進一步封裝處理后通過網(wǎng)絡(luò)實時發(fā)送到客戶端。客戶端通過網(wǎng)絡(luò)實時接收服務(wù)器端編碼語音數(shù)據(jù)包,經(jīng)ACELP譯碼處理后實時發(fā)送到聲卡進行播放處理,從而實現(xiàn)網(wǎng)絡(luò)語音通信。
3.1 語音信號實時采集與播放技術(shù)實現(xiàn)
在語音信號實時采集與播放實現(xiàn)過程中,如何實現(xiàn)聲卡采集與播放數(shù)據(jù)的實時性、連續(xù)性和可靠性是軟件設(shè)計的關(guān)鍵所在。在本文軟件系統(tǒng)中,通過直接凋用Windows最底層波形音頻接口函數(shù),實現(xiàn)聲卡的編程控制,系統(tǒng)中采用了多線程多緩沖技術(shù),即在服務(wù)器端,聲卡采集與語音壓縮編碼使用不同的工作線程,同時給聲卡提供多個用于承載采集數(shù)據(jù)的緩沖區(qū),在同一時刻部分緩沖區(qū)供聲卡采集線程裝載數(shù)據(jù)的同時,另外已經(jīng)裝滿數(shù)據(jù)的緩沖區(qū)供語音壓縮數(shù)據(jù)處理線程處理,從而使得語音信號采集和壓縮編碼處理工作同時進行,有效保證了采集數(shù)據(jù)的連續(xù)性和信號處理的實時性。服務(wù)器端聲卡實時采集原理框圖如圖3所示。
3.2 網(wǎng)絡(luò)通信技術(shù)實現(xiàn)
軟件系統(tǒng)采用客戶/服務(wù)器模式和TCP/IP協(xié)議,利用Socket套接字編程技術(shù)實現(xiàn)數(shù)據(jù)接收與發(fā)送。其中數(shù)據(jù)接收模塊采用VC++的CSo cket類,具體通信過程為:1)程序啟動的時候在指定端口創(chuàng)建網(wǎng)絡(luò)監(jiān)聽套接字,用以監(jiān)聽客戶端的連接請求。2)當(dāng)有客戶請求連接時,創(chuàng)建接收套接字與客戶端建立連接。3)當(dāng)有數(shù)據(jù)需要接收時,CAcceptSocket響應(yīng)OnReceive消息,調(diào)用Receive函數(shù)從緩沖里獲取客戶端傳來的數(shù)據(jù),實時的交給ACELP譯碼線程進行譯碼還原處理。4)當(dāng)通信結(jié)束時,關(guān)閉監(jiān)聽套接字和接收套接字并釋放資源。數(shù)據(jù)發(fā)送接口采用SOCKET通信技術(shù),為了使系統(tǒng)在實時編碼處理的同時及時將編碼數(shù)據(jù)發(fā)送到服務(wù)器端,軟件采用多線程技術(shù);同時為了避免由于待發(fā)送數(shù)據(jù)流不均勻?qū)е碌臄?shù)據(jù)幀丟失等情況發(fā)生,系統(tǒng)采用了多緩沖機制。主程序編碼模塊將要發(fā)送的編碼數(shù)據(jù)源源不斷的向緩沖隊列中寫,同時發(fā)送線程不斷的檢測緩沖隊列中緩沖情況,當(dāng)有緩沖滿時及時進行發(fā)送。由于多線程與多緩沖機制的有效使用,使得網(wǎng)絡(luò)通信能夠?qū)崟r高效的運行。
3.3 系統(tǒng)情況介紹
該系統(tǒng)實現(xiàn)了基于ACELP算法的網(wǎng)絡(luò)語音通信,能夠?qū)νㄐ胚^程中的語音波形樣本數(shù)據(jù)、ACELP編碼數(shù)據(jù)等進行實時存儲和網(wǎng)絡(luò)發(fā)送,對通行過程中的波形進行實時顯示等。系統(tǒng)運行穩(wěn)定,延遲較小,語音通信質(zhì)量較好。圖4所示為本文設(shè)計的軟件系統(tǒng)運行截圖。
4 結(jié)束語
文中研究了TETRA系統(tǒng)采用的ACELP語音編譯碼算法,在此基礎(chǔ)上基于VC++編程技術(shù)實現(xiàn)ACELP編、譯碼軟件模塊,并采用動態(tài)鏈接庫對其進行封裝處理,接口簡單,使用方便。最后開發(fā)相應(yīng)系統(tǒng),實現(xiàn)了ACELP編譯碼算法在網(wǎng)絡(luò)語音通信中的應(yīng)用。經(jīng)實踐證明,ACELP算法編碼質(zhì)量高,性能優(yōu)異,具有較好的應(yīng)用價值。
評論