基于PXA255的VoIP語音傳輸系統(tǒng)研究
語音處理的音頻庫函數(shù)使用OSS(Open Sound System)。
嵌入式IP終端系統(tǒng)軟件界面采用QT/Embed編程。利用qte的界面編程輔助工具QT Designer能很方便地實(shí)現(xiàn)界面規(guī)劃布局。由于是可視化編程,能很好地控制界面布局、效果,操作方便。QT Designer生成的界面文件是以XML語言編寫的.ui文件,通過QT附帶的工具UIC,能讓*.ui文件生成*.h和*.cpp的文件格式。使用QTDesigner大大降低了編程的工作量,并且能得到所見即所得的圖形效果。
3 語音編解碼器選型
對語音信號(hào),有許多壓縮算法和標(biāo)準(zhǔn)。這些編碼算法可按照編碼系統(tǒng)碼率大小、輸入信號(hào)頻帶寬度、所采用的編碼技術(shù)等方面進(jìn)行分類。編碼系統(tǒng)優(yōu)劣的評(píng)價(jià)主要體現(xiàn)在編解碼系統(tǒng)的性能指標(biāo)上,一個(gè)編解碼器系統(tǒng)有輸出聲音的質(zhì)量、編碼速率、復(fù)雜度、遲延和容錯(cuò)性
等性能指標(biāo)。
(1)編碼速率。編碼速率指的是編碼器對輸入聲音經(jīng)過壓縮后每秒的比特?cái)?shù),即壓縮后的傳碼率。這是編碼系統(tǒng)的一個(gè)十分重要的指標(biāo)。降低比特率而維持較高的解碼聲音質(zhì)量,是語音和音頻信號(hào)壓縮編碼的主要任務(wù)和主要目標(biāo)。對電話級(jí)別的語音帶寬而言,通常認(rèn)為比特率超過16kb/s的為高速編碼,而速率在8~16kb/s范圍的為中速率編碼,速率在8kb/s以下的為低速率編碼。
(2)輸出聲音的質(zhì)量。輸出聲音的質(zhì)量是指經(jīng)過編碼系統(tǒng)再經(jīng)過接收方的解碼后恢復(fù)出的聲音質(zhì)量。衡量輸出聲音質(zhì)量主要有二個(gè)指標(biāo):客觀質(zhì)量和主觀質(zhì)量??陀^質(zhì)量法易測量,但往往不能精確反映語音質(zhì)量。由于聲音的最終接收者是人,所以主觀法更能反映聲音質(zhì)量的真正好壞,但它測試不易,費(fèi)時(shí)費(fèi)力。
(3)復(fù)雜度。在傳統(tǒng)電話應(yīng)用中,很少使用壓縮,是因?yàn)閴嚎s算法的復(fù)雜度太大,算法執(zhí)行時(shí)間長,算法的延遲也一起帶入到通信系統(tǒng)中。隨著技術(shù)的進(jìn)步,芯片處理速度越來越快。現(xiàn)在工程上一般采用單片數(shù)字信號(hào)處理器DSP芯片來實(shí)時(shí)實(shí)現(xiàn)語音編解碼。語音編解碼算法的復(fù)雜度可由算法所需的計(jì)算量、存儲(chǔ)量、硬件尺寸、消耗功率及價(jià)格來衡量。
(4)時(shí)延。時(shí)延指完成編解碼算法所需的時(shí)間。對于語音編解碼器來說,時(shí)延也是一個(gè)非常重要的指標(biāo),如果時(shí)延太大,聽起來很不舒服。對于時(shí)延,不同的應(yīng)用場合有不同規(guī)定,如對長話網(wǎng)不加回波抑制的單向編解碼時(shí)延不得大于10ms。對可視電話則放松到不超過500ms。對VOIP語音系統(tǒng)的時(shí)延要求不超過300ms。
(5)容錯(cuò)能力或魯棒性。容錯(cuò)能力指編解碼系統(tǒng)抗誤差、線路噪聲等各種干擾的能力。
表1對幾種編碼器的比特率、主觀平均意見分法(MOS)、復(fù)雜度(以G.711為基準(zhǔn))和時(shí)延(幀大小)做了比較。
本系統(tǒng)選用GSM 06.10語音標(biāo)準(zhǔn)算法,該算法在1988年被確定為數(shù)字移動(dòng)通信的語音編碼標(biāo)準(zhǔn),其編碼速率為13kb/s,算法簡單,運(yùn)算量小,語音質(zhì)量高,接近32kb/s的ADPCM(ITU-G.712)。
4 IP語音實(shí)時(shí)傳輸系統(tǒng)設(shè)計(jì)
本文采用Intel公司推出的PXA255處理器,該芯片專用于網(wǎng)絡(luò)和多媒體。其最高工作頻率可達(dá)400MHz,并帶內(nèi)存管理單元MMU和DSP協(xié)處理器,可方便與高清晰的彩色LCD接口,同時(shí)該芯片可擴(kuò)展連接AC97音頻芯片CS4201、高性能網(wǎng)絡(luò)接口芯片LANC9196,可方便移植嵌入式Linux和圖形界面等。
評(píng)論