朗谷數(shù)字音頻處理技術(shù)在音頻及網(wǎng)絡(luò)通訊領(lǐng)域的應(yīng)用
2008年12月15日出版的《第一財經(jīng)周刊》刊登了科爾尼資訊管理公司發(fā)布的2008年全球化城市指數(shù)的前60個城市,上海、北京、深圳入選其中,而07年有本暢銷書《世界是平的》,則把網(wǎng)絡(luò)通訊技術(shù)的變革視為使全球化的力量之一,統(tǒng)一通訊技術(shù)發(fā)展方向是IP將融合所有協(xié)議,AV將融合所有格式,互聯(lián)互通,開放式代替封閉式,技術(shù)越復(fù)雜就越要求用戶應(yīng)用上的簡單,而數(shù)字音頻處理技術(shù)則是網(wǎng)絡(luò)通訊中最基礎(chǔ)和最核心的技術(shù)之一,朗谷數(shù)字實驗室專注于此項技術(shù)的研發(fā)。
一、 與朗谷數(shù)字音頻處理技術(shù)關(guān)聯(lián)的基礎(chǔ)概念
歷史
回音消除已經(jīng)替代了早期的回音抑制,回音抑制最早始于20世紀(jì)50年代,在衛(wèi)星通訊環(huán)境中用來控制由于比較長的信號延時而聽到的回音。最早的回音消除理論在二十世紀(jì)六十年代在ATT貝爾實驗室中發(fā)展起來,但是直到20世紀(jì)70年代末,由于受到電子行業(yè)的技術(shù)能力限制,商用回音消除產(chǎn)品一直沒有取得太大的發(fā)展。
隨著DSP的飛速發(fā)展使得回音消除產(chǎn)品變得更小和更具有效費比。在20世紀(jì)九十年代,回音消除器不再作為一個獨立的設(shè)備,第一次被集成于語音網(wǎng)關(guān)中(加拿大北電公司DMS-250)。這個整合使得回音消除直接內(nèi)置于語音網(wǎng)關(guān)中,意味著回音消除器可以在通話過程中非??煽康乇婚_啟或者關(guān)閉,在語音通訊和數(shù)據(jù)通信中區(qū)分不同的干線組取得所需要的信號。
1、回聲與延時的關(guān)系
回聲和延時是兩個不同的概念,延時不會加重或者改變回聲的量值。聲音有一個遮掩效應(yīng),例如我們在山谷里那么清楚的聽到回聲的原因是因為聲音的傳遞時間長,聲音反射回來的時間就長,超過1秒甚至2秒,聲音的傳遞時間長了,聲音的遮掩效應(yīng)會失去,這樣人的耳朵就會感覺到聽到這個回聲,回聲是一直存在的,專門的研究機(jī)構(gòu)做過專門的測試,聲音的傳遞小于20毫秒左右的時候,遮掩效果發(fā)揮作用,人耳一般聽不出來,超過20毫秒以后遮掩效應(yīng)開始衰減,超過50毫秒,聲音的遮掩效應(yīng)就基本消失了,只要有微弱的回聲人耳就能聽得到。
2、回聲和數(shù)字延時及語音壓縮技術(shù)的關(guān)系
數(shù)字延時技術(shù)就是把線性的信號,語音信號從喇叭或者電話中傳出去前,經(jīng)過數(shù)字信號采樣處理會延遲一段時間,就使得回音回來延遲的更長,所以我們能夠聽到。而語言壓縮技術(shù)是對一段數(shù)字信號進(jìn)行采樣后壓縮,然后再把這個壓縮信號送出去,這一段數(shù)字信號一般是30毫秒,40毫秒左右,語音數(shù)據(jù)經(jīng)過拿出來做處理,處理之后,再送出去,這樣就增加了40毫秒的延時,導(dǎo)致的結(jié)果就是有回音回來被聽到。例如我們現(xiàn)在的電話網(wǎng)絡(luò)都采用用數(shù)字交換機(jī),而以前都是模擬交換機(jī),送出的都是模擬信號,這個信號是以光速傳遞的,所以在模擬交換機(jī)時代,打本地電話和長途電話感覺不到有回音,只有通過衛(wèi)星打國際電話的時候聽到有回音,因為延遲時間就變長了,那么打本地電話,電信號以光的速度傳遞,只有幾個毫秒,我們就聽不見感覺不到回音的存在,而現(xiàn)在的電話網(wǎng)絡(luò)全都用數(shù)字式的,它把電信號變成數(shù)字信號,而數(shù)字信號的處理,不是采一個數(shù)字就送出去,它是采集一段信號,可能是20毫秒40毫秒的信號進(jìn)來了,把它處理一下,然后送出去,這樣的數(shù)字處理的效率很高,把信號先壓縮以后,再送出去,結(jié)果就是效率更高,本來一根線只能送一路電話,現(xiàn)在可能送10個電話,但是提高效率的同時,增加了延時作為結(jié)果,這是就導(dǎo)致回音的出現(xiàn),例如我們打手機(jī)有回音,也是這種原因。
二、AEC(Adaptive Echo Control) 朗谷自適應(yīng)回聲消除回音器的原理
1、回聲消除原理
回音的產(chǎn)生既復(fù)雜也簡單,一般喇叭信號出來聲音它會傳遞到麥克風(fēng),這個傳遞過程本身從技術(shù)上講就有一個傳遞函數(shù),傳遞本身就已經(jīng)發(fā)生了一些變化,在傳遞過程中,高頻和低頻的傳遞系數(shù)是不一樣的,通常低頻傳遞的效率更高,高頻傳遞的效率低一點 。麥克風(fēng)跟喇叭的位置靠的越近,聲音傳遞的時間越短,稍微離的遠(yuǎn)一點,那么延遲的時間會多一點,即使聲音直接傳過去,信號就已經(jīng)有時間延時了,麥克風(fēng)位置的改變,回音也隨之改變,傳遞的聲音隨著距離位置的改變,它傳遞的時間也發(fā)生改變,接觸到信號也就改變了,但聲音除了這個直接信號以外,聲音在空間中它是往各個方向傳遞的,它會碰到墻壁、碰到天花板反射回來,然后反射到麥克風(fēng),有的反射到桌面然后到麥克風(fēng),各個情況都存在,所以這是一個很復(fù)雜的問題,所有的信號最終的結(jié)果是疊加在一起的,疊加的結(jié)果就是有的信號被增強(qiáng)了,有的信號被減弱了,各種各樣的都有,然后墻壁對聲音信號的反射也不一樣,高頻低頻都不一樣,所以結(jié)果是一個復(fù)雜的所有疊加的結(jié)果,有的早有的晚,有的強(qiáng)有的弱,朗谷做回音消除呢,就是把總的傳遞函數(shù)效果算出來,那么并不是簡單的說兩個信號一樣,這個你算出來的回音信號,跟送出去的參考信號,送到喇叭去的信號并不一樣,它已經(jīng)經(jīng)過了一些傳遞改變了,那么可能有些已經(jīng)延遲了100個毫秒,這是總的結(jié)果,回音消除的原理就是信號出去,然后麥克風(fēng)收的信號肯定是這些信號各種各樣的直接間接的傳遞,反射回來的信號疊加到一起,我們把這些傳遞函數(shù)計算出來,疊加結(jié)果計算出來,這樣就能得到一個回音信號和麥克風(fēng)信號,在理想條件下如果計算出來的和麥克風(fēng)信號一樣,就可以把回聲消除掉,如果計算出來的有誤差,那么就不可能消除干凈,這就是回聲消除的原理?;芈曄夹g(shù)后面還有很復(fù)雜的數(shù)學(xué)問題?;匾粝铍y的地方是變量太多,回音模型的改變回音的疊加的結(jié)果都要計算出來。另外還有采用回聲抑制進(jìn)行回聲處理的方法,即非線性的過度就是兩邊同時說話的時候,它分辯不出那個是回音信號,所以就cutoff,剪切掉拉,這是處理不當(dāng),也可以說是單工,就是因為線性的做的不夠好,還有回音,所以它就多切掉一點,回聲抑制就是這個道理。也就是回聲消除和回音抑制的不同。
2、回聲消除技術(shù)關(guān)鍵性技術(shù)指標(biāo)
1)ITU-T的G.167
這是國際電信聯(lián)盟有一個標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)要求任何回聲消除必須要做到降低45分貝以上,但是達(dá)到這個標(biāo)準(zhǔn)不是最好的,因為人還能聽到這個回聲,這個是最基本的標(biāo)準(zhǔn)。原則上麥克風(fēng)信號收的信號有一個電平,這個電平我們可以用分貝來標(biāo)示,如果這個信號的電平比如說是-3dB,如果你消除了30dB,那么結(jié)果就變成了-30Db,因為10分貝能量上是10倍,20個分貝就是100倍,人耳能聽到的聲音范圍值大約是100萬倍,所以人耳朵能聽到能量范圍值是60分貝左右,回聲處理要消除60分貝以上人耳才聽不出來,如果只消除30或者40分貝,能量降低到千分之一,萬分之一,雖然能量弱了很多,但還是能聽到。
朗谷的回聲消除技術(shù)通過線性和非線性的方法可以做到60個分貝甚至更高,可以達(dá)到非常優(yōu)秀的回聲消除的效果,人耳無法感受到回聲的存在。
2)回聲消除的帶寬:
窄帶模式頻率: 300Hz—3.4kHz
寬帶頻率模式: 50Hz—7kHz 應(yīng)用廠家ploycom/Cisco/skype
超寬帶模式:50Hz—14kHz,一般稱HD高清音頻模式
全音域模式:20Hz—20kHz
朗谷的回聲消除技術(shù)采用20Hz—20kHz的全音域模式
評論