音頻編碼和解碼原理
編碼器原始信號是5路,輸入通道是5個,經(jīng)過矩陣轉(zhuǎn)化處理后產(chǎn)生了7種聲音信號。應(yīng)當(dāng)設(shè)置通道選擇電路,它能夠根據(jù)需要,對7路信號進行合理的選擇處理。該處理過程決定于解矩陣的過程,以及傳輸通道的分配信息;合理的通道選擇,有利于減弱人為噪聲加工而引起的噪聲干擾。此外,還設(shè)置了多聲道預(yù)測計算電路,用于減少各通道間冗余度。在進行多聲道預(yù)測時,在傳輸通道內(nèi)的兼容信號LO、RO,可由MPEG-1數(shù)據(jù)計算出來。根據(jù)人耳生理聲學(xué)基
礎(chǔ),后級設(shè)置了動態(tài)串話電路,可在給定比特的情況下提高聲音質(zhì)量,或在要求聲音質(zhì)量的前提下降低比特率。但設(shè)置該電路增加了MPEG-2解碼器的復(fù)雜程度。
經(jīng)過編碼器產(chǎn)生了多種信息,主要有編碼取樣值,比例因子,比特分配數(shù)據(jù),動態(tài)串話模式,多聲道預(yù)測信息,通道預(yù)測選擇信號等,諸信息傳遞給復(fù)接成幀模塊電路,最后以MPEG-2比特流形式輸出壓縮編碼信號。
MPEG-2解碼器基本上是編碼器的逆過程,其電路結(jié)構(gòu)簡單一些,運算量小一些。解碼器的解碼轉(zhuǎn)換矩陣可輸出5路信號,再經(jīng)過32分頻子帶濾波器處理,可輸出LS、L、C、R、RS信號;另外,經(jīng)過量化、SCF和子帶濾波器處理后,還可以取得前置立體聲LO、RO,共計可輸出7路音頻信號。
2、MPEG-4音頻解碼
MPEG-4音頻編碼和MPEG-4視頻編碼一樣,具有許多特點和功能,例如可分級性,有限時間音頻流,音頻變化/時間尺度變化,可編輯性,延遲性等。它具優(yōu)越的交互性能和高壓縮比。它不僅利用分級方法可對語言和音樂進行編輯,也能解決合成語言和音樂問題,它將成為多媒體世界的一個主要格式,將成為“全能”的系統(tǒng)。
通過MPEG-4音頻編碼,可以存儲、傳送多種音頻內(nèi)容。它具有高質(zhì)量的音頻信號(單聲道、立體聲和多通道)。它采用低碼率編碼,而聲音重放質(zhì)量很高。它可以傳送寬帶語言信號(例如7KHz寬的語音),也可傳送窄帶寬語言信號(例如長途電話)??梢詡鬏?、制作可理解的各種語音信號。可以合成語言,例如進行音素或其它記號為基礎(chǔ)的文本轉(zhuǎn)換;也可以合成音頻,例如支持音樂描述語言。
四、杜比AC-3技術(shù)
1、什么是杜比AC-3
在杜比定向邏輯環(huán)繞聲技術(shù)的基礎(chǔ)上,于1990年杜比公司與日本先鋒公司合作,采用先進的數(shù)位壓縮技術(shù),推出新穎的全數(shù)字化杜比數(shù)碼環(huán)繞聲系統(tǒng)。它可使多聲道信號有更多的信息被壓縮到雙聲道中去,并將這種系統(tǒng)稱為AC-3。AC是英語“音頻感覺編碼系統(tǒng)”的縮寫詞。AC-3技術(shù)首先應(yīng)用到電影院,后來又進入普通家庭。
杜比AC-3系統(tǒng)設(shè)置完全獨立的6個聲道,即全頻帶的左、中、右、左環(huán)繞和右環(huán)繞聲道,再加上一個超重低音聲道。由于這樣聲道的結(jié)構(gòu),AC-3系統(tǒng)又稱為5.1聲道。
2、杜比AC-3的基本原理
(1)應(yīng)用聽覺掩蔽效應(yīng)開發(fā)出自適應(yīng)編碼系統(tǒng)
AC-3技術(shù)的理論基礎(chǔ),也是利用心理聲學(xué)中的聽覺閾值和掩蔽效應(yīng),但具體技術(shù)上與MPEG標(biāo)準又有所不同。
對音頻信號進行數(shù)據(jù)處理時,都要進行數(shù)據(jù)壓縮,將沒有用途或用途不大的數(shù)據(jù)信息忽略掉。為此,可以應(yīng)用聽覺閾值和掩蔽規(guī)律,省略掉那些多余的數(shù)據(jù)信息。杜比公司除運用上述聲學(xué)原理外,還運用了它擁有的杜比降噪技術(shù),開發(fā)出數(shù)碼化的“自適應(yīng)編碼”系統(tǒng)。這是一種極具選擇性和抑制噪聲能力的自適應(yīng)編碼體系。杜比公司依據(jù)音響心理學(xué)的基本原理,在未輸入音樂信號時,保持寧靜狀態(tài);當(dāng)輸入音樂信號時,對復(fù)雜的音頻信號進行分析和分解,用較強信號掩蔽噪聲,刪除聽覺界限以外,或由于頻率相近而音量小的信號,經(jīng)過這種處理方法,可以大大減少需要處理的數(shù)據(jù)信息。人耳的聽覺范圍是20Hz-20KHz,在如此寬闊的頻帶范圍內(nèi),人耳對不同頻率的聽覺靈敏度具有極大的差異。杜比AC-3根據(jù)這個特性,將各聲道的音響頻道劃分為許多大小不等的狹窄頻帶,各個子頻帶與人耳臨界頻帶的寬度相接近,保留有效的音頻,將不同的噪聲頻率緊跟每個聲道信號進行編碼,即編碼噪聲只能存在于編碼音頻信號的頻帶內(nèi)。這樣能夠更陡峭地濾除掉編碼噪聲,將頻帶內(nèi)多余信號和無音頻信號的編碼噪聲降低或除掉,而將有用的音頻信號保留下來。AC-3系統(tǒng)精確地運用了掩蔽效應(yīng)和“公用位元群”的設(shè)計方法,使數(shù)據(jù)壓縮效率大大提高,且具有很高水平的音質(zhì)。該系統(tǒng)的比特率是根據(jù)個別頻譜的需要,或者音源的動態(tài)狀況,再分配到每個窄頻段,它設(shè)計了內(nèi)置的聽覺掩蓋程序,可讓編碼器改變其頻率靈敏度和時間分解力,以確保有充足的比特被采用,掩蓋掉噪聲,而良好地記錄音樂信號。
為了高效地利用有限的信息傳輸介質(zhì)(光盤、膠片等),它在壓縮音頻信號時與其它壓縮系統(tǒng)一樣,利用人耳的聽覺特性,根據(jù)當(dāng)時的具體情況,將某些聲道的系數(shù)合并(這些聲道系數(shù)反映了那個頻帶的能量大小),以便提高壓縮率。并不是所有聲道都能進行這種合并。編碼器可根據(jù)各聲道的信息特征自動決定和調(diào)整,只有相似的聲道才能混合在一起,若壓縮比不要求很高時也不必合并。一般情況下,合并的起始頻率越高,音質(zhì)就越好,但要求數(shù)據(jù)傳輸速率也越高。當(dāng)取樣頻率為48KHz時,合并的起始頻率應(yīng)為3.42MHz;若取樣頻率為44.1KHz時,起始頻率應(yīng)為3.14MHz。若硬件和軟件搭配適當(dāng),AC-3的音質(zhì)可達到或接近CD唱片的水平。
(2)杜比AC-3解碼器簡易方框圖
AC-3解碼器輸入信號是一組頻譜信號,它是由時域信號PCM數(shù)據(jù)經(jīng)過時-頻變換而得到。該頻譜數(shù)據(jù)流分為指數(shù)部和尾數(shù)部兩部分,指數(shù)部分采用差分方式進行編碼,編碼后的指數(shù)代表了整個信號的頻譜,可作為頻譜包絡(luò)的參數(shù)。其尾數(shù)部分按照比特分配的結(jié)果進行量化。于是,量化尾數(shù)和頻譜包絡(luò)形成了AC-3碼流的主要信息,連同其它輔助信號(例如比特分配等)構(gòu)成了AC-3比特流。
圖2.3.4是AC-3系統(tǒng)的解碼方框圖,它是AC-3編碼的逆過程。AC-3比特流首先進入緩沖級,然后以幀為處理單元進行誤碼糾錯,經(jīng)糾錯處理后對比特流中的固定數(shù)據(jù)(指數(shù)數(shù)據(jù)、匹配系數(shù)、模式符號等)解碼,使數(shù)據(jù)比特流恢復(fù)為原來的比特分配。
評論