多聲道數(shù)字音頻系統(tǒng)的編碼及應用
AAC可以支持1到48路之間任意數(shù)目的音頻聲道組合、包括15路低頻效果聲道、配音/多語聲聲道,以及15路數(shù)據(jù)。它可同時傳送16套節(jié)目,每套節(jié)目的音頻及數(shù)據(jù)結構可任意規(guī)定。在碼率為64kbps/聲道的條件下,AAC可以提供很高的聲音質量。
根據(jù)不同的應用場合,AAC提供了三種類型(Profile)以供選擇,即主要類型(MainProfile)、低復雜度類型(LowComplexityProfile)、可放縮采樣率類型(ScaleableSamplingRate,SSR Profile)。因而其可應用范圍很廣。
5.2AAC算法結構
為提高音頻編碼效率,AAC采用了許多先進技術,如霍夫曼編碼、相關立體聲、聲道耦合、反向自適應預測、時域噪聲整形、修正離散余弦變換(MDCT)、及混合濾波器組等。本文引用地址:http://www.ex-cimer.com/article/166943.htm
其中,濾波器組與MPEG層III所采用的濾波器組相比,由于層III算法在對濾波器進行選擇時考慮了兼容性問題,因而具有固有的結構上的不足;而AAC則直接采用了MDCT變換濾波。同時,AAC增加了窗口長度,由1152點增至2048,使MDCT的性能優(yōu)于原來的濾波器組。
時域噪聲整形(TNS)技術是時域/頻域編碼中一項新穎的技術。它利用頻域的自適應預測的結果來對時域中量化噪聲的分布進行整形處理。通過采用TNS技術,可以使特殊環(huán)境下的話音信號質量得到顯著的提高。
后向自適應預測是一項在語音信號編碼系統(tǒng)領域建立起來的技術。它主要利用了某一特定形式的音頻信號易于預測的特點。
在量化過程中,通過對量化精度更為精細的控制,可以使給定的碼率得到更加有效的利用。在碼流復接時,通過對必須傳輸?shù)男畔⑦M行熵編碼使冗余度降至最低。
通過以上各種編碼技術的運用以及采用一種可變的碼流結構,使AAC編碼算法在得到大大優(yōu)化的同時, 也為將來進一步提高編碼效率提供了可能性。
事實上,在AAC編碼的三種類型中,各種編碼技術的使用也是不同的,也就是說,三種類型的算法復雜度是不同的。這一不同考慮了編、解碼兩端的算法復雜度。例如,后向自適應預測約占解碼運算量的45%左右,在LC和SSR類型中都沒有采用這一技術。另外,在LC類型中,TNS濾波器的長度被限制為12個系數(shù),但仍保持了18KHz帶寬;在SSR類型中,TNS也只使用12個系數(shù),并且?guī)捪拗茷?KHz,同時該類型也沒有采用聲道耦合技術,在混合濾波器組的結構及增益控制方面也與另兩種類型不同。
AAC可以在低數(shù)據(jù)率的情況下提供較高質量的音頻信息,如每個聲道僅64kb/s時就會有比較好的性能。
AAC當前的應用主要用于日本的數(shù)字音頻廣播及美國的IBOC(帶內同頻技術)。
6、用于DTS的相干聲學編碼
DTS系統(tǒng)中采用的數(shù)字音頻壓縮算法――相干聲學編碼,主要目的就是用于提高民用音頻重放設備重放的音頻質量的,其音頻重放質量可以超越原有的如CD唱片的質量。同時通過更多揚聲器的使用,使得聽眾可以感受到普通立體聲無法達到的聲音效果。因此總體目標就是將聽眾真正的帶入專業(yè)的音響領 域及多聲道環(huán)繞聲的天地。
相干聲學編碼器是一種感知、優(yōu)化、差分子帶音頻編碼器,它使用了多種技術對音頻數(shù)據(jù)進行壓縮。下面將分別對其進行詳細的描述。從整體來看,編碼器與解碼器的實現(xiàn)是不對稱的。理論上編碼器可以設計的非常復雜,但實際上,編碼器
圖19相干聲學解碼器流程圖
第二步是通過在每個子帶中傳輸?shù)妮o助信息指令,對子帶中的差分信號進行反量化得到子帶PCM信號。這些通過反量化得到的子帶PCM信號再進行反濾波處理,得到每個聲道的全頻帶的時域PCM信號。在解碼器中,沒有程序用于音頻質量的調整。
在解碼器中包括一個可選的DSP功能模塊,這個模塊主要用于用戶的編程使用。它允許對單個聲道或全部聲道中子帶或是全頻帶PCM信號進行處理。這些功能諸如上矩陣變換、下矩陣變換、動態(tài)范圍控制以及聲道之間的延時調整等。
6.3
DTS系統(tǒng)最早是用于電影應用中的。在1993年的電影“JurassicPark”(侏羅紀公園)中,沒有使用AC-3,而是使用了DTS多聲道數(shù)字音頻系統(tǒng)。DTS系統(tǒng)中的音頻數(shù)據(jù)是存儲在一張CD-ROM上的,取代了將聲音記錄在膠片上的方式,而是在膠片上記錄用于同步CD-ROM音頻信息的時間碼,通過電影膠片上的時間碼來同步播放CD-ROM。由于CD-ROM與電影膠片磁跡相比,具有更大的容量和更穩(wěn)定的可靠程度,因此它可以在4:1壓縮比的情況下提供質量更高的多聲道音頻信息。對于AC-3來說,典型的壓縮比為12:1。隨著應用的普及,DTS系統(tǒng)又提出一種低數(shù)據(jù)率版本,其參數(shù)規(guī)范如下:
音頻聲道的個數(shù)DTS=1――10.1
FsDTS=8――192kHz
RDTS=16――24bit
BDTS=32――6144kb/s
數(shù)據(jù)幀大小DTS=512樣本
在低數(shù)據(jù)率版本中,由0到24kHz的32個子帶的頻率,通過一個512抽頭的多相正交鏡象濾波器(PQMF)來實現(xiàn)從時域到頻域的映射。另外8個附加的子帶覆蓋了24kHz到48kHz之間頻率范圍,2個附加的子帶覆蓋了48kHz到96kHz之間的頻率范圍。為了進一步減小冗余度,采用了前向自適應線性預測,同時心理聲學模型用來對信號進行預測,在量化過程中使用了標度量化和矢量量化。
DTS的大多數(shù)應用都是采用相對較小的壓縮比、工作在幾乎無損情況的模式下的。一般來說,數(shù)據(jù)率在1Mb/s的情況下,DTS可以提供較好質量的音頻。DTS的應用也主要是在電影、CD及DVD視頻中。另外,DTS所具有的可變比特率編碼方式使得它同樣可以應用于DAB及DVD的廣播中。
7、
數(shù)字音頻廣播系統(tǒng)的
評論