深度探討高清音頻IC設(shè)計(jì)難題
編碼流可使用DTS 5.1編碼器或杜比數(shù)字5.1編碼器,而編碼必須把數(shù)據(jù)以壓縮的格式傳送給一個(gè)兼容的音頻/視頻接收器(比如經(jīng)由S/PDIF電纜)。混合信號(hào)在發(fā)送給揚(yáng)聲器之前可能需要后處理功能,以補(bǔ)償聲音失配播放環(huán)境或各種不同的音頻不完整性。
圖2 5.1編碼系統(tǒng)
高清音頻IC的設(shè)計(jì)挑戰(zhàn)
在設(shè)計(jì)高清音頻IC時(shí),有若干因素需要考慮。高清音頻最重要的特性是數(shù)據(jù)流量,因?yàn)橄啾葌鹘y(tǒng)的音頻應(yīng)用,高清音頻數(shù)據(jù)流量大大提高。僅對(duì) I/O而言,這種數(shù)據(jù)流量在某些編解碼器就可能達(dá)到24.5Mb/s的輸入速率和在27.6Mb/s的輸出速率下達(dá)致每秒96kHz×8×24位的輸出。這就需要一種新的IC設(shè)計(jì)方案來(lái)確保這些挑戰(zhàn)得到解決,同時(shí)保證音頻的質(zhì)量。
另外,一些采樣頻率達(dá)192kHz、帶6個(gè)或8個(gè)聲道,并且運(yùn)算精度很高的無(wú)損音頻編解碼器,如DTS-HD主音頻或杜比TrueHD,它們的計(jì)算要求極高。如果不予以改進(jìn),單單一個(gè)編解碼器就可能消耗掉傳統(tǒng)DSP的全部MHz預(yù)算。
性能要求
如上所述,高清音頻實(shí)現(xiàn)方案(如藍(lán)光光盤應(yīng)用)的數(shù)據(jù)處理要求非常高。在如此高的數(shù)據(jù)率下,很多現(xiàn)有的單核DSP解決方案都無(wú)法保證高質(zhì)量的數(shù)據(jù)處理,故業(yè)界不少解決方案開始傾向于采用能夠滿足視頻結(jié)合音頻的處理開銷要求的雙內(nèi)核方案。
而且,在DSP解決方案的實(shí)現(xiàn)中,除了強(qiáng)制性及可選音頻編解碼器之外,還需要許多后處理功能,而這些后處理功能正是眾多實(shí)現(xiàn)方案的差異化因素。由于在處理最小的高清音頻編解碼器時(shí),許多單核DSP都會(huì)有過(guò)載的情況,所以幾乎沒(méi)有什么剩余能力可言,即便有,也差不多都是用于強(qiáng)制性后處理。
芯片尺寸/功耗考慮
由于制造商和設(shè)計(jì)人員不得不應(yīng)對(duì)挑戰(zhàn),把所有必要的處理功能全部塞入尺寸越來(lái)越小的芯片中,這使現(xiàn)有的芯片尺寸也面臨著巨大的壓力。采用多核解決方案雖然可以提供這些處理能力,但芯片尺寸、相應(yīng)的價(jià)格增加和驅(qū)動(dòng)子系統(tǒng)所需的電能之間的權(quán)衡都可能往往令人望而卻步。特別在滿足具有特殊功率和外形尺寸限制的高清設(shè)備(如便攜游戲機(jī))要求時(shí),這一點(diǎn)尤其關(guān)鍵。
即使對(duì)于非移動(dòng)設(shè)備,功耗也是一個(gè)重要的考慮因素,因?yàn)樗绊懙皆O(shè)備的散熱性能。較高的功耗可能需要某些冷卻手段,從而對(duì)產(chǎn)品的總體設(shè)計(jì)造成影響。
任務(wù)切換的存儲(chǔ)器交換
高清音頻系統(tǒng)中必須執(zhí)行大量并行任務(wù),故需要非常頻繁的存儲(chǔ)器交換。這些交換必然會(huì)致使存儲(chǔ)器帶寬過(guò)載,讓系統(tǒng)無(wú)法處理增加的總線流量,最終快速降低音質(zhì)。另外因?yàn)橹噶罴32捎?2位格式編寫,這又使得指令更大,指令間間隔更長(zhǎng),進(jìn)一步加劇數(shù)據(jù)過(guò)載問(wèn)題,而16位指令集可以減輕這種負(fù)載。在數(shù)據(jù)方面,某些高清音頻編解碼器需要100Kb以上的數(shù)據(jù)RAM外加相當(dāng)大的數(shù)據(jù)表,也就是強(qiáng)制要求利用存儲(chǔ)器交換以高效利用RAM存儲(chǔ)器。
慢速外部存儲(chǔ)器存取OUND-COLOR: rgb(255,255,255); orphans: 2; widows: 2; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px> 許多在DSP上運(yùn)行的音頻算法傳統(tǒng)上均以非序列(non-sequential)的方式對(duì)大容量緩存進(jìn)行存取。一般而言,這些緩存都太大,無(wú)法駐留在處理器的片上存儲(chǔ)器中,故它們必須置于速度較慢的外部存儲(chǔ)器中,如DDR SDRAM。另外,非序列存取也給維持高性能的目標(biāo)帶來(lái)一個(gè)挑戰(zhàn)。由于音頻解碼器常常與視頻解碼器爭(zhēng)奪數(shù)據(jù)總線吞吐量,故存儲(chǔ)器存取效率非常重要。要提供高質(zhì)量的音頻體驗(yàn),就必須解決這個(gè)難題以實(shí)現(xiàn)穩(wěn)定的性能。
解決難題
要解決影響高清音頻DSP領(lǐng)域的眾多問(wèn)題,需要一個(gè)基于功能強(qiáng)大的數(shù)字信號(hào)處理器的系統(tǒng),其中應(yīng)包括合適的軟件和外設(shè)。CEVA-HD-Audio就是這種高清音頻系統(tǒng)的實(shí)例,它是一個(gè)全面完善的單核DSP解決方案,能夠滿足最嚴(yán)苛的高清音頻使用案例的要求。
CEVA-HD-Audio是基于CEVA-TeakLite-III DSP內(nèi)核的系統(tǒng)。CEVA-TeakLite-III擁有本地32位處理能力和雙乘法累加(Multiply-Accumulate, MAC)架構(gòu),是需要先進(jìn)音頻標(biāo)準(zhǔn)的高清音頻應(yīng)用的理想DSP方案。另外,CEVA-TeakLite-III還具有良好平衡的10級(jí)管線,使其內(nèi)核在65nm工藝下的運(yùn)作頻率仍超過(guò)550MHz(在最差條件和工藝)。CEVA-HD-Audio集成了一個(gè)帶有32位寄存器文件、64位數(shù)據(jù)存儲(chǔ)帶寬、32×32位乘法器和自動(dòng)32位飽和的本地32位SIMD DSP處理器。CEVA-TeakLite-III還具有一個(gè)帶有完善MAC指令集的雙16×16 MAC,可實(shí)現(xiàn)語(yǔ)音/VoIP和全面的流處理位操作(bit-manipulation)功能,這對(duì)流處理十分有用。除了帶有多精度點(diǎn)的固有32位數(shù)據(jù)處理功能之外,單周期32位MAC單元還包括用于無(wú)損編解碼器的72位MAC累加,和獨(dú)特的單精度與雙精度FFT蝶形指令(butterfly instruction),以及一個(gè)2/4周期內(nèi)核。
圖3 CEVA TeakLite-III結(jié)構(gòu)框圖
CEVA-TeakLite-III架構(gòu)嵌入了CEVA-Quark指令集,是全面的獨(dú)立式嵌入緊湊型指令集架構(gòu)(ISA)。這種獨(dú)特的ISA旨在僅利用16位指令,減小芯片的尺寸和成本,同時(shí)降低功耗,減少存儲(chǔ)器存取次數(shù)。CEVA-Quark ISA是一套完整的指令,包括存儲(chǔ)器存取、算術(shù)與乘法運(yùn)算、邏輯、移位和流處理位操作指令以及控制操作。應(yīng)用程序開發(fā)人員還可以把CEVA-Quark指令與其他更先進(jìn)的CEVA-TeakLite-III指令相混合,無(wú)須切換到不同的運(yùn)作模式。這種組合特性可使代碼量減少4倍,周期數(shù)減少了近9倍。
利用單核實(shí)現(xiàn)高性能高清音頻
上面提到的處理效率,顯示CEVA-TeakLite-III能夠利用單核DSP,輕松提供完整的高清音頻支持。由于它擁有更小的存儲(chǔ)器,所以尺寸更小,性能更高,比市場(chǎng)上其他競(jìng)爭(zhēng)解決方案更為優(yōu)勝。單核實(shí)現(xiàn)方案也意味著不論從硬件還是軟件的角度來(lái)看,應(yīng)用開發(fā)和集成都更為容易。
評(píng)論