數(shù)字時(shí)代的模擬語(yǔ)音
數(shù)碼錄音和回放技術(shù)自1981年開(kāi)始引入消費(fèi)電子領(lǐng)域。自那以后,數(shù)字系統(tǒng)的能力不斷遭到質(zhì)疑,包括能否重現(xiàn)老唱片的細(xì)微差別和“特質(zhì)”,并捕捉高頻信號(hào)及相關(guān)背景,這對(duì)于希望完美欣賞音樂(lè)和電影的高保真愛(ài)好者來(lái)說(shuō)至關(guān)重要。
本文引用地址:http://www.ex-cimer.com/article/165592.htm從事數(shù)字音頻系統(tǒng)開(kāi)發(fā)的工程師所面臨的挑戰(zhàn)當(dāng)然還不止這些。最基本的,是如何在整個(gè)處理過(guò)程中獲得高質(zhì)量輸入。在早期的數(shù)字記錄階段,采樣率非常低;即便在今天,CD唱片速率也只能達(dá)到44.1KHz,與當(dāng)前直接數(shù)字流(DSD)等純數(shù)字格式所能實(shí)現(xiàn)的潛在采樣率相比,顯然要低得多。
雖然上世紀(jì)80和90年代“數(shù)字灌錄”的再版發(fā)行對(duì)CD的大面積普及有所幫助,但對(duì)于解決數(shù)字系統(tǒng)所面臨的復(fù)制問(wèn)題卻并無(wú)建樹(shù)。這些問(wèn)題中包括“預(yù)振鈴”:即回放系統(tǒng)中由于數(shù)字濾波器所引起的在第一個(gè)音符發(fā)出之前所能聽(tīng)到的回聲。
圖1:將數(shù)字信號(hào)轉(zhuǎn)換回模擬信號(hào)——更高的分辨率(更細(xì)的量化電平)和/或更快的采樣率將會(huì)減小量化誤差。時(shí)鐘抖動(dòng)則會(huì)引入額外的誤差。
抖動(dòng)是發(fā)燒友和專業(yè)人員都知道的存在于數(shù)字復(fù)制早期的另一個(gè)問(wèn)題。抖動(dòng)產(chǎn)生的原因有兩個(gè),一是由于用于定時(shí)音頻采樣的時(shí)鐘的隨機(jī)抖動(dòng),另一個(gè)則由電源電壓的不穩(wěn)定造成。在隨機(jī)采樣抖動(dòng)情況下,聽(tīng)眾聽(tīng)起來(lái)就好像是背景噪音,如果抖動(dòng)與音頻信號(hào)相關(guān)的話,其結(jié)果就像失真。圖1顯示由于時(shí)鐘問(wèn)題,平滑的模擬信號(hào)可能被過(guò)晚或過(guò)早采樣,不過(guò)這個(gè)問(wèn)題可以通過(guò)下面一些措施得以解決:
如今日益流行的MP3/MP4格式將原始音源中的低采樣率問(wèn)題與MP3/MP4格式中利用的數(shù)據(jù)壓縮技術(shù)中由于不良時(shí)鐘所引起的抖動(dòng)問(wèn)題混淆在了一起。換句話說(shuō),通過(guò)MP3/MP4壓縮技術(shù)后原始信號(hào)中更深層次的數(shù)據(jù)丟失了,因?yàn)樗鼈冃枰氖亲プ?ldquo;數(shù)據(jù)塊”,并放棄所有它們認(rèn)為無(wú)關(guān)緊要的部分,從而獲得更加緊湊的文件格式。
除抖動(dòng)引起的各種挑戰(zhàn)外,還存在不少其他方面的問(wèn)題,如低采樣率和壓縮率、早期的數(shù)字復(fù)制系統(tǒng)在采樣過(guò)程中遭遇的信噪比過(guò)低問(wèn)題,以及在復(fù)制過(guò)程中存在的總諧波失真(即THD)百分比過(guò)高等。
向超高音質(zhì)轉(zhuǎn)移
于本世紀(jì)初引入的DSD錄音格式,其設(shè)計(jì)初衷是為了解決對(duì)原始音源采樣率過(guò)低的問(wèn)題。DSD為原始信號(hào)提供了超高采樣率,但仍然解決不了音樂(lè)發(fā)燒友們?cè)谶M(jìn)行數(shù)字復(fù)制時(shí)所面臨的關(guān)鍵難題,它們包括前面所提到的預(yù)振鈴和抖動(dòng),以及后振鈴、相位延遲和傳輸頻帶衰減等。雖然超級(jí)音頻CD(SACD)格式保證了原始音源的質(zhì)量,但卻無(wú)法解決如何利用數(shù)字系統(tǒng)再現(xiàn)高品質(zhì)信號(hào)所引發(fā)的問(wèn)題。
正因如此,SACD格式從未真正騰飛,截至目前我們發(fā)現(xiàn),這種格式的發(fā)行量?jī)H為4,500-5,000左右,而采用MP3錄制格式的i-Tune銷量,僅僅在2008年一年就超過(guò)了50億。從這點(diǎn)來(lái)看,追求極致音質(zhì)的人,將不得不開(kāi)始慢慢返回模擬音源,重拾老唱片,去尋求更具深遠(yuǎn)意義的音頻體驗(yàn)。
混合信號(hào)單元:實(shí)現(xiàn)高質(zhì)量的關(guān)鍵
為了在數(shù)字環(huán)境中改善用來(lái)再現(xiàn)模擬聲音的電子設(shè)備質(zhì)量,音頻系統(tǒng)行業(yè)也采取了一些措施,包括引入ADC和DAC。但是,這畢竟不是直接手段,而且仍然需要考慮以下幾個(gè)方面:
1. DAC轉(zhuǎn)換過(guò)程中適度的音頻濾波
從上世紀(jì)80年代初的CD,直到今天的MP3等數(shù)字系統(tǒng),用戶所遭遇的主要難題之一,都是與DAC本身相關(guān)的數(shù)字濾波問(wèn)題。當(dāng)重建信號(hào)時(shí),DAC會(huì)引入一個(gè)誤差分量,從而破壞原始音源。
可以證明,上述問(wèn)題中最重要且最具破壞性的仍然是預(yù)振鈴問(wèn)題,即在聲音產(chǎn)生前就能夠聽(tīng)到回聲,這是DAC中FIR濾波器存在的基本問(wèn)題。在聲音還未發(fā)出之前就能夠聽(tīng)到,這不符合自然規(guī)律,因而聽(tīng)眾對(duì)此非常敏感——這也成為數(shù)字回放系統(tǒng)中的棘手問(wèn)題。傳統(tǒng)DAC中的濾波器包以前只關(guān)注與頻率響應(yīng)相關(guān)的控制問(wèn)題,而忽略了時(shí)域問(wèn)題。
預(yù)振鈴可以通過(guò)采用最小相位濾波器來(lái)解決,但是如果單獨(dú)應(yīng)用則會(huì)導(dǎo)致后振鈴(異常的余音)的增加,而且會(huì)導(dǎo)致信號(hào)群延遲失真的增大。但由于人們對(duì)后振鈴并不敏感,因?yàn)橛嘁艉突芈暠緛?lái)就是自然的事情,所以很顯然目標(biāo)仍然是減小各種失真。
圖2:先后使用各種不同的濾波器即可減小預(yù)振鈴以及其他數(shù)字失真的不良影響
通過(guò)提供寬范圍的濾波并一同使用各種濾波器,即可以解決上述的失真問(wèn)題(見(jiàn)圖2)。線性濾波器、非半帶濾波器,以及最小相移濾波器都可以使用。由于制造商和終端用戶可以改變這些濾波器的影響,故通過(guò)仔細(xì)選用濾波器并組合來(lái)適配音源信號(hào)的自然特性以及所聽(tīng)音頻的風(fēng)格,就有可能實(shí)現(xiàn)最佳的再現(xiàn)音質(zhì)。
2. 與聲音純度相匹配的動(dòng)態(tài)單元
歐勝公司提供的各種濾波器產(chǎn)品都與一個(gè)復(fù)雜的動(dòng)態(tài)單元匹配(DEM)過(guò)程相結(jié)合,后者可為多比特信號(hào)提供深入處理,從而將帶內(nèi)噪聲和失真降低到盡可能低的水平。
多比特信號(hào)可以被分解成一系列獨(dú)立的Δ/Σ調(diào)制信號(hào),在降低帶內(nèi)噪聲和失真之后,再重新把這些分解開(kāi)的信號(hào)組合到一起產(chǎn)生輸出信號(hào)。DEM過(guò)程中可以采用多通道方案,以確保Δ/Σ調(diào)制過(guò)程之后的信號(hào)中每個(gè)部分都具有最高的清晰度和保真度,這將在重現(xiàn)中實(shí)現(xiàn)盡可能最高的輸出信號(hào)質(zhì)量。
通過(guò)在DEM過(guò)程中采用多通道技術(shù),就有可能確保在低頻重現(xiàn)中極大減小誤差。此外,信號(hào)的線性度也得到了改善,原因是原始DAC信號(hào)的每個(gè)分量都呈現(xiàn)在為了實(shí)現(xiàn)最高保真度所進(jìn)行匹配過(guò)程的各階段中輸入和輸出的等效頻率上。
3. 多階超高性能的Σ/Δ架構(gòu)
實(shí)際上,高性能Σ/Δ架構(gòu)的重要性對(duì)于DAC單元的整體性能來(lái)說(shuō)怎么強(qiáng)調(diào)都不為過(guò)。
該Σ/Δ架構(gòu)負(fù)責(zé)接收輸入的數(shù)字信號(hào),并監(jiān)控輸出脈沖,當(dāng)輸入的二進(jìn)制信號(hào)與輸出的脈沖串之間出現(xiàn)差異時(shí),便生成一個(gè)誤差信號(hào)。隨后,其中的Σ單元開(kāi)始工作,將由Δ單元所提供的誤差信號(hào)加到結(jié)果中去,再提供給低通濾波器,該濾波器對(duì)模擬信號(hào)進(jìn)行細(xì)微的調(diào)整,來(lái)補(bǔ)償二進(jìn)制信號(hào)與脈沖串之間的差異,這樣做確保了最終結(jié)果中聲音的保真度和清晰度。
評(píng)論