<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于虛擬環(huán)繞聲的音頻處理器設(shè)計完整方案

基于虛擬環(huán)繞聲的音頻處理器設(shè)計完整方案

作者：時間：2017-06-04 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

本文引用地址：http://www.ex-cimer.com/article/201706/348707.htm

一、應(yīng)用前景

虛擬環(huán)繞聲技術(shù)是區(qū)別于多通道環(huán)繞聲技術(shù)的另一類聲重放系統(tǒng)，它利用聲源到雙耳的傳遞函數(shù)(HRTF)通過雙耳(即空間兩點(diǎn))聲信號的傳輸與重放，實(shí)現(xiàn)聲音空間信息的傳輸與重放，這種系統(tǒng)只需兩路獨(dú)立的傳輸信號和重放揚(yáng)聲器(或耳機(jī)) ，因而在一些不便于安裝多通道放聲系統(tǒng)的環(huán)境下，對改善電視機(jī)、手機(jī)、MP3/MP4等等電子產(chǎn)品的音頻聲效有很大的幫助。

二、項目背景

虛擬聽覺空間（VAS）是一門新興的邊緣交叉學(xué)科，涉及聽覺心理學(xué)、聽覺生理學(xué)、多傳感器集成與融合、人工智能、并行計算和高性能計算機(jī)系統(tǒng)等多個研究領(lǐng)域。VAS有時也稱為虛擬聽覺顯示(Virtual Auditory Display)、三維聲再現(xiàn)系統(tǒng)(3D Sound Rendering/Reproducing System)、虛擬聲再現(xiàn)系統(tǒng)(Virtual Sound Rendering/Reproducing System)、空間聲音再現(xiàn)系統(tǒng)(Spatial Sound Rendering System)、虛擬空間/三維聽覺系統(tǒng)(Virtual Spatial/(3D)Auditory Systems)、聲音空間化系統(tǒng)(Sound Spatialization System )和雙耳技術(shù)(Binaural Technology)等，是通過對雙耳的聲音信號進(jìn)行撿拾、模擬和重放，讓傾聽者在虛擬環(huán)境中聽到的聲信號逼近在真實(shí)環(huán)境聲場中聽到的聲信號，因而在電影院、家庭影院中得到了很好的應(yīng)用。其中多通路環(huán)繞聲經(jīng)過許多年的發(fā)展，也獲得了很好的效果，也先后出現(xiàn)了5.1、6.1、7.1甚至10.2通路的環(huán)繞聲系統(tǒng)，而且5.1通路環(huán)繞聲系統(tǒng)也為國際電信聯(lián)盟(ITU)所推薦。

此外，為了適應(yīng)音頻的播放，特構(gòu)建了一款音頻DSP處理器以適應(yīng)本系統(tǒng)。

三、項目立意

在耳機(jī)聲源定位算法的框架上，采用MIT媒體實(shí)驗(yàn)室的KEMAR人工頭HRTF數(shù)據(jù)庫對3D虛擬環(huán)繞聲的濾波器設(shè)計進(jìn)行改進(jìn)；

改進(jìn)通用處理器體系結(jié)構(gòu)，移植適合于音頻處理DSP IP Core到FPGA上；

利用硬件描述語言直接實(shí)現(xiàn)算法，并與DSP IP Core進(jìn)行集成；

在FPGA平臺上進(jìn)行IP核的設(shè)計，在Xilinx的FPGA平臺上予以驗(yàn)證，并對功耗和時鐘進(jìn)行優(yōu)化

四、原理和技術(shù)特點(diǎn)

1．本系統(tǒng)由以下三大部分構(gòu)成：

A.虛擬環(huán)繞聲模塊；B.DSP處理器模塊(包括了音頻解碼，音效疊加等模塊)；C.音頻還原?？傮w框圖大致如圖1所示，

圖1系統(tǒng)總體框圖

DSP音頻處理器是本系統(tǒng)的核心，負(fù)責(zé)音頻解碼，信號疊加等處理。虛擬環(huán)繞聲模塊，負(fù)責(zé)針對音頻信號產(chǎn)生虛擬的環(huán)繞聲音頻效果。DAC負(fù)責(zé)還原出音頻信號。在這些基本功能的礎(chǔ)基上，實(shí)現(xiàn)諸如音頻檢索等新功能。

2. 虛擬環(huán)繞聲原理介紹

由于虛擬環(huán)繞是以人耳的聲源定位為基礎(chǔ)的，故在此主要對人耳的聲源定位予以介紹。心理聲學(xué)的基本要素是到達(dá)人耳的聲音的頻率、強(qiáng)度和譜結(jié)構(gòu)。以下將進(jìn)一步討論基于心理聲學(xué)的聲源定位、距離感知及包圍感等。

2. 1 人耳對聲源的定位

在自然聽音中，人的聽覺系統(tǒng)對聲源的定位取決于多個因素——雙耳接收到的信號差異用來決定聲源的水平位置，由外耳對高頻信號的反射所引起的耳郭效應(yīng)決定聲源的垂直位置，而人耳的某些心理聲學(xué)特性對于聲源的定位也起到很大的作用。

2.2 雙耳效應(yīng)

在自然聽音環(huán)境中，雙耳信號之間的差異對于聲源的定位是非常重要的。該因素可以在直達(dá)聲場的聽音環(huán)境中得到最好解釋，如圖2所示。

圖2 聲源S與鏡像聲源S′引入最大程度相似的雙耳因素

聲源位于水平面上，水平方位角為θ，與人頭中心的距離為r，到達(dá)左右耳的距離分別為SL和SR。由于SL>SR，聲音首先到達(dá)右耳，從而在到達(dá)雙耳的時間先后上形成時間差。這種時間差被定義為雙耳時間差（interaural time difference，ITD），它與聲源的水平方位角θ有關(guān)。當(dāng)θ = 0°時， = 0；當(dāng)θ = ±90°時，達(dá)到最大值，對一般人頭來說，為0.6～0.7ms 的數(shù)量級。

在低中頻（f 1.5kHz）情況下，雙耳時間差是定位的主要因素，這時對固定頻率的聲音，雙耳時間差與雙耳相位差是相對應(yīng)的。然而對于更高的頻率，雖然雙耳時間差的概念依然正確，但雙耳相位差的概念將變得模糊不清。以正弦聲音為例來進(jìn)行解釋，設(shè)雙耳時間差的最大值為Δt_max，則角頻率為ω的正弦聲音在左、右兩耳產(chǎn)生的相位差為ΔΦ = ωΔt_max?？梢钥闯?，當(dāng)ω較小時，聲音頻率較低，波長較長，由時間差所造成的相位差有確定的意義，雙耳可以根據(jù)它來判定聲源的方位；當(dāng)ω較大時，即聲音頻率較高、波長較短時，由時間差所形成的相位差數(shù)值將較大，甚至?xí)^180°，使人不能判斷是超前還是滯后，因而失去了作為聲源定位因素的意義。所以雙耳相位差只對低頻聲的方位判斷起主要作用，而雙耳時間差（嚴(yán)格說是群延時）則可作為1.5～4.0kHz的一個定位因素。

另外一方面，人頭對入射聲波起到了阻礙作用，導(dǎo)致了兩耳信號間的聲級差（interaural intensity difference，IID）。聲級差除與入射聲波的水平方位角有關(guān)外，還與入射聲波的頻率有關(guān)。在低頻時，聲音波長大于人頭尺寸，聲音可以繞射過人頭而使雙耳信號沒有明顯的聲級差。隨著頻率的增加，波長越來越短，頭部對聲波產(chǎn)生的阻礙越來越大，使得雙耳信號間的聲級差越來越明顯——這就是我們常說的人頭遮蔽效應(yīng)。對于1.5～4.0kHz的頻率范圍來說，聲級差和時間差是聲源定位的共同因素，而當(dāng)f > 5.0kHz時，雙耳聲級差是定位的主要因素，與時間差形成互補(bǔ)?？偟膩碚f，雙耳時間差和聲級差涵蓋了整個聲音頻率范圍。

但是如果只考慮雙耳時間差和聲級差兩個因素，還不足以完全解釋定位問題，其中最典型的問題就是前后鏡像聲源的定位。假設(shè)人頭是一個球體，不存在外耳，如圖3所示，水平方位角為θ的聲源和水平方位角為180°.θ的鏡像聲源在人耳處會產(chǎn)生相同的IID和ITD。對于實(shí)際的人頭來說，雖然IID和ITD不會完全相同，但是它們會在很大程度上相似。當(dāng)只考慮雙耳時間差和聲級差時，就會產(chǎn)生前后鏡像聲源的混淆，其實(shí)這只是空間錐形區(qū)域聲像混淆（cones of confusion）的一種特例。為了解決這個問題，就要依賴于其他的因素進(jìn)行聲源定位了。

圖3 空間錐形區(qū)域聲像混淆

2.3 耳郭效應(yīng)

在聽覺系統(tǒng)中用于對聲源進(jìn)行垂直定位的因素通常被認(rèn)為是“單耳信號”。耳郭具有不規(guī)則的形狀，形成一個共振腔。當(dāng)聲波到達(dá)耳郭時，一部分聲波直接進(jìn)入耳道，另一部分則經(jīng)過耳郭反射后才進(jìn)入耳道。由于聲音到達(dá)的方向不同，反射聲和直達(dá)聲之間強(qiáng)度比不僅發(fā)生變化，而且反射聲與直達(dá)聲之間在不同頻率上產(chǎn)生不同的時間差和相位差，使反射聲與直達(dá)聲在鼓膜處形成一種與聲源方向位置有關(guān)的頻譜特性，聽覺神經(jīng)據(jù)此判斷聲音的空間方向。耳郭效應(yīng)的本質(zhì)就是改變不同空間方向聲音的頻譜特性，也就是說人類聽覺系統(tǒng)功能上相當(dāng)于梳狀濾波器，將不同空間方向的聲音進(jìn)行不同的濾波。

頻譜特性的改變主要是針對于高頻信號，由于高頻信號波長短，經(jīng)耳郭折向耳道的各個反射波之間會出現(xiàn)同相相加、反相相減，甚至相互抵消的干涉現(xiàn)象，形成頻譜上的峰谷，也即耳郭對高頻聲波起到了梳狀濾波作用。

耳郭效應(yīng)對聲源的垂直定位起到很重要的作用。圖4顯示的是聲源位于中垂面，仰角φ分別為.10°、0°和10°在人頭模型上測得的耳郭響應(yīng)曲線。由圖可以看出，在高頻處響應(yīng)曲線變化比較大，因此可以對聲源進(jìn)行定位。例如對位于前后鏡像的聲源進(jìn)行定位時，雖然位于(r , θ , φ)的聲源和位于(r , 180°.θ , .φ)的鏡像聲源會在人耳處產(chǎn)生極相似的ITD和IID，但是可以通過耳郭效應(yīng)對聲源作精確定位。

圖4 人頭模型測量的耳郭效應(yīng)

耳郭效應(yīng)進(jìn)行聲音定位，主要是將每次接收到的聲音與過去存儲在大腦里的重復(fù)聲排列或梳狀波動記憶進(jìn)行比較，然后判斷定位。因每個人耳郭尺寸不同，所以每個人在大腦中存儲的記憶是不同的，這一點(diǎn)應(yīng)引起注意。

2.4 人頭轉(zhuǎn)動因素

如圖5所示在低頻或較差的聽音環(huán)境中，當(dāng)雙耳效應(yīng)和耳郭效應(yīng)對聲源的定位不能給出明確的信息時，聽音者會轉(zhuǎn)動頭部來消除不確定性。最經(jīng)常使用這種方法的情況是出現(xiàn)空間錐形區(qū)域聲像混淆現(xiàn)象時，因?yàn)檫@樣會造成不確定的雙耳效應(yīng)。

圖5 頭部轉(zhuǎn)動避免聲源位置前后混淆

2.5 優(yōu)先效應(yīng)

聲音的定位除了以上因素外還有其他因素。在混響環(huán)境中，優(yōu)先效應(yīng)起到重要作用。它是心理聲學(xué)的特性之一。所謂的優(yōu)先效應(yīng)是指當(dāng)同一聲源的直達(dá)聲和反射聲被人耳聽到時，聽音者會將聲源定位在直達(dá)聲傳來的方向上，因?yàn)橹边_(dá)聲會首先到達(dá)人耳處，即使反射聲的強(qiáng)度比直達(dá)聲高達(dá)10dB。因此，聲源可以在空間中進(jìn)行正確的定位，而與來自不同方向的反射聲無關(guān)。但是優(yōu)先效應(yīng)不會完全消除反射聲的影響。反射聲可以增加聲音的空間感和響度感。

當(dāng)優(yōu)先效應(yīng)用在混響環(huán)境中識別語音時，就產(chǎn)生了哈斯效應(yīng)（Haas effect）。哈斯觀察到，只要早期反射聲到達(dá)人耳足夠早就不會影響語音的識別，相反，由于增加了語音的強(qiáng)度，還會有利于語音的識別。而且哈斯發(fā)現(xiàn)，相對于音樂來說，語音對反射延時時間和混響的變化更為敏感。對于語言聲來說，只有滯后直達(dá)聲50ms以上的延遲聲才會對語音的識別造成影響。所以50ms被稱為哈斯效應(yīng)的最大延時量。在哈斯的平衡實(shí)驗(yàn)證明，當(dāng)延時為10～20ms時，先導(dǎo)聲會對滯后聲有最大程度的抑制。

以上說明，只是對虛擬環(huán)繞聲的簡單介紹，更詳細(xì)的介紹參見附見。

3.DSP音頻處理器結(jié)構(gòu)說明

由于本系統(tǒng)的音頻處理器主要以一款現(xiàn)在的音頻處理器為參考進(jìn)行開發(fā)，故對音頻處理器只作簡單說明。

如圖6所示

圖6 音頻DSP處理器結(jié)構(gòu)

圖示為一款商用DSP核的結(jié)構(gòu)，區(qū)別于普通MCU處理器的是其采用了典型的哈佛結(jié)構(gòu)，存儲部分配置了X，Y，XY等部分，以適合于音頻處理，至于數(shù)據(jù)通路和普通處理器相比區(qū)別不大，故考慮以移植為主。

五、實(shí)現(xiàn)目標(biāo)

利用數(shù)字信號處理技術(shù)對數(shù)字濾波器的設(shè)計進(jìn)行改進(jìn)，主要對傳遞函數(shù)零極點(diǎn)處理；

采用Matlab進(jìn)行原理性的仿真實(shí)驗(yàn)，驗(yàn)證濾波器效果和算法的正確性；

使用VerilogHDL硬件描述語言進(jìn)行電路建模，劃分好電路模塊，分模塊予以實(shí)現(xiàn)，最終實(shí)現(xiàn)整個IP核；

用ModelSim對IP Core進(jìn)行硬件仿真，驗(yàn)證電路的正確性以及是否具備優(yōu)化空間；

在Xilinx的Vertex系列或是Spartan系列FPGA上予以驗(yàn)證;

對整個3D虛擬環(huán)繞聲系統(tǒng)進(jìn)行主觀綜合評價。

六、預(yù)期成果

虛擬環(huán)繞聲的算法的verilog實(shí)現(xiàn)；

將虛擬環(huán)繞聲模塊加入DSP音頻處理器核，形成新的音頻處理器；

在Vertex系列FPGA實(shí)現(xiàn)最終處理器；

利用ARM或是其它MCU實(shí)現(xiàn)對音頻處理器控制，使之能播放音樂，并實(shí)虛擬環(huán)繞聲效果；

使播放器具有其它創(chuàng)新特性的功能(在項目完成過程中發(fā)掘)。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 虛擬環(huán)繞聲 音頻處理器 FPGA DSP音頻處理器

評論

相關(guān)推薦

視頻協(xié)議板-FPGA配置基于LatticeECP3的設(shè)計

設(shè)計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

LabVIEW FPGA 模塊簡介

視頻 NI LabVIEW FPGA | 2009-04-01

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

LatticeECP3設(shè)計的視頻協(xié)議板電路圖-FPGA配置

設(shè)計方案 LatticeECP3 設(shè)計視頻協(xié)議電路圖 -FPGA | 2011-06-27

高速ADC與內(nèi)置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng)新可編程解決方案

嵌入式系統(tǒng) iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

基于FPGA的數(shù)字信號處理--什么是定點(diǎn)數(shù)？

嵌入式系統(tǒng) FPGA 數(shù)字信號定點(diǎn)數(shù) | 2024-05-11

ALTERA的PCI_IP Core問答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

基于SD7502構(gòu)成的FPGA-ASK電路圖

設(shè)計方案基于 SD7502 構(gòu)成 FPGA-ASK 電路圖 | 2011-07-13

基于FPGA的可編程數(shù)字濾波器系統(tǒng)

資源下載 Max FPGA 可編程數(shù)字濾波器 | 2007-12-14

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統(tǒng) 萊迪思 FPGA 小型FPGA | 2024-07-23

LabVIEW 8.20技術(shù)資料大全簡介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

利用強(qiáng)大的軟件設(shè)計工具為FPGA開發(fā)者賦能

嵌入式系統(tǒng) 軟件設(shè)計工具 FPGA 萊迪思 | 2024-07-17

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

s3c2410+fpga 做視頻無線傳輸

herbertwj | 2004-08-15

Altera公司cyclone系列FPGA-1C6電路圖

設(shè)計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

3-DES算法的FPGA高速實(shí)現(xiàn)(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現(xiàn)創(chuàng)新

視頻 Altera FPGA ASIC | 2009-07-13

采用創(chuàng)新的FPGA 器件來實(shí)現(xiàn)更經(jīng)濟(jì)且更高能效的大模型推理解決方案

嵌入式系統(tǒng) Achronix FPGA | 2024-06-18

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

用C/C++語言開發(fā)大規(guī)模FPGA [轉(zhuǎn)載于www.fpga.com.cn]

xiaohua | 2002-09-24

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統(tǒng) 萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

實(shí)時的噪聲源定位系統(tǒng)

視頻 NI LabVIEW FPGA | 2009-03-25

Altera的FPGA下載常見問題經(jīng)驗(yàn)小結(jié)

資源下載 Altera FPGA 常見問題經(jīng)驗(yàn) | 2007-12-13

9種單片機(jī)常用的軟件架構(gòu)

嵌入式系統(tǒng) PCB FPGA 架構(gòu) | 2024-05-21

基于FPGA的鎖相環(huán)位同步提取電路

設(shè)計方案電子電路圖，F(xiàn)PGA 鎖相環(huán) | 2012-07-27

國產(chǎn)28納米FPGA流片

嵌入式系統(tǒng) FPGA EDA 芯片 | 2024-05-31

FPGA比單片機(jī)厲害嗎？

嵌入式系統(tǒng) FPGA 單片機(jī) | 2024-06-13

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

FPGA是實(shí)現(xiàn)敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統(tǒng) FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();