小體積超低功耗語音喚醒耳機(jī)方案——帝思DSPG D4P
隨著AI的普及,越來越多人使用智能語音控制,從智能音箱慢慢開始延伸到智能耳機(jī)領(lǐng)域。目前市場的大部分耳機(jī)還是以手動(dòng)喚醒語音助手為主,主要問題還是在語音檢測方面功耗和開發(fā)難度問題,。本方案將為大家介紹一套開發(fā)難度小且功耗低的語音喚醒方案——DBMD4P + QCC3044,該方案在頭戴耳機(jī)和運(yùn)動(dòng)型耳機(jī)上都適用。
本文引用地址:http://www.ex-cimer.com/article/202205/434463.htm首先介紹一下這款DBMD4P的公司——DSP Group,它是家庭和辦公室的集成通信無線芯片產(chǎn)品全球領(lǐng)先的提供商。DSPg提供軟件半導(dǎo)體系統(tǒng)產(chǎn)品和參考設(shè)計(jì),使ODM、 DEM、 消費(fèi)電子產(chǎn)品制造商和服務(wù)提供商能夠經(jīng)濟(jì)高效地開發(fā),快速實(shí)現(xiàn)市場創(chuàng)收的新產(chǎn)品。該公司處于半導(dǎo)體創(chuàng)新的前沿并實(shí)現(xiàn)卓越運(yùn)營超過二十年,提供了一個(gè)廣泛的無線芯片集成組合DEC/ CAT-iq、DECT ULE、Wi - Fi、PSTN、BoneTone智能語音增強(qiáng)和噪聲消除器、視頻和VoIP技術(shù)。 DSPg使集成的聲音、音頻、視頻和數(shù)據(jù)連接不同消費(fèi)者和商業(yè)產(chǎn)品,包括連接多媒體屏幕、移動(dòng)設(shè)備、家庭安全自動(dòng)化、無線電話、網(wǎng)絡(luò)電話系統(tǒng)和家庭網(wǎng)關(guān)。利用行業(yè)領(lǐng)先的經(jīng)驗(yàn)和專業(yè)知識,DSPg集團(tuán)與CE制造商和服務(wù)提供商合作來塑造未來家庭和辦公室的集成通信。
DBMD系列憑著極高的性價(jià)比,至今已向全球提供超一億顆芯片,國內(nèi)外各大智能語音引擎(如谷歌,亞馬遜,思必馳,出門問問等)都已有成熟算法方案在DBMD系列芯片上運(yùn)行。從支持AI的TWS耳機(jī)到支持語音的智能家居,再到物聯(lián)網(wǎng),安防,手機(jī),平板電腦和筆記本電腦中,DSPg的身影無處不在。
其中DBMD4P是一款適用于電池供電設(shè)備(如手機(jī),IoT,可穿戴設(shè)備等)的超低功耗語音和傳感器數(shù)據(jù)處理器。這處理器可實(shí)現(xiàn)各種應(yīng)用,例如語音觸發(fā)(VT)、語音驗(yàn)證(VA)、語音命令(VC)、傳感器數(shù)據(jù)處理和均衡器功能。DBMD4P是基于TeakLite-III?DSP 架構(gòu)的處理器,具備與系統(tǒng)中其他設(shè)備(例如應(yīng)用處理器(AP),編解碼器,麥克風(fēng)和傳感器)進(jìn)行通信所需的接口(如TDM,I2c,SPI,Uart等),加上已有的成熟算法,可為客戶快速開發(fā)出想要的功能。
QCC3044大家應(yīng)該也很熟悉,這是高通推出的新一代雙聲道藍(lán)牙芯片,采用最新的BT5.2藍(lán)牙標(biāo)準(zhǔn),具備24bit DSP處理能力,這必然會(huì)帶有有高通優(yōu)秀的Aptx HD編碼。同時(shí)這款芯片內(nèi)置了flash,減少了外圍器件成本和采購flash的壓力。穩(wěn)定的平臺賦能,卓越的音樂品質(zhì),強(qiáng)悍的電源管理,豐富的功能接口和產(chǎn)業(yè)公認(rèn)的低功耗是這套方案的不二之選,搭配DSPg的芯片可謂強(qiáng)強(qiáng)聯(lián)合。
方案實(shí)現(xiàn)
D4p和QCC3044主要引腳連接
DBMD_INT:當(dāng)D4P檢測到有較大幅度聲音變化時(shí),就會(huì)啟動(dòng)識別引擎去識別這聲音是否為喚醒詞,如果識別是喚醒詞,就通過這個(gè)引腳把AP喚醒,再進(jìn)入語音傳輸模式(Audio Buffering)。
RSTN:該引腳為D4P的復(fù)位腳,在每次燒錄FW之前,都需要下拉該引腳一段時(shí)間。
WAKEUP:該引腳為AP喚醒D4P的引腳,當(dāng)D4P進(jìn)入Hibernate時(shí),只能通過該引腳喚醒。
SPI(或I2C、Uart):這組引腳用于AP與D4P之間的數(shù)據(jù)交互(如FW文件傳輸,配置和控制指令)。在D4P進(jìn)入語音傳輸模式時(shí)(Audio Buffering),AP會(huì)通過SPI(或I2C、Uart)讀取拾取的語音指令數(shù)據(jù)做進(jìn)一步的語音指令識別。
程序控制
先了解D4p的5種工作模式,如下圖:
Idle:Boot Firmware之后,系統(tǒng)會(huì)在idle模式,這個(gè)狀態(tài)主要用于配置參數(shù),為接下來的模式做準(zhǔn)備
Audio Buffering:該模式是將聲音都放到buffer中,讓AP去提取使用
Detection:在該模式下,系統(tǒng)用較低的功耗檢測環(huán)境聲音,當(dāng)有明顯聲音波動(dòng)時(shí),系統(tǒng)進(jìn)入語音識別狀態(tài),識別成功后,進(jìn)入聲音傳輸狀態(tài)
Sleep:該模式關(guān)閉ADC采集和處理, 保留與AP通訊能力
Hibernate:系統(tǒng)關(guān)閉處理功能,AP無法通訊,只有AP用IO喚醒才能恢復(fù)到Idle模式
Microphone:該模式用于debug,mic聲音數(shù)據(jù)直接通過uart輸出
根據(jù)這幾個(gè)模式,在QCC3044中加入對應(yīng)的處理
1)QCC3044開機(jī)時(shí),對D4P復(fù)位并燒錄FW文件(Idle模式)
2)配置D4P參數(shù),并進(jìn)入Sleep或Hibernate模式
3)QCC3044接收到用戶指示,喚醒并控制D4P開啟語音檢測模式(Detection模式)
4)D4P檢測喚醒詞,喚醒QCC3044做語音識別(Audio Buffering模式)
設(shè)計(jì)要點(diǎn)
1)Boot模式選擇:D4P支持多種boot模式,若需要獨(dú)立啟動(dòng)可從flash加載程序;若從AP加載程序,可從Uart、SPI或I2C選一種加載,方便不同主控端選擇。加載時(shí)芯片會(huì)自動(dòng)識別當(dāng)前通訊協(xié)議,從而自動(dòng)選擇對應(yīng)的通訊方式。大致流程如下:
2)Mic設(shè)計(jì):mic輸入是差分信號,所以振幅比較低,設(shè)計(jì)時(shí)需要將mic的線路平行并盡可能靠近。Mic到D4p之間需要保持相同的距離和相同的阻抗。Mic的濾波電容應(yīng)靠近mic,而其他部分則盡可能靠近D4p端。
3)實(shí)體mic之間的距離越大越好,這樣有助于算法做beam forming
4)Uart引腳需要預(yù)留出來,調(diào)算法和debug時(shí)候都需要用到
5)Reset引腳是必須要接上的,D4p每次燒Firmware之前都需要拉低reset一下
6)Uart通訊時(shí),D4p會(huì)自動(dòng)識別比特率,但在此之前需要發(fā)送16個(gè)0進(jìn)行同步
此外這個(gè)設(shè)計(jì)的連接方式同樣適用于其他藍(lán)牙、WiFi、ARM等應(yīng)用平臺。如要做通話降噪應(yīng)用,D4P也提供了I2S接口,可將處理后的音頻數(shù)據(jù)傳入AP端。
評論