基于DSP的聲控電子記事本系統(tǒng)
本文所介紹的聲控電子記事本系統(tǒng)將語(yǔ)音識(shí)別和語(yǔ)音編解碼在同一片DSP芯片上實(shí)現(xiàn),用語(yǔ)音方式代替其它方式進(jìn)行信息輸入,提高了系統(tǒng)的靈活性。
1 系統(tǒng)功能
可存200張語(yǔ)音名片,每張語(yǔ)音名片包含四條信息:姓名、電話號(hào)碼、工作單位、備注;聲控查找語(yǔ)音名片信息,用戶只需口述所要查找人的姓名,即可獲得電話號(hào)碼、工作單位、備注等信息,同時(shí)電話號(hào)碼顯示在液晶顯示屏上。
具有雙音多頻(DTMF)撥號(hào)功能,用戶用聲控查找到電話號(hào)碼并顯示在液晶屏上之后,只需輕觸一個(gè)撥號(hào)鍵,即可通過(guò)普通電話機(jī)的話筒實(shí)現(xiàn)快速自動(dòng)撥號(hào)。
數(shù)字錄音,每段錄音加語(yǔ)音標(biāo)識(shí);聲控放音,在放音時(shí)只需口述所要語(yǔ)音段的語(yǔ)音標(biāo)識(shí)即可自動(dòng)找到該段錄音并加放,累計(jì)錄音時(shí)間達(dá)兩個(gè)半小時(shí)以上。
具有方便的編輯功能,增加、刪除語(yǔ)音名片,增加、刪除數(shù)字錄音段。
2 系統(tǒng)構(gòu)成
本文所介紹的聲控電子記事本系統(tǒng),是在定點(diǎn)16位DSP芯片上實(shí)現(xiàn)的,它包含特定人孤立詞語(yǔ)音識(shí)別算法和代數(shù)碼本激勵(lì)線性預(yù)測(cè)(ACELP)語(yǔ)音編解碼算法數(shù)(MFCC)為語(yǔ)音特征、以動(dòng)態(tài)時(shí)間規(guī)劃(DTW)為模板匹配算法,對(duì)于普通詞條,識(shí)別率達(dá)到了99%以上。用于“錄音”功能的ACELP算法是該碼率下性能優(yōu)異的編解碼算法,雖然算法復(fù)雜度較高,但共重建語(yǔ)音質(zhì)量的平均主觀評(píng)測(cè)分?jǐn)?shù)(MOS分)達(dá)到了4.0,非常接近于壓縮前的分?jǐn)?shù)4.3。
如圖1所示,系統(tǒng)由MCU實(shí)現(xiàn)總線控制,接受外部鍵盤輸入,并在液晶屏上顯示信息。在本系統(tǒng)中,語(yǔ)音充當(dāng)大部分人機(jī)界面的角色,盡量省去復(fù)雜的鍵盤操作,而且用語(yǔ)音提示或語(yǔ)音回放代替一部門液晶文字提示。由于語(yǔ)音要經(jīng)過(guò)DSP處理,所以MCU需要與DSP經(jīng)常交換信息,以便實(shí)現(xiàn)友好的操作界面。
2.1 DSP
DSP(ADSP2185)是整個(gè)硬件系統(tǒng)的信號(hào)處理中心,完成語(yǔ)音識(shí)別、訓(xùn)練、編解碼,進(jìn)行片內(nèi)RAM及外部FLASH存儲(chǔ)芯片的數(shù)據(jù)管理與調(diào)度,并向主控芯片MCU提供簡(jiǎn)潔的命令與反饋信息。ADSP2185是Analog Devices公司的產(chǎn)品,其主要性能如下:
運(yùn)算速度為50MIPS,且均為高效的單周期指令。
提供了80Kbyte的片內(nèi)RAM,其中32Kbyte為數(shù)據(jù)RAM,48Kbyte為程序RAM。
最大可支持4Mbyte的外部存儲(chǔ)區(qū),用于存儲(chǔ)數(shù)據(jù)或程序。
提供對(duì)字節(jié)存儲(chǔ)區(qū)(BM)與片內(nèi)RAM區(qū)之間的DMA方式支持。
提供兩上可編程、全雙工、自動(dòng)進(jìn)行收發(fā)緩沖區(qū)操作的串行口。
2.2 MCU
MCU(KS57C2316)是SAMSUNG公司生產(chǎn)的性價(jià)比較高的一種CMOS四位單片機(jī),可以一次性編程,適于小批量生產(chǎn),被廣泛地應(yīng)用于家用電器的控制,它具有強(qiáng)大的I/O功能。其主要性能如下:
ROM為16K;8 bit;
RAM為512;4 bit
40個(gè)I/O引腳
多至16位數(shù)字LCD顯示 ——32個(gè)段,4個(gè)公共端引腳 這些性能保證了系統(tǒng)主控能力,而且能夠提供靈活的外部接口,適于做進(jìn)一步的改進(jìn)和改造。計(jì)算器等附加功能可以直接由MCU完成。
評(píng)論