基于定點DSP處理芯片的語音信號的識別
3 語音識別的DSP實現(xiàn)技術
3.1 浮點運算的定點實現(xiàn)
在語音識別的算法中,有許多的浮點運算。用定點DSP來實現(xiàn)浮點運算是在編寫語音識別程序中需要首先解決的問題。這個問題可以通過數(shù)的定標方法來實現(xiàn)。數(shù)的定標就是決定小數(shù)點在定點數(shù)中的位置。Q表示法是一種常用的定標方法。其表示機制是:
設定點數(shù)是J,浮點數(shù)是)/,則Q法表示的定點數(shù)與浮點數(shù)的轉換關系為:
浮點數(shù))/轉換為定點數(shù)x:x= (int)y×2Q;
定點數(shù)z轉換為浮點數(shù)y:y =(float)x×2-Q。
3.2 數(shù)據(jù)精度的處理
用16b的定點DSP實現(xiàn)語音識別算法時,雖然程序的運行速度提高了,但是數(shù)據(jù)精度比較低。這可能由于中間過程的累計誤差而引起運算結果的不正確。為了提高數(shù)據(jù)的運算精度,在程序中采用了以下的處理方法:
(1)擴展精度
在精度要求比較高的地方,將計算的中間變量采用32b,甚至48b來表示。這樣,在指令條數(shù)增加不多的情況下卻使運算精度大大提高了。
(2)采用偽浮點法來表示浮點數(shù)
偽浮點法即用尾數(shù)+指數(shù)的方法來表示浮點數(shù)。這時,數(shù)據(jù)塊的尾數(shù)可以采用Q1.15數(shù)據(jù)格式,數(shù)據(jù)塊的指數(shù)相同。這種表示數(shù)據(jù)的方法有足夠大的數(shù)據(jù)范圍,可以完全滿足數(shù)據(jù)精度的要求,但是需要自己編寫一套指數(shù)和尾數(shù)運算庫,會額外增加程序的指令數(shù)和運算量,不利于實時實現(xiàn)。
以上兩種方法,都可以提高運算精度,但在實際操作時,要根據(jù)系統(tǒng)的要求和算法的復雜度,來權衡考慮。
3.3 變量的維護
在高級語言中,有全局變量與局部變量存儲的區(qū)別,但在DSP程序中,所有聲明的變量在鏈接時都會分給數(shù)據(jù)空間。所以如果按照高級語言那樣定義局部變量,就會浪費大量的DSP存儲空間,這對數(shù)據(jù)空間較為緊張的定點DSP來說,顯然是不合理的。為了節(jié)省存儲空間,在編寫DSP程序時,最好維護好一張變量表。每進入一個DSP子模塊時,不要急于分配新的局部變量,應優(yōu)先使用已分配但不用的變量。只有在不夠時才分配新的局部變量。
3.4 循環(huán)嵌套的處理
語音識別算法的實現(xiàn),有許多是在循環(huán)中實現(xiàn)的。對于循環(huán)的處理,需要注意以下幾個問題:
(1)ADSP2100系列DSP芯片中,循環(huán)嵌套最多不能超過4重,否則就會發(fā)生堆棧溢出,導致程序不能正確執(zhí)行。但在語音識別的DSP程序中,包括中斷在內(nèi)的嵌套程序往往超過4重。這時不能使用DSP提供的do…unTIl…指令,只能自己設計出一些循環(huán)變量,自己維護這些變量。由于這時沒有使用DSP的循環(huán)堆棧,所以也不會導致堆棧溢出。另外,如果采用jump指令從循環(huán)指令中跳出,則必須維護好PC,LOOP和CNTR三個堆棧的指針。
(2)盡量減少循環(huán)體內(nèi)的指令數(shù)。在多重循環(huán)的內(nèi)部,減少指令數(shù)有利于降低程序的執(zhí)行次數(shù)。這樣有利于減少程序的執(zhí)行時間、提高操作的實時性。
3.5 采用模塊化的程序設計方法
在語音識別算法的實現(xiàn)中,為了便于程序的設計和調試,采用了模塊化的程序設計方法。以語音識別的基本過程為依據(jù)進行模塊劃分,每個模塊再劃分為若干個子模塊,然后以模塊為單元進行編程和調試。在編寫程序之前,首先用高級語言對每個模塊進行算法仿真,在此基礎上再進行匯編程序的編寫。在調試時,可以采用高級語言與匯編語言對比的調試方式,這樣可以通過跟蹤高級語言與匯編語言的中間狀態(tài),來驗證匯編語言的正確性,并及時的發(fā)現(xiàn)和修改錯誤,縮短編程周期。另外,在程序的編寫過程中,應在關鍵的部分加上必要的注釋與說明,以增強程序的可讀性。
在總調時,需要在各模塊中設置好相應的人口參數(shù)與出口參數(shù),維護好堆棧指針與中間變量等。
3.6 利用C語言與匯編語言的混合編程
現(xiàn)在,大多數(shù)的DSP芯片都支持匯編語言與C或C++語言的混合編程,ADSP2181也不例外。用C語言開發(fā)DSP程序具有縮短開發(fā)周期、降低程序復雜度的優(yōu)點,但是,程序的執(zhí)行效率卻不高,會增加額外的機器周期,不利于程序的實時實現(xiàn)。為此,在用C語言編寫語音識別算法時,我們采用了定點化處理技術。ADSP2181是16位定點處理器,定點化處理應注意以下幾個問題:
(1)ADSP2181支持小數(shù)和整數(shù)兩種運算方式,在計算時應選擇小數(shù)方式,使計算結果的絕對值都小于1;
(2)用雙字定點運算庫代替C語言的浮點庫,提高運算精度;
(3)注意在每次乘加運算之后進行飽和操作,防止結果的上溢和下溢;
(4)循環(huán)處理后的一組數(shù)據(jù)可能有不同的指數(shù),要進行歸一化處理,以便后續(xù)定點操作對指數(shù)和尾數(shù)部分分別處理。
4 結 語
用定點DSP芯片構成的語音識別系統(tǒng)有著廣泛的應用前景,在編寫語音識別算法時,對其進行定點化處理以及一些原則和方法對其他類似的算法也有著現(xiàn)實指導意義。在實際應用中,應注意根據(jù)DSP芯片的特點,對算法進行優(yōu)化,使得DSP芯片的性能得到充分的發(fā)揮。本文引用地址:http://www.ex-cimer.com/article/151140.htm
評論