定點DSP C55X實現(xiàn)浮點相關(guān)運算
引 言
本文引用地址:http://www.ex-cimer.com/article/80237.htmDSP結(jié)構(gòu)可以分為定點和浮點型兩種。其中,定點型DSP可以實現(xiàn)整數(shù)、小數(shù)和特定的指數(shù)運算,它具有運算速度快、占用資源少、成本低等特點;靈活地使用定點型DSP進行浮點運算能夠提高運算的效率。目前對定點DSP結(jié)構(gòu)支持下的浮點需求也在不斷增長,主要原因是:實現(xiàn)算法的代碼往往是采用C/C++編寫,如果其中有標準型的浮點數(shù)據(jù)處理,又必須采用定點DSP器件,那么就需要將浮點算法轉(zhuǎn)換成定點格式進行運算。同時,定點DSP結(jié)構(gòu)下的浮點運算有很強的可行性,因為C語言和匯編語言分別具有可移植性強和運算效率高的特點,因此在定點DSP中結(jié)合C語言和匯編語言的混合編程技術(shù)將大大提高編程的靈活度,以及運算速度。
大多數(shù)DSP的開發(fā)工具只是在C語言的基礎(chǔ)上支持標準的浮點運算,而定點DSP硬件一般都是面向定點的運算,不支持標準的浮點運算,缺乏硬件的支持極大地限制了浮點的應用,因而標準的浮點運算在實際定點DSP應用中并不多見。C5509是一款16位定點DSP。在本文中,對C5509輸入FTSK信號,用C語言和匯編語言混合編程的方式對輸入浮點型的FTSK信號進行相關(guān)運算,并輸出浮點運算結(jié)果。這種方法的特點是:在C語言中方便地進行數(shù)據(jù)格式轉(zhuǎn)化,在匯編語言中進行乘法和加法運算,既達到很高的運算精度,又極大地提高了運算效率。
1 定點DSP C語言開發(fā)環(huán)境中的浮點數(shù)據(jù)格式
在定點DSP中,整型數(shù)是用16位二進制格式來存儲的,但是DSP的C語言和匯編語言中定義的單精度浮點型數(shù)據(jù)都是標準C語言浮點表示格式。這種格式在C55X中,符合IEEE754標準。它定義了單精度32位和雙精度64位的格式。32位IEEE754單精度標準中,第一位是符號位,其后8位用來存放指數(shù),最后23位用來存放小數(shù)尾數(shù),如下:
在IEEE754單精度浮點標準中,明確包含了符號位,第32位用作符號位。尾數(shù)進行了歸一化,以產(chǎn)生一個1.f格式的數(shù),f是小數(shù)部分,占用分配的23位。因為規(guī)格化的數(shù)最左一位總是1,所以不需要存儲該位,在該格式中它是隱式的。這樣一個n位的尾數(shù)實際上存放了一個n+l位數(shù)。為使尾數(shù)規(guī)格化,指數(shù)被適當增減,來跟蹤規(guī)格化所需的左右移位數(shù)以及小數(shù)點。
最常用的是用8位指數(shù)表示0~255,即0
其中:s是符號位,0為正數(shù),1為負數(shù);e是指數(shù)位,無符號8位;f是尾數(shù)的小數(shù)部分,23位。
例如:IEEE754格式下浮點正數(shù)00110001001111l000000001000000000的十進制表示為:
2 相關(guān)運算的實現(xiàn)
2.1 數(shù)據(jù)提取方式
在本軟件設計中,F(xiàn)TSK輸入數(shù)據(jù)的頻率包含800Hz,1200Hz、1600Hz、2020Hz,通過相關(guān)運算提取800Hz信號。具體參數(shù)是:FTSK輸入數(shù)據(jù)的采樣率為8000Hz。相關(guān)運算輸入數(shù)據(jù):每次運算對輸入數(shù)據(jù)先提取l600個點,并分離出這些數(shù)據(jù)的最后40個點;然后對下一個輸入數(shù)據(jù)提取1600個點,并把剛才取的40個點加在這1600個點后面組成l640長度的數(shù)組,作為相關(guān)運算的輸入。這樣做的原因是,最大限度地消除每次提取的l600個點相鄰部分的影響,提高相關(guān)輸出的精準度。相關(guān)運算的輸入數(shù)據(jù)都為浮點型,而通過MATLAB仿真計算出來的系數(shù)也都為小于l的浮點數(shù)。通過在C語言中調(diào)用匯編語言,在定點C5509中實現(xiàn)此浮點運算,并輸出用800Hz相關(guān)運算提取出的波形。
2.2 C5509中實現(xiàn)浮點運算方法
此相關(guān)運算的輸人是浮點型數(shù)據(jù),相關(guān)系數(shù)是小于1的單精度浮點型數(shù)。對于定點DSP,由于不能直接進行浮點數(shù)的乘法運算,因此必須對輸入數(shù)據(jù)進行類型轉(zhuǎn)換。首先,相關(guān)運算的輸入數(shù)據(jù)是FTSK浮點數(shù)據(jù)。在C語言中,單精度浮點數(shù)據(jù)是以IEEE754標準存儲的32位數(shù)據(jù),而C5509中C語言調(diào)用匯編語言,是通過寄存器AR0從C語言傳遞給匯編語言的是數(shù)據(jù)指針,這個指針是指向16位數(shù)據(jù)的,所以相關(guān)的輸入32位浮點數(shù)要先轉(zhuǎn)化為16位整型數(shù)據(jù)。本文這樣實現(xiàn):C程序中先把浮點數(shù)據(jù)乘以10后(提高運算精度),強制類型轉(zhuǎn)化為整型數(shù)據(jù),然后把此16位數(shù)據(jù)的指針賦給調(diào)用匯編的入口參數(shù),即通過寄存器AR0傳遞到匯編程序中。然后,在匯編程序中,相關(guān)的系數(shù)是小于l的小數(shù);在DSP中,匯編語言直接定義的格式是將其轉(zhuǎn)換為16位二進制2的補碼表示形式(例如0.8用8×32 768/lO來表示)。從匯編程序入口進入的、經(jīng)過強制類型轉(zhuǎn)換的整型數(shù)據(jù)也是以16位二進制形式存儲的,通過與16位的小數(shù)相乘得到的是32位數(shù),存儲在累加器A中。其中,前16位是運算結(jié)果的整數(shù)部分,后16位是小數(shù)部分。由于從匯編語言程序返回C程序的參數(shù)是16位的,故取運算結(jié)果的高16位(此前已經(jīng)把輸入數(shù)據(jù)乘以lO,最大限度地提高了運算精度,這里直接取高16位)。把這16位數(shù)據(jù)返回C程序,得到整型數(shù)據(jù),再強制類型轉(zhuǎn)化為單精度浮點型數(shù)據(jù),再除以10,即得到了最后相關(guān)運算的結(jié)果。經(jīng)實際運算檢驗,通過這種方法在C5509里進行浮點運算,最終結(jié)果實現(xiàn)了很高的精度,而且通過調(diào)用匯編語言,極大地提高了運算的效率。
2.3 仿真
實際在用戶板上用TI公司提供的CCS Emulator調(diào)試程序,實現(xiàn)了硬件仿真;而對此DSP算法來說,也可用TI公司提供的軟件仿真器(Simulator)實現(xiàn)軟件仿真。
TI公司提供的軟件CCS中有一項強大的探測點功能。它是一個開發(fā)算法的工具,將計算機數(shù)據(jù)文件傳送到目標板或計算機的緩沖區(qū)中提供DSP軟件應用,而且可以通過CCS提供的圖形窗口觀察輸入/輸出數(shù)據(jù)波形。
本次算法設計中利用CCS的斷點和探測點進行數(shù)據(jù)的輸入,利用圖形窗口觀察輸入/輸出的波形。
2.4 實際運算的結(jié)果分析
從輸入波形可以看到,有4種不同的頻率,可以算出最低頻率是800 Hz,經(jīng)過800 Hz相關(guān)運算得出的輸入波形與輸出波形對比如圖1所示。
在圖l中,可以看到輸入波形中頻率最低的波形。2個波峰時間差(即周期)是0.0054-0.00416=0.00124s,取倒數(shù)是806.45,所以此波形是800Hz部分;再看輸出波形,4個尖峰正好分別對應輸入4個800 Hz頻率分量。如果在后面再加上低通濾波器。就可以濾出更平滑的曲線,如圖2所示。
2.5 測試程序運行時間
CCS中提供了~種評價器(profiler)。它通過收集在指定代碼區(qū)間程序執(zhí)行的統(tǒng)計性能,確定程序中各段所花費的處理器時間,從而識別并消除性能發(fā)揮的瓶頸,縮短程序的執(zhí)行時間,使程序更有效;利用評價器分析可以確定執(zhí)行某個特殊的函數(shù)花費了多少個時鐘周期,以及對它調(diào)用的頻繁度等。
本設計中相關(guān)浮點運算通過C語言編程和C、匯編語言混合編程兩種方式的對比,用CCS提供的評價器可以測出,調(diào)用匯編語言的方式比純C語言編程方式,速度提高了51.2%。
結(jié)語
在定點DSP中進行浮點運算,要經(jīng)過復雜的數(shù)據(jù)格式轉(zhuǎn)化,因此用定點DSP取代浮點DSP,在降低設備成本的情況下,必定會提高研發(fā)的成本。
如果直接把IEEE754標準的32位單精度浮點數(shù)據(jù)轉(zhuǎn)化為16位整型數(shù),要經(jīng)過相當復雜的過程,在滿足一定精度的前提下,可以使用本文的轉(zhuǎn)化方式。使用C語言和匯編語言混合編程的方法,達到了大大提高運算效率的目的,不失為很靈活的編程方法。
評論