基于FPGA的短幀Turbo譯碼器的實現(xiàn)
3.4 8狀態(tài)值最小值運算單元
由MAX-LOG-MAP算法可知,在進行前后向遞推歸一化處理和計算譯碼軟輸出時,均需要計算每一時刻8個狀態(tài)的最小值。為了減小計算延時,采用了8狀態(tài)值并行比較的結(jié)構(gòu),與串行的8狀態(tài)值比較結(jié)構(gòu)相比較,要少4級延時。實現(xiàn)結(jié)構(gòu)如圖4所示。

4 仿真結(jié)果
按照以上所分析的簡化譯碼算法、FPGA實現(xiàn)的相關(guān)參數(shù)和結(jié)構(gòu),整個譯碼采用Verilog HDL語言編程,以Xilinx ISE 7.1i、Modelsim SE 6.0為開發(fā)環(huán)境,選定Virtex4芯片xc4vlx40-12ff668進行設計與實現(xiàn)。整個譯碼器占用邏輯資源如表1所示。

MAX-LOG-MAP譯碼算法,幀長為128,迭代4次的情況下,MATLAB浮點算法和FPGA定點實現(xiàn)的譯碼性能比較如圖5所示。

由MAX-LOG-MAP算法的MATLAB浮點與FPGA定點的性能比較仿真結(jié)果可知,采用F(9,3)的定點量化標準,F(xiàn)PGA定點實現(xiàn)譯碼性能和理論的浮點仿真性能基本相近,并具有較好的譯碼性能。
綜上所述,在短幀情況下,MAX-LOG-MAP算法具有較好的譯碼性能,相對于MAP,LOG-MAP算法具有最低的硬件實現(xiàn)復雜度,并且Turbo碼譯碼延時也較小。所以,在特定的短幀通信系統(tǒng)中,如果采用Turbo碼作為信道編碼方案,MAX-LOG-MAP譯碼算法是硬件實現(xiàn)的最佳選擇。
Turbo碼常見的幾種譯碼算法中,MAP算法[1][3]具有最優(yōu)的譯碼性能。但因其運算過程中有較多的乘法和指數(shù)運算,硬件實現(xiàn)很困難。簡化的MAP譯碼算法是LOG-MAP算法和MAX-LOG-MAP算法,它們將大量的乘法和指數(shù)運算轉(zhuǎn)化成了加減、比較運算,大幅度降低了譯碼的復雜度,便于硬件實現(xiàn)。簡化算法中,LOG-MAP算法性能最接近MAP算法,MAX-LOG-MAP算法次之,但由于LOG-MAP算法后面的修正項需要一個查找表,增加了存儲器的使用。所以,大多數(shù)硬件實現(xiàn)時,在滿足系統(tǒng)性能要求的情況下,MAX-LOG-MAP算法是硬件實現(xiàn)的首選。通過仿真發(fā)現(xiàn),采用3GPP的編碼和交織方案[2],在短幀情況下,MAX-LOG-MAP算法同樣具有較好的譯碼性能。
如圖1所示,幀長為128,迭代6次,BER=10-5的數(shù)量級時, MAX-LOG-MAP算法的譯碼性能比MAP算法差大約0.6dB,比LOG-MAP算法差0.2dB左右。所以,本文采用3GPP的交織和(13,15)編碼方案,MAX-LOG-MAP譯碼算法進行短幀Turbo碼譯碼器的FPGA實現(xiàn)與設計。

2 MAX-LOG-MAP算法
為對MAP算法進行簡化,通常將運算轉(zhuǎn)換到對數(shù)域上進行,避免了MAP算法中的指數(shù)運算,同時,乘法運算變成了加法運算,而加法運算用雅可比公式簡化成MAX*運算[4]。
將運算轉(zhuǎn)化到正對數(shù)域進行運算,則MAX*可等效為:

按照簡化公式(3)對MAP譯碼算法[1][3]的分支轉(zhuǎn)移度量、前向遞推項、后向遞推項及譯碼軟輸出進行簡化。
分支轉(zhuǎn)移度量:

為防止迭代過程中數(shù)據(jù)溢出,對前后向遞推項(5)、(6)式進行歸一化處理:


評論