采用可配置處理器技術(shù)構(gòu)建多發(fā)射向量DSP
DSP是進(jìn)行數(shù)字信號(hào)處理的絕好選擇,因?yàn)閿?shù)字信號(hào)處理器可以編程,并且在當(dāng)今數(shù)字媒體處理飛速變化的世界里可以容易地處理眾多變化的標(biāo)準(zhǔn)。然而,通用DSP的“通用性”使得其并非對(duì)所有應(yīng)用都能夠?qū)崿F(xiàn)很好的功耗效率(power-efficient)。
硬線連接的信號(hào)處理模塊通常有比較好的功耗效率,但是缺少DSP那樣的靈活性和可編程特性??膳渲锰幚砥骷夹g(shù)通過(guò)建立針對(duì)某一特定任務(wù)屬性正確的、功能豐富和可編程的DSP,在DSP的固定ISA(指令集體系結(jié)構(gòu))靈活性和可編程特性與硬線連接模塊的功耗有效性之間建立起橋梁。 Tensilica的Vectra LX是這種概念很好的詮釋。Vectra LX是一個(gè)定點(diǎn)的向量DSP引擎,該引擎是通過(guò)配置選項(xiàng)在Xtensa LX可配置處理器的基礎(chǔ)上建立起來(lái)的。
本文引用地址:http://www.ex-cimer.com/article/8017.htm
可配置架構(gòu)
Vectra LX定點(diǎn)DSP引擎是Xtensa LX微處理器內(nèi)核的一種配置。該定點(diǎn)DSP引擎是一個(gè)3發(fā)射的SIMD處理器,具有四個(gè)乘法器/累加器(四個(gè)MAC),它可以處理128位的向量。128位向量可以分成8個(gè)16位或者4個(gè)32位的元素。整個(gè)Vectra LX DSP引擎是用TIE(Tensilica’s Instruction Extension)語(yǔ)言開(kāi)發(fā)的,通過(guò)修改可以適合目標(biāo)應(yīng)用領(lǐng)域。正像圖1所示,Vectra LX DSP引擎增加了16個(gè)向量寄存器(每個(gè)寄存器160位寬)、四個(gè)128位的向量隊(duì)列寄存器、第二個(gè)加載/存儲(chǔ)單元和210多條現(xiàn)有Xtensa LX處理器指令集體系結(jié)構(gòu)中的通用DSP指令。
基本的Xtensa LX處理器是一個(gè)單發(fā)射的微處理器,具有16位和24位指令。但是,Tensilica的處理器產(chǎn)生器(processor generator)能夠讓開(kāi)發(fā)人員增加更寬的指令字長(zhǎng)。通過(guò)一種稱為可變長(zhǎng)度指令擴(kuò)展FLIX(Flexible-Length Instruction Extensions)的技術(shù)為處理器指令集增添多個(gè)獨(dú)立操作。FLIX指令寬度可以為32位或者64位,并且由于Xtensa LX處理器已經(jīng)設(shè)計(jì)成可以處理多種指令寬度,因此多操作FLIX指令可以在處理器代碼流中自由組合,并且可以和現(xiàn)有的單發(fā)射Xtensa LX處理器指令連接在一起。
當(dāng)開(kāi)發(fā)人員選擇Vectra LX DSP引擎配置選項(xiàng)時(shí),Tensilica的處理器產(chǎn)生器會(huì)自動(dòng)將DSP引擎的RTL代碼添加到可綜合的 Xtensa LX處理器中。新的Vectra LX指令被添加到處理器自動(dòng)產(chǎn)生的軟件工具集(編譯器、匯編器、調(diào)試器、指令集仿真器ISS和實(shí)時(shí)操作系統(tǒng)RTOS接口)中。Vectra LX使得Xtensa LX處理器門數(shù)增加20萬(wàn)~25萬(wàn)門。這些增加的門數(shù)中的大部分用于構(gòu)建Vectra LX DSP引擎中的寄存器和執(zhí)行部件,因?yàn)橥ㄓ锰幚砥骱虳SP引擎擴(kuò)展可以共享處理器中現(xiàn)有的取指令和指令譯碼部件,所以那些硬件模塊不需要重新復(fù)制。然而,需要增加一些邏輯用于對(duì)新的指令進(jìn)行譯碼。圖2為Vectra LX DSP引擎配置選項(xiàng)中增加的寄存器和執(zhí)行部件框圖。
圖3表示三操作Vectra LX指令字格式。指令字中最右邊四位表示該指令寬度為64位。剩下的60位指令字長(zhǎng)度不等地分布在三個(gè)操作指令槽中:一個(gè)24位和兩個(gè)18位的指令槽。Vectra LX指令字中的24位操作指令槽(指令字中第4位到第27位)可放置Xtensa LX處理器中所有80條基本指令,包括控制第一個(gè)加載/存儲(chǔ)單元的操作。該操作指令槽還可以處理擴(kuò)展的128位加載/存儲(chǔ)指令,此指令可將信息存到Vectra LX寬向量寄存器中,也可以從該向量寄存器讀出信息。
24位的操作指令槽能提供足夠?qū)挼木幋a位數(shù),允許加載和存儲(chǔ)指令在指令槽中指定對(duì)齊或者非對(duì)齊加載和存儲(chǔ)操作,如圖4所示。非對(duì)齊加載和存儲(chǔ)操作幫助相關(guān)的向量化編譯器處理存儲(chǔ)器數(shù)據(jù)陣列,這些數(shù)據(jù)陣列可以任意方式對(duì)齊,因?yàn)榫幾g器產(chǎn)生的代碼有時(shí)是非對(duì)齊的數(shù)據(jù)陣列,這將降低DSP的性能。然而,這種性能損失可以通過(guò)DSP引擎以非對(duì)齊加載和存儲(chǔ)操作方式提供的支持加以補(bǔ)償。
Vectra LX DSP引擎的對(duì)齊寄存器提供部分向量存儲(chǔ)功能,這些對(duì)齊寄存器在非對(duì)齊加載或者存儲(chǔ)字符串的開(kāi)始用第一個(gè)部分向量進(jìn)行初始化。后續(xù)的非對(duì)齊加載或者存儲(chǔ)操作隱含地和新的向量數(shù)據(jù)進(jìn)行合并,這些向量數(shù)據(jù)經(jīng)過(guò)循環(huán)移位并和部分對(duì)齊寄存器內(nèi)容相連接,在對(duì)齊寄存器中將整個(gè)向量組合在一起。這些非對(duì)齊加載和存儲(chǔ)操作還為下一個(gè)非對(duì)齊加載或者存儲(chǔ)操作準(zhǔn)備好對(duì)齊寄存器,以便使得一系列連續(xù)的非對(duì)齊加載或者存儲(chǔ)操作能和對(duì)齊數(shù)據(jù)近似相同的效率將數(shù)據(jù)送入或者送出非對(duì)齊數(shù)據(jù)陣列。
Vectra LX DSP引擎采用第一個(gè)18位操作指令槽(第28位到第45位)來(lái)放置4
相關(guān)推薦
-
★被水淹死的魚(yú)★ | 2002-11-02
-
hpnet | 2002-05-15
-
-
-
-
-
-
-
-
jackwang | 2002-05-29
-
-
liujt_ic | 2002-11-16
-
hpnet | 2002-08-27
技術(shù)專區(qū)
- FPGA
- DSP
- MCU
- 示波器
- 步進(jìn)電機(jī)
- Zigbee
- LabVIEW
- Arduino
- RFID
- NFC
- STM32
- Protel
- GPS
- MSP430
- Multisim
- 濾波器
- CAN總線
- 開(kāi)關(guān)電源
- 單片機(jī)
- PCB
- USB
- ARM
- CPLD
- 連接器
- MEMS
- CMOS
- MIPS
- EMC
- EDA
- ROM
- 陀螺儀
- VHDL
- 比較器
- Verilog
- 穩(wěn)壓電源
- RAM
- AVR
- 傳感器
- 可控硅
- IGBT
- 嵌入式開(kāi)發(fā)
- 逆變器
- Quartus
- RS-232
- Cyclone
- 電位器
- 電機(jī)控制
- 藍(lán)牙
- PLC
- PWM
- 汽車電子
- 轉(zhuǎn)換器
- 電源管理
- 信號(hào)放大器
評(píng)論