TMS320C54x和ADSP218x性能比較

作者：時(shí)間：2007-03-09 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

摘要：TI（Texas Instruments）公司的TMS320C54X系列和ADI（Analog Devices Inc.）公司的ADSP218X系列是目前應(yīng)用廣泛的兩款主流16位定點(diǎn)DSP芯片。以Geffe發(fā)生器和MD5算法的實(shí)現(xiàn)為例，通過對(duì)這兩款芯片性能的詳細(xì)比較，分析研究了它們各自優(yōu)缺點(diǎn)。關(guān)鍵詞：DSP芯片 TMS320C54X ADSP-218X 性能比較從1982年第一片數(shù)字信號(hào)處理器（Digital Signal Processor,DSP）TMS320C10產(chǎn)生以來，經(jīng)過二十年的發(fā)展，DSP以其卓越的性能、獨(dú)有的特點(diǎn)，已成為通信、計(jì)算機(jī)、消費(fèi)類電子產(chǎn)品等領(lǐng)域的基礎(chǔ)器件。業(yè)內(nèi)人干預(yù)言，DSP將是未來集成電路中發(fā)展最快的電子產(chǎn)品，并成為電子產(chǎn)品更新?lián)Q代的決定因素，它將徹底變革人們的作、學(xué)習(xí)和生活方式。 DSP[6][8][9]具有兩種算術(shù)結(jié)構(gòu)：定點(diǎn)和浮點(diǎn)。從理論上講，雖然浮點(diǎn)DSP的動(dòng)態(tài)范圍比定點(diǎn)DSP大，且更適合于DSP的應(yīng)用場(chǎng)合，但定點(diǎn)運(yùn)算的DSP器件的成本較低，對(duì)存儲(chǔ)器的要求也較低，而且耦電較省。定點(diǎn)運(yùn)算的可編程DSP器件仍是市場(chǎng)上的主流產(chǎn)品。據(jù)統(tǒng)計(jì)，目前銷售的DSP器件中的80%以上屬于16位定點(diǎn)可編程DSP器件。其中，TI公司的TMS320C54X系列和ADI公司的ADSP-218X系列是目前廣泛使用的主流定點(diǎn)DSP芯片。下面就以它們?yōu)檠芯繉?duì)象，結(jié)合Geffe發(fā)生器[7]和MD5算法的實(shí)現(xiàn)，對(duì)其性能進(jìn)行分析比較。由于TI的TMS320VC5402和ADI的ADSP-2186N是使用較多的兩款，硬件性能指標(biāo)又相近，有很好的可比性，所以編程實(shí)現(xiàn)時(shí)選擇它們?yōu)榫唧w芯片。雖然兩款DSP芯片都提供C編譯器，但是因?yàn)樾识疾桓?，這里我們就不作討論。下面的論述都是基于直接用匯編語(yǔ)言編程的。 1 Geffe發(fā)生器與MD5算法先簡(jiǎn)單介紹一眄兩個(gè)算法。Geffe發(fā)生器是一種密鑰序列發(fā)生器，它利用線性反饋移位寄存器（Linear Feedback Shift Register,LFSR）產(chǎn)生序列密碼。Geffe發(fā)生器使用了三個(gè)LFSR，它們以非線性方式結(jié)合，其中兩個(gè)LFSR作為復(fù)合器的輸入，第三個(gè)LFSR控制復(fù)合器的輸出。因?yàn)檫\(yùn)算量很大，所以LFSR用軟件實(shí)現(xiàn)起來比較慢，但是用匯編語(yǔ)言實(shí)現(xiàn)比用C語(yǔ)言實(shí)現(xiàn)快。 MD5（MD，即Message Digest）是一個(gè)單向散列函數(shù)，它對(duì)輸入消息產(chǎn)生128位散列值（或消息摘要）。該算法需要進(jìn)行大量的移位和邏輯操作，用DSP實(shí)現(xiàn)比較方便。 2 TMS320C54X系列與ADSP-218X系列性能比較 2.1 硬件結(jié)構(gòu)[1][4][5] TMS320C54X系列采用改進(jìn)的Harvard結(jié)構(gòu)體系，有一組程序總線和三組數(shù)據(jù)總線、高度并行性的算術(shù)邏輯單元ALU、乘法/累加器MAC、桶形移位器、緩沖串口、專用硬件邏輯、片內(nèi)存儲(chǔ)器、片內(nèi)外設(shè)和高度專業(yè)化的指令集等等。支持32位長(zhǎng)操作數(shù)指令，支持并行存儲(chǔ)和并行裝入的算術(shù)指令。 ADSP-218X系列借裝了TMS320X系列的優(yōu)缺點(diǎn)，重新設(shè)計(jì)。它也是采用改進(jìn)的Harvard結(jié)構(gòu)體系。ALUMAC、桶形移位器這三個(gè)獨(dú)立的運(yùn)算部件均可以單周期操作。還有豐富的雙緩沖串口、中斷（分外中斷和內(nèi)中斷）等。在TMS320C54x系列中，程序存儲(chǔ)區(qū)和數(shù)據(jù)存儲(chǔ)區(qū)是混在一起的，而ADSP-218X系列從物理上就將兩者分開，這就使多功能指令操作顯得非常方便。因此，ADSP-218X系列程序?qū)崿F(xiàn)更有高效性。兩款芯片主要技術(shù)指標(biāo)的比較如表1所示。表1 兩款DSP芯片主要技術(shù)指標(biāo)比較比較項(xiàng)目MIPSCycle Time/nsRAM/千字TMS320C54X30～53233.3～1.885～640ADSP-218X33～8030～12.58～104可見，兩款系列芯片性能指標(biāo)的選擇范圍都很大，而TSM320C54X系列的選擇空間更大一些。具體到本文選用的TMS320VC5400和ADSP-2186N，主要參數(shù)（MIPS/Cycle Time/RAM）為：TMS320VC5402是100/10ns/16kword,ADSP-2186N是80/12.5ns/16Kword。這兩種芯片的硬件性能指標(biāo)相仿，用它們實(shí)現(xiàn)相同的算法，具有很好的可比性。 2.2 程序編程[2][3][4][6] 下面分別用TMS320VC5402和ADSP-2186N實(shí)現(xiàn)Geffe發(fā)生器和MD5算法，以此來比較兩款芯片在編程過程中的優(yōu)劣。其中，Geffe發(fā)生器產(chǎn)生96字的序列，MD5處理的消息長(zhǎng)63個(gè)字。 2.2.1 指令系統(tǒng)概述 ADSP-2186N指令系統(tǒng)使用代數(shù)符號(hào)來表示算術(shù)運(yùn)算和數(shù)據(jù)傳送，源代碼具有較高的可讀性，且不會(huì)損壞運(yùn)行特性。它的指令系統(tǒng)很精簡(jiǎn)，程序員可以快速掌握。ADSP-2186N的編程方式和高級(jí)語(yǔ)言類似，如果用戶有高級(jí)語(yǔ)言編程的經(jīng)驗(yàn)，上手較快。 TMS320VC5402指令系統(tǒng)很豐富，靈活多變，雖然使用時(shí)很方便，但是完全掌握卻有一定的困難，這對(duì)程序員來說是個(gè)不小的難題。它的指令系統(tǒng)有傳統(tǒng)的助記符和代數(shù)符號(hào)兩種方式，程序員可以根據(jù)所好任選一種。助記符方式對(duì)于習(xí)慣了匯編語(yǔ)言的開者易于接受，代數(shù)符號(hào)方式則表達(dá)簡(jiǎn)潔、較為直觀、易于理解。但是，合作完成項(xiàng)目時(shí)，往往會(huì)由于不同的程序員選擇不同的格式而造成麻煩。解決的方法有兩個(gè)，一是使用TI提供的轉(zhuǎn)換工具，另一是只將兩者的obj文件鏈接調(diào)試，但調(diào)試時(shí)有些方便。另外，兩者的編譯環(huán)境也有差別。相比較而言，ADSP-2186N的界面要友好一些，它和VC++非常相像，很方便。 2.2.2 指令的“單周期性” ADSP-2186N的每條程序語(yǔ)言都匯編成僅需一個(gè)執(zhí)行周期的24位指令機(jī)器碼。它完全在并行處理方式下工作，所有的指令都是真正的單周期指令。除了訪問慢速的外部存儲(chǔ)設(shè)備，或者外部存儲(chǔ)器出現(xiàn)控制權(quán)競(jìng)爭(zhēng)而需要附加周期的情況外，任何指令的運(yùn)行一般僅需一個(gè)周期。由于它的指令系統(tǒng)沒什么“禁忌”，所以程序員大可像編寫高級(jí)語(yǔ)言程序一樣，只需要考慮算法如何實(shí)現(xiàn)，至于編程過程就可以不太注意。可是，TMS320VC5402的指令系統(tǒng)卻不是這樣。TMS320VC5402的各個(gè)單元是基于流水線方式的結(jié)構(gòu)，指令按流水線方式工作。它的大多數(shù)指令在單獨(dú)執(zhí)行時(shí)并不能在一個(gè)周期內(nèi)完成，只是在流水線方式下工作或重復(fù)操作的，才可以做到平均每一個(gè)周期執(zhí)行一條指令。因此，在它的指令系統(tǒng)中，不僅有不少的指令需要多個(gè)執(zhí)行周期，而且由于“時(shí)延”的原因，如果處理的不好，還會(huì)出現(xiàn)額外的附加周期。因此為了保證每條指令準(zhǔn)確執(zhí)行，有時(shí)就不得不把程序打亂，就是說，相關(guān)聯(lián)的幾條語(yǔ)句要分散插入別的地方。程序的模塊化遭到損害，顯得雜亂無章，大大影響了可讀性。如下面語(yǔ)句中的句1、句2、句3、句4（選自Geffe發(fā)生器）是我們實(shí)際應(yīng)用的形式（指令用代數(shù)符號(hào)格式，下面如果不特別指出，均為這要您）。 m_seq_ll: ；標(biāo)號(hào) …… b=a %26;amp; #1 ;句1 if(aeq)goto m_seq_12 ;句2，if a=0,goto m_seq_12 a=a>>1 ;句3 if(beq)goto m_seq_11 ;句4，if b=0,goto m_seq_11 …… m_seq_12: …… 但是，它們正常語(yǔ)序則應(yīng)該為 m_seq_11: ;標(biāo)號(hào) …… a=a>>1 ；句3（若這樣，a的初始值隨之改變） if(aeq)goto m_seq_12 ;句2，if a=0,goto m_seq_12 b=a %26;amp; #1 ;句1 if(beq)goto m_seq_11 ；句4，if b=0,goto m_seq_l1 …… m_seq_l2： …… 不過，若以正常語(yǔ)序執(zhí)行if語(yǔ)句時(shí)，a、b的值會(huì)因?yàn)闀r(shí)延不夠，來不及改變而導(dǎo)致程序出錯(cuò)。為避免這種情況，要么在句3和句2以及句1和句4之間分別加上若干個(gè)空操作（nop），這樣就會(huì)影響速度；要么調(diào)整它們的順序，如實(shí)際應(yīng)用中的句1、句2、句3、句4.有時(shí)候，語(yǔ)句順序?qū)嵲跓o法調(diào)整，就不得不加上一些空操作。尤其是循環(huán)的主體部分，往往一條語(yǔ)句處理的不好，就會(huì)導(dǎo)致整個(gè)程序多運(yùn)行成千上萬條指令。因此，TMS320C54系列編程對(duì)程序員的要求較高，必須非常熟悉指令系統(tǒng)，才可以得到高效的程序。 2.2.3 對(duì)數(shù)組的循環(huán)操作關(guān)于對(duì)數(shù)組進(jìn)行循環(huán)操作，兩者平分秋色。它們都支持寄存器地址自動(dòng)加減。只不過ADSP-2186N的調(diào)試界面看上去更直觀些。 2.2.4 對(duì)32位長(zhǎng)操作數(shù)操作 ADSP-2186N不支持32位操作，如果需要的話，必須多條指令共同完成。而TMS320VC5402經(jīng)過簡(jiǎn)單的設(shè)置，就可以直接進(jìn)行一些32位操作。例如，MD5算法中4輪主循環(huán)都需要大量的32位邏輯運(yùn)算及加法操作。表2示出“與”運(yùn)算和加法的實(shí)例，顯然，用TMS320VC-2186N實(shí)現(xiàn)時(shí)，必須將32位分為高16位和16位分別操作，最后再整合。這也是為什么在實(shí)現(xiàn)MD5算法時(shí)，用ADSP-2186N實(shí)現(xiàn)不如TMS320VC5402有效的主要原因。表2 分別用TMS320VC5402和ADSP-2186N實(shí)現(xiàn)32位與運(yùn)算和加法　實(shí)現(xiàn)32位與運(yùn)算實(shí)現(xiàn)32位加法運(yùn)算TMS320VC5402實(shí)現(xiàn)a=db1(*ar2);b=b %26;amp; a;b=b+db1(*ar1);b=db1(*ar3);ADSP-2186N實(shí)現(xiàn)ay0=DM(i0,m1);ar=ax0 and ay0,ay1=DM(i0,m1);sr0=ar;sr1=ar;ay0=DM(i0,m1);AR=AX0+AY0,ay1=DM(i0,m1);AR=AX1+AY1+C,AX0=AR;AR;AX1=AR;另外，兩者在編程時(shí)還有一些不同，例如，TMS320VC5402有標(biāo)號(hào)必須頂格寫等要求?？偟膩碚f，TMS320VC5402指令系統(tǒng)中有不少的“禁忌”，需要經(jīng)驗(yàn)積累才可以發(fā)現(xiàn)，這就給編程者帶來了不便。兩款DSP芯片實(shí)現(xiàn)Geffe發(fā)生器和MD5算法的具體結(jié)果如表3所示。表3 分別用兩款DSP實(shí)現(xiàn)密碼算法的結(jié)果分析（兩者均在各自的最高主頻下工作）　比較項(xiàng)目程序大小/字需要指令周期數(shù)需要時(shí)間/μsGeffe發(fā)生器TMS320VC5402ADSP-2186N252188444,816268,2994,448.163,353.74MD5算法TMS320VC5402ADSP-2186N9004363,4003,00934.0037.61可以看出，實(shí)現(xiàn)Geffe發(fā)生器時(shí)，ADSP-2186N較快，主要是因?yàn)槠渲噶钕到y(tǒng)的單周期性；實(shí)現(xiàn)MD5算法時(shí)，TMS320VC5402稍快，主要原因是它支持32位操作。 2.3 其它總而言之，從技術(shù)上看，ADSP-218X系列稍占優(yōu)勢(shì)。但目前的實(shí)際情況是：1999年TI占有全球DSP市場(chǎng)48%的份額，市場(chǎng)排名第一。2000年其市場(chǎng)占有率也是第二名的兩倍多。尤其在中國(guó)，高層占有率在80%左右。主要原因如下：第一是價(jià)格。性能相近的芯片，TI比ADI要便宜很多。如TMS320VC5402的單片價(jià)格為$5.66，ADSP-2186N的單片價(jià)格則為$8.50。從性價(jià)比看，TI占優(yōu)勢(shì)。從產(chǎn)品效益看，如果大指生產(chǎn)，顯然TI的芯片實(shí)惠。第二是服務(wù)。這里指的是指生產(chǎn)商提供的服務(wù)。TI公司有非常完善的服務(wù)體系，從產(chǎn)品宣傳到課程培訓(xùn)，非常齊全。ADI公司這方面略有不足。第三是第三方服務(wù)。市場(chǎng)上支持TI芯片的第三方服務(wù)要比支持ADI的多，這也是由于TI芯片的市場(chǎng)占有率高的緣故。反過來，大量支持TI芯片的第三方服務(wù)，又保證了TI芯片的市場(chǎng)占有率。兩者是相輔相成的關(guān)系。第四是繼承性。DSP芯片有其特殊性，不同公司的芯片，其編程方式差異很大。因此，程序員一旦熟悉了一種芯片，就不愿意更換。在我國(guó)，TI公司的用戶要遠(yuǎn)遠(yuǎn)多于ADI公司的用戶。為便于交流和學(xué)習(xí)，新的用戶也會(huì)傾向于選擇TI公司的芯片。第五是性能。雖然從技術(shù)性能看，TI的芯片稍稍遜色一些，但只要程序員付出一定精力，也可以得到高效的程序。所以，TMS320C54X系列和ADSP-218X系列可以說是各有千秋，互有短長(zhǎng)。ADSP-218X系列界面友好、TMS320C54X系列性價(jià)比高、服務(wù)體系完善、產(chǎn)品效益好，故公司企業(yè)多選用它。

新聞中心

TMS320C54x和ADSP218x性能比較

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)