用單片機實現(xiàn)SRAM工藝FPGA的加密應(yīng)用
在現(xiàn)代電子系統(tǒng)設(shè)計中,由于可編程邏輯器件的卓越性能、靈活方便的可升級特性,而得到了廣泛的應(yīng)用。由于大規(guī)模高密度可編程邏輯器件多采用sram工藝,要求每次上電,對fpga器件進行重配置,這就使得可以通過監(jiān)視配置的位數(shù)據(jù)流,進行克隆設(shè)計。因此,在關(guān)鍵、核心設(shè)備中,必須采用加密技術(shù)保護設(shè)計者的知識產(chǎn)權(quán)。
本文引用地址:http://www.ex-cimer.com/article/21585.htm1 基于sram工藝fpga的保密性問題
通常,采用sram工藝的fpga芯片的的配置方法主要有三種:由計算機通過下載電纜配置、用專用配置芯片(如altera公司的epcx系列芯片)配置、采用存儲器加微控制器的方法配置。第一種方法適合調(diào)試設(shè)計時要用,第二種和第三種在實際產(chǎn)品中使用較多。第二種方法的優(yōu)點在于外圍電路非常簡單,體積較小,適用于不需要頻繁升級的產(chǎn)品;第三種方法的優(yōu)點在于成本較低,升級性能好。
以上幾種方法在系統(tǒng)加電時,都需要將配置的比特流數(shù)據(jù)按照確定的時序?qū)懭雜ram工藝的fpga。因此,采用一定的電路對配置fpga的數(shù)據(jù)引腳進行采樣,即可得到配置數(shù)據(jù)流信息。利用記錄下來的配置數(shù)據(jù)可對另一塊fpga芯片進行配置,就實現(xiàn)了對fpga內(nèi)部設(shè)計電路的克隆。典型
的克隆方法見圖1。
由于sram工藝的fpga上電時的配置數(shù)據(jù)是可以被復(fù)制的,因此單獨的一塊fpga芯片是無法實現(xiàn)有效加密的。fpga芯片供應(yīng)商對位數(shù)據(jù)流的定義是不公開的,因此無法通過外部的配置數(shù)據(jù)流信息推測內(nèi)部電路。也就是說,通過對fpga配置引腳的數(shù)據(jù)進行采樣可得到配置信息。但也不能知道內(nèi)部電路結(jié)構(gòu)。如果在配置完成后使fpga處于非工作狀態(tài),利用另外一塊保密性較強的cpu產(chǎn)生密碼驗證信息與fpga進行通信,僅在驗證成功的情況下使能fpga正常工作,則能有效地對設(shè)計進行加密。具體電路結(jié)構(gòu)見圖2。
系統(tǒng)加電時,由單片機對sram工藝的fpga進行配置。配置完成時,fpga內(nèi)部功能塊的使能端為低,不能正常工作。此時,單片機判斷到配置完成后,將aset信號置為高電平,使能fpga內(nèi)的偽碼發(fā)生電路工作;同時,單片機產(chǎn)生一個偽碼驗證信息,在fpga中將兩路偽碼進行比較,兩者完全匹配時,fpga內(nèi)部電路正常工作,否則不能正常工作。加密電路主要利用了配置完成后處于空閑狀態(tài)的單片機和fpga內(nèi)部分邏輯單元,沒有增加硬件成本。
由上述討論可知,系統(tǒng)的加密能力主要由cpu的加密能力決定。這就要求cpu的加密算法要足夠復(fù)雜,使得對驗證信息的捕獲與識別足夠困難。最常見的加密算法就是產(chǎn)生兩個偽隨機序列發(fā)生器:一個位于sram工藝的fpga內(nèi);另一個位于cpu內(nèi)。當兩者匹配時,通過驗斑點。對pn碼有兩點要求:一方面,要求偽隨機序列的長度足夠長,使得要捕獲整個序列不太可能;另一方面,偽隨機序列的線性復(fù)雜度要足夠高,使推測偽隨機序列的結(jié)構(gòu)不易實現(xiàn)。
通常采用的偽隨機碼發(fā)生器的反饋電路如圖3所示。實際中,可采用級數(shù)較高的線性反饋移位寄存器來產(chǎn)生偽隨機碼。如采用40級線性移位寄存器產(chǎn)生的最大序列的周期為2?40=10?12。若將所有偽隨機碼截獲并存儲,就需要1000gb的存儲空間;若碼速率為50kbps,捕獲時間將長達5555小時;當增加移位寄存器的級數(shù)時,所需的存儲空間和捕獲時間都會呈指數(shù)增長,以至于難以實現(xiàn)。采用較為簡單的線性反饋電路被推測出反饋結(jié)構(gòu)的可能性較大,因此實際的系統(tǒng)中,除了級數(shù)要較多之外,往往通過對多個線性移位寄存器產(chǎn)生的偽碼進行特定運算產(chǎn)生長碼,以增加所產(chǎn)生偽碼的線性復(fù)雜度。
3 fpga內(nèi)的校驗工作電路在此采用40級線性反饋移位寄存器來產(chǎn)生偽隨機碼,特征多項式為20000012000005(八進制表示)。其移位寄存器表示形式為:bin=b23?xor?b21xorb2xorb0,fpga內(nèi)工作電路見圖4。
在上電之后,單片機將圖4中的電路配置在fpga中。配置完成后,單片機發(fā)送的aset信號由低電平跳變?yōu)楦唠娖?,使得fpga內(nèi)的pn碼產(chǎn)生電路開始工作,并于cpu發(fā)送過來的pn碼進行比較。比較結(jié)果一致就使能user_design模塊正常工作。其中pll_bitsys模塊用來發(fā)生verify_pn的位同步時鐘,采用微分鎖相原理實現(xiàn)。各種參考資料都有較多介紹,在此不再詳述。
compare_pn模塊完成對單片機發(fā)送的偽隨機碼和pnma_producer模塊產(chǎn)生的偽隨機碼的比較:當兩路相同,輸出1,不同時輸出0;若兩路偽碼完全匹配,則恒定輸出1,使user_design電路正常工作,否則,輸出為類似于偽碼的信號,使user_design電路不能正常工作。
4 fpga內(nèi)的偽隨機碼產(chǎn)生電路
pnma_producer模塊和來產(chǎn)生偽隨機碼,采用移位寄存器實現(xiàn),具體電路見圖5。
lpm_shiftreg為移位寄存器模塊。移位寄存器aset端為異步置位端,高電平有效,即aset為高時,將初值85置入移位寄存器內(nèi),lpmshiftreg模塊的“direction”設(shè)置為“right”即移位方向為右移。q[39..0]表示40位移位寄存器的各個狀態(tài),shiftin為串行輸入,shiftin為q0、q2、q21、q23四個狀態(tài)異或運算的結(jié)果。
系統(tǒng)加電時,單片機將aset置為低電平,經(jīng)過一個非門,變成高電平使移位寄存器處于置位狀態(tài)。在配置完成后,單片機將aset信號置為高電平,經(jīng)非門使移位寄存器正常工作。
利用移位寄存器電路產(chǎn)生偽隨機碼的電路非常簡單,反饋邏輯也便于修改。 5 單片機驗證偽碼的程序
在位尋址區(qū)(20h~2fh)定義了字節(jié)變量word1、word2、word3、word4、word5,用來存儲移位寄存器的40個狀態(tài)。其中q0對應(yīng)word1.0,q1對應(yīng)word1.1……q39對應(yīng)word5.7。同時,在位尋址區(qū)定義了word6、word7、word8、word9,用來進行后面的反饋邏輯計算
。
單片機一上電,首先將aset腳清零,同時,也將pnma腳清零,將初值55h作為移位寄存器的初始狀態(tài),接著完成fpga的上電配置工作。配置完成后,單片機檢測來自fpga的外部中斷confdone。如果配置完成,confdone為高電;否則,為低電平。在檢測到confdone為高電平,即配置完成后,單片機將aset腳置為1,使能fpga內(nèi)的偽碼發(fā)生電路工作,單片機產(chǎn)生偽隨機碼的流程。配置完成后,首先將q0輸出到pnma引腳,接著計算反饋邏輯輸入,將參與反饋運算的幾個狀態(tài)運算結(jié)果存在中間變量mid_vary中。然后,對各個狀態(tài)進行右移,為了提高運算效率,使用了帶進位c的字節(jié)循環(huán)右移指令。移位完成后,將mid_vary存入q39,再將新的q0輸出到pnma引腳,程序循環(huán)執(zhí)行產(chǎn)生偽隨機碼。
單片機核心源程序如下:
clr aset;單片機上電后將aset位清0
clr pnma
mov word1,#55h
mov word2,#0
mov word3,#0
mov word4,#0
mov word5,#0;將55h作為移位寄存器的初值peizhi:
……;進行fpga的配置工作
jb confdone,pnproduce;根據(jù)confdone判斷配置是否完成
ljmp peizhi;否則繼續(xù)配置
pnproduce:setb aset;配置完成后,將aset腳置1
xmqloop:mov c,q0
mov pnma,c;將q0輸出到pnma引腳,作為pn碼
mov c,q0
mov word6.0,c;用word6單元的0位來存q0的狀態(tài)
mov c,q2
mov word7.0,c;用word7單元的0位來存q2的狀態(tài)
mov c,q21
mov word8.0,c;用word8單元的0位來存q21的狀態(tài)
mov c,q23
mov word9.0,c;用word9單元的0位來存q23的狀態(tài)
mov acc,word6
xrl a,word7
xrl a,word8
xrl a,word9;通過異或指令,計算反饋邏輯
mov c,acc.0;反饋邏輯為qin=q0
;xor q2 xor q21 xor q23
mov mid_vary,c;將運算后的狀態(tài)存到mid_vary中右移運算
mov acc,word1
rrc a;移位q7~q0
mov word1,a;移位后,保存到word1單元中
mov acc,word2
rrc a;移位q15~q8
mov word2,a;移位后,保存到word2單元中
mov q7,c;將q8的值賦到q7
mov acc,word3
rrc a;移位q23~q16
mov word3,a;移位后,保存到word3單元中
mov q15,c;將q16的值賦到q15
mov acc,word4
rrc a;移位q31~q24
mov word4,a;移位后,保存到word4單元中
mov q23,c;將q24的值賦到q23
mov acc,word5
rrc a;移位q39~q32
mov word5,a;移位后,保存到word5單元中
mov q31,c;將q32的值賦到q31
mov c,mid_vary;將前面反
饋計算的值賦給q39mov q39,c
ljmp xmaloop?。焕^續(xù)產(chǎn)生下一代pn碼元
6 其它加密方法介紹及比較
對sram工藝的fpga進行加密,除了可以利用單片機實現(xiàn)外,還可以用e2prom工藝的cpld實現(xiàn)。與用單片機實現(xiàn)相比,利用cpld的優(yōu)點在于可實現(xiàn)高速偽碼,但要在硬件電路中增加一塊cpld芯片,使整個硬件電路復(fù)雜化,增加了成本。本文提供的加密方法考慮到配置完成后單片機處于空閑狀態(tài),此時利用單片機進行加密,不需要增加任何電路成本,使得整個系統(tǒng)硬件結(jié)構(gòu)十分簡潔。本文提出采用長偽隨機碼來實現(xiàn)加密。如果采用其它的算法產(chǎn)生驗證信息,并增加單片機與fpga工作時信息實時交互,使得獲取驗證信息的難度足夠大,也可以達到類似的加密效果。
評論