基于PCI總線的嵌入式實(shí)時(shí)圖像處理系統(tǒng)
1 圖像處理系統(tǒng)發(fā)展現(xiàn)狀
在計(jì)算機(jī)信息處理及應(yīng)用中,圖像信息處理以及處理結(jié)果的應(yīng)用占有十分重要的地位。圖像處理的發(fā)展依賴于處理器芯片(包括單片機(jī)、DSP等)技術(shù)的應(yīng)用和發(fā)展,以及大容量、價(jià)格低廉的存儲(chǔ)器的出現(xiàn)。圖像處理系統(tǒng)雖然由機(jī)箱式大體積結(jié)構(gòu)發(fā)展為插卡式小型化結(jié)構(gòu),但是由于圖像處理存在大量的數(shù)據(jù)信息,在實(shí)時(shí)性和容量上一般不能滿足多數(shù)需要實(shí)時(shí)處理的場(chǎng)合。這主要體現(xiàn)在如下2個(gè)方面。
1.1 實(shí)時(shí)性要求
圖像處理系統(tǒng)有很多種實(shí)現(xiàn)方法,比如在通用計(jì)算機(jī)上用軟件實(shí)現(xiàn)、用單片機(jī)實(shí)現(xiàn)、利用特殊用途的DSP芯片來(lái)實(shí)現(xiàn)等。但這些實(shí)現(xiàn)方法都有著缺點(diǎn),例如軟件實(shí)現(xiàn)速度太慢,不能用于實(shí)時(shí)系統(tǒng);單片機(jī)采用的是馮·諾依曼總線結(jié)構(gòu),而且乘法運(yùn)算速度太慢;如果用特殊用途的DSP芯片又缺乏靈活性,而且開(kāi)發(fā)工具不是很完善。
在本系統(tǒng)中,圖像處理系統(tǒng)是在通用計(jì)算機(jī)上加入DSP加速卡來(lái)實(shí)現(xiàn)。利用DSP芯片的高速處理特性完成大部分的圖像處理工作,計(jì)算機(jī)只是作為輔助操作和存儲(chǔ)系統(tǒng)。這種方法發(fā)揮了DSP的高速性能又具有相當(dāng)大的靈活性的特點(diǎn),開(kāi)發(fā)工具比較完善。
實(shí)現(xiàn)實(shí)時(shí)性要求還必須有足夠的傳輸速度,PCI總線速度最高可達(dá)132MB/s,這是其他總線無(wú)法比擬的速度,如ISA總線速度只有5MB/s。
1.2 小型化要求
現(xiàn)今圖像處理應(yīng)用越來(lái)越趨于小型化系統(tǒng),趨向于把整個(gè)處理系統(tǒng)集成在一個(gè)小"黑盒子"里面,甚至于一塊電路板上。這就要求圖像處理系統(tǒng)具有高速度、高集成度的處理芯片來(lái)完成原本需要許多部件合作完成的任務(wù)。DSP的中央處理器特性使得可以把眾多的功能集于一身,并通過(guò)外部擴(kuò)展來(lái)實(shí)現(xiàn)復(fù)雜的功能,實(shí)現(xiàn)系統(tǒng)的小型化。
另外,視頻數(shù)據(jù)一個(gè)很大的特點(diǎn)就是大容量性,這是與音頻數(shù)據(jù)最大的區(qū)別之一。對(duì)于大容量數(shù)據(jù)的實(shí)時(shí)處理不但需要高速的CPU,還需要能擴(kuò)展的大容量存儲(chǔ)空間。在通用計(jì)算機(jī)上用軟件實(shí)現(xiàn)時(shí),其存儲(chǔ)空間由計(jì)算機(jī)的存儲(chǔ)空間決定,其擴(kuò)展性能受到了限制;同時(shí)單片機(jī)的擴(kuò)展空間有限。它們都無(wú)法滿足視頻數(shù)據(jù)的大容量要求。
本文正是著眼于實(shí)時(shí)性和小型化要求這兩方面問(wèn)題,設(shè)計(jì)了用DSP加速卡實(shí)現(xiàn)的圖像采集系統(tǒng)。利用DSP芯片的高速處理特性完成大部分的圖像處理工作,上位機(jī)只完成輔助操作和存儲(chǔ)系統(tǒng)。這種方法發(fā)揮了DSP的高速性能又具有相當(dāng)大的靈活性,而且開(kāi)發(fā)工具比較完善。另外,PCI總線速度最高可達(dá)528MB/s(66MHz、64位),這是其他總線無(wú)法比擬的速度。系統(tǒng)中C6000系列中DSP的可擴(kuò)展存儲(chǔ)空間高達(dá)1GB,這完全可以滿足一般圖像處理系統(tǒng)的需要。
2 DSP圖像處理系統(tǒng)結(jié)構(gòu)
本系統(tǒng)采用TI公司C6000系列DSP中的TMS320C6211作為系統(tǒng)的CPU。圖像數(shù)據(jù)通過(guò)視頻頭輸入模擬圖像信號(hào),這些信號(hào)經(jīng)過(guò)視頻解碼芯片進(jìn)行A/D轉(zhuǎn)換為數(shù)字信號(hào),經(jīng)FIFO輸入DSP進(jìn)行圖像的增強(qiáng)、分割、特征提取和數(shù)據(jù)壓縮等,然后輸出信號(hào)經(jīng)PCI解碼芯片轉(zhuǎn)換為符合PCI總線規(guī)范的標(biāo)準(zhǔn)信號(hào),通過(guò)PCI總線接口傳到上位機(jī)。
本系統(tǒng)設(shè)計(jì)目的是用于智能樓宇的管理,主要實(shí)現(xiàn)對(duì)樓宇一些重要參數(shù)的實(shí)時(shí)檢測(cè)功能等。當(dāng)然可以用于其他的監(jiān)控系統(tǒng),其硬件系統(tǒng)基本一致,不同的在于軟件功能的區(qū)別。系統(tǒng)結(jié)構(gòu)圖如圖1。 從圖1可以看出,整個(gè)系統(tǒng)可分為3個(gè)模塊: DSP圖像處理模塊,視頻解碼模塊,PCI總線模塊。下面分別介紹這3個(gè)模塊的實(shí)現(xiàn)過(guò)程和功能。
2.1 DSP圖像處理模塊
本系統(tǒng)選用TI公司的C6000系列DSP之中的TMS320C611作為本系統(tǒng)的CPU。C6000是TI公司發(fā)布的面向視頻處理領(lǐng)域的新款高速數(shù)字處理芯片,適用于移動(dòng)通信基站、圖像監(jiān)控、雷達(dá)系統(tǒng)等需要高速度和高度智能化的應(yīng)用領(lǐng)域。存儲(chǔ)空間選用現(xiàn)代公司的2片HY57V651620B作為運(yùn)行過(guò)程中的存儲(chǔ)器(SDRAM)和AMD公司的AM29LV800B 作為啟動(dòng)時(shí)候需加載程序和參數(shù)的存儲(chǔ)器(FLASH)。其結(jié)構(gòu)如圖2所示。圖中的HPI(Host Port Interface)為主機(jī)口;EMIF(External Memory Interface)為外部存儲(chǔ)器接口,兼容同步/異步方式。 (1) TMS320C6211處理器特性及完成功能
TMS320C6211處理器由3個(gè)主要部分組成:CPU內(nèi)核、外設(shè)和存儲(chǔ)器。它的高速性能主要體現(xiàn)在如下幾個(gè)方面:① TMS320C6211的存儲(chǔ)空間最大擴(kuò)展可以達(dá)到512MB,這完全可以滿足各種圖像處理系統(tǒng)所需的內(nèi)存空間,而且其最高時(shí)鐘可達(dá)167MHz,峰值性能可達(dá)1600MIPS(百萬(wàn)條指令/秒)、2400MOPS(百萬(wàn)次操作/秒)。② 并行處理結(jié)構(gòu)。TMS320C6211芯片內(nèi)有8個(gè)并行處理單元,分為相同的兩組,并行結(jié)構(gòu)突破傳統(tǒng)設(shè)計(jì)使得芯片具有很高的性能。③ 芯片體系采用VelociTI結(jié)構(gòu)。VelociTI是一種高性能的甚長(zhǎng)指令字(VLIW)結(jié)構(gòu),單指令字字長(zhǎng)為32bit,8個(gè)指令組成一個(gè)指令包,總字長(zhǎng)為256bit,即每秒鐘可以執(zhí)行8條指令,同時(shí)芯片內(nèi)部設(shè)置了專門的指令分配模塊,可以將每個(gè)256bits的指令包同時(shí)分配到8個(gè)處理單元,并由8個(gè)單元同時(shí)執(zhí)行。④ 采用流水線操作實(shí)現(xiàn)高速度、高效率。TMS320C6211只有在流水線充分發(fā)揮作用的情況下,才能達(dá)到最高的MIPS。C6211的流水線分為3個(gè)階段:指令讀入、解碼和執(zhí)行,總共11級(jí)。
評(píng)論