基于MPEG-4的視頻監(jiān)控應(yīng)用系統(tǒng)的軟件實現(xiàn)
本文根據(jù)視頻監(jiān)控的特點,主要討論了MPEG-4 在視頻監(jiān)控應(yīng)用中的軟件實現(xiàn)過程與涉及的關(guān)鍵技術(shù),其中重點講述了以前的標(biāo)準(zhǔn)中沒有的部分,包括VOP 的生成,形狀、紋理、運動編碼,特別強調(diào)了Sprite 編碼和可擴展編碼。
本文引用地址:http://www.ex-cimer.com/article/165399.htm關(guān)鍵詞 MPEG-4 VOP 生成 Sprite 編碼 可擴展編碼
The Software Realization of MPEG-4 Based on video surveillance application
Li Qing-ping , Shi Zhong-suo,Chen Ming (University of Science and Technology Beijing, Information Engineering Institute, Beijing,100083)Abstract Due to the characters of video surveillance, this paper mainly discusses the softwarerealization of MPEG-4 based on video surveillance application. Also the related key techniquesincluding the generation of VOP, shape coding, texture coding, motion coding are presented andthe novel techniques that do not appear in the previous standard are emphasized, for example,Sprite coding and scalable coding.
Key words MPEG-4, VOP generation, Sprite coding, Scalable coding
1 引言
目前,用于數(shù)字視頻監(jiān)控的圖像壓縮標(biāo)準(zhǔn)主要是H.261 和MPEG-1,他們在實際應(yīng)用中有一定的局限性。第一,他們的適應(yīng)性差,不能根據(jù)網(wǎng)絡(luò)情況自適應(yīng)的調(diào)節(jié)傳輸率,使得網(wǎng)絡(luò)發(fā)生擁塞時性能急劇下降;第二,他們不具備較強的用戶交互性。MPEG-4 能彌補以上不足,還具有在監(jiān)控應(yīng)用中的獨特優(yōu)勢:由于壓縮比是同質(zhì)量的MPEG-1 的十倍多,所以可大大節(jié)約存儲空間和網(wǎng)絡(luò)帶寬;錯誤恢復(fù)能力強:當(dāng)網(wǎng)絡(luò)傳輸有誤碼或丟包現(xiàn)象時,MPEG4 受的影響很小并且能夠迅速恢復(fù);圖像質(zhì)量高:可以達(dá)到接近DVD 的效果。
2 設(shè)計思路
根據(jù)視頻監(jiān)控的圖像特點及其實時性要求,考慮到實際中網(wǎng)絡(luò)的不穩(wěn)定性,進(jìn)行了編碼軟件的設(shè)計。視頻監(jiān)控的原始圖像有一個顯著的特點,即有大量的背景對象是靜止不動的或極少運動的。MPEG-4 最基本的思想是基于對象的編碼,編解碼的基本單元是對象。所以可以把圖像分割為運動物體對象和背景對象。背景對象采用壓縮比較高、損失較大的方法進(jìn)行編碼,運動物體對象采用壓縮比較低、損失較小的方法編碼。基于此,我們采用MPEG-4 中Sprite 編碼的思想來對背景對象編碼。這是軟件實現(xiàn)的一個重點所在。針對視頻監(jiān)控的實時性要求,算法的設(shè)計與選擇上,除盡可能提高壓縮比外,還要考慮到算法的復(fù)雜性,使其盡量滿足實時性要求。這一思想貫穿于編碼的整個過程,具體的,如VOP 的定義與生成,Sprite 編碼等。另外考慮到網(wǎng)絡(luò)的不穩(wěn)定性,采用了MPEG-4 的可分級編碼思想。
3 MPEG-4 的軟件實現(xiàn)過程
現(xiàn)在,基于MPEG-4 標(biāo)準(zhǔn)的應(yīng)用大多為硬件方案,采用專門的MPEG-4 編碼芯片,難以實現(xiàn)升級,靈活性也較差,而本文中使用軟件方案,可按實際應(yīng)用要求進(jìn)行編碼,易于以后的升級,具有很好的靈活性。本文中,實現(xiàn)的是自然視頻編碼,不涉及音頻編碼。軟件設(shè)計的總體步驟是首先利用圖像分割技術(shù)生VOP,接下來是Sprite 生成,最后是對各VOP 的編碼。軟件實現(xiàn)流程如圖1 所示。下面對其中的關(guān)鍵技術(shù)作介紹,重點是以前的標(biāo)準(zhǔn)中所沒有的:視頻對象平面VOP(video object plane)的定義與生成,Sprite 生成與編碼,形狀、運動、紋理編碼,可擴展編碼。MPEG-4 中,VOP 分四種,I-VOP、P-VOP、B-VOP、S-VOP,對于普通視頻對象,只涉及到前三種,S-VOP 指SpriteVOP。
3.1 VOP 的定義與生成
MPEG-4 的編碼單位是VOP,但標(biāo)準(zhǔn)并未規(guī)定生成VOP 的具體算法,而將其列入公開研究的內(nèi)容。VOP 的生成是通過視頻分割實現(xiàn)的。視頻分割是實現(xiàn)基于對象的視頻編碼系統(tǒng)的基礎(chǔ),也是MPEG-4 編碼的一個難點。圖像分割技術(shù)根據(jù)分割所利用的信息,分為基于紋理的分割、基于運動的分割和基于時空的分割三類。按照人工參與的程度,圖像分割分為自動分割和半自動分割。自動分割不需要用戶的參與,只需要設(shè)置一些基本的參數(shù),就可以由分割算法自動將視頻對象分割出來,但是結(jié)果不很準(zhǔn)確,主要用于實時編碼;半自動分割需要用戶的參與,因此可以得到準(zhǔn)確的語義對象和邊界,主要用于基于內(nèi)容的操縱和交互式訪問?;诰幋a對圖像分割的要求不是很高,主要在于實時性上,這里,選用了一種時空聯(lián)合自動視頻對象分割算法。該算法首先對時域分割采用基于F-假設(shè)檢驗的方法來得到初始的變化檢測模板,然后通過與基于形態(tài)學(xué)的空域分割融合來獲得最終的運動對象。此算法計算比較簡單,能較好的將前景運動對象從背景中分離出來,算法詳見。
評論