視偵檢索技術——視頻解碼研究
一、認識視偵檢索
本文引用地址:http://www.ex-cimer.com/article/201612/332893.htm1、視偵檢索定義
視頻偵查檢索技術(簡稱視偵檢索)是指利用高性能計算機對視頻數(shù)據(jù)進行快速處理,對視頻數(shù)據(jù)幀進行檢測、分類、識別、跟蹤,遍歷所有數(shù)據(jù)幀后即可得到所有運動目標的軌跡、特征信息,辦案民警可根據(jù)時間、位置、行進方向、嫌疑人衣著等信息對視頻進行過濾,找出符合特征的視頻片段,快速從中獲取更多信息,提升效率,節(jié)省人力成本。
2、視偵檢索的意義
視頻監(jiān)控具有客觀詳實性、反復使用性、信息拓展性等特點,這些特點使其在偵查破案、打擊犯罪中發(fā)揮著不可替代的作用。目前,監(jiān)控攝像頭已遍布中國大地的每個街頭,晝夜不停地監(jiān)視和錄像。
視頻監(jiān)控在改善社會治安的同時,也產(chǎn)生了海量視頻信息。在海量的視頻中查找我們需要的信息,無疑是大海撈針,給視頻監(jiān)控帶來巨大的挑戰(zhàn)。傳統(tǒng)的人海戰(zhàn)術,因效率低下以及容易錯過關鍵目標,容易使視頻監(jiān)控處于“監(jiān)而不控”的狀態(tài)。如何化解這一危機,是現(xiàn)代安防的熱點和難點。視頻檢索和視頻濃縮是解決這一問題的關鍵,其中視頻檢索技術已經(jīng)逐漸成熟并開始走向市場。
3、視頻數(shù)據(jù)來源
視頻數(shù)據(jù)來源非常廣泛,常見的有天網(wǎng)視頻、路口卡口、小區(qū)監(jiān)控、門店監(jiān)控等各種固定監(jiān)控探頭,其中視頻數(shù)據(jù)的格式和圖像制式也是多種多樣,監(jiān)控設備硬件出自不同廠商,暫時還沒有統(tǒng)一的標準。
二、視頻解碼是視偵檢索的前提
視頻解碼是視偵檢索的前置條件,其解碼速度直接對檢索速度產(chǎn)生影響。檢索是非常耗時的一種操作,經(jīng)測試,對高清(1920x1080、1280x720)視頻直接檢索時,通常只能達到實時的速度,這顯然對檢索的意義不大。怎樣盡可能快,盡可能少漏檢目的是檢索算法改進的方向。目前,在暫時沒有更好方法的情況下,對視頻進行快速解碼和對圖像幀進行縮放,以減少檢索算法的數(shù)據(jù)輸入,是一種非常有效的方法。
三、視頻解碼具體解決方案
針對視頻解碼,數(shù)據(jù)恢復四川省重點實驗室科研人員提供的具體解決方案是:使用統(tǒng)一API的方式實現(xiàn)視頻解碼框架,對輸入輸出參數(shù)和數(shù)據(jù)類型進行統(tǒng)一。具體來說,又分為通用格式解碼和專用格式解碼:
1、通用格式解碼
FFmpeg是一套可以用來記錄、轉換數(shù)字音頻、視頻一套開源軟件,它包含了非常先進的音頻、視頻編解碼庫,并具體高可移植性,多款視頻播放軟件中使用了其技術。
這里,我們僅需要使用它的視頻解碼功能,經(jīng)測試,F(xiàn)Fmpeg目前版本已經(jīng)支持常用的計算機視頻格式asf/avi/rm/flv/mkv/mov/mp4/3gp等,所以與其兼容的監(jiān)控視頻都可以采用FFmpeg來進行解碼處理,并將解碼輸出圖像進行縮放處理。
經(jīng)測試1080p視頻圖像縮放0.4倍時處理時間與漏檢率之比是最好的,速度約12倍左右;視頻圖像縮放0.25倍時,速度約為正常播放時的20倍左右,1小時視頻可以在3分鐘內(nèi)檢索完畢。720p視頻0.25倍時可達48倍檢索速度,640x480的視頻可達80倍檢索速度。
關鍵C++代碼:
//在上下文是指定輸出高寬*倍數(shù)
swScaleCtx = sws_getContext(
videoCodecCtx->width, videoCodecCtx->height, //視頻幀高寬
videoCodecCtx->pix_fmt, //視頻幀數(shù)據(jù)格式
videoCodecCtx->width * outZoom, videoCodecCtx->height * outZoom, //輸出高寬
dstFormat, //輸出幀格式,使用PIX_FMT_YUV420P
SWS_POINT, NULL, NULL, NULL);
2、專用格式解碼
對于那些與計算機視頻不兼容的監(jiān)控廠商專用視頻格式,只能使用廠商提供的SDK進行解碼,使用統(tǒng)一的解碼框架,統(tǒng)一輸入輸出參數(shù)和數(shù)據(jù)類型,其中圖像縮放部分可以使用FFmpeg提供的轉換方法,因為其針對CPU多媒體指令集進行了優(yōu)化,效率非常高。
四、總結:
目前,市場上主要采用FFmpeg解決方案進行視頻解碼,而數(shù)據(jù)恢復四川省重點實驗室科研人員提供的方案,使用統(tǒng)一API的方式實現(xiàn)視頻解碼框架,輸入輸出參數(shù)和數(shù)據(jù)類型是統(tǒng)一的,方便擴展新的第三方監(jiān)控廠家專用視頻格式,而且方案對解碼圖像做了縮放處理,使解碼過程變得更高效。目前,此項方案已經(jīng)成功應用在了效率源VIE視頻全能提取系統(tǒng)、VICP視頻偵查應用平臺等產(chǎn)品中,取得了很好的效果。
評論