智能視覺技術(shù)在安防行業(yè)的應(yīng)用
隨著經(jīng)濟(jì)快速發(fā)展,城市化進(jìn)程不斷推進(jìn),各種社會(huì)矛盾和暴力事件逐漸增多,面臨的突發(fā)事件和異常事件越來越復(fù)雜,監(jiān)控的難度和重要性也越來越突出。從監(jiān)控技術(shù)的發(fā)展來看,大致可分為三個(gè)階段:人力現(xiàn)場(chǎng)監(jiān)控、人力視頻監(jiān)控和智能視覺監(jiān)控。所謂人力現(xiàn)場(chǎng)監(jiān)控,即安排專人在現(xiàn)場(chǎng)對(duì)場(chǎng)景監(jiān)控,人力現(xiàn)場(chǎng)監(jiān)控的應(yīng)用可以追溯到原始社會(huì),一直延續(xù)至今。所謂人力視頻監(jiān)控,即用攝像機(jī)對(duì)場(chǎng)景拍攝,視頻信號(hào)被采集到中央控制部門并被顯示到監(jiān)視器上,由人對(duì)視頻圖像進(jìn)行分析,得出恰當(dāng)?shù)呐袛?。視頻監(jiān)控又分為兩種,一種是早期采用的模擬視頻監(jiān)控,一種是現(xiàn)在廣泛采用的數(shù)字視頻監(jiān)控,這種監(jiān)控技術(shù)引入了大量的計(jì)算機(jī)技術(shù),來協(xié)助人采集和管理所有視頻信息,監(jiān)控系統(tǒng)的性能得到了有效的提高。當(dāng)有事件發(fā)生后,采用調(diào)取查閱的方式,這種方式在一定程度上滿足了社會(huì)的需求,但是無法避免事態(tài)趨于惡化。
何種技術(shù)可以有效的解決傳統(tǒng)監(jiān)控行業(yè)帶來的困惑,是安防行業(yè)亟需考慮和深入研究的課題。
一、智能視覺分析技術(shù)
隨著科技的發(fā)展,計(jì)算機(jī)技術(shù)的不斷提升,智能視覺技術(shù)應(yīng)運(yùn)而生,可以有效的解決傳統(tǒng)視頻監(jiān)控行業(yè)的問題,為安防行業(yè)提供了更為廣闊的應(yīng)用方向。它和以往的監(jiān)控技術(shù)有本質(zhì)的區(qū)別,其主要特征是采用計(jì)算機(jī)視覺的方法,在幾乎不需要人為干預(yù)的情況下,通過對(duì)攝像機(jī)拍錄的圖像序列進(jìn)行自動(dòng)分析,對(duì)動(dòng)態(tài)場(chǎng)景中的目標(biāo)進(jìn)行定位、識(shí)別和跟蹤,并在此基礎(chǔ)上分析和判斷目標(biāo)的行為,從而做到既能完成日常管理又能在異常情況發(fā)生的時(shí)候及時(shí)做出反應(yīng)。更形象地說,智能視覺監(jiān)控系統(tǒng)能夠看,看監(jiān)控場(chǎng)景中目標(biāo)物體的行為;能夠想,想目標(biāo)物體的行為意味著什么;能夠說,把想的結(jié)果用自然語(yǔ)言的形式表達(dá)出來。因此智能視覺監(jiān)控系統(tǒng)取代人完成了監(jiān)控任務(wù)中的大部分工作,是新一代的具有高度智能的監(jiān)控技術(shù)應(yīng)用。
智能視覺分析技術(shù)是指計(jì)算機(jī)圖像視覺分析技術(shù),計(jì)算機(jī)圖像視覺技術(shù)是人工智能(AI,Artificial Intelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關(guān)系,從而使計(jì)算機(jī)能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內(nèi)容。而視頻監(jiān)控中所提到的智能視頻技術(shù)主要指的是“自動(dòng)分析和抽取視頻源中的關(guān)鍵信息”。 如果把攝像機(jī)看作人的眼睛,智能視頻系統(tǒng)或設(shè)備則可以看作人的大腦。智能視頻技術(shù)借助計(jì)算機(jī)強(qiáng)大的數(shù)據(jù)處理功能,通過將場(chǎng)景中背景和目標(biāo)分離,進(jìn)而分析并追蹤在攝像機(jī)場(chǎng)景內(nèi)出現(xiàn)的目標(biāo),對(duì)視頻畫面中的海量數(shù)據(jù)進(jìn)行高速分析,過濾用戶不關(guān)心的信息,僅僅為監(jiān)控者提供有用的關(guān)鍵信息。智能視頻解決方案以數(shù)字化、網(wǎng)絡(luò)化視頻監(jiān)控為基礎(chǔ),用戶可以根據(jù)視頻內(nèi)容分析功能,通過在不同攝像機(jī)的場(chǎng)景中預(yù)設(shè)不同的報(bào)警規(guī)則,系統(tǒng)識(shí)別不同的物體,同時(shí)識(shí)別目標(biāo)行為是否符合這些規(guī)則,一旦目標(biāo)在場(chǎng)景中出現(xiàn)了違反預(yù)定義規(guī)則的行為,系統(tǒng)能夠以最快和最佳的方式發(fā)出警報(bào)并提供有用信息,從而能夠更加有效的協(xié)助安全人員處理危機(jī),最大限度的降低誤報(bào)和漏報(bào)現(xiàn)象,切實(shí)提高監(jiān)控區(qū)域的安全防范能力。
二、智能視覺分析技術(shù)的應(yīng)用
智能視覺分析技術(shù)在安防領(lǐng)域的重要作用是毋庸置疑的,具有廣泛的應(yīng)用前景,可以應(yīng)用在公安、司法、交通、教育、金融等主流行業(yè)應(yīng)用,比如十字路口、高速公路、停車場(chǎng)、飛機(jī)場(chǎng)等交通場(chǎng)景;比如軍事基地、銀行等軍事場(chǎng)景監(jiān)控、國(guó)家重要部門以及人們?nèi)粘I畹膱?chǎng)所;比如天安門廣場(chǎng)、火車站等敏感的公共場(chǎng)合監(jiān)控,相關(guān)智能視覺分析產(chǎn)品也隨著技術(shù)的發(fā)展不斷地細(xì)化,比如人臉識(shí)別比對(duì)系統(tǒng),公安機(jī)關(guān)搭建人臉識(shí)別比對(duì)系統(tǒng),建立人臉捕捉數(shù)據(jù)庫(kù),將人臉信息歸檔,并與個(gè)人身份建立關(guān)系,在實(shí)際運(yùn)用過程中采用人臉?biāo)阉?、黑名單布防、陌生人識(shí)別等多項(xiàng)智能分析功能,大大提高視頻監(jiān)控的防范功效,可以讓犯罪分子無可遁形。由于和智能視覺分析相關(guān)的高清產(chǎn)品并未得到真正的普及,社會(huì)上的監(jiān)控布局點(diǎn)也并不完善,目前還只是針對(duì)某些行業(yè)進(jìn)行使用,還遠(yuǎn)遠(yuǎn)未達(dá)到全面普及,只有大批量的使用高清攝像機(jī),增大捕獲到清晰、正面人臉的可能性,才能有更好的實(shí)戰(zhàn)效果。此外,還需要公安和企業(yè)加強(qiáng)合作,加大監(jiān)控點(diǎn)的部署密度。由于大量監(jiān)控點(diǎn)的部署會(huì)帶來海量視頻,需要重視智能視頻分析技術(shù)的應(yīng)用,合理利用技術(shù),人機(jī)配合,發(fā)揮技術(shù)的長(zhǎng)處,從而有效輔助偵辦人員。
從目前行業(yè)應(yīng)用和產(chǎn)品發(fā)展,我們已經(jīng)能夠看出智能視覺技術(shù)顯示出了巨大的市場(chǎng)價(jià)值。
三、智能視覺分析技術(shù)的發(fā)展
隨著高清探頭不斷投入,人們對(duì)于智能視覺分析技術(shù)產(chǎn)品化的需求越來越多,要求也越來越高,這給安防行業(yè)帶來了廣闊的思路,許多智能化新產(chǎn)品快速涌現(xiàn):
1、 雙目技術(shù)
雙目立體技術(shù)核心目的是提高識(shí)別的準(zhǔn)確率。由于立體視覺技術(shù)形成的視場(chǎng)中帶有物體的三維幾何信息,因此能夠有效的設(shè)定檢測(cè)規(guī)則,排除光線、影子等干擾因素,大幅提高智能分析的準(zhǔn)確度。如果說高清技術(shù)通過提升可用像素來提高分析的準(zhǔn)確率,是戰(zhàn)術(shù)性的舉措,那么雙目立體視覺技術(shù)對(duì)視頻分析準(zhǔn)確率的影響則是戰(zhàn)略性的。雙目立體視覺技術(shù)是基于視差原理,并利用成像設(shè)備從不同的位置獲取被測(cè)物體的兩幅圖像,通過計(jì)算圖像對(duì)應(yīng)點(diǎn)間的位置偏差,來獲取物體三維幾何信息的方法。 采用雙相機(jī)或多相機(jī),對(duì)視場(chǎng)內(nèi)空間的自由運(yùn)動(dòng)體的三維位置坐標(biāo)及姿態(tài)進(jìn)行高精度的測(cè)量,確定運(yùn)動(dòng)目標(biāo)的質(zhì)心位置,并根據(jù)標(biāo)定結(jié)果對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行高精度跟蹤。
立體視覺技術(shù)的跟蹤,由于能夠辨識(shí)目標(biāo)的三維坐標(biāo)、姿態(tài)、相對(duì)距離、與背景環(huán)境的空間距離,因此能適應(yīng)復(fù)雜的跟蹤背景環(huán)境。雙目技術(shù)應(yīng)用于人體屬性識(shí)別是人臉識(shí)別技術(shù)一次技術(shù)應(yīng)用的跨步,這對(duì)更準(zhǔn)確的定位和分析人的特征有著支援重要的作用。
2、 多球機(jī)聯(lián)動(dòng)跟蹤技術(shù)
多球機(jī)聯(lián)動(dòng)跟蹤技術(shù)是以單球機(jī)智能跟蹤技術(shù)作為基礎(chǔ)的。從應(yīng)用的層面上看,能夠?qū)⑵胀ǖ母櫱驒C(jī)的單點(diǎn)式監(jiān)控,提升為系統(tǒng)內(nèi)對(duì)單個(gè)目標(biāo)的無縫式接力跟蹤,配合電子地圖的使用,能夠容易的實(shí)現(xiàn)對(duì)高安全等級(jí)區(qū)域的無縫式跟蹤,并實(shí)現(xiàn)目標(biāo)軌跡描繪、犯罪行為預(yù)警等高等級(jí)的安保需求。多球機(jī)聯(lián)動(dòng)跟蹤技術(shù)的實(shí)現(xiàn),需要具備多目標(biāo)識(shí)別與跟蹤技術(shù)。在應(yīng)用中,通常設(shè)定一臺(tái)球機(jī)作為發(fā)起點(diǎn),對(duì)廣域范圍內(nèi)目標(biāo)進(jìn)行的智能行為分析,并將同時(shí)監(jiān)控的多個(gè)目標(biāo)按照既定的策略進(jìn)行排序,并按照先后順序,指揮智能跟蹤球機(jī)逐個(gè)跟蹤監(jiān)控目標(biāo)。與單目標(biāo)跟蹤相比,多目標(biāo)跟蹤技術(shù)的關(guān)鍵點(diǎn)是數(shù)據(jù)關(guān)聯(lián)問題,即建立一個(gè)統(tǒng)一的坐標(biāo)系,使得發(fā)起球機(jī)可以將目標(biāo)的坐標(biāo)信息傳遞給跟蹤球機(jī),實(shí)現(xiàn)聯(lián)動(dòng)跟蹤。
3、 面向事后應(yīng)用的智能技術(shù)
隨著監(jiān)控探頭的普及,監(jiān)控系統(tǒng)中存有海量的錄像數(shù)據(jù),在目前人工查看的模式下,傳統(tǒng)的方法需要從頭到尾順序播放,往往需要數(shù)倍于原始視頻的時(shí)間才能審看完成,因此需要大量人員連續(xù)加班數(shù)周進(jìn)行視頻的審看。為了規(guī)避遺漏和誤差,就要加大人力投入的方法。但是經(jīng)過實(shí)踐證明,這種方法吃力不討好,仍然解決不了根本的問題,如何有效、高效的應(yīng)用,減輕人工查看回放帶來的時(shí)效性差、成本高、疲勞問題,并在不同分辨率、不同清晰度的錄像中準(zhǔn)確的辨別出需要獲取的信息,基于以上需求,安防廠家研發(fā)了視頻摘要、視頻檢索等技術(shù)手段。
視頻摘要技術(shù)
將視頻摘要形成視頻片斷,不同時(shí)刻的目標(biāo)“穿越時(shí)空”同時(shí)展現(xiàn)播放,使24小時(shí)的視頻被制作成一個(gè)簡(jiǎn)短到幾分鐘摘要視頻成為現(xiàn)實(shí)。視頻摘要不僅濃縮的是事件的精華,也是活動(dòng)事件的全部,沒有價(jià)值的視頻將被剔除。通過多分格快照技術(shù),可以在幾秒中看完所有的活動(dòng)目標(biāo)成為可能,回溯原始視頻功能,瞬間鎖定目標(biāo)在原始視頻中的位置。這些智能視頻分析功能的實(shí)現(xiàn)和應(yīng)用將大大提高海量視頻監(jiān)控錄像分析的效率。
視頻檢索技術(shù)
視頻檢索主要是依賴于視頻算法對(duì)視頻進(jìn)行預(yù)處理,通過對(duì)視頻內(nèi)容進(jìn)行結(jié)構(gòu)化處理,提取出視頻內(nèi)容中的有效信息,進(jìn)行標(biāo)記或者相關(guān)處理后,人后可以通過各種屬性描述進(jìn)行快速檢索。因此視頻檢索最主要的是利用視頻檢測(cè)算法對(duì)視頻進(jìn)行結(jié)構(gòu)化描述,目前已經(jīng)在相應(yīng)的產(chǎn)品中得到應(yīng)用的算法主要有以下幾種:行為分析算法、車牌識(shí)別算法、車輛顏色識(shí)別算法、車標(biāo)識(shí)別算法、車型識(shí)別算法、人臉檢測(cè)識(shí)別算法、人體特征識(shí)別算法等。其中人體特征識(shí)別又包括人的年齡、性別、身高、衣服顏色、是否戴眼鏡等特征信息的識(shí)別。在視頻檢索中已經(jīng)得到比較成熟應(yīng)用的算法技術(shù)是行為分析算法、車牌識(shí)別算法、車輛顏色識(shí)別算法、人臉檢測(cè)識(shí)別算法等。
由于監(jiān)控探頭的布置也會(huì)有盲點(diǎn)等原因,當(dāng)雙目技術(shù)和多球機(jī)跟蹤技術(shù)無法每時(shí)每刻準(zhǔn)確的撲捉到嫌疑人的軌跡信息的時(shí)候,可以通過校園內(nèi)遍布的探頭錄像進(jìn)行事后檢索分析,找到相關(guān)線索,幫助刑偵人員及時(shí)快速的定位嫌疑人。
4、 視頻拼接技術(shù)
視頻拼接系統(tǒng)是基于圖像拼接技術(shù)得以實(shí)現(xiàn)的,而圖像拼接技術(shù)是根據(jù)實(shí)際的科研和工程的需要而發(fā)展來的。在很多領(lǐng)域經(jīng)常會(huì)用到超過人眼視角的高分辨率圖像,而普通相機(jī)或攝像機(jī)的視角往往不能滿足需要,例如由于距離的限制,某些超大尺寸的物體無法清晰的用視頻拍攝下來。目前來說,許多大型應(yīng)用場(chǎng)景都需要高清晰高覆蓋的拍攝,比如機(jī)場(chǎng)跑道、碼頭等,一個(gè)攝像機(jī)無法真正清晰的展示這些大型應(yīng)用場(chǎng)景的全貌,無法給出一種用戶滿意的高清視頻,更無法對(duì)視頻中的事物進(jìn)行高清分析,由此而帶來的就是高投入和多畫面展示,不僅僅視覺效果不好,也不能最大程度的滿足用戶的高清大畫面的需求。基于以上需求,圖像拼接技術(shù)解決了這一難題,該技術(shù)將來自不同視角的圖像拼接在一起得到高分辨率圖像,解決了用戶大場(chǎng)景高清晰監(jiān)控的迫切需求,用戶可以在一幅視頻圖像上瀏覽高清晰畫面。
目前智能視覺分析技術(shù)已經(jīng)趨于成熟,這和安防企業(yè)的努力是分不開的,他們是智能視覺分析技術(shù)的先行者,比如杭州海康威視數(shù)字技術(shù)股份有限公司等,這些企業(yè)的智能視覺分析技術(shù)發(fā)展或許可以成為榜樣,帶動(dòng)業(yè)內(nèi)企業(yè)的研發(fā)腳步,真正為智能視覺分析技術(shù)的應(yīng)用帶來革命性的變化。
四、結(jié)束語(yǔ)
雖然智能視覺分析技術(shù)其自身發(fā)展也存在諸多缺陷,但是智能視覺分析技術(shù)已經(jīng)逐漸成為安防行業(yè)發(fā)展的大方向,眾人拾柴火焰高,在國(guó)內(nèi)外眾多科研機(jī)構(gòu)、院校、大型安防企業(yè)對(duì)智能視覺分析技術(shù)不斷的研究和創(chuàng)新,智能視覺分析的運(yùn)用會(huì)逐漸大眾化,將來會(huì)更廣泛的應(yīng)用于金融、交通等各個(gè)領(lǐng)域中,普及到人們的日常生活當(dāng)中,真正發(fā)揮安全防范的預(yù)見作用,將危險(xiǎn)因素扼殺在搖籃里,給人們的工作和生活帶來安全保障。
評(píng)論