智能視頻監(jiān)控技術(shù)及其應(yīng)用分析
2010/08/03
1.引言
隨著計算機、網(wǎng)絡(luò)、信息與通信、音視頻編解碼、流媒體等技術(shù)的日趨成熟與完善,在安防市場巨大的需求推動下,視頻監(jiān)控技術(shù)正在向著數(shù)字化、網(wǎng)絡(luò)化、智能化的方向發(fā)展,視頻監(jiān)控由目視解釋轉(zhuǎn)變?yōu)樽詣咏忉屖且曨l監(jiān)控技術(shù)的飛躍,也是安防技術(shù)發(fā)展的必然。
在2008年北京安防展上,一批視頻監(jiān)控前端設(shè)備廠家分別展出了各自的智能視頻監(jiān)控產(chǎn)品,標(biāo)志著智能視頻監(jiān)控技術(shù)已經(jīng)從概念轉(zhuǎn)化為產(chǎn)品,并逐步進入實際應(yīng)用。本文結(jié)合智能視頻監(jiān)控應(yīng)用系統(tǒng)開發(fā)與部署的經(jīng)驗,對智能視頻監(jiān)控技術(shù)及其應(yīng)用現(xiàn)狀與前景進行分析。
2.智能視頻監(jiān)控技術(shù)
智能視頻監(jiān)控技術(shù)源自計算機視覺與人工智能的研究,它的主要研究目標(biāo)是利用計算機視覺技術(shù)、圖像視頻處理技術(shù)和人工智能技術(shù)對監(jiān)控視頻的內(nèi)容進行描述、理解和分析,并能根據(jù)分析的結(jié)果對視頻監(jiān)控系統(tǒng)進行控制,從而使視頻監(jiān)控系統(tǒng)具有較高層次的智能化水平。圖1給出了一個典型的智能視頻監(jiān)控系統(tǒng)的基本工作流程。
圖1:智能視頻監(jiān)控系統(tǒng)工作流程
智能視頻分析模塊獲取視頻序列后,首先通過圖像恢復(fù)或超分辨率復(fù)原技術(shù)提高圖像質(zhì)量,然后對場景中的目標(biāo)進行檢測、分類和跟蹤,進而實現(xiàn)視頻內(nèi)容的分析理解,包括場景中的異常檢測、人的身份識別以及視頻內(nèi)容的理解描述等。最后根據(jù)設(shè)定的規(guī)則產(chǎn)生報警,進而觸發(fā)后續(xù)業(yè)務(wù)處理。各步驟介紹如下:
1. 目標(biāo)檢測將輸入的視頻圖像中變化劇烈的圖像區(qū)域從圖像背景中分離出來,它處于視頻監(jiān)控技術(shù)的前端,是各種后續(xù)處理的基礎(chǔ)。目前,算法主要包括背景減法、相鄰幀差法和光流法等。
2. 目標(biāo)分類利用一些圖像特征值實現(xiàn)目標(biāo)類型(一般是人和車)的甄別。用于目標(biāo)分類的特征有空間特征和時間特征兩種,空間特征包括目標(biāo)輪廓、目標(biāo)尺寸、目標(biāo)紋理等,時間特征包括目標(biāo)大小的變化、運動的速度等。
3. 目標(biāo)跟蹤依據(jù)目標(biāo)及其所在的環(huán)境,選擇能唯一表示目標(biāo)的特征,并在后續(xù)幀中搜索與該特征最匹配的目標(biāo)位置。常用的跟蹤算法包括:基于特征的跟蹤算法,基于3D模型的跟蹤,基于主動輪廓模型的跟蹤以及基于運動估計的跟蹤等。
4. 智能分析。它位于智能視頻監(jiān)控的高級階段,是實現(xiàn)視頻監(jiān)控智能化的關(guān)鍵。包括異常檢測、身份識別及視頻內(nèi)容理解等:
異常檢測中典型的異常包括用戶定義的異常情況和非常規(guī)事件,檢測方法分為基于模型的方法和基于分類器的方法;
身份識別包括人臉識別和步態(tài)識別;
視頻內(nèi)容理解是指在對序列進行低級處理的基礎(chǔ)上,對場景中的事件進行分析和識別,用自然語言等加以描述。
根據(jù)目前智能視頻分析技術(shù)的成熟度,智能視頻監(jiān)控應(yīng)用場景主要包括人數(shù)統(tǒng)計、車牌識別、事件檢測和視頻診斷等。
人數(shù)統(tǒng)計:統(tǒng)計穿越入口或指定區(qū)域的人或物的數(shù)量。例如可為商場統(tǒng)計每天的客流量。
車牌識別:識別車輛的形狀、顏色、車牌號碼等特征,并反饋給監(jiān)控者。此技術(shù)可應(yīng)用于車輛黑名單追蹤。
事件檢測:對視頻進行周界監(jiān)測與異常行為分析。異常行為包括雙向越界、單向越界、進入禁區(qū)、離開禁區(qū)、徘徊、無人值守、驟變、人員聚集、煙霧檢測、快速運動、逆行、打架等事件。
視頻診斷:對視頻圖像出現(xiàn)的雪花、滾屏、模糊、偏色、畫面凍結(jié)、增益失衡和云臺失控等常見攝像頭故障做出準(zhǔn)確判斷并發(fā)出報警信息。該技術(shù)可應(yīng)用于平安城市的建設(shè)中,自動檢測攝像機的狀態(tài),從而減輕維護人員的工作強度。
3.智能視頻監(jiān)控應(yīng)用
3.1 智能視頻監(jiān)控產(chǎn)品形態(tài)
根據(jù)智能視頻分析模塊所處的位置可將智能視頻監(jiān)控產(chǎn)品分為兩種形態(tài):前端智能和后端智能。其中,前端智能通過DSP方式實現(xiàn),將智能視頻分析算法加載在視頻服務(wù)器、數(shù)字硬盤錄像機、網(wǎng)絡(luò)攝像機等前段設(shè)備中,對攝像頭采集的視頻數(shù)據(jù)直接進行分析。由于利用了DSP強大的硬件處理能力,同時前端設(shè)備的架設(shè)針對具體的智能視頻分析算法優(yōu)化,從而提高了視頻分析準(zhǔn)確率,因此目前智能視頻監(jiān)控產(chǎn)品多為前端智能。后端智能通過純軟件實現(xiàn),運行于普通PC或服務(wù)器上,構(gòu)成視頻分析服務(wù)器。視頻分析服務(wù)器獲取壓縮的視頻流后,對視頻進行解碼、分析和處理。后端智能的優(yōu)勢在于可以方便的與其它視頻監(jiān)控應(yīng)用軟件融合,而且不需要對已有的前端設(shè)備進行替換升級,保護原有投資,同時智能視頻分析單元可被多路視頻分析分時復(fù)用,降低整個系統(tǒng)的投入。但后端智能受限于視頻分析服務(wù)器的處理能力,而且已有前端設(shè)備的架設(shè)往往不滿足智能視頻分析的要求,導(dǎo)致視頻分析的準(zhǔn)確率較低。
3.2 智能視頻監(jiān)控系統(tǒng)實施
隨著智能視頻監(jiān)控產(chǎn)品日漸成熟,智能視頻監(jiān)控技術(shù)開始在視頻監(jiān)控系統(tǒng)中逐步應(yīng)用,大大提高了視頻信息的價值。但是,要充分發(fā)揮智能視頻監(jiān)控技術(shù)在視頻監(jiān)控系統(tǒng)中的作用,卻不是想象中那么簡單,主要面對以下幾點挑戰(zhàn)。
智能視頻監(jiān)控技術(shù)運用數(shù)學(xué)模型來描述真實世界,并試圖利用數(shù)學(xué)模型來分析視頻數(shù)據(jù),但是實際環(huán)境比數(shù)學(xué)模型要復(fù)雜得多,智能視頻分析受到諸多因素的干擾而影響其檢測準(zhǔn)確率,存在較大程度的漏報和誤報,當(dāng)漏報和誤報達到一定比例,視頻檢測就失去了它的意義。智能視頻監(jiān)控產(chǎn)品生產(chǎn)廠家針對各種實際應(yīng)用環(huán)境,對算法進行了大量的優(yōu)化以排除干擾,提高了智能視頻檢測的準(zhǔn)確率,但是實際應(yīng)用環(huán)境千差萬別,生產(chǎn)廠家要對各種環(huán)境進行優(yōu)化,勢必增加研發(fā)成本與產(chǎn)品版本管理的負擔(dān)。
由于前端設(shè)備架設(shè)環(huán)境對智能視頻分析的影響,在安裝前端設(shè)備時,需要根據(jù)智能視頻監(jiān)控應(yīng)用場景,針對性的架設(shè)。如進行人流或者車流統(tǒng)計時,攝像機視角與人或車行進方向垂直會達到比較好的分析效果;而應(yīng)用在車牌識別時,攝像機視角又需要能夠從正面拍攝到車牌,并且選擇攝像機時要考慮低照度、逆光、車速等因素。不同的應(yīng)用場景對目標(biāo)對象在整個視頻中的比例或者像素也有相應(yīng)要求。
所有的這些要求,需要施工調(diào)試人員對智能視頻分析應(yīng)用場景有比較深入的了解,在施工時針對性的選型和架設(shè)前端設(shè)備,不斷的調(diào)試以達到最佳分析效果。因此,智能視頻監(jiān)控系統(tǒng)的施工要求比普通視頻監(jiān)控系統(tǒng)要高很多。
前文描述了智能視頻監(jiān)控的若干主要應(yīng)用場景,而用戶的需求并不局限于這些場景,常常是上述幾種應(yīng)用場景的混合,或者介于幾個應(yīng)用場景之間,如何選擇智能視頻分析的算法和產(chǎn)品形態(tài)滿足用戶的需求,是智能視頻監(jiān)控系統(tǒng)開發(fā)的主要問題。同時,由于智能視頻分析主要是檢測視頻中的事件,并不提供這些事件的統(tǒng)計分析,也就是說,如何進一步挖掘智能視頻分析檢測到的事件信息的價值,以此為基礎(chǔ)開發(fā)出更高層次的增值應(yīng)用,是推動智能視頻監(jiān)控廣泛應(yīng)用的關(guān)鍵,也是智能視頻監(jiān)控應(yīng)用系統(tǒng)開發(fā)的關(guān)鍵。
- 技術(shù)到實戰(zhàn)的轉(zhuǎn)化
基于智能視頻監(jiān)控技術(shù),可以提出很多實用性很高的應(yīng)用,但是這些應(yīng)用用于實戰(zhàn)時,卻暴露出技術(shù)的局限。以攝像機自動接力為例,環(huán)境中如果只有一個移動目標(biāo),智能視頻分析可以很快的定位到移動目標(biāo),并實施跟蹤,攝像機之間的接力跟蹤也得以實現(xiàn),但是一旦環(huán)境中不只一個移動目標(biāo),單純的依靠智能視頻監(jiān)控技術(shù),并不能確定要跟蹤的目標(biāo)。而且,由于攝像機跟蹤時需要快球的配合,而各種快球的性能指標(biāo)并不相同,快球能否保持與智能視頻分析發(fā)出的跟蹤指令一致,也是智能視頻跟蹤進入實戰(zhàn)的障礙。
很明顯,具備智能視頻監(jiān)控能力的前端設(shè)備價格會高出不少,其直接影響是增加了系統(tǒng)建設(shè)成本。但是,增加系統(tǒng)建設(shè)成本的不只是前端設(shè)備價格,還有工程施工要求提高帶來的成本增加。如上文所述,不同的應(yīng)用場景對前端設(shè)備的架設(shè)有不同的特殊要求,這就導(dǎo)致攝像機可能只能為專門的應(yīng)用場景使用,如車流統(tǒng)計和車牌識別就不能用相同的攝像機,如果在路口要實現(xiàn)兩種應(yīng)用場景,必須安裝兩個攝像機才能滿足要求;在智能視頻跟蹤應(yīng)用中,需要兼顧全局與局部,就必須在相同區(qū)域安裝至少兩個攝像機,對快球也有特殊要求;而某廠家的煙霧檢測產(chǎn)品,為提高檢測的準(zhǔn)確率,設(shè)計了專門的雙鏡頭攝像機。智能視頻監(jiān)控系統(tǒng)建設(shè)的方方面面都可能帶來建設(shè)成本的增加。
盡管面對不少挑戰(zhàn),智能視頻監(jiān)控系統(tǒng)還是在某些領(lǐng)域逐漸進入實用。針對這些挑戰(zhàn),要建設(shè)實戰(zhàn)的智能視頻監(jiān)控系統(tǒng),除了用戶的應(yīng)用需求外,還需要考慮監(jiān)控場景的復(fù)雜程度、監(jiān)控環(huán)境、以及算法選用和參數(shù)的合理設(shè)置等。此外,合理選擇攝像機及其安裝位置與角度,也是非常重要的。在智能視頻監(jiān)控系統(tǒng)的開發(fā)與實施中,應(yīng)注意以下四點:
- 根據(jù)系統(tǒng)的需求選擇合適的產(chǎn)品形態(tài)
前端智能和后端智能各具有缺點,前端智能和后端智能具有各自適用的場景,因此,在搭建視頻監(jiān)控系統(tǒng)時,應(yīng)清楚兩者的區(qū)別,從而進行合適的選擇。一般而言,對于分析實時性強或者算法對環(huán)境要求高的應(yīng)用場景,如火車軌道闖入、非法拋灑物等,應(yīng)選擇前端智能;若算法對環(huán)境的要求不苛刻,可采用后端智能,從而減少資金的投入,視頻診斷是后端智能的最好應(yīng)用。
合理選擇攝像機及其安裝位置與角度,是為了在條件允許的情況下盡量降低監(jiān)控場景的復(fù)雜度,凸出有效的信息。對于不同的應(yīng)用場景,攝像機的選用及安裝過程是不同的。對于人數(shù)統(tǒng)計,攝像頭的角度要求很重要,應(yīng)盡量垂直于人的頭部。通常來講,當(dāng)攝像頭垂直向下對著行人頭部時,由于遮擋較少,統(tǒng)計精度較高。而當(dāng)攝像頭角度接近水平時,由于行人互相遮擋,難度較大。對于車牌識別,應(yīng)選用清晰度高、信噪比大、低照度功能的攝像機。同時,為了降低環(huán)境光照對攝像機成像的影響,還應(yīng)選用補光燈。除此之外,攝像機的架設(shè)高度、位置也直接影響到車牌的識別效果。對于事件檢測,大俯視覺角度會有較好的檢測效果,同時檢測的目標(biāo)大小也要滿足檢測算法的要求。由此可見,對于智能視頻監(jiān)控系統(tǒng),現(xiàn)場施工調(diào)試是比較繁瑣的,但同時這也是比較重要的,它關(guān)系到智能視頻監(jiān)控系統(tǒng)的檢測準(zhǔn)確率。
- 應(yīng)合理選用算法及設(shè)置相關(guān)參數(shù)
智能視頻技術(shù)運用數(shù)學(xué)模型來描述真實世界,并試圖利用數(shù)學(xué)模型來分析視頻數(shù)據(jù),因此,在設(shè)計智能視頻監(jiān)控系統(tǒng)時,應(yīng)選擇與監(jiān)控場景最吻合的數(shù)學(xué)模型,保證檢測的精度。如,對于無人值守應(yīng)用,可選用移動偵測、人數(shù)統(tǒng)計及人物出現(xiàn)等算法。其中,移動偵測算法無法區(qū)分人或物,而且畫面中稍微有動靜就會產(chǎn)生告警,因此會存在大量的誤報;人數(shù)統(tǒng)計算法只能統(tǒng)計進入?yún)^(qū)域或離開區(qū)域的人數(shù)變化情況,無法檢測區(qū)域中是否有人存在,因此會有大量的漏報情況發(fā)生。因此,人物出現(xiàn)算法更適合無人值守應(yīng)用。同時,選用了一種分析算法后,也應(yīng)不斷調(diào)整監(jiān)控環(huán)境和調(diào)試算法參數(shù),如目標(biāo)尺寸的大小、檢測靈敏度、畫面搜索范圍等,從而使得監(jiān)控環(huán)境與智能分析技術(shù)內(nèi)部的數(shù)學(xué)模型達到最大的一致性。
- 應(yīng)發(fā)掘智能視頻監(jiān)控技術(shù)與實際應(yīng)用的合理切入點
智能視頻技術(shù)經(jīng)過多年的研究,有些算法已相當(dāng)成熟,但如何發(fā)揮其最大優(yōu)勢,尋求更多的應(yīng)用模式還需進一步的探討和嘗試。如PTZ跟蹤,算法已比較成熟,在演示系統(tǒng)中能獲得較好的效果,但在實際應(yīng)用中由于檢測場景復(fù)雜,畫面中人員過多,導(dǎo)致攝像頭無法定位需跟蹤的人員,因此在實際應(yīng)用中還無法推廣此項業(yè)務(wù)。對于車牌識別,車牌黑名單跟蹤是車牌識別的常見應(yīng)用模式,除此之外,還可以將識別出的同一車牌的攝像頭聯(lián)系起來,形成車牌識別新的應(yīng)用模式:車輛跟蹤。總之,市場需求是智能視頻監(jiān)控發(fā)展的強大推動力,只有立足技術(shù),面向市場,發(fā)掘應(yīng)用,智能視頻監(jiān)控才能得到廣泛應(yīng)用。
4.結(jié)束語
智能視頻監(jiān)控技術(shù)進入實用,極大提高了視頻信息的價值,具有傳統(tǒng)視頻監(jiān)控?zé)o法比擬的優(yōu)勢,但是因為該技術(shù)尚欠缺成熟度和穩(wěn)定性,集成商智能視頻監(jiān)控系統(tǒng)建設(shè)施工經(jīng)驗不足,它投入實戰(zhàn)還面臨不少挑戰(zhàn)。經(jīng)驗告訴我們,解決問題的方法總是比問題多,面對這些挑戰(zhàn),一方面,我們可以依靠技術(shù)的進一步發(fā)展來解決,單純技術(shù)不能解決的問題,可以輔以非技術(shù)手段解決;另一方面,我們可以依靠智能視頻監(jiān)控系統(tǒng)建設(shè)施工經(jīng)驗的積累。智能視頻監(jiān)控系統(tǒng)的應(yīng)用剛剛起步,它所發(fā)掘的視頻信息價值已經(jīng)為用戶帶來全新的視頻監(jiān)控體驗,面對巨大的市場需求,智能視頻監(jiān)控系統(tǒng)應(yīng)該同時也有能力為用戶創(chuàng)造更大的價值。
C114中國通信網(wǎng)
相關(guān)閱讀: