視頻監(jiān)控是視頻工程中重要的技術(shù)和應(yīng)用領(lǐng)域,支撐其發(fā)展的視頻技術(shù)在不到一個(gè)世紀(jì)的發(fā)展過(guò)程中,大致經(jīng)歷了3個(gè)跨越式的發(fā)展階段。20世紀(jì)30年代,以電視廣播為代表的視頻技術(shù)走出了實(shí)驗(yàn)室,進(jìn)入廣播電視臺(tái)和千萬(wàn)家庭,實(shí)現(xiàn)了從靜止圖像傳輸?shù)交顒?dòng)圖像傳輸?shù)目缭剑?0世紀(jì)80年代末,以會(huì)議電視、視頻監(jiān)控等為代表的視頻技術(shù)走出了實(shí)驗(yàn)室,進(jìn)入眾多的電視會(huì)議室、安防系統(tǒng),實(shí)現(xiàn)了從模擬視頻通信到數(shù)字視頻通信的跨越;如今,以智能視頻監(jiān)控(IVS)為代表的視頻技術(shù),正處在走出實(shí)驗(yàn)室、進(jìn)入到各行各業(yè)的應(yīng)用階段,將要實(shí)現(xiàn)從“機(jī)械”的視頻信息處理向智能化視頻信息處理的跨越。當(dāng)前中國(guó)正處在這一跨越的關(guān)鍵時(shí)段。智能視頻監(jiān)控只是智能視頻技術(shù)的一個(gè)部分,一個(gè)將視頻技術(shù)引入智能時(shí)代的部分。
智能化視頻監(jiān)控技術(shù)的進(jìn)一步發(fā)展,仍然是仿生學(xué)引導(dǎo)的結(jié)果
智能化是視頻監(jiān)控的亮點(diǎn),但又是視頻監(jiān)控技術(shù)的關(guān)鍵和難點(diǎn)
智能視頻監(jiān)控產(chǎn)業(yè)的發(fā)展需要采用新的符合智能監(jiān)控要求的體系結(jié)構(gòu)
基金項(xiàng)目:國(guó)家自然科學(xué)基金(60672134、61071091)
1IVS的發(fā)展歷程
和人類許多技術(shù)一樣,視頻技術(shù)也是仿生學(xué)引導(dǎo)的結(jié)果。視頻技術(shù)模仿人類眼睛的功能,把眼睛“拉”到實(shí)際難以到達(dá)的時(shí)空。電視廣播提供了大量有聲有色的娛樂(lè)節(jié)目,豐富了人們的文化生活;而視頻監(jiān)控的出現(xiàn),不僅提供了栩栩如生的現(xiàn)場(chǎng)信息,更解決了安全和生產(chǎn)方面的問(wèn)題,使人們深切感受到視頻技術(shù)的應(yīng)用范圍之廣和所起的重要作用。
視頻監(jiān)控已有三四十年的發(fā)展,最早安裝在銀行營(yíng)業(yè)廳的模擬視頻監(jiān)控設(shè)備,采用的是攝像頭加磁帶錄像機(jī);后來(lái)發(fā)展為數(shù)字監(jiān)控,實(shí)際上是數(shù)字視頻記錄(DVR),采用的是攝像頭、采集卡加計(jì)算機(jī)(主要用于壓縮、存儲(chǔ));近幾年的網(wǎng)絡(luò)視頻監(jiān)控裝置,主要是由嵌入式攝像機(jī)、傳輸網(wǎng)絡(luò)和計(jì)算機(jī)構(gòu)成。
智能視頻監(jiān)控經(jīng)過(guò)近四、五年的發(fā)展,已由簡(jiǎn)單的視頻監(jiān)控發(fā)展到具有人工智能的視頻監(jiān)控。視頻監(jiān)控的由來(lái)很簡(jiǎn)單,從需求層面來(lái)看:人們一直需要擴(kuò)大眼睛的功能,希望在必要的地方“掛上”一只“眼睛”進(jìn)行不間斷的監(jiān)控;從技術(shù)可行性的層面來(lái)看:傳感器技術(shù)從單點(diǎn)傳感器發(fā)展到多點(diǎn),從一維傳感器,發(fā)展到二維、三維傳感器(圖像、視頻傳感器),快速的發(fā)展為實(shí)現(xiàn)以看為主的監(jiān)控提供了可能。實(shí)際上這一過(guò)程再次體現(xiàn)了仿生學(xué)對(duì)技術(shù)發(fā)展的巨大影響力:監(jiān)控技術(shù)即智能化視頻監(jiān)控技術(shù)的進(jìn)一步發(fā)展,仍然是仿生學(xué)引導(dǎo)的結(jié)果。從仿生學(xué)的角度出發(fā),各種傳感器的出現(xiàn)均模仿人類的各種感覺(jué)的結(jié)果,從觸覺(jué)、嗅覺(jué)到聽(tīng)覺(jué)、視覺(jué),如模仿人耳的麥克風(fēng)和模仿人眼的攝像機(jī)。最近,如何在模仿視覺(jué)的基礎(chǔ)上模仿人腦功能,使現(xiàn)有的監(jiān)控設(shè)備具有一定的智能并、成為研究的焦點(diǎn)。智能的匯入使傳感的內(nèi)容、含義具有了主觀“感覺(jué)”,能夠給出分析、判斷和結(jié)論,而并非只對(duì)傳感對(duì)象的物理量作忠實(shí)的記錄。
早期的傳感器往往比較簡(jiǎn)單,傳感的是一維、單義的物理量,且易于分析、便于結(jié)論,如溫度傳感器,當(dāng)所獲得溫度超過(guò)某一閾值時(shí),說(shuō)明發(fā)生了異常情況。以攝像機(jī)為代表的視覺(jué)傳感器是一種多維、多義的傳感器:面對(duì)記錄的圖像難以判斷其內(nèi)容的含義,如難以判斷攝像機(jī)所面對(duì)的場(chǎng)景到底“發(fā)生”了什么事。現(xiàn)階段該問(wèn)題的解決主要靠人工完成:值班人員用眼睛對(duì)成百上千的攝像機(jī)信息進(jìn)行屏幕“監(jiān)視”,對(duì)存儲(chǔ)的海量信息進(jìn)行回放“檢索”,對(duì)可疑信息進(jìn)行人工對(duì)比、分析。但人(尤其是人的眼睛和大腦)是很容易疲勞的,有數(shù)據(jù)表明:如值班人員緊盯屏幕十幾分鐘后將會(huì)不自覺(jué)丟掉大部份信息。再如在倫敦地鐵案中,安保人員為找到一點(diǎn)有價(jià)值的信息,往往要花幾十小時(shí)查看大量的存儲(chǔ)磁帶。尋找不會(huì)疲勞的眼睛和大腦,分析所監(jiān)控的內(nèi)容,減輕負(fù)擔(dān),提高監(jiān)控效率,這就是視頻監(jiān)控智能化的目標(biāo)。
監(jiān)控智能化并不僅僅可以幫助我們緊盯屏幕,提高效率,還可以通過(guò)“智能”承擔(dān)并實(shí)現(xiàn)更多工作。目前最典型的“智能”主要集中在以下4個(gè)方面:
(1)攝像機(jī)保護(hù)。這是首要任務(wù),如果攝像機(jī)得不到保護(hù),其它的一切都免談。因此對(duì)攝像機(jī)被遮擋、被移動(dòng)、模糊等情況能及時(shí)自動(dòng)轉(zhuǎn)移、報(bào)警并通知維護(hù)人員。
(2)入侵檢測(cè)和運(yùn)動(dòng)目標(biāo)跟蹤。對(duì)非正常進(jìn)入監(jiān)視區(qū)域的可疑目標(biāo)及時(shí)檢測(cè),能夠識(shí)別單個(gè)或多個(gè)目標(biāo)的運(yùn)動(dòng)情況(如運(yùn)動(dòng)方向、運(yùn)動(dòng)速度等)。在檢測(cè)到可疑目標(biāo)后,發(fā)送控制指令使攝像機(jī)自動(dòng)跟蹤目標(biāo),在物體超出該攝像機(jī)監(jiān)控范圍之后,自動(dòng)通知鄰近的攝像機(jī)協(xié)同工作,繼續(xù)進(jìn)行跟蹤并發(fā)出報(bào)警信號(hào)。
(3)滯留物和搬移物報(bào)警。當(dāng)場(chǎng)景中(如候機(jī)室、會(huì)議室等)某一物體(如包裹、手提箱等)在敏感區(qū)域停留的時(shí)間過(guò)長(zhǎng),或原場(chǎng)景中存在的物體(如手提電腦、貴重儀表)被無(wú)故搬移時(shí),系統(tǒng)就發(fā)出報(bào)警信號(hào),同時(shí)自動(dòng)在前面的視頻畫(huà)面中查找放置滯留物或搬走原有物品的可疑人。
(4)群體行為分析。包含對(duì)人群、車流等目標(biāo)的正常行為和異常行為分析。能夠?qū)?chǎng)景中群體的正常行為進(jìn)行分析,如統(tǒng)計(jì)穿越出入口或指定區(qū)域的人或車的數(shù)量、高速公路交通流量,識(shí)別人群的整體運(yùn)動(dòng)特征,包括速度、方向等。也能夠?qū)?chǎng)景中群體的異常行為進(jìn)行分析和判斷,如檢測(cè)、分類、跟蹤和記錄過(guò)往行人、車輛及其他可疑物體,判斷公路上是否有車輛非法停靠、是否有故障車輛,是否有行人及車輛在禁區(qū)內(nèi)發(fā)生長(zhǎng)時(shí)間徘徊、停留、逆行等行為,檢測(cè)公共場(chǎng)所是否有人員的集聚、奔跑、斗毆等異常行為。
當(dāng)然,智能視頻監(jiān)控能夠做到的事不只如此。今后它可以幫我們做更多的事,但前提是我們要有足夠的智能來(lái)設(shè)計(jì)并實(shí)現(xiàn)這樣的智能視頻監(jiān)控系統(tǒng)。