1.1視訊技術在多媒體業務中的應用
隨著互聯網的飛速發展,消費類電子、通信、影視及廣播、計算機技術日益緊密地結合起來,使得基于互聯網的多媒體產業成為本世紀初發展最快、規模最大的產業之一。
多媒體是建立在計算機圖形學、人機接口技術、傳感技術和人工智能等學科基礎上的綜合性極強的高新信息技術,由其帶來的虛擬現實技術能創造身臨其境的神奇 效果,從而廣泛應用于影視、廣告、游戲、教育、會展等領域。2002年全球多媒體產業產值達300億美元,今年將突破400億美元。前不久,北京經濟廣播 多媒體財經頻道正式運行,實現了廣播節目既可以聽又可以看的多項全新的廣播服務功能。北京經濟廣播的多媒體財經頻道可以全天24小時不間斷地提供全球的外 匯市場的行情、報價、市場信息以及與外匯市場相關的國內國際重要財經新聞等信息,同時還可以使用節目中提供的“匯眼”市場分析軟件,自己對市場進行分析, 研判外匯市場的走勢。從這個實際例子中也可以看到多媒體業務的大部分應用都與視訊技術相關。在中國市場,視訊技術主要應用于政府會議。
由于政府的工作性質和政府對提高辦公效率的需求,這部分應用還會繼續增加。另一方面,隨著以聯通、網通為代表的新電信運營商的崛起和企業內部基于IP的寬帶基礎網絡的建設,把需要占用較多帶寬的視頻通訊應用到寬帶網絡上,將成為視訊技術加速發展的新動力。
2.1視頻壓縮標準的發展
傳統的壓縮編碼是建立在香農(Shannon)信息論基礎上的,它以經典的集合論為基礎,用統計概率模型來描述信源,但它未考慮信息接受者的主觀特性及 事件本身的具體含義、重要程度和引起的后果。因此,壓縮編碼的發展歷程實際上是以香農信息論為出發點,一個不斷完善的過程。
從不同角度考慮,數據壓縮縮碼具有不同的分類方式。
按信源的統計特性可分為預測編碼、變換編碼、矢量量化編碼、子帶-小波編碼、神經網絡編碼方法等。
數眼的視覺特性可能基于方向濾波的圖像編碼、基于圖像輪廓-紋理的編碼方法等。
按圖像傳遞的景物特性可分為分形編碼、基于內容的編碼方法等。
隨著產業化活動的進一步開展,國際標準化組織于1986年、1998年先后成立了聯合圖片專家組JPEG和運動圖像壓縮編碼組織MPEG。GPEG專家 組主要致力于靜態圖像的幀內壓縮編碼標準ISO/IEC10918的制定;MPEG專家組主要致力于運動圖像壓縮編碼標準的制定。經過專家組不懈的努力, 基于第一代壓縮編碼方法(如預測編碼、變換編碼、熵編碼及運動補償等)的三種壓縮編碼國際標
視頻技術
眾所周知,人類通過視覺獲取的信息量約占總信息量的70%,而且視頻信息具有直觀性、可信性等一系列優點。所以,視訊技術中的關鍵技術就是視頻技術。
目前,視頻技術的應用范圍很廣,如網上可視會議、網上可視電子商務、網上政務、網上購物、網上學校、遠程醫療、網上研討會、網上展示廳、個人網上聊天、可視咨詢等業務。
但是,以上所有的應用都必須壓縮。傳輸的數據量之大,單純用擴大存儲器容量、增加通信干線的傳輸速率的辦法是不現實的,數據壓縮技術是個行之有效的解決 辦法,通過數據壓縮,可以把信息數據量壓下來,以壓縮形式存儲、傳輸,既節約了存儲空間,又提高了通信干線的傳輸效率,同時也可使計算機實時處理音頻、視 頻信息,以保證播放出高質量的視頻、音頻節目??梢?,多媒體數據壓縮是非常必要的。由于多媒體聲音
1 2 3 下一頁 |
圖像編碼方法可分為兩代:第一代是基于數據統計,去掉的是數據冗余,稱為低層壓縮編碼方法;第二代是基于內容,去掉的是內容冗余,其中基于對象 (Object-Based)方法稱為中層壓縮編碼方法,其中基于語義(Syntax-Based)方法稱為高層壓縮編碼方法。
基于內容壓縮編碼方法代表新一代的壓縮方法,也是目前最活躍的領域,最早是由瑞典的Forchheimer提出的,隨后日本的Harashima等人也展示了不少研究成果。
2.2運動估計和補償
MPEG-4中提供了基于塊的運動估計和補償技術來有效地利用各個VOP中視頻內容上的時間冗余。一般,運動估計和補償可以看作針對任意形狀圖像序列的 塊匹配技術的延伸。塊匹配過程對于標準宏塊使用;預測誤差和用于預測的宏塊運動向量一起被編碼;高級運動補償模式支持重疊塊運動補償,可對8×8塊運動向 量進行編碼。為了使運動估計得到高編碼效率,預測圖像和被預測圖像越相似越好,所以在運動估計之前要先進行補償。在目標邊界上的MB先用水平填補而后用垂 直填補,其余完全在VOP之外的MB用擴張填補。
2.3紋理編碼
紋理指的是I-VOP圖像和P/B-VOP經運動補償后殘留的圖像信息。紋理一般在變換域進行壓縮編碼和熵編碼。
準正式編輯已經出版:靜態圖像壓縮編碼標準(JPEG);數字聲像儲存壓縮編碼標準(MPEG-1);通用視頻圖像壓縮編碼標準(MPEG-2)。
隨后,MPEG專家組于1999年2月正式公布了MPEG-4(ISO/IEC14496)V1.0版本。同年底MPEG-4V2.0版本亦告完成,且 于2000年年初正式成為國際標準。MPEG-4標準將眾多的多媒體應用集成于一個完整的框架內,旨在為多媒體通信及應用環境提供標準的算法及工具,從而 建立起一種能被多媒體傳輸、存儲、檢索等應用普遍采用的統一數據格式,并根據不同的應用需求,現場配置解碼器,開放的編碼系統也可隨時加入新的有效的算法 模塊。為支持對視頻內容的訪問,MPEG-4提出了“視頻對象”的概念。
目前,MPEG專家組又推出了專門支持多媒體信息且基于 內容檢索的編碼方案MPEG-7及多媒體框架標準MPEG-21。另外,由ITU-T和MPEG聯合開發的新標準H.264是最新的視頻編碼算法。為了降 低碼率,獲得盡可能更好圖像質量,H.264標準吸取了MPEG-4的長處,具有更高的壓縮比、更好的信道適應性,必將在數字視頻的通信和存儲領域得到廣 泛的應用,其發展潛力不可限量。
3MPEG-4的主要技術
MPEG-4具有很多優點。它的壓縮率可以超過100 倍,而仍保有極佳的音質和畫質;它可利用最少的數據,獲取最佳的圖像質量,滿足低碼率應用的需求;它更適合于交互式AV服務及遠程監控。為了滿足各種應用 的需求,MPEG-4標準的使用范圍相當龐大,具有廣泛的適應性和可擴展性。
3.1形狀編碼
形狀信息的獲得首先要對圖形進行分析和分割,把各個代表不同內容的目標分割后再用形狀表示。形狀信息通常用二值Alpha平面和灰度Alpha平面來表 示。二值Alpha平面可用臨近信息進行算術編碼(CAE);灰度Alpha平面可用運動補償加DCT變換方式類似紋理編碼一樣進行編碼。
其中用于圖像壓縮的變換有離散Forier變換(DFT)、離散小波變換(DWT)、奇異值分解(SVD)、K-L變換、Walsh變換、 Hadamar
上一頁 1 2 3 下一頁 |
3.2伸屈性
視頻的伸屈性,包括空間伸屈性和時間伸屈性??臻g伸屈性可以得到不同的空間分辨率,時間伸屈性可得到不同的時間分辨率。每種伸屈都有多層,在只有高低2層的情況下,底層指的是基本層,而高層指的是增強層。
3.3差錯回避
VLC碼中的一個比特錯誤會引起同步丟失,而運動補償則會引起錯誤傳遞。
MPEG-4的差錯回避有三個方面:重同步、數據恢復和錯誤隱藏。
重同步,是指差錯被檢測后,解碼器和碼流之間重新同步的技術。一般來說,這種方法會將錯誤之前的同步點到重建的同步點之間的數據丟棄。不過這些丟棄的數據可以用其他的技術進行恢復和實施錯誤隱藏。
數據恢復工具在解碼器和碼流重新建立起同步后用來恢復丟棄的數據。這些工具不是簡單的用容錯碼恢復,而是用一種差錯回避手段,即用可逆VLC碼字進行VLC編碼。
錯誤隱藏,在重同步有效地將錯誤定位后可以很容易處理。為了進一步提高錯誤隱匿的能力,有必要增加錯誤定位能力,特別是數據分割可以用來提高錯誤定位能力。
4 結束語
隨著經濟的發展、通信技術的日益提高,客戶已不僅僅滿足于語音、電報、電子郵件等的通信方式,對視訊業務的需求呈迅猛發展的趨勢。特別是美國 “9•11"事件后,全球的視訊業務需求猛增?,F有的視訊業務應用主要以政府部門會議為主,在遠程教育、遠程醫療以及商用方面的應用很少,而國外90%的 企業都在使用視訊業務,已是“信息高速公路”的主體通信業務,因此市場潛力巨大。在視訊業務中使用的視頻壓縮技術,其發展和應用前景也是非常廣闊的。
上一頁 1 2 3 |