首頁>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

H.264--保證清晰視頻的尖端武器

2004/12/02

  如果您對比使用過視維和其他品牌的視頻會議產(chǎn)品,您會發(fā)現(xiàn),在相同的網(wǎng)絡(luò)條件下,使用相同的機器,視維產(chǎn)品的視頻清晰度和流暢度要遠遠高于其他產(chǎn)品,視維是如何解決“視頻質(zhì)量”和“網(wǎng)絡(luò)帶寬占用”這個矛盾的呢?

  在視頻會議應(yīng)用中,視頻質(zhì)量和網(wǎng)絡(luò)帶寬占用是矛盾的,通常情況下視頻流占用的帶寬越高則視頻質(zhì)量也越高;如要求高質(zhì)量的視頻效果,那么需要的網(wǎng)絡(luò)帶寬也越大;解決這一矛盾的鑰匙當(dāng)然是視頻編解碼技術(shù)。評判一種視頻編解碼技術(shù)的優(yōu)劣,是比較在相同的帶寬條件下,哪個視頻質(zhì)量更好;在相同的視頻質(zhì)量條件下,哪個占用的網(wǎng)絡(luò)帶寬更少。

  視頻編解碼技術(shù)有兩套標(biāo)準(zhǔn),國際電聯(lián)(ITU-T)的標(biāo)準(zhǔn)H.261、H.263、H.263+等;還有ISO 的MPEG標(biāo)準(zhǔn)Mpeg1、Mpeg2、Mpeg4等等。H.264/AVC是兩大組織集合H.263+和Mpeg4的優(yōu)點聯(lián)合推出的最新標(biāo)準(zhǔn),最具價值的部分無疑是更高的數(shù)據(jù)壓縮比。在同等的圖像質(zhì)量條件下,H.264的數(shù)據(jù)壓縮比能比H.263高2倍,比MPEG-4高1.5倍。

  以下我們簡單介紹H.264的概念和發(fā)展,并探討H.264技術(shù)實用化的可能性

H.264/AVC是什么?

  H.264/AVC標(biāo)準(zhǔn)是由ITU-T和ISO/IEC聯(lián)合開發(fā)的,定位于覆蓋整個視頻應(yīng)用領(lǐng)域,包括:低碼率的無線應(yīng)用、標(biāo)準(zhǔn)清晰度和高清晰度的電視廣播應(yīng)用、Internet上的視頻流應(yīng)用,傳輸高清晰度的DVD視頻以及應(yīng)用于數(shù)碼相機的高質(zhì)量視頻應(yīng)用等等。

  ITU-T給這個標(biāo)準(zhǔn)命名為H.264(以前叫做H.26L),而ISO/IEC稱它為MPEG-4 高級視頻編碼(Advanced Video Coding,AVC),并且它將成為MPEG-4標(biāo)準(zhǔn)的第10部分。既然AVC是當(dāng)前MPEG-4標(biāo)準(zhǔn)的拓展,那么它必然將受益于MPEG-4開發(fā)良好的基礎(chǔ)結(jié)構(gòu)(比如系統(tǒng)分層和音頻等)。很明顯,作為MPEG-4高級簡潔框架(Advanced Simple Profile,ASP)的MPEG-4 AVC將會優(yōu)于當(dāng)前的MPEG-4視頻壓縮標(biāo)準(zhǔn),它將主要應(yīng)用在具有高壓縮率和分層次質(zhì)量需求的方向。

  就像在下邊“視頻編碼歷史”表格中看到的,ITU-T和ISO/IEC負(fù)責(zé)以前所有的國際視頻壓縮標(biāo)準(zhǔn)的定制。到目前為止,最成功的視頻標(biāo)準(zhǔn)是MPEG-2,它已經(jīng)被各種市場領(lǐng)域所廣泛接受比如DVD、數(shù)字電視廣播(覆蓋電纜和通訊衛(wèi)星)和數(shù)字機頂盒。自從MPEG-2技術(shù)產(chǎn)生以來,新的H.264/MPEG-4 AVC標(biāo)準(zhǔn)在編碼效率和質(zhì)量上有了巨大的提高。隨著時間的過去,在許多現(xiàn)有的應(yīng)用領(lǐng)域,H.264/MPEG-4 AVC將會取代MPEG-2和MPEG-4,包括一些新興的市場(比如ADSL視頻)。

數(shù)字視頻編解碼技術(shù)的演變

  國際標(biāo)準(zhǔn)通常是由國際標(biāo)準(zhǔn)化組織ISO在國際電信聯(lián)盟 ITU的技術(shù)建議的基礎(chǔ)上制訂的。數(shù)字視頻編解碼標(biāo)準(zhǔn)也經(jīng)歷了多次變革,其演變進程如圖所示:


  很明顯,H264標(biāo)準(zhǔn)使運動圖像壓縮技術(shù)上升到了一個更高的階段,在較低帶寬上提供高質(zhì)量的圖像傳輸是H.264的應(yīng)用亮點。H.264的推廣應(yīng)用對視頻終端、網(wǎng)守、網(wǎng)關(guān)、MCU等系統(tǒng)的要求較高,將有力地推動視頻會議軟設(shè)備在各個方面的不斷完善。

H.264的核心競爭力

  H.264最具價值的部分無疑是更高的數(shù)據(jù)壓縮比。壓縮技術(shù)的基本原理就是將視頻文件中的非重要信息過濾,以便讓數(shù)據(jù)能夠更快地在網(wǎng)絡(luò)中傳輸。在同等的圖像質(zhì)量條件下,H.264的數(shù)據(jù)壓縮比能比當(dāng)前DVD系統(tǒng)中使用的MPEG-2高2-3倍,比MPEG-4高1.5-2倍。正因為如此,經(jīng)過H.264壓縮的視頻數(shù)據(jù),在網(wǎng)絡(luò)傳輸過程中所需要的帶寬更少,也更加經(jīng)濟。

  在MPEG-4需要6Mbps的傳輸速率匹配時,H.264只需要3Mbps-4Mbps的傳輸速率。我們用交通運輸來做更加形象的比喻:同樣是用一輛卡車運輸一個大箱子,假如MPEG-4能把箱子減重一半,那么H.264能把箱子減重為原來的1/4,在卡車載重量不變的情況下,H.264比MPEG-2讓卡車的載貨量增加了二倍。

  H.264獲得優(yōu)越性能的代價是計算復(fù)雜度的大幅增加,例如分層設(shè)計、多幀參論、多模式運動估計、改進的幀內(nèi)預(yù)測等,這些都顯著提高了預(yù)測精度,從而獲得比其他標(biāo)準(zhǔn)好得多的壓縮性能。

  不斷提高的硬件處理能力和不斷優(yōu)化的軟件算法是H.264得以風(fēng)行的生存基礎(chǔ)。早在十年前,主頻為幾十兆的CPU就達到了頂級,而如今普通的臺式機,CPU的主頻已經(jīng)高達幾千兆。按照摩爾定律的說法,芯片單位面積的容量每18個月翻一番,因此H.264所增加的運算復(fù)雜度相對于性能提升效果而言微不足道。更何況新的計算方法層出不窮,也相對緩解H.264對處理速度的饑渴需求。

H.264 與MPEG-4的比較

1、在極低碼率(32-128Kbps)的情況下,H.264與MPEG-4相比具有性能倍增效應(yīng),即: 相同碼率的H.26L媒體流和MPEG-4媒體流相比,H.26L擁有大約3個分貝的增益(畫質(zhì)水平倍增)。 32Kbps的H.26L媒體流,其信躁比與128K的MPEG-4媒體流相近。即在同樣的畫面質(zhì)量下,H.264的碼率僅僅為MPEG-4的四分之一。


  2、 H.26L在中低碼率下與MPEG-4比較: 在中低碼率(32-128Kbps)的情況下,H.26L與MPEG-4相比具有性能倍增效應(yīng)。


  3、H.264與MPEG-4的畫面效果比較

  下圖左為MPEG-4在碼率為1Mbps情況下的畫面質(zhì)量,右為H.26L在碼率為512Kbps情況下的畫面質(zhì)量。同樣體現(xiàn)了H.26L的性能倍增。


  H.264標(biāo)準(zhǔn)推出僅一年,大部分宣傳支持H.264的終端廠商主要都是支持H.264的基本檔次。因為H.264編解碼復(fù)雜度的增加,對終端廠商的視頻處理能力提出了挑戰(zhàn),F(xiàn)有的平臺,要么就根本無法做H.264的編解碼,要么就不能支持高碼率下的編解碼。而視維視頻會議產(chǎn)品最大支持640*480,視頻標(biāo)準(zhǔn)采用最新的高碼率編解碼技術(shù),圖像清晰流暢。在帶寬節(jié)約39%的基礎(chǔ)上視頻質(zhì)量的信噪比要比同類產(chǎn)品高出40%,是目前視頻質(zhì)量最好的編碼技術(shù)。

  下面我們深入探討一下H.264/AVC核心技術(shù)。

H.264/AVC核心技術(shù)概覽

  就像在圖中看到的一樣,這個新的標(biāo)準(zhǔn)是由下面幾個處理步驟組成的:

  幀間和幀內(nèi)預(yù)測
  變換(和反變換)
  量化(和反量化)
  環(huán)路濾波
  熵編碼

  單張的圖片流組成了視頻,它能分成16X16像素的“宏塊”,這種分塊方法簡化了在視頻壓縮算法中每個步驟的處理過程。舉例來說,從標(biāo)準(zhǔn)清晰度標(biāo)準(zhǔn)視頻流解決方案(720X480)中截取的一幅圖片被分成1350(45X30)個宏塊,然后在宏塊的層次進行進一步的處理。

幀間預(yù)測

  改良的運動估計。運動估計用來確定和消除存在于視頻流中不同圖片之間的時間冗余。當(dāng)運動估計搜索是根據(jù)過去方向的圖片,那么被編碼的圖片稱為“P幀圖片”,當(dāng)搜索是根據(jù)過去和將來兩種方向的圖片,那么被編碼的圖片被稱為“B幀圖片”。

  為了提高編碼效率,為了包含和分離在“H.264運動估計-改良的運動估計”圖中的運動宏塊,宏塊被拆分成更小的塊。然后,以前或?qū)淼膱D片的運動矢量被用來預(yù)測一個給定的塊。H.264/MPEG-4 AVC發(fā)明了一種更小的塊,它具有更好的靈活性,在運動矢量方面可以有更高的預(yù)測精度。

H.264運動估計-改良的運動估計

幀內(nèi)預(yù)測

  不能運用運動估計的地方,就采用幀內(nèi)估計用來消除空間冗余。內(nèi)部估計通過在一個預(yù)定義好的集合中不同方向上的鄰近塊推測相鄰像素來預(yù)測當(dāng)前塊。然后預(yù)測塊和真實塊之間的不同點被編碼。這種方法是H.264/MPEG-4 AVC所特有的,尤其對于經(jīng)常存在空間冗余的平坦背景特別有用。一個例子就是下邊展示的“H.264內(nèi)部估計”。

H.264內(nèi)部估計

變換

  運動估計和內(nèi)部估計后的結(jié)果通過變換被從空間域轉(zhuǎn)換到頻率域。H.264/MPEG-4 AVC使用整數(shù)DCT4X4變換。而MPEG-2和MPEG-4使用浮點DCT8X8變換。

  更小塊的H.264/MPEG-4 AVC減少了塊效應(yīng)和明顯的人工痕跡。整數(shù)系數(shù)消除了在MPEG-2和MPEG-4中進行浮點系數(shù)運算時導(dǎo)致的精度損失。

H.264變換

量化

  變換后的系數(shù)被量化,減少了整數(shù)系數(shù)的預(yù)測量和消除了不容易被感知高頻系數(shù)。這個步驟也用來控制輸出的比特率維持在一個基本恒定的常量。

H.264量化/碼率控制

環(huán)路濾波

  H.264/MPEG-4 AVC標(biāo)準(zhǔn)定義了一個對16X16宏塊和4X4塊邊界的解塊過濾過程。在宏塊這種情況下,過濾的目的是消除由于相鄰宏塊有不同的運動估計類型(比如運動估計和內(nèi)部估計)或者不同的量化參數(shù)導(dǎo)致的人工痕跡。在塊邊界這種情況下,過濾的目的是消除可能由于變換/量化和來自于相鄰塊運動矢量的差別引起的人工痕跡。環(huán)路濾波通過一個內(nèi)容自適應(yīng)的非線性算法修改在宏塊/塊邊界的同一邊的兩個像素。

熵編碼

  在熵編碼之前,4X4的量化系數(shù)必須被重排序。根據(jù)這些系數(shù)原來采用的預(yù)測算法為運動估計或者內(nèi)部估計的不同來選擇不同的掃描類型創(chuàng)建一個重排序的串行化流。掃描類型按照從低頻到高頻的順序排序這些系數(shù)。既然高頻系數(shù)大多數(shù)趨向于零,那么利用游程編碼就可以縮減零的數(shù)目,從而高效的達到熵編碼的目的。

H.264熵編碼-系數(shù)的串行化

  在熵編碼步驟通過映射符號的字節(jié)流來表示運動矢量,量化系數(shù)和宏塊頭。熵編碼通過設(shè)計用一個較少的比特位數(shù)來表示頻繁使用的符號,比較多的比特位數(shù)來表示不經(jīng)常使用的符號。

視維產(chǎn)品中的H.264/AVC

  H.264雖然具有如此優(yōu)秀的特點,但是標(biāo)準(zhǔn)算法卻需要耗費巨大的系統(tǒng)資源,硬件視頻會議升級到H.264的困難在于此,原有的芯片無法支持如此大量的運算;軟件視頻會議系統(tǒng)升級到H.264的困難也在于此,普通PC的處理能力無法滿足編碼H.264的要求。

  視維產(chǎn)品團隊核心編解碼研究組致力于H.264的編解碼優(yōu)化,并成功推出商用級H.264編解碼技術(shù),應(yīng)用于視維網(wǎng)絡(luò)視頻會議系統(tǒng)Version 4.5。利用當(dāng)今最優(yōu)秀的編解碼技術(shù)和快速H.264編解碼算法,視維為客戶提供了當(dāng)今視頻會議領(lǐng)域最杰出視頻效果的產(chǎn)品。

IT168 網(wǎng)絡(luò)頻道



相關(guān)鏈接:
企業(yè)網(wǎng)如何應(yīng)用視頻 2004-12-01
會議電視技術(shù)介紹 2004-11-30
基于H.323標(biāo)準(zhǔn)的全面視頻網(wǎng)絡(luò)解決方案及其應(yīng)用 2004-11-30
視頻編碼標(biāo)準(zhǔn)的發(fā)展:從H.261到H.264 2004-11-30
技術(shù)不斷進步 視頻會議將進入尋常百姓家 2004-11-29

分類信息:     文摘   技術(shù)_視像通訊_文摘