首頁(yè)>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

MPEG系列標(biāo)準(zhǔn)及其應(yīng)用

湖南邵陽(yáng)電視臺(tái) 鄧永紅 2003/02/11

  摘要:本文從MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21標(biāo)準(zhǔn)以及它們的應(yīng)用等方面,介紹了MPEG系列標(biāo)準(zhǔn)及其應(yīng)用。

  隨著數(shù)字化、網(wǎng)絡(luò)化、全球一體化信息時(shí)代的來(lái)臨,多媒體技術(shù)成為信息技術(shù)的重要組成部分。它包括聲音、圖形、數(shù)據(jù)以及圖像在內(nèi)的多種媒體信息的傳送和處理,其關(guān)鍵在于壓縮技術(shù)。此外,在多媒體的傳輸、處理、應(yīng)用中還有許多問(wèn)題:如何在網(wǎng)絡(luò)上傳輸視頻?如何通過(guò)手機(jī)上網(wǎng)并接收視頻和圖像?如何對(duì)多媒體數(shù)據(jù)進(jìn)行快速有效的檢索?如何對(duì)多媒體信息進(jìn)行統(tǒng)一的存。康鹊。

  MPEG是活動(dòng)圖像專家組(Moving Picture Exports Group)英文的縮寫,于1988年成立,是為數(shù)字視/音頻制定壓縮標(biāo)準(zhǔn)的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&&T等世界知名公司。MPEG組織最初得到的授權(quán)是制定用于“活動(dòng)圖像”編碼的各種標(biāo)準(zhǔn),隨后擴(kuò)充為“及其伴隨的音頻”及其組合編碼。后來(lái)針對(duì)不同的應(yīng)用需求,解除了“用于數(shù)字存儲(chǔ)媒體”的限制,成為現(xiàn)在制定“活動(dòng)圖像和音頻編碼”標(biāo)準(zhǔn)的組織。MPEG組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。

一、MPEG-1標(biāo)準(zhǔn)及其應(yīng)用

  MPEG-1標(biāo)準(zhǔn)于1993年8月公布,用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼。該標(biāo)準(zhǔn)包括五個(gè)部分:

  第一部分說(shuō)明了如何根據(jù)第二部分(視頻)以及第三部分(音頻)的規(guī)定,對(duì)音頻和視頻進(jìn)行復(fù)合編碼。第四部分說(shuō)明了檢驗(yàn)解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過(guò)程。第五部分是一個(gè)用完整的C語(yǔ)言實(shí)現(xiàn)的編碼和解碼器。

  該標(biāo)準(zhǔn)從頒布的那一刻起,MPEG-1取得一連串的成功,如VCD和MP3的大量使用,Windows95以后的版本都帶有一個(gè)MPEG-1軟件解碼器,可攜式MPEG-1攝像機(jī)等等。

二、MPEG-2標(biāo)準(zhǔn)及其應(yīng)用

  MPEG組織于1994年推出MPEG-2壓縮標(biāo)準(zhǔn),以實(shí)現(xiàn)視/音頻服務(wù)與應(yīng)用互操作的可能性。MPEG-2標(biāo)準(zhǔn)是針對(duì)標(biāo)準(zhǔn)數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定,編碼碼率從每秒3兆比特~100兆比特,標(biāo)準(zhǔn)的正式規(guī)范在ISO/IEC13818中。MPEG-2不是MPEG-1的簡(jiǎn)單升級(jí),MPEG-2在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。MPEG-2特別適用于廣播級(jí)的數(shù)字電視的編碼和傳送,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)。MPEG-2還專門規(guī)定了多路節(jié)目的復(fù)分接方式。MPEG-2標(biāo)準(zhǔn)目前分為9個(gè)部分,統(tǒng)稱為ISO/IEC13818國(guó)際標(biāo)準(zhǔn)。

  MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關(guān)性和時(shí)間相關(guān)性。一幀圖像內(nèi)的任何一個(gè)場(chǎng)景都是由若干像素點(diǎn)構(gòu)成的,因此一個(gè)像素通常與它周圍的某些像素在亮度和色度上存在一定的關(guān)系,這種關(guān)系叫作空間相關(guān)性;一個(gè)節(jié)目中的一個(gè)情節(jié)常常由若干幀連續(xù)圖像組成的圖像序列構(gòu)成,一個(gè)圖像序列中前后幀圖像間也存在一定的關(guān)系,這種關(guān)系叫作時(shí)間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息。如果我們能將這些冗余信息去除,只保留少量非相關(guān)信息進(jìn)行傳輸,就可以大大節(jié)省傳輸頻帶。而接收機(jī)利用這些非相關(guān)信息,按照一定的解碼算法,可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。一個(gè)好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗余信息。

  MPEG-2的編碼圖像被分為三類,分別稱為I幀,P幀和B幀。

  I幀圖像采用幀內(nèi)編碼方式,即只利用了單幀圖像內(nèi)的空間相關(guān)性,而沒有利用時(shí)間相關(guān)性。I幀使用幀內(nèi)壓縮,不使用運(yùn)動(dòng)補(bǔ)償,由于I幀不依賴其它幀,所以是隨機(jī)存取的入點(diǎn),同時(shí)是解碼的基準(zhǔn)幀。I幀主要用于接收機(jī)的初始化和信道的獲取,以及節(jié)目的切換和插入,I幀圖像的壓縮倍數(shù)相對(duì)較低。I幀圖像是周期性出現(xiàn)在圖像序列中的,出現(xiàn)頻率可由編碼器選擇。

  P幀和B幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè),可以提高壓縮效率和圖像質(zhì)量。P幀圖像中可以包含幀內(nèi)編碼的部分,即P幀中的每一個(gè)宏塊可以是前向預(yù)測(cè),也可以是幀內(nèi)編碼。B幀圖像采用雙向時(shí)間預(yù)測(cè),可以大大提高壓縮倍數(shù)。值得注意的是,由于B幀圖像采用了未來(lái)幀作為參考,因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。

  P幀和B幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè),可以提高壓縮效率和圖像質(zhì)量。P幀圖像中可以包含幀內(nèi)編碼的部分,即P幀中的每一個(gè)宏塊可以是前向預(yù)測(cè),也可以是幀內(nèi)編碼。B幀圖像采用雙向時(shí)間預(yù)測(cè),可以大大提高壓縮倍數(shù)。值得注意的是,由于B幀圖像采用了未來(lái)幀作為參考,因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。

  MPEG-2的編碼碼流分為六個(gè)層次。為更好地表示編碼數(shù)據(jù),MPEG-2用句法規(guī)定了一個(gè)層次性結(jié)構(gòu)。它分為六層,自上到下分別是:圖像序列層、圖像組(GOP)、圖像、宏塊條、宏塊、塊。MPEG-2標(biāo)準(zhǔn)的主要應(yīng)用如下:

1、視音頻資料的保存

2、非線性編輯系統(tǒng)及非線性編輯網(wǎng)絡(luò)

3、衛(wèi)星傳輸

4、電視節(jié)目的播出

三、MPEG-4標(biāo)準(zhǔn)及其應(yīng)用

  運(yùn)動(dòng)圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標(biāo)準(zhǔn)第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國(guó)際標(biāo)準(zhǔn)。

  MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對(duì)數(shù)字電視、交互式繪圖應(yīng)用(影音合成內(nèi)容)、交互式多媒體(WWW、資料擷取與分散)等整合及壓縮技術(shù)的需求而制定的國(guó)際標(biāo)準(zhǔn)。MPEG-4標(biāo)準(zhǔn)將眾多的多媒體應(yīng)用集成于一個(gè)完整的框架內(nèi),旨在為多媒體通信及應(yīng)用環(huán)境提供標(biāo)準(zhǔn)的算法及工具,從而建立起一種能被多媒體傳輸、存儲(chǔ)、檢索等應(yīng)用領(lǐng)域普遍采用的統(tǒng)一數(shù)據(jù)格式。

  MPEG-4的編碼理念是:MPEG-4標(biāo)準(zhǔn)同以前標(biāo)準(zhǔn)的最顯著的差別在于它是采用基于對(duì)象的編碼理念,即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對(duì)象,分別編碼后,再經(jīng)過(guò)復(fù)用傳輸?shù)浇邮斩,然后再?duì)不同的對(duì)象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對(duì)不同的對(duì)象采用不同的編碼方法和表示方法,又有利于不同數(shù)據(jù)類型間的融合,并且這樣也可以方便的實(shí)現(xiàn)對(duì)于各種對(duì)象的操作及編輯。例如,我們可以將一個(gè)卡通人物放在真實(shí)的場(chǎng)景中,或者將真人置于一個(gè)虛擬的演播室里,還可以在互聯(lián)網(wǎng)上方便的實(shí)現(xiàn)交互,根據(jù)自己的需要有選擇的組合各種視頻音頻以及圖形文本對(duì)象。

  MPEG-4系統(tǒng)的一般框架是:對(duì)自然或合成的視聽內(nèi)容的表示;對(duì)視聽內(nèi)容數(shù)據(jù)流的管理,如多點(diǎn)、同步、緩沖管理等;對(duì)靈活性的支持和對(duì)系統(tǒng)不同部分的配置。

與MPEG-1、MPEG-2相比,MPEG-4具有如下獨(dú)特的優(yōu)點(diǎn):

(1)基于內(nèi)容的交互性

  MPEG-4提供了基于內(nèi)容的多媒體數(shù)據(jù)訪問(wèn)工具,如索引、超級(jí)鏈接、上下載、刪除等。利用這些工具,用戶可以方便地從多媒體數(shù)據(jù)庫(kù)中有選擇地獲取自己所需的與對(duì)象有關(guān)的內(nèi)容,并提供了內(nèi)容的操作和位流編輯功能,可應(yīng)用于交互式家庭購(gòu)物,淡入淡出的數(shù)字化效果等。MPEG-4提供了高效的自然或合成的多媒體數(shù)據(jù)編碼方法。它可以把自然場(chǎng)景或?qū)ο蠼M合起來(lái)成為合成的多媒體數(shù)據(jù)。

(2)高效的壓縮性

  MPEG-4基于更高的編碼效率。同已有的或即將形成的其它標(biāo)準(zhǔn)相比,在相同的比特率下,它基于更高的視覺聽覺質(zhì)量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時(shí)MPEG-4還能對(duì)同時(shí)發(fā)生的數(shù)據(jù)流進(jìn)行編碼。一個(gè)場(chǎng)景的多視角或多聲道數(shù)據(jù)流可以高效、同步地合成為最終數(shù)據(jù)流。這可用于虛擬三維游戲、三維電影、飛行仿真練習(xí)等。

(3)通用的訪問(wèn)性

  MPEG-4提供了易出錯(cuò)環(huán)境的魯棒性,來(lái)保證其在許多無(wú)線和有線網(wǎng)絡(luò)以及存儲(chǔ)介質(zhì)中的應(yīng)用,此外,MPEG-4還支持基于內(nèi)容的的可分級(jí)性,即把內(nèi)容、質(zhì)量、復(fù)雜性分成許多小塊來(lái)滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲(chǔ)容量的傳輸信道和接收端。

  這些特點(diǎn)無(wú)疑會(huì)加速多媒體應(yīng)用的發(fā)展,從中受益的應(yīng)用領(lǐng)域有:因特網(wǎng)多媒體應(yīng)用;廣播電視;交互式視頻游戲;實(shí)時(shí)可視通信;交互式存儲(chǔ)媒體應(yīng)用;演播室技術(shù)及電視后期制作;采用面部動(dòng)畫技術(shù)的虛擬會(huì)議;多媒體郵件;移動(dòng)通信條件下的多媒體應(yīng)用;遠(yuǎn)程視頻監(jiān)控;通過(guò)ATM網(wǎng)絡(luò)等進(jìn)行的遠(yuǎn)程數(shù)據(jù)庫(kù)業(yè)務(wù)等。MPEG-4主要應(yīng)用如下:

1、應(yīng)用于因特網(wǎng)視音頻廣播

2、應(yīng)用于無(wú)線通信

3、應(yīng)用于靜止圖像壓縮

4、應(yīng)用于電視電話

5、應(yīng)用于計(jì)算機(jī)圖形、動(dòng)畫與仿真

6、應(yīng)用于電子游戲

四、MPEG-7標(biāo)準(zhǔn)及其應(yīng)用

  MPEG-7標(biāo)準(zhǔn)被稱為“多媒體內(nèi)容描述接口”,為各類多媒體信息提供一種標(biāo)準(zhǔn)化的描述,這種描述將與內(nèi)容本身有關(guān),允許快速和有效的查詢用戶感興趣的資料。它將擴(kuò)展現(xiàn)有內(nèi)容識(shí)別專用解決方案的有限的能力,特別是它還包括了更多的數(shù)據(jù)類型。換而言之,MPEG-7規(guī)定一個(gè)用于描述各種不同類型多媒體信息的描述符的標(biāo)準(zhǔn)集合。該標(biāo)準(zhǔn)于1998年10月提出,于2001年最終完成并公布。

  MPEG-7的目標(biāo)是支持多種音頻和視覺的描述,包括自由文本、N維時(shí)空結(jié)構(gòu)、統(tǒng)計(jì)信息、客觀屬性、主觀屬性、生產(chǎn)屬性和組合信息。對(duì)于視覺信息,描述將包括顏色、視覺對(duì)象、紋理、草圖、形狀、體積、空間關(guān)系、運(yùn)動(dòng)及變形等。

  MPEG-7的目標(biāo)是根據(jù)信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對(duì)信息的需求。以視覺內(nèi)容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運(yùn)動(dòng)(軌道)和位置的描述。對(duì)于音頻的較低抽象層包括音調(diào)、調(diào)式、音速、音速變化、音響空間位置。最高層將給出語(yǔ)義信息:如“這是一個(gè)場(chǎng)景:一個(gè)鴨子正躲藏在樹后并有一個(gè)汽車正在幕后通過(guò)!背橄髮优c提取特征的方式有關(guān):許多低層特征能以完全自動(dòng)的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據(jù)視覺描述的查詢?nèi)z索聲音數(shù)據(jù),反之也一樣。

  MPEG-7的目標(biāo)是支持?jǐn)?shù)據(jù)管理的靈活性、數(shù)據(jù)資源的全球化和互操作性。

  MPEG-7標(biāo)準(zhǔn)化的范圍包括:一系列的描述子(描述子是特征的表示法,一個(gè)描述子就是定義特征的語(yǔ)法和語(yǔ)義學(xué));一系列的描述結(jié)構(gòu)(詳細(xì)說(shuō)明成員之間的結(jié)構(gòu)和語(yǔ)義);一種詳細(xì)說(shuō)明描述結(jié)構(gòu)的語(yǔ)言、描述定義語(yǔ)言(DDL);一種或多種編碼描述方法。

MPEG-7由以下幾部分組成:

(1)MPEG-7系統(tǒng):它保證MPEG-7描述有效傳輸和存儲(chǔ)所必須的工具,并確保內(nèi)容與描述之間進(jìn)行同步,這些工具有管理和保護(hù)的智能特性;

(2)MPEG-7描述定義語(yǔ)言:用來(lái)定義新的描述結(jié)構(gòu)的語(yǔ)言;

(3)MPEG-7音頻:只涉及音頻描述的描述子和描述結(jié)構(gòu);

(4)MPEG-7視頻:只涉及視頻描述的描述子和描述結(jié)構(gòu);

(5)MPEG-7屬性實(shí)體和多媒體描述結(jié)構(gòu);

(6)MPEG-7參考軟件:實(shí)現(xiàn)MPEG-7標(biāo)準(zhǔn)相關(guān)成分的軟件;

(7)MPEG-7一致性:測(cè)試MPEG-7執(zhí)行一致性的指導(dǎo)方針和程序。

  在我們的日常生活中,日益龐大的可利用音視頻數(shù)據(jù)需要有效的多媒體系統(tǒng)來(lái)存取、交互。這類需求與一些重要的社會(huì)和經(jīng)濟(jì)問(wèn)題相關(guān),并且在許多專業(yè)和消費(fèi)應(yīng)用方面都是急需的,尤其是在網(wǎng)絡(luò)高度發(fā)展的今天,而MPEG-7的最終目的是把網(wǎng)上的多媒體內(nèi)容變成象現(xiàn)在的文本內(nèi)容一樣,具有可搜索性。這使得大眾可以接觸到大量的多媒體內(nèi)容,MPEG-7標(biāo)準(zhǔn)可以支持非常廣泛的應(yīng)用,具體如下:

(1)音視數(shù)據(jù)庫(kù)的存儲(chǔ)和檢索;

(2)廣播媒體的選擇(廣播、電視節(jié)目);

(3)因特網(wǎng)上的個(gè)性化新聞服務(wù);

(4)智能多媒體、多媒體編輯;

(5)教育領(lǐng)域的應(yīng)用(如數(shù)字多媒體圖書館等);

(6)遠(yuǎn)程購(gòu)物;

(7)社會(huì)和文化服務(wù)(歷史博物館、藝術(shù)走廊等);

(8)調(diào)查服務(wù)(人的特征的識(shí)別、辯論等);

(9)遙感;

(10)監(jiān)視(交通控制、地面交通等);

(11)生物醫(yī)學(xué)應(yīng)用;

(12)建筑、不動(dòng)產(chǎn)及內(nèi)部設(shè)計(jì);

(13)多媒體目錄服務(wù)(如,黃頁(yè)、旅游信息、地理信息系統(tǒng)等);

(14)家庭娛樂(個(gè)人的多媒體收集管理系統(tǒng)等)。

  原則上,任何類型的AV(Audio-Video)材料都可以通過(guò)任何類型的查詢材料來(lái)檢索,例如,AV材料可以通過(guò)視頻、音樂、語(yǔ)言等來(lái)查詢,通過(guò)搜索引擎來(lái)匹配查詢數(shù)據(jù)和MPEG-7的音視頻描述。

五、MPEG-21標(biāo)準(zhǔn)及其應(yīng)用

  互聯(lián)網(wǎng)改變了物質(zhì)商品交換的商業(yè)模式,這就是“電子商務(wù)”。新的市場(chǎng)必然帶來(lái)新的問(wèn)題:如何獲取數(shù)字視頻、音頻以及合成圖形等“數(shù)字商品”,如何保護(hù)多媒體內(nèi)容的知識(shí)產(chǎn)權(quán),如何為用戶提供透明的媒體信息服務(wù),如何檢索內(nèi)容,如何保證服務(wù)質(zhì)量等。此外,有許多數(shù)字媒體(圖片、音樂等)是由用戶個(gè)人生成、使用的。這些“內(nèi)容供應(yīng)者”同商業(yè)內(nèi)容供應(yīng)商一樣關(guān)心相同的事情:內(nèi)容的管理和重定位、各種權(quán)利的保護(hù)、非授權(quán)存取和修改的保護(hù)、商業(yè)機(jī)密與個(gè)人隱私的保護(hù)等。目前雖然建立了傳輸和數(shù)字媒體消費(fèi)的基礎(chǔ)結(jié)構(gòu)并確定了與此相關(guān)的諸多要素,但這些要素、規(guī)范之間還沒有一個(gè)明確的關(guān)系描述方法,迫切需要一種結(jié)構(gòu)或框架保證數(shù)字媒體消費(fèi)的簡(jiǎn)單性,很好地處理“數(shù)字類消費(fèi)”中諸要素之間的關(guān)系。MPEG-21就是在這種情況下提出的。

  制定MPEG-21標(biāo)準(zhǔn)的目的是:(1)將不同的協(xié)議、標(biāo)準(zhǔn)、技術(shù)等有機(jī)地融合在一起;(2)制定新的標(biāo)準(zhǔn);(3)將這些不同的標(biāo)準(zhǔn)集成在一起。MPEG-21標(biāo)準(zhǔn)其實(shí)就是一些關(guān)鍵技術(shù)的集成,通過(guò)這種集成環(huán)境就對(duì)全球數(shù)字媒體資源進(jìn)行透明和增強(qiáng)管理,實(shí)現(xiàn)內(nèi)容描述、創(chuàng)建、發(fā)布、使用、識(shí)別、收費(fèi)管理、產(chǎn)權(quán)保護(hù)、用戶隱私權(quán)保護(hù)、終端和網(wǎng)絡(luò)資源抽取、事件報(bào)告等功能。

  任何與MPEG-21多媒體框架標(biāo)準(zhǔn)環(huán)境交互或使用MPEG-21數(shù)字項(xiàng)實(shí)體的個(gè)人或團(tuán)體都可以看作是用戶。從純技術(shù)角度來(lái)看,MPEG-21對(duì)于“內(nèi)容供應(yīng)商”和“消費(fèi)者”沒有任何區(qū)別。標(biāo)準(zhǔn)化是產(chǎn)業(yè)化成功的前提,MPEG-1已成功地在中國(guó)推動(dòng)了VCD產(chǎn)業(yè),MPEG-2標(biāo)準(zhǔn)又帶動(dòng)了DVD及數(shù)字電視等多種消費(fèi)電子產(chǎn)業(yè),其它MPEG標(biāo)準(zhǔn)的應(yīng)用也在實(shí)施或開發(fā)中,MPEG緊扣應(yīng)用發(fā)展的脈搏,與工業(yè)和應(yīng)用同步。未來(lái)是信息化的社會(huì),各種多媒體數(shù)據(jù)的傳輸和存儲(chǔ)是信息處理的基本問(wèn)題,因此,可以肯定MPEG系列標(biāo)準(zhǔn)將發(fā)揮越來(lái)越大的作用。

中國(guó)通信網(wǎng)(www.c114.net)—《衛(wèi)視周刊》


相關(guān)鏈接:
順利演進(jìn)到SIP 2003-01-21
VDSL技術(shù)和標(biāo)準(zhǔn)的新進(jìn)展 2003-01-21
IP視頻壓縮協(xié)議H.263 2002-11-07
MPEG-4望成為移動(dòng)應(yīng)用視頻產(chǎn)品標(biāo)準(zhǔn) 2002-11-07
下一代網(wǎng)絡(luò)(NGN)標(biāo)準(zhǔn)進(jìn)展 2002-07-10

分類信息:  標(biāo)準(zhǔn)匯編_與_視像通訊     標(biāo)準(zhǔn)匯編_文摘   文摘   技術(shù)_視像通訊_文摘