杨幂瘦腿视频教程,清纯美女视频网址,杨幂生孩子视频

基于E-Model的VoIP語(yǔ)音質(zhì)量測(cè)量方法

2007/04/20

　　摘要　基于E-Model的語(yǔ)音質(zhì)量測(cè)量方法是一種客觀測(cè)試方法，它克服了傳統(tǒng)語(yǔ)音質(zhì)量測(cè)試在數(shù)據(jù)網(wǎng)絡(luò)測(cè)量中的不足。為了能夠準(zhǔn)確評(píng)估VoIP語(yǔ)音質(zhì)量，在E-Model算法的基礎(chǔ)之上，探討了延時(shí)、噪聲、回音、語(yǔ)音壓縮等損傷因素對(duì)VoIP語(yǔ)音質(zhì)量的影響。

1、引言

　　VoIP（Voice over IP），以IP分組交換網(wǎng)絡(luò)為傳輸平臺(tái)，對(duì)模擬的語(yǔ)音信號(hào)進(jìn)行壓縮、打包等一系列的特殊處理，使之可以采用無(wú)連接的UDP（User Datagram Protocol）協(xié)議進(jìn)行傳輸[1]。近年來(lái)，隨著IP網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用，VoIP成為一種新興的電話通信方式，IP網(wǎng)絡(luò)所提供的語(yǔ)音質(zhì)量問(wèn)題受到人們的普遍關(guān)注，如何對(duì)語(yǔ)音質(zhì)量進(jìn)行科學(xué)可靠的測(cè)量和評(píng)價(jià)是網(wǎng)絡(luò)測(cè)量和網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)中十分關(guān)鍵的問(wèn)題。E-Model作為語(yǔ)音質(zhì)量測(cè)量的一種新方法，它適合數(shù)據(jù)網(wǎng)絡(luò)的語(yǔ)音質(zhì)量測(cè)量，必將有廣泛的應(yīng)用。本文將在E模型下分析延時(shí)、噪聲、回音和語(yǔ)音壓縮等對(duì)VoIP語(yǔ)音質(zhì)量的影響。

2、基于E-Model的語(yǔ)音質(zhì)量評(píng)價(jià)

　　目前對(duì)IP電話業(yè)務(wù)語(yǔ)音質(zhì)量評(píng)分的評(píng)價(jià)分為主觀評(píng)價(jià)和客觀評(píng)價(jià)。主觀評(píng)價(jià)方法主要是MOS模型（平均評(píng)定得分法），還包括判斷滿意度測(cè)量等方法；客觀評(píng)價(jià)方法主要有PSQM模型（感知話音質(zhì)量測(cè)量法）、PAMS模型（感知分析測(cè)量法）、PESQ模型（感知話音評(píng)估法）和E-Model[2，3]。傳統(tǒng)的測(cè)量方式不是基于數(shù)據(jù)網(wǎng)絡(luò)的，不能反映延時(shí)、抖動(dòng)和丟包等數(shù)據(jù)網(wǎng)絡(luò)特有的問(wèn)題。

　　在ITU-T P.800中規(guī)定的平均主觀值MOS，基于該主觀評(píng)測(cè)把人接聽(tīng)和感知語(yǔ)音質(zhì)量的行為被調(diào)研和量化，接聽(tīng)到何種級(jí)別質(zhì)量的語(yǔ)音，就得到多少平均主觀值MOS。一般情況下MOS值是4或更高被認(rèn)為是比較好的語(yǔ)音質(zhì)量，而若平均主觀值MOS低于3.6，則大部分接聽(tīng)者不能滿意語(yǔ)音質(zhì)量。平均主觀測(cè)試雖然準(zhǔn)確有效，但是這種方法存在的最大問(wèn)題就是實(shí)現(xiàn)起來(lái)非常麻煩和昂貴，因此人們?cè)诓粩嗟靥剿髂苓M(jìn)行客觀測(cè)量的方法。ITU-T的G.107標(biāo)準(zhǔn)提出的E模型考慮了延時(shí)、噪聲、回音、編碼器性能、丟包、抖動(dòng)等網(wǎng)絡(luò)損傷因素對(duì)語(yǔ)音質(zhì)量的影響。它的評(píng)價(jià)標(biāo)準(zhǔn)如圖1所示。

圖1　用戶滿意度等級(jí)與R值和MOS值的范圍對(duì)應(yīng)表

根據(jù)ITU-T G.107的定義和實(shí)際測(cè)試所需的參數(shù)可以求出R的值。傳輸參數(shù)R的表達(dá)式為：

其中

（1）Ro表示基本的信噪比，Ro的表達(dá)式為：

　　其中，SLR表示發(fā)送端響度評(píng)測(cè)值，No表示不同噪聲源功率之和。

No的表達(dá)式為：

　　其中，Nc表示電路引起的所有哚聲功率之和，Nos表示發(fā)送端背景噪聲引起的電路噪聲，Nor表示接收端背景噪聲引起的電路噪聲，Nfo表示接收端的噪聲。影響Ro的主要因素包括：響度評(píng)測(cè)值（SLR，RLR），背景噪聲（Ps，Pr），電話延遲值（Ds，Dr），說(shuō)話者回音響度額定值（TELR）。

（2）Is表示語(yǔ)音實(shí)時(shí)傳輸所產(chǎn)生的同步損傷，Is的表達(dá)式為：

　　其中，Iolr表示是由太低的響度評(píng)測(cè)值所引起的質(zhì)量的下降，Ist表示是由非適宜的電話噪聲引起的損傷，Iq表示量化失真所造成的損傷。影響Is的主要因素有：響度評(píng)測(cè)值，背景噪聲，電話延遲值，說(shuō)話者回音響度額定值，單向延遲時(shí)間（T），量化失真度（qdu）。

（3）Id表示語(yǔ)音信號(hào)的延遲損傷，Id的表達(dá)式為：

　　其中，Idte表示發(fā)送端回音所造成的損傷，Idle表示接收端回音所造成的損傷，Idd表示太長(zhǎng)的絕對(duì)延遲所引起的損傷。影響Id的主要因素有：延遲，說(shuō)話者回音響度，背景噪聲，響度評(píng)測(cè)值等。

（4）Ie-eff表示低比特率編碼及丟包所造成的損傷，Ie-eff的表達(dá)式為：

　　其中Ie表示設(shè)備損傷因素，Bbl表示丟包主要因素，Ppl表示丟包率。

　�。�5）A表示優(yōu)勢(shì)損傷因素，它是當(dāng)有其它優(yōu)勢(shì)傳遞到用戶的一種補(bǔ)償，通常情況下設(shè)置為零[4]。

　　在E-Model測(cè)量中包含了影響窄帶電話通話質(zhì)量的多種傳輸參數(shù)，在ITU-T G.107中提供了一組默認(rèn)值，當(dāng)終端和應(yīng)用環(huán)境是正常的，可以直接使用這些默認(rèn)值。根據(jù)這些默認(rèn)值和一些可求的參數(shù)比如延時(shí)、丟包率等可以得到E-Model輸出的傳輸參數(shù)R。R直越大，說(shuō)明語(yǔ)音質(zhì)量越好，R值的范圍是0-100，0是最差的，100是最好的。

　　平均主觀值MOS是1-5之間的數(shù)，1是語(yǔ)音質(zhì)量最差的，5是語(yǔ)音質(zhì)量最好的。R值可以通過(guò)下面的公式轉(zhuǎn)化成MOS分：

　　IP電話網(wǎng)絡(luò)損傷的主要因素包括延時(shí)、噪聲、回音、語(yǔ)音編碼和丟包[5，6]：

　�。�1）延時(shí)（delay），指IP包從網(wǎng)絡(luò)入口點(diǎn)到達(dá)網(wǎng)絡(luò)出口點(diǎn)所需要的傳輸時(shí)間。如果在一個(gè)呼叫中包含不同的通路時(shí)間，則存在抖動(dòng)，抖動(dòng)越大則語(yǔ)音質(zhì)量下降的越明顯。在E模型中采用固定緩沖區(qū)的方法，可以使抖動(dòng)的影響轉(zhuǎn)化為延時(shí)[7]。

　�。�2）回音（echo），是由語(yǔ)音網(wǎng)絡(luò)中的電氣反射引起的，延時(shí)超過(guò)16 ms的回聲對(duì)說(shuō)話人會(huì)有影響。下文通過(guò)說(shuō)話者回音響度額定值（TELR），來(lái)檢測(cè)回音對(duì)語(yǔ)音質(zhì)量的影響。

　�。�3）噪聲（noise），是影響語(yǔ)音質(zhì)量的一個(gè)關(guān)鍵因素，下文分別通過(guò)發(fā)送端背景噪聲Ps和接收端背景噪聲Pr來(lái)分析噪聲對(duì)語(yǔ)音質(zhì)量的影響。

　�。�4）語(yǔ)音壓縮（Speech compression），在語(yǔ)音處理中語(yǔ)音編碼有很多種方式，每一種都有不同的特點(diǎn)。低速的編碼方式占用較少的帶寬，但是低速編碼使用有損的壓縮算法，削弱了語(yǔ)音質(zhì)量。仿真將采用標(biāo)準(zhǔn)為G.711、G.729 A、G.723.1的編碼方式，演示編碼對(duì)語(yǔ)音質(zhì)量的影響，其主要參數(shù)如表1所示。

表1　標(biāo)準(zhǔn)編碼器的主要參數(shù)

　　（5）丟包（Packet loss），是影響語(yǔ)音質(zhì)量的又一個(gè)關(guān)鍵因素。數(shù)據(jù)包發(fā)送端和接收端之間的數(shù)據(jù)包數(shù)目的差值即為網(wǎng)絡(luò)傳輸丟失包數(shù)目。當(dāng)少量的丟包且是隨機(jī)地分布時(shí)，人耳并不容易感覺(jué)到較差的語(yǔ)音質(zhì)量。當(dāng)丟包數(shù)量變大時(shí)，語(yǔ)音質(zhì)量也就相應(yīng)的變差。

3、仿真結(jié)果

　　（1）圖2演示了延時(shí)和說(shuō)話者回音響度額定值（TELR）對(duì)R值的影響：時(shí)延在0～500 ms變化時(shí)，相應(yīng)的R值隨時(shí)延的增長(zhǎng)而降低，另外，從仿真結(jié)果也可以看出，TELR對(duì)R值的影響也是很大的，TELT=65 dB時(shí)，R值隨延時(shí)變化的相對(duì)緩慢，隨著TELR值的減小，R值隨延時(shí)的增加而迅速降低，且在相同的時(shí)延條件下，TELR越大，得到的R值也越大。

圖2　延時(shí)、回音額定值對(duì)R值的影響

（2）從圖3仿真結(jié)果可以看出語(yǔ)音編碼對(duì)R值的影響：選擇越低速率的編碼方式，得到的R值就越小。在實(shí)際情況中，選擇低速的編碼方式能夠在相同的連接上建立更多的呼叫，但是引入了更大的延時(shí)，使語(yǔ)音質(zhì)量對(duì)丟包也更加敏感。如果需要很高的語(yǔ)音質(zhì)量，則意味著只能使用64 kbit/s的G.711編碼方式。

圖3　語(yǔ)音編碼對(duì)R值的影響

（3）從圖4仿真結(jié)果可以看出，發(fā)送端背景噪聲Ps和接收端背景噪聲Pr對(duì)MOS值的影響：背景噪聲小于40 dB時(shí)，對(duì)語(yǔ)音質(zhì)量沒(méi)有太大的影響，當(dāng)背景噪聲大于40 dB，語(yǔ)音質(zhì)量會(huì)迅速下降。

圖4　噪聲對(duì)MOS值的影響

4、結(jié)束語(yǔ)

　　 E-Model是一種語(yǔ)音質(zhì)量測(cè)量的新方法，在網(wǎng)絡(luò)規(guī)劃和語(yǔ)音監(jiān)測(cè)方面有著廣泛的應(yīng)用。隨著IP網(wǎng)絡(luò)和應(yīng)用的迅猛發(fā)展，特別是隨著NGN網(wǎng)絡(luò)的逐步應(yīng)用，該網(wǎng)絡(luò)可以提供包括話音、數(shù)據(jù)和多媒體等各種業(yè)務(wù)。語(yǔ)音質(zhì)量測(cè)量是NGN網(wǎng)絡(luò)測(cè)試的一個(gè)重要方面，基于E-Model的語(yǔ)音質(zhì)量測(cè)量是對(duì)NGN網(wǎng)絡(luò)語(yǔ)音質(zhì)量測(cè)量的一種有效的方法，必定會(huì)有很好的應(yīng)用前景。

廣東通信技術(shù)

VoIP要“趕走”PSTN還有點(diǎn)難 2007-04-17

擺脫VoIP安全困擾：電信外包的初衷 2007-04-17

曾劍秋解析AT&T的VOIP策略 2007-04-16

探索：網(wǎng)絡(luò)電話VoIP產(chǎn)業(yè)“亂局”突破點(diǎn) 2007-04-16

分類信息: