欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁(yè) > 技術(shù) > 解決方案 > 聲訊TTS應(yīng)用解決方案

聲訊TTS應(yīng)用解決方案

2001-08-29 00:00:00   作者:   來(lái)源:   評(píng)論:0 點(diǎn)擊:


一、語(yǔ)音合成技術(shù)及其在聲訊臺(tái)中的應(yīng)用

1 語(yǔ)音合成簡(jiǎn)介

語(yǔ)音合成(Text To Speech),簡(jiǎn)稱TTS技術(shù),它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù)。解決的主要問(wèn)題就是如何將文本狀態(tài)的文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來(lái)聽(tīng)。通俗地說(shuō),就是讓電腦開(kāi)口說(shuō)話的技術(shù)。這項(xiàng)技術(shù)在以語(yǔ)音信息服務(wù)為主要方式的聲訊業(yè)務(wù)中尤其有應(yīng)用意義。

2 語(yǔ)音合成技術(shù)的優(yōu)點(diǎn)

語(yǔ)音是信息傳播的一大媒介,隨著多媒體信息需求的增大,語(yǔ)音服務(wù)系統(tǒng)近年來(lái)發(fā)展較為迅速。下表是語(yǔ)音合成技術(shù)和傳統(tǒng)錄音回放技術(shù)在語(yǔ)音服務(wù)中相比較的情況。

 

TTS

錄音制作

存儲(chǔ)空間的要求

較低

較高

節(jié)目開(kāi)發(fā)周期

長(zhǎng)

出錯(cuò)可能

信息的更新速度

即時(shí)

信息庫(kù)建立和維護(hù)的工作量

  • 就工作量而言,錄音需要大量的人力,在信息量以級(jí)數(shù)增長(zhǎng)的今天,錄音往往無(wú)法滿足信息的供給,而語(yǔ)音合成將絕大多數(shù)工作由機(jī)器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。
  • 對(duì)于動(dòng)態(tài)的信息,尤其是對(duì)實(shí)時(shí)性要求很高的信息如:股票行情等,如果讓錄音員錄音則至少在半小時(shí)后才能對(duì)外提供,而語(yǔ)音合成可以實(shí)現(xiàn)實(shí)時(shí)的轉(zhuǎn)換,每分鐘可刷新一次。
  • 由于信息的高速增長(zhǎng),錄音數(shù)據(jù)存放和查詢也存在問(wèn)題。將信息以文本形式存儲(chǔ)在計(jì)算機(jī)中可節(jié)約大量系統(tǒng)資源再結(jié)合計(jì)算機(jī)技術(shù)對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行搜索和整理將輸出的結(jié)果用語(yǔ)音合成轉(zhuǎn)換成聲音,這樣就可以解決信息服務(wù)中海量信息的存儲(chǔ)和查詢的問(wèn)題。
  • 錄音的信息維護(hù)、修改的工作量比較大。而文本信息的維護(hù)和修改相對(duì)要容易的多,通過(guò)語(yǔ)音合成技術(shù)只需對(duì)文本信息進(jìn)行修改就可以完成信息內(nèi)容的更改和維護(hù)工作。

二、全省節(jié)目文本內(nèi)容聯(lián)網(wǎng)方案

在聲訊臺(tái)使用TTS技術(shù)能實(shí)現(xiàn)一種全新的節(jié)目聯(lián)網(wǎng)方式。在實(shí)現(xiàn)數(shù)據(jù)聯(lián)網(wǎng)情況下,節(jié)點(diǎn)聲訊臺(tái)中的一個(gè)或者多個(gè)制作的節(jié)目?jī)?nèi)容能通過(guò)文本的方式在網(wǎng)絡(luò)上共享;其他的節(jié)點(diǎn)聲訊臺(tái)取得這些文本內(nèi)容,在本地進(jìn)行語(yǔ)音合成,進(jìn)而開(kāi)通相應(yīng)的節(jié)目。從而可以使用少量的帶寬來(lái)輕松實(shí)現(xiàn)信息共享,為各地的用戶提供全面的語(yǔ)音服務(wù)。

1 集中制作、聯(lián)網(wǎng)下傳方式

單一的節(jié)目制作中心一般放置在省中心。在節(jié)目制作中心,節(jié)目數(shù)據(jù)以數(shù)據(jù)庫(kù)或者文本文件的方式存放于節(jié)目數(shù)據(jù)倉(cāng)庫(kù)中。在節(jié)目制作中心運(yùn)行文本訪問(wèn)服務(wù)代理,接受各地市臺(tái)的數(shù)據(jù)請(qǐng)求并發(fā)送相應(yīng)的數(shù)據(jù)。各個(gè)地市臺(tái)通過(guò)文本請(qǐng)求、接收代理向中心請(qǐng)求或者接收文本數(shù)據(jù),存放于本地?cái)?shù)據(jù)倉(cāng)庫(kù),等待語(yǔ)音合成服務(wù)器合成成語(yǔ)音文件,地市臺(tái)使用合成后的語(yǔ)音文件迅速開(kāi)通相應(yīng)的節(jié)目。

節(jié)目文本數(shù)據(jù)的共享和消息通知,可以通過(guò)兩種方式實(shí)現(xiàn),即地市臺(tái)定時(shí)(或人為)向中心請(qǐng)求數(shù)據(jù),或者中心數(shù)據(jù)服務(wù)代理向地市臺(tái)廣播數(shù)據(jù)增加消息,并發(fā)送增加的數(shù)據(jù)。

三、TTS技術(shù)應(yīng)用方案

通過(guò)節(jié)目文本內(nèi)容聯(lián)網(wǎng),實(shí)現(xiàn)節(jié)目文本內(nèi)容的共享,從文本到語(yǔ)音的轉(zhuǎn)換,開(kāi)通相應(yīng)的節(jié)目則需要語(yǔ)音合成來(lái)完成。

科大訊飛針對(duì)各地聲訊平臺(tái)不同的建設(shè)狀況,提出實(shí)時(shí)合成和離線合成兩種解決方案,實(shí)現(xiàn)在現(xiàn)有平臺(tái)上嵌入語(yǔ)音合成功能。

1.離線合成

在用戶電話呼入之前生成相應(yīng)語(yǔ)音文件,每個(gè)語(yǔ)音文件可供多個(gè)用戶重復(fù)聽(tīng)取。特點(diǎn)是資源消耗少(普通PC即可實(shí)現(xiàn)),硬件要求低,能較好的替代人工錄音的語(yǔ)音制作方式。

離線合成可以與省級(jí)甚至全國(guó)聲訊網(wǎng)絡(luò)結(jié)合,開(kāi)發(fā)出靈活的聯(lián)網(wǎng)業(yè)務(wù)。即文本訪問(wèn)代理從廣域網(wǎng)上取得節(jié)目文本數(shù)據(jù)存放于本地的文本數(shù)據(jù)共享目錄,語(yǔ)音合成服務(wù)器通過(guò)訪問(wèn)該目錄獲取節(jié)目文本合成為語(yǔ)音文件存放與服務(wù)器的語(yǔ)音文件共享目錄中。局域網(wǎng)內(nèi)其他設(shè)備(IVR、MSI等等)訪問(wèn)語(yǔ)音文件共享目錄,向用戶播放最新生成的語(yǔ)音信息。

2.在線合成嵌入方案

在線合成是在用戶電話呼入的同時(shí)實(shí)時(shí)生成語(yǔ)音文件,并在該用戶呼入的通道播放,每個(gè)語(yǔ)音文件僅供該用戶聽(tīng)取。

在線合成包含離線合成的一切功能,且實(shí)時(shí)性好,業(yè)務(wù)靈活,可以開(kāi)展出各種個(gè)性化信息服務(wù),主要適用于對(duì)語(yǔ)音合成的實(shí)時(shí)性要求高的場(chǎng)合。

聲訊平臺(tái)的TTS升級(jí)是在現(xiàn)有平臺(tái)上增加TTS語(yǔ)音合成服務(wù)器,語(yǔ)音節(jié)點(diǎn)通過(guò)語(yǔ)音合成網(wǎng)關(guān)調(diào)用TTS資源。語(yǔ)音合成服務(wù)器支持多路的實(shí)時(shí)語(yǔ)音合成,根據(jù)系統(tǒng)業(yè)務(wù)量可以方便地?cái)U(kuò)容。

由于不涉及到話務(wù)接入處理層的內(nèi)容,聲訊臺(tái)采用前置交換方式還是后置交換方式不對(duì)嵌入改造工作的造成影響。

如圖所示,一個(gè)包含TTS服務(wù)的電話訪問(wèn)流程大致可分為七步:

(1)用戶電話撥入,系統(tǒng)IVR響應(yīng),獲得用戶按鍵等信息。

(2)IVR根據(jù)用戶輸入,向數(shù)據(jù)庫(kù)或文件等信息源申請(qǐng)數(shù)據(jù)。

(3)信息源返回文本數(shù)據(jù)給IVR。

(4)IVR通過(guò)其TCP通訊接口將需要合成的文本信息發(fā)送給TTS Server。

(5)TTS Server將用戶文本合成為語(yǔ)音文件放置在一個(gè)共享目錄中。

(6)TTS Server通過(guò)其TCP通訊接口通知IVR合成完畢,并返回文件名。

(7)IVR播放相應(yīng)的語(yǔ)音文件給電話用戶。

四、TTS技術(shù)在聲訊臺(tái)的應(yīng)用意義

新業(yè)務(wù)的開(kāi)發(fā)對(duì)現(xiàn)有聲訊平臺(tái)提出了更高的技術(shù)要求,目前全省聲訊平臺(tái)基本上沒(méi)有文字語(yǔ)音合成能力,數(shù)字合成也停留在單音報(bào)讀階段,播放出來(lái)的聲音生硬、不連續(xù)、不自然;而使用語(yǔ)音合成技術(shù)合成的語(yǔ)音自然、連續(xù),接近人的發(fā)音,用戶感覺(jué)較親切,易聽(tīng)懂,可以大幅度提高服務(wù)質(zhì)量和用戶滿意度。可以說(shuō),TTS技術(shù)的應(yīng)用是聲訊平臺(tái)技術(shù)升級(jí)的當(dāng)務(wù)之急。

TTS技術(shù)在聲訊臺(tái)應(yīng)用后可以直接開(kāi)發(fā)許多新業(yè)務(wù),如:

1.海量信息查詢類業(yè)務(wù)

大部分海量信息如考試查分、征婚啟事、人才信息、電話廣告等,由于其內(nèi)容龐大,往往無(wú)法在短期內(nèi)完成錄音,即使可以事先錄音,也需要很長(zhǎng)的制作周期,而且在量大的時(shí)候肯定會(huì)出現(xiàn)人為錯(cuò)誤;采用語(yǔ)音合成技術(shù)可以節(jié)約大量人力,縮短開(kāi)發(fā)周期,而且能夠完全保證了所有信息100%正確。

2.動(dòng)態(tài)信息查詢類業(yè)務(wù)

聲訊節(jié)目逐漸地由現(xiàn)在娛樂(lè)型節(jié)目為主的節(jié)目構(gòu)成轉(zhuǎn)向以應(yīng)用型的節(jié)目為主,而多數(shù)的應(yīng)用類節(jié)目對(duì)實(shí)時(shí)性要求比較高,如證券行情、訂票、訂房等,上述應(yīng)用中動(dòng)態(tài)信息不可能事先錄音,需要實(shí)時(shí)地從數(shù)據(jù)庫(kù)中讀取,動(dòng)態(tài)進(jìn)行語(yǔ)音合成,保證信息的實(shí)時(shí)性。

此外,在聲訊服務(wù)領(lǐng)域內(nèi),使用TTS技術(shù)不但對(duì)技術(shù)開(kāi)發(fā)工作來(lái)說(shuō)很重要,而且對(duì)于業(yè)務(wù)運(yùn)營(yíng)方面也同樣如此。傳統(tǒng)的聲訊服務(wù)領(lǐng)域,信息的組織和維護(hù)都是由人工來(lái)完成的,需要人工錄音、文件拷貝等一系列步驟,工作煩瑣,維護(hù)不便,很難做到信息的實(shí)時(shí)更新,影響了服務(wù)質(zhì)量,而且占用存儲(chǔ)資源多。

由此可見(jiàn),TTS技術(shù)作為一個(gè)新興技術(shù),可以解決動(dòng)態(tài)信息和海量信息的查詢問(wèn)題,把它應(yīng)用于聲訊領(lǐng)域,對(duì)于開(kāi)展增值業(yè)務(wù),改變傳統(tǒng)業(yè)務(wù)的實(shí)現(xiàn)方式,提高服務(wù)質(zhì)量都是很必要的。

科大訊飛供稿 CTI論壇編輯

相關(guān)閱讀:

分享到: 收藏

專題