首頁>>廠商>>語音識別與合成>> 捷通華聲

捷通華聲語音網(wǎng)站解決方案

2001/11/16

1.1 背景和現(xiàn)狀

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)的硬件設(shè)備的容量和技術(shù)水平在不斷提高,網(wǎng)絡(luò)帶寬正在持續(xù)快速增長和放大;在軟件方面,流媒體、語音合成等技術(shù)也日臻成熟;ヂ(lián)網(wǎng)硬件水平和軟件技術(shù)的相互作用,為語音、圖形圖象、動態(tài)影像等大容量數(shù)據(jù)在互聯(lián)網(wǎng)上的傳送提供了可能。

近年來,一些語音網(wǎng)站紛紛開通,其中比較著名是2000年4月18日在英國誕生的全球首位互聯(lián)網(wǎng)虛擬主持人:安娜諾娃(Ananova,www.ananova.com)。從技術(shù)角度分析,安娜諾娃的實(shí)現(xiàn),基于三項(xiàng)主要的技術(shù),即數(shù)字動畫技術(shù)、語音合成技術(shù)和流媒體技術(shù)。數(shù)字動畫技術(shù)可以為安娜諾娃創(chuàng)建人類的表情,語音合成技術(shù)可以將新聞的內(nèi)容合成為人類的語言,流媒體技術(shù)可以使用戶在線收看、收聽安娜諾娃所播報的新聞。

在中國,也先后出現(xiàn)了類似的網(wǎng)站,諸如香港一家電視臺的“Icy”, 51Go網(wǎng)站的“GoGirl”和天津電視臺的“言東方”等等。

但是,以上這些以漢語為信息載體的虛擬主持人(語音網(wǎng)站)或者沒有實(shí)現(xiàn)語音方式,或者聲音全部是用人工提前錄音的方式錄制的,沒有實(shí)現(xiàn)用計算機(jī)進(jìn)行實(shí)時動態(tài)合成。

1.2 捷通華聲語音網(wǎng)站方案解決的技術(shù)問題

1.3解決方案之一:jTTS—Service語音服務(wù)器方案

語音服務(wù)器-IIS服務(wù)器-瀏覽器

語音服務(wù)器方案是指利用捷通華聲在CTI領(lǐng)域成熟應(yīng)用的jTTS Service語音服務(wù)器,增加一臺或多臺語音服務(wù)器到現(xiàn)有的IIS服務(wù)系統(tǒng)的網(wǎng)絡(luò)環(huán)境中;在IIS服務(wù)器中,增加訪問語音服務(wù)器的功能。當(dāng)IIS服務(wù)器需要流媒體輸出時,向語音服務(wù)器發(fā)出請求,語音服務(wù)器接受IIS服務(wù)器的請求,并對請求的數(shù)據(jù)進(jìn)行合成、格式轉(zhuǎn)換,得到流媒體后返回給IIS服務(wù)器,IIS服務(wù)器再將此流媒體傳輸給用戶。

(1) jTTS Service

(2)ASP(用于響應(yīng)Web頁面請求、播放的腳本程序、ASP程序)

在本方案中,語音服務(wù)器是構(gòu)建語音網(wǎng)站的后臺。jTTS Service將處于監(jiān)聽某一TCP/IP端口狀態(tài),響應(yīng)來自IIS服務(wù)器的多用戶請求。而IIS服務(wù)器則增加通過TCP/IP請求服務(wù)器和接受服務(wù)器返回數(shù)據(jù)的程序,來完成流媒體獲得的功能。

瀏覽器端(Explorer)發(fā)出瀏覽請求,網(wǎng)站服務(wù)器(IIS)根據(jù)請求查找流媒體(音頻流)文件,如有,則將流媒體返回客戶端,并啟動客戶端的MS media player播放流媒體。若沒有,則向語音服務(wù)器(jTTS Service)發(fā)出合成請求,并將所需合成的文本通過Socket接口傳送至語音服務(wù)器;語音服務(wù)器響應(yīng)網(wǎng)站服務(wù)器的合成請求后,將調(diào)用jTTS合成技術(shù)進(jìn)行語音合成,并調(diào)用WMF SDK將生成的音頻文件轉(zhuǎn)換成流媒體格式ASF;通過Socket接口返回IIS服務(wù)器端后,將此流媒體文件存儲到指定的Web目錄,同時將流媒體返回瀏覽器端,啟動MS media player播放。其流程如下:

 

(1)可實(shí)現(xiàn)語音服務(wù)器的分布式工作方式,對客戶端的請求自動調(diào)度,平衡負(fù)載,以達(dá)到更高的性能。

(2)適用于訪問量大(同時60線程及以上并發(fā)合成)的門戶網(wǎng)站或提供虛擬主機(jī)的IDC、ASP。

(3) 對現(xiàn)有的IIS服務(wù)系統(tǒng)不產(chǎn)生影響,也無需硬件升級,只需在IIS服務(wù)器上安裝客戶端軟件。

(4)投入少、實(shí)現(xiàn)簡單,只需增加一臺或多臺語音服務(wù)器(視服務(wù)量大小,建議配置:PIII550 128M 10G以上)到現(xiàn)有的IIS服務(wù)系統(tǒng)的網(wǎng)絡(luò)環(huán)境中。

1.服務(wù)器端

語音服務(wù)器:

(1)一臺或多臺語音服務(wù)器(視服務(wù)量大小建議配置:PIII550 128M 10G以上)。

(2)NT4.0、SP4及以上、WMF SDK4.0及以上或Windows 2000、WMF SDK4.0及以上。

(3)jTTS Service(捷通華聲TTS服務(wù)器)服務(wù)器端軟件。

IIS服務(wù)器:

(1)jTTS Service (捷通華聲TTS服務(wù)器)客戶端軟件。

2.Web頁面端

(1)加入傳播參數(shù)的腳本,加入調(diào)用播放器的腳本文件(mediaplayer.asp)。

(2)加入播放參數(shù)(播放文件標(biāo)志、播放引擎)。

1.4解決方案之二:jTTS-Web Service Pack語音網(wǎng)站服務(wù)包方案

語音網(wǎng)站服務(wù)包+IIS服務(wù)器-瀏覽器

與語音服務(wù)器方案不同的是,語音網(wǎng)站服務(wù)包方案不添加語音服務(wù)器,而是在IIS服務(wù)器中安裝捷通華聲語音網(wǎng)站服務(wù)包,從而構(gòu)成集網(wǎng)站服務(wù)器(IIS)、語音服務(wù)器(TTS)于一身的語音網(wǎng)站服務(wù)器。其工作方式與語音服務(wù)器方案大致相同。當(dāng)IIS服務(wù)器響應(yīng)瀏覽器請求需要流媒體輸出時,通過內(nèi)部COM控件向底層的jTTS發(fā)出請求,jTTS依據(jù)COM所傳遞的參數(shù),對請求的數(shù)據(jù)進(jìn)行合成、格式轉(zhuǎn)換后,直接將此流媒體傳輸給客戶端的瀏覽器。

 

(1)COM控件(TTSPlayer.dll,用于鏈接Web腳本和TTS合成引擎jTTS_ma.dll的動態(tài)鏈接程序)

(2)jTTS SDK

在語音網(wǎng)站服務(wù)器中,語音服務(wù)器位于系統(tǒng)的底層,其作用是響應(yīng)來自IIS服務(wù)器的請求服務(wù),來完成流媒體的生成。

瀏覽器端(Explorer)發(fā)出瀏覽請求時,加在Web頁面的服務(wù)器端ASP程序和腳本程序自動響應(yīng),根據(jù)請求查找流媒體(音頻流)文件,如有,則將流媒體返回客戶端,并啟動客戶端的MS media player播放流媒體。若沒有,則向通過COM控件(TTSPlayer.dll)的傳遞函數(shù)向COM傳遞參數(shù),并發(fā)送合成請求;COM控件根據(jù)參數(shù)和請求調(diào)用捷通華聲語音合成系統(tǒng)jTTS(jTTS_ma.dll)生成Wave格式的音頻文件,并返回給COM控件;COM控件得到之后再調(diào)用WMF SDK將所生成的音頻文件轉(zhuǎn)換成流媒體格式ASF,在保存到指定目錄后開始將此流媒體返回客戶端,啟動MS media player播放。其流程如下:

(1)投入少,實(shí)現(xiàn)簡單,不需增加任何硬件設(shè)備,性價比高。

(2)適用于訪問量不大(同時60線程左右并發(fā)合成)的企業(yè)、機(jī)關(guān)及各類網(wǎng)站或提供虛擬主機(jī)服務(wù)的IDC、ASP。

(3)對現(xiàn)有的IIS服務(wù)系統(tǒng)影響小,需在IIS服務(wù)器上安裝jTTS-Web Service Pack軟件。

 

 

1.服務(wù)器端

對IIS服務(wù)器的要求是SP4及以上,增加以下組件

jTTS SDK2.1、添加并注冊COM控件(TTSPlayer.dll)、WMF SDK4.0及以上。

2.Web頁面端

(1)加入傳播參數(shù)的腳本,加入調(diào)用播放器的腳本文件(mediaplayer.asp)。

(2) 加入播放參數(shù)(播放文件標(biāo)志、播放引擎)。

 

捷通華聲供稿 CTI論壇編輯



相關(guān)鏈接:
捷通華聲發(fā)布jASR5.5 ASR價格面前將無怯步 2008-04-16
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31
捷通華聲移動導(dǎo)航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28