首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>> 捷通華聲

捷通華聲TTS在掌上電腦、信息家電等領(lǐng)域的解決方案

2002/09/01

1. 掌上電腦

1.1 捷通華聲TTS在掌上電腦上的應(yīng)用

  由于掌上電腦的屏幕太小,閱讀信息很不方便,這形成了信息獲取的一個(gè)瓶頸。人們對(duì)掌上電腦追求是越來(lái)越小巧,但是越小,這個(gè)瓶頸就越發(fā)突出。雖然各個(gè)廠家都在大力發(fā)展掌上電腦的應(yīng)用軟件,尤其是互聯(lián)網(wǎng)應(yīng)用的軟件,使其能夠收發(fā)郵件,瀏覽網(wǎng)頁(yè),但是面對(duì)互聯(lián)網(wǎng)上的大量信息,如果都通過(guò)一個(gè)比手掌還小的屏幕去閱讀,其難度可想而知。不僅眼睛容易疲勞,不停滾屏也需要很大的耐心。因此,如果我們能夠在掌上電腦上應(yīng)用語(yǔ)音合成技術(shù),通過(guò)"聽"而不是"看"來(lái)讀取大量的信息,就可以打破瓶頸的束縛,為掌上電腦的進(jìn)一步普及提供一個(gè)很有力的基礎(chǔ)。

  掌上電腦的內(nèi)存存儲(chǔ)容量十分小,而且沒(méi)有硬盤一類的外部存儲(chǔ)設(shè)備,這些因素導(dǎo)致了很多在臺(tái)式微機(jī)上得到很好應(yīng)用的軟件無(wú)法在嵌入式操作系統(tǒng)環(huán)境下運(yùn)行,TTS系統(tǒng)也是如此。普通的TTS技術(shù)需要20M以上的音庫(kù)才能完成男女聲的語(yǔ)音合成,顯然不能完成在掌上電腦的應(yīng)用,而捷通華聲公司的TTS具有音庫(kù)壓縮技術(shù)和音色轉(zhuǎn)化技術(shù),從而使捷通華聲TTS技術(shù)在掌上電腦上的應(yīng)用成為可能。

1.2 捷通華聲TTS在嵌入式操作系統(tǒng)應(yīng)用歷程

  三年來(lái),捷通華聲公司積累了將TTS技術(shù)與其他應(yīng)用軟件相結(jié)合的豐富經(jīng)驗(yàn)("錄易"漢語(yǔ)智能輸入輸出系統(tǒng)),TTS技術(shù)向其他硬件系統(tǒng)上移植的核心技術(shù)(TTS在電話語(yǔ)音卡上的開發(fā)),為我們實(shí)現(xiàn)TTS技術(shù)向嵌入式操作系統(tǒng)的移植打下了堅(jiān)實(shí)的技術(shù)基礎(chǔ),并保持業(yè)已形成的領(lǐng)先優(yōu)勢(shì)。

  我們成功實(shí)現(xiàn)了捷通華聲TTS在"天權(quán)2000+"上的移植。在"天權(quán)2000+"上移植實(shí)驗(yàn)的成功表明捷通華聲公司已經(jīng)具備了向嵌入式操作系統(tǒng)移植中文語(yǔ)音技術(shù)的能力,為全面進(jìn)入產(chǎn)品化階段打下了基礎(chǔ)。

  2000年10月,捷通華聲公司成功推出國(guó)內(nèi)第一套應(yīng)用于掌上電腦的語(yǔ)音軟件--語(yǔ)音伴侶-CE版。該軟件成功實(shí)現(xiàn)掌上電腦"開口說(shuō)話",為解決嵌入式設(shè)備獲取信息的"瓶頸"難題提供了一套嶄新的方案。掌上電腦等嵌入式設(shè)備的軟件應(yīng)用已成為現(xiàn)實(shí)。

  2001年7月,捷通華聲公司推出了目前世界領(lǐng)先的嵌入式TTS漢語(yǔ)語(yǔ)音合成技術(shù),推動(dòng)了語(yǔ)音技術(shù)在嵌入式中應(yīng)用的發(fā)展。

1.3 捷通華聲TTS在掌上電腦的解決方案案

  捷通華聲公司的TTS技術(shù)與其他文語(yǔ)轉(zhuǎn)換系統(tǒng)相比具有獨(dú)特的音庫(kù)壓縮等特點(diǎn),使捷通華聲TTS技術(shù)向嵌入式操作系統(tǒng)的移植(尤其是向PDA上的移植)具備先決條件。據(jù)市場(chǎng)調(diào)研及考證:捷通華聲公司是最早掌握該技術(shù),及最先提出在掌上電腦應(yīng)用該技術(shù)的公司。該系統(tǒng)在2001年中關(guān)村電腦節(jié)上榮獲"十大IT創(chuàng)新產(chǎn)品"。

  捷通華聲公司的TTS技術(shù)(jTTS),是具有自我版權(quán)的TTS技術(shù),以大規(guī)模真實(shí)錄音的語(yǔ)音庫(kù)為基礎(chǔ),增加音庫(kù)壓縮算法和音色變換算法形成核心技術(shù)。此核心技術(shù)與國(guó)內(nèi)其他文語(yǔ)轉(zhuǎn)換技術(shù)相比較,具有如下特點(diǎn):

· 系統(tǒng)輸出語(yǔ)音清晰度高。
· 系統(tǒng)輸出具有非常好的自然度。
· 音庫(kù)大小可縮擴(kuò),小音庫(kù)僅為1MB。
· 合成速度快。

  正是因?yàn)榻萃ㄈA聲TTS具有以上的特點(diǎn),使得捷通華聲公司的TTS技術(shù)可以向嵌入式操作系統(tǒng)移植。特別是小音庫(kù)和音色轉(zhuǎn)換的特點(diǎn),使得在嵌入式操作系統(tǒng)下不會(huì)占用太大的資源。

  捷通華聲公司語(yǔ)音合成技術(shù)向WinCE操作系統(tǒng)環(huán)境下移植的技術(shù)已經(jīng)成熟,進(jìn)入到應(yīng)用階段。庫(kù)大小為1M,運(yùn)行空間在2M左右,完全可以滿足掌上電腦應(yīng)用的需要。

  捷通華聲公司提供最新的WinCE環(huán)境下的語(yǔ)音合成開發(fā)工具包(jTTS-ce SDK),掌上電腦應(yīng)用程序的開發(fā)廠商可以利用此SDK在其自己的應(yīng)用中加入語(yǔ)音合成的功能。另外,捷通華聲公司還可提供WinCE版本下的"語(yǔ)音伴侶",提供閱讀電子文檔和有聲鬧鐘的功能,以供掌上電腦的生產(chǎn)廠家選用。

  目前捷通華聲公司已經(jīng)在不同的操作系統(tǒng)和硬件環(huán)境中進(jìn)行了移植,操作系統(tǒng)包括:Hopen、Linux、Nucleus、WinCE 2.11 (Palm PC)、WinCE 3.0 (Pocket PC, Pocket PC 2002), WinCE .NET、Penbex等;CUP包括:MIPS、DragonBall,、StrongARM、ARM7、X86等。

2. 信息家電

2.1 TTS在信息家電中的應(yīng)用

  應(yīng)該說(shuō),無(wú)論從商業(yè)角度還是從促進(jìn)用戶接觸互聯(lián)網(wǎng)的社會(huì)意義上來(lái)說(shuō)機(jī)頂盒都是很好的概念。然而我們發(fā)現(xiàn)機(jī)頂盒的銷售并不理想。據(jù)我們的分析,有聲的電視機(jī)變成了無(wú)聲的網(wǎng)絡(luò)瀏覽器是用戶并不習(xí)慣使用的一個(gè)很大的原因。我們注意到,多年以來(lái),人們已經(jīng)習(xí)慣將電視機(jī)作為家庭生活的一個(gè)娛樂(lè)中心,圖像和聲音必不可少,而在目前的機(jī)頂盒系統(tǒng)中,人們?cè)陔娨暻澳瑹o(wú)聲地閱讀網(wǎng)頁(yè)信息。從開始對(duì)商品的認(rèn)織習(xí)慣來(lái)說(shuō),人們對(duì)"熱鬧慣了"的電視機(jī)變成了一個(gè)"啞口無(wú)言"的顯示器,可能會(huì)很不習(xí)慣。因此,引入語(yǔ)音合成技術(shù)會(huì)對(duì)機(jī)頂盒的推廣有很大地促進(jìn)作用。

  語(yǔ)音一直是人們生活中最重要的交流手段,在一些新式的信息家電中,也采用了語(yǔ)音的方式來(lái)通知用戶狀態(tài)或信息,但一般都是采用錄音回放的方式,無(wú)法實(shí)現(xiàn)對(duì)任意文本的閱讀。對(duì)于需要上網(wǎng)的信息家電來(lái)說(shuō),所閱讀的信息肯定是任意的而非事先固定的。這也正是語(yǔ)音合成技術(shù)的用武之地。

  在信息家電中使用語(yǔ)音合成技術(shù)的難點(diǎn)和掌上電腦的情況是一樣的,需要較小的庫(kù)和運(yùn)行內(nèi)存。

2.2 捷通華聲TTS在信息家電中的解決方案

  類似于掌上電腦,在WinCE操作系統(tǒng)下,捷通華聲公司已經(jīng)推出了實(shí)用的語(yǔ)音合成技術(shù)。捷通華聲公司可以向其它廠商提供捷通華聲TTS開發(fā)工具包(jTTS-ce SDK)。捷通華聲公司也將根據(jù)不同用戶的需求將語(yǔ)音合成技術(shù)移植到HOPEN等不同的操作系統(tǒng)中。

  另外,捷通華聲公司將會(huì)投入精力在語(yǔ)音合成技術(shù)的硬件實(shí)現(xiàn)上,例如用DSP(數(shù)字信號(hào)處理)芯片來(lái)實(shí)現(xiàn),以便使語(yǔ)音合成技術(shù)更好地為信息家電服務(wù)。

3. 其它

  我們所列舉的嵌入式應(yīng)用只是幾個(gè)最具有代表性的領(lǐng)域,類似的嵌入式應(yīng)用還有很多,如WAP手機(jī)、可以講故事的玩具等。在這些領(lǐng)域中,由于沒(méi)有操作系統(tǒng),語(yǔ)音合成主要的實(shí)現(xiàn)手段將是芯片技術(shù),這也正是捷通華聲公司今后研究的目標(biāo)之一。

  值得關(guān)注的是,捷通華聲還同時(shí)提供嵌入式手寫識(shí)別技術(shù)和嵌入式語(yǔ)音識(shí)別技術(shù),并將它們有機(jī)的結(jié)合起來(lái),實(shí)現(xiàn)一個(gè)完整的嵌入式整體解決方案。相信該方案能為今后各類手持設(shè)備、信息家電設(shè)備提供必不可少的實(shí)用功能。

捷通華聲公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無(wú)怯步 2008-04-16
捷通華聲TTS成功登陸中國(guó)郵政儲(chǔ)蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31
捷通華聲移動(dòng)導(dǎo)航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28