首頁(yè)>>>技術(shù)>>>語(yǔ)音應(yīng)用>>>語(yǔ)音合成(TTS)  語(yǔ)音合成產(chǎn)品

 

語(yǔ)音門(mén)戶(hù)網(wǎng)革命

Cene Eagle 2000/12/04

  電子商務(wù)是當(dāng)今世界最熱門(mén)的商業(yè)趨勢(shì),而語(yǔ)音門(mén)戶(hù)正在迅速成為電子商務(wù)中的熱點(diǎn);谡Z(yǔ)音的互聯(lián)網(wǎng)門(mén)戶(hù),也就是語(yǔ)音門(mén)戶(hù),代表著計(jì)算機(jī)語(yǔ)音與互聯(lián)網(wǎng)融合的新趨勢(shì)。

  語(yǔ)音門(mén)戶(hù)讓用戶(hù)可隨時(shí)隨地輕松獲取各種信息。例如,用戶(hù)只需用普通電話(huà)機(jī)或手機(jī)撥打語(yǔ)音門(mén)戶(hù)網(wǎng)的800號(hào)碼,就可在語(yǔ)音提示引導(dǎo)之下用自然語(yǔ)言和耳朵便捷地“瀏覽”所需信息。在這個(gè)過(guò)程中,不必鍵入菜單選擇,僅需簡(jiǎn)單的語(yǔ)音應(yīng)答即可完成操作。所以,語(yǔ)音門(mén)戶(hù)簡(jiǎn)單易用—無(wú)論是通過(guò)PC機(jī)、手機(jī)或者固定電話(huà),也無(wú)論是在辦公室、家中還是在路上、車(chē)上,“瀏覽”網(wǎng)絡(luò)的過(guò)程變得輕松無(wú)比!

  由于語(yǔ)音技術(shù)的發(fā)展,語(yǔ)音門(mén)戶(hù)將電話(huà)交互過(guò)程從以廠(chǎng)商為中心轉(zhuǎn)向以用戶(hù)為中心。這一轉(zhuǎn)變?cè)跒橛脩?hù)提高效率和降低業(yè)務(wù)成本的同時(shí),還將提高用戶(hù)的滿(mǎn)意度。

  未來(lái)數(shù)年,語(yǔ)音門(mén)戶(hù)將大大改變?nèi)藗兪褂秒娫?huà)的方式以及廠(chǎng)商與主叫用戶(hù)溝通的方式。在當(dāng)今以廠(chǎng)商為中心的模式中,主叫用戶(hù)只能以?huà)鞌嚯娫?huà)的方式來(lái)“擺脫”某一企業(yè)的交互式語(yǔ)音應(yīng)答(IVR)系統(tǒng)。而在未來(lái)以用戶(hù)為中心的模式中,主叫用戶(hù)可與語(yǔ)音門(mén)戶(hù)展開(kāi)交互式對(duì)話(huà),可以象“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè)。


  語(yǔ)音市場(chǎng)火爆


  語(yǔ)音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟(jì)最重要的“推進(jìn)器”之一。語(yǔ)音技術(shù)市場(chǎng)正在迅速成長(zhǎng),且發(fā)展勢(shì)頭良好。分析家預(yù)測(cè),從1999年到2004年,語(yǔ)音技術(shù)市場(chǎng)將以每年31%的速度持續(xù)增長(zhǎng)。語(yǔ)音技術(shù)市場(chǎng)的迅速擴(kuò)展意味著我們正面臨著大量部署語(yǔ)音應(yīng)用的轉(zhuǎn)折期。

  語(yǔ)音技術(shù)如此“火爆”有幾方面的原因,這既與語(yǔ)音技術(shù)本身有關(guān),同時(shí)也因?yàn)檎Z(yǔ)音技術(shù)能夠讓開(kāi)發(fā)商不斷推出真正滿(mǎn)足現(xiàn)實(shí)用戶(hù)需求的應(yīng)用。比如,90年代早期,簡(jiǎn)單的語(yǔ)音應(yīng)用只支持詞匯較少的(20到30個(gè)單詞)命令和控制指令,且只能識(shí)別不連續(xù)的數(shù)字。現(xiàn)在,在我們的眼前卻出現(xiàn)了諸如虛擬個(gè)人助理、股票交易代理、企業(yè)內(nèi)自動(dòng)值守、旅游訂票系統(tǒng)和許多其他可實(shí)現(xiàn)語(yǔ)音功能的復(fù)雜應(yīng)用。在不久的將來(lái),在互聯(lián)網(wǎng)上更將出現(xiàn)由大型詞匯表(一百萬(wàn)字條)支持的自動(dòng)目錄幫助、企業(yè)應(yīng)用托管等象語(yǔ)音門(mén)戶(hù)這樣的應(yīng)用。


  技術(shù)是發(fā)展動(dòng)力


  未來(lái)語(yǔ)音應(yīng)用的關(guān)鍵在于語(yǔ)音技術(shù)的發(fā)展。在過(guò)去幾年里,ASR引擎的精確度和詞匯量已經(jīng)大大提升。精確的算法、顯著增強(qiáng)的處理能力、更低的成本和實(shí)現(xiàn)自助溝通、連續(xù)語(yǔ)音技術(shù)的不斷發(fā)展推動(dòng)了這些進(jìn)步。Barging技術(shù)也已完善,可使主叫用戶(hù)根據(jù)提示進(jìn)行應(yīng)答,并且可識(shí)別用戶(hù)的應(yīng)答。自然語(yǔ)言功能的推出也對(duì)語(yǔ)音應(yīng)用的用途產(chǎn)生了極大影響。


  倍受服務(wù)商偏愛(ài)


  除了新型技術(shù)的出現(xiàn)和原有技術(shù)的發(fā)展外,在當(dāng)今具有強(qiáng)大沖擊力的語(yǔ)音應(yīng)用發(fā)展大潮中,另外一個(gè)關(guān)鍵的因素就是技術(shù)供應(yīng)商改變了自己的角色。當(dāng)今的服務(wù)提供商(主要是過(guò)去的算法供應(yīng)商)已經(jīng)發(fā)展成為全方位應(yīng)用的提供者,擁有大批人文因素設(shè)計(jì)、應(yīng)用分析、系統(tǒng)分析、語(yǔ)言學(xué)和電話(huà)應(yīng)用開(kāi)發(fā)方面的專(zhuān)家,他們推出了廣泛的專(zhuān)業(yè)服務(wù),支持創(chuàng)建、部署和維護(hù)高級(jí)語(yǔ)音應(yīng)用的功能。


  新工具不斷涌現(xiàn)


  應(yīng)用測(cè)試工具已經(jīng)大大改進(jìn),使技術(shù)供應(yīng)商能夠開(kāi)發(fā)快速、持續(xù)部署的應(yīng)用成為可能。

  現(xiàn)在,從一種新型應(yīng)用的基本研究設(shè)計(jì)開(kāi)始,開(kāi)發(fā)商就可謹(jǐn)慎地、小規(guī)模地進(jìn)行測(cè)試,然后將測(cè)試的結(jié)果不斷反饋到開(kāi)發(fā)過(guò)程中,直到可部署實(shí)際應(yīng)用為止。一旦一個(gè)實(shí)際應(yīng)用部署之后,開(kāi)發(fā)商可將這一技能應(yīng)用到其他類(lèi)似的應(yīng)用中,這樣,大規(guī)模快速部署新型應(yīng)用變得相對(duì)簡(jiǎn)單輕松。

  同時(shí),技術(shù)開(kāi)發(fā)商也投入了很多精力來(lái)開(kāi)發(fā)可方便快速部署應(yīng)用的強(qiáng)大工具。對(duì)話(huà)應(yīng)用組件(DAC)便是這樣一種高級(jí)程序工具,它融合了大量從應(yīng)用對(duì)話(huà)設(shè)計(jì)和從經(jīng)常性用戶(hù)交互中獲得的大量寶貴經(jīng)驗(yàn)和知識(shí)。例如,DAC可包含小程序,這些小程序允許用戶(hù)從目錄中選擇項(xiàng)目、讓?xiě)?yīng)用程序收集信用卡號(hào)碼、接收“是”或“不是”這樣的回答、獲取旅行出發(fā)點(diǎn)和目的地的信息或查看股票價(jià)格等。通過(guò)提供可再利用的目標(biāo)程序中的專(zhuān)門(mén)技術(shù),DAC可大大縮短開(kāi)發(fā)新型應(yīng)用的時(shí)間。過(guò)去需30人、數(shù)年才能開(kāi)發(fā)出的應(yīng)用程序,現(xiàn)在利用更少的人員、在數(shù)月甚或數(shù)周之內(nèi)即可開(kāi)發(fā)出來(lái)。


  轉(zhuǎn)換質(zhì)量提高


  除了語(yǔ)音識(shí)別技術(shù)之外,文字轉(zhuǎn)換為語(yǔ)音(TTS)的技術(shù)水平也大大提高,成為促進(jìn)語(yǔ)音門(mén)戶(hù)發(fā)展的另一個(gè)重要因素。過(guò)去由于語(yǔ)音轉(zhuǎn)換質(zhì)量差,阻礙了TTS的廣泛應(yīng)用,而最新一代的TTS技術(shù)顯著地提高了語(yǔ)音轉(zhuǎn)換的質(zhì)量,語(yǔ)言支持也得到很大的提高。此外,TTS現(xiàn)實(shí)應(yīng)用中至關(guān)重要的組件—處理“臟”數(shù)據(jù)的預(yù)處理器已經(jīng)開(kāi)發(fā)出來(lái)?尚拚⑻幚碇T如首字母縮寫(xiě)詞、縮略詞和聲調(diào)的電子郵件預(yù)處理器,也使通過(guò)電話(huà)閱讀電子郵件信息的應(yīng)用成為可能。


  應(yīng)用前景廣闊


  互聯(lián)網(wǎng)電子交易革命使人們對(duì)即時(shí)信息接入和強(qiáng)大的交易處理功能提出了更高的要求。為了滿(mǎn)足這種要求,業(yè)界在開(kāi)發(fā)以HTML等腳本語(yǔ)言為基礎(chǔ)的基礎(chǔ)設(shè)施方面已經(jīng)開(kāi)展了大量的工作。

  新型的具有語(yǔ)音功能的語(yǔ)言,諸如VoiceXML,正在將互聯(lián)網(wǎng)的功能擴(kuò)展到電話(huà)上,F(xiàn)在,具有語(yǔ)音功能的語(yǔ)言不僅可以利用現(xiàn)有的基礎(chǔ)設(shè)施,并可對(duì)支持互聯(lián)網(wǎng)的整個(gè)基礎(chǔ)設(shè)施進(jìn)行補(bǔ)充,將互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施擴(kuò)展到客戶(hù)機(jī)/服務(wù)器架構(gòu)中,其結(jié)果是產(chǎn)生了可由基于互聯(lián)網(wǎng)的遠(yuǎn)程應(yīng)用來(lái)控制的、具有強(qiáng)大功能的語(yǔ)音服務(wù)器平臺(tái)。


  語(yǔ)音也要交互


  可實(shí)現(xiàn)語(yǔ)音功能的交互式語(yǔ)音應(yīng)答系統(tǒng)(IVR)的發(fā)展速度非常迅猛。比如,可考察一下利用800號(hào)碼提供主叫用戶(hù)接入服務(wù)的企業(yè),最初的情況是用戶(hù)撥打800號(hào)碼,然后接到提供服務(wù)的人員處。但企業(yè)很快認(rèn)識(shí)到人員配備成本昂貴,許多工作可采用自動(dòng)處理方式,從而節(jié)約成本開(kāi)支。IVR系統(tǒng)即可實(shí)現(xiàn)這種自動(dòng)處理。企業(yè)下一步就是將IVR系統(tǒng)與數(shù)據(jù)庫(kù)集成在一起,以便IVR系統(tǒng)可動(dòng)態(tài)地處理信息。這樣,主叫用戶(hù)利用計(jì)算機(jī)語(yǔ)音集成(CTI)技術(shù)接入企業(yè)的IVR系統(tǒng)。之后,這一呼叫被IVR系統(tǒng)實(shí)時(shí)轉(zhuǎn)移到相關(guān)人員處,同時(shí),個(gè)性化的主叫用戶(hù)信息(比如未完成的訂貨情況)可通過(guò)彈出的屏幕傳遞給這一處理人員,這為企業(yè)提供最好的服務(wù)建立了堅(jiān)實(shí)的基礎(chǔ)。另外,通過(guò)使IVR系統(tǒng)前端具有語(yǔ)音功能,強(qiáng)大的ASR功能可使企業(yè)節(jié)省更多成本。

  對(duì)主叫用戶(hù)而言,語(yǔ)音意味著更自然和更舒適的界面?蓪(shí)現(xiàn)語(yǔ)音功能的IVR應(yīng)用也比雙音多頻(DTMF)或按鈕應(yīng)用更方便。這將帶來(lái)更好的投資回報(bào)。


  第一個(gè)語(yǔ)音門(mén)戶(hù)


  到2001年,全球?qū)⒂?0億多部電話(huà)投入使用,任何企業(yè)都不應(yīng)該置身于這些用戶(hù)視線(xiàn)之外,否則后果不堪設(shè)想。企業(yè)非常需要借助語(yǔ)音門(mén)戶(hù)網(wǎng)以向用戶(hù)提供接入服務(wù)。在服務(wù)提供商的基礎(chǔ)設(shè)施中添加的語(yǔ)音門(mén)戶(hù)網(wǎng),將從根本上改變企業(yè)與用戶(hù)“溝通”的方式,以及用戶(hù)與企業(yè)互動(dòng)的方式。

  11月24日,TOM.COM在國(guó)內(nèi)第一個(gè)開(kāi)通了語(yǔ)音門(mén)戶(hù)“TOM及時(shí)語(yǔ)”,用戶(hù)通過(guò)撥打熱線(xiàn)電話(huà)(010-85180012)即可通過(guò)與系統(tǒng)的語(yǔ)音交互獲得個(gè)人理財(cái)、語(yǔ)音郵件、航班查詢(xún)、北京地區(qū)酒店預(yù)定、定餐及叫車(chē)、全球新聞、天氣預(yù)報(bào)等內(nèi)容廣泛的服務(wù)。

  TOM及時(shí)語(yǔ)由于采用了計(jì)算機(jī)電話(huà)集成技術(shù)的開(kāi)創(chuàng)者和領(lǐng)導(dǎo)者Intel子公司Dialogic的語(yǔ)音門(mén)戶(hù)開(kāi)發(fā)平臺(tái)和全球語(yǔ)音技術(shù)領(lǐng)導(dǎo)者IBM公司的語(yǔ)音識(shí)別技術(shù)和語(yǔ)音合成技術(shù),因此在短短3個(gè)月時(shí)間內(nèi)就完成了系統(tǒng)的開(kāi)發(fā)和測(cè)試,真正體現(xiàn)了互聯(lián)網(wǎng)時(shí)代的效率和速度。這再次證明,快速、大規(guī)模部署語(yǔ)音門(mén)戶(hù)的技術(shù)條件已經(jīng)成熟,語(yǔ)音門(mén)戶(hù)的時(shí)代已經(jīng)到來(lái)!

《賽迪市場(chǎng)專(zhuān)家》2000/12/04

 


分類(lèi)信息:  語(yǔ)音合成TTS_與_語(yǔ)音識(shí)別ASR     技術(shù)_語(yǔ)音合成_文摘   技術(shù)_語(yǔ)音識(shí)別_文摘