1.語音門戶發(fā)展的背景
語音門戶是指基于互聯(lián)網(wǎng)平臺,應用語音識別、語音合成和其他技術,為固定電話、移動電話以及使用手持設備(如:PDA)的用戶提供語音訪問互聯(lián)網(wǎng)并獲取網(wǎng)上資訊的門戶,這是全球互聯(lián)網(wǎng)發(fā)展的最新動態(tài)。
由于傳統(tǒng)的上網(wǎng)方式限制了互聯(lián)網(wǎng)的上網(wǎng)人數(shù),互聯(lián)網(wǎng)的訪問模式逐漸從單一的訪問方式向多種用戶終端發(fā)展 ,如:電話、移動電話、PDA、機頂盒等。在當今科技飛速發(fā)展的地區(qū),語音上網(wǎng)成為繼無線WAP上網(wǎng)之后的又一個發(fā)展熱點。人們喜歡用人類自然的語音,通過友好的語音交互方式直接來獲取信息和服務。1999年 ,Evans Group Research分析了對250個使用不同語音系統(tǒng)的用戶進行調查,調查的結果反饋和定量分析表明:對語音系統(tǒng)和按鍵式系統(tǒng)的使用受歡迎程度,83%的用戶更喜歡使用語音系統(tǒng)而不是使用按鍵式系統(tǒng);而對于語音驅動系統(tǒng)和與坐席進行通話,74%的用戶更傾向于前者。
語音訪問,作為人類最原始、最自然、最人性化,也是最有效的交流方式,正以其不可阻擋的強勁勢頭融入到互聯(lián)網(wǎng)中。在美國市場,以Tellme.com和Nuance 、SpeechWorks為代表的企業(yè)異軍突起 ,倡導人性化的語音上網(wǎng)服務。隨后Yahoo、Lycos等著名互聯(lián)網(wǎng)公司紛紛進入相應的服務領域,建立大規(guī)模的語音門戶網(wǎng)站,而AOL則提供所謂AOL-By-Phone服務。
從技術角度看,過去數(shù)十年來,語音識別(ASR)技術、文語轉換(TTS)技術已經(jīng)從實驗室中逐步走向成熟,其算法的復雜性也逐年下降,從而使這些技術逐步在市場中得以應用;另一方面,計算機的運算能力每兩年就翻一番,也為這些技術的商業(yè)應用奠定了堅實的基礎;再加上移動用戶終端的種類與功能也在以前所未有的速度增長;所有這些技術的發(fā)展都為基于語音的互聯(lián)網(wǎng)門戶的發(fā)展提供的可靠的保證。
2.語音門戶
豐富的網(wǎng)絡內容,電話的普及。所謂的語音門戶是集合了所有那些已經(jīng)成熟的網(wǎng)絡資源的一種新型網(wǎng)站。那么語音門戶到底是什么呢?語音門戶就是通過任何一部電話使用人類自然的語音來訪問互聯(lián)網(wǎng)上的一些基本信息、電子商務以及個人通訊服務。語音門戶闡明的是使用電話來訪問互聯(lián)網(wǎng)上的相關內容和信息。
對于用戶而言,通過使用電話的會話方式來瀏覽信息和管理事務仍然是目前最自然和最有效的方法之一。隨著計算機運算能力的提高和識別技術算法的快速發(fā)展,促使基于各種平臺的語音識別系統(tǒng)能識別人類的自然會話。在20世紀90年代中期以來,許多主要的有自己獨特技術的公司開始運轉語音商務(基于語音的電子商務)系統(tǒng)。他們這樣做的目的是為了給那些希望通過使用語音技術無論在何時、何地都能獲得大量的信息和查詢一些實時股票交易信息的人提供服務。正如個人通過使用計算機來解決訪問因特網(wǎng)的方法一樣,這些圍繞著基于語音技術應用來展開的一種新型的網(wǎng)絡叫做語音門戶。
語音門戶發(fā)展到現(xiàn)在,越來越多的公司正迅速朝著包含有各種服務(如:統(tǒng)一消息、網(wǎng)上購物)和基于互連網(wǎng)的各種內容(如:電影,黃頁)的網(wǎng)站發(fā)展,從而讓用戶只要通過任何一部電話就能使所有的這些都成為有用信息。企業(yè)和電子商務公司也明白通過語音技術和全球所擁有的電話用戶人群來發(fā)展他們的用戶是一個非常好的機會;谛袠I(yè)技術標準的出現(xiàn)和產(chǎn)品實用性的加強將加快語音門戶的發(fā)展,同樣對于語音行業(yè)標準的產(chǎn)生也將有助于互聯(lián)網(wǎng)的快速成長。
3.市場的影響產(chǎn)生對語音門戶的需求
市場的多方面影響以及結合一些實際的需求即某一用戶無論在何時,何地都能直接通過語音來提供給個人在某方面的內容以及服務。
3.1隨著個人電話的普及,尤其是手機的普及。
3.2互聯(lián)網(wǎng)的快速發(fā)展
互聯(lián)網(wǎng)提供了大量的各種各樣的實用信息,但是要獲得這些信息并不是隨處可得,用戶必須在家里或辦公室通過電腦聯(lián)網(wǎng)來獲得這些信息。這對于在一個信息快速更新的社會并不是一件令人愉快的事情。所以消費者對于互聯(lián)網(wǎng)內容和信息的大量需求促使各種生產(chǎn)廠商設計出各種各樣的產(chǎn)品,如PDA、手機等這些可隨身攜帶又能直接與網(wǎng)絡互聯(lián)的產(chǎn)品。
這些設備的快速發(fā)展促使通過手持設備和手機來訪問互聯(lián)網(wǎng)的內容是可實現(xiàn)的,而基于文本的互聯(lián)網(wǎng)的內容也是非常有用的,但緩慢的傳輸速度與互聯(lián)網(wǎng)連接的困難以及這些設備的小屏幕都限制了這些設備的使用價值。
電信的增值服務改變用戶無論在何地、何時的要求都能直接訪問互聯(lián)網(wǎng)的內容是激動人心的。但個性化的服務可使個人和商務快速獲得和容易訪問他們所關心的內容和信息。因而語音門戶的出現(xiàn)及時改變了電話的應用范圍,從而使電話成為從網(wǎng)絡媒體上得到語音和數(shù)據(jù)信息的一種最便利的設備。
4.語音門戶的優(yōu)勢
語音門戶簡單易用,讓用戶可隨時隨地輕松獲取各種信息--無論是通過PC、手機或者固定電話,也無論是在辦公室、家中還是在路上、車上,"瀏覽"網(wǎng)絡的過程變得輕松無比!
根據(jù)語音門戶平臺面向的對象來說,我們可以從個人,也就是最終消費用戶,以及企業(yè),也就是服務提供方,兩個角度來考察語音門戶平臺的優(yōu)勢。首先,對廣大最終用戶來講,語音門戶平臺方便、快捷、自然,而且不需要額外成本來添加設備。用戶只要對著普通電話說話就行了,不再受制于按鍵音頻,不再受制于電腦和一大堆連線,也不再受制于網(wǎng)絡專業(yè)知識的貧乏。同時,用戶還可以根據(jù)自己的喜好定制個性化服務,集中關注個人業(yè)務;并且可以從各種各樣的信息源、信息終端中解放出來,獲得統(tǒng)一消息服務帶來的自由和方便。
其次,企業(yè)本身也必然會得益于語音門戶平臺。企業(yè)利用語音門戶,不僅可以通過節(jié)省人工坐席成本來低成本地發(fā)布信息,提供客戶服務,而且可以實現(xiàn)其他一些有價值的業(yè)務,開創(chuàng)新的市場空間和利潤。
總之,語音門戶將電話交互過程從以廠商為中心轉向以用戶為中心。這一轉變在為用戶提高效率和降低業(yè)務成本的同時,還將提高用戶的滿意度。未來數(shù)年,語音門戶將大大改變人們使用電話的方式以及廠商與主叫用戶溝通的方式。在當今以廠商為中心的模式中,主叫用戶只能以掛斷電話的方式來"擺脫"某一企業(yè)的按鍵式交互語音應答(IVR)系統(tǒng) 。而在未來以用戶為中心的模式中 ,主叫用戶可與語音門戶展開交互式對話,可以象"網(wǎng)上沖浪"般快捷、方便地從一家企業(yè)自由地 "跳" 到另外一家企業(yè)。
5.語音識別技術
電話的出現(xiàn)已經(jīng)有120多年的歷史,而使用在商業(yè)應用上相關的語音識別最近幾十年才開始進行研究。事實上,一直到90年代中期基于電話并且提供大量的詞匯、使用者不需要經(jīng)過任何的培訓并且支持各種類型電話的語音識別軟件才出現(xiàn),目前語音識別系統(tǒng)能支持自然的習慣用語,例如"我想查詢四川長虹的最新價格"。
語音識別的處理是在網(wǎng)絡服務器中進行處理而不是在電話中進行處理,可升級的系統(tǒng)配置可支持幾百萬訪問者同時也支持通過不同的線路來發(fā)出相同的信息請求來進行識別,訪問者也可以在他們得到他們想要的信息后自動返回。
對于目前所采用的任何一種新建的主流服務它們必須要有一定靈活性和易使用性。使用基于語音服務來構建的所有商業(yè)信息是因為語音識別提供了對不同年齡和不同生活方式的用戶可以通過他們手中的任何一部電話來得到他們所需要的信息。
6.語音門戶的核心技術
V-XML本身就定義了語音識別有關的tag,因此,集成天朗分布式語音識別系統(tǒng)到VXML引擎中變得更加簡單。只要參照VXML本身的定義來做就行。另外,VXML腳本也不過是一種IVR常用的腳本語言,因此,集成工作和IVR系統(tǒng)集成天朗分布式語音識別系統(tǒng)基本類似。
天朗語音公司供稿 CTI論壇編輯