每一部手機(jī)都將具備能聽會(huì)說的功能;
每一臺(tái)家電都將具備能聽會(huì)說的功能;
每一臺(tái)轎車都將具備能聽會(huì)說的功能;
每一個(gè)玩具都將具備能聽會(huì)說的功能;
……
這是安徽科大訊飛信息科技股份有限公司高級(jí)副總裁吳曉如先生在接受CTI論壇記者專訪時(shí),為我描繪出的語音遠(yuǎn)景,而在此之前的若干年,語音應(yīng)用雖然已得到行業(yè)人士足夠的重視,但真正落地?zé)o疑與移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展有著密不可分的關(guān)系。
圖:安徽科大訊飛信息科技股份有限公司高級(jí)副總裁吳曉如先生
訊飛“語音云”
正如創(chuàng)新工場(chǎng)CEO 李開復(fù)在科大訊飛“語音點(diǎn)亮生活” 、“新一代語音云發(fā)布暨語音開發(fā)者大會(huì)”上闡述的:“過去總說語音改變世界,為什么一直沒有改?一方面是云計(jì)算還沒有達(dá)到很高的水平。第二,語音在過去二三十年總是不知道應(yīng)用在哪里。第三個(gè)挑戰(zhàn)過去存在以后還會(huì)存在,那就是假如能做到一定語義的理解,需要花盡可能少的時(shí)間讓開發(fā)者迅速介入。而第四個(gè)挑戰(zhàn)則是用戶體驗(yàn)和用戶的期望值,語音是人類最自然彼此溝通的方式,所以人們一旦開始用語音交流了,就表示人們把機(jī)器當(dāng)做一個(gè)‘人’了,這樣高的期望值將給開發(fā)者帶來更大挑戰(zhàn)。”
上述挑戰(zhàn)讓語音應(yīng)用在相當(dāng)長(zhǎng)時(shí)期內(nèi)限于部分玩具、車載導(dǎo)航等領(lǐng)域,而讓聲音穿越障礙,得到自由交流是科大訊飛一直的夢(mèng)想。
同時(shí),為讓更多的中國(guó)人、更多的中國(guó)企業(yè)使用上訊飛語音,2010年10月,科大訊飛啟動(dòng)了“語音云”開發(fā)者計(jì)劃。訊飛“語音云”,是基于云計(jì)算技術(shù)基礎(chǔ),將業(yè)界領(lǐng)先的智能語音技術(shù)向互聯(lián)網(wǎng)開發(fā)者開放,為各類移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)者和創(chuàng)新性企業(yè)提供低門檻的語音技術(shù)服務(wù),合作伙伴可以像使用水、電那樣“即開即有、按需取用”,在很短時(shí)間內(nèi)構(gòu)建出支持自然語音交互功能的特色移動(dòng)互聯(lián)網(wǎng)應(yīng)用。
而在不到一年半的時(shí)間里,吳曉如說:“我們的開發(fā)者伙伴已達(dá)到3100個(gè),終端用戶數(shù)達(dá)到3000萬,每天在線用戶數(shù)超120萬,總請(qǐng)求量超過700萬次,涵蓋移動(dòng)互聯(lián)網(wǎng)、游戲、汽車、通信、金融、學(xué)校等領(lǐng)域,吸引了工程師、IT技術(shù)人員甚至學(xué)生的積極參與。在手機(jī)、呼叫中心、車載、互聯(lián)網(wǎng)電視、智能家電等各領(lǐng)域得到創(chuàng)新應(yīng)用,‘語音云’服務(wù)已深入千家萬戶、日常生活。”
訊飛新一代“語音云”
吳曉如介紹,相比較于第一代“語音云”,科大訊飛新一代“語音云”平臺(tái)更健全穩(wěn)固,能夠處理更復(fù)雜的業(yè)務(wù),并能服務(wù)于更多的用戶,此外,新一代語音云將開放個(gè)性化識(shí)別、個(gè)性化合成、自然語言理解、聲紋識(shí)別、口語評(píng)測(cè)等接口。
吳曉如強(qiáng)調(diào):“新一代‘語音云’主要有三個(gè)關(guān)注點(diǎn),一是不斷提升的核心語音技術(shù):新一代訊飛語音云引入了取得新突破的語音技術(shù),無論是語音合成、語音識(shí)別、語音轉(zhuǎn)寫目前都是業(yè)界領(lǐng)先的,僅在2011年,我們這方面的專利技術(shù)就超過百個(gè)。第二個(gè)關(guān)注點(diǎn)是訊飛語音技術(shù)種類豐富,除了剛才提到的語音合成、語音識(shí)別、語音轉(zhuǎn)寫技術(shù)外,還添加了聲紋識(shí)別、口語評(píng)測(cè)、自然語言理解技術(shù),行業(yè)用戶可以在新的語音云中獲得更多的語音服務(wù)種類,也可根據(jù)自身的特點(diǎn)進(jìn)行有機(jī)的組合,擴(kuò)展應(yīng)用和服務(wù)的多樣性。第三個(gè)關(guān)注點(diǎn)是更加個(gè)性化的語音技術(shù),能有針對(duì)性的解決在實(shí)際應(yīng)用中不同用戶語音服務(wù)的獨(dú)特性,同時(shí)也滿足現(xiàn)在移動(dòng)互聯(lián)網(wǎng)用戶的個(gè)性化需求,讓語音交互更加生動(dòng)。”
語義理解,在人和人的交流中,主要基于人互動(dòng)時(shí)的表情、手勢(shì)、語調(diào)等的交流,來實(shí)現(xiàn)對(duì)語義的具體判斷,而科大訊飛的語義理解技術(shù)到底會(huì)有多高的識(shí)別率?
吳曉如進(jìn)一步解釋:“語義理解技術(shù)目前仍是對(duì)一些固定領(lǐng)域、有著特定明確表述的信息進(jìn)行識(shí)別?拼笥嶏w通過將語言扁平化,對(duì)于應(yīng)用需求明確的語義理解識(shí)別率較高。”
訊飛語音在呼叫中心的應(yīng)用
隨著金融行業(yè)呼叫中心對(duì)應(yīng)用需求越來越明確,相比較于傳統(tǒng)按鍵式菜單,IVR服務(wù)就顯得越來越冗長(zhǎng)、繁瑣、復(fù)雜,已嚴(yán)重影響用戶體驗(yàn)。而語音識(shí)別呼叫中心導(dǎo)航技術(shù)可以讓用戶直接說出需求,即可辦理業(yè)務(wù),如希望查詢賬戶余額,只需說出“查詢余額”或者“我手機(jī)上還有多少錢?”系統(tǒng)就可以理解用戶的意圖,并引導(dǎo)用戶辦理該業(yè)務(wù)。
因此,訊飛語音識(shí)別呼叫中心導(dǎo)航技術(shù)已經(jīng)在工商銀行電話銀行中得到了應(yīng)用,并已經(jīng)在大連、廈門、青島、寧波等地區(qū)上線。另外,中信銀行電話銀行也已經(jīng)在北京、深圳、天津、武漢、合肥、貴陽、哈爾濱、呼和浩特等地區(qū)上線。
那么,在各個(gè)企業(yè),行業(yè)不同,業(yè)務(wù)類型不同,呼叫中心平臺(tái)及業(yè)務(wù)接入有著千差萬別,語音接入是否會(huì)非常困難呢?吳曉如指出:“目前科大訊飛的語音產(chǎn)品可與主流的呼叫中心平臺(tái),如華為、中興、Avaya、Edify、Genesys等進(jìn)行系統(tǒng)集成,可以有效支持在這些平臺(tái)下的語音應(yīng)用,針對(duì)不同行業(yè)的不同應(yīng)用情況,科大訊飛成立了專門的項(xiàng)目實(shí)施團(tuán)隊(duì),承接著效果優(yōu)化、用戶交互設(shè)計(jì)等工作,提供個(gè)性化服務(wù),保證項(xiàng)目成功。”
語音技術(shù)在呼叫中心中的未來應(yīng)用前景到底怎樣?吳曉如給出了很肯定的答復(fù):“國(guó)外呼叫中心應(yīng)用智能語音技術(shù)已經(jīng)非常普遍,國(guó)內(nèi)的重點(diǎn)行業(yè)也都已經(jīng)開始使用科大訊飛的智能語音技術(shù),并已初見成效?蛻裟軌蚶萌伦灾Z音服務(wù)解決方案來處理日益增長(zhǎng)的信息咨詢、電子交易和客戶服務(wù)需求,并能幫助用戶在任何時(shí)候、任何地點(diǎn)通過隨處可得的電話輕松自然的獲得信息與服務(wù)。”
吳曉如最后表示:“接下來在未來5年內(nèi),科大訊飛將持續(xù)提升語音技術(shù)水平,為建設(shè)更加智能的呼叫中心自助服務(wù)渠道提供源源不斷的動(dòng)力。”
聲明:CTI論壇(CTiforum)版權(quán)作品,未經(jīng)CTiforum書面授權(quán),嚴(yán)禁轉(zhuǎn)載,違者將被追究法律責(zé)任。