首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>科大訊飛

科大訊飛吳曉如:語(yǔ)音技術(shù)助力更智能更安全的新一代呼叫中心

2009/04/15

  CTI論壇(ctiforum)04月15日消息: 2009年4月14日至15日,CTI論壇主辦2009中國(guó)呼叫中心及企業(yè)通信大會(huì)在北京國(guó)際會(huì)議中心隆重召開,會(huì)議展開三十多場(chǎng)精彩紛呈的演講,邀請(qǐng)了一批業(yè)界知名專家在會(huì)上發(fā)表演說(shuō),以下是主題演講現(xiàn)場(chǎng)圖文報(bào)道:

  主持人:下面,有請(qǐng)安徽科大訊飛信息科技股份有限公司吳曉如先生,吳先生給大家演講的題目是《語(yǔ)音技術(shù)助力更智能、更安全的新一代呼叫中心》,有請(qǐng)吳先生進(jìn)行精彩的演講!

  吳曉如:各位嘉賓下午好!

  實(shí)際上在上午各個(gè)主題演講中,大家可以發(fā)現(xiàn),我們最近的通信技術(shù)、IT技術(shù)的發(fā)展,使我們呼叫中心的功能更加強(qiáng)大。下面我演講的主題是通過(guò)智能語(yǔ)音技術(shù),如何使我們的呼叫中心更加智能、更加安全。

  實(shí)際上我也像揚(yáng)州的領(lǐng)導(dǎo)一樣,我提出兩個(gè)問(wèn)題。第一個(gè)問(wèn)題是怎么讓我們新一代的呼叫中心更加聰明,第二個(gè)問(wèn)題是如何讓我們的新一代的呼叫中心在與用戶交互的過(guò)程中更加安全。

  我們科大訊飛是以語(yǔ)音交互技術(shù)為切入點(diǎn)的廠商,語(yǔ)音技術(shù)使信息時(shí)代的各種信息通過(guò)機(jī)器和人進(jìn)行交互。語(yǔ)音合成相當(dāng)于給機(jī)器裝上了人工嘴巴,語(yǔ)音識(shí)別是使機(jī)器能夠聽懂人聽話,聲紋識(shí)別是可以辨別說(shuō)話人的身份。

  語(yǔ)音產(chǎn)業(yè)伴隨著社會(huì)信息化、網(wǎng)絡(luò)化、智能化的發(fā)展趨勢(shì),語(yǔ)音技術(shù)的應(yīng)用已經(jīng)進(jìn)入到社會(huì)各行業(yè),且不斷深化。語(yǔ)音技術(shù)的不斷進(jìn)步及當(dāng)前產(chǎn)業(yè)特點(diǎn),以及我們經(jīng)濟(jì)的特點(diǎn),下一步的呼叫中心的服務(wù)將助力我們的呼叫中心建設(shè)。

  目前語(yǔ)音合成技術(shù)在我們呼叫中心中得到了廣泛的應(yīng)用,大幅提升了呼叫中心動(dòng)態(tài)、海量信息的發(fā)布。

  大家可以看到,雖然聽到了只是一句簡(jiǎn)單的提示音,但是這個(gè)提示音背后所蘊(yùn)含的各個(gè)行業(yè)大量的動(dòng)態(tài)海量的信息,可以通過(guò)我們的語(yǔ)音合成播報(bào)給用戶。

  這幾年的語(yǔ)音識(shí)別已經(jīng)在我們的電信運(yùn)營(yíng)過(guò)程中得到了大規(guī)模的應(yīng)用,這在提升我們的服務(wù)水平上,起到了什么樣的支持呢?首先,我們對(duì)于呼叫中心目前面臨的一些挑戰(zhàn),我們?cè)谶@里提出,第一個(gè)是呼叫中心的規(guī)模不斷地?cái)U(kuò)張,呼叫中心的人均成本也是不斷地提升。

  剛才我們前面一些演講人說(shuō)過(guò),呼叫中心不但規(guī)模大,而且成本也很大,人員流動(dòng)管理困難。

  第二個(gè)挑戰(zhàn)是呼叫中心提供給用戶的信息越來(lái)越多,隨著3G我們的統(tǒng)一通信,實(shí)際上我們的通信技術(shù)、IT技術(shù)越發(fā)達(dá),呼叫中心推送給用戶的信息越多。推送這么多的信息,如何使我們能夠更好地設(shè)計(jì)人和呼叫中心之間交互的界面呢?

  這個(gè)地方是一個(gè)簡(jiǎn)單的菜單,比如說(shuō)一個(gè)用戶需要查詢卡里面的余額,他需要首先按鍵1得到個(gè)人的業(yè)務(wù),按鍵3得到基金、期貨等等的業(yè)務(wù),再按鍵3得到期貨和銀證的業(yè)務(wù)才可以查詢卡里面的余額。

  目前的IVR用戶只能通過(guò)9個(gè)鍵,才可以告訴IVR他有什么樣的需求。隨著我們的服務(wù)越來(lái)越多,設(shè)計(jì)菜單的合理結(jié)構(gòu)越來(lái)越困難。即使是我們精心設(shè)計(jì)的菜單,這種多級(jí)式的按鍵菜單也經(jīng)常使用戶不知所措。同時(shí),也是對(duì)我們用戶耐心極大地考驗(yàn)。為什么很多的用戶一進(jìn)呼叫中心就直接按0進(jìn)入人工服務(wù)呢?就是他不能忍受當(dāng)前的IVR。

  我們提出一個(gè)問(wèn)題,如果用戶對(duì)于IVR服務(wù)不滿意的話,我們需要所有不滿意的用戶都轉(zhuǎn)向人工服務(wù)嗎?那么我們企業(yè)這么大規(guī)模的座席資源,是不是要消耗在一些很普通的查詢業(yè)務(wù)上呢?

  回到上層的菜單,我們首先通過(guò)語(yǔ)音識(shí)別,用戶直接可以查詢卡內(nèi)的余額,即使是這種語(yǔ)音識(shí)別,也可以讓我們?cè)瓉?lái)的多層次的按鍵式的菜單,變成扁平式的菜單,可以讓用戶迅速地通過(guò)扁平式的服務(wù)得到最后的結(jié)果。

  那么提出了這個(gè)問(wèn)題,我們?nèi)绾蝸?lái)改進(jìn)呢?通過(guò)我們大量堆積我們的座席數(shù)量就需要提升我們的成本,那么通過(guò)增加座席質(zhì)量和提升用戶體驗(yàn),是不是魚和熊掌不可兼得呢?實(shí)際上我們認(rèn)為,對(duì)于人和語(yǔ)音技術(shù)在呼叫中心的交互方面,對(duì)于IVR來(lái)說(shuō)有一個(gè)語(yǔ)音交互系統(tǒng),通過(guò)開放式的語(yǔ)音識(shí)別+語(yǔ)義解析+高品質(zhì)的語(yǔ)音合成,就可以得到高品質(zhì)的語(yǔ)音服務(wù)。

  在這種服務(wù)當(dāng)中,用戶的電話接入之后,我們的語(yǔ)音導(dǎo)航可以把用戶帶來(lái)一般類查詢的業(yè)務(wù)上。這種服務(wù)并不是說(shuō)我們不需要人工的,讓我們的人工資源可以滿足一些VIP,或者是一些專家型的更重要的業(yè)務(wù)上。使我們的專家座席具有更高的效率和更高的用戶投入產(chǎn)出比。

  前一段時(shí)間我使用過(guò)語(yǔ)音識(shí)別,但是不方便,我的菜單用戶怎么記得?用戶必須準(zhǔn)確說(shuō)出這個(gè)菜單的名稱,這種情況下,用戶必須準(zhǔn)確記住菜單的名稱,或者是要求用戶必須按我們規(guī)定的方式說(shuō),對(duì)于用戶來(lái)說(shuō)是很痛苦事情。那么,有沒(méi)有更好的解決方案呢?能不能用戶跟IVR采用語(yǔ)音交互的過(guò)程更加愉快呢?這個(gè)時(shí)候,我們也想請(qǐng)我們各位參會(huì)的嘉賓先看一個(gè)演示。

(演講人演示,說(shuō):"我家的煤氣費(fèi)沒(méi)錢了,我想交一點(diǎn)煤氣費(fèi)", 菜單自動(dòng)跳轉(zhuǎn)到:煤氣交費(fèi))



  這個(gè)是我們叫做呼叫導(dǎo)航的系統(tǒng),大家可以看到這個(gè)下拉菜單是用戶希望得到的服務(wù),但是我們這個(gè)服務(wù)列得不是很全。如果我們希望得到一項(xiàng)服務(wù),我家的煤氣費(fèi)沒(méi)錢了,我想交一點(diǎn)煤氣費(fèi)。大家可以看到,我可以以比較自由的方式,告訴IVR一件什么事情呢?就是我家的媒體費(fèi)沒(méi)錢了,我要交煤氣費(fèi)。在以前傳統(tǒng)的IVR的按鍵上,你可能需要按3、4次,但是現(xiàn)在用戶只需要說(shuō)他的需求。

  我們?cè)賮?lái)看一個(gè)。

(演講人演示,說(shuō):"我想把定期的儲(chǔ)蓄轉(zhuǎn)成活期的", 菜單自動(dòng)跳轉(zhuǎn)到:定期轉(zhuǎn)活期)

  我想把定期的儲(chǔ)蓄轉(zhuǎn)成活期的。這個(gè)演示實(shí)際上是給大家介紹一個(gè)什么叫做呼叫導(dǎo)航,與之前的基于命令的識(shí)別有什么差別。它可以給我們的呼叫中心起到一個(gè)什么幫助。

  在這種基于自由說(shuō)話的呼叫導(dǎo)航中,我們的用戶不用這么痛苦,必須記住我們的菜單名稱。我們?cè)谠O(shè)計(jì)我們的菜單的時(shí)候,我們整個(gè)呼叫中心的管理者,也不需要設(shè)計(jì)一個(gè)非常復(fù)雜的菜單。實(shí)際說(shuō)準(zhǔn)確的呼叫導(dǎo)航是怎么做到的呢?叫做特定語(yǔ)音的語(yǔ)音識(shí)別,如果要語(yǔ)音識(shí)別,對(duì)于識(shí)別每一個(gè)字是很困難的,但是對(duì)于我們銀行的語(yǔ)音菜單是很簡(jiǎn)單的。即使1、2個(gè)字發(fā)生的困難,對(duì)于我們最后的解析也可以讓它理解我們最后用戶的需求是什么。所以,語(yǔ)音導(dǎo)航用戶只需要做什么事情呢?只需要說(shuō)說(shuō)你的需求。

  我們說(shuō)的呼叫中心,剛才說(shuō)怎么讓我們的呼叫中心變得更加聰明。第二個(gè)問(wèn)題是呼叫中心還面臨一個(gè)挑戰(zhàn),當(dāng)前的呼叫中心轉(zhuǎn)成成本中心,在一些用戶轉(zhuǎn)向呼叫中心做一些實(shí)際業(yè)務(wù)的時(shí)候,如何讓我們的呼叫中心變得更加安全。以我們銀行的呼叫中心,電話銀行是大家非常信任的業(yè)務(wù)的手段,但是有很多安全須知,千萬(wàn)不要泄露你的帳號(hào)、密碼,如果你泄露了你可能會(huì)很痛苦,你的財(cái)產(chǎn)會(huì)受到損失。對(duì)于這方面,我們的語(yǔ)音技術(shù)能不能做一些工作,使我們的呼叫中心變得更加安全呢?目前的語(yǔ)音識(shí)別可以使我們的呼叫中心在風(fēng)險(xiǎn)控制方面得到很大的幫助。

  如果我們的座席人員了解他家里面每一個(gè)家人的聲音那么熟悉去了解用戶的聲音,對(duì)于座席人員有點(diǎn)難,幾乎不可能完成。但是語(yǔ)音識(shí)別可以做到,實(shí)際上我們對(duì)于我們的用戶和座席,在說(shuō)話的過(guò)程當(dāng)中我們可以實(shí)時(shí)監(jiān)控。如果發(fā)現(xiàn)當(dāng)前的通話是一個(gè)可疑的對(duì)話,可以告知座席,座席可以采取銀行要求他采取的步驟,這樣可以加強(qiáng)我們的風(fēng)險(xiǎn)控制。

  對(duì)于有一些用戶,我們實(shí)際上在他做這個(gè)業(yè)務(wù)的過(guò)程中,我們可以采用一些,吸入說(shuō)聲紋系統(tǒng),對(duì)于他的聲紋進(jìn)行實(shí)時(shí)的監(jiān)控,如果沒(méi)有聲紋識(shí)別,我們可以提醒這個(gè)用戶提高安全級(jí)別。

  聲紋識(shí)別是辨別說(shuō)話人身份的一項(xiàng)技術(shù),通話人說(shuō)的可以是特定的內(nèi)容,也可以說(shuō)一些任意無(wú)關(guān)的內(nèi)容。

  其中兩個(gè)最關(guān)鍵的技術(shù),一個(gè)是聲紋確認(rèn),比如說(shuō)這個(gè)用戶是某某帳號(hào)的聲紋,他說(shuō)話的時(shí)候可以跟語(yǔ)音庫(kù)里的聲音進(jìn)行對(duì)照。開始我不知道你這個(gè)用戶是誰(shuí),你進(jìn)來(lái)之后我看你是不是屬于特殊的群體,比如說(shuō)是我們銀行需要關(guān)注的黑名單。這樣的話,這個(gè)人在通話的過(guò)程中,我們可以和目標(biāo)聲紋庫(kù)里的聲紋模板進(jìn)行匹配。如果是可疑分子,我們要通知銀行注意這個(gè)業(yè)務(wù)當(dāng)中有風(fēng)險(xiǎn)。

  實(shí)際上大家對(duì)于語(yǔ)音識(shí)別前期也在關(guān)注,但是我們覺得一個(gè)成功的語(yǔ)音識(shí)別有很多的核心技術(shù)。我們不但針對(duì)命令詞,而且對(duì)于連續(xù)的語(yǔ)音也可以識(shí)別,而且我們語(yǔ)音識(shí)別可以有很好的排除干擾的能力。同時(shí),我們的語(yǔ)音識(shí)別應(yīng)該有語(yǔ)義解析,正確理解一個(gè)人說(shuō)話的目的。

  語(yǔ)音識(shí)別在實(shí)際的應(yīng)用中,它會(huì)面臨不同的口音、不同的應(yīng)用環(huán)境,需要我們對(duì)使用中大規(guī)模的語(yǔ)音數(shù)據(jù)通過(guò)語(yǔ)音模型進(jìn)行訓(xùn)練,使我們可以排除不同的噪音。

  實(shí)際上,所有的語(yǔ)音識(shí)別的技術(shù)都是基于統(tǒng)計(jì)的。如果我們了解過(guò)不同的口音、不同的信道地之后就可以很好地處理這些不同的數(shù)據(jù),一些不同口音的影響。

  科大訊飛我們?cè)谌珖?guó)建了4個(gè)聯(lián)合實(shí)驗(yàn)室,在中國(guó)科技大學(xué)、清華大學(xué)、社科院語(yǔ)言所、國(guó)家普通話測(cè)試站中心,最后會(huì)整合成我們最后的語(yǔ)音合成、語(yǔ)音識(shí)別、聲紋識(shí)別等等。

  另外,對(duì)于我們相關(guān)很重要的處理語(yǔ)音識(shí)別所需要的口音、信道,目前我們?cè)谌珖?guó)省級(jí)電信運(yùn)營(yíng)商部署的音樂(lè)搜索等大規(guī)模語(yǔ)音識(shí)別業(yè)務(wù)已超過(guò)50個(gè),覆蓋不同地域等,使我們的語(yǔ)音識(shí)別可以應(yīng)用于不同的環(huán)境。

  自助式的語(yǔ)音服務(wù)之前一直是按鍵加錄音,TTS技術(shù)的出現(xiàn),使我們的語(yǔ)音呼叫是按鍵+TTS。我們語(yǔ)音導(dǎo)航可以進(jìn)入ASR&TTS,用戶的需求不但可以通過(guò)3鍵和9鍵。

  我們科大訊飛是語(yǔ)音技術(shù)領(lǐng)域唯一的國(guó)家863計(jì)劃產(chǎn)業(yè)化基地、國(guó)家規(guī)劃布局內(nèi)重點(diǎn)軟件企業(yè)、國(guó)家級(jí)企業(yè)技術(shù)中心。中國(guó)語(yǔ)音市場(chǎng)占有率最高達(dá)到了70%,同時(shí)我們代表工信部制定語(yǔ)音技術(shù)的國(guó)家標(biāo)準(zhǔn),目前我們有700人左右,設(shè)有博士后的工作站在全國(guó)有4個(gè)聯(lián)合實(shí)驗(yàn)室,公司是在去年的5月份在深交所正式發(fā)行上市。

  科大訊飛的中文語(yǔ)音合成技術(shù),在理歷屆的國(guó)內(nèi)、國(guó)際的評(píng)測(cè)中都名列第一。2006年和2008年我們參加了全球英文語(yǔ)音技術(shù)合成大賽,我們也連續(xù)三年蟬聯(lián)了第一名。在這里,我簡(jiǎn)單地把我們的語(yǔ)音合成技術(shù),簡(jiǎn)單地做一個(gè)演示。

  同時(shí),我們的語(yǔ)音合成可以提供不同的音樂(lè)和語(yǔ)種。目前,我們的音樂(lè)合成技術(shù)首先整合了我們06到08年三年比賽的成果,同時(shí)我們的產(chǎn)品可以支持各種主流的語(yǔ)種,同時(shí)可以支持不同的方言音色,合成系統(tǒng)可以有男女老少各種因素供我們用戶選擇。

  為了使我們相關(guān)的產(chǎn)品可以在主流行業(yè)有更好的效果,我們針對(duì)像電信、金融等一些主流的行業(yè)進(jìn)行專門的優(yōu)化,可以提供專業(yè)的優(yōu)化版本。同時(shí),我們的系統(tǒng)還提供了多種實(shí)用的特性,它不僅僅是是文本轉(zhuǎn)語(yǔ)音,還可以進(jìn)行音頻的管理,可以進(jìn)行日志的管理和動(dòng)態(tài)的重啟。

  比如說(shuō)你分散式部署IVR的系統(tǒng),你可以把所有的提示音通過(guò)我們TTS的音頻管理進(jìn)行統(tǒng)一的安排,這樣各地的IVR的服務(wù)器,可以通過(guò)FTP、HTTP的格式進(jìn)行轉(zhuǎn)換。

  聲紋識(shí)別目前在國(guó)際上最有名的技術(shù)評(píng)測(cè)是美國(guó)的國(guó)家標(biāo)準(zhǔn)技術(shù)研究院,每年會(huì)舉行一次大規(guī)模的聲紋識(shí)別大賽?七_(dá)訊飛在2008年我們參加了這次評(píng)測(cè),這次評(píng)測(cè)包含了國(guó)際上像MIT和斯坦福參加的比賽,我們?nèi)〉昧说谝幻。這有一個(gè)識(shí)別錯(cuò)誤里,如果有100個(gè)人想冒充別人,我發(fā)生錯(cuò)誤的是3個(gè),我可以抓住97個(gè)。這次比賽也表明了我們科大訊飛在識(shí)別方向上我們是國(guó)際領(lǐng)先。

  目前,我們的語(yǔ)音識(shí)別除了目前已經(jīng)在各地電信廣泛音樂(lè)搜索中所使用的命令識(shí)別,你一說(shuō)一個(gè)歌曲的名稱我就可以幫你下載下來(lái),我們目前有成熟的呼叫導(dǎo)航,可以進(jìn)行語(yǔ)義的解析,同時(shí)我們可以提供相關(guān)的語(yǔ)音搜索和檢索。以后有大量的音視頻的呼叫,怎么管理,我們可以制定一些語(yǔ)音的標(biāo)簽,使我們搜索的時(shí)候更加方便。

  實(shí)際上我們說(shuō)了很多不同的語(yǔ)音服務(wù)的模塊,聽上去很多,但是應(yīng)用起來(lái)非常方便。

  我們有多種的語(yǔ)音合成,多種的語(yǔ)音識(shí)別,我們的聲紋識(shí)別引擎等等。所有這些我們都可以通過(guò)統(tǒng)一的網(wǎng)絡(luò)平臺(tái)技術(shù)封裝。這種封裝既可以通過(guò)之前各個(gè)廠商非常熟悉的接口形式進(jìn)行封裝,也可以通過(guò)最新的基于SIP的、MRCP的服務(wù)進(jìn)行統(tǒng)一的管理。用戶無(wú)論使用什么引擎都可以得到我們的語(yǔ)音管理的服務(wù)。

  目前我們這種平臺(tái)已經(jīng)可以支持華為、Avaya、思科等眾多的平臺(tái),可以支持眾多主流的操作系統(tǒng)。我們科大訊飛有著非常完備的研發(fā)和質(zhì)量體系,早在2006年的12月份我們就通過(guò)了CMMI L4評(píng)估認(rèn)證,目前我們也是首個(gè)國(guó)家的標(biāo)準(zhǔn)試點(diǎn)基地。

  目前,我們?cè)谌珖?guó)24個(gè)主要的城市設(shè)有子公司和辦事處,可以為我們所有的合作伙伴和用戶提供非常完備的技術(shù)支持和服務(wù)。

  科大訊飛在去年5月份上市以后,也是成立了我國(guó)第一家以語(yǔ)音技術(shù)為主要產(chǎn)業(yè)化方向的上市公司。在當(dāng)前比較惡劣的經(jīng)濟(jì)環(huán)境下,科大訊飛受到了股市和分析師非常好的評(píng)價(jià),去年11月份開始我們中小版上升了60%,我們大概上升了140%。我們現(xiàn)在的股價(jià)大概維持在30多元。其中股價(jià)只是很表面的表現(xiàn),最主要的原因是各個(gè)行業(yè)的分析師,對(duì)于語(yǔ)音技術(shù)的水平,以及語(yǔ)音技術(shù)各個(gè)行業(yè)的廣泛應(yīng)用,表示高度的認(rèn)可。我們也希望我們不斷提供最優(yōu)的語(yǔ)音技術(shù),我們期待和我們的產(chǎn)業(yè)、呼叫中心相關(guān)的產(chǎn)業(yè)能夠合作共贏、共同發(fā)展。我的介紹就到這里,謝謝大家!

  本文根據(jù)CTI論壇主辦的2009中國(guó)呼叫中心及企業(yè)通信大會(huì)會(huì)議記錄整理,轉(zhuǎn)載請(qǐng)注明出處!

CTI論壇報(bào)道



相關(guān)閱讀:
科大訊飛連續(xù)三年獲中國(guó)IP通信大獎(jiǎng) 2010-10-14
訊飛助寧夏大學(xué)建成普通話模擬測(cè)試與學(xué)習(xí)平臺(tái) 2010-10-08
科大訊飛助力重慶時(shí)報(bào) 詮釋現(xiàn)代呼叫中心理念 2010-09-30
引領(lǐng)語(yǔ)音合成芯片發(fā)展 科大訊飛推出XFS4243CE 2010-09-26
訊飛語(yǔ)音服務(wù)城市公共自行車管理系統(tǒng) 2010-09-21

熱點(diǎn)專題:  呼叫中心  語(yǔ)音合成TTS 語(yǔ)音識(shí)別ASR