捷通華聲語音技術產(chǎn)品在SP增值業(yè)務的應用
2006/09/19
在以語音服務為主的增值業(yè)務中,需要與用戶交互大量的、豐富多彩的語音信息,單純的錄音不能及時滿足用戶多樣的需求,多層次的菜單和復雜的操作流程也使用戶感到厭煩。
而語音合成和語音識別技術的應用,避免語音交互過程中的繁瑣,提供一種便捷的交互方式,提高互動的動態(tài)性、時效性、簡單性和娛樂性。
北京捷通華聲語音技術有限公司一直在語音應用方面進行著探索,其語音技術產(chǎn)品廣泛應用在移動、聯(lián)通、電信等國內(nèi)各大運營商語音服務平臺中,充分顯示出在語音技術上的最高專業(yè)水平。
捷通華聲語音技術產(chǎn)品
語音合成產(chǎn)品
語音合成(Text-to-Speech),簡稱TTS,學名文語轉(zhuǎn)換系統(tǒng),是指利用計算機將任意組合的文本信息轉(zhuǎn)化為聲音數(shù)據(jù),并通過聲卡、電話語音卡等多媒體設備將聲音輸出。
捷通華聲自主知識產(chǎn)權的中文語音合成技術jTTS,采用大規(guī)模真實錄音的語音庫和基于韻律層級匹配的波形拼接算法,確保合成的高清晰度和高自然度,在國際上處于領先地位,并已申請多項國家專利。新近推出的jTTS4.5,基于深度的開發(fā)和廣泛的實踐積累,在語料設計、韻律層級分析、語義分析、數(shù)字符號讀法等多項技術上均有突破創(chuàng)新,自然度、可懂度、流暢度也明顯提升;同時增添了更加多樣化的音色選擇,以滿足電信增值服務平臺個性化應用的需求。
語音識別產(chǎn)品
語音識別(Open Speech Recognition),簡稱OSR,它的基本功能是對用戶說話的音波進行處理,轉(zhuǎn)換成文本,簡單的說就是讓計算機“聽”懂人說話。
在電信增值業(yè)務中,信息內(nèi)容的索引作為詞條放入詞表,用戶利用這些索引獲得具體的信息內(nèi)容服務,這也是目前語音識別技術基于電話網(wǎng)最常用的方式。
捷通音效平臺——變音技術產(chǎn)品
變音軟件,是捷通華聲開發(fā)的一套聲音處理的軟件開發(fā)包,通過數(shù)字信號處理等核心技術,可以將輸入的聲音變換成另一種效果的聲音,將聲音變換出豐富多彩的效果。例如:將溫柔的女子的聲音變成粗獷的男子的聲音;將成年人的聲音變成小孩的聲音;山谷的回聲;和預先錄制好聲音混合,創(chuàng)造出波濤洶涌的海邊,嘈雜的街道,充滿蚊蟲野外等場景。
語音技術在語音增值業(yè)務中的應用過程
捷通華聲語音技術在電信增值業(yè)務中的應用
語音短信
語音合成(TTS)技術在短信業(yè)務中的應用方式主要是:通過在平臺上添加安裝語音合成服務器等短信平臺改造或升級,用戶在使用短信時,可以選擇短信發(fā)送及接收方式,如文字短信、聲音短信等,這樣,傳統(tǒng)的“看”短信就變成“聽”短信,人們即使在很不方便用手機的狀態(tài)下(如開車時等),也可以從容的使用單一或任意一個按鍵,或使用耳機聽取聲音短信或話音。
語音郵件
傳統(tǒng)電話接收E-mail方法是由話務員把郵件的內(nèi)容直接念給用戶聽,而利用TTS技術,由語音合成平臺把文本格式的郵件內(nèi)容合成為語音,通過IVR播放給用戶。
用電話發(fā)E-mail業(yè)務是指用戶通過電話接入系統(tǒng),告知系統(tǒng)目的電子郵件的地址及郵件內(nèi)容,由OSR自動識別系統(tǒng)內(nèi)已定義好的IP地址,通過IVR節(jié)點錄音的語音文件以附件的方式生成Email,通過Internet發(fā)送到對方的Email信箱中。這樣,大大方便了那些上網(wǎng)不方便,但又需要通過E-mail與外界聯(lián)系的朋友。
語音秘書
用戶可以播打電話根據(jù)語音提示直接對著電話語音填寫,包括用戶電話號碼、呼叫時間及事由等信息。這些信息經(jīng)過語音識別模塊識別,并存入數(shù)據(jù)庫中,并由應用服務器定時查詢記事本,觸發(fā)PBX發(fā)生一次呼出事件,由IVR完成服務。
語音電話簿
語音電話簿旨在通過電話網(wǎng)絡和互聯(lián)網(wǎng)絡,向用戶提供可以隨時獲取、永不丟失的通訊錄服務。系統(tǒng)可以提供電話、互聯(lián)網(wǎng)等多種接入方式,用戶接入系統(tǒng)以后可以使用通訊錄的聯(lián)系人條目進行呼叫。如使用電話接入系統(tǒng),用戶可以用說出人名的方式,比如“張三”,實現(xiàn)與該聯(lián)系人的通話。同時用戶可以通過電話,直接采用語音的方式對通訊錄進行維護,,整個過程由系統(tǒng)自動響應完成,從而免除按鍵等繁瑣的操作。語音識別技術用以識別用戶命令,從而實現(xiàn)自動服務。語音合成技術把人名、電話號碼等大量無法用人工錄音的動態(tài)信息處理成語音信息播報給用戶。
語音資訊
用戶可通過撥打特定的接入號碼,按照相應的語音提示定制新聞實事、股票證券、天氣預報等語音信息后,由交互式語音業(yè)務平臺主動向用戶發(fā)起呼叫,按照客戶的定制要求播放語音信息。這些語音信息可以先存儲為文本,再由TTS轉(zhuǎn)成語音向用戶播報。同時通過TTS、OSR技術輕松實現(xiàn)航班、公交路線、體育賽事、考試分數(shù)、旅游景點、違章違規(guī)等信息的查詢。
彩鈴
彩鈴業(yè)務主要是讓主叫用戶發(fā)起呼叫之后接聽一段悅耳的音樂或歌聲或一句問候語。如遇到需將任意文字轉(zhuǎn)成語音方式時,用人工錄音(或被叫用戶自己錄音)實現(xiàn)有些麻煩,并且有一定的安全性;而被叫用戶如果可以通過手機、固定電話(帶文字輸入的)、或者是在一個網(wǎng)頁上將自己準備的有關文字信息放到彩鈴系統(tǒng)平臺中,經(jīng)過文字安全過濾,再選擇定制音樂等,彩鈴系統(tǒng)平臺中如果又安裝了語音合成(TTS)軟件,以上所提到的應用就完全可以實現(xiàn)。
另外,捷通華聲公司利用語音技術對一些語音文件進行特效處理,將彩鈴做成一個帶有背景特效聲音的個性化語音文件,如:在一個山谷背景中,一個個性化的聲音在告訴你一些信息;有一個來自宇宙太空中的聲音在與你交流;一片風雨聲中,在向您播報天氣信息;在一段悠揚的音樂聲中,做你自己的自我介紹等。
聲動點播
傳統(tǒng)的點歌系統(tǒng),將歌曲根據(jù)歌手、主題進行分類,由于受到電話鍵盤的限制,用戶要經(jīng)過層層的菜單引導,聽大量的菜單內(nèi)容后聽到點播的歌曲。而引入OSR以后,用戶只要說出歌曲名稱或者歌手姓名就可以調(diào)出所需的歌曲。同時還可以利用TTS將歌曲名稱合成語音,以便動態(tài)添加、管理曲庫,免去錄音的繁瑣工作。
其他應用
體育競猜、知識問答、廣播節(jié)目互動、趣味游戲、虛擬博彩、交友聊天、電話廣告、民意調(diào)查、費用催繳、愛心熱線、全國農(nóng)業(yè)信息查詢… …
捷通華聲公司作為一家專業(yè)的語音技術公司,不僅擁有語音技術研究與經(jīng)驗豐富的開發(fā)團隊,還投資建設了國內(nèi)一流的語音錄音室,從而構成了包括由專業(yè)人員 、專業(yè)設備、專業(yè)處理軟件技術組成的一整套語音資源建設體系,能夠根據(jù)不同用戶提出的任何個性化語音服務的需求做出迅速反應,并及時為其提供“量身定做”的語音產(chǎn)品,包括語音定制服務、各種專業(yè)錄音、語音音庫制作、語音加工處理等項目。
捷通華聲公司供稿 CTI論壇編輯
相關鏈接: