科大訊飛車載導(dǎo)航語(yǔ)音合成系統(tǒng)探析
2009/09/30
從全球汽車產(chǎn)業(yè)發(fā)展?fàn)顩r來(lái)看,智能語(yǔ)音技術(shù)在車載導(dǎo)航中的應(yīng)用是一種新的、必然的趨勢(shì)。傳統(tǒng)的車載導(dǎo)航產(chǎn)品,是用眼睛看的方式獲取相關(guān)信息,對(duì)汽車駕駛者而言存在一定的安全隱患。智能語(yǔ)音技術(shù)在車載導(dǎo)航中的應(yīng)用,變看為聽(tīng),極大提升了汽車駕駛的舒適性與安全性。
目前,國(guó)內(nèi)車載導(dǎo)航制造廠商就語(yǔ)音技術(shù)在車載導(dǎo)航中的應(yīng)用已經(jīng)達(dá)成了廣泛的共識(shí),都在積極尋求智能語(yǔ)音技術(shù)提供商。那么,各車載導(dǎo)航制造廠商如何才能選購(gòu)一款符合消費(fèi)者使用需求的優(yōu)質(zhì)語(yǔ)音合成系統(tǒng)?基于對(duì)語(yǔ)音合成技術(shù)的開(kāi)發(fā)應(yīng)用研究以及與車載導(dǎo)航廠商的合作經(jīng)驗(yàn),作為國(guó)內(nèi)最大智能語(yǔ)音技術(shù)提供商的科大訊飛建議:車載導(dǎo)航廠商選購(gòu)語(yǔ)音合成系統(tǒng),可從以下4個(gè)方面進(jìn)行考量。
地名、路名的準(zhǔn)確播報(bào)
在實(shí)時(shí)的導(dǎo)航過(guò)程中,需要播報(bào)大量動(dòng)態(tài)的地名和路名,傳統(tǒng)的真人錄音無(wú)法實(shí)現(xiàn)對(duì)如此海量數(shù)據(jù)的處理,導(dǎo)航設(shè)備的資源存儲(chǔ)空間有限,也無(wú)法容納大量的聲音文件。隨著全國(guó)城市建設(shè)的提速,每過(guò)一段時(shí)間,就會(huì)有新的導(dǎo)航地圖發(fā)布、使用。如此的更新速度,也是傳統(tǒng)真人錄音手段望塵莫及的。而利用語(yǔ)音合成技術(shù)可輕松解決這一難題,將海量、動(dòng)態(tài)的信息實(shí)時(shí)轉(zhuǎn)化為語(yǔ)音播報(bào)給用戶。
中國(guó)地大物博、文化豐富,存在太多生僻地名、路名,有時(shí)普通大眾也不知道如何發(fā)音。生僻字、多音多義字大量存在,這就要求導(dǎo)航產(chǎn)品所選用的語(yǔ)音系統(tǒng)能夠?qū)崿F(xiàn)地名、路名的準(zhǔn)確播報(bào),充分保證語(yǔ)音播報(bào)的質(zhì)量和正確率。不恰當(dāng)或者錯(cuò)誤的路名播報(bào)會(huì)誤導(dǎo)用戶行車方向以及浪費(fèi)旅途時(shí)間,會(huì)給用戶帶來(lái)巨大的困擾甚至安全問(wèn)題,直接影響到用戶對(duì)車載導(dǎo)航產(chǎn)品的使用感受和信任度。
具備“語(yǔ)隨文變”的優(yōu)質(zhì)語(yǔ)音合成效果
語(yǔ)音服務(wù)不僅實(shí)現(xiàn)了便捷化、人性化的操作,更重要的是保證了駕駛者的安全。如何讓駕駛者無(wú)需繁雜操作就可以第一時(shí)間了解所需信息,清晰、流暢、自然準(zhǔn)確的語(yǔ)音合成效果顯得至關(guān)重要。
導(dǎo)航過(guò)程中,語(yǔ)音合成系統(tǒng)應(yīng)具備文本的自然播報(bào)以及強(qiáng)大的智能處理能力,真正實(shí)現(xiàn)語(yǔ)隨文變。部分導(dǎo)航文本具有特殊性,播報(bào)時(shí)需要考慮它們?cè)谌粘?dǎo)航里的通用稱謂,例如G101——幺零幺國(guó)道;S309——三零九省道等等。漢語(yǔ)的詞語(yǔ)、成語(yǔ)和一般語(yǔ)境中有不少多音字,這就需要語(yǔ)音導(dǎo)航根據(jù)上下文和語(yǔ)境判斷這些多音字的讀音,同時(shí)還考慮到人名、地名等一些特殊情況。
另外,語(yǔ)音合成系統(tǒng)還必須根據(jù)上下文和語(yǔ)境正確判斷一些常見(jiàn)標(biāo)點(diǎn)符號(hào)、特殊符號(hào)的合成效果,如 “$0.50”與“敖東/北大街”,應(yīng)合成為“零點(diǎn)五零美元”、“敖東*北大街”。
與硬件設(shè)備的融合
語(yǔ)音合成系統(tǒng)能否與導(dǎo)航設(shè)備完美融合一直是車載導(dǎo)航制造廠商考察智能語(yǔ)音技術(shù)合作伙伴的關(guān)鍵。優(yōu)秀的語(yǔ)音合成系統(tǒng)應(yīng)該具備強(qiáng)大的兼容性,實(shí)現(xiàn)內(nèi)核與平臺(tái)無(wú)關(guān),任何平臺(tái)只需簡(jiǎn)單配置、編譯,即可完成移植。
此外,嵌入式環(huán)境下資源空間非常寶貴,語(yǔ)音合成系統(tǒng)應(yīng)該在系統(tǒng)架構(gòu)、代碼實(shí)現(xiàn)、資源結(jié)構(gòu)等方面進(jìn)行大量的優(yōu)化工作,降低運(yùn)算資源和存儲(chǔ)資源的需求。即使是一些低端的平臺(tái),也能夠從容運(yùn)行。同時(shí),語(yǔ)音合成系統(tǒng)應(yīng)該提供不同的輸出采樣率,滿足各種播音設(shè)備,真正適應(yīng)不同的平臺(tái)需求。
娛樂(lè)化需求設(shè)計(jì)
長(zhǎng)途的行駛過(guò)程中,同一種語(yǔ)音播報(bào)會(huì)讓用戶感到單調(diào)。如果語(yǔ)音技術(shù)提供商能夠提供不同發(fā)音人、方言發(fā)音以及定制特殊發(fā)音人等個(gè)性化需求設(shè)計(jì),將會(huì)使駕駛旅途變得更輕松愉快。
娛樂(lè)化需求設(shè)計(jì)表現(xiàn)在一些人性化的設(shè)計(jì)上,如支持菜單播報(bào)、開(kāi)機(jī)問(wèn)候語(yǔ)、語(yǔ)音提醒等功能。不論是固定文本還是動(dòng)態(tài)文本,如“下班先去玩具店給兒子買禮物”,既能省去真人錄音的工作及其占用的寶貴空間,又能解決真人發(fā)音無(wú)法應(yīng)對(duì)處理的動(dòng)態(tài)文本問(wèn)題。
未來(lái),語(yǔ)音合成系統(tǒng)將成為車載內(nèi)信息獲取、互動(dòng)娛樂(lè)、程序操控的重要工具,這就需要語(yǔ)音技術(shù)提供商重點(diǎn)考慮語(yǔ)音車載導(dǎo)航的更廣泛的需求設(shè)計(jì)。
CTI論壇編輯
相關(guān)鏈接: