首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

發(fā)表評論分享按鈕

語音識別聲控導(dǎo)航和后臺服務(wù)聲控導(dǎo)航之爭

2012/06/08

  多年前,在科幻作家和未來學(xué)家想象的文章中以及科幻大師的電影中,人們可以用聲音來控制生活中的設(shè)備。多年后的今天,這種理念正在試圖改變我們的生活。

  2012年春,蘋果Siri的流行帶火了語音控制的概念。而在車載導(dǎo)航領(lǐng)域,2011年6月,好幫手電子旗下翼卡車聯(lián)網(wǎng)公司在鄭州首次發(fā)布了語音控制類的車聯(lián)網(wǎng)產(chǎn)品:領(lǐng)航服務(wù),首次將語音控制的概念在車聯(lián)網(wǎng)領(lǐng)域內(nèi)實現(xiàn)。在短短的半年之后的2012年廣州AAITF展上,聲控導(dǎo)航的概念和產(chǎn)品遍地開花。從“聲控導(dǎo)航升級風(fēng)暴”的翼卡車聯(lián)網(wǎng),“智駕云”的天緣電子,“聲控更安全”的卡仕達(dá),以APP應(yīng)用為主打的凱立德等車載導(dǎo)航行內(nèi)的新貴和大佬們都開啟導(dǎo)航的“聲控”之路。

  乍看之下,聲控技術(shù)來勢洶洶,大有欲“革”前些年熱火的專車專用手寫導(dǎo)航“命”的勢頭,目前,行業(yè)內(nèi)的聲控導(dǎo)航出現(xiàn)了純語音識別的智能聲控和以后臺服務(wù)為支撐的聲控導(dǎo)航兩種實現(xiàn)方式。前者在行業(yè)內(nèi)還鮮有落地產(chǎn)品,而后者以卡仕達(dá)領(lǐng)航系列、翼卡車聯(lián)網(wǎng)公司聲控導(dǎo)航•智能升級系統(tǒng)為代表的聲控導(dǎo)航已經(jīng)落地商用。不過就目前兩種技術(shù)的成熟度而言,在車載終端上,誰也不具有壓倒性的優(yōu)勢,但毫無疑問的是,智能聲控和后臺服務(wù)聲控之間的暗戰(zhàn)已經(jīng)拉開帷幕。

  誰主沉?智能聲控與后臺服務(wù)聲控之爭

  現(xiàn)今市面上搶占“聲控”概念的導(dǎo)航大略能分兩類:一是無需后臺支持的智能聲控,一是由服務(wù)后臺支持的聲控導(dǎo)航。

  智能聲控通常以應(yīng)用軟件形式出現(xiàn),它專注增強(qiáng)導(dǎo)航功能,能識別用戶的日常用語,很酷很炫,但精準(zhǔn)度及客戶體驗成為大規(guī)模應(yīng)用的考驗。智能聲控在取得突飛猛進(jìn)的發(fā)展時,也還有不少瓶頸需要突破。第一,軟件兼容性,智能聲控軟件使用范圍狹窄。智能聲控軟件一般只能兼容一種或是幾種終端系統(tǒng),也就是說用戶只能選擇特定的手機(jī)系統(tǒng)或是車載導(dǎo)航系統(tǒng),才能運(yùn)用聲控導(dǎo)航軟件,能享受聲控導(dǎo)航帶來方便的客戶范圍受到很大的限制。第二,智能聲控軟件沒有屬于自己的后臺,能實現(xiàn)的功能單一,提供的服務(wù)有限,F(xiàn)在的車主對車聯(lián)網(wǎng)服務(wù)需求越來越多,安全、方便、娛樂等都成為選擇的標(biāo)準(zhǔn),顯而易見,單一的功能不能滿足客戶對車聯(lián)網(wǎng)服務(wù)的期望。第三,在進(jìn)行聲控時,為了減少周圍噪聲對軟件的影響,用戶要把手機(jī)拿到嘴邊讓軟件接收聲音,并且需要使用標(biāo)準(zhǔn)的普通話,軟件才能進(jìn)行準(zhǔn)確的語音識別。也就是說在導(dǎo)航過程中不能徹底解放雙手,甚至可能會出現(xiàn)不能識別用戶方言的情況,語義識別就更談不上了。智能聲控的進(jìn)一步推廣和普及,都要先解決包括但不限于以上瓶頸。不過我們有信心期待,假以時日,三五年后,智能聲控能更上新臺階,步入尋常百姓家。

  另一種擁有服務(wù)后臺支撐的聲控導(dǎo)航,是以“產(chǎn)品+服務(wù)”的產(chǎn)品模式出現(xiàn),產(chǎn)品和服務(wù)提供商建立起自己的服務(wù)后臺,除了能夠?qū)崿F(xiàn)聲控導(dǎo)航功能,同時能為用戶提供機(jī)票酒店預(yù)訂、餐飲租車預(yù)訂、全國道路救援等服務(wù)。服務(wù)后臺的客服人員能靈活識別用戶的語言。不過此種模式的主要瓶頸在于人工服務(wù)需要新增使用成本,同時,各品牌產(chǎn)品之間的后臺兼容及服務(wù)的標(biāo)準(zhǔn)化有很多功課尚待彌補(bǔ),目前尚未有車聯(lián)網(wǎng)行業(yè)的服務(wù)化標(biāo)準(zhǔn)出現(xiàn)。雖然目前有第三方積極運(yùn)作兼容各家產(chǎn)品平臺的應(yīng)用,但距離實際的大規(guī)模應(yīng)用上,還有一定距離。

  目前,以智能聲控為代表的是華陽和凱立德,華陽的智能聲控導(dǎo)航已在其官方微博發(fā)布體驗式視頻,凱立德聲控APP已經(jīng)在AAITF上亮相,相信不久之后都將面向消費(fèi)者,接受消費(fèi)者的全面考驗。以后臺服務(wù)為主的聲控導(dǎo)航以好幫手電子旗下卡仕達(dá)、車友互聯(lián)、智成DOD以及翼卡車聯(lián)網(wǎng)公司等的導(dǎo)航為主。好幫手電子旗下卡仕達(dá)導(dǎo)航以及翼卡車聯(lián)網(wǎng)公司針對手寫導(dǎo)航升級為聲控導(dǎo)航的“聲控導(dǎo)航•智能升級系統(tǒng)”已經(jīng)大規(guī)模面市。智能聲控還是后臺服務(wù)聲控誰主沉。啃枰唤o消費(fèi)者來檢驗,我們拭目以待。

  曲線前進(jìn)?語音控制會是車聯(lián)網(wǎng)發(fā)展趨勢

  在今年3月底科大訊飛舉行的語音開發(fā)者大會上,研發(fā)出世界上第一個“非特定人連續(xù)語音識別系統(tǒng)”的李開復(fù)強(qiáng)調(diào):“假如能做到一定程度的語意的理解,需要投入多少,怎么樣讓開發(fā)者很好的介入,這是一個問號。” “人們一旦開始使用語音跟機(jī)器交流了,就會把它當(dāng)做一個人,這個帶來的超級高的期望值會給語音帶來很大的挑戰(zhàn)!

  從李開復(fù)的發(fā)言中,我們不難發(fā)現(xiàn)語音識別相對容易,語義理解相對困難,同時語音的交流會帶來用戶期望值的提高。故在謹(jǐn)慎進(jìn)入語音控制的同時,也凸顯出語音控制將是發(fā)展趨勢。無論是智能聲控,還是后臺服務(wù)的聲控,語音控制將讓人真正擺脫雙手與機(jī)器交流,讓未來人機(jī)交互進(jìn)入一個新紀(jì)元,不僅在導(dǎo)航領(lǐng)域,在未來車聯(lián)網(wǎng)的競爭中,語音等人機(jī)交互方式的競爭也將是至關(guān)重要的一環(huán)。

  從語音技術(shù)在業(yè)界以外范圍的應(yīng)用看,iPhone4S推出后,最大的變化是語音技術(shù),語音技術(shù)好幾年前就在手機(jī)上有應(yīng)用,之前制約語音技術(shù)發(fā)展的瓶頸之一就是命令過少,且識別率較低,而隨著云技術(shù)的開發(fā)成熟,具有云技術(shù)的聲控技術(shù)將大大提高終端設(shè)備的識別能力?拼笥嶏w總經(jīng)理方奇認(rèn)為,在眾多的功能實際應(yīng)用中,語音互動是車聯(lián)網(wǎng)發(fā)展的一個關(guān)鍵點(diǎn),從安全角度和便利性考慮,語音識別應(yīng)用都是未來車聯(lián)網(wǎng)發(fā)展的主流方向。他認(rèn)為,語音互動實際上解放了人的雙手,讓行車變得更加安全。筆者體驗過一段時間科大飛訊語音輸入法,在識別率方面,這個輸入法整體表現(xiàn)基本滿意,當(dāng)然,那是在體驗用該輸入法發(fā)短信,如果將此技術(shù)適用到車載主機(jī)上,用于識別功能操控,其識別效率和正確率應(yīng)該會有大幅提高。

  在國外,福特SYNC的車載主機(jī)就是通過語音技術(shù)突破車載智能平臺的難題,而在國內(nèi)市場,很多企業(yè)也意識到了這個問題,多家企業(yè)都在語音控制上“悶頭大發(fā)財”,更將語音控制技術(shù)用自己的理解向前推動,如華陽在推出了語音控制基礎(chǔ)上,進(jìn)一步增加了手勢控制功能主機(jī),天緣、凱越等廠家推出的聲控主機(jī)已經(jīng)可以辨識具體功能項目中的功能細(xì)目,如進(jìn)入iPod界面后,可以用語音選擇曲目,在導(dǎo)航界面下實現(xiàn)本地化語音導(dǎo)航,據(jù)傳,好幫手電子以及旗下翼卡車聯(lián)網(wǎng)公司也已經(jīng)投入語音控制研發(fā)多年,2011年發(fā)布概念性產(chǎn)品,可能因為尚未大面積推廣的原因,目前對外界保持低調(diào)和神秘。

  可以預(yù)想一下,聲控技術(shù)應(yīng)用于車載主機(jī)后,人機(jī)對話將會變得更輕松,很可能會變得像開啟按鈕一樣司空見慣。雖然語音控制在軟硬件之上還離大規(guī)模應(yīng)用有比較長的距離,在短期內(nèi),后臺服務(wù)將作為主導(dǎo),但曲線前進(jìn),并最終成為車聯(lián)網(wǎng)發(fā)展趨勢的大局已經(jīng)明朗化。

  總結(jié)陳詞

  iPhone 4S中的Siri語音控制系統(tǒng)自發(fā)布以后就掀起了語音系統(tǒng)開發(fā)的熱潮,語音技術(shù)是未來的發(fā)展的趨勢,但是目前而言還是困難重重,尤其是面對博大精深的中文,語義理解更是困難。語音識別技術(shù)成熟運(yùn)用在車聯(lián)網(wǎng)中還有很長的路要走,故在短期內(nèi),以自主后臺,自建呼叫中心實現(xiàn)聲控導(dǎo)航的車聯(lián)網(wǎng)企業(yè)將搶占先機(jī),率先占有市場。

  目前,以后臺服務(wù)為支撐的車聯(lián)網(wǎng)服務(wù)的客戶體驗、靈活度、服務(wù)延展性等方面略占優(yōu)勢,將成為短期(未來1到3年)的主流和熱點(diǎn),尤其是即滿足消費(fèi)者使用需求,又結(jié)合當(dāng)下經(jīng)濟(jì)、綠色、環(huán)保熱點(diǎn),能實現(xiàn)將使用過的手寫導(dǎo)航直接通過較為簡單的方式升級為聲控導(dǎo)航的產(chǎn)品。但也期待,假以時日,伴隨科技的發(fā)展,智能聲控能帶來更好的應(yīng)用和體驗。

音響改裝技術(shù)



相關(guān)閱讀:
讓你的設(shè)備更加智能,語音技術(shù)如何提升用戶體驗? 2012-05-25
語音時代的到來與群體式憂慮 2012-04-06
專訪科大訊飛吳曉如:語音云服務(wù) 深入千家萬戶 2012-03-27
語音操控體驗攪熱移動互聯(lián)網(wǎng) 2012-01-30
捷通華聲董事長張連毅:HCI前景不可限量 2011-12-26

熱點(diǎn)專題:  語音合成TTS 語音識別ASR