然而選擇語音輸入的另一個(gè)問題就是:不得不面對(duì)的語音識(shí)別速度。一旦網(wǎng)絡(luò)環(huán)境稍差,識(shí)別速度就堪稱“龜速”,而在沒網(wǎng)的情況下,就只能面對(duì)著“網(wǎng)絡(luò)在打盹兒,稍后在試吧!”而興嘆了。
近期,捷通華聲針對(duì)靈云語音識(shí)別SDK進(jìn)行全新升級(jí),更改vad引擎并優(yōu)化了效果,大幅提升了識(shí)別率以及識(shí)別速度,并增加了ASR的雙路識(shí)別功能,更能保障識(shí)別的準(zhǔn)確率與成功率。
除了語音識(shí)別SDK,靈云語義理解SDK、語音合成SDK也得到了相應(yīng)的升級(jí)優(yōu)化,從而實(shí)現(xiàn)更快、更優(yōu)質(zhì)的人機(jī)語音交互。開發(fā)者登陸靈云平臺(tái)(www.aicloud.com),進(jìn)入開發(fā)者社區(qū),即可下載相關(guān)SDK,讓你的APP不再忍受語音交互的等待之苦。
靈云語音識(shí)別 中國(guó)智能語音領(lǐng)軍品牌
捷通華聲作為國(guó)內(nèi)最早從事中文智能語音技術(shù)研究與應(yīng)用的高新技術(shù)企業(yè),擁有行業(yè)頂尖的靈云語音識(shí)別技術(shù)。識(shí)別技術(shù)采用行業(yè)領(lǐng)先的深度學(xué)習(xí)算法,具備了識(shí)別率高、響應(yīng)速度快、支持話者分離和智能語音端點(diǎn)檢測(cè),口音和方言適應(yīng)能力強(qiáng)等優(yōu)點(diǎn)。
除支持中文識(shí)別已達(dá)國(guó)內(nèi)領(lǐng)先水平外,靈云語音識(shí)別還支持英文、維語、粵語等多語種識(shí)別,其中,中文普通話,識(shí)別率可達(dá)97%以上,實(shí)時(shí)率在0.3以下,并可通過語言模型定制和聲學(xué)模型定制,在短時(shí)間內(nèi)大幅提升專業(yè)領(lǐng)域的語音識(shí)別率。
結(jié)合靈云語音識(shí)別技術(shù),捷通華聲在靈云平臺(tái)上為開發(fā)者提供的靈云語音識(shí)別SDK可支持HTTP、Socket、WebService以及MRCP接口,且支持詞表識(shí)別、語法識(shí)別和自由說識(shí)別,可以在用戶終端進(jìn)行語音識(shí)別,也可以在云端進(jìn)行語音識(shí)別,并能根據(jù)不同領(lǐng)域的需求進(jìn)行個(gè)性化定制。
大規(guī)模語音實(shí)現(xiàn)高效、實(shí)時(shí)、精準(zhǔn)轉(zhuǎn)寫
靈云語音識(shí)別技術(shù)的快速進(jìn)步,給企業(yè)創(chuàng)新發(fā)展、提高效率帶來了新機(jī)遇,讓更多企業(yè)享受到靈云人工智能技術(shù)帶來的方便與快捷。
新升級(jí)的靈云語音識(shí)別SDK,以及靈云語義理解SDK、語音合成SDK、靈云種子,配合捷通華聲專門推出的靈云麥克風(fēng)陣列技術(shù),不僅能夠輕松實(shí)現(xiàn)電視、空調(diào)、音箱、機(jī)器人、車載系統(tǒng)的遠(yuǎn)場(chǎng)精準(zhǔn)語音交互,也讓交互等待時(shí)間不再漫長(zhǎng)、卡頓。
在各類會(huì)議的文字直播中,新升級(jí)的靈云語音識(shí)別能更加實(shí)時(shí)、高效地將會(huì)議情況進(jìn)行文字轉(zhuǎn)播,從而達(dá)到同步轉(zhuǎn)寫的效果,庭審記錄中將庭審現(xiàn)場(chǎng)實(shí)時(shí)記錄轉(zhuǎn)寫下來,大幅減輕速記員等文字工作者的工作量,提升了信息的傳播效率。
在客服、呼叫中心領(lǐng)域,語音識(shí)別技術(shù)將坐席與用戶的電話實(shí)時(shí)轉(zhuǎn)寫為文字,識(shí)別速度及準(zhǔn)確率的提升,讓溝通與文字的轉(zhuǎn)寫變得更為同步。在靈云智能語音導(dǎo)航系統(tǒng)以及靈云智能外呼機(jī)器人上,這一升級(jí)體現(xiàn)的更為明顯,接打外呼機(jī)器人或機(jī)器人客服的電話溝通交流時(shí),我們?cè)僖膊挥脼闄C(jī)器人長(zhǎng)時(shí)間的“思考”而苦苦等待了,用戶體驗(yàn)得到顯著提升。
未來,捷通華聲將進(jìn)一步深化與清華大學(xué)“靈云科技源自清華”的戰(zhàn)略合作,不斷提升靈云語音識(shí)別、語義理解、語音合成、人臉識(shí)別等各項(xiàng)技術(shù)的能力,讓大眾能夠體驗(yàn)到人工智能帶來的方便與快捷。開發(fā)者可以到靈云平臺(tái)上下載體驗(yàn)包括靈云語音識(shí)別、語義理解、語音合成、人臉識(shí)別、OCR識(shí)別、聲紋識(shí)別等多種能力在內(nèi)的SDK。