欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁 > 新聞 > 專家觀點(diǎn) >

如何搶灘智能語音字號(hào) 打造人機(jī)智能語音交互時(shí)代

2014-06-18 09:46:14   作者:   來源:中國計(jì)算機(jī)報(bào)   評(píng)論:0  點(diǎn)擊:


  磨一根針 破一片天

  “做語音是需要慢慢熬的。”這句話記者不止聽一個(gè)被采訪人說過。

  1989年從清華大學(xué)畢業(yè)任職紫光推進(jìn)OCR(圖像掃描識(shí)別),中間赴美,2000年與中國科學(xué)院聲學(xué)所研究員呂士楠共同創(chuàng)辦捷通華聲的張連毅稱自己是語音乃至整個(gè)智能交互行業(yè)的老兵。在他看來,從“入口說”、“門檻說”到“血統(tǒng)說”再到“技術(shù)說”,這兩年來的語音熱其實(shí)更多是一種炒作,而這種炒作對(duì)行業(yè)本身未必有多大好處。“我只認(rèn)可"技術(shù)說"。因?yàn)檎Z音只是交互的方式之一,智能語音就是一門技術(shù),它與應(yīng)用結(jié)合,這項(xiàng)技術(shù)就能創(chuàng)造出巨大價(jià)值。而這門技術(shù)的特點(diǎn)是厚積薄發(fā),需要慢慢積累,所以這就決定智能語音產(chǎn)業(yè)是要用一根針刺破天的專業(yè)領(lǐng)域,而不是用一個(gè)鐵錘砸出一片聲勢(shì)的產(chǎn)業(yè),必須專注、專業(yè),精耕細(xì)作,深耕久釀。”

  而所謂的積累,在云知聲CEO黃偉看來,就是算法、數(shù)據(jù)和團(tuán)隊(duì)經(jīng)驗(yàn)的積累。他告訴記者,作為創(chuàng)業(yè)型公司,“云知聲的優(yōu)勢(shì)不在于數(shù)據(jù)積累,而在于算法。從云知聲成立第一天起,我們就用了比對(duì)手少一個(gè)數(shù)量級(jí)的數(shù)據(jù)來訓(xùn)練算法模型,最終達(dá)到甚至超越對(duì)手產(chǎn)品性能,這個(gè)過程我們也積累了豐富而寶貴的團(tuán)隊(duì)經(jīng)驗(yàn)。而現(xiàn)在開放的語音云平臺(tái)已經(jīng)讓我們有了很多用戶數(shù)據(jù),我們的數(shù)據(jù)短板已經(jīng)得到了彌補(bǔ)。”

  黃偉畢業(yè)于中國科學(xué)技術(shù)大學(xué),后加入摩托羅拉并帶隊(duì)研發(fā)出世界上首個(gè)手機(jī)聲紋認(rèn)證系統(tǒng)。國際金融危機(jī)期間,摩托羅拉將整個(gè)語音識(shí)別團(tuán)隊(duì)出售給Nuance。黃偉拒絕被Nuance收編,于2009年7月加入盛大網(wǎng)絡(luò)旗下的創(chuàng)新院,2010年10月創(chuàng)建了語音分院,2013年年底正式出任公司CEO。黃偉告訴記者,在技術(shù)方面云知聲先后四次升級(jí)語音識(shí)別內(nèi)核,目前識(shí)別準(zhǔn)確率達(dá)96.26%,技術(shù)領(lǐng)先,并且可提供中、英、粵多語言識(shí)別;在商業(yè)化方面,云知聲單月簽約額突破千萬元,合作伙伴超過3200家,云知聲智能語音已廣泛應(yīng)用在移動(dòng)互聯(lián)網(wǎng)、智能家電、車載、可穿戴設(shè)備、呼叫中心、教育、醫(yī)療等領(lǐng)域。

  無獨(dú)有偶,科大訊飛副總裁江濤也同樣是語音界的老人。畢業(yè)于中國科技大學(xué)自動(dòng)化與計(jì)算機(jī)專業(yè)的他是科大訊飛的元老,作為科大訊飛創(chuàng)業(yè)團(tuán)隊(duì)成員,一直在從事語音技術(shù)在通信和互聯(lián)網(wǎng)方向的應(yīng)用推廣。在江濤看來,語音技術(shù)和其他技術(shù)一樣,都在沿技術(shù)成熟曲線不斷發(fā)展。幾年前蘋果Siri帶動(dòng)語音走進(jìn)向上發(fā)展階段,那時(shí)整個(gè)產(chǎn)業(yè)被看好,很多資本投入進(jìn)來至一個(gè)高潮,而現(xiàn)在是高潮過后走入技術(shù)成熟曲線下行階段,很多人開始悲觀,資本撤離,只有堅(jiān)持下來的公司能做成。他判斷,帶語音走入下一波上行曲線的動(dòng)力很可能是可穿戴設(shè)備、智能家居、智能汽車等。

  江濤向記者回憶,在上世紀(jì)90年代,當(dāng)時(shí)公認(rèn)語音做得最好是南北二“王”,南“王”就是中國科技大學(xué)的王仁華老師,他也是科大訊飛第一任董事長,也是他支持科大訊飛現(xiàn)任董事長劉慶峰創(chuàng)業(yè)的;北“王”指的就是清華大學(xué)的王作英老師,語音識(shí)別和語音合成做得都很不錯(cuò)。在江濤看來,語音成為人機(jī)交互的主要信息入口這是大勢(shì)所趨,毋庸置疑,只是語音真正價(jià)值的實(shí)現(xiàn)還有賴于技術(shù)的成熟和應(yīng)用的普及。應(yīng)用的普及需要慢慢來,引導(dǎo)、教育市場(chǎng),培養(yǎng)人們的使用習(xí)慣要一點(diǎn)點(diǎn)推進(jìn),但要全面推廣、普及還是需要過程的。“幾年前要是有人在電梯里對(duì)著自己手機(jī)喃喃自語大家都會(huì)覺得奇怪,不知道這人干嘛呢,但現(xiàn)在因?yàn)槲⑿诺钠占,這種行為習(xí)慣已經(jīng)被接受認(rèn)可。”

  而對(duì)于技術(shù)的成熟,江濤同樣認(rèn)為是需要專注投入、不斷積累的。江濤向記者介紹目前的語音識(shí)別技術(shù)現(xiàn)狀,他以環(huán)境從嘈雜到安靜的程度為橫軸,以人說話的清晰程度為縱軸,劃分四個(gè)象限。在第一象限,也就是環(huán)境也安靜、人說話也清楚的情況下,目前各家語音廠商技術(shù)實(shí)力差距不大,語音識(shí)別率都很高。在第二象限,也就是環(huán)境嘈雜、網(wǎng)絡(luò)不好的情況下,目前科大訊飛做得很不錯(cuò)。噪音大、網(wǎng)絡(luò)信號(hào)時(shí)斷時(shí)續(xù)非常影響語音識(shí)別效果。“車載語音識(shí)別最大的對(duì)手就是噪音。2013年8月,奔馳在全球?qū)υ萍夹g(shù)提供商進(jìn)行選型發(fā)布的報(bào)告中分別按不同時(shí)速(每小時(shí)60、100、140公里)測(cè)噪,科大訊飛是唯一在100公里時(shí)速上識(shí)別率超過90%的廠商。”江濤自豪地介紹。在第三象限,也就是環(huán)境不錯(cuò)、人發(fā)音不太配合(最典型的各種口音)的情況下,看的就是對(duì)語言種類,尤其是方言的支持程度。云知聲實(shí)現(xiàn)對(duì)粵語、英語的識(shí)別支持?拼笥嶏w除了實(shí)現(xiàn)對(duì)粵語、英語的識(shí)別支持,2014年以來陸續(xù)支持對(duì)河南話、四川話、東北話等方言的識(shí)別。江濤透露今年還會(huì)陸續(xù)支持湖南話、山東話、武漢話、合肥話、閩南話的方言識(shí)別。除了口音之外,語速、講話模式等也會(huì)對(duì)語音識(shí)別帶來不同挑戰(zhàn),比如演講與開會(huì)的語音識(shí)別的識(shí)別算法和模型都不一樣。“今年年底科大訊飛將推出一個(gè)產(chǎn)品實(shí)現(xiàn)普通話開會(huì)過程中,將語音轉(zhuǎn)變?yōu)槲淖郑R(shí)別率很高。”江濤透露。而在第四象限,即環(huán)境又不好、發(fā)音又不好的情況是世界性的難題,很難有誰能攻克。



分享到: 收藏

專題