首頁>>>技術(shù)>>>語音應(yīng)用>>>語音識別(ASR)  語音識別產(chǎn)品

盛大進軍語音識別領(lǐng)域 對外開源哼唱搜索技術(shù)

2010/08/09

  8月4日消息,繼百度與谷歌中國之后,國內(nèi)又一企業(yè)殺入語音識別領(lǐng)域。盛大網(wǎng)絡(luò)創(chuàng)新院語音團隊負(fù)責(zé)人黃偉博士近日透露,盛大將對外開源哼唱搜索技術(shù)。


圖:硅谷一家名為Melodis的公司的旗下網(wǎng)站Midomi實現(xiàn)哼唱搜索功能

  據(jù)了解,哼唱搜索技術(shù)近年來備受關(guān)注。在美國包括谷歌以及多家美國創(chuàng)業(yè)公司均提供過相關(guān)產(chǎn)品。硅谷一家名為Melodis的公司的旗下網(wǎng)站Midomi已實現(xiàn)這個功能,而且早在07年,Midomi就已經(jīng)開始運營。

  日前,百度內(nèi)部也正在測試MP3“哼唱”音樂搜索,用戶通過音頻輸入設(shè)備哼唱歌曲可以找到最符合這個旋律的歌曲信息。早前百度就開始加強語音識別的投入力度,近期更是連續(xù)發(fā)出招聘啟事,招募語音識別的技術(shù)帶頭人、高級工程師和工程師等崗位。

  相對于百度大張旗鼓地招兵買馬,盛大網(wǎng)絡(luò)創(chuàng)新院卻早在去年便靜悄悄地組建了中國最強悍的語音識別團隊,其帶頭人黃偉博士以及同事李霄寒博士等骨干人員,悉數(shù)為各語音專業(yè)機構(gòu)的核心成員。

  剛剛帶領(lǐng)盛大網(wǎng)絡(luò)創(chuàng)新院語音團隊在世界最為知名的NIST SRE比賽中獲得綜合指標(biāo)第一的成績之后,黃偉博士近日對外宣布他們將對外開源哼唱搜索技術(shù)。

  黃偉介紹說,哼唱搜索技術(shù)目前常見的一種語音識認(rèn)證算法,盡管涉及技術(shù)較淺,但卻是很好的語音識別教學(xué)案例。他指出,為了更好促進語音識別的產(chǎn)業(yè)化,他們決定對外開放哼唱搜索技術(shù)相關(guān)源代碼,以幫助國內(nèi)這個領(lǐng)域的研究人員得到分享和幫助。

  據(jù)悉,盛大語音團隊已被盛大內(nèi)部雪藏了兩年,近日盛大網(wǎng)絡(luò)在內(nèi)部通令嘉獎下屬創(chuàng)新院的語音團隊,全體成員獲得集體漲薪25%。此外,盛大語音團隊秘密研發(fā)兩年的神秘項目也將在近期推出。

IT168



相關(guān)閱讀:
Daum將推出聲音和物體檢索 2010-08-09
iPhone美食天下訊飛語音合成版發(fā)布 2010-08-09
沙特與黑莓達成協(xié)議 取消禁用令 2010-08-09
電子書價格成為引爆市場的導(dǎo)火索 2010-08-06
中國聯(lián)通手機閱讀擬8月中旬計費 2010-08-06

熱點專題:  語音合成TTS 語音識別ASR    移動增值
分類信息:  移動增值_與_語音應(yīng)用  移動增值_與_互聯(lián)網(wǎng)  移動增值_與_移動  移動增值_與_互聯(lián)網(wǎng)
相關(guān)頻道:  增值電信新聞