欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁 > 新聞 > 專家觀點 >

顏永紅:“搜索”語音識別技術的未來

2010-05-28 00:00:00   作者:   來源:   評論:0  點擊:



  顏永紅:中科院聲學所中科信利語音識別實驗室主任。
  1990年畢業(yè)于清華大學,1995年獲得美國俄勒岡研究院博士學位,后在該校任教,曾擔任OGI口語研究中心的副主任、英特爾微處理器實驗室的主任工程師和人機界面總框架師,英特爾中國研究中心的主任和首席研究員,英特爾全球人機界面學術委員會主席。
  2002年入選中科院百人計劃,任聲學所研究員、博士生導師,中科信利語音實驗室主任和所長助理。長期從事人機界面研究工作,目前從事的研究領域:大詞表非特定人連續(xù)語音識別,多模口語系統(tǒng),嵌入式系統(tǒng),多媒體數(shù)據(jù)檢索,系統(tǒng)自適應和快速搜索算法。

  10年前,他曾是英特爾微處理器實驗室的主任工程師和人機界面總框架師,英特爾中國研究中心的主任和首席研究員。
  如今,他一手創(chuàng)辦的中科院聲學所中科信利語音識別實驗室已發(fā)展成為國內語言聲學領域規(guī)模最大、學科最全的實驗室,與實驗室同時成立的中科信利技術有限公司也取得了長足的發(fā)展。
  兩個“孩子”的長大讓他倍感欣慰。而同時,他錯過了兩個寶貝女兒的成長,這是他最遺憾的。
  “沒有什么后悔的,時間無法倒流,只能往前看!敝锌圃郝晫W所中科信利語音識別實驗室主任顏永紅說。
  一項技術,牽制搜索引擎
  “在不久的將來,互聯(lián)網(wǎng)將成為一個浩大的音視頻檔案庫,對下一代搜索引擎來說,語音識別技術是關鍵。”顏永紅說。
  在浩繁的音視頻數(shù)據(jù)庫中,要查找出所需的音視頻片斷,已經(jīng)成為困擾互聯(lián)網(wǎng)搜索的難題——目前的技術主要是搜索音視頻的關鍵詞,比如音視頻的名字或作者,并沒有辦法搜索音視頻內容。而通過語音識別技術,可以把多媒體文件變成可識別的計算機語言,從而有效快速的實現(xiàn)準確搜索。
  事實上,語音識別技術也是各大公司競爭的一大焦點。
  去年11月份,谷歌推出的語音搜索引起極大關注。用戶只需在手機上安裝一個軟件,然后利用手機原有的麥克風,用普通話對手機說出需要查詢的內容,谷歌中文語音搜索會自動返回整合的搜索結果。
  “從實驗室成立到現(xiàn)在,我們一直在做這方面的技術積累,很快,我們和國內公司合作的語音搜索將面世!鳖佊兰t笑著說。
  目前,中科信利的中文電視廣播新聞節(jié)目識別系統(tǒng),就已經(jīng)被多家公司采用,并作為其提供給全國各電視臺的數(shù)字媒體管理系統(tǒng)中一個核心技術模塊。
  這個系統(tǒng)立刻引起本報記者的強烈興趣——當系統(tǒng)“收聽”到一段“新聞聯(lián)播”節(jié)目,自動將節(jié)目內容生成文字,并且識別準確率驚人地高。
  “那是不是我們的采訪錄音直接可以被轉化成文字?”記者頓時興致勃勃。
  “現(xiàn)在還不行!鳖佊兰t笑著說,“因為語音識別包括語言模型和聲學模型,新聞語言可以建立語言模型,但口語卻很難建立語言模型。”
  在語音識別實驗室里,視頻精確搜索已不是問題。
  在一段王楠比賽的視頻中,你只要輸入“側身搶拉”、“前三板”等關鍵詞,就可以找到精確到秒的視頻。這就意味著,如果你想找一部電影里的精彩片段,只需記得其中的經(jīng)典臺詞即可搜索。
共 2 頁:1 2 

《科技日報》

相關閱讀:

分享到: 收藏

專題