欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁 > 新聞 > 專家觀點 >

語音識別領域的“潛行者”

--專訪普強信息CEO何國濤、CTO李全忠

2014-06-30 16:37:29   作者:   來源:21CN股票   評論:0  點擊:


  隨著蘋果Siri的出現(xiàn),語音識別技術開始逐步走進我們的視野。最直觀的感受,就是現(xiàn)在移動互聯(lián)網(wǎng)的應用中越來越多地以語音識別作為新的人機交互手段。

  那么語音識別究竟是怎么一回事,它又是怎樣被應用并實現(xiàn)其價值的,通過它企業(yè)又能獲取怎樣的增值服務?帶著這些疑問,我們走進普強信息技術(北京)有限公司,請被譽為語音識別領域舵手的普強CEO何國濤,和CTO李全忠先生來一一解說。

  何國濤:普強CEO,北京大學及美國雪城大學計算機碩士,曾就職于硅谷惠普實驗室及多家高科技創(chuàng)業(yè)企業(yè), 成功管理多個跨國項目。 擁有管理上億元營收的公司經(jīng)驗。 專長:大規(guī)模企業(yè)級服務器, Voice XML, IVR System.現(xiàn)主管公司運營。

  李全忠:普強聯(lián)合創(chuàng)始人和CTO,負責公司語音識別及語音分析技術。曾在IBM Almaden研究中心任研究員,在數(shù)據(jù)庫、數(shù)據(jù)分析、大數(shù)據(jù)處理及云計算等信息科技領域領導了多項研究項目。李全忠于1995年和1998年分別獲得北京大學計算機學士和碩士學位,隨后留學美國,在亞利桑那大學獲得計算機博士學位。

  問:現(xiàn)在語音識別技術已經(jīng)成為目前快速推廣、作用顯著的一種技術,但是對于普通用戶來說,這個概念可能更局限于諸如微信的語音輸入,請問這二者有什么異同點,語音識別技術究竟是怎樣的一門技術呢?

  何國濤:語音識別技術,簡單地說就是把用戶語音轉(zhuǎn)換成文本。它可以適用于不同的領域,例如移動互聯(lián)網(wǎng),可以讓很多人工密集的呼叫中心實現(xiàn)自動化和智能化,保障信息安全的如聲紋識別類,作為大數(shù)據(jù)挖掘的語音分析系統(tǒng),以及車聯(lián)網(wǎng)和教育產(chǎn)品等等。

  李全忠:微信的語音輸入只是一個應用例子。未來在我們的日常生活中會越來越多的情況下使用語音識別技術,能夠給我們的生活工作帶來很多便捷。

  問:嗯,語音識別技術就是把語音轉(zhuǎn)換成文本的技術,那語音識別在哪些領域使用的比較多,能夠為這些企業(yè)帶來哪些效益?

  何國濤:語音識別技術可以應用于許多不同的領域。現(xiàn)在使用最多的是移動互聯(lián)網(wǎng)領域,可以直接把語音轉(zhuǎn)換成文字,為用戶解決了在小屏幕鍵盤輸入的困難;呼叫中心領域,通過采用語音識別技術,自動化處理大量的重復性工作,例如語音分析、語音IVR導航;導航及車聯(lián)網(wǎng),通過智能語音輸入,使駕駛?cè)藛T能夠通過語音控制相應的非駕駛操作,讓駕駛?cè)藛T專注駕駛操作,增加駕駛的安全性;教育領域:口語評測;玩具領域:語音控制;聲紋識別領域:增強系統(tǒng)安全性能,這是今年語音識別的主要收入增長點;醫(yī)療保健領域:應用到電子病歷中,可自動實現(xiàn)醫(yī)生口述病歷及醫(yī)囑等等。

  問:確實是給我們?nèi)粘I顜砹撕艽蟮谋憬,也為企業(yè)提供了有效的解決方案。作為語音識別領域的重要研發(fā)企業(yè),普強在語音識別領域有著怎樣的技術優(yōu)勢?

  李全忠:普強目前已經(jīng)為金融、電信、保險等行業(yè)提供高準確度和高性能的電話線信道的 ASR(語音識別)引擎。

  移動互聯(lián)網(wǎng)方面,普強早在2010年7月便與愛幫網(wǎng)推出了語音版的LBS手機應用,這是國內(nèi)首個基于開放語音云平臺下支持多操作系統(tǒng)的手機應用。近年來,隨著公司不斷的積累,語音識別的技術和產(chǎn)品都相應獲得了全方面領先優(yōu)勢的發(fā)展。在產(chǎn)品的聲學建模上,開發(fā)使用了深度神經(jīng)網(wǎng)絡技術;公司研發(fā)的語音切分技術及識別結(jié)果的置信度算法,不但為企業(yè)級應用提供準確的識別結(jié)果,同時也提供了精確的說話人分割、時間邊界以及識別結(jié)果的置信度等信息,這些信息使企業(yè)在應用中(例如呼叫中心),更加便捷和準確地利用語音作為主要的交互方式,并且可以進一步挖掘、分析和利用海量語音數(shù)據(jù)的內(nèi)容。

 

  何國濤:普強智能語音分析系統(tǒng)可以廣泛應用于客服中心的質(zhì)檢和企業(yè)的精準營銷中。該產(chǎn)品提供例如熱點發(fā)現(xiàn),趨勢分析,自動建模等領先的功能。

  普強在不斷開發(fā)新技術的同時,也在企業(yè)語音應用的多個領域,(例如保險、銀行、證券及電信等的客服中心、增值服務等)積累了海量的數(shù)據(jù)、模型信息和項目的經(jīng)驗。

  問:由此可以看出普強信息的技術實力和優(yōu)勢。目前依托語音識別技術,普強有哪些成熟的產(chǎn)品?

  何國濤:成熟的產(chǎn)品主要有,千語語音平臺,向企業(yè)提供語音識別產(chǎn)品和服務;千語語音云平臺,為手機互聯(lián)網(wǎng)應用提供的語音識別云服務;普強智能語音分析系統(tǒng),為企業(yè)提供全方位、多維度的大數(shù)據(jù)分析(語音,視頻,文本數(shù)據(jù)等)。

  問:您所提到的語音分析系統(tǒng)與傳統(tǒng)的人工分析相比,有哪些優(yōu)勢?

  何國濤:語音分析系統(tǒng)的優(yōu)勢主要有以下幾個方面。

  1. 數(shù)據(jù)覆蓋更全:很顯然,智能語音分析人工分析工具所難以比擬的數(shù)據(jù)覆蓋性,語音分析可以做到100%覆蓋,但人工分析一般抽樣比例低于5%.

  2. 數(shù)據(jù)處理能力更強:相比于人工分析,智能語音分析數(shù)據(jù)處理能力更高,每一個CPU線程每一小時可以處理分析2.6小時的錄音,而人工分析每人每一小時只能處理分析0.4小時的錄音。一般標配服務器為16核CPU,一般等同于104人。(Elwin,這里需要說得更簡單直白一些,“一般標配服務器16和CPU,一般等同于104人”,具體是什么意思?)

  3. 具有精確的分析功能:語音分析可以通過聚類算法知道熱點業(yè)務、高頻詞匯;同時也可以通過篩選算法,在幾秒鐘內(nèi)就可找到目標數(shù)據(jù),而人工分析無法處理大數(shù)據(jù)量計算統(tǒng)計工作。

  4. 更具智能性:語音分析可以進行大數(shù)據(jù)量的統(tǒng)計計算,從而找出中間的具有某個特定特性的集合,并且分析集合間的相關性,而人工分析無法進行大數(shù)量的計算。

  5.自動性:語音分析可以事先預設統(tǒng)計規(guī)則,并設置回溯期的數(shù)據(jù)重新統(tǒng)計計算,人工無法將歷史數(shù)據(jù)采用新算法計算。

  6.統(tǒng)計計算工具:語音分析具備大量的數(shù)據(jù)挖掘和分析工具,人工分析只能做簡單的計算統(tǒng)計。

  問:與國際水平相比,國內(nèi)的語音識別技術整體上處在一個怎樣的層次?

  何國濤:在中文語音識別領域,國內(nèi)的科研院所及公司的數(shù)據(jù)積累要遠遠多于國外的同行,因此在中文的識別準確度上要好于國外。國內(nèi)技術型創(chuàng)業(yè)公司(包括普強)在研發(fā)和利用新技術方面有很大的靈活性,站在技術的前沿,這同時也提高了國內(nèi)語音技術在國內(nèi)的產(chǎn)業(yè)化水平。在企業(yè)應用市場方面仍然落后于歐美的發(fā)達國家,但是目前處于迅速跟進和快速發(fā)展的階段,這給語音產(chǎn)業(yè)的創(chuàng)業(yè)公司尤其是面向企業(yè)市場的公司提供了廣闊的市場空間。

  問:作為國內(nèi)語音識別技術的優(yōu)秀創(chuàng)業(yè)企業(yè)之一,普強預計語音識別的未來發(fā)展會是怎樣的?

  李全忠:在技術方面,從簡單的聲音模板匹配,到GMM/HMM,再到DNN/HMM每個新技術的發(fā)展都能給ASR的準確率帶來一個飛躍,但仍然有很多問題需要解決,比如適應各種環(huán)境的噪音,尤其是含有人聲的背景噪聲、口音及方言的識別、以及在嵌入式設備中降低功耗等。

  普強會繼續(xù)投入大量的資源去解決這些問題。以保證普強在技術上的領先地位。

  問:您認為普強未來的發(fā)展方向是怎樣的?

  何國濤:正如我之前提到的,ASR可應用在很多不同領域。包括:企業(yè)呼叫中心,車載導航領域、教育領域、玩具領域、聲紋識別領域和醫(yī)療保健領域等。普強的自主專利核心技術都可以支持這些領域。目前,我們集中資源在企業(yè)呼叫中心和移動互聯(lián)網(wǎng)領域。我們的產(chǎn)品在這一領域有明顯的優(yōu)勢,會繼續(xù)投資現(xiàn)有的領域,同時也會在此領域繼續(xù)加大投入以保持我們的優(yōu)勢,當然,也會投入在車載、教育等領域來建立技術屏障。

分享到: 收藏

專題