首頁>>廠商>>語音識別與合成>>得意音通

得十分利予人七分 得意傾心產(chǎn)業(yè)聯(lián)盟

2004/07/01

核心技術(shù)產(chǎn)業(yè)化

  "我們現(xiàn)在正在尋找合適的合作伙伴。"北京得意音通技術(shù)有限責(zé)任公司市場副總裁鄧永強說。雖然公司員工不多,但鄧永強對公司技術(shù)實力頗感自信。得意公司的技術(shù)以及管理團隊來自清華大學(xué)、美國南加州大學(xué)等著名學(xué)府,有著深厚的技術(shù)積累。

  得意公司成立于2002年4月,公司定位為"語音與語言技術(shù)開發(fā)商和技術(shù)提供商"。得意公司擁有語音識別、聲紋識別和自然語言理解三大領(lǐng)域的核心技術(shù)。這幾項技術(shù)屬于人工智能范疇,是中文信息處理的重要分支。

  與之相對應(yīng)的是,目前國內(nèi)進行相關(guān)技術(shù)研究的科研機構(gòu)屈指可數(shù),而得意公司是惟一在以上三大領(lǐng)域都具備完全自主知識產(chǎn)權(quán),而且在商業(yè)化取得成功的企業(yè)。

  有關(guān)領(lǐng)域被公認(rèn)為未來的朝陽產(chǎn)業(yè),比爾·蓋茨說過:"人類計算的未來是讓計算機能夠看、聽、學(xué),能用自然語言與人類進行交流。"IBM、微軟等IT巨頭都投入重金強將進行研究開發(fā)。但是語音與語言技術(shù)難度大、投入高,比如連續(xù)語音識別,雖然國內(nèi)外很多研究機構(gòu)和商業(yè)公司已經(jīng)投入了大量的精力和資源,目前技術(shù)上仍不夠成熟。

  可喜的是,得意公司經(jīng)過兩年多的艱苦創(chuàng)業(yè),技術(shù)取得了很多進展,市場得到了很好的開拓,其成熟度達到了商用化的要求。鄧永強向記者介紹,得意公司的聲紋識別技術(shù)和產(chǎn)品,可以為公安、國防等高端領(lǐng)域服務(wù),也可以在民用領(lǐng)域大有作為。

  聲紋識別技術(shù)屬于生物識別技術(shù)的一種,是一項根據(jù)語音波形中所蘊涵的說話人信息,自動識別說話人身份的技術(shù)。公安系統(tǒng)在調(diào)查某些人時,可以把他的聲音與聲音庫中的樣本進行對比而確認(rèn)其身份;同樣,聲紋加密鎖、門禁系統(tǒng)、電話/網(wǎng)絡(luò)身份認(rèn)證系統(tǒng)等民品中也可以通過聲音進行身份確認(rèn)。可以說,現(xiàn)代社會無處不在的身份驗證、加密鎖等設(shè)備中,都有聲紋識別的用武之地。

  鄧永強介紹,得意公司在國際上首創(chuàng)的"聲紋加密鎖",即利用了聲紋識別技術(shù),實現(xiàn)了更方便和更安全的身份認(rèn)證。在演示中記者看到,只要合法用戶對著話筒說大約2秒到4秒的任何語言、任何話語,經(jīng)聲紋識別確認(rèn)無誤后,電腦就會把管理權(quán)交給該用戶,而其他人則無法訪問經(jīng)過加密的電腦文件。

  據(jù)得意公司技術(shù)人員介紹,聲紋識別技術(shù)分為兩類,即聲紋辨認(rèn)和聲紋確認(rèn)。其中,聲紋辨認(rèn)(又稱說話人辨認(rèn))技術(shù)用于判斷某段語音是若干人中的哪一個所說的,是"多選一"問題;聲紋確認(rèn)(又稱說話人確認(rèn))用以確認(rèn)某段語音是否為指定的某個人所說的,是"一對一判別"問題。即使用錄音機等設(shè)備錄制的原聲,都不會被系統(tǒng)確認(rèn)通過,因為在錄制以及播放過程中,這些發(fā)音經(jīng)過了與訓(xùn)練時不一致的信道轉(zhuǎn)換,因此能被系統(tǒng)安全可靠地鑒別出來是真人發(fā)音還是錄音重放。基于這個特性,可以保證只有當(dāng)事人才能打開聲紋加密鎖,確保了安全性。

  鄧永強告訴記者,目前得意公司的聲紋識別技術(shù)已經(jīng)被應(yīng)用于很多領(lǐng)域和一些重要客戶,為公司帶來了良好的收益。得意公司希望這一技術(shù)能更加廣泛地應(yīng)用和推廣,迅速形成產(chǎn)業(yè)規(guī)模。

做好產(chǎn)業(yè)鏈的最上游

  鄧永強認(rèn)為,聲紋識別技術(shù)要實現(xiàn)更大規(guī)模的產(chǎn)業(yè)化,提供更多樣化的產(chǎn)品形態(tài)、為更多領(lǐng)域服務(wù)的工作很重要,比如研發(fā)和生產(chǎn)嵌入式系統(tǒng)或者芯片。嵌入式產(chǎn)品適用范圍更廣泛,包括手機、門禁、汽車、取款機甚至智能式信用卡等需要身份認(rèn)證的設(shè)備和場合。實現(xiàn)了嵌入式系統(tǒng)和芯片的開發(fā),在給別人打開方便安全的大門同時,也打開了得意公司走向財富的大門。

  但鄧永強也同樣知道,要把聲紋識別技術(shù)移植到嵌入式系統(tǒng)和芯片中,得意公司不但需要資金支持,還需要與有相關(guān)經(jīng)驗和有獨特眼光與遠見的廠商合作。

  "園區(qū)的所有優(yōu)惠政策,我們基本都享受到了,并得到了不少的資金支持。"鄧永強說。但對于一個技術(shù)研發(fā)型的企業(yè)來說,這些資金以及優(yōu)惠遠遠不夠。得意公司是一個快速發(fā)展的企業(yè),與中關(guān)村所有有著良好的技術(shù)背景的研發(fā)企業(yè)一樣,得意公司也面臨著共同的問題:高速發(fā)展的期望與資金緊張的現(xiàn)實之間的矛盾。

  對于得意公司來說,它迫切需要能夠?qū)崿F(xiàn)技術(shù)產(chǎn)業(yè)化的合作伙伴,得意公司有成型的技術(shù)產(chǎn)品,希望與有實力的合作伙伴一起,構(gòu)造上下游分工合理、利益共享的產(chǎn)業(yè)關(guān)系,打造現(xiàn)代產(chǎn)業(yè)鏈,分工協(xié)作,把技術(shù)產(chǎn)品大規(guī)模地應(yīng)用到海內(nèi)外市場。而一些新型系統(tǒng)集成商正好可以完成這個工作--把得意公司的技術(shù)整合在整個系統(tǒng)中,進行進一步的應(yīng)用開發(fā)。但可惜的是,雖然系統(tǒng)集成商自救的呼聲漸高,但目前國內(nèi)的大部分系統(tǒng)集成商們?nèi)匀辉诤唵蔚刂貜?fù)搬箱子、裝電腦的工作,技術(shù)能力的增長,特別是產(chǎn)業(yè)理念的更新,不是短時間之內(nèi)就能實現(xiàn)的。

  得意音通的另一項技術(shù)--自然語言理解技術(shù)已經(jīng)初步形成了產(chǎn)業(yè)鏈,進入良性循環(huán)。自然語言理解是把文字轉(zhuǎn)化為語義的過程,該應(yīng)用最常見的例子就是智能聊天機器人。得意公司與電信系統(tǒng)集成商深圳傲天的合作,實現(xiàn)了智能短信服務(wù)系統(tǒng),應(yīng)用于中國移動、中國聯(lián)通等電信運營商網(wǎng)絡(luò)平臺。這個系統(tǒng)加入相關(guān)的資料數(shù)據(jù),即可方便、智能地實現(xiàn)該領(lǐng)域智能短信服務(wù),比如添入商家數(shù)據(jù)庫,它就可以完成黃頁智能查詢功能;而加入城市生活數(shù)據(jù)庫,它就可以完成餐飲推薦、交通路線、生活指南等多種實用功能。

  得意公司的自我定位是研發(fā)型的技術(shù)企業(yè),不會進行終端產(chǎn)品和應(yīng)用的開發(fā),而只是向合作伙伴提供技術(shù)。因此,在整個產(chǎn)業(yè)鏈中,得意公司處于最頂端。

  當(dāng)然,對于融資或者合作伙伴的選擇,鄧永強也有著自己的想法和理解。

  "在語音技術(shù)領(lǐng)域,我們自己不開發(fā)語音合成。"鄧永強說。語音識別與語音合成相輔相成,因此,鄧永強認(rèn)為這兩種技術(shù)應(yīng)該互相合作,共同培育市場蛋糕。

  "得十分利,予人七分",這是道家的境界。與小而全的中關(guān)村許多中小企業(yè)相比,得意公司選擇了集中精力,做好上游的技術(shù)提供商。給整個產(chǎn)業(yè)鏈讓出七分利,才能獲得最好的合作伙伴,這一理念,是眾多企業(yè)所需要思考的。

得意音通公司供稿 原文刊登于《中關(guān)村周刊》



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺項目中標(biāo) 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測檢驗中心對《海量語音文件的目標(biāo)說話人篩選系統(tǒng)》進行測試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類信息:  語音合成TTS_與_語音識別ASR     新聞頻道   技術(shù)_語音合成_新聞   技術(shù)_語音識別_新聞