首頁>>廠商>>語音識別與合成>>得意音通

中文語音語言處理技術(shù)與中國無線互聯(lián)

清華大學(xué)語音技術(shù)中心主任 北京得意音通技術(shù)有限責(zé)任公司總裁
鄭方博士 2003/03/14

  鄭方博士是漢語語音識別與語言理解方面國際知名的學(xué)術(shù)帶頭人之一,他是清華大學(xué)計算機(jī)科學(xué)與技術(shù)系副教授,智能技術(shù)與系統(tǒng)國家重點實驗室語音技術(shù)中心主任。他分別于1990年、1992年和1997年獲得清華大學(xué)計算機(jī)應(yīng)用專業(yè)學(xué)士學(xué)位(優(yōu)良畢業(yè)生)、碩士學(xué)位(北京市計算機(jī)學(xué)會優(yōu)秀論文)和博士學(xué)位(答辯委員會界定優(yōu)秀論文)。他從1988年開始從事語音識別與理解等方面研究,他負(fù)責(zé)或作為骨干人員參與研發(fā)過20余項國家重點項目和國際合作項目,并獲得教育部(委)、科技部(委)、北京市獎勵和其他獎勵10余次。他在國內(nèi)外知名刊物和學(xué)術(shù)會議上發(fā)表了110多篇學(xué)術(shù)論文,多篇獲優(yōu)秀論文獎。

  他服務(wù)于一些國際著名會議、刊物和組織,包括:中國計算機(jī)學(xué)會人工智能與模式識別專業(yè)委員會委員、中文信息學(xué)報編委、2000年ISCSLP程序委員會聯(lián)席主席、2000年ICSLP技術(shù)委員會委員、2000年東方COCOSDA國際會議的組織委員會委員、2001年全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC)程序委員會委員、2002年ISCA的PMLA(發(fā)音變異建模和詞典自適應(yīng))國際會議科學(xué)委員會委員、2002年SNLP-O-COCOSDA聯(lián)合國際會議的組織委員會委員和國際顧問、2003年東方COCOSDA國際會議總主席、東方COCOSDA核心成員、IEEE會員、ISCA會員等。他是IEEE Trans. on SAP、J. of Computer Science & Technology、中國計算機(jī)學(xué)報、聲學(xué)學(xué)報、中文信息學(xué)報、計算機(jī)研究與發(fā)展、Association of Computational Linguistics (ACL)等的審稿人,他還應(yīng)邀審議國家自然科學(xué)基金項目。

聯(lián)系方式:fzheng@d-Ear.com fzheng@sp.cs.tsinghua.edu.cn



  無論在國內(nèi)還是在國際,無線互聯(lián)都是技術(shù)和市場的熱點,中國的無線互聯(lián)產(chǎn)業(yè)也有了突飛猛進(jìn)的發(fā)展。分析現(xiàn)在,展望未來,可以預(yù)見中文語音和語言處理技術(shù)在中國的無線互聯(lián)產(chǎn)業(yè)中將起到非常大的作用,無線互聯(lián)的發(fā)展反過來也將帶動語音和語言處理技術(shù)的進(jìn)一步發(fā)展。

中文語音和語言處理技術(shù)

  自從1960年代IBM開始從事語音識別的研究以來,經(jīng)過人類數(shù)十年的艱苦努力,語音和語言處理技術(shù)有了很大的發(fā)展。尤其是在1990年代中,IBM的Via Voice在全球發(fā)布以后,無論是個人用戶還是產(chǎn)業(yè)界,無不對此刮目相看:語音的世紀(jì)來臨了。美國眾多著名大學(xué),包括MIT、CMU、JHU等的教授們,還有包括Microsoft、IBM、Intel等業(yè)界的佼佼者,都眾口一詞地認(rèn)為,"二十一世紀(jì)是語音的世紀(jì)",并為此從學(xué)術(shù)研究和應(yīng)用開拓各方面積蓄力量,希望在這幅美麗的圖畫中占據(jù)一席之地。

  在中國,語音和語言處理技術(shù)的研發(fā)略晚于國外。中國科學(xué)院聲學(xué)研究所的俞鐵城教授應(yīng)該說是中國最早涉足這一領(lǐng)域的人之一,他于1977年在《物理學(xué)報》發(fā)表了全國第一篇關(guān)于語音識別的論文。清華大學(xué)語音技術(shù)中心緊隨其后,語音界老前輩方棣棠教授、吳文虎教授于1979年創(chuàng)立語音技術(shù)中心(原名語音實驗室),現(xiàn)已有24年的歷史。隨后,全國各地從事這方面研究的機(jī)構(gòu)越來越多,比較著名的有清華大學(xué)電子工程系、中國科學(xué)院自動化研究所、中國科技大學(xué)、中國社會科學(xué)院語言研究所(在語音學(xué)研究方面,吳宗濟(jì)先生的起步更早)、北京大學(xué)、哈爾濱工業(yè)大學(xué)等等。在這些頂尖的學(xué)術(shù)機(jī)構(gòu)的帶動下,中國的語音和語言處理技術(shù)得到很大發(fā)展,并逐步在國際上引起注意。

  到上個世紀(jì)末這個世紀(jì)初,一些擁有自主知識產(chǎn)權(quán)的公司也相繼成立,包括得意音通、天朗語音、中科模式;科大訊飛、北京捷通華聲、炎黃新星等等。雖然國外許多公司,如Microsoft、IBM、Nuance、InfoTalk等,也都在盯著中國這個巨大的市場,然而國內(nèi)公司擁有獨特的優(yōu)勢:低成本、高性價比、可定制化程度高等,也取得了很好的成績,從而有足夠的條件與國外的公司進(jìn)行多方面的競爭以及合作。

  語音和語言處理涉及的技術(shù)包括很多方面。簡單地講有:(1)語音識別(ASR):把聲音變成文字(相當(dāng)于耳朵的功能);(2)語言理解(NLU):把文字變成語義(相當(dāng)于大腦之語言區(qū)的功能);(3)語音合成(TTS):把文字變成聲音(相當(dāng)于嘴巴的功能);(4)聲紋識別(VPR):通過聲音對人的身份進(jìn)行辨認(rèn)和/或確認(rèn)(耳朵的功能);……

  中國的學(xué)術(shù)界和產(chǎn)業(yè)界在這些領(lǐng)域都有很大的成績。清華大學(xué)智能技術(shù)和系統(tǒng)國家重點實驗室連續(xù)三次在全國國家重點實驗室評比中被評為A類(信息類國家重點實驗室的唯一),其屬下的清華大學(xué)語音技術(shù)中心,在以上四項技術(shù)有著20多年的研發(fā)積累;得意音通公司和清華大學(xué)語音技術(shù)中心有著密切合作關(guān)系,并致力于建立無縫"產(chǎn)學(xué)研"的通道,經(jīng)過努力,更是實現(xiàn)了以上四種技術(shù)的應(yīng)用編程接口(API)和軟件開發(fā)工具(SDK)。

  然而,"語音的世紀(jì)"除了蘊含無限的商機(jī)以外,也表明它們存在發(fā)展的空間。概括地講,有這樣一些問題急需解決:

  第一個是語音識別的方言和口音問題。中文有八大方言區(qū),現(xiàn)在很多語音識別系統(tǒng),對標(biāo)準(zhǔn)普通話的識別性能很好,但是一旦有方言或者口音,性能就會馬上下降。但是怎么攻克這個問題呢?這在國際上就是一個Open Issue。比如美國的自然科學(xué)基金(NSF)、國防高級研究規(guī)劃局(DARPA)和國防部(DoD)每年在美國的Johns Hopkins University (JHU)召開一次研討會。該研討會面向全世界,征集具有前瞻性的研究課題,全球較為知名的研究機(jī)構(gòu)或者企業(yè)都可以向它提交一些提案,希望和來自全球的專家一起共同研究以找到解決問題的方法。今年我提了一個提案就是關(guān)于方言和口音的問題,它在全球十幾家提案中勝出,并成為最終被選定的三四家之一,屆時將會有來自得意音通、清華大學(xué)、JHU、Microsoft、IBM、AT&T、科羅拉多大學(xué)、香港大學(xué)等的學(xué)者和業(yè)界人士一道去探討這一問題。這個問題之所有能夠勝出,說明它的重要性,也說明人們對它的關(guān)注,必須下力氣解決好這個問題。

  第二個是信道問題。我們知道在無線互聯(lián)應(yīng)用中,涉及到的信道種類可能會很多,比如固定電話、手機(jī)、IP、網(wǎng)絡(luò)、車載系統(tǒng)等等,各種各樣的信道都有不同的特性。語音識別、聲紋識別和語音理解怎么去適應(yīng)不同信道的差異呢?這是一個不得不面對的問題。我們既需要解決多信道的問題,也要解決跨信道的問題(在一個信道上學(xué)習(xí),在另一個信道上識別)。

  第三個問題,就是背景噪音。語音識別、聲紋識別、語音理解等系統(tǒng)往往在有背景噪音時就不能正常工作了,這是因為背景噪音破壞了原始語音的頻譜,或者說把原始語音部分或全部掩蓋在噪音當(dāng)中,因而無法準(zhǔn)確地分離出來的緣故。這個時候就得解決好背景噪音的問題,這也是我們在技術(shù)上面臨的挑戰(zhàn)之一。

  第四個是自然語音理解領(lǐng)域,我們也有很多的問題需要解決。我國很多學(xué)術(shù)單位在語言理解這方面都有很好的成就,比如北大的俞士汶教授、清華的黃昌寧教授(現(xiàn)在在微軟研究院)、東北大學(xué)的姚天順教授、北京語言大學(xué)的宋柔教授等等。和語音識別面臨的復(fù)雜的隨意發(fā)音現(xiàn)象類似,當(dāng)我們面對的不是語法比較規(guī)范、語序比較正常等的書寫文本的時候,語義的分析和理解就很困難了。我們必須有很好的理論和技術(shù)去解決口語語言現(xiàn)象,比如口語中的重復(fù)、改正、強(qiáng)調(diào)、倒敘、省略、拖音、韻律等等。

  第五個是語音合成。應(yīng)該說現(xiàn)在的語音合成技術(shù)做得相當(dāng)不錯,把一個文本給它以后,它能夠把聲音發(fā)出來,而且你感覺到還比較好。但是其中存在著一個很大的問題,就是它雖然對每一個音都發(fā)得很標(biāo)準(zhǔn),但是對一句話,你不敢非常有把握地說它做得非常自然。因為就一句話而言,牽涉到很多的問題:如韻律,不同的韻律有不同的意思;比如把"你好(問候)"說成"你好呀(譏諷)",就變了另外一個意思。所以在語音合成當(dāng)中,怎樣能夠很好地把感情色彩、情緒等正確地表達(dá)出來,也需要我們進(jìn)一步研究。這里面有一個問題首先要解決,就是必須先對這句話(甚至整個段落)進(jìn)行理解,理解之后才能夠知道如何把韻律加進(jìn)去,如何表達(dá)感情和情緒等。

  然而,和人類進(jìn)步過程中其他任何一種技術(shù)的發(fā)展歷程一樣,語音和語言處理技術(shù)在任何一個不同的成熟階段都有一個不同的應(yīng)用形式和不同的市場定位。在這種技術(shù)到市場再到技術(shù)的螺旋式上升的過程中,技術(shù)越來越成熟,市場也越來越成熟,從而讓技術(shù)更好地為人類服務(wù)。

中國的無線互聯(lián)業(yè)務(wù)及其新的增長點

  有人說,信息時代人和人之間的關(guān)系會越來越淡化,人和人的交往漸漸會被"人機(jī)"交往所取代。這雖然有點偏激卻不無道理,現(xiàn)實在印證著這一點。那些在網(wǎng)上有過親密接觸的年輕一代,那些遍布在城市各個角落的"大哥大"侃爺,那些在計算機(jī)面前時不時大笑不已的QQ族,那些低著頭差點撞到電線桿的手指操舞蹈者(打短信)……等等,都是在以自身的實際行動實踐、支持這一理論。

  在這種新的"人--機(jī)(網(wǎng))--人"交往模式中,無線互聯(lián)模式逐步成型并形成規(guī)模。無線互聯(lián)產(chǎn)業(yè)中,用戶、網(wǎng)絡(luò)運營商、設(shè)備和終端制造商、增值應(yīng)用服務(wù)商、內(nèi)容提供商相互關(guān)聯(lián)、共生共存,構(gòu)成完整的產(chǎn)業(yè)鏈。產(chǎn)業(yè)鏈良性循環(huán)是無線互聯(lián)產(chǎn)業(yè)成功的關(guān)鍵,圓滿解決用戶、電信運營商、內(nèi)容和服務(wù)提供商之間的利益關(guān)系是形成無線互聯(lián)事業(yè)良性循環(huán)的核心。產(chǎn)業(yè)價值鏈的基礎(chǔ)是為最終用戶提供更加便利和完善的服務(wù)。中國無線互聯(lián)產(chǎn)業(yè)發(fā)展最迫切、最重要也是終極的目標(biāo),就是要讓用戶享受到最好的應(yīng)用和服務(wù)。

  目前在無線互聯(lián)方面更多的是低層次的、點對點的。無論是用手機(jī)打電話,還是收發(fā)短信,更多的只是用戶之間通過網(wǎng)絡(luò)運營商進(jìn)行交互。那么是否可能把這種應(yīng)用的層次再提高一些呢?

  我們可以先看一下無線互聯(lián)產(chǎn)業(yè)鏈中用戶以外的其他環(huán)節(jié)。網(wǎng)絡(luò)運營商提供基本的數(shù)據(jù)通道,設(shè)備和終端制造商提供用戶使用的終端設(shè)備,而內(nèi)容提供商收集整理大量的、用戶感興趣的信息,由增值應(yīng)用服務(wù)商集成,可以為用戶提供非常豐富的多領(lǐng)域信息服務(wù)。

  我們看到,為了更好地服務(wù)用戶,中國移動、中國聯(lián)通相繼推出"移動夢網(wǎng)"和"聯(lián)通在線"角逐無線互聯(lián)市場。這兩家網(wǎng)絡(luò)運營商在無線互聯(lián)生存模式的探索中創(chuàng)造了各方有利的盈利模式,吸引了產(chǎn)業(yè)鏈各環(huán)節(jié)的積極參與。但是直到2002年初,他們在平臺的技術(shù)標(biāo)準(zhǔn)上互不相讓,致使兩網(wǎng)之間的互聯(lián)互通問題遲遲無法解決,各自都失去了數(shù)億元的業(yè)務(wù)量。經(jīng)過曠日持久的對峙,在主管部門的敦促和調(diào)和下,特別是在可觀的市場利益和強(qiáng)大的用戶壓力作用下,中國移動和中國聯(lián)通終于達(dá)成網(wǎng)間短消息互通協(xié)議。

  除此之外,這兩家無線網(wǎng)絡(luò)運營商忽視了處于這條產(chǎn)業(yè)鏈的核心地位所應(yīng)承擔(dān)的諸多責(zé)任,他們還沒有起到像日本NTT DoCoMo那樣的核心作用。NTT DoCoMo雖然從移動互聯(lián)市場的收入分成中只抽取很少的份額,但它作為整個鏈條的核心,承擔(dān)了大量的投入和銜接工作,扮演了產(chǎn)業(yè)鏈主宰者的角色,而中國移動和中國聯(lián)通在制定移動互聯(lián)產(chǎn)業(yè)鏈的游戲規(guī)則、技術(shù)標(biāo)準(zhǔn)方面雖然也做出了不少努力,但與NTT DoCoMo相比還存在著一些欠缺。

  NTT DoCoMo具備強(qiáng)大的對整個網(wǎng)絡(luò)的管理能力。運營商不只是單純地提供通信平臺,還要統(tǒng)攬全局,眾多的服務(wù)商和軟硬件提供商共生于一條產(chǎn)業(yè)鏈上,良莠不齊,需要運營商進(jìn)行判別和管理。其次,DoCoMo自身也通過合作等方式與銀行、音樂公司等聯(lián)合開展應(yīng)用服務(wù)。DoCoMo與幾百家銀行合作,用戶可以通過網(wǎng)上銀行轉(zhuǎn)賬、炒股;DoCoMo與相關(guān)機(jī)構(gòu)合作,提供地圖導(dǎo)航,如餐館、咖啡館、酒吧、泊車等實時信息,深受遠(yuǎn)足的旅客所喜愛。

  國外的經(jīng)驗給我們提供了很好的借鑒。隨著手機(jī)用戶的日益增長,運營商的利益空間將越來越大。雖然商機(jī)無限,運營商還是要在整個鏈條上給自己準(zhǔn)確定位,也只有承擔(dān)起更多的責(zé)任,創(chuàng)造出"多贏"的局面,才能最大程度上實現(xiàn)自身的利益。

  我們呼吁中國的網(wǎng)絡(luò)運營商能夠提供一個開放的平臺,這是實現(xiàn)多贏局面的根本。在一種開放的心態(tài)和平臺下,在這個產(chǎn)業(yè)鏈上任何一個環(huán)節(jié)做好了,對其他環(huán)節(jié)尤其是網(wǎng)絡(luò)運營商都是一個極大的促進(jìn),使其能夠得到更好的發(fā)展和鞏固。一個健康、良性的無線互聯(lián)產(chǎn)業(yè)鏈形成時,也就是中國的無線互聯(lián)產(chǎn)業(yè)"萬紫千紅春滿園"之際,可以把無線互聯(lián)應(yīng)用提高到一個更高的層次,創(chuàng)造更大的價值。

  設(shè)備和終端制造商不斷推出招人喜愛、功能豐富但小巧玲瓏的無線互聯(lián)設(shè)備,也讓人們越來越認(rèn)識到,在那些設(shè)備上,我們沒有鍵盤,或者鍵盤很。ㄖ挥袛(shù)字鍵盤),或者只有軟鍵盤(用觸摸屏),文字的輸入成為一個很大的障礙。用戶們呼喚自然語言,因為它是人機(jī)交互的最高境界,是人機(jī)交互最自然的方式。尤其是對中文,常見的多音字、同音字現(xiàn)象,制約著中文短信的輸入速度。得意音通公司提供了很好的解決方案,有基于拼音的整句輸入法、基于數(shù)字的整句輸入法、基于筆劃的整句輸入法,以及基于語音的輸入法,等等。這些技術(shù)既可以由增值服務(wù)提供商(如Sina等)集成到服務(wù)器中以間接服務(wù)用戶,也可以由設(shè)備和終端制造商集成到新型手機(jī)(如Nokia 9210、Dopoda等)中去直接服務(wù)用戶。

  另一方面,內(nèi)容提供商必須努力才能把用戶的點對點模式拓展到整個產(chǎn)業(yè)鏈,F(xiàn)今的無線互聯(lián),尚缺乏很好的內(nèi)容提供商,也沒有用到一些很好的解決方案讓用戶享受那些內(nèi)容。得意音通的語言理解技術(shù)可以為此提供技術(shù)保障。人們在享受點對點模式帶來的好處的同時,更希望能在任何時間、在任何場所、在任何設(shè)備享受到無線互聯(lián)服務(wù)帶來的好處。怎么去享受?

  舉一個例子說,旅游。一個人到一個新的城市,如北京,他想了解有關(guān)旅游的信息。但初來乍到,不知道在哪個地方去問。但他有手機(jī),他就可以用手機(jī)打到一個特服號碼。他可以直接用自然語言去問一個擁有海量信息的服務(wù)器:北京有哪些好玩的地方,哪些地方能夠提供很好的餐飲服務(wù),哪些地方可以購物,那些地方可以享受文化娛樂等等。用戶可以通過自然語言的方式享受周到的服務(wù)。在這樣的例子中,需要用到很多技術(shù),如語音識別、語言理解和語音合成;也需要多方面的參與,如網(wǎng)絡(luò)運營商、內(nèi)容提供商、增值服務(wù)提供商等。而如果要詢問交談狀況,比如我想問從清華大學(xué)到上地怎么走,那么就涉及到多家內(nèi)容提供商。首先必須有一個北京市的電子地圖,它給出北京市的道路、街道、建筑物、單位等靜態(tài)信息;其次還必須有交通部門的動態(tài)信息,它瞬時提供各個道路的交通擁擠情況。有了這兩個內(nèi)容提供商的內(nèi)容服務(wù),增值服務(wù)提供商就可以集成語音理解技術(shù)和數(shù)據(jù)計算技術(shù),動態(tài)給出最佳的行車路線。

  很顯然,在無線互聯(lián)產(chǎn)業(yè)鏈中,任何一環(huán)的發(fā)展和提升,都給用戶帶來極大的方便,也給自己和其他環(huán)節(jié)帶來利潤增長點。在產(chǎn)業(yè)鏈中,"單贏"是不能長久的;"多贏"才可以維護(hù)長期的、穩(wěn)定的、良性的局面。

  這種"多贏",有時是縱向貫串整個產(chǎn)業(yè)鏈,有時則跨平臺橫向聯(lián)合。Microsoft以及其他一些著名的國際大公司共同制定的SALT(Speech Application Language Tag)規(guī)范;Microsoft的.NET Speech以及其他公司的成熟的語音和語言處理技術(shù)等;……都為這種跨平臺的無線互聯(lián)應(yīng)用,提供了技術(shù)保證。人們有理由相信,在不遠(yuǎn)的將來,任何人、在任何時刻、在任何場所、在任何設(shè)備上,都可以通過自然語言方便瀏覽網(wǎng)頁、互相傳遞信息,實現(xiàn)無線互聯(lián)的目標(biāo)。

無線互聯(lián)在數(shù)字奧運中的商機(jī)

  北京申奧成功,不但給中國人爭了光,而且給中國帶來了"奧運經(jīng)濟(jì)"的大好契機(jī);而無線互聯(lián)產(chǎn)業(yè)也將面臨很大的商機(jī)。

  北京奧申委在申奧時莊嚴(yán)承諾,"在2008北京奧運,Any Time, Any Where, Any One, Any Device都能方便地獲取奧運的信息,分享奧運的喜悅。"《北京奧運行動規(guī)劃》中提出"到2008年,基本實現(xiàn)任何人、在任何時間、任何場所都能夠安全、方便、快捷、高效地獲取可支付得起的、豐富的、無語言障礙的、個性化的信息服務(wù)。"

  "數(shù)字奧運"將成為2008年北京奧運會的一大特色。屆時,來自全世界各個國家和地區(qū)的、說各種語言的運動員、教練員和體育官員,各自有各種不同的信息咨詢需求,我們需要提供各種不同的信息。比如有的想及時了解賽事的信息,有的可能想了解比賽場館的信息,有的想了解從住處到場館的交通路線信息,有的則想了解其他與競賽相關(guān)的信息。然而,除此之外,在運動員比賽完之后,運動員、教練員或體育官員,可能想在北京旅游、觀光、購物等等。我們需要提供一個很好的多語言的語音識別系統(tǒng)和智能信息查詢系統(tǒng)。

  這給我國的語音和語言處理技術(shù)的學(xué)術(shù)界及產(chǎn)業(yè)界提供很好的發(fā)展機(jī)會。我們面臨很多問題需要解決,比如多語言識別問題。然而更重要的是混合語言識別問題,這可能比多語言要麻煩一點。因為對多語言識別,你說日語,就提供日語的服務(wù);你說漢語,就提供漢語的服務(wù);你說英語,就提供英語的服務(wù);等等……這就是多語言。在實際情況下往往并不完全是這樣,有時是混合語言,比如他在說中文的時候突然夾雜兩個英文詞或日文詞,甚至兩三種語言混在一起。

  除了多語言和混合語言識別外,還有機(jī)器翻譯等。在奧運期間,世界上每一個國家都要來參加,語言是很多的,而賽事信息可能是用中文或英文存儲和處理的。有一個很好的做法就是有一個翻譯系統(tǒng),讓各種語言和中文或英文之間可以互譯。

  這就給無線互聯(lián)產(chǎn)業(yè)帶來很大機(jī)遇。圍繞體育賽事、北京旅游、北京購物、北京文化、航班查詢、飛機(jī)訂票等等,內(nèi)容提供商、設(shè)備和終端開發(fā)商、增值服務(wù)提供商等都有很多機(jī)會。

短信――中國特色的無線互聯(lián)業(yè)務(wù)

  我到過十幾個國家和地區(qū),我發(fā)現(xiàn)在無線互聯(lián)領(lǐng)域里,短信(Short Message)是一個非常具有中國特色的現(xiàn)象。短信在中國發(fā)展很快,僅在今年春節(jié)期間短信量就達(dá)到七八十億條,著實給產(chǎn)業(yè)界以很大的震動和驚喜。短信甚至成了中國一種特有的文化現(xiàn)象,大家通過短信聊天、對話、拜年、祝福,似乎成了一種新的時尚。

  中國的短信市場是一個很大的潛在市場。我覺得會有更大的發(fā)展。為什么呢?因為目前的短信只點對點的形式,是中低端形式。正如我剛才說的,現(xiàn)在牽涉到環(huán)節(jié)只有"用戶->運營商->用戶"。事實上還可以讓整個產(chǎn)業(yè)鏈更好地動起來。

  比如把內(nèi)容服務(wù)商加進(jìn)來,提供高考信息。每年在高考前后,不管考生本人也好,考生家長也好,都非常關(guān)心報志愿的情況、高考的情況。能不能通過某種形式把高考的信息、招生的信息搜集起來?這就是內(nèi)容服務(wù)商的工作。做完以后加上語言理解的技術(shù),就可以把這些信息提供給考生及其家長、親屬,做高考志愿的參謀,做高考成績、錄取消息的信鴿。這個產(chǎn)業(yè)會是很大的,中國的父母都望子成龍,為此他們不惜花錢;而作為短信這種最方便、最經(jīng)濟(jì)的方式,考生和家長將更愿意接受,所謂物美價廉。

  無線互聯(lián)給人類更自由的信息交流手段,擴(kuò)大了人們的行動空間;語音與語言技術(shù)讓人類以更自然、更直接的方式進(jìn)行交流,將創(chuàng)造出全新的思想空間。讓我們一起多進(jìn)行思想交流、碰撞,一起來實現(xiàn)我們的夢想。

得意音通公司供稿 CTI論壇編輯

相關(guān)鏈接:新浪“無線互聯(lián)”論壇第二期 清華大學(xué)計算機(jī)應(yīng)用專業(yè)博士鄭方聊天實錄



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺項目中標(biāo) 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測檢驗中心對《海量語音文件的目標(biāo)說話人篩選系統(tǒng)》進(jìn)行測試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類信息:  移動_與_語音識別ASR     文摘   行業(yè)_移動_新聞   技術(shù)_語音識別_文摘