欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

自然語言處理:讓機器善解人意

2019-04-26 11:26:31   作者:   來源:《營贏》   評論:0  點擊:


  華為諾亞方舟實驗室語音語義首席科學(xué)家劉群指出,隨著人類進(jìn)入智能時代,智能設(shè)備和數(shù)據(jù)量都空前增長,通過語音和語言進(jìn)行人機交互的需求也在急速增長,語音和自然語言處理領(lǐng)域?qū)⒂楷F(xiàn)更多有影響力的前沿研究和技術(shù)創(chuàng)新。
  自然語言是人類智慧的獨特表現(xiàn)。自然語言處理(Natural Language Processing,NLP)是計算機科學(xué)領(lǐng)域與人工智能領(lǐng)域的一個重要研究方向,旨在研究人機之間用自然語言進(jìn)行有效通信的理論和方法。根據(jù)Gartner發(fā)布的《2018世界人工智能產(chǎn)業(yè)發(fā)展藍(lán)皮書》,到2021年,全球自然語言處理市場的價值預(yù)計會達(dá)到160億美元。
  自然語言處理是AI皇冠上的明珠
  《營贏》:從整個科學(xué)領(lǐng)域的角度來考慮,您覺得自然語言處理的意義是什么?
  劉群:語言學(xué)是一門古老的學(xué)科,人類為什么會有語言?動物為什么沒有發(fā)展出人類這樣復(fù)雜高級的語言?語言機制是人類大腦中先天就有的,還是像其他能力一樣后天獲得的?語言是如何形成和發(fā)展的?語言本身服從一些怎樣的規(guī)律?無數(shù)的不解之謎等待著科學(xué)家來回答。
  計算語言學(xué),或者自然語言處理,既是一門科學(xué),也是一門應(yīng)用技術(shù)。從科學(xué)角度說,像其他計算機科學(xué)一樣,它是一種從模擬角度來研究語言的學(xué)科。自然語言處理并不直接研究人類語言的機制,而是試圖讓機器去模擬人類的語言能力。如果說計算機擁有了像人一樣的語言能力,從某種角度,我們就可以說,我們理解了人類的語言機制。由于理解自然語言需要關(guān)于外在世界的廣泛知識以及運用操作這些知識的能力,所以自然語言處理是一個人工智能完備(AI-complete)的問題,并被視為人工智能的核心問題之一。
  《營贏》:有人認(rèn)為“自然語言處理應(yīng)該是實現(xiàn)通用人工智能的關(guān)鍵挑戰(zhàn),得語言者得天下”,您怎么看?
  劉群:這句話有一定的道理。有人把人的智能分為三大類:感知智能、運動智能和認(rèn)知智能。
  第一,感知智能,包括聽覺、視覺、觸覺等;最近兩年,深度學(xué)習(xí)的引入大幅度提高了語音和圖像的識別率,所以計算機在感知智能層面已經(jīng)做得相當(dāng)不錯了,在一些典型的測試下,達(dá)到或者超過了人類的平均水平。
  第二,運動智能,指能夠在復(fù)雜的環(huán)境中自由行動的能力。運動智能是機器人研究的核心問題之一。
  第三,認(rèn)知智能屬于最高級的智能活動。動物也具有感知智能和運動智能,但在認(rèn)知智能方面,卻明顯低于人類。認(rèn)知智能是包括理解、運用語言的能力,掌握知識、運用知識的能力,以及在語言和知識基礎(chǔ)上的推理、規(guī)劃和決策能力。認(rèn)知智能中最基礎(chǔ)也是最重要的部分就是語言智能,研究語言智能的學(xué)科就是自然語言處理。
  自然語言處理的研究對象是人類語言,如詞語、短語、句子、篇章等。通過對這些語言單位的分析,我們不僅希望理解語言所表達(dá)的字面含義,還希望能理解說話人所表達(dá)的情感,以及說話人通過語言所傳達(dá)的意圖。沒有成功的自然語言處理,就不會有真正的認(rèn)知智能。
  自然語言理解和處理也是人工智能中最難的部分。比如一幅圖像,改變像素,或者一個局部,對整個圖像的內(nèi)容影響并不太大。但文字就不一樣了,很多情況下,一句話中改變一個字,意思會完全不一樣。
  很多人工智能/機器學(xué)習(xí)技術(shù),在圖像識別領(lǐng)域,已經(jīng)獲得了很大的成功,但在自然語言處理領(lǐng)域,還處于起步的階段。比如說,風(fēng)格的生成,F(xiàn)在人們很容易把一幅畫轉(zhuǎn)變成梵高的風(fēng)格,但要把一段話轉(zhuǎn)換成莎士比亞風(fēng)格,還沒有技術(shù)能夠做得很好。
  所以,有些學(xué)者把自然語言處理稱為“人工智能皇冠上的明珠”,是很有道理的,我非常認(rèn)同這種說法。
  自然語言處理的賽道
  《營贏》:您認(rèn)為目前自然語言處理面臨的最大問題是什么?
  劉群:我認(rèn)為自然語言處理今后面臨的主要問題是兩個。
  一是語義理解,或者說知識的學(xué)習(xí),或常識的學(xué)習(xí)問題。這是自然語言處理技術(shù)如何變得更“深”的問題。盡管常識的理解對人類來說不是問題,但是它卻很難被教給機器。比如我們可以對手機助手說“查找附近的餐館”,手機就會在地圖上顯示出附近餐館的位置。但你如果說“我餓了”,手機助手可能就無動于衷,因為它缺乏“餓了需要就餐”這樣的常識,除非手機設(shè)計者把這種常識灌入到了這個系統(tǒng)中。但大量的這種常識都潛藏在我們意識的深處,AI系統(tǒng)的設(shè)計者幾乎不可能把所有這樣的常識都總結(jié)出來,并灌入到系統(tǒng)中。
  二是低資源問題。所謂無監(jiān)督學(xué)習(xí)、Zero-shot學(xué)習(xí)、Few-shot學(xué)習(xí)、元學(xué)習(xí)、遷移學(xué)習(xí)等技術(shù),本質(zhì)上都是為了解決低資源問題。面對標(biāo)注數(shù)據(jù)資源貧乏的問題,譬如小語種的機器翻譯、特定領(lǐng)域?qū)υ捪到y(tǒng)、客服系統(tǒng)、多輪問答系統(tǒng)等,自然語言處理尚無良策。這類問題統(tǒng)稱為低資源的自然語言處理問題。對這類問題,我們除了設(shè)法引入領(lǐng)域知識(詞典、規(guī)則)以增強數(shù)據(jù)能力之外,還可以基于主動學(xué)習(xí)的方法來增加更多的人工標(biāo)注數(shù)據(jù),以及采用無監(jiān)督和半監(jiān)督的方法來利用未標(biāo)注數(shù)據(jù),或者采用多任務(wù)學(xué)習(xí)的方法來使用其他任務(wù),甚至其他語言的信息,還可以使用遷移學(xué)習(xí)的方法來利用其他的模型。這是自然語言處理技術(shù)如何變得更“廣”的問題。
  《營贏》:過去十年,自然語言處理領(lǐng)域影響最深遠(yuǎn)的研究是什么?
  劉群:答案很明確,就是深度學(xué)習(xí)技術(shù)的引入。
  基于深層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法從根本上改變了自然語言處理技術(shù)的面貌,把自然語言處理問題的定義和求解從離散的符號域搬到了連續(xù)的數(shù)值域,導(dǎo)致整個問題的定義和所使用的數(shù)學(xué)工具與以前完全不同,極大地促進(jìn)了自然語言處理研究的發(fā)展。
  在深度學(xué)習(xí)技術(shù)引入自然語言處理之前,自然語言處理所使用的數(shù)學(xué)工具跟語音、圖像、視頻處理所使用的數(shù)學(xué)工具截然不同,這些不同模態(tài)之間的信息流動存在巨大的壁壘。而深度學(xué)習(xí)的應(yīng)用,把自然語言處理和語音、圖像、視頻處理所使用的數(shù)學(xué)工具統(tǒng)一起來了,從而打破了這些不同模態(tài)信息之間的壁壘,使得多模態(tài)信息的處理和融合成為可能。
  總之,深度學(xué)習(xí)的應(yīng)用,使得自然語言處理達(dá)到了前所未有的水平,也使得自然語言處理應(yīng)用的范圍大大擴展。可以說,自然語言處理的春天已經(jīng)來臨。
  《營贏》:自然語言處理對框架乃至硬件層面提出了哪些獨特的需求呢?
  劉群:AI研究對硬件的需求是無止境的?梢哉f,貧窮限制了想象力,硬件限制了模型。只有在更好的硬件條件下,科學(xué)家才能嘗試更復(fù)雜的模型,才能發(fā)展出更新更好的方法。
  我不覺得自然語言處理對框架和硬件有獨特的需求,自然語言處理的需求跟其他AI研究的需求應(yīng)該是類似的,更多的內(nèi)存、更高的帶寬、更多的并行、更高的速度,永遠(yuǎn)都是需求的。有了這些,針對自然語言處理問題做一些特定的優(yōu)化,并不是太大的問題。
  《營贏》:2018年,學(xué)術(shù)界有哪些新的方法或者趨勢,讓您覺得會對自然語言處理的應(yīng)用產(chǎn)生新的影響?
  劉群:2018年自然語言處理研究領(lǐng)域最令人驚艷的成果是預(yù)訓(xùn)練語言模型,這包括基于RNN的Elmo和基于Transformer的GPT和Bert。預(yù)訓(xùn)練語言模型的成功充分證明了我們可以從海量的無標(biāo)注文本中學(xué)到大量潛在的知識,而無需為每一項自然語言處理任務(wù)都標(biāo)注大量的數(shù)據(jù)。
  在應(yīng)用方面,Google演示的Duplex技術(shù)讓人耳目一新。與此同時,國內(nèi)幾個公司提供的會議同聲翻譯技術(shù)也令人印象深刻,語音同傳雖然還有很多錯誤,與人類同聲傳譯相比還有很大差距,但其實用性已經(jīng)毋庸置疑。這項技術(shù)的實際應(yīng)用在幾年前還難以想象,在這么短時間內(nèi)就達(dá)到了現(xiàn)在這樣可以初步實用的水平,真是非常出乎意料。
  華為發(fā)力自然語言處理
  《營贏》:華為諾亞方舟實驗室在自然語言處理領(lǐng)域的技術(shù)布局包括哪些?取得了哪些進(jìn)展?
  劉群:華為諾亞方舟實驗室的自然語言處理研究主要包括三個大的方向:語音技術(shù)、機器翻譯和對話技術(shù)。
  諾亞方舟的自然語言處理技術(shù),已經(jīng)開始在華為的各種產(chǎn)品和服務(wù)中獲得廣泛的應(yīng)用。以大家日常使用的華為手機為例,華為的手機語音助手就集成了諾亞方舟的語音識別和對話技術(shù)。諾亞方舟的機器翻譯技術(shù)支持了華為內(nèi)部海量的技術(shù)資料的翻譯。諾亞方舟基于知識圖譜的問答技術(shù)為華為的全球技術(shù)支持系統(tǒng)(GTS),提供了快速準(zhǔn)確地回答復(fù)雜技術(shù)問題的能力。
  諾亞方舟實驗室的自然語言處理在研究方面也取得了突出的成果。我們在自然語言文本匹配、對話生成、神經(jīng)網(wǎng)絡(luò)機器翻譯方面的研究成果被研究者廣泛引用。在NIPS近五年來引用最多的50篇論文中就有一篇是我們的論文,在ACL近五年來應(yīng)用最高的20篇論文中也有我們的一篇論文、引用最高的30篇論文中有我們的3篇論文。
  《營贏》:聽覺、視覺結(jié)合的多模態(tài)是否會是自然語言處理未來很有前途的研究方向?華為是否已有這方面的研究了?
  劉群:是的。我們已經(jīng)開始在這一領(lǐng)域開展研究了。
  自然語言處理場景應(yīng)用產(chǎn)業(yè)化
  《營贏》:自然語言作為人類社會信息的載體,使得自然語言處理不只是計算機科學(xué)的專屬。自然語言處理如何能成為其他領(lǐng)域(如金融、法律、醫(yī)療健康等)的重要支撐技術(shù)?
  劉群:自然語言處理技術(shù)早已深入我們的日常生活。很多人都沒有意識到,我們每天都在享受自然語言處理技術(shù)提供的便利,比如,拼音輸入法。很多人大概有印象,20年前流行過五筆字型輸入法。但后來,拼音輸入法幾乎完全取代了五筆字型。
  其實當(dāng)年五筆字型流行的時候并非沒有拼音輸入法,那時的拼音輸入法智能程度非常低,用戶需要為每一個拼音從大量同音字中選擇正確的漢字,聯(lián)想功能也非常弱,輸入速度非常慢。只有到后來自然語言處理技術(shù)取得了長足的進(jìn)步,統(tǒng)計語言模型使得我們能夠為一長串的拼音自動選擇最可能的漢字序列,才使得拼音輸入法最終取代五筆字型,并占據(jù)了漢字輸入法的主導(dǎo)地位。
  另外,現(xiàn)在的搜索引擎也大量使用了自然語言處理技術(shù)。你在百度或者谷歌搜索“四川的人口”,搜索引擎除了給你一系列相關(guān)的網(wǎng)頁以外,還會直接給出一個具體的答案,這就用到了自然語言問答技術(shù)。
  在金融、法律、醫(yī)療健康等領(lǐng)域,自然語言處理技術(shù)也得到了越來越廣泛的應(yīng)用。在金融領(lǐng)域,自然語言處理可以為證券投資提供各種分析數(shù)據(jù),如熱點挖掘、輿情分析等,還可以進(jìn)行金融風(fēng)險分析、欺詐識別等。在法律領(lǐng)域,自然語言處理可以幫助進(jìn)行案例搜索、判決預(yù)測、法律文書自動生成、法律文本翻譯、智能問答等等。在醫(yī)療健康領(lǐng)域,自然語言處理技術(shù)更是有著廣闊的應(yīng)用前景,如病歷的輔助錄入、醫(yī)學(xué)資料的檢索和分析、輔助診斷等等,F(xiàn)代醫(yī)學(xué)資料浩如煙海,新的醫(yī)學(xué)手段、方法發(fā)展迅猛,沒有任何醫(yī)生和專家能夠掌握所有的醫(yī)學(xué)發(fā)展的動態(tài),自然語言處理可以幫助醫(yī)生快速準(zhǔn)確地找到各種疑難病癥最近的研究進(jìn)展,使得病人最快地享受醫(yī)學(xué)技術(shù)進(jìn)步的成果。
  《營贏》:自然語言的研究對普通人有什么影響,會給我們的生活帶來什么方便或沖擊?
  劉群:會讓大家的生活越來越方便。比如打客服電話,你不用再選擇一大堆的語音菜單。語音助手可以理解你的需求,貼心地幫你完成日常生活中的各種任務(wù)。機器甚至可以幫你寫報告、寫詩、寫情書等等。與此同時,技術(shù)的進(jìn)步也會給我們的生活帶來一些沖擊。比如就業(yè)方面,機器取代人工會造成一些人失業(yè)。但新技術(shù)的應(yīng)用讓一些職業(yè)消失的同時,又創(chuàng)造出大量新的就業(yè)機會。作為個人應(yīng)該主動積極地想辦法去適應(yīng)這種變化,而不是消極等待和抱怨。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)