7月9日,2021年世界人工智能大會,竹間智能成功舉辦了“AI智簡|認(rèn)知智能創(chuàng)科技未來”分論壇。論壇上,竹間智能創(chuàng)始人兼CEO簡仁賢先生發(fā)表了題為《認(rèn)知智能賦能企業(yè)轉(zhuǎn)型》的演講。他重點(diǎn)探討了認(rèn)知智能的基石——知識圖譜,環(huán)環(huán)相扣地闡述了知識圖譜的定義、優(yōu)勢、獨(dú)特能力與構(gòu)建原理,接著圍繞產(chǎn)業(yè)界極重視的大規(guī)模落地問題,結(jié)合具體例證及經(jīng)驗(yàn)心得,描繪了跨越眾多行業(yè)的不同應(yīng)用,最后針對企業(yè)在創(chuàng)新進(jìn)程中易陷入的兩難境地,為“Buy or Build”這個經(jīng)典難題給出了一個耐人尋味的答案。事不宜遲,立刻來品讀一下本次演講中最精華的部分。
演講要點(diǎn)
1.認(rèn)知智能的重要性
2.知識圖譜是認(rèn)知智能的基石
3.知識圖譜的突出優(yōu)勢
4.知識圖譜的四大能力
5.知識圖譜的構(gòu)建原理
6.認(rèn)知智能的實(shí)際應(yīng)用
7.洞悉未知,收獲意外之喜
8.企業(yè)科技創(chuàng)新的兩難之境
01 認(rèn)知智能的重要性
人工智能簡單來講分三個領(lǐng)域:一是機(jī)器視覺;二是ASR跟TTS,也就是語音識別;第三個部分是NLP相關(guān)領(lǐng)域,包括自然語言處理、意圖理解、情緒識別、對話交互和知識推理,還有自動閱讀理解,這部分是今天我要講的重點(diǎn)。
竹間智能一直以來關(guān)注的便是NLP自然語言處理。人跟人之間的對話基本都要靠語言,讓機(jī)器理解人類的自然語言表達(dá),就叫做自然語言處理技術(shù)。前面說的機(jī)器視覺跟語音辨識更多是屬于感知,而自然語言處理偏向于認(rèn)知。
大家為什么要學(xué)認(rèn)知智能?其實(shí)它在全世界各個高校的研究里面都是非常艱深的一個課題。我們這個世界現(xiàn)有的信息非常復(fù)雜,人們生活的方式也非常復(fù)雜,如果把整個世界當(dāng)做一個模型,會是什么樣的模型?假如沒有認(rèn)知智能與情感智能,你無法了解這個模型的運(yùn)作,無法理清人跟人之間的關(guān)系,無法把握人跟人之間共通的以及相互連接的部分。
對企業(yè)來說,隨著時代的發(fā)展,互聯(lián)網(wǎng)已經(jīng)變成了一個很常見的模型,是大家所生活的這個世界的一種表現(xiàn)方式。未來,個人的知識資產(chǎn)會決定個人的價值,企業(yè)的知識資產(chǎn)也將決定企業(yè)的價值。認(rèn)知智能可以幫助企業(yè)在未來的數(shù)字化變革潮流當(dāng)中加速業(yè)務(wù)發(fā)展,如果現(xiàn)在就開始積極采用認(rèn)知智能,那企業(yè)在三五年之后獲得的紅利,將遠(yuǎn)遠(yuǎn)超過那些沒有采用認(rèn)知智能的企業(yè)。如果你今天不行動,企業(yè)未來的盈利和運(yùn)營能力很可能會大大降低。
02 知識圖譜是認(rèn)知智能的基石
在認(rèn)知智能領(lǐng)域,知識圖譜是非常關(guān)鍵的技術(shù)。知識圖譜,顧名思義,就是用圖譜的形式對知識進(jìn)行表達(dá)和表示。能夠把知識圖譜技術(shù)開發(fā)好、應(yīng)用好,就可以產(chǎn)生更高的價值。
我用一個簡單的例子來解釋知識圖譜。先問大家一個問題:大熊貓有沒有尾巴?對這個問題,人會怎么回答?第一種,可能會回答:我去四川見過大熊貓,看到它有尾巴——這是感性記憶;另外一種回答可能是:由于大熊貓是哺乳動物,所以它有尾巴,這是理性推導(dǎo);還有一種是說,我以前回答過這個問題,所以答案應(yīng)該是怎樣的——這是斷言式的。以上這些是我們?nèi)祟惖幕卮,有多種邏輯,有不同的思考方式。
那如果是機(jī)器人,它會怎么回答?機(jī)器人沒見過大熊貓,除非你給他植入機(jī)器視覺。描述大熊貓有很多信息,這些信息都是非結(jié)構(gòu)化數(shù)據(jù),你寫出來的文字、你讀過的文檔都是非結(jié)構(gòu)化數(shù)據(jù),若沒有經(jīng)過處理和整理,你要花很多時間去讀、去看、去理解才行,但我們用知識圖譜將其轉(zhuǎn)變?yōu)楦拍罨谋硎痉绞,就會變成下面這個樣子:
然后,機(jī)器人就可以根據(jù)這個圖譜來回答你:很簡單,大熊貓有尾巴。如果各位用搜索引擎去解答這個問題,你可能找到很多文章,但你要自己去看內(nèi)容,才會知道大熊貓有沒有尾巴。有時候搜索引擎給你的還是不正確的信息。經(jīng)過語義理解和知識圖譜,你可以確認(rèn)大熊貓有尾巴,這是可追溯而且是可解釋的,是基于事實(shí)來回答的。這是知識圖譜可以做到的很簡單但很重要的事情。
03 知識圖譜的突出優(yōu)勢
知識圖譜能協(xié)助企業(yè)迎接形形色色的業(yè)務(wù)挑戰(zhàn)。第一,它可以幫助采集知識,包括業(yè)務(wù)知識、商業(yè)知識在內(nèi)的任何知識。IT行業(yè)發(fā)展了幾十年,我們囤積了巨量的非結(jié)構(gòu)化數(shù)據(jù),以PDF、Word、PPT等多種形式存在。這里面蘊(yùn)藏著豐富的知識,如果不挖掘出來,就毫無價值;如果能挖掘出來,就可以產(chǎn)生極大的作用——知識圖譜可實(shí)現(xiàn)這一點(diǎn)。
第二,知識圖譜有助于發(fā)現(xiàn)、整合和使用數(shù)據(jù)。它將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行連接,整體利用起來,能夠找出一些以前不為人知的知識。而且知識圖譜會持續(xù)性地發(fā)生改變,隨著知識的變化而變化。不同的時間段,有些知識會不一樣,我們稱之為“時序知識圖譜”。建立起這種時序性,才能更準(zhǔn)確地描述事實(shí)及使用知識。
另外一個是,知識圖譜能簡潔快速地回答復(fù)雜的業(yè)務(wù)問題。過去,企業(yè)積累了很多知識,知識跟知識之間存在直接或間接的關(guān)聯(lián),你可能要翻查多個系統(tǒng)或大量文檔才能解決問題,或者根本無法查到,如今,通過統(tǒng)一的知識圖譜的推理能力加上自然語言理解能力,可以更快地找到答案。
第四,知識圖譜技術(shù)可以讓AI更加高效。因?yàn)樗梢园褜?shí)體和實(shí)體之間的關(guān)系特征都梳理好,在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方面減少很多不必要的數(shù)據(jù)標(biāo)注以及訓(xùn)練,讓深度學(xué)習(xí)模型具備可解釋性,也可以輔助多任務(wù)的機(jī)器學(xué)習(xí),從而提升整體效率。這是知識圖譜的一大主要優(yōu)勢。
04 知識圖譜的四大能力
知識圖譜有四項(xiàng)重要能力,第一個是可推論,第二個是可關(guān)聯(lián),此外還有可解釋和可交付這兩大能力。
什么叫可推論呢?首先,知識圖譜可以從大量的數(shù)據(jù)中發(fā)掘出新的insights和patterns,發(fā)現(xiàn)信息之間的關(guān)聯(lián)性,這靠人力是做不到的。過去沒法形成大規(guī)模商業(yè)應(yīng)用,正是因?yàn)楹芏嗥髽I(yè)都是借助人工來構(gòu)建知識圖譜,沒辦法自動去發(fā)現(xiàn)和挖掘知識,導(dǎo)致它們處于冷封狀態(tài)。其次,知識圖譜可以用最自然的方式來挖掘珍貴數(shù)據(jù),而無需憑借關(guān)系型數(shù)據(jù)庫,這在是以前也是做不到的。你不用去總結(jié)一個關(guān)鍵詞來搜索,只要自然而然地發(fā)問就行了。此外,可推論能力有利于加速相關(guān)的調(diào)查研究流程,讓搜索范圍更大。
第二是可關(guān)聯(lián),這非常關(guān)鍵。知識圖譜用數(shù)據(jù)和概念的方式去呈現(xiàn)實(shí)體及實(shí)體間的關(guān)系,相當(dāng)于我們用自然語言的方式,將整個世界變成一個超大的模型。所有的圖譜里的所有實(shí)體,上下文中的內(nèi)容和內(nèi)涵,都是可關(guān)聯(lián)的,因而能夠找到一些平常難以發(fā)現(xiàn)的隱藏信息或連接。
第三是可解釋。知識圖譜的很多特征可以用到深度學(xué)習(xí)上面,使其變得可解釋。大家知道深度學(xué)習(xí)中的非監(jiān)督機(jī)器學(xué)習(xí),要一層一層抽絲剝繭地去訓(xùn)練,是不可解釋的,但是知識圖譜可以讓它變成可解釋的。而且圖譜具有豐富的特征數(shù)據(jù),能夠聯(lián)結(jié)各種數(shù)據(jù),從而將整個流程變得更大。
最后,知識圖譜是可交付的。它不像傳統(tǒng)數(shù)據(jù)庫,數(shù)據(jù)如孤島般分散,它可以將零散的數(shù)據(jù)連接起來,用簡單的方式,在中臺完成元數(shù)據(jù)的交付,我們稱之為Knowledge Fabric。
05 知識圖譜的構(gòu)建原理
2005年,我第一次接觸到RDF(Resource Description Framework,資源描述框架),深深受到了Tim Berners-Lee的影響。從那個時候起,我就認(rèn)為世界可以變成一張宏大的知識圖譜。一直到現(xiàn)在,我們有了機(jī)器學(xué)習(xí)和深度學(xué)習(xí),能夠處理大量的非結(jié)構(gòu)化數(shù)據(jù),才有辦法讓新一代的認(rèn)知技術(shù)適應(yīng)各種文檔和數(shù)據(jù),可以進(jìn)行交互。沒有自然語言處理與理解NLP與NLU,就沒有辦法做交互,那你縱使有知識也是無法利用的。
我們所說的多源異構(gòu)數(shù)據(jù),涵蓋PDF、PPT、Word、紙質(zhì)文檔,還有網(wǎng)絡(luò)上的信息。知識抽取主要是指抽取關(guān)系、抽取屬性、抽取事件,抽取完了以后進(jìn)行知識融合。知識融合方面,一個是做實(shí)體消岐,一個是做實(shí)體鏈接,另外還要做實(shí)體融合。先看是不是有一樣的實(shí)體可以對齊,如果有,那就將它們?nèi)诤掀饋,繼而進(jìn)行消岐,再創(chuàng)建鏈接,然后去補(bǔ)全、校正這些知識,這就形成了知識圖譜。這是一個循環(huán)的過程,整個知識圖譜會一直演進(jìn),越來越大,不斷更新。加上時間維度,它就變成了時序知識圖譜。
自監(jiān)督的實(shí)體消岐技術(shù)非常重要,我們通過已知的知識圖譜去學(xué)習(xí)不同實(shí)體之間的特征,可以自動構(gòu)建訓(xùn)練集、測試集,讓訓(xùn)練更快,如此一來人工標(biāo)注量會大大減少,甚至于不需要。另外一個焦點(diǎn)是推理的生成,我們通過NLP技術(shù)能夠抽取信息,從文本中構(gòu)建實(shí)體間的關(guān)系。
就自動構(gòu)建方面而言,NLP可以把任何的句子和詞都拆解成很小的元素,以此去構(gòu)建各種實(shí)體與屬性,從語義方面進(jìn)行解析,去發(fā)現(xiàn)他們之間的關(guān)系,解析完以后也可以建立一幅知識圖譜。
06 認(rèn)知智能的實(shí)際應(yīng)用
認(rèn)知技術(shù)該怎么落地?如果把它應(yīng)用到企業(yè)中?首先是看在當(dāng)前的業(yè)務(wù)流程里,可不可以找出一個清晰的四元組模型,囊括人、實(shí)體、地點(diǎn)、事件這四大元素。如果有,那這就是你落地的一個選擇。其次,要關(guān)注復(fù)雜有難度的業(yè)務(wù),不要考慮太簡單的業(yè)務(wù),挑選那些需要花很長時間、人力難以企及的場景,知識圖譜可以立竿見影取得極佳的效果。比如我們曾幫很多企業(yè)去實(shí)現(xiàn)文檔的查重、比對和抽取,靠人力是無法完成的。接著,找到合適的業(yè)務(wù)場景之后,就可以開始構(gòu)建MVP,分多個步驟,逐漸迭代,不要一次性把業(yè)務(wù)系統(tǒng)全部換掉。知識圖譜用不著推翻企業(yè)內(nèi)部結(jié)構(gòu),它是以企業(yè)知識為中心,將數(shù)據(jù)孤島統(tǒng)統(tǒng)連接起來。
未來,企業(yè)的實(shí)力取決于科技。競爭力強(qiáng)的企業(yè),經(jīng)過業(yè)務(wù)重構(gòu)之后會成為一家認(rèn)知智能企業(yè),享受認(rèn)知技術(shù)的便捷,而ERP、OA之類的平臺都只是工具罷了。竹間智能鉆研了6年,取得了一系列突破,如今,從原始文檔自動構(gòu)建知識圖譜,到對話機(jī)器人自動回答,只需要一個小時,就可以達(dá)到過去花6個月也無法達(dá)到的預(yù)期效果。
比如,在我們的產(chǎn)品界面上,先輸入一篇類風(fēng)濕免疫疾病的文檔,里面講了風(fēng)濕病的特征、癥狀、治療方式,然后經(jīng)過我們的平臺,自動生成標(biāo)簽,把關(guān)系、屬性、事件都抽取出來,建立三元組,隨后便可形成可視化的知識圖譜。如果有一萬篇文檔,那這幅圖譜就會變得相當(dāng)大。通過圖譜,你可以查詢、問答,找到自己想要的答案。它就如同一個大腦,不光是能開展簡單的Q&A。機(jī)器人馬上就可以調(diào)用這幅圖譜,直接回答你的提問。你查搜索引擎是沒法找到這樣的答案的,因?yàn)闄C(jī)器人是用自然語言理解的技術(shù)加上整個知識圖譜來進(jìn)行解答。
竹間已經(jīng)將自動構(gòu)建知識圖譜的技術(shù)產(chǎn)品化了,這個產(chǎn)品叫做Gemini,并可以大規(guī)模應(yīng)用。上面這個例子是落地在醫(yī)藥醫(yī)療行業(yè)的,你可以想象,制造、金融、保險、公共安全、城市管理等領(lǐng)域,亟待解決的問題有多少?而且,知識圖譜給出的答案都是正確的,不存在模棱兩可的現(xiàn)象,所以知識圖譜+語義理解,機(jī)器人把短文本NLP和長文本NLP結(jié)合起來,實(shí)現(xiàn)自動化應(yīng)用,即將顛覆常規(guī)的搜索引擎,來賦能于企業(yè)。將來,企業(yè)和人都不需要搜索引擎了,我們只需要一個載體——將知識圖譜跟對話輸出融合為一的載體就夠了。
07 洞悉未知,收獲意外之喜
剛才秀的只是一個小應(yīng)用,認(rèn)知智能的用途極其廣泛。比方說產(chǎn)品導(dǎo)購,可以讓你精確搜到自己想要的產(chǎn)品,而不是廣告。假設(shè)分析,就是“如果怎么樣,會怎么樣?”的問題,也能根據(jù)圖譜來回答。再是追蹤預(yù)警,采集人和事件之間的關(guān)系,看看能不能找出一些異常之處,然后提前預(yù)警。反欺詐也是一樣的,去監(jiān)測交易中是否存在欺詐行為,以降低損失。還有提供個性化的商品推薦,如今主流的邏輯是——你買過或者瀏覽過什么產(chǎn)品,商家就一天到晚給你推相似的東西,但在購物時最開心的其實(shí)是遇到驚喜,不遠(yuǎn)的未來,知識圖譜技術(shù)完全可以做到這一點(diǎn)。
360度繪制客戶畫像更是一個強(qiáng)大的應(yīng)用,可以全方位分析客戶的愛好、行為和反饋等。最近我們?yōu)橐患曳浅4蟮臒o人機(jī)公司定制了360度客戶畫像應(yīng)用,收集全網(wǎng)、全世界對于產(chǎn)品的反饋和使用情況,打造一個全方位的Voice Of Customer分析和洞察模型,據(jù)此找出產(chǎn)品的瑕疵和優(yōu)點(diǎn),揚(yáng)長避短,以便改進(jìn)產(chǎn)品與服務(wù)。
接下來,我們談一談各行各業(yè)的大規(guī)模落地情況。在保險業(yè),圍繞保單和保險人,有很多場景,全部可以用到知識圖譜。在房地產(chǎn)行業(yè),從地產(chǎn)開發(fā)到銷售到運(yùn)營,各環(huán)節(jié)日漸繁復(fù),知識圖譜能夠大顯身手。在醫(yī)療行業(yè),前面已經(jīng)展示過,患者即用戶,從治療方案到疾病診斷,知識圖譜都有用武之地。在物流業(yè),通過圖譜的計算能夠找到最短路徑、最低成本和最有效的方案。至于制造業(yè),是人工智能產(chǎn)值最高的行業(yè),所有的制造企業(yè)都在尋求智能化轉(zhuǎn)型,知識圖譜可以幫助解決生產(chǎn)、銷售、人員、流程、產(chǎn)品反饋等方方面面的問題,整合產(chǎn)業(yè)鏈的上中下游,填補(bǔ)斷層,直到觸達(dá)終端用戶。
知識圖譜可以清晰顯示數(shù)據(jù)之間的關(guān)系,它的最大價值是幫助人類發(fā)現(xiàn)未知,從大量的數(shù)據(jù)中發(fā)掘出你不知道的關(guān)聯(lián)——這就是驚喜,這就是我們目前所需要的。我們有太多重復(fù)性的信息,還有很多不知道的信息,都被鎖起來了,當(dāng)你把知識圖譜構(gòu)建起來后,就可以解鎖前所未見的景象。
08 企業(yè)科技創(chuàng)新的兩難之境
我們探討這些技術(shù),也非常希望把這些技術(shù)落地,唯有落地以后,才能看到它們產(chǎn)生的價值,看到它們可以創(chuàng)造收入、降低成本、提高營業(yè)效率,這樣才會吸引更多人把資金投入到學(xué)術(shù)研究中,然后開發(fā)出更多的技術(shù)。我覺得,竹間智能和其他一些人工智能公司所肩負(fù)的責(zé)任就是把所有技術(shù)都落地,營造一個認(rèn)知科學(xué)和NLP的產(chǎn)業(yè)生態(tài)圈,去刺激更多的投資。
然而在落地過程中,所有企業(yè)都會碰到創(chuàng)新的兩難困境。什么兩難困境呢?首先,我必須說,我對未來是滿懷希望的。竹間在過去幾年接觸了很多客戶,大約有300家大型標(biāo)桿客戶,我們發(fā)現(xiàn)絕大多數(shù)客戶項(xiàng)目負(fù)責(zé)人都是90后和85后,他們都非常有理想,渴望用科技創(chuàng)造真正的改變。不過他們往往會碰到一些古老的選擇難題——是該買(Buy)還是該自研(Build)?該用這家還是那家的產(chǎn)品?實(shí)施時是基于標(biāo)準(zhǔn)化軟件還是從零代碼起步打造?該用云服務(wù)還是用低代碼開發(fā)平臺?
碰到這些不同維度的問題,我總結(jié)了三個要素來幫大家做出判斷:第一個是AI平臺——什么樣的AI平臺才能讓你快速享受到技術(shù)帶來的紅利?此外,數(shù)據(jù)運(yùn)營也非常重要,好的技術(shù)、產(chǎn)品和平臺,只需要很少的人力來進(jìn)行運(yùn)營,達(dá)到低運(yùn)營的水準(zhǔn),讓人工不再是人工智能的絆腳石。第二個是場景定制。找到對的場景,才會看到效果,看到價值。你以前做不到的事,借助認(rèn)知技術(shù),馬上就能做到。人工智能是要顛覆過往,而非取代,是站在傳統(tǒng)的技術(shù)和系統(tǒng)上去創(chuàng)造新事物。還有就是價格。人工智能平臺不是越便宜就越好,對于成本和收益,企業(yè)要做一個評估,弄清楚自己的投入能不能得到充足的回報。
我們竹間智能的技術(shù),聽上去似乎很簡單,但實(shí)際上是很艱深的。有些企業(yè)覺得自己能獨(dú)立研發(fā),于是花大筆經(jīng)費(fèi),召集了一大群人,做了一兩年,最后卻發(fā)現(xiàn)沒辦法做出好的效果來,錯失了創(chuàng)新的契機(jī)。如果你只想用傳統(tǒng)的系統(tǒng),那部署RPA就夠了,我們也能幫企業(yè)提供RPA解決方案;然而,如果面對的是需要復(fù)雜信息、專業(yè)知識、快速決策的業(yè)務(wù),或者非常耗時耗力難以實(shí)現(xiàn)的,那就必須求助于認(rèn)知技術(shù)和NLP技術(shù)了。比如,你的數(shù)據(jù)分散在很多系統(tǒng)里,沒有辦法整合,只有靠知識圖譜才能解決。知識圖譜就像是一個企業(yè)的超級大腦,加上NLP就是一個企業(yè)級的操作系統(tǒng)。
所以,買還是自研?最后的答案就在這里。對于復(fù)雜且多樣的AI能力,特別是NLP這樣艱深、高門檻的技術(shù)領(lǐng)域,企業(yè)是沒有辦法從零開發(fā)的,難度非常高,何況底層平臺、能力平臺和場景解決方案現(xiàn)在都有人提供,有人幫著做了。那什么地方是需要企業(yè)自研的呢?我認(rèn)為是用戶體驗(yàn)。這不能假手于人,企業(yè)應(yīng)該花最多的時間,至少80%的時間在用戶體驗(yàn)上,去重構(gòu)業(yè)務(wù),實(shí)現(xiàn)定制化。發(fā)展新業(yè)務(wù),需要新技術(shù)支撐。有很多企業(yè),從上到下都要別人做,這是錯的,還有很多企業(yè),從上到下都想自己做,這也多是以失敗告終。
歸根結(jié)底,所有的技術(shù)和產(chǎn)品最終都是要落地經(jīng)受檢驗(yàn)的,不斷地驗(yàn)證積累才能大規(guī)模商用。以后,我們會將認(rèn)知科學(xué)和技術(shù)做進(jìn)一步的推廣,希望結(jié)合中外學(xué)術(shù)界及產(chǎn)業(yè)界,一起完善NLP行業(yè)和認(rèn)知智能行業(yè)!