視頻中,用戶在問第二個問題時,并沒有提到城市,但是客服機器人可以準(zhǔn)確回答珠海分行?头䴔C器人「機智過人」的背后,便是來自捷通華聲AI硬核技術(shù)——知識圖譜。
知識圖譜可以將非結(jié)構(gòu)化、結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)經(jīng)過知識抽取、知識融合、知識加工等方法構(gòu)建成有關(guān)聯(lián)關(guān)系的圖模型。知識圖譜由實體、關(guān)系和屬性三部分構(gòu)成,能夠非常清晰的體現(xiàn)不同實體之間的關(guān)系。在智能客服中,知識圖譜利用知識庫來輔助理解用戶問話內(nèi)容。
以上圖為例,張京的「職業(yè)」是翻譯,她的「國籍」是中國…在知識圖譜中,將客觀存在的「職業(yè)」和「國籍」等屬性關(guān)系,作為連接線,將張京與個人標(biāo)簽之間進(jìn)行連接。當(dāng)然,除此外,張京還有很多個人標(biāo)簽,比如畢業(yè)院校外交學(xué)院,漢族等等。
在現(xiàn)實世界中還存在很多隱性或復(fù)雜的關(guān)系。在客服領(lǐng)域,這種關(guān)系同樣存在,這就需要對各種關(guān)系不斷的挖掘,從而構(gòu)建龐大的知識圖譜,以便更好的服務(wù)用戶。
知識圖譜構(gòu)建
簡單來說,知識圖譜的構(gòu)建類和思維導(dǎo)圖非常相似,只要找到關(guān)聯(lián)關(guān)系,就可以將各個實體連接起來,主要包括知識抽取、知識融合及知識加工。
知識抽取
知識抽取就是從獲取到的各種原始數(shù)據(jù)中提取出實體、關(guān)系和屬性。知識抽取步驟所涉及的數(shù)據(jù)有非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。以非結(jié)構(gòu)化數(shù)據(jù)的關(guān)系抽取為例,可以分為開放領(lǐng)域關(guān)系抽取和限定領(lǐng)域三元組抽取。
- 限定領(lǐng)域關(guān)系抽取
限定領(lǐng)域三元組抽取是在一個或多個限定的領(lǐng)域內(nèi)對實體間的語義關(guān)系進(jìn)行抽取,即實體領(lǐng)域已做限制,如:
數(shù)據(jù):以下是鈞達(dá)股份在北京時間9月19日14:26分盤口異動快照:9月19日,鈞達(dá)股份盤中快速上漲,5分鐘內(nèi)漲幅超過2%,截至14點26分,報18.05元,成交3310.86萬元,換手率4.92%。
抽取結(jié)果:鈞達(dá)股份,漲跌幅,超過2%
- 開放領(lǐng)域三元組抽取
開放領(lǐng)域三元組抽取是依據(jù)模型對自然語言句子理解的結(jié)果進(jìn)行開放式抽取實體關(guān)系,即對實體領(lǐng)域不做限制,如:
數(shù)據(jù):7月19日,河南省自然資源廳地質(zhì)勘查處陳軍副處長協(xié)同自然資源部專家孟立山組成省廳地質(zhì)災(zāi)害防治調(diào)研組蒞臨方城縣調(diào)研指導(dǎo)工作。
抽取結(jié)果:河南省自然資源廳,副處長,陳軍
知識融合
知識抽取完成后,需要將不同類型實體信息進(jìn)行知識融合,即將不同知識庫的同一實體和同一屬性分別融合在一起。
- 屬性融合
把來自不同知識庫或名稱不同但表示特征相同的屬性進(jìn)行信息融合,將同一實體中等價的屬性進(jìn)行歸類統(tǒng)一,如:「注冊地,注冊地點,注冊地址」融合為「注冊地址」
- 實體融合
對表示同一個對象的多個實體之間構(gòu)建對齊關(guān)系,同時對實體包含的信息進(jìn)行融合和聚集。如:「捷通華聲,捷通華聲靈云,捷通華聲科技股份有限公司」屬性值相同融合。
知識加工
對知識圖譜進(jìn)一步補充擴展,形成更加靈活的知識大腦。
知識圖譜功能
捷通華聲的知識圖譜支持查詢實體或?qū)嶓w對應(yīng)屬性、查詢多個實體間的關(guān)聯(lián)關(guān)系,實現(xiàn)實體間的屬性值進(jìn)行計算,以及根據(jù)多個實體的屬性值進(jìn)行篩選等功能。
屬性查找
查詢實體或?qū)嶓w對應(yīng)屬性時,對于某一實體以及實體對應(yīng)的某種屬性進(jìn)行提問,返回其答案。例如當(dāng)圖譜數(shù)據(jù)為:姚明-身高-226cm
Q:姚明的身高是多少?
A:姚明的身高是226cm
關(guān)系查詢
查詢多個實體間的關(guān)聯(lián)關(guān)系時,對于多個實體之間的關(guān)聯(lián)關(guān)系提問,返回其關(guān)系。例如圖譜數(shù)據(jù)包括“葉惠美-兒子-周杰倫”和“周杰倫-妻子-昆凌”
Q:葉惠美和昆凌什么關(guān)系?
A:葉惠美的兒子是周杰倫,周杰倫的妻子是昆凌
插值計算
實現(xiàn)實體間的屬性值進(jìn)行計算,例如圖譜數(shù)據(jù)為“小明-年齡-5”和“小王-年齡-6”
Q:小王比小明大幾歲?
A:1歲
按值篩選
根據(jù)多個實體的屬性值進(jìn)行篩選,例如圖譜數(shù)據(jù)為“小明年齡5”,“小王年齡6”,以及“小洪年齡7”
Q:6歲以下的人有哪些?
A:小明,小王