智能輔助建模(也稱(chēng)為“OEC智能輔助建模”)將介紹如何利用機(jī)器學(xué)習(xí)算法和語(yǔ)義資源,輔助場(chǎng)景業(yè)務(wù)人員,自動(dòng)或半自動(dòng)化地構(gòu)建具體場(chǎng)景應(yīng)用中的OEC模型。本文是輔助建模系列文章的第一篇,將介紹輔助建模的概念、工具和基本功能。
一個(gè)場(chǎng)景模型示例
在下邊這個(gè)本體場(chǎng)景實(shí)例,是銀行領(lǐng)域客服投訴分析挖掘的場(chǎng)景本體模型,可用于對(duì)銀行客服投訴進(jìn)行自動(dòng)分析。輸入是客服投訴文本,是自然語(yǔ)言表示的文本,輸出結(jié)果是客服投訴的自動(dòng)分類(lèi)。
客服投訴模型,包括3部分:
1、本體模型:形式上由一個(gè)本體樹(shù)和領(lǐng)域模型構(gòu)成。本體樹(shù)是類(lèi)目體系的形式化描述,這里指客服投訴的分類(lèi)。領(lǐng)域模型,是本體樹(shù)對(duì)應(yīng)的推理規(guī)則的形式化描述,這里指客服投訴分類(lèi)相關(guān)的業(yè)務(wù)知識(shí)。領(lǐng)域模型支持兩種類(lèi)型:概念模型、機(jī)器學(xué)習(xí)預(yù)訓(xùn)練模型。上圖中的“本體表達(dá)式”,是概念模型的形式化規(guī)則,說(shuō)明客服投訴的業(yè)務(wù)知識(shí),一般是用“客服人員-態(tài)度-不好”這樣的三元組表示,其中“客服人員”是投訴對(duì)象要素,“態(tài)度”是投訴涉及的屬性要素,“不好”是投訴中對(duì)投訴對(duì)象涉及屬性的評(píng)價(jià)性描述。
2、要素模型:是對(duì)領(lǐng)域相關(guān)實(shí)體概念的形式化描述。這里指銀行領(lǐng)域相關(guān)投訴對(duì)象(對(duì)象要素)、投訴對(duì)象相關(guān)屬性(屬性要素)。如工作人員的對(duì)象要素,可包括下級(jí)要素,如“柜員、客服人員、保安、大堂經(jīng)理”等,工作人員的屬性要素,可包括下級(jí)要素如“態(tài)度、效率、業(yè)務(wù)水平”等。
3、概念模型:是對(duì)領(lǐng)域無(wú)關(guān)的語(yǔ)言概念的形式化描述。這里指對(duì)象和屬性的評(píng)價(jià)概念,如“不好、惡劣、怠慢”等。概念模型可理解為傳統(tǒng)意義上的語(yǔ)言資源形式化管理。
場(chǎng)景本體輔助建模
場(chǎng)景本體模型是業(yè)務(wù)知識(shí)的形式化表示,一般由業(yè)務(wù)人員主導(dǎo)構(gòu)建。面向場(chǎng)景應(yīng)用開(kāi)發(fā)的工具——DINFO-OEC平臺(tái),提供專(zhuān)業(yè)、方便、易用的建模IDE集成環(huán)境,支持場(chǎng)景化業(yè)務(wù)建模,可通過(guò)概念規(guī)則,構(gòu)建形式化的業(yè)務(wù)規(guī)則,也可通過(guò)數(shù)據(jù)標(biāo)注,指定機(jī)器學(xué)習(xí)(包括深度學(xué)習(xí))算法,來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型。建模工具支持兩種類(lèi)型領(lǐng)域模型。
為了提高建模效率,DINFO-OEC平臺(tái)也提供OEC智能輔助建模工具,支持利用機(jī)器學(xué)習(xí)算法,對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行自動(dòng)學(xué)習(xí)。輔助建模中涉及到的機(jī)器學(xué)習(xí)算法(包括深度學(xué)習(xí))、知識(shí)資源及各種功能模塊,均由DINFO-OEC平臺(tái)提供。
輔助建模工具
輔助建模工具,提供可視化輔助建模環(huán)境,支持業(yè)務(wù)人員通過(guò)拖拉拽的方式,實(shí)現(xiàn)各種建模操作。
輔助建模工具的3個(gè)分區(qū):
1、組件區(qū):在建模工具左下角。該區(qū)提供相關(guān)算法組件,如用于本體模型輔助的分類(lèi)聚類(lèi),用于要素模型、概念模型中的實(shí)體抽取,用于本體模型中本體表達(dá)式輔助的關(guān)聯(lián)發(fā)現(xiàn)、規(guī)則生成等組件。每個(gè)組件對(duì)可以對(duì)應(yīng)一個(gè)或多個(gè)算法,業(yè)務(wù)人員無(wú)須了解算法的具體細(xì)節(jié),只需要在輔助建模工具中拖拽組件(如分類(lèi)、聚類(lèi)組件),即可完成自動(dòng)聚類(lèi)的任務(wù)。組件區(qū)也提供建模常用操作,如選擇語(yǔ)料,可以選擇客服投訴語(yǔ)料來(lái)作為輔助建模的數(shù)據(jù)等。
2、建模區(qū):在建模工具左上方。該區(qū)支持業(yè)務(wù)人員將組件區(qū)的組件和操作,通過(guò)拖拉拽的方式,形成一個(gè)處理流程,用以實(shí)現(xiàn)多級(jí)建模。
3、結(jié)果區(qū):在建模工具右方。該區(qū)展示當(dāng)前流程的輸出結(jié)果,業(yè)務(wù)人員可對(duì)結(jié)果進(jìn)行合并、修改、刪除等操作。
輔助建模功能示例
以上述客服投訴模型為例,輔助建模工具在以下4個(gè)環(huán)節(jié)中,支持業(yè)務(wù)人員對(duì)客服投訴的文本數(shù)據(jù)進(jìn)行分析,提高客服投訴模型的建設(shè)效率:
1、分類(lèi)體系建模:針對(duì)本體模型中本體樹(shù)建設(shè),輔助自動(dòng)發(fā)現(xiàn)本體樹(shù)節(jié)點(diǎn)。
2、要素發(fā)現(xiàn):針對(duì)要素模型中要素樹(shù)建設(shè),輔助自動(dòng)發(fā)現(xiàn)客服投訴場(chǎng)景下的實(shí)體對(duì)象。
3、評(píng)價(jià)概念復(fù)用:針對(duì)概念樹(shù)中概念樹(shù)建設(shè),可直接復(fù)用平臺(tái)提供的語(yǔ)言資源。
4、本體表達(dá)式發(fā)現(xiàn):針對(duì)本體模型中,一個(gè)本體樹(shù)節(jié)點(diǎn)的業(yè)務(wù)規(guī)則,從客服投訴文本中,輔助發(fā)現(xiàn)要素與概念的組合關(guān)系,自動(dòng)形成本體表達(dá)式。
作者:晉耀紅博士,神州泰岳首席科學(xué)家,人工智能研究院院長(zhǎng),北京師范大學(xué)教授,博士生導(dǎo)師。