近日,鼎富科技董事長楊凱程先生受邀參加了2016中國呼叫中心與企業(yè)通信大會[http://www.yh9t5.com/expo/2016/ccec2016spring/index.htm],發(fā)表了《小富機(jī)器人:超越與夢想》的主題演講,分享了鼎富科技在智能機(jī)器人領(lǐng)域取得的進(jìn)展。以下是演講PPT及部分演講內(nèi)容摘錄:
小富是有著超越之處和夢想的機(jī)器人,希望能在明年CTI會議上親自和大家交流。
現(xiàn)在可以說機(jī)器人是無所不在,并且炙手可熱。AlphaGo與李世石的人機(jī)大戰(zhàn)勝利之后,微軟機(jī)器人、賢二法師先后都成了“網(wǎng)紅”。但作為專業(yè)人士,我們必須考慮什么樣的機(jī)器人才是我們工作和生活中需要的機(jī)器人?
答案就是需要我們的機(jī)器人做到機(jī)器無感。就是要和人溝通,要正確的理解,聽得懂我們在說什么,同時也要給我們一個正確的答案,這是未來我們需要的機(jī)器人,也是我們在人工智能挑戰(zhàn)的領(lǐng)域--認(rèn)知計算的革命。
認(rèn)知計算的革命已經(jīng)成為了業(yè)界焦點,眾多巨頭紛紛推出了自己在這個領(lǐng)域的的商業(yè)計劃:2016年3月1號,IBM推出一個新的概念叫認(rèn)知商業(yè),拳頭產(chǎn)品是Watson;3月30號微軟發(fā)布了微軟認(rèn)知服務(wù)和微軟機(jī)器人的框架;百度把搜索業(yè)務(wù)分離出成立了一個搜索公司,要專注于認(rèn)知技術(shù)。
這些說明了認(rèn)知是很重要的,它是解決機(jī)器人必須攻克、繞不過去的一個方向;同時也說明認(rèn)知計算的難度較大,與企業(yè)量級沒有必然聯(lián)系。而鼎富科技在認(rèn)知計算領(lǐng)域積累多年,擁有先發(fā)優(yōu)勢和豐富的平臺經(jīng)驗。
認(rèn)知計算沒有突破機(jī)器人會怎樣呢?現(xiàn)實中,我們在網(wǎng)上跟某家銀行的機(jī)器人聊天,往往是這個樣子:我們先問它“微信公眾號可辦理哪些信用卡業(yè)務(wù)”,它很聰明,可以給我們正確答案;但當(dāng)我們換了一個問法,“微信公眾號都可以辦理哪種業(yè)務(wù)?”結(jié)果它就不知道說什么了。同一個問題,換種問法,機(jī)器人就無法理解。
我們還可以問它“最后還款日(銀行業(yè)中有到期還款日的概念)未還款怎么辦?”它正確的回答了。我們再換一個方法來問,比如說“還款晚了一周有什么影響?”實際上是同一個問題,但機(jī)器就理解不了了。然后我們問“逾期還款不會怎么樣吧?”它說依舊沒理解我們的意思。認(rèn)知技術(shù)的最大挑戰(zhàn)在于自然語言的語義處理技術(shù)的突破,而中文的歧義性是一個繞不過去的問題。
機(jī)器人的后臺如同中式餐館的后廚都是十分辛苦的,需要有大量的人工把大家想知道的答案、知識先翻成Q&A,再把Q&A根據(jù)一個語言的模板填進(jìn)去,不停地填,填完以后機(jī)器人表達(dá)的效果還是達(dá)不到理想的狀態(tài)。因為我們很難用模板統(tǒng)一我們聊天的多樣性。而在認(rèn)知計算沒有突破時,機(jī)器人跟我們聊天做到機(jī)器無感是如此的艱難。
我們最可能突破的領(lǐng)域是深度學(xué)習(xí)。可是深度學(xué)習(xí)首先需要大量樣本,就是要跟它交談,不斷有知識跟它交談,交談還要學(xué)會新知識;其次還得好好教,一不小心不認(rèn)真教,教一些不好的東西很快就學(xué)會了,這就是所謂善良的數(shù)據(jù)。就像小孩,你找的老師不好就學(xué)壞了。當(dāng)你訓(xùn)練它的語料、樣本數(shù)據(jù)不一樣,訓(xùn)練出這個孩子長得一定不一樣。
目前深度學(xué)習(xí)在這些領(lǐng)域是最有可能突破的:互聯(lián)網(wǎng)上最多、最容易獲得大量樣本數(shù)據(jù)的領(lǐng)域,或者這些樣本數(shù)據(jù)不在互聯(lián)網(wǎng)上,但是在機(jī)構(gòu)內(nèi)部很容易獲得,而且特別易于積累的領(lǐng)域,就能取得深度學(xué)習(xí)的成功,并且是我們對機(jī)器人答案的專業(yè)性要求不會太高的領(lǐng)域。在這個領(lǐng)域里,典型的例子是度秘,度秘提供了一些東西,可以提供一些生活、美食等方面的。這也是現(xiàn)在聊天、聊生活、聊日常的機(jī)器人比較多,而聊專業(yè)機(jī)器人比較少的原因。
在專業(yè)領(lǐng)域,深度學(xué)習(xí)會遇到各種困難。首先行業(yè)的專業(yè)領(lǐng)域缺乏樣本大數(shù)據(jù)的支持,沒有那么多的樣本可供機(jī)器人學(xué)習(xí)。另一方面,專業(yè)領(lǐng)域不接受模糊的答案,應(yīng)答要求專業(yè)、準(zhǔn)確。第三個方面的挑戰(zhàn)是中文的歧義性。
這三個問題導(dǎo)致目前專業(yè)機(jī)器人行業(yè)面臨兩個較大的挑戰(zhàn):第一個就是知識學(xué)習(xí)的自動化,能不能做的讓機(jī)器自動把知識學(xué)進(jìn)去,省下大量的人力成本;第二就是應(yīng)答的準(zhǔn)確性,在一種比較開放的情況下聊天,機(jī)器人的回答要很專業(yè),要把握住含義。
鼎富科技通過大量基礎(chǔ)性的研究工作,克服了這些困難和挑戰(zhàn),在中文語義方面實現(xiàn)了突破,開發(fā)出了智慧語義認(rèn)知技術(shù)。這是鼎富科技成功開發(fā)小富機(jī)器人的主要原因。
一方面鼎富科技為了緊跟認(rèn)知計算的變革,另一方面行業(yè)客戶希望我們能給他們提供更好服務(wù),鼎富科技開發(fā)出了另一個專利產(chǎn)品--DINFO-OEC的分析挖掘平臺,這個平臺運用了智慧語義認(rèn)知技術(shù),客戶在應(yīng)用時只需要描述自己的業(yè)務(wù),就可以分析出描述內(nèi)容在170種情感計算后的表達(dá)的情感是什么。目前DINFO-OEC分析挖掘平臺已在金融、保險、證券、互聯(lián)網(wǎng)等行業(yè)有較好的應(yīng)用,是成熟、業(yè)界領(lǐng)先的技術(shù)。
運用智慧語義認(rèn)知技術(shù),鼎富科技自主研發(fā)的新一代知識庫產(chǎn)品:DINFO-UBKM統(tǒng)一業(yè)務(wù)知識庫系統(tǒng)。新一代知識庫實現(xiàn)了知識的自動入庫,不需要人加工知識,而是把各種形式的文檔直接給系統(tǒng),系統(tǒng)會自動地加工。另外支持自主學(xué)習(xí)、非結(jié)構(gòu)化數(shù)據(jù)分析加工、基于業(yè)務(wù)的知識圖譜的構(gòu)建,以及智能搜索技術(shù)--碎片化搜索。比如呼叫中心發(fā)現(xiàn)了一個問題,但是這個問題的知識分散在了很多段落里,碎片化知識的搜索能從各個段落直接搜出來,而不是像現(xiàn)在絕大多數(shù)的知識庫搜出一篇一篇的文章讓用戶閱讀。
使用DINFO-UBKM統(tǒng)一業(yè)務(wù)知識庫系統(tǒng),你只要搜索一句話,會通過啟發(fā)式搜索導(dǎo)引到段落最終的那一句。DINFO-UBKM讓我們的小富機(jī)器人未來應(yīng)對時不需要人工加工。
鼎富DINFO-UBKM統(tǒng)一業(yè)務(wù)知識庫系統(tǒng)解決了知識加工的業(yè)務(wù)導(dǎo)向難題。專業(yè)領(lǐng)域的業(yè)務(wù)具有三大特點:所有行業(yè)的業(yè)務(wù)相對穩(wěn)定、業(yè)務(wù)規(guī)則相對有限、業(yè)務(wù)表達(dá)相對規(guī)范。業(yè)務(wù)規(guī)則的表達(dá)是比較容易實現(xiàn),而知識表達(dá)有多樣性,知識無窮性,表達(dá)很靈活,同一個業(yè)務(wù)支持有很多種說法。因此我們就需要知識加工領(lǐng)域更多考慮業(yè)務(wù)建模,而不是直接對知識本身進(jìn)行業(yè)務(wù)處理,這樣就可以保證一次建模實現(xiàn)知識的自動加工。
另外,DINFO-UBKM系統(tǒng)目前至少可以支持27個國家語言的自動加工,客戶不需要用英文建立業(yè)務(wù)模型,只要用簡體中文做好業(yè)務(wù)建模即可,系統(tǒng)可以自動轉(zhuǎn)化為多國語言。
鼎富科技能夠?qū)崿F(xiàn)小富機(jī)器人的另一個條件是擁有鼎富客服大數(shù)據(jù)分析挖掘系統(tǒng)。該系統(tǒng)服務(wù)時,呼叫中心打電話進(jìn)去,客戶的坐席會把用戶說的話原封不動機(jī)器錄入,錄入了之后根據(jù)知識庫自動轉(zhuǎn)到5級、4級500個業(yè)務(wù)分類,準(zhǔn)確率可以達(dá)到95%,而且響應(yīng)是在毫秒。
鼎富客服大數(shù)據(jù)分析挖掘系統(tǒng)支持簡體中文建模,同時可以支持簡體、繁體、英文上線。每個工單打電話說話的內(nèi)容和它做的分類完全沒有關(guān)鍵字錄音關(guān)系,但我們的小富理解它的含義,所以面向業(yè)務(wù)時十分方便,而且該系統(tǒng)基本上沒有太多的回復(fù)。
另外,機(jī)器人在聊天溝通之后必須要大數(shù)據(jù)深度挖掘溝通內(nèi)容。還能進(jìn)行深度分析,不光分析投訴,還可以發(fā)現(xiàn)潛客,甚至支持市場的營銷活動,呼叫中心有反應(yīng)時,小富會隨時做一個響應(yīng)。順豐、工商銀行總行在2014年就上線了鼎富客服大數(shù)據(jù)分析挖掘系統(tǒng),實現(xiàn)了全部呼叫中心的工單分析挖掘。
對某家商業(yè)銀行的信用卡業(yè)務(wù)對比測試表明,小富機(jī)器人對于問題理解和答案相關(guān)性有顯著優(yōu)勢。
此次測試信用卡小富學(xué)了不到800個知識,該行有1500個專業(yè)知識,我們同時使用1800個問卷對該行現(xiàn)有機(jī)器人和小富機(jī)器人進(jìn)行測試,測試結(jié)果表明小富機(jī)器人百分之百回答了問題,現(xiàn)在的機(jī)器人只能實現(xiàn)60%-70%的準(zhǔn)確率。這些差別是問題對于答案準(zhǔn)確性的提升。
而同樣一個逾期的不同表述,小富機(jī)器人除了可以告訴你什么情況下會判定逾期。對于還款逾期的后果?晚還款會有什么影響?還款晚了一周怎么辦?逾期有沒有程度輕重之分?不同信用卡等判定逾期規(guī)則一樣嗎?等等問題,小富機(jī)器人都有準(zhǔn)確的回答。這是小富機(jī)器人在專業(yè)領(lǐng)域使用機(jī)器人帶來的顯著變化。
小富機(jī)器人還具有知識學(xué)習(xí)的自動化的優(yōu)勢。例如在信用卡業(yè)務(wù),客戶建立好業(yè)務(wù)規(guī)則的模型后,只要給小富一個相關(guān)銀行的業(yè)務(wù)文檔,不需要幫小富翻成Q&A,小富就會自動把這個章節(jié)分解成Q&A,同時會自動告訴客戶屬于的業(yè)務(wù)類別是收單、客戶用卡,對應(yīng)的業(yè)務(wù)還是還款的問題。它還可以給客戶相關(guān)的一些標(biāo)簽、知識項。所有這些東西都是機(jī)器自動學(xué)習(xí),它的后臺完全實現(xiàn)了自動化。
目前小富機(jī)器人是TO B,未來小富會變成個性化咨詢的機(jī)器人。屆時,小富將具備以下能力:一是從互聯(lián)網(wǎng)上和機(jī)器人之間將知識源源不斷學(xué)習(xí)的開放學(xué)習(xí)能力;二是個性化特征的學(xué)習(xí)能力,小富機(jī)器人可在回答客戶問題之后,把查到文章后面關(guān)心的知識點自動學(xué)習(xí)回來,它會把文章背后的含義幫客戶做上標(biāo)記,同時對多次關(guān)注文章進(jìn)行內(nèi)容聚合,給客戶打上個性化標(biāo)簽。
此外小富還將具有動態(tài)個性化知識庫構(gòu)建能力和基于較強的基于認(rèn)知計算的個性化溝通能力。例如,小富可以將懷孕相關(guān)的知識自動加工給客戶建立一個知識庫,出現(xiàn)了新款奶粉可以及時告知和推薦給用戶,實現(xiàn)機(jī)器人的個性化的溝通,真正像人的大腦一樣工作。鼎富科技有信心為小富機(jī)器人提供強大的技術(shù)支撐。
鼎富科技希望能在未來給大家?guī)硪豢钊碌男「粰C(jī)器人,它將成為專業(yè)領(lǐng)域最優(yōu)秀的人工智能解決方案之一,將會是大家工作和生活的好伙伴!讓大家的生活更美好!