語(yǔ)義分析指運(yùn)用各種方法,學(xué)習(xí)與理解一段文本所表示的語(yǔ)義內(nèi)容,任何對(duì)語(yǔ)言的理解都可以歸為語(yǔ)義分析的范疇。一段文本通常由詞、句子和段落來(lái)構(gòu)成,根據(jù)理解對(duì)象的語(yǔ)言單位不同,語(yǔ)義分析又可進(jìn)一步分解為詞匯級(jí)語(yǔ)義分析、句子級(jí)語(yǔ)義分析以及篇章級(jí)語(yǔ)義分析。一般來(lái)說(shuō),詞匯級(jí)語(yǔ)義分析關(guān)注的是如何獲取或區(qū)別單詞的語(yǔ)義,句子級(jí)語(yǔ)義分析則試圖分析整個(gè)句子所表達(dá)的語(yǔ)義,而篇章語(yǔ)義分析旨在研究自然語(yǔ)言文本的內(nèi)在結(jié)構(gòu)并理解文本單元(可以是句子從句或段落)間的語(yǔ)義關(guān)系。簡(jiǎn)單地講,語(yǔ)義分析的目標(biāo)就是通過(guò)建立有效的模型和系統(tǒng),實(shí)現(xiàn)在各個(gè)語(yǔ)言單位(包括詞匯、句子和篇章等)的自動(dòng)語(yǔ)義分析,從而實(shí)現(xiàn)理解整個(gè)文本表達(dá)的真實(shí)語(yǔ)義。
一、語(yǔ)義分析技術(shù)
(一)基礎(chǔ)技術(shù)
1.詞語(yǔ)級(jí)語(yǔ)義分析
詞匯層面上的語(yǔ)義分析主要體現(xiàn)在如何理解某個(gè)詞匯的含義,主要包含兩個(gè)方面:詞義消歧和詞義表示
。1)詞義消歧
詞匯的歧義性是自然語(yǔ)言的固有特征。詞義消歧根據(jù)一個(gè)多義詞在文本中出現(xiàn)的上下文環(huán)境來(lái)確定其詞義,作為各項(xiàng)自然語(yǔ)言處理的基礎(chǔ)步驟和必經(jīng)階段被提出來(lái)。詞義消歧包含兩個(gè)必要的步驟:(a)在詞典中描述詞語(yǔ)的意義;(b)在語(yǔ)料中進(jìn)行詞義自動(dòng)消歧。例如“蘋果”在詞典中描述有兩個(gè)不同的意義:一種常見(jiàn)的水果;美國(guó)一家科技公司。對(duì)于下面兩個(gè)句子:
她的臉紅得像蘋果。
最近幾個(gè)月蘋果營(yíng)收出現(xiàn)下滑。
詞義消歧的任務(wù)是自動(dòng)將第一個(gè)蘋果歸為“水果”,而將第二個(gè)蘋果歸為“公司”。從上面的例子中我們發(fā)現(xiàn),詞義消歧主要面臨如下兩個(gè)關(guān)鍵問(wèn)題:(a)詞典的構(gòu)建;(b)上下文的建模。
(2)詞義表示和學(xué)習(xí)
對(duì)于詞義表示,早期的做法將某個(gè)詞義表示為,從該詞義在同義詞網(wǎng)絡(luò)中出現(xiàn)的位置到該網(wǎng)絡(luò)根節(jié)點(diǎn)之間的路徑信息。詞義表示的另一個(gè)思路是將其數(shù)字化。最直觀,也是到目前為止最常用的詞表示方法是one-hot表示方法,這種方法把每個(gè)詞表示為一個(gè)很長(zhǎng)的向量。這個(gè)向量的維度是詞表大小,其中絕大多數(shù)元素為0,只有一個(gè)維度的值為1,這個(gè)維度就代表了當(dāng)前的詞。不難想象,這種表示方法存在一個(gè)重要的問(wèn)題:任意兩個(gè)詞之間都是孤立的。造成的結(jié)果是:光從兩個(gè)向量中看不出兩個(gè)詞是否有關(guān)系,即使這兩個(gè)詞是同義詞,例如“計(jì)算機(jī)”和“電腦”、“上海”和“上海市”。
隨著機(jī)器學(xué)習(xí)算法的發(fā)展,目前更流行的詞義表示方式是詞嵌入(Word Embedding,又稱詞向量)。其基本想法是:通過(guò)訓(xùn)練將某種語(yǔ)言中的每一個(gè)詞映射成一個(gè)固定維數(shù)的向量,將所有這些向量放在一起形成一個(gè)詞向量空間,而每一向量則可視為該空間中的一個(gè)點(diǎn),在這個(gè)空間上引入“距離”,則可以根據(jù)詞之間的距離來(lái)判斷它們之間的(詞法、語(yǔ)義上的)相似性。
2.句子級(jí)語(yǔ)義分析
句子級(jí)的語(yǔ)義分析試圖根據(jù)句子的句法結(jié)構(gòu)和句中詞的詞義等信息,推導(dǎo)出能夠反映這個(gè)句子意義的某種形式化表示。根據(jù)句子級(jí)語(yǔ)義分析的深淺,又可以進(jìn)一步劃分為淺層語(yǔ)義分析和深層語(yǔ)義分析。
(1)淺層語(yǔ)義分析
語(yǔ)義角色標(biāo)注(Semantic Role Labeling,簡(jiǎn)稱SRL)是一種淺層的語(yǔ)義分析。給定一個(gè)句子,SRL的任務(wù)是找出句子中謂詞的相應(yīng)語(yǔ)義角色成分,包括核心語(yǔ)義角色(如施事者、受事者等)和附屬語(yǔ)義角色(如地點(diǎn)、時(shí)間、方式、原因等)。
目前SRL的實(shí)現(xiàn)通常都是基于句法分析結(jié)果,即對(duì)于某個(gè)給定的句子,首先得到其句法分析結(jié)果,然后基于該句法分析結(jié)果,再實(shí)現(xiàn)SRL。
(2)深層語(yǔ)義分析
深層的語(yǔ)義分析(有時(shí)直接稱為語(yǔ)義分析,Semantic Parsing)不再以謂詞為中心,而是將整個(gè)句子轉(zhuǎn)化為某種形式化表示,例如:謂詞邏輯表達(dá)式(包括lambda演算表達(dá)式)、基于依存的組合式語(yǔ)義表達(dá)式(dependencybased compositional semantic representation)等。以下給出了GeoQuery數(shù)據(jù)集中的一個(gè)中英文句子對(duì),以及對(duì)應(yīng)的一階謂詞邏輯語(yǔ)義表達(dá)式:
中文:列出在科羅拉多州所有的河流
英文:Name all the rivers in Colorado
語(yǔ)義表達(dá)式:answer(river(loc_2(stateid('colorado'))))
雖然各種形式化表示方法采用的理論依據(jù)和表示方法不一樣,但其組成通常包括關(guān)系謂詞(如上例中的loc_2、river等)、實(shí)體(如colorado)等。語(yǔ)義分析通常需要知識(shí)庫(kù)的支持,在該知識(shí)庫(kù)中,預(yù)先定義了一序列的實(shí)體、屬性以及實(shí)體之間的關(guān)系。
3.篇章級(jí)語(yǔ)義分析
篇章是指由一系列連續(xù)的子句、句子或語(yǔ)段構(gòu)成的語(yǔ)言整體單位,在一個(gè)篇章中,子句、句子或語(yǔ)段間具有一定的層次結(jié)構(gòu)和語(yǔ)義關(guān)系,篇章結(jié)構(gòu)分析旨在分析出其中的層次結(jié)構(gòu)和語(yǔ)義關(guān)系。具體來(lái)說(shuō),給定一段文本,其任務(wù)是自動(dòng)識(shí)別出該文本中的所有篇章結(jié)構(gòu),其中每個(gè)篇章結(jié)構(gòu)由連接詞,兩個(gè)相應(yīng)的論元,以及篇章關(guān)系類別構(gòu)成。篇章結(jié)構(gòu)可進(jìn)一步分為顯式和隱式,顯式篇章關(guān)系指連接詞存在于文本中,而隱式篇章關(guān)系指連接詞不存在于文本中,但可以根據(jù)上下文語(yǔ)境推導(dǎo)出合適的連接詞。對(duì)于顯式篇章關(guān)系類別,連接詞為判斷篇章關(guān)系類別提供了重要依據(jù),關(guān)系識(shí)別準(zhǔn)確率較高;但對(duì)于隱式篇章關(guān)系,由于連接詞未知,關(guān)系類別判定較為困難,也是篇章分析中的一個(gè)重要研究?jī)?nèi)容和難點(diǎn)。
(二)深度學(xué)習(xí)技術(shù)
在深度學(xué)習(xí)技術(shù)中,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNNs)被證明在自然語(yǔ)言處理中是最有效的,下面將介紹循環(huán)神經(jīng)網(wǎng)絡(luò)。
RNNs的目的是使用序列來(lái)處理數(shù)據(jù)。在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型中,是從輸入層到隱含層再到輸出層,層與層之間是全連接的,每層之間的節(jié)點(diǎn)是無(wú)連接的。但是這種普通的神經(jīng)網(wǎng)絡(luò)對(duì)于很多問(wèn)題卻無(wú)能無(wú)力。例如,你要預(yù)測(cè)句子的下一個(gè)單詞是什么,一般需要用到前面的單詞,因?yàn)橐粋(gè)句子中前后單詞并不是獨(dú)立的。RNNs之所以稱為循環(huán)神經(jīng)網(wǎng)路,即一個(gè)序列當(dāng)前的輸出與前面的輸出也有關(guān)。具體的表現(xiàn)形式為網(wǎng)絡(luò)會(huì)對(duì)前面的信息進(jìn)行記憶并應(yīng)用于當(dāng)前輸出的計(jì)算中,即隱藏層之間的節(jié)點(diǎn)不再無(wú)連接而是有連接的,并且隱藏層的輸入不僅包括輸入層的輸出還包括上一時(shí)刻隱藏層的輸出。理論上,RNNs能夠?qū)θ魏伍L(zhǎng)度的序列數(shù)據(jù)進(jìn)行處理。但是在實(shí)踐中,為了降低復(fù)雜性往往假設(shè)當(dāng)前的狀態(tài)只與前面的幾個(gè)狀態(tài)相關(guān)。
RNNs已經(jīng)在實(shí)踐中被證明對(duì)NLP是非常成功的。如詞向量表達(dá)、語(yǔ)句合法性檢查、詞性標(biāo)注等。在RNNs中,目前使用最廣泛、最成功的模型便是LSTMs(Long Short-Term Memory,長(zhǎng)短時(shí)記憶模型)模型,該模型通常比vanillaRNNs能夠更好地對(duì)長(zhǎng)短時(shí)記憶模型依賴進(jìn)行表達(dá),該模型相對(duì)于一般的RNNs,只是在隱藏層做了手腳。
RNNs可以應(yīng)用于語(yǔ)言模型與文本生成、文本分類、機(jī)器翻譯等自然語(yǔ)言處理任務(wù)中。
二、面向業(yè)務(wù)建模的語(yǔ)義分析
。ㄒ唬〥INFO-OEC平臺(tái)介紹
DINFO-OEC非結(jié)構(gòu)化大數(shù)據(jù)分析挖掘平臺(tái),是中科鼎富(北京)科技發(fā)展有限公司研發(fā)的大數(shù)據(jù)產(chǎn)品,具有非結(jié)構(gòu)化文本大數(shù)據(jù)的分析、挖掘的超凡能力,是企業(yè)實(shí)施大數(shù)據(jù)戰(zhàn)略的強(qiáng)大利器。
大數(shù)據(jù)中80%都是非結(jié)構(gòu)化大數(shù)據(jù),非結(jié)構(gòu)化大數(shù)據(jù)因其中的業(yè)務(wù)對(duì)象、對(duì)象之間的關(guān)系等都蘊(yùn)含在文本內(nèi)容中,而文本內(nèi)容來(lái)源繁多、表達(dá)方式靈活多樣、存在著大量的歧義性,因此無(wú)法使用傳統(tǒng)的BI工具等進(jìn)行分析,無(wú)法直接服務(wù)于業(yè)務(wù),實(shí)現(xiàn)業(yè)務(wù)價(jià)值。非結(jié)構(gòu)化大數(shù)據(jù)是大數(shù)據(jù)處理的難點(diǎn)和熱點(diǎn)。DINFO-OEC平臺(tái)支持三位一體的多維度業(yè)務(wù)建模能力,結(jié)合自然語(yǔ)言處理、深度學(xué)習(xí)等統(tǒng)計(jì)文本挖掘算法,基于平臺(tái)立體式的業(yè)務(wù)模型的智能語(yǔ)義感知技術(shù),提供對(duì)非結(jié)構(gòu)化大數(shù)據(jù)智能理解與自動(dòng)化處理能力,實(shí)現(xiàn)文本知識(shí)的多維度的業(yè)務(wù)標(biāo)簽標(biāo)記功能,將無(wú)序的非結(jié)構(gòu)化信息轉(zhuǎn)換為滿足業(yè)務(wù)需求的結(jié)構(gòu)化數(shù)據(jù)。DINFO-OEC平臺(tái)支持與主流Hadoop、Spark等大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)對(duì)接,利用hadoop平臺(tái)提供的分布式存儲(chǔ)和Map/Reduce分布式計(jì)算能力,實(shí)現(xiàn)復(fù)雜、批量的大數(shù)據(jù)分析挖掘。利用Spark、kafka等提供的實(shí)時(shí)分布式計(jì)算能力,提供海量數(shù)據(jù)的實(shí)時(shí)分析計(jì)算能力,融合主流的搜索引擎技術(shù),支持基于海量歷史數(shù)據(jù)的交互式搜索功能。DINFO-OEC平臺(tái)支持與常用的商業(yè)智能系統(tǒng)進(jìn)行融合,實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的融合分析挖掘,最大化的挖掘大數(shù)據(jù)的業(yè)務(wù)價(jià)值,提供大數(shù)據(jù)分析挖掘支持下的業(yè)務(wù)創(chuàng)新。
(二)業(yè)務(wù)建模
業(yè)務(wù)建模技術(shù),采用神州泰岳獨(dú)創(chuàng)的“本體O-要素E-概念C”三位一體的專利技術(shù)(發(fā)明專利號(hào)201410155830.1)進(jìn)行建模,將業(yè)務(wù)和語(yǔ)言分為兩個(gè)不同層次建模。業(yè)務(wù)建模以本體論為核心,對(duì)業(yè)務(wù)知識(shí)進(jìn)行規(guī)劃,對(duì)業(yè)務(wù)規(guī)則進(jìn)行建模配置,形成形式化的業(yè)務(wù)規(guī)則。業(yè)務(wù)建模技術(shù)支持業(yè)務(wù)與非結(jié)構(gòu)化數(shù)據(jù)的語(yǔ)言表達(dá)分離,區(qū)分業(yè)務(wù)層次和語(yǔ)言層次進(jìn)行分部建模。業(yè)務(wù)層次支持業(yè)務(wù)本體構(gòu)建,支持業(yè)務(wù)要素發(fā)現(xiàn)與配置;語(yǔ)言層次支持語(yǔ)言概念的構(gòu)建與維護(hù),支持常用詞匯庫(kù)和同義庫(kù)等建設(shè)。DINFO-OEC業(yè)務(wù)建模價(jià)值在于客戶只需關(guān)注自身業(yè)務(wù)的描述,文本表示的多樣性和歧義性等由系統(tǒng)來(lái)負(fù)責(zé)解決。
。ㄈ┢脚_(tái)特點(diǎn)
1.超凡的面向業(yè)務(wù)的非結(jié)構(gòu)化數(shù)據(jù)建模能力
DINFO-OEC業(yè)務(wù)建模,能把紛繁復(fù)雜的業(yè)務(wù)規(guī)則和靈活多樣的語(yǔ)言表達(dá)習(xí)慣進(jìn)行統(tǒng)一建模,從本體、要素和概念三個(gè)維度構(gòu)建分析挖掘模型,有效地將“業(yè)務(wù)”描述與自然語(yǔ)言的表達(dá)進(jìn)行分離,使得業(yè)務(wù)人員可以專注于自己擅長(zhǎng)的業(yè)務(wù)需求及業(yè)務(wù)規(guī)則的建模,而無(wú)需考慮自然語(yǔ)言的歧義性、表達(dá)的多樣性和復(fù)雜性等。
2.強(qiáng)大的非結(jié)構(gòu)化分析挖掘能力
產(chǎn)品支持智慧語(yǔ)義感知算法,提供強(qiáng)大的自然語(yǔ)言理解相關(guān)分析算法,包括內(nèi)容分類、聚類、主題分析、語(yǔ)義分析、實(shí)體識(shí)別、啟發(fā)式搜索引擎、推薦引擎、摘要引擎等。
產(chǎn)品支持多種分析挖掘算法,包括C計(jì)算(提供概念的抽取、概念表達(dá)式挖掘、概念表達(dá)式匹配算法),S計(jì)算(提供常用的統(tǒng)計(jì)挖掘算法,包括但是不限于KNN、SVM、決策樹等算法)和R計(jì)算(提供概念關(guān)聯(lián)發(fā)現(xiàn)算法)。
3.豐富的多語(yǔ)種分析挖掘支持能力
系統(tǒng)內(nèi)置了多語(yǔ)種分析挖掘算法。利用一套算法流程,實(shí)現(xiàn)多語(yǔ)種支持,語(yǔ)種擴(kuò)展性好。新增加語(yǔ)種,不用修改算法。
多語(yǔ)種復(fù)用的能力。平臺(tái)支持多語(yǔ)種業(yè)務(wù)規(guī)則保持一致的能力。業(yè)務(wù)規(guī)則(對(duì)應(yīng)系統(tǒng)的本體樹)的維護(hù),只需維護(hù)中文簡(jiǎn)體版,無(wú)須維護(hù)其他語(yǔ)種的本體樹,大大減少本體樹維護(hù)工作推出的工作量。
4.卓越的大數(shù)據(jù)計(jì)算與存儲(chǔ)平臺(tái)集成能力
支持主流的Hadoop平臺(tái),支持Map/Reduce批量計(jì)算以及Spark實(shí)時(shí)計(jì)算,支持HDFS、Hbase、kafka等存取。支持的Hadoop平臺(tái)包括Apache Hadoop、IBM BigInsights、華為Fusion Insights、EMC PivotalHD。支持SOA集群架構(gòu),支持與Oracle、Mysql、DB2等主力數(shù)據(jù)庫(kù)產(chǎn)品集成。
三、語(yǔ)義分析應(yīng)用
。ㄒ唬┙鹑谛袠I(yè)應(yīng)用
人工智能的飛速發(fā)展,使得機(jī)器能夠在很大程度上模擬人的功能,實(shí)現(xiàn)批量人性化和個(gè)性化地服務(wù)客戶,這將給身處服務(wù)價(jià)值鏈高端的金融行業(yè)帶來(lái)深刻影響,人工智能將成為決定銀行溝通客戶、發(fā)現(xiàn)客戶金融需求的重要因素。它將對(duì)金融產(chǎn)品、服務(wù)渠道、服務(wù)方式、風(fēng)險(xiǎn)管理、授信融資、投資決策等帶來(lái)新一輪的在中臺(tái)支持授信、各類金融交易和金融分析中的決策,在后臺(tái)用于風(fēng)險(xiǎn)防控和監(jiān)督,它將大幅改變金融現(xiàn)有格局,金融服務(wù)(銀行、保險(xiǎn)、理財(cái)、借貸、投資等方面)將更加地個(gè)性化與智能化。證券研報(bào)大數(shù)據(jù)云服務(wù),是鼎富科技針對(duì)證券業(yè)、基金業(yè)研究人員、分析師推出的一款大數(shù)據(jù)云服務(wù)產(chǎn)品。系統(tǒng)提供SaaS服務(wù),提供公告、研報(bào)的全網(wǎng)采集,以及事件結(jié)構(gòu)化分析,提供研報(bào)一站式智能搜索,以及基于時(shí)間軸、基于信息錨點(diǎn)的大數(shù)據(jù)分析挖掘。系統(tǒng)能幫助分析師從大數(shù)據(jù)視角進(jìn)行深度研究分析,提高工作效率。
。ǘ┱袠I(yè)應(yīng)用
輿情分析為政府、公安、社會(huì)等提供可自定義熱點(diǎn)問(wèn)題的輿情分析系統(tǒng),信息出現(xiàn)的源頭到產(chǎn)生的影響全程跟進(jìn)分析,形成輿情影響波及范圍、公眾反響、不良輿論等內(nèi)容的分析報(bào)告。
輿情分析能夠大幅度縮短組織對(duì)互聯(lián)網(wǎng)、論壇等電子信息渠道的公眾輿論趨勢(shì)的響應(yīng)時(shí)間,通過(guò)關(guān)聯(lián)分析能夠幫助組織預(yù)測(cè)未來(lái)可能出現(xiàn)的狀況并提前實(shí)施相關(guān)措施。
智慧傳播云服務(wù),是鼎富科技與騰訊網(wǎng)合作推出的互聯(lián)網(wǎng)信息監(jiān)測(cè)預(yù)警平臺(tái),面向政府機(jī)構(gòu)、企事業(yè)單位提供互聯(lián)網(wǎng)信息監(jiān)測(cè)、預(yù)警服務(wù)。輿情云項(xiàng)目的研發(fā)目的是為企業(yè)、政府、組織開發(fā)一款基于云服務(wù)的互聯(lián)網(wǎng)輿情監(jiān)測(cè)系統(tǒng)。該系統(tǒng)數(shù)據(jù)采集模塊具有可配置、自動(dòng)去重、垃圾過(guò)濾核心功能。系統(tǒng)分析挖掘功能采用智慧語(yǔ)義識(shí)別技術(shù),保證了語(yǔ)義分析的準(zhǔn)確性。系統(tǒng)可以按照客戶需求進(jìn)行輿情監(jiān)測(cè)定制、統(tǒng)計(jì)報(bào)表定制和預(yù)警定制。
。ㄈ┛头袠I(yè)應(yīng)用
客服作為勞動(dòng)密集型行業(yè),對(duì)于一些大公司來(lái)說(shuō),成本依然很高。智能機(jī)器人客服的出現(xiàn)可以在很大程度上解決簡(jiǎn)單、重復(fù)性工作,幫助企業(yè)節(jié)省人工和坐席成本,提升運(yùn)營(yíng)效率。
小富機(jī)器人4.0是神州泰岳旗下一款智能客服機(jī)器人,它將開啟全媒體時(shí)代的智能客服中心。小富機(jī)器人4.0有以下幾個(gè)亮點(diǎn):
亮點(diǎn)一:首創(chuàng)業(yè)務(wù)場(chǎng)景機(jī)器人
讓機(jī)器人服從業(yè)務(wù),而非業(yè)務(wù)屈從于機(jī)器人。客服、營(yíng)銷、外呼等業(yè)務(wù),場(chǎng)景不同,業(yè)務(wù)邏輯也不同。小富4.0預(yù)設(shè)多種場(chǎng)景模式的業(yè)務(wù)框架,對(duì)應(yīng)的知識(shí)類型和交互方式也有區(qū)分設(shè)計(jì),可提供更專業(yè)、更具針對(duì)性的智能化服務(wù)。
亮點(diǎn)二:整體性業(yè)務(wù)建模更具延展性
基于對(duì)業(yè)務(wù)的整體理解,而非Q&A的堆積;趯(duì)具體場(chǎng)景的深刻業(yè)務(wù)理解,進(jìn)行整體建模,具有完整的業(yè)務(wù)邏輯,機(jī)器人的思維延展性和可復(fù)用性大大增強(qiáng),應(yīng)答效率更高。
亮點(diǎn)三:差異化的知識(shí)類型表達(dá)體系
智能引導(dǎo)多輪會(huì)話,而非預(yù)設(shè)問(wèn)題的反復(fù)跳轉(zhuǎn)。小富4.0的業(yè)務(wù)知識(shí)體系化,并具有記憶能力,可基于業(yè)務(wù)邏輯自創(chuàng)造問(wèn)答邏輯,智能地開展多輪引導(dǎo)式問(wèn)答,讓交互更自然、更具親和力。
亮點(diǎn)四:智能碎片化知識(shí)加工
直接告知答案,而非僅告知答案所在的范圍。小富4.0提供豐富的知識(shí)加工模式,可智能化地將結(jié)構(gòu)化和非結(jié)構(gòu)化的知識(shí),碎片化為結(jié)構(gòu)化的文檔。應(yīng)答客戶提問(wèn)時(shí),可直接回饋用戶的問(wèn)題而非給出一個(gè)答案所在區(qū)間。
此外,與小富機(jī)器人4.0同時(shí)展示的還有泰岳統(tǒng)一業(yè)務(wù)知識(shí)庫(kù)系統(tǒng),可提供知識(shí)自動(dòng)加工和強(qiáng)大的知識(shí)圖譜關(guān)聯(lián)能力;泰岳客服大數(shù)據(jù)分析挖掘解決方案,可支持多層級(jí)業(yè)務(wù)類別自動(dòng)分類和語(yǔ)義處理,為客戶提供更智能、更高效的人工智能新體驗(yàn)。
四、語(yǔ)義分析及大數(shù)據(jù)發(fā)展趨勢(shì)
人工智能技術(shù)及大數(shù)據(jù)已經(jīng)成為新經(jīng)濟(jì)發(fā)展的動(dòng)力,美國(guó)、歐洲、日本、中國(guó)等多個(gè)國(guó)家和地區(qū)均將大數(shù)據(jù)及人工智能作為國(guó)家戰(zhàn)略。中國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十三個(gè)五年規(guī)劃綱要指出,實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略,把大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,全面實(shí)施促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng),加快推動(dòng)數(shù)據(jù)資源共享開放和開發(fā)應(yīng)用,助力業(yè)轉(zhuǎn)型升級(jí)和社會(huì)治理創(chuàng)新。同時(shí),2016年,國(guó)家發(fā)改委、科技部、工信部、中央網(wǎng)信辦聯(lián)合發(fā)布了《“互聯(lián)網(wǎng)+”人工智能三年行動(dòng)實(shí)施方案》,首次單獨(dú)為人工智能發(fā)展提出具體的策略方案,提出了人工智能發(fā)展的九大工程。2016美國(guó)白宮發(fā)布了《為人工智能的未來(lái)做好準(zhǔn)備》(Preparing for the Future of Artificial Intelligence)和《國(guó)家人工智能研究與發(fā)展戰(zhàn)略計(jì)劃》(National Artificial Intelligence Research and Development Strategic Plan)兩份重要報(bào)告。探討了人工智能的發(fā)展現(xiàn)狀、應(yīng)用領(lǐng)域以及潛在的公共政策問(wèn)題,提出了美國(guó)優(yōu)先發(fā)展的人工智能七大戰(zhàn)略方向及兩方面建議,對(duì)我國(guó)人工能產(chǎn)業(yè)發(fā)展具有重要的借鑒意義。