首頁>>>技術(shù)>>>CRM  CRM產(chǎn)品

 

從呼叫中心通向CRM—數(shù)據(jù)倉庫必不可少

段云峰 楊鳳年 宋俊德 2002/04/19

  在呼叫中心業(yè)務(wù)系統(tǒng)收集到大量數(shù)據(jù)之后,要將這些信息進(jìn)行有效利用,從而為CRM系統(tǒng)提供正確的依據(jù),這個過程中,數(shù)據(jù)倉庫是必不可少的要素。數(shù)據(jù)倉庫是一項基于數(shù)據(jù)管理和利用的綜合性技術(shù)和解決方案,它將成為數(shù)據(jù)庫市場的新一輪增長點,同時也將成為下一代應(yīng)用系統(tǒng)的重要組成部分。

  本文共分三大部分,介紹了數(shù)據(jù)倉庫及數(shù)據(jù)集市的概念,并對如何獲取高質(zhì)量信息、數(shù)據(jù)倉庫的設(shè)計和實現(xiàn)、數(shù)據(jù)倉庫系統(tǒng)中的三個工具層以及數(shù)據(jù)倉庫平臺的評測指標(biāo)進(jìn)行了較為詳細(xì)的闡述,同時分析了數(shù)據(jù)倉庫的發(fā)展方向。

什么是數(shù)據(jù)倉庫?

  1.?dāng)?shù)據(jù)倉庫概念解析

  面對競爭日趨激烈與瞬息萬變的市場,面對不同層次的大量信息,企業(yè)各級管理人員將如何應(yīng)用,以便在企業(yè)的經(jīng)營和管理中迅速做出正確的決策?

  數(shù)據(jù)倉庫就是針對上述問題而產(chǎn)生的一種技術(shù)方案,它是基于大規(guī)模數(shù)據(jù)庫的決策支持系統(tǒng)環(huán)境的核心。數(shù)據(jù)倉庫之父H·W·Inmon是這樣定義數(shù)據(jù)倉庫的:數(shù)據(jù)倉庫是一個面向主題的、集成的、不可更新的且隨時間不斷變化的數(shù)據(jù)集合,用來支持管理人員的決策。

  我們常常會認(rèn)為,數(shù)據(jù)倉庫是一個或一組產(chǎn)品,可以幫助我們得到問題的答案,或幫助我們提高決策能力。其實數(shù)據(jù)倉庫并不是這么簡單,它雖然可以幫助我們得到答案以便更好地做出決策,但這只是其全局過程的一部分。數(shù)據(jù)倉庫中的數(shù)據(jù)從何而來?數(shù)據(jù)如何進(jìn)入數(shù)據(jù)倉庫?如何維護(hù)數(shù)據(jù)倉庫?數(shù)據(jù)倉庫中的數(shù)據(jù)如何組織?這些都是建立數(shù)據(jù)倉庫之前必須回答的問題。建立數(shù)據(jù)倉庫包括創(chuàng)建、管理、維護(hù)數(shù)據(jù)倉庫的所有活動。因此,數(shù)據(jù)倉庫不是產(chǎn)品,而是解決方案。

  數(shù)據(jù)倉庫和數(shù)據(jù)庫是不一樣的概念。數(shù)據(jù)倉庫是一個綜合的解決方案,而數(shù)據(jù)庫只是一個現(xiàn)成的產(chǎn)品。數(shù)據(jù)倉庫需要一個功能十分強(qiáng)大的數(shù)據(jù)庫引擎來驅(qū)動。與關(guān)系數(shù)據(jù)庫不同,數(shù)據(jù)倉庫并沒有嚴(yán)格的數(shù)學(xué)理論基礎(chǔ),它更偏向于工程。由于數(shù)據(jù)倉庫的這種工程性,在技術(shù)上可以根據(jù)它的工作過程分為數(shù)據(jù)的抽取、數(shù)據(jù)的存儲和管理、數(shù)據(jù)的表現(xiàn)以及數(shù)據(jù)倉庫設(shè)計的技術(shù)咨詢等四個方面。

  2.?dāng)?shù)據(jù)倉庫與數(shù)據(jù)集市的區(qū)別

  談到數(shù)據(jù)倉庫,就不可避免地談到數(shù)據(jù)集市。由于一些廠商的誤導(dǎo),很多人往往把這兩個概念混淆了。數(shù)據(jù)集市也是當(dāng)前非常熱門的一個術(shù)語,一種比較常見的誤解是,認(rèn)為它與數(shù)據(jù)倉庫的差別只是數(shù)據(jù)量的大小而已。事實上,數(shù)據(jù)倉庫是企業(yè)級的,能為整個企業(yè)各個部門的運(yùn)行提供決策支持手段: 而數(shù)據(jù)集市則是一種微型的數(shù)據(jù)倉庫,它通常有更少的數(shù)據(jù),更少的主題區(qū)域,以及更少的歷史數(shù)據(jù),因此是部門級的,一般只能為某個局部范圍內(nèi)的管理人員服務(wù),因此也稱之為部門級數(shù)據(jù)倉庫。

  數(shù)據(jù)集市有兩種,即獨立的數(shù)據(jù)集市(Independent Data Mart)和從屬的數(shù)據(jù)集市(Dependent Data Mart)。所謂從屬,是指它的數(shù)據(jù)直接來自于中央數(shù)據(jù)倉庫。顯然,從屬的數(shù)據(jù)集市的這種結(jié)構(gòu)仍能保持?jǐn)?shù)據(jù)的一致性。一般為那些訪問數(shù)據(jù)倉庫十分頻繁的關(guān)鍵業(yè)務(wù)部門建立從屬的數(shù)據(jù)集市,這樣可以很好地提高查詢的反應(yīng)速度。獨立數(shù)據(jù)集市,它的數(shù)據(jù)直接來源于各生產(chǎn)系統(tǒng)。許多企業(yè)在計劃實施數(shù)據(jù)倉庫時,往往出于投資方面的考慮,最后建成的就是這種結(jié)構(gòu)的獨立數(shù)據(jù)集市,用來解決個別部門比較迫切的決策問題。從這個意義上講,它和企業(yè)數(shù)據(jù)倉庫除了在數(shù)據(jù)量大小和服務(wù)對象上有所區(qū)別外,邏輯結(jié)構(gòu)并無多大區(qū)別,這也是有人把數(shù)據(jù)集市稱為部門數(shù)據(jù)倉庫的主要原因。

如何建立數(shù)據(jù)倉庫?

  1.獲取高質(zhì)量的信息

  數(shù)據(jù)倉庫作為決策支持系統(tǒng)(DSS)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境所要研究和解決的問題,就是從數(shù)據(jù)庫中獲取信息。數(shù)據(jù)質(zhì)量差是構(gòu)建數(shù)據(jù)倉庫時需要解決的最困難的問題之一,有許多不同的方法可以用于改善數(shù)據(jù)倉庫中信息的質(zhì)量。當(dāng)發(fā)現(xiàn)在源系統(tǒng)中哪些地方存在數(shù)據(jù)質(zhì)量問題之后,就需要研究一些方法來改善數(shù)據(jù)質(zhì)量。一種改善數(shù)據(jù)倉庫中數(shù)據(jù)質(zhì)量的方法是改善源系統(tǒng)中數(shù)據(jù)質(zhì)量: 另一種方法是在將數(shù)據(jù)從老系統(tǒng)移植到數(shù)據(jù)倉庫的過程中校正數(shù)據(jù)。

  2.?dāng)?shù)據(jù)倉庫的設(shè)計和實現(xiàn)

  (1)設(shè)計與實現(xiàn)過程

  (2)需要注意的問題

  數(shù)據(jù)倉庫的模型設(shè)計(包括邏輯模型設(shè)計和物理模型設(shè)計)是系統(tǒng)的基礎(chǔ)和成敗的關(guān)鍵,在實際操作中應(yīng)對下列問題引起注意:

   在數(shù)據(jù)抽取過程中,應(yīng)該注意以下幾點:

  3.?dāng)?shù)據(jù)倉庫系統(tǒng)的三個工具層

  OLAP的查詢分析型工具、DSS的分析預(yù)測型工具與數(shù)據(jù)挖掘型工具共同構(gòu)成了數(shù)據(jù)倉庫系統(tǒng)的工具層。它們各自的側(cè)重點不同,適用范圍和針對的用戶也不相同。數(shù)據(jù)倉庫系統(tǒng)具備了這三種工具,人們才能真正高效地利用其中蘊(yùn)藏的大量寶貴的信息。

  (1)聯(lián)機(jī)分析處理(OLAP)

  聯(lián)機(jī)分析處理主要通過多維的方式對數(shù)據(jù)進(jìn)行分析、查詢和報表。它不同于傳統(tǒng)的聯(lián)機(jī)事物處理(OLTP)應(yīng)用。OLTP應(yīng)用主要是用來完成用戶的事務(wù)處理,如民航訂票系統(tǒng)、銀行儲蓄系統(tǒng)等,通常要進(jìn)行大量的更新操作,同時對響應(yīng)時間要求比較高。而OLAP應(yīng)用主要是對用戶當(dāng)前及歷史數(shù)據(jù)進(jìn)行分析,輔助領(lǐng)導(dǎo)決策。其典型的應(yīng)用有對銀行信用卡風(fēng)險的分析與預(yù)測、公司市場營銷策略的制定等,主要是進(jìn)行大量的查詢操作,對時間的要求不太嚴(yán)格。

  目前常見的OLAP主要有基于多維數(shù)據(jù)庫的MOLAP及基于關(guān)系數(shù)據(jù)庫的ROLAP。在數(shù)據(jù)倉庫應(yīng)用中,OLAP應(yīng)用一般是數(shù)據(jù)倉庫應(yīng)用的前端工具,同時OLAP工具還可以與數(shù)據(jù)挖掘工具、統(tǒng)計分析工具配合使用,增強(qiáng)決策分析功能。

  (2)決策支持系統(tǒng)(DSS)

  決策支持系統(tǒng)(DSS)和數(shù)據(jù)倉庫的目標(biāo)用戶相同,都是面向企業(yè)的中高層領(lǐng)導(dǎo),它們執(zhí)行的都是決策和趨勢分析類的應(yīng)用。DSS中的一些技術(shù)可以很好地集成到數(shù)據(jù)倉庫中,并使數(shù)據(jù)倉庫的分析能力更加強(qiáng)大。例如:DSS中的傳統(tǒng)統(tǒng)計分析模型可以幫助用戶對數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行更加有效、更加深入的分析,從而更好地掌握和利用信息。而一些智能決策技術(shù),如人工神經(jīng)網(wǎng)絡(luò)在發(fā)現(xiàn)顧客行為模式、預(yù)測金融市場行為等方面顯示了強(qiáng)大的功能。這些DSS的核心技術(shù)在數(shù)據(jù)倉庫中的應(yīng)用,不但會大大提高數(shù)據(jù)倉庫的決策支持能力,同時也使DSS的應(yīng)用范圍更加廣泛。

 。3)數(shù)據(jù)挖掘

  數(shù)據(jù)挖掘是當(dāng)前業(yè)界的熱門技術(shù),已經(jīng)在多個應(yīng)用領(lǐng)域產(chǎn)生了巨大的效益。數(shù)據(jù)挖掘不一定需要建立在數(shù)據(jù)倉庫的基礎(chǔ)上,但是如果將數(shù)據(jù)挖掘和數(shù)據(jù)倉庫協(xié)同工作,則可以簡化數(shù)據(jù)挖掘過程的某些步驟,從而大大提高數(shù)據(jù)挖掘的工作效率。由于數(shù)據(jù)倉庫的數(shù)據(jù)來源于整個企業(yè),保證了數(shù)據(jù)挖掘中數(shù)據(jù)來源的廣泛性和完整性。數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)倉庫應(yīng)用中比較重要且相對獨立的部分。目前,數(shù)據(jù)挖掘技術(shù)正處在發(fā)展當(dāng)中。數(shù)據(jù)挖掘涉及到數(shù)理統(tǒng)計、模糊理論、神經(jīng)網(wǎng)絡(luò)和人工智能等多種技術(shù),技術(shù)含量比較高,實現(xiàn)難度較大。此外,數(shù)據(jù)挖掘技術(shù)還會同可視化技術(shù)、地理信息系統(tǒng)、統(tǒng)計分析系統(tǒng)相結(jié)合,豐富數(shù)據(jù)挖掘技術(shù)及工具的功能與性能。

  4.?dāng)?shù)據(jù)倉庫平臺的評測指標(biāo)

  由于許多數(shù)據(jù)庫廠商都在大力推廣和宣傳自己的數(shù)據(jù)倉庫解決方案,使最終用戶無所適從。那么,是否有第三方機(jī)構(gòu)或組織制訂一個比較公正而權(quán)威的評測標(biāo)準(zhǔn)呢?回答是肯定的。

  目前,專門針對數(shù)據(jù)倉庫平臺的評測指標(biāo)主要有兩個:

 。1)TPC-D

  TPC是一個國際性的組織,由45個會員公司組成,IBM、Microsoft、NCR、NEC、HP、Sun等跨國公司都是其會員。TPC專門負(fù)責(zé)為各種開放平臺在不同類型的應(yīng)用上制定一個統(tǒng)一、公正的測試標(biāo)準(zhǔn)。

  對于OLTP系統(tǒng),衡量其數(shù)據(jù)庫性能的主要指標(biāo)是TPC-C,這里不做分析。對于數(shù)據(jù)倉庫系統(tǒng),衡量其數(shù)據(jù)庫性能的主要指標(biāo)則是TPC-D。主要有3方面的數(shù)據(jù)需要考慮:

  顯然,前面兩個指標(biāo)的數(shù)據(jù)越大越好,而最后一個則越小越好。當(dāng)然,首先要考慮的應(yīng)該是能否滿足業(yè)務(wù)上的需求。

  各家供應(yīng)商的TPC-D值以及TPC-D的詳細(xì)描述可以從TPC在Internet的主頁上找到。另外,也可以從Microsoft、IDEAS等公司的主頁上找到TPC-D的測試結(jié)果。

  需要做些說明的是流量測試結(jié)果。盡管它描述了系統(tǒng)處理并發(fā)查詢請求的能力,但并非所有廠商的流量測試都是在多用戶狀態(tài)下進(jìn)行的。TPC-D給了供應(yīng)商們一個選擇: 直接進(jìn)行多用戶狀態(tài)下的流量測試; 或者先在單用戶狀態(tài)下進(jìn)行測試,然后利用測得的處理能力指標(biāo)QppD和流量指標(biāo)的計算公式來計算出QthD。

  如何區(qū)分這兩種測試結(jié)果呢?只要把TPC-D的測試概要下載并打印出來,就可以了解在做流量測試時的Stream數(shù)目。Stream數(shù)實際上代表了同時遞交查詢請求的用戶個數(shù)。如果是單用戶狀態(tài)下的測試,則只能發(fā)現(xiàn)一個Stream,即Stream00。

 。2)Data Challenge

  由于TPC-D對測試的數(shù)據(jù)庫模型、數(shù)據(jù)的加載以及所有查詢都做了非常嚴(yán)格的規(guī)定,這樣,參與測試的各廠商有可能預(yù)先做許多調(diào)整,使其性能更好,致使數(shù)據(jù)倉庫的實際應(yīng)用情況與之有較大的區(qū)別。因此,TPC-D的測試結(jié)果主要給用戶在做數(shù)據(jù)倉庫軟硬件平臺選型時提供一個初步的參考。

  除TPC-D以外,還有一個于1998年5月宣布的稱為Data Challenge(數(shù)據(jù)挑戰(zhàn))的測試標(biāo)準(zhǔn)。與TPC-D不一樣的是,它非常注重考察系統(tǒng)的動態(tài)查詢能力,所有查詢都不公開,參與測試的廠商無法做預(yù)先的調(diào)整。測試前由各廠商按照規(guī)定設(shè)置好環(huán)境,然后由Data Challenge公司的技術(shù)專家來進(jìn)行各種性能評測。

  當(dāng)用戶在決定選擇一個廠商為其實施數(shù)據(jù)倉庫系統(tǒng)時,至少應(yīng)該考慮以下問題:

  當(dāng)認(rèn)真考慮了以上各方面的問題后,所投資建立的實際系統(tǒng)一般都能達(dá)到預(yù)期的效果。

數(shù)據(jù)倉庫向何處去?

  1.技術(shù)趨勢

  數(shù)據(jù)倉庫技術(shù)的發(fā)展包括數(shù)據(jù)抽取、存儲管理、數(shù)據(jù)表現(xiàn)和方法論等方面。

  在數(shù)據(jù)抽取方面,未來的技術(shù)發(fā)展將集中在系統(tǒng)集成化方面。它將互聯(lián)、轉(zhuǎn)換、復(fù)制、調(diào)度、監(jiān)控等納入標(biāo)準(zhǔn)化的統(tǒng)一管理,以適應(yīng)數(shù)據(jù)倉庫本身或數(shù)據(jù)源的變化,使系統(tǒng)更加便于管理和維護(hù)。

  在數(shù)據(jù)管理方面,未來的發(fā)展將使數(shù)據(jù)庫廠商明確推出數(shù)據(jù)倉庫引擎,并作為服務(wù)器產(chǎn)品與數(shù)據(jù)庫服務(wù)器并駕齊驅(qū)。在這一方面,帶有決策支持?jǐn)U展的并行關(guān)系數(shù)據(jù)庫將最具發(fā)展?jié)摿Α?

  在數(shù)據(jù)表現(xiàn)方面,數(shù)理統(tǒng)計的算法和功能將被普遍集成到聯(lián)機(jī)分析產(chǎn)品中,同時與Internet/Web技術(shù)緊密結(jié)合,推出適用于Intranet、終端免維護(hù)的數(shù)據(jù)倉庫訪問前端。在這個方面,按行業(yè)應(yīng)用特征細(xì)化的數(shù)據(jù)倉庫用戶前端軟件將形成產(chǎn)品,并作為數(shù)據(jù)倉庫解決方案的一部分。數(shù)據(jù)倉庫實現(xiàn)過程的方法論將更加普及,將成為數(shù)據(jù)庫設(shè)計的一個明確分支,成為管理信息系統(tǒng)設(shè)計的必備部分。

  計算機(jī)應(yīng)用發(fā)展的數(shù)據(jù)倉庫傾向,是數(shù)據(jù)倉庫發(fā)展的推動力。傳統(tǒng)的聯(lián)機(jī)事務(wù)處理系統(tǒng)并不單獨考慮數(shù)據(jù)倉庫,但實際應(yīng)用對數(shù)據(jù)倉庫所能提供的功能卻早有需求。因此,許多事務(wù)處理系統(tǒng)近年來陷入一個兩難的境地:在現(xiàn)有系統(tǒng)上增加有限的聯(lián)機(jī)分析功能,包括復(fù)雜的報表和數(shù)據(jù)匯總操作,這樣一方面嚴(yán)重影響了事務(wù)處理聯(lián)機(jī)性能,另一方面,統(tǒng)計分析又因系統(tǒng)結(jié)構(gòu)上的種種限制而不能得到充分體現(xiàn)。因此,應(yīng)用技術(shù)是朝著更加細(xì)化、更加專業(yè)的方向發(fā)展。

  在新一代的應(yīng)用系統(tǒng)中,數(shù)據(jù)倉庫在一開始便被納入系統(tǒng)設(shè)計的考慮之中,聯(lián)機(jī)分析將被應(yīng)用于普遍的事務(wù)處理系統(tǒng)之中。在數(shù)據(jù)管理上,聯(lián)機(jī)事務(wù)處理和數(shù)據(jù)倉庫在應(yīng)用中相對獨立,聯(lián)機(jī)事務(wù)處理系統(tǒng)本身將更加簡潔高效,同時分析統(tǒng)計也更為便利。面向行業(yè)的數(shù)理統(tǒng)計學(xué)向更為普遍的應(yīng)用發(fā)展,并集成到應(yīng)用系統(tǒng)的數(shù)據(jù)倉庫解決方案中。它們將立足于數(shù)據(jù)倉庫所提供的豐富信息,更好地為業(yè)務(wù)決策服務(wù)。

  2.市場預(yù)測

  在市場上,可以從廠商和用戶兩個方面看數(shù)據(jù)倉庫的發(fā)展。對于提供數(shù)據(jù)倉庫產(chǎn)品和解決方案的廠商來說,嚴(yán)酷的市場競爭是永恒的主題,無法提供完整解決方案的廠商,可能被其他公司收購。例如,從事數(shù)據(jù)抽取、提供專用工具的軟件公司很可能并入大型數(shù)據(jù)庫廠商。能夠持續(xù)發(fā)展的廠商大致有兩類:一是擁有強(qiáng)大的數(shù)據(jù)庫、數(shù)據(jù)管理背景的公司;二是專門提供面向具體行業(yè)的、關(guān)于數(shù)據(jù)倉庫實施的技術(shù)咨詢的公司。

  從用戶的角度看,數(shù)據(jù)管理的傳統(tǒng)領(lǐng)域,如金融、保險、電信等行業(yè)中的特定應(yīng)用,除信用分析、風(fēng)險分析、欺詐檢測之外,數(shù)據(jù)倉庫的應(yīng)用將隨著現(xiàn)代社會商業(yè)模式的變革而進(jìn)一步普及和深入。

  近年來,一場革命正在改變產(chǎn)品制造和服務(wù)的提供方式,它就是數(shù)字化定制經(jīng)濟(jì)模式。在這個世界里,用戶可以購買一臺根據(jù)自己要求組裝的計算機(jī)、一條根據(jù)自己體形設(shè)計的牛仔褲、一種根據(jù)自己身體需要而生產(chǎn)的保健藥、一副與自己臉型相配的眼鏡……大規(guī)模的定制不僅是一種制造過程、后勤系統(tǒng)或者推銷策略,它很可能成為企業(yè)生產(chǎn)的組織原則。在未來大規(guī)模定制經(jīng)濟(jì)環(huán)境下,數(shù)據(jù)倉庫將成為企業(yè)獲得競爭優(yōu)勢的關(guān)鍵武器。

計算機(jī)世界報 2002/04/19



相關(guān)鏈接:
英橋E-STAR客戶關(guān)系管理軟件(CRM) 2002-04-17
正邦高科EAI整體解決方案 2002-04-15
商網(wǎng)通CRM企業(yè)解決方案 2002-04-10
如何用部門級服務(wù)器構(gòu)建分析型CRM應(yīng)用 2002-04-10
金蝶電力行業(yè)解決方案 2002-04-09

分類信息:     技術(shù)_CRM與呼叫中心   技術(shù)_CRM_解決方案