每天,我們都在創(chuàng)建難以估算的海量數(shù)據(jù),F(xiàn)在全球90%的數(shù)據(jù)都是過去兩年間產(chǎn)生的,這些數(shù)據(jù)來源廣泛,包括氣象信息收集傳感器、社交媒體內(nèi)容、在線數(shù)碼照片和視頻、在線交易記錄及手機(jī)GPS信號(hào)等。這種類型的數(shù)據(jù)被稱為多結(jié)構(gòu)化數(shù)據(jù),也就是通常所指的大數(shù)據(jù)。值得注意的是,大數(shù)據(jù)可以根據(jù)其結(jié)構(gòu)的復(fù)雜性和多樣性來定義。
每天,各種網(wǎng)站都能產(chǎn)生大量TB數(shù)量級(jí)復(fù)雜的原始數(shù)據(jù),收集了消費(fèi)者的瀏覽及購買習(xí)慣,因此也被稱為交互數(shù)據(jù)。在分析準(zhǔn)備中,將這些網(wǎng)絡(luò)日志轉(zhuǎn)化和提煉,將最終分析出客戶偏好。通過整合及應(yīng)用數(shù)量龐大、類型復(fù)雜的數(shù)據(jù),將實(shí)現(xiàn)客戶信息的深度洞察。此外,通過整合客戶的交易信息數(shù)據(jù),將獲得支持營銷活動(dòng)的觀點(diǎn),確保在正確的時(shí)間,將適當(dāng)?shù)拇黉N信息提供給需要的消費(fèi)者。
顯而易見,數(shù)據(jù)的絕大部分是多結(jié)構(gòu)化數(shù)據(jù),或者是多種不同格式的數(shù)據(jù)。我們大量的工作時(shí)間用于閱讀或者回復(fù)郵件,撰寫報(bào)告或文章,進(jìn)行交談,收聽直播或者錄音資料。顯然,這些都是產(chǎn)生多結(jié)構(gòu)化數(shù)據(jù)的情形。這種數(shù)據(jù)不僅帶來挑戰(zhàn),同時(shí)也是通過新興類型數(shù)據(jù)形成洞察力的機(jī)會(huì),確保業(yè)務(wù)更加靈活,解決過去和未來存在的挑戰(zhàn)。
此外,多結(jié)構(gòu)化數(shù)據(jù)環(huán)境將帶來新的挑戰(zhàn)和機(jī)遇,利于分析、管理和控制現(xiàn)有系統(tǒng)和新渠道產(chǎn)生的大容量、高增長、易變化且復(fù)雜的數(shù)據(jù)信息。多年以來,企業(yè)已經(jīng)身處這種環(huán)境,應(yīng)對(duì)來自網(wǎng)絡(luò)互動(dòng)、移動(dòng)設(shè)備、社會(huì)媒體、機(jī)器數(shù)據(jù)及其他來源的新型信息。
目前,只有最大規(guī)模及專注于數(shù)據(jù)分析的公司擁有時(shí)間、資源和工具進(jìn)行大數(shù)據(jù)分析。但是,更多的公司將能夠順利應(yīng)用可擔(dān)負(fù)的數(shù)據(jù)倉庫系統(tǒng),從新信息源中獲取珍貴的戰(zhàn)略性觀點(diǎn),以前所未有的速度支持業(yè)務(wù)創(chuàng)新。
海量數(shù)據(jù)帶來極致痛苦?
隨著數(shù)據(jù)源呈現(xiàn)指數(shù)級(jí)增長,信息的數(shù)量及復(fù)雜程度快速擴(kuò)大,從海量數(shù)據(jù)中提取信息的能力正快速成為戰(zhàn)略性的強(qiáng)制要求。2011年4月,Gartner集團(tuán)發(fā)布了《大數(shù)據(jù)僅僅是海量信息管理的開端》報(bào)告。報(bào)告稱:“對(duì)大數(shù)據(jù)的關(guān)注展現(xiàn)了最主要的挑戰(zhàn),這些挑戰(zhàn)將重構(gòu)現(xiàn)有的信息管理實(shí)踐和技術(shù)。管理海量數(shù)據(jù)的能力將成為企業(yè)的核心競爭力,確保企業(yè)能夠持續(xù)使用新型信息(文本、社交網(wǎng)絡(luò)、環(huán)境)發(fā)掘支撐業(yè)務(wù)決策的模式(基于模式的戰(zhàn)略)。”
釋放創(chuàng)新能力
為站在不斷發(fā)展的信息浪潮之尖,企業(yè)必須尋求大數(shù)據(jù)分析方案,擴(kuò)展從集成數(shù)據(jù)倉庫獲得的知識(shí)資產(chǎn)。但是,大部分集成數(shù)據(jù)倉庫尚未納入來自網(wǎng)絡(luò)日志及社交媒體高達(dá)80%的多結(jié)構(gòu)化數(shù)據(jù)。
其實(shí),大數(shù)據(jù)的挖掘和分析并非僅應(yīng)用在營銷領(lǐng)域。部分高精度加工企業(yè),如半導(dǎo)體和醫(yī)藥領(lǐng)域企業(yè),也正面臨著海量數(shù)據(jù)壓力,期望通過存儲(chǔ)并分析這種數(shù)據(jù),制定出更佳的業(yè)務(wù)決策。而且,更大的期待是通過理解運(yùn)營和制造中的問題,以及提供更好的用戶體驗(yàn)。通過收集、存儲(chǔ)和分析所有的多結(jié)構(gòu)化數(shù)據(jù),將有助于輕松實(shí)現(xiàn)這些宏偉愿望。