NICE:源自“摩薩德”數(shù)據(jù)挖掘的巨大藍(lán)海
2012/02/29
世界已經(jīng)進(jìn)入數(shù)據(jù)爆炸的時代,那些能在數(shù)據(jù)之間發(fā)現(xiàn)聯(lián)系并將其轉(zhuǎn)化為商業(yè)機(jī)會的公司,不僅能在瞬間制服亡命的歹徒,還將賺得盆滿缽滿。
印度議會大廈,當(dāng)一位襲擊者準(zhǔn)備掏出手槍時,監(jiān)控系統(tǒng)已經(jīng)提前做出預(yù)警,就在他掏出手槍的那一刻,安保人員及時出現(xiàn),將其制服,避免了一場恐慌—這是現(xiàn)實,不是《盜夢空間》或《駭客帝國》描述的虛幻世界,也不是湯姆·克魯斯的《碟中諜》系列或美國熱播劇《24小時》中的人造場景。
在以色列NICE公司,其開發(fā)的分析系統(tǒng)每天都要處理各種各樣的突發(fā)狀況,通過搜集、分析來自監(jiān)控攝像頭、感應(yīng)器實時采集的數(shù)據(jù),發(fā)現(xiàn)你的“意圖”,判斷監(jiān)控視頻中出現(xiàn)的“反!迸e動,做出預(yù)警。這不是天方夜譚,它已經(jīng)應(yīng)用在中國浦東機(jī)場、印度議會大廈、新加坡地鐵等大型交通樞紐或公共設(shè)施。
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及存儲技術(shù)的不斷演進(jìn),文字、音樂、視頻甚至動作都在被數(shù)據(jù)化,真實的世界正在全面數(shù)據(jù)化的進(jìn)程中。根據(jù)IDC的數(shù)據(jù)顯示,就在今年,全球新增的數(shù)據(jù)量將達(dá)到1.8ZB(或1.8萬億GB),這相當(dāng)于中國每個人每分鐘發(fā)送3條微博且連續(xù)6,217年不間斷。
世界已經(jīng)進(jìn)入數(shù)據(jù)爆炸時代,而信息產(chǎn)生、獲取、管理和存儲成本也在下降,2011年該成本是2005年的1/6。而在數(shù)據(jù)管理領(lǐng)域,過去以結(jié)構(gòu)化數(shù)據(jù)為主,而未來,非結(jié)構(gòu)化數(shù)據(jù)將占據(jù)主流。非結(jié)構(gòu)化數(shù)據(jù)是指那些不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù),比如辦公文檔、圖片、音視頻等。
隨著互聯(lián)網(wǎng)進(jìn)入2.0時代以及社交網(wǎng)站的崛起,F(xiàn)acebook、Foursquare、Twitter等社交網(wǎng)站都成為最新的數(shù)據(jù)源。這些社交網(wǎng)站產(chǎn)生的內(nèi)容數(shù)量不斷增加,增長速度將達(dá)到每年40%-60%。無一例外,這些數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)。
但隨之而來的問題是,如何處理急速膨脹的數(shù)據(jù)?尤其是非結(jié)構(gòu)化數(shù)據(jù)。哪些“摩薩德”的信息進(jìn)信息有用?如何從看似無聯(lián)系的數(shù)據(jù)中找到關(guān)聯(lián)?那些能夠幫助企業(yè)獲取、搜索、發(fā)現(xiàn)和分析非結(jié)構(gòu)化數(shù)據(jù)的工具將是一片藍(lán)海,孕育著巨大的市場機(jī)會。
NICE公司正在做這樣的嘗試,它已經(jīng)從安防領(lǐng)域開始,將自己對非結(jié)構(gòu)化數(shù)據(jù)的挖掘能力向金融以及更寬闊的商業(yè)領(lǐng)域擴(kuò)展。NICE公司的創(chuàng)始人以及大部分工程師,來自以色列情報機(jī)關(guān)“摩薩德”,它的數(shù)據(jù)挖掘和分析技術(shù)也脫胎于。以色列所處的地緣和政治環(huán)境,決定了在安防領(lǐng)域它必須具有強(qiáng)悍的身軀和聰明的大腦,以抵御來自外部的風(fēng)險。
NICE公司的軟件工具可以對音頻、視頻以及網(wǎng)頁瀏覽行為等不同渠道行分析,通過對這些看似離散的信息進(jìn)行深度挖掘,從而為金融、零售等行業(yè),提供有價值的客戶信息,在這背后是復(fù)雜的數(shù)學(xué)模型和一系列的運算。以前,這些復(fù)雜數(shù)據(jù)的分析僅用于導(dǎo)彈軌跡或者深奧的科學(xué)實驗,但現(xiàn)在隨著數(shù)據(jù)爆炸,這種大數(shù)據(jù)分析正用于生活很多方面,比如為商業(yè)客戶提供及時的客戶分析結(jié)果,以判斷客戶意圖,從而提供最適合的建議,促成消費;蛘咴诮鹑陬I(lǐng)域,防范金融風(fēng)險。
對于已經(jīng)成立25年的NICE公司,廣闊的前景正在眼前展開。NICE公司可以提供從結(jié)構(gòu)化到非結(jié)構(gòu)化數(shù)據(jù)的捕捉和分析,應(yīng)用主要集中在三個領(lǐng)域:呼叫中心、金融以及安防。
NICE公司的優(yōu)勢在于,它提供的技術(shù)是一種跨渠道的方式,可以將同一個用戶所使用的不同渠道的信息通過捕獲,集中在一起進(jìn)行綜合分析。在中國最近成長速度迅猛的電子商務(wù)品牌“凡客誠品”,就是NICE在商業(yè)領(lǐng)域的客戶之一,NICE的工具幫助凡客誠品的客戶服務(wù)部門挖掘潛在的商業(yè)機(jī)會。而隨著越來越多的商業(yè)客戶開始重視數(shù)據(jù)挖掘,這種能夠在結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)價值的企業(yè),將會大行其道。
另一家同樣在大數(shù)據(jù)存儲和挖掘領(lǐng)域擁有獨特競爭力的公司是SGI。它的CEO馬克· 巴雷內(nèi)切亞(Mark J. Barrenechea)最近收到了理論物理學(xué)家斯蒂芬·威廉·霍金先生的生日聚會邀請函。作為SGI 的重要客戶之一,SGI的高性能計算設(shè)備和軟件正在霍金的實驗室賣力工作,幫助這位著名且神秘的理論物理學(xué)家推演600億年前宇宙起源的那一刻究竟發(fā)生了什么。
圖:SGI CEO Mark J. Barrenechea
SGI是一家專注于高性能計算的科技公司。除了幫助霍金研究深奧的宇宙起源問題之外,它超強(qiáng)的圖形計算能力還曾經(jīng)為《泰坦尼克》、《指環(huán)王》等大制作電影提供技術(shù)支持,不過,SGI還研究計算機(jī)建模,如薯片的包裝過程:傳送帶保持何種速度時薯片不會弄碎而且能被成功包裝。
SGI是一家專注于高性能計算的公司,在它的客戶中包括NASA、中國氣象局、科學(xué)院等全球知名的科研機(jī)構(gòu)。高性能計算由于數(shù)據(jù)量大,需要高性能計算和存儲設(shè)備,而SGI的專長就在于此。
2011 財年SGI收入創(chuàng)下新紀(jì)錄,GAAP收入62.96億美元,同比增長56%,其增長速度幾乎是整個行業(yè)的3倍,在美國經(jīng)濟(jì)衰退的今天,SGI的表現(xiàn)非常搶眼。
就在幾個月前,馬克· 巴雷內(nèi)切亞來到中國。在他的中國之行中,除了拜訪中國氣象局等傳統(tǒng)的高性能計算客戶,他還特別拜訪了幾家著名網(wǎng)絡(luò)公司。實際上,在數(shù)據(jù)爆炸的今天,來自互聯(lián)網(wǎng)的非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)占據(jù)了越來越多的存儲空間。SGI同樣看到了非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域的巨大商機(jī)。
SGI可以提供建模與模擬、云計算、高性能計算到大數(shù)據(jù)處理的從存儲設(shè)備到軟件的一體化解決方案,可以進(jìn)行從計算流體動力學(xué)、結(jié)構(gòu)力學(xué)、計算化學(xué)等等任一復(fù)雜的數(shù)學(xué)運算,而在非結(jié)構(gòu)化數(shù)據(jù)泛濫的今天,SGI的計算能力正當(dāng)其時。
實際上, 重組前兼并SGI公司的Rackable Systems是最早使用hadoop這個工具處理非結(jié)構(gòu)化數(shù)據(jù)的公司之一,“比如新浪微博,如果是在四年前根本做不了數(shù)據(jù)挖掘,因為沒有工具!瘪R克· 巴雷內(nèi)切亞說。
在過去幾十年,以SQL、Oracle為代表的“關(guān)系數(shù)據(jù)庫”發(fā)展到頂點,存儲的前提是數(shù)據(jù)之間要有聯(lián)系,比如姓名、年齡,但互聯(lián)網(wǎng)的興起,令非結(jié)構(gòu)化數(shù)據(jù)泛濫,非結(jié)構(gòu)化數(shù)據(jù)不以關(guān)系唯一相關(guān),它可以有很多關(guān)系,或者沒有關(guān)系,而通過一系列計算,找出其中的聯(lián)系,這就是數(shù)據(jù)挖掘的價值。
“這是一個重大突破,十億個數(shù)據(jù)放在那,看不到關(guān)系,然后建立出關(guān)系來,這就是現(xiàn)在新的發(fā)展和突破要用到大量硬件和分析軟件的一個機(jī)會。”馬克· 巴雷內(nèi)切亞強(qiáng)調(diào),“現(xiàn)實世界中可能80% 都是非結(jié)構(gòu)化數(shù)據(jù),只有20%是結(jié)構(gòu)化的,F(xiàn)在知道的這些知名的公司,像百度、卓越、騰訊微博、Facebook、新浪微博,他們創(chuàng)立的全是非結(jié)構(gòu)化數(shù)據(jù),可能是SAP的100倍!瘪R克· 巴雷內(nèi)切亞繼續(xù)說,因此“非結(jié)構(gòu)化數(shù)據(jù)的創(chuàng)建、分析和挖掘的價值是巨大的”。
SGI把整個市場分成兩大領(lǐng)域:商務(wù)計算和技術(shù)計算。在商務(wù)計算市場不乏IBM、HP這樣級別的競爭者,目前市場規(guī)模大約在300多億美元。而SGI更具優(yōu)勢的技術(shù)計算市場,比如航空工業(yè)公司制造飛機(jī)所做的CID的設(shè)計,氣象局、衛(wèi)星氣象中心,要從衛(wèi)星獲取資料,進(jìn)行分析,預(yù)報氣象等需要建立復(fù)雜數(shù)學(xué)模型和算法的領(lǐng)域,這是SGI的優(yōu)勢所在!拔覀兪且粋數(shù)學(xué)家的公司!彼,SGI更關(guān)注于技術(shù)計算市場而非商務(wù)計算市場。
實際上,隨著數(shù)據(jù)爆炸時代的來臨,從薯片包裝、F1賽車的設(shè)計到生物起源模擬,無不需要數(shù)學(xué)家建立運算公式,并通過計算設(shè)備強(qiáng)大的計算能力來實現(xiàn),這將是一個數(shù)學(xué)家的時代。尤其網(wǎng)站制造的海量、分散的數(shù)據(jù),也需要聰明的頭腦從中找出規(guī)律,過去的工具、流程和參數(shù)設(shè)計并不是為了獲取和評估非結(jié)構(gòu)化數(shù)據(jù),而新的工具以及新的數(shù)學(xué)模型建立,數(shù)學(xué)算法的改進(jìn),都將會為實現(xiàn)它的企業(yè)創(chuàng)造市場機(jī)會。
福布斯中文網(wǎng)
相關(guān)閱讀:
感谢您访问我们的网站,您可能还对以下资源感兴趣:
欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看
老外毛片免费视频播放,人人狠狠综合久久亚洲,久艹在线视频,天天操夜操
婷婷激情在线,亚洲成a人片77777群色,狠狠躁天天躁,成年美女黄网站色大片免费看
黄色片aa,亚洲一区二区三区免费在线观看,久久青草精品一区二区三区,性感美女国产射精免费黄视频
日本一道本在线,视频二区三区国产情侣在线,国产精品色哟哟,青青草伊人
久久久久精品香蕉免费看,国产美女免费视频,成人免费xxx色视频,91精品国产综合久久消防器材