日前,攜程技術(shù)副總裁葉亞明(Eric Ye)來北京出席大數(shù)據(jù)&分析創(chuàng)新峰會,在活動現(xiàn)場葉亞明接受了記者的訪談,對于這一年多來對攜程網(wǎng)所做的幾次技術(shù)改造升級、大數(shù)據(jù)探索、開放API、引入OpenStack、云計算價值、開源技術(shù)、團(tuán)隊建設(shè)以及記者提出的各種問題,葉亞明都分享了精彩的觀點。
攜程技術(shù)副總裁葉亞明(Eric Ye)
葉亞明,攜程旅行網(wǎng)技術(shù)副總裁、研發(fā)中心總經(jīng)理,在納斯達(dá)克上市公司攜程管理上千人的團(tuán)隊。加盟攜程之前,他曾在全球最大的在線拍賣網(wǎng)站EBAY擔(dān)任平臺開 發(fā)總監(jiān),負(fù)責(zé)改善網(wǎng)站的穩(wěn)定性和有效性。葉亞明也是一名硅谷資深人士,曾經(jīng)在雅虎、Netscape和其他互聯(lián)網(wǎng)公司擔(dān)任產(chǎn)品開發(fā)和管理等職位。
這一年多來攜程的幾次重大技術(shù)改進(jìn)
記者:到攜程后,你對攜程的技術(shù)改造升級主要體現(xiàn)在哪些方面?
葉亞明(Eric Ye):我到攜程是這一兩年的事情,剛開始注意力集中在技術(shù)架構(gòu)和酒店業(yè)務(wù)方面。到后來,我就去管理整個技術(shù)開發(fā)團(tuán)隊了。那是去年7、8月份的事情,到現(xiàn)在有一年多時間了。主要做了幾個方面的事情:
第一,我進(jìn)去的時候攜程還是很重視Off Line,但領(lǐng)導(dǎo)層已經(jīng)開始意識到On line的重要性了。所以我們首先做的就是攜程網(wǎng)站的改版(包括通過各種技術(shù)給訪問頁面提速)。如果放到五年前,攜程網(wǎng)的頁面風(fēng)格(技術(shù))在當(dāng)時是很領(lǐng)先的。但在兩年前看的時候,用戶已經(jīng)覺得這個頁面很老氣了。所以當(dāng)時我們提出一個口號叫做UI2.0。 攜程經(jīng)過一年多的改動,現(xiàn)在的頁面設(shè)計風(fēng)格跟以前已經(jīng)完全不一樣了。經(jīng)過改進(jìn),現(xiàn)在攜程網(wǎng)的風(fēng)格有點像亞馬遜、Ebay,但與國內(nèi)主要競爭對手的網(wǎng)站風(fēng)格差異很大。
第二個大的改進(jìn)是后臺,攜程平臺資源通過Open API的方式開放出去。通過開放平臺,讓合作伙伴能用到攜程的產(chǎn)品和資源,包括 機票、酒店、租車、火車等。最近的一些動作,例如攜程和去哪兒的合作就是開放的例子。不僅僅是去哪兒,攜程網(wǎng)跟搜索引擎的合作也從來沒有停止過。攜程跟很多上下游的旅游網(wǎng)站都有合作,數(shù)千個分銷商在分銷攜程的產(chǎn)品。
攜程的開放平臺之路已經(jīng)開啟,今后五年發(fā)展的威力很更大。國外像Ebay這樣的網(wǎng)站,賣家通過API方式成交的產(chǎn)品已經(jīng)超過60%~70%了。攜程平臺會堅持開放的思路,因為攜程本身沒有酒店、飛機、火車(等實體產(chǎn)品),但攜程卻能幫客人找到最好的酒店,幫客人找到性價比最高的機票。攜程提供的是服務(wù),我們要做的是把用戶體驗做到極致。這次改變的不光是技術(shù),而是整個思路都改變了。
第三個改進(jìn)就是數(shù)據(jù)中心的提升。攜程已經(jīng)有好幾個的數(shù)據(jù)中心了,一方面是支持業(yè)務(wù)的持續(xù)成長,另外還要提供更可靠的網(wǎng)站可用性。此外,攜程還在今年3、4月份建立了專門的數(shù)據(jù)團(tuán)隊,對大數(shù)據(jù)分析進(jìn)行研究。
記者:攜程在大數(shù)據(jù)方面做了哪些探索性的工作?
葉亞明(Eric Ye):如果跟海外的大數(shù)據(jù)分析應(yīng)用來比較的話,攜程還是在起步階段;但是,我們已經(jīng)進(jìn)行了很多嘗試,并且應(yīng)用在具體的業(yè)務(wù)流程中,產(chǎn)生的收益可能會超出外人的想象。我可以舉個有意思的例子,比如酒店行業(yè)有一個noshow現(xiàn)象,是客人下了訂單但是沒去住,酒店會告訴攜程這個情況,因為客人沒去住酒店,酒店就沒有必要給攜程付費。
一天可能有很多個訂單客人沒去,我們要如何知道客人是否真的沒去,這是一個大問題。有一個笨辦法,我給客人打電話,一萬個訂單你要給一萬個人打電話,每天一萬個人你后面是有工作成本的。一般客人不會撒謊,會如實告訴我們到底去沒去,所以我們更相信客人講的東西。如果客人說沒去,酒店說沒去,那就是沒去。如果客人說去,酒店說沒去,客人有材料,酒店也賴不掉。
對于這種“客人說去,酒店說沒去”的情況,這背后涉及到很多收益,一定要鑒別出來。我們通過技術(shù)(機器學(xué)習(xí))的過程,可以比較精準(zhǔn)的告訴你哪個酒店在撒謊。精準(zhǔn)到什么程度?可以精準(zhǔn)到70%以上,另外的30%的打電話再確認(rèn)就好了。這里面其實有一個技術(shù)動作,通過數(shù)學(xué)模型去分析數(shù)據(jù)。這樣做以后,酒店慢慢也會規(guī)范自己的行為。
記者:簡單介紹一下攜程是怎么做到的,通過哪些東西進(jìn)行分析?
葉亞明(Eric Ye):我們要積累用戶的行為,這個行為數(shù)據(jù)庫不是一天建立起來的,而是一年、幾年、甚至是十年。攜程對它們就可以分析了。我們打電話已經(jīng)打了十年,我們知道哪個酒店的情況怎么樣,每次打完電話以后我們都會有記錄。我們建立一個系統(tǒng),這個系統(tǒng)對酒店和消費者的行為進(jìn)行跟蹤,進(jìn)行分析和糾正。這是學(xué)習(xí)的過程,這個學(xué)習(xí)不是人來學(xué)習(xí),而是機器來學(xué)習(xí)。機器有一個好處,處理一百個跟一萬個,花的時間基本上是一樣的,并且很準(zhǔn)確。
攜程所有的產(chǎn)品線都要有開放API的技術(shù)能力
記者:剛才談到了攜程要做開放平臺,作為一種技術(shù)和業(yè)務(wù)能力的體現(xiàn),在這兩方面攜程是如何準(zhǔn)備的?
葉亞明(Eric Ye):做開放對技術(shù)是個很大的挑戰(zhàn)。因為開放的是技術(shù)平臺,技術(shù)沒有的話其他的東西都免談。但光有技術(shù)還不充分,技術(shù)和業(yè)務(wù)結(jié)合的話,可以把它做得很充分,成功的概率就會很高。開放平臺里技術(shù)的考驗很大,要做很多的升級才能真正做到開放。
舉一些例子,API給別人用的時候,人家也會評價你的API好不好用,攜程的API也在改版和提升。這一階段做的事情首先就是后臺可以支撐這些API的運營。另外,在產(chǎn)品線上,我要求每一個產(chǎn)品線都要做到可以通過API的方式開放出來,當(dāng)需要提供給合作伙伴去使用的時候,能立即打開。有些 業(yè)務(wù)暫時沒有準(zhǔn)備好的時候,API可以先關(guān)掉,但是開放API的能力是存在的,就相當(dāng)于有一個導(dǎo)彈沒有發(fā)射出去而已。但攜程需要把這些武器都準(zhǔn)備好,每一 樣武器背后都是有技術(shù)架構(gòu)支撐的。
云計算現(xiàn)階段對攜程最大價值是呼叫云和快速部署
記者:云計算技術(shù)對于攜程的價值是什么?
葉亞明(Eric Ye):云技術(shù)對攜程的價值有兩個。一個是呼叫中心,攜程可能有全世界最大的呼叫云,后面所有的接線員都要在云上(現(xiàn)在攜程呼叫中心有一萬以上的坐席);現(xiàn)在大部分還是用Desktop。如果把這些東西放在云上,這是非常有業(yè)務(wù)價值的云應(yīng)用,而不是說為了云而云。
還有一個價值體現(xiàn)在快速部署。業(yè)務(wù)成長快的時候,有的時候一千臺機器進(jìn)來,不能一臺一臺的機器去部署。新的機器同時可以上架,要鋪很多東 西,網(wǎng)絡(luò)、分配、配置、運營部署上去,才能把流量引進(jìn)來。這里面包括一系列的動作,每一步都不能出錯。怎么能做到快速準(zhǔn)備、可靠的部署,如果業(yè)務(wù)量小的時候沒有關(guān)系,也就十余臺機器,人都可以搞定。一千臺機器的話,人肯定會有犯錯誤的時候,十臺機器中有一臺犯錯,還好;但是一千臺機器的網(wǎng)站就沒法玩了。這也是云的技術(shù)價值。所以,攜程的云計算主要集中在這兩方面,一個是提高運營效率,一個是真正有業(yè)務(wù)價值的呼叫云。
記者:剛才說到選擇架構(gòu)的時候,為什么會選擇開源的技術(shù)?
葉亞明(Eric Ye):剛開始我們走過一些彎路,當(dāng)時我們測試了市場上主要的商用級云計算解決方案,但具體算了一下,不比現(xiàn)在的部署開銷低,甚至有的還要比現(xiàn)在更貴。后來我們選擇了OpenStack。在引入OpenStack的時候,我跟我們的團(tuán)隊講,一定要在真刀真槍的生產(chǎn)環(huán)境里跑起來才算真正的用上了。今年已經(jīng)有一千個虛擬機用上去了,物理的Desktop已經(jīng)拿掉了。
因為這么一個技術(shù)革新,開銷結(jié)構(gòu)變化了,省下來不少費用。但這不是最核心的,最核心的是下一個:今后攜程的業(yè)務(wù)會持續(xù)成長,打電話進(jìn)來的人不會少還會多, 當(dāng)然成長速度不會像無線這么快,無線這個可能是十倍的增長;這個問題怎么面對?也用原來的辦法通過一臺一臺Desktop部署嗎?絕對不行。現(xiàn)在用虛擬化,可以快速部署、管理、響應(yīng),碰到一個問題,攜程可以快速對你進(jìn)行響應(yīng),例如修復(fù)Bug的時 間,這些會大大提升效率。
今后比如突然增加300個人,對我來說是很簡單的事情,我產(chǎn)生300個虛機就可以了。采購也省掉了,我把后面的物理機采購足了以后,部署虛機就是很簡單的事情了。盡管是好多接線員,但后面幾個機柜就搞定了。管理幾個機柜跟管理 上萬臺機器不是一個數(shù)量級的問題。
“三個臭皮匠頂一個諸葛亮”不適用于技術(shù)團(tuán)隊
記者:攜程的OpenStack團(tuán)隊有幾個人?目前團(tuán)隊是什么情況?
葉亞明(Eric Ye):這個團(tuán)隊不大,核心技術(shù)人員有六、七個,團(tuán)隊總共加起來二十人不到,關(guān)鍵是找到合適的人。中國有一句老話叫“三個臭皮匠頂一個諸葛亮”,這句話對做 技術(shù)的人來說是不合適的;哪怕十個人加在一起也沒有他一個人厲害,他可以在一個問題上有所突破。這跟下棋是一樣的,一個人厲害,十個人也下不過他,一樣的 道理。
不能以犧牲業(yè)務(wù)為代價來提升技術(shù)的架構(gòu)
記者:現(xiàn)在互聯(lián)網(wǎng)公司都傾向于開源開放,在某種程度上來說,開放和開源有很大程度的聯(lián)系,我們關(guān)注很多互聯(lián)網(wǎng)公司基本上都用的是開源的那些產(chǎn)品。不知道對攜程來說,你們是不是也是這樣?
葉亞明(Eric Ye):我加入攜程之前,攜程已經(jīng)有了很長時間的歷史,攜程起家比較早,做的很成功。他后面有了一套運營的東西。我進(jìn)來的時候,像由offline到online轉(zhuǎn)變 的過程,這里面的技術(shù)改變比較大,原來有的東西我不能全部翻掉,也不能那么快。我不能太激進(jìn),但是我要去改變,這是一個難題。
攜程的技術(shù)里其實很多東西已經(jīng)是開源的,大數(shù)據(jù)還沒有不是開源的;有一些地方開源做起來比較難,推進(jìn)不能太激進(jìn)。我有一個原則,不能以犧牲業(yè)務(wù)為代價來提升技術(shù)的架構(gòu),這個原則要掌握。我不能到業(yè)務(wù)團(tuán)隊說,你們業(yè)務(wù)給我停一下,我技術(shù)要翻新;我不能說這句話,要求我的團(tuán)隊也不能說這句話。
我有一部分資源留出來做技術(shù)的提升,如果這個開源對我們的長期發(fā)展來說是合適的,我肯定會引進(jìn)。這是“我們要站在前人的肩膀做事情”的理念。如果一個地方我覺得開源很合適,并且是一個新的領(lǐng)域,一定會這樣做。