AWS在過去十年里定義了云計算的運營模式,我們相信AWS也將在未來的系統(tǒng)里成為領(lǐng)頭羊。AWS系統(tǒng)創(chuàng)新的秘訣在于專門的設(shè)計,可以打破低效和臃腫的集中式處理架構(gòu)的束縛。我們相信,這些舉措使得AWS能夠適應跨云、數(shù)據(jù)中心以及近端和遠端工作負載的多樣性。
在本文的分析里,我們將深入探討AWS過去的一些舉措,解釋他們是如何取得今日的成就,以及為什么我們認為這將導致行業(yè)的轉(zhuǎn)型,我們也會討論這些對客戶、合作伙伴和AWS的眾多競爭對手意味著什么。
AWS的架構(gòu)之旅:通往Nitro和Graviton之路
AWS掀起了一場基礎(chǔ)架構(gòu)即服務的革命,基礎(chǔ)架構(gòu)即服務讓人們可以輕松地獲得可以按需部署及按需退場的虛擬機。亞馬遜使用的虛擬機是高度定制的Xen版本,可以允許多個虛擬機在一臺物理機上運行。管理程序的功能由英特爾公司的x86中央處理單元芯片控制。
根據(jù)亞馬遜首席技術(shù)官Werner Vogels說,這種虛擬機結(jié)構(gòu)導致多達30%的處理能力被浪費了,這意味著虛擬機也在支持管理程序功能和管理系統(tǒng)的其他部分,包括存儲和網(wǎng)絡(luò)。這些開銷導致AWS決定開發(fā)定制的特定應用集成電路,以幫助加速工作負載。
AWS從2013年開始交付定制芯片,同年還與Advanced Micro Devices Inc. (AMD)芯片合作并宣布推出EC2 C3實例。隨著AWS云計算規(guī)模的擴大,亞馬遜對相應的性能提升并不滿意,AWS看到架構(gòu)上存在著限制。
這促使了AWS從2014年開始與Annapurna實驗室合作。云計算巨頭AWS在2015年推出EC2 C4實例。C4的ASIC優(yōu)化了存儲和網(wǎng)絡(luò)卸載功能,但仍然依賴英特爾至強,英特爾至強是個控制點。
2015年,AWS斥資收購了Annapurna,據(jù)報道金額為3.5億美元,這對于獲得其未來系統(tǒng)設(shè)計的秘方而言只是一筆微不足道的數(shù)目。這次收購的結(jié)果是2017年出現(xiàn)了現(xiàn)代版Nitro項目。Nitro卸載卡是2013年首次推出的。
當時AWS推出了C5實例,用KVM取代了Xen,將管理程序與ASIC更緊密地耦合在一起。Vogels去年曾表示,這一里程碑式的舉措卸下了剩余的組件,包括控制平面和I/O的其余部分,處理能力的近100%都用于支持客戶的工作負載,而且還實現(xiàn)了裸機版計算,裸機版計算催生了與VMware公司的合作,使得VMware公司在AWS上推出了VMware云。
然后AWS在2018年又邁出了下一步,推出了Graviton,Graviton是基于Arm的AWS定制設(shè)計芯片。因而打破了對x86的依賴,開啟了架構(gòu)新時代,Graviton現(xiàn)在支持各種配置,可以支持數(shù)據(jù)密集型工作負載。這些舉措為AWS的其他創(chuàng)新奠定了框架,包括為機器學習和人工智能優(yōu)化的新芯片,涵括了訓練、推理等芯片。
總之,AWS架構(gòu)開辟了一種方法,可以卸載目前由中央處理器完成的工作。這種方法為未來奠定了基礎(chǔ),可以允許內(nèi)存共享、內(nèi)存分解和獨立資源,這些都可以配置成支持云及邊緣等工作負載,成本遠低于通用方法所能實現(xiàn)的成本。
Nitro是該架構(gòu)的關(guān)鍵?偨Y(jié):AWS Nitro是一套定制硬件和軟件,在基于Arm的芯片上運行,是由Annapurna催生的。AWS已將管理程序、網(wǎng)絡(luò)和存儲虛擬化遷移到專用硬件上,因而釋放了CPU,使其得以更有效地運行。我們認為,這一點如此引人注目的原因是,AWS現(xiàn)在擁有的架構(gòu)可以在龐大的整個可尋址市場的各個層面進行競爭,包括公共云、企業(yè)內(nèi)部數(shù)據(jù)中心以及近端和遠端邊緣。
為整個行業(yè)定向
下面的圖表是從企業(yè)技術(shù)研究(Enterprise Technology Research縮寫為下文的ETR)的數(shù)據(jù)集里提取的數(shù)據(jù)。圖表列出了目前爭奪云、數(shù)據(jù)中心和邊緣的未來主要參與者。我們加上了英偉達公司和英特爾。兩家公司沒有直接出現(xiàn)在ETR的調(diào)查數(shù)據(jù)里,但兩家公司顯然是這些領(lǐng)域的平臺參與者。
上圖數(shù)據(jù)的縱軸顯示了凈得分,是對支出速度的一種衡量。橫軸是市場份額,是對普及性的衡量。我們在這里不打算糾纏參與者的相對位置,我們只會對各參與者給出一些評論,從AWS開始。我們上面已經(jīng)說了AWS走到這一步的歷程,我們相信AWS正在為未來定向。
AWS——AWS確實在大力推動從x86向旗下基于Arm平臺的遷移。Patrick Moorhead在Six Five峰會上采訪了AWS EC2的負責人David Brown。Brown廣泛地談了從x86到AWS基于Arm的Graviton 2的遷移。他還宣布了一項新的開發(fā)者挑戰(zhàn),以加速向Arm的遷移。
Brown給客戶準備的甜頭是40%的性價比。他舉例說,一個客戶運行100臺服務器實例,遷移到Graviton2實例后,可以用60臺服務器完成同樣的工作?蛻粜枰鲆恍┻w移工作,但回報大。
一般來說,我們想到遷移就不免退縮。遷移的商業(yè)價值是個處決于所取得的利益減去遷移成本的函數(shù),遷移成本必須考慮各種業(yè)務中斷、代碼凍結(jié)、重新培訓和時間價值等變量。但在這種情況下AWS似乎正在將遷移的痛苦降到了最低。
據(jù)Brown說,對客戶的好處是,AWS目前提供大約400種不同的EC2實例。今年早些時候,去年出貨的新EC2實例里有近50%是基于Arm的實例。而且AWS正在努力加快從x86遷移到AWS自己的設(shè)計的步伐。
都是一些顯而易見的好處。
英特爾——英特爾終于對市場力量做出了認真的回應。我們認為英特爾基本上是在借鑒Arm的玩法。我們今天就來侃一下這個事情。2015年,英特爾斥資167億美元收購了現(xiàn)場可編程門陣列制造商Altera。
英特爾的Navin Shenoy同樣在Six Five峰會上介紹了英特爾稱之為基礎(chǔ)架構(gòu)處理單元或IPU的細節(jié)。IPU與英特爾的一切都由中央處理單元控制的規(guī)范不同。IPU基本上就是的智能網(wǎng)絡(luò)接口卡,數(shù)據(jù)處理單元也是如此,這些都是事關(guān)卸載工作負載、分解內(nèi)存和發(fā)展片上系統(tǒng)(SoC)和封裝系統(tǒng)(SoP)。
但仔細想一下,英特爾在過去一周的動作——至少我們覺得——顯然是為了創(chuàng)造一個類似于Nitro的平臺。收購這個平臺的基礎(chǔ)花了167億美元。AWS收購Annapurna只花了3.5億美元,比一下真是有點不可思議。
Shenoy在他的演講中表示,“我們已經(jīng)在微軟Azure上非常大批量地部署了使用FPGA的IPU,我們最近還陸續(xù)宣布了與百度、京東云及VMWare的合作。”
我們特別來看看VMware的情況。
VMware——VMware是這場競賽中另一個真正突出的平臺玩家。VMware在2020年宣布推出Project Monterey,Project Monterey是個基于英特爾那些FPGA的項目。VMware也是參與者,選擇了與英特爾合作很可能是出于各種原因。一個原因是在VMware上運行的軟件是為x86構(gòu)建的,并且存在一個巨大的安裝基礎(chǔ)群。另一個原因則是,英特爾新任首席執(zhí)行官Pat Gelsinger在Monterey項目醞釀期里正在領(lǐng)導VMware,他是英特爾的傳奇人物,對未來看得很清楚。
不管怎么說,VMware擁有一個類似于Nitro的產(chǎn)品。在我們看來,VMware的可選性受到英特爾的限制,但至少VMware加入了游戲,而且似乎在這個領(lǐng)域的競爭里處于領(lǐng)先地位。
其他超大規(guī)模廠商
微軟公司、谷歌公司和阿里巴巴是什么情況呢?我們堅信,盡管英特爾和微軟之間存在的關(guān)系,微軟和谷歌以及阿里巴巴都將跟隨AWS的步伐開發(fā)類似Nitro的基于Arm的平臺。我們認為,他們必須這樣做,目的是跟上AWS的步伐。
其他數(shù)據(jù)中心商家:戴爾、思科、HPE、IBM和甲骨文
戴爾科技公司擁有VMware股權(quán)。盡管即將進行拆分,但我們預期在這方面不會有任何真正的改變。戴爾將充分利用VMware的做法,而且比其他人做得更好。
思科系統(tǒng)公司很有意思,思科剛剛改造了旗下的UCS,但我們沒有見到任何證據(jù)表明其路線圖里有類似Nitro的計劃;萜掌髽I(yè)有限公司也是如此。這兩家公司的歷史和能力都和芯片有著不解的淵源。思科現(xiàn)在可以為運營商級的使用案例設(shè)計自己的芯片,而我們也報道過,HPE可能還是帶點“機器”殘余的味道。但這兩家公司都很可能跟隨VMware的步伐采用基于英特爾的設(shè)計。
IBM會怎么做呢?這個嘛,我們真的不知道。我們認為IBM能做的最好事情是將IBM云遷移到基于Arm的Nitro平臺上。我們認為大型主機也應該遷移到Arm。現(xiàn)在要建個專門的大型主機CPU實在是太昂貴了。
假若我們是甲骨文公司的負責人,我們會建立或合作建立一個基于Arm的、類似Nitro的數(shù)據(jù)庫云,在這樣的數(shù)據(jù)庫云里運行甲骨文數(shù)據(jù)庫比在其他平臺運行甲骨文數(shù)據(jù)庫更便宜、更快、耗能更少。而且我們會走多一步,會為甲骨文云里為其他競爭數(shù)據(jù)庫做優(yōu)化,只在云數(shù)據(jù)庫上運行表格。想象一下Snowflake在甲骨文云里運行的情景吧!
說一下FPGA——我們一直對FPGA市場不是十分感冒。誠然,F(xiàn)PGA并不是筆者的工作范圍,但是我們從來沒有覺得這些大規(guī)模的收購是合理的。英特爾收購Altera以及AMD斥資350億美元收購Xilinx,這兩次收購在我們看來都有點虛浮,而將二者與AWS的Annapurna收購相比時更是如此。我們從The Next Platform找到一份不錯的FPGA市場概述報告,該報告將FPGA定位為一個正在下降的市場。我們并不覺得驚訝。
AMD至少在利用自己虛浮的股價在進行交易,但是我們真心認為Arm生態(tài)系統(tǒng)將日益令FPGA市場趨向式微,Arm可以更加簡單地及更快速地遷移到SoC,可以具有更好的性能、靈活性、集成度和移動性。我們認為FPGA是低批量的,遠不如來自Arm生態(tài)系統(tǒng)的可編程創(chuàng)新有吸引力。
我們聯(lián)系了Moor Insights & Strategy的Patrick Moorhead,想了解他對AMD Xilinx交易的看法。以下是他的想法。
這是令人鼓舞的反饋。由于虛浮的市場條件和AMD股票的使用,這個交易看起來在財務上是可行的。我們覺得,如果AMD專注于將Arm組件集成到自己的設(shè)計里,則可以加速旗下業(yè)務。
我們?nèi)匀徊荒懿辉偬嵋幌聛嗰R遜3.5億美元收購了Annapurna,太漂亮了。令人驚嘆。
英特爾對未來數(shù)據(jù)中心的設(shè)想
下面是Shenoy展示的一張圖表,描繪了英特爾對未來的愿景。
我們來分解一下。上面看到的是IPU,這些IPU是嵌在所示的四個區(qū)塊中的智能網(wǎng)卡,通過一個元件結(jié)構(gòu)進行通信。通用計算在左上方,機器智能在左下方,右上方是存儲服務,右下方是各種替代處理器。
這是英特爾對共享資源的看法,過去的共享資源世界里所有東西都由中央處理單元控制,現(xiàn)在過渡到一個更獨立的、可以并行工作的資源集合。
Gelsinger談到各種很酷的技術(shù),這些技術(shù)將使英特爾能夠合并各種接口(包括能夠?qū)崿F(xiàn)內(nèi)存共享和分解的PCI 5代和CXL內(nèi)存接口)及5G和6G連接等等。
Arm如何看未來
首先,Arm的營銷傾向真正的技術(shù)型。但在下圖里可以看到,Arm與英特爾的愿景有明確的相似之處,特別是用紅色虛線標出的右側(cè)部分。里面不同類型的處理器塊是可編程的。注意兩邊的“高帶寬內(nèi)存”HBM3 + DDRS,托著處理器塊,處理器塊是整個系統(tǒng)共享的,由PCIe-Gen5、CXL或CCIX、多片式插座連接。
是,你看著這個,兩套框圖,覺得有什么大不了的。雖然分解、隱含共享內(nèi)存和先進標準的使用有相似之處,但也有一些明顯的區(qū)別。
特別是,Arm在SoC層面上,而英特爾談的是FPGA。Arm架構(gòu)Neoverse現(xiàn)在以測試模式發(fā)貨,到2022年底將有產(chǎn)品進入終端市場。英特爾談的是2025年,或最早2024年。Arm的路線圖要清晰得多。而英特爾說將在10月份發(fā)布更多細節(jié),所以也許我們會在那個時候重新調(diào)整,但對我們來說,Arm顯然走得更遠一些。
另一個主要區(qū)別是數(shù)量。英特爾從高端數(shù)據(jù)中心入手,據(jù)推測會計劃推向下游市場的邊緣。Arm則是從邊緣開始的,低成本、低能耗、高性價比。Arm已經(jīng)在邊緣領(lǐng)域取得了勝利,而且根據(jù)我們之前分享的AWS數(shù)據(jù),它在企業(yè)中的地位明顯提高了。
過去的歷史資料強烈表明,量是制勝的法寶。
對客戶和生態(tài)系統(tǒng)的影響
我們來看看對于客戶和合作伙伴的生態(tài)系統(tǒng)而言這意味著什么。
我們提出的第一點是,務必跟隨消費者應用程序。消費者應用程序的功能(如圖像處理、自然語言處理、面部識別、語音翻譯)在今天移動領(lǐng)域里有些是推理功能,這些功能必將找到進入企業(yè)生態(tài)系統(tǒng)的途徑。
云里與機器學習相關(guān)的成本其中90%涉及推理。在未來,企業(yè)中的大部分人工智能將是實時推理,當然將來的邊緣人工智能也是實時推理。實時推理尚未出現(xiàn)在今天的企業(yè)中,因為太昂貴了,而且在消費者之外的用例也不成熟。這就是為什么AWS正在打造用于推理的定制芯片。AWS希望降低成本和增加采納率。
第二點,應該開始做些實驗,看看能用基于Arm的平臺做些什么。摩爾定律正在加速,Arm在性能、性價比、成本和能耗方面都處于領(lǐng)先地位。例如,將一些工作負載遷移到Graviton后,就可以看到究竟推動了哪些類型的成本節(jié)約以及可以看到能向企業(yè)提供的哪些新應用。可以讓幾個工程師負責這項任務,看看他們在兩、三周內(nèi)能做些什么。你或許會收到驚喜,或者你可能會說這對我們來說太早了點,但不妨一試。你可能會中大獎。
我們還建議去和混合云供應商談談,看看他們是不是提供Nitro。我們分享過,VMware有一個清晰的路線圖。其他戰(zhàn)略供應商又是什么情況呢?他們的路線圖是什么呢?他們從現(xiàn)在起的時間框架是什么,是不是會推出以專業(yè)服務為主導的定價模式、每兩年推出更快的盒子等等類似Nitro及更具吸引力的軟件模式等等?他們?nèi)绾慰紤]降低你的成本和支持新的工作負載規(guī)模呢?
對于獨立軟件供應商而言,務必要考慮一下我們之前討論過的那些消費者功能,例如現(xiàn)在汽車里所有那些移動和自動化系統(tǒng)以及類似生物識別技術(shù)等等。這些機器智能功能將進入你的軟件。你的競爭對手正在積極地將這些功能移植到Arm。他們正在將這些類似于消費者的功能嵌入到他們的應用程序里。你在做嗎?我們強烈建議你看一下,去和你的云計算供應商談談,看看他們能做些什么來幫助你創(chuàng)新、加快運行和降低成本。
什么都不做、看著市場如何發(fā)展有的時候也是一種可行的策略。但我們認為現(xiàn)在不是這樣的時候。
來源:siliconANGLE
來源:siliconANGLE