站在21年后的今天回望1999,無論對(duì)于汪建還是華大基因而言,都是具有里程碑意義的一年。這一年,作為“人類基因組計(jì)劃”中國研究員之一的汪建,一手創(chuàng)立了華大基因。
自上世紀(jì)90年代初以來,“基因”便成為人類繞不開的話題,學(xué)界更是從那時(shí)起開始涉足“人類基因組計(jì)劃”。
在你我或多或少都能談上一兩句“基因”的今天,基因已經(jīng)不再是那樣的新奇,它甚至關(guān)乎著你我自身的健康。
秉承“基因科技造福人類”的使命,懷抱“健康美麗,做生命時(shí)代的引領(lǐng)者”的愿景,華大基因以“產(chǎn)學(xué)研”一體化的發(fā)展模式引領(lǐng)基因組學(xué)的創(chuàng)新發(fā)展。然而,對(duì)于華大基因這樣的行業(yè)先行者而言,若想有一個(gè)更長遠(yuǎn)的未來,解決算力瓶頸成為立足基因測(cè)序行業(yè)的必然選擇。
計(jì)算資源緊張的時(shí)候
任務(wù)排隊(duì)等候是“家常便飯”
01、隨著業(yè)務(wù)規(guī)模的不斷擴(kuò)大,既反映了華大基因不可撼動(dòng)的行業(yè)地位,同時(shí)也讓它遭受了“幸福的煩惱”——“基因測(cè)序”需要龐大的算力支持。
往大了說,如今的生命科學(xué)研究競(jìng)賽,很多時(shí)候已經(jīng)變成了一場(chǎng)“算力”的比拼,好的科研成果通;邶嫶蟮挠(jì)算數(shù)據(jù)和強(qiáng)大算力的支撐;往小了說,目前的產(chǎn)前檢測(cè)、腫瘤檢測(cè)等醫(yī)療檢測(cè)也需要消耗大量的算力。
作為全球領(lǐng)先的生命科學(xué)前沿機(jī)構(gòu),目前華大基因已經(jīng)完成HPV檢測(cè)總數(shù)超過420萬例,完成耳聾基因檢測(cè)250余萬例,完成無創(chuàng)產(chǎn)前檢測(cè)510多萬例。
這些基因測(cè)序的流程中,動(dòng)輒涉及數(shù)萬到數(shù)十萬個(gè)基因測(cè)序及模型建立,依賴大量的計(jì)算和存儲(chǔ)資源,隨著未來業(yè)務(wù)量的那一步擴(kuò)展,將使華大基因的傳統(tǒng)IT架構(gòu)面臨一定挑戰(zhàn)——計(jì)算資源緊張的使用峰值時(shí),任務(wù)排隊(duì)等候更是“家常便飯”。
02、除此之外,基因測(cè)序行業(yè)還有這樣的特點(diǎn),對(duì)于算力的需求是波動(dòng)的。通常情況下,第4季度的消耗最大而第1季度最少,這便導(dǎo)致了服務(wù)器的數(shù)量無法得到很好的控制。
如何調(diào)配服務(wù)器成為擺在華大基因這樣基因測(cè)序企業(yè)面前的一大難題;驕y(cè)序行業(yè)有很多復(fù)雜基因組,在各個(gè)測(cè)序分析的階段需要借助不同規(guī)格的計(jì)算資源,線下計(jì)算集群往往無法適應(yīng)快速的擴(kuò)縮容。
03、除此之外,線下集群架構(gòu)不支持高通量基因測(cè)序數(shù)據(jù)的多任務(wù)并行,面對(duì)海量基因數(shù)據(jù),每個(gè)基因測(cè)序都是一個(gè)極其消耗計(jì)算資源的過程,傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和分析方式并不能支持高通量測(cè)序的需求。
面對(duì)基因測(cè)序行業(yè)困難與挑戰(zhàn),華大基因該如何化解?
華為云讓華大基因
“云端暢游”,事半功倍
面對(duì)大量待測(cè)數(shù)據(jù)的挖掘、存儲(chǔ)、計(jì)算等都給基因測(cè)序行業(yè)帶來了全新的挑戰(zhàn)。系統(tǒng)逐步上云成為基因行業(yè)未來高速度、高質(zhì)量發(fā)展中不可缺少的重要一環(huán)。
2018年,針對(duì)基因測(cè)序行業(yè)的困難與挑戰(zhàn),華為云推出了以Kubernetes為基礎(chǔ)的基因容器服務(wù)GCS(Gene Container Service)。通過華為云GCS-SGE容器方案,將基因測(cè)序和容器技術(shù)完美結(jié)合,可以幫助華大基因更好地解決新一代基因測(cè)序技術(shù)在應(yīng)用過程中所產(chǎn)生的大量數(shù)據(jù)存儲(chǔ)、識(shí)別、計(jì)算等問題。
為了更好地探索基因的奧秘和解決計(jì)算資源短缺等問題,華大基因率先開啟創(chuàng)新改革之路。“步入云端”后,華大基因既節(jié)省了測(cè)序時(shí)間,又針對(duì)測(cè)序算力需求波動(dòng),云端容器自主擴(kuò)容,解決了峰值期客戶各部門排隊(duì)情況。
不僅如此,華為云GCS服務(wù)還為華大基因提供全自動(dòng)化測(cè)序分析能力、低成本高可靠的存儲(chǔ)服務(wù),通過計(jì)算存儲(chǔ)分離、內(nèi)存及分布式緩存、智能調(diào)度等使大數(shù)據(jù)性能提升40%,成本降低50%。如今,華大科技服務(wù)已利用GCS-SGE方案完成超過300萬核時(shí)計(jì)算,合作期間始終保持云端平穩(wěn)運(yùn)行。
看華為云五大“技能”為華大基因提供算力加持
回到最初的起點(diǎn),人們關(guān)心的仍然是“基因測(cè)序技術(shù)能否鎖定個(gè)人病變基因,提前預(yù)防和輔助治療”的問題。因?yàn),基因科技產(chǎn)業(yè)的發(fā)展一頭連著經(jīng)濟(jì)發(fā)展,一頭連著民生福祉。(延伸閱讀:預(yù)言只在科幻里?不,可能還在基因里)
近年來,華為云也一直秉持“科技向善”的理念,華大基因與華為云的攜手,不僅以科技力量解碼基因測(cè)序,也為上述問題的解決提供了更多的可能,進(jìn)而讓更多人從中獲益。
可以想象,在“云+AI+5G”等新技術(shù)的加持下,華大基因和華為云將繼續(xù)為基因乃至泛醫(yī)療行業(yè)的發(fā)展帶來更多想象空間。