在亞馬遜云科技助力下,UBC CIC團隊和全球計算病毒學家啟動了The Open Virome(開放病毒組)項目,創(chuàng)建了開放的病毒發(fā)現(xiàn)云計算平臺Serratus。目前,該研究成果已經發(fā)表在科學雜志《自然》上,同時還創(chuàng)建了公開的病毒數(shù)據(jù)庫,向全球科學界分享研究成果,幫助加速對RNA病毒的研究。
RNA病毒引起的疾病包括普通感冒、流感、SARS、新冠肺炎、丙型肝炎、埃博拉、狂犬病、脊髓灰質炎和麻疹等。由于RNA病毒繁殖和進化速度快,其更容易感染新的宿主物種。如果基因組學研究人員能夠提前預見和識別新冠肺炎病毒,將徹底改變當前全球疫情的狀況。基于亞馬遜云科技的云服務所取得的研究成果,從根本上改變了生物信息學的研究方式。在此之前,科學家們經過幾十年的數(shù)據(jù)分析,只發(fā)現(xiàn)了1.5萬種病毒。在使用亞馬遜云科技的基礎架構和服務后,The Open Virome項目團隊在發(fā)現(xiàn)新病毒方面已經為科學界節(jié)省了數(shù)百萬美元和長達數(shù)年的時間。
病毒的識別和研究需要分析海量的基因測序數(shù)據(jù),這其中就包括數(shù)十萬種未知病毒的DNA和RNA。基因組學的數(shù)據(jù)量每天都在成倍地增長,造成病毒測序數(shù)據(jù)庫的總量非常龐大,依靠傳統(tǒng)計算方式根本無法對其進行全面分析或處理。The Open Virome項目負責人、計算病毒學家Artem Babaian認為,“預防未來大流行病的關鍵是知識。我們的數(shù)據(jù)量正在迅速超過處理能力,我們擁有所需的所有信息,但卻不具備使用這些信息的工具。”
The Open Virome項目的研究人員僅用8周時間,順利地在亞馬遜云科技上構建了功能強大的超級計算平臺。借助亞馬遜云科技卓越的彈性計算能力,他們能夠快速處理數(shù)百萬GB的數(shù)據(jù),并且獲得了顯著的成本效益。該團隊在亞馬遜云科技Amazon Simple Storage Service(Amazon S3)中鏡像了病毒基因測序數(shù)據(jù)庫SRA,之后使用亞馬遜云科技彈性計算云實例Amazon Elastic Compute Cloud (Amazon EC2)來分析數(shù)據(jù)集。項目組的目標是為處理每個測序數(shù)據(jù)集支付不到1美分,在項目完成時全面超越了這個目標,實際每個測序數(shù)據(jù)集支付不到半美分。
在短短11天內,該團隊就處理了高達570萬個測序數(shù)據(jù)集,并且僅僅花費了2.4萬美元,發(fā)現(xiàn)了13萬個新的RNA病毒。通過基于亞馬遜云科技搭建的Serratus平臺,研究人員相信他們既能識別潛在的有害新病毒,又能提醒科學家注意導致新冠肺炎病毒SARS-CoV-2 virus的潛在突變,幫助改善診斷測試和疫苗開發(fā),為醫(yī)療政策決策者提供更有效的指導。
醫(yī)療和生命科學行業(yè)是亞馬遜云科技的優(yōu)勢領域之一,通過在基因組學研究中應用云計算,賦能客戶將更多的時間和資源用于科研,幫助加速獲得洞見,更快地進行突破性研究和產品上市。亞馬遜云科技強大的計算和機器學習服務確?茖W家可以快速地執(zhí)行工作負載優(yōu)勢,近乎無限的計算能力且靈活的定價能夠帶來非常高的性價比,同時遍布全球的基礎設施和統(tǒng)一的架構,以及托管的40 多個開放的生命科學和基因組數(shù)據(jù)集,能夠確保實現(xiàn)全球范圍內開展安全的研究協(xié)作。
關于亞馬遜云科技
超過15年以來,亞馬遜云科技 (Amazon Web Services)一直以技術創(chuàng)新、服務豐富、應用廣泛而享譽業(yè)界。亞馬遜云科技一直不斷擴展其服務組合以支持幾乎云上任意工作負載,目前提供超過200項全功能的服務,涵蓋計算、存儲、數(shù)據(jù)庫、網絡、數(shù)據(jù)分析、機器學習與人工智能、物聯(lián)網、移動、安全、混合云、虛擬現(xiàn)實與增強現(xiàn)實、媒體,以及應用開發(fā)、部署與管理等方面;基礎設施遍及26個地理區(qū)域的84個可用區(qū),并已公布計劃在澳大利亞、加拿大、印度、以色列、新西蘭、西班牙、瑞士和阿聯(lián)酋新建8個區(qū)域、24個可用區(qū)。全球數(shù)百萬客戶,包括發(fā)展迅速的初創(chuàng)公司、大型企業(yè)和領先的政府機構,都信賴亞馬遜云科技,通過亞馬遜云科技的服務支撐其基礎設施,提高敏捷性,降低成本。要了解更多關于亞馬遜云科技的信息,請訪問:www.amazonaws.cn。
消息來源:亞馬遜云科技