亞馬遜云科技宣布近期與加拿大不列顛哥倫比亞大學(xué)云創(chuàng)新中心(UBC CIC)達(dá)成合作,基于亞馬遜云科技構(gòu)建的超級(jí)計(jì)算平臺(tái),助力國際科學(xué)家團(tuán)隊(duì)在短短11天內(nèi)搜索了近600萬份公開可用的生物樣本,成功識(shí)別出超過13萬種新的RNA病毒,其中包括9種新型冠狀病毒。這一工作如果使用一臺(tái)傳統(tǒng)計(jì)算機(jī)則需要2000年才能完成。該項(xiàng)目實(shí)現(xiàn)了RNA病毒研究的又一創(chuàng)舉,通過識(shí)別并溯源新型病毒,科學(xué)家們希望在病毒感染人、牲畜、農(nóng)作物和瀕危物種時(shí),能夠更早地識(shí)別出它們,幫助防范全球傳染病大爆發(fā)。
在亞馬遜云科技助力下,UBC CIC團(tuán)隊(duì)和全球計(jì)算病毒學(xué)家啟動(dòng)了The Open Virome(開放病毒組)項(xiàng)目,創(chuàng)建了開放的病毒發(fā)現(xiàn)云計(jì)算平臺(tái)Serratus。目前,該研究成果已經(jīng)發(fā)表在科學(xué)雜志《自然》上,同時(shí)還創(chuàng)建了公開的病毒數(shù)據(jù)庫,向全球科學(xué)界分享研究成果,幫助加速對(duì)RNA病毒的研究。
RNA病毒引起的疾病包括普通感冒、流感、SARS、新冠肺炎、丙型肝炎、埃博拉、狂犬病、脊髓灰質(zhì)炎和麻疹等。由于RNA病毒繁殖和進(jìn)化速度快,其更容易感染新的宿主物種。如果基因組學(xué)研究人員能夠提前預(yù)見和識(shí)別新冠肺炎病毒,將徹底改變當(dāng)前全球疫情的狀況?;趤嗰R遜云科技的云服務(wù)所取得的研究成果,從根本上改變了生物信息學(xué)的研究方式。在此之前,科學(xué)家們經(jīng)過幾十年的數(shù)據(jù)分析,只發(fā)現(xiàn)了1.5萬種病毒。在使用亞馬遜云科技的基礎(chǔ)架構(gòu)和服務(wù)后,The Open Virome項(xiàng)目團(tuán)隊(duì)在發(fā)現(xiàn)新病毒方面已經(jīng)為科學(xué)界節(jié)省了數(shù)百萬美元和長達(dá)數(shù)年的時(shí)間。
病毒的識(shí)別和研究需要分析海量的基因測(cè)序數(shù)據(jù),這其中就包括數(shù)十萬種未知病毒的DNA和RNA。基因組學(xué)的數(shù)據(jù)量每天都在成倍地增長,造成病毒測(cè)序數(shù)據(jù)庫的總量非常龐大,依靠傳統(tǒng)計(jì)算方式根本無法對(duì)其進(jìn)行全面分析或處理。The Open Virome項(xiàng)目負(fù)責(zé)人、計(jì)算病毒學(xué)家Artem Babaian認(rèn)為,“預(yù)防未來大流行病的關(guān)鍵是知識(shí)。我們的數(shù)據(jù)量正在迅速超過處理能力,我們擁有所需的所有信息,但卻不具備使用這些信息的工具。”
The Open Virome項(xiàng)目的研究人員僅用8周時(shí)間,順利地在亞馬遜云科技上構(gòu)建了功能強(qiáng)大的超級(jí)計(jì)算平臺(tái)。借助亞馬遜云科技卓越的彈性計(jì)算能力,他們能夠快速處理數(shù)百萬GB的數(shù)據(jù),并且獲得了顯著的成本效益。該團(tuán)隊(duì)在亞馬遜云科技Amazon Simple Storage Service(Amazon S3)中鏡像了病毒基因測(cè)序數(shù)據(jù)庫SRA,之后使用亞馬遜云科技彈性計(jì)算云實(shí)例Amazon Elastic Compute Cloud (Amazon EC2)來分析數(shù)據(jù)集。項(xiàng)目組的目標(biāo)是為處理每個(gè)測(cè)序數(shù)據(jù)集支付不到1美分,在項(xiàng)目完成時(shí)全面超越了這個(gè)目標(biāo),實(shí)際每個(gè)測(cè)序數(shù)據(jù)集支付不到半美分。
在短短11天內(nèi),該團(tuán)隊(duì)就處理了高達(dá)570萬個(gè)測(cè)序數(shù)據(jù)集,并且僅僅花費(fèi)了2.4萬美元,發(fā)現(xiàn)了13萬個(gè)新的RNA病毒。通過基于亞馬遜云科技搭建的Serratus平臺(tái),研究人員相信他們既能識(shí)別潛在的有害新病毒,又能提醒科學(xué)家注意導(dǎo)致新冠肺炎病毒SARS-CoV-2 virus的潛在突變,幫助改善診斷測(cè)試和疫苗開發(fā),為醫(yī)療政策決策者提供更有效的指導(dǎo)。
醫(yī)療和生命科學(xué)行業(yè)是亞馬遜云科技的優(yōu)勢(shì)領(lǐng)域之一,通過在基因組學(xué)研究中應(yīng)用云計(jì)算,賦能客戶將更多的時(shí)間和資源用于科研,幫助加速獲得洞見,更快地進(jìn)行突破性研究和產(chǎn)品上市。亞馬遜云科技強(qiáng)大的計(jì)算和機(jī)器學(xué)習(xí)服務(wù)確??茖W(xué)家可以快速地執(zhí)行工作負(fù)載優(yōu)勢(shì),近乎無限的計(jì)算能力且靈活的定價(jià)能夠帶來非常高的性價(jià)比,同時(shí)遍布全球的基礎(chǔ)設(shè)施和統(tǒng)一的架構(gòu),以及托管的40 多個(gè)開放的生命科學(xué)和基因組數(shù)據(jù)集,能夠確保實(shí)現(xiàn)全球范圍內(nèi)開展安全的研究協(xié)作。
關(guān)于亞馬遜云科技
超過15年以來,亞馬遜云科技 (Amazon Web Services)一直以技術(shù)創(chuàng)新、服務(wù)豐富、應(yīng)用廣泛而享譽(yù)業(yè)界。亞馬遜云科技一直不斷擴(kuò)展其服務(wù)組合以支持幾乎云上任意工作負(fù)載,目前提供超過200項(xiàng)全功能的服務(wù),涵蓋計(jì)算、存儲(chǔ)、數(shù)據(jù)庫、網(wǎng)絡(luò)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)與人工智能、物聯(lián)網(wǎng)、移動(dòng)、安全、混合云、虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)、媒體,以及應(yīng)用開發(fā)、部署與管理等方面;基礎(chǔ)設(shè)施遍及26個(gè)地理區(qū)域的84個(gè)可用區(qū),并已公布計(jì)劃在澳大利亞、加拿大、印度、以色列、新西蘭、西班牙、瑞士和阿聯(lián)酋新建8個(gè)區(qū)域、24個(gè)可用區(qū)。全球數(shù)百萬客戶,包括發(fā)展迅速的初創(chuàng)公司、大型企業(yè)和領(lǐng)先的政府機(jī)構(gòu),都信賴亞馬遜云科技,通過亞馬遜云科技的服務(wù)支撐其基礎(chǔ)設(shè)施,提高敏捷性,降低成本。