基因組學(xué)領(lǐng)域的數(shù)據(jù)正在劇增。在短短幾年內(nèi),美國國家衛(wèi)生研究院(National Institutes of Health,NIH)等組織托管的基因組數(shù)據(jù)已經(jīng)超過了50PB(5000萬GB),這些組織正在轉(zhuǎn)向云基礎(chǔ)架構(gòu),以便將數(shù)據(jù)提供給研究團(tuán)體。你該如何調(diào)整分析工具和協(xié)議來訪問和分析云端的海量數(shù)據(jù)?通過這本實(shí)用書籍,研究人員將學(xué)會(huì)如何使用基因組分析工具包(Genome Analysis Toolkit,GATK)、Docker、WDL、Terra等開源工具來處理基因組學(xué)算法。GATK用戶社區(qū)的長期監(jiān)理人Geraldine Van der Auwera和加州大學(xué)圣克魯茲基因組學(xué)研究所的Brian O’Connor會(huì)指導(dǎo)你完成這一過程。你將通過使用真實(shí)數(shù)據(jù)和相關(guān)領(lǐng)域的基因組學(xué)算法展開學(xué)習(xí)。
作者簡(jiǎn)介
Geraldine A. Van der Auwera博士是麻省理工學(xué)院-哈佛大學(xué)博德研究所數(shù)據(jù)科學(xué)平臺(tái)(Data Sciences Platform,DSP)的外聯(lián)和溝通負(fù)責(zé)人。