據說,地球上的微生物總量超過了銀河系中的恒星數量,而且病毒總量也要比之前預計的多得多。

在最新的Nature Biotechnology雜志上,美國能源部(DOE)聯合基因組研究所(JGI)構建了重要的病毒序列數據庫,同時提出了病毒基因組標準,指出了三類基因組質量的分級。
目前雖然許多病毒未知,或者未在實驗室培養,但基因組測序和分析方面技術的機制,讓研究人員能夠從宏基因組和元轉錄組數據集中識別出超過750,000種未培養的病毒基因組。
質量和分析指南
“病毒是每個微生物生態系統中的關鍵組成部分,由于JGI生成了大量這些數據,因此對開發病毒基因組標準特別感興趣,”JGI研究人員,第一作者Simon Roux說,“我們只是部分研究人員,我們龐大的研究機構詳細審查了這些數據,并提供指導以幫助確定數據質量。此外,在本文中,我們希望提供的不僅僅是標準,而是包括了對這些數據進行何種類型的分析,幫助想要描述自己實驗室新型病毒的研究人員。”
培養病毒已經有了自己的數據質量標準,但這些標準不能直接應用于未經培養的病毒,這些病毒的序列通常是不完整的,并且某些屬性只能通過計算方法間接預測。
馬里蘭大學醫學院基因組科學研究所的GSC主席Lynn Schriml說:“未定義的病毒基因組群體共同確定了對于學界什么是值得報道和有價值的東西。”
基因組質量的分類
在這篇論文中,Roux等人指出了未定義病毒基因組的最小信息量,包括來源,病毒基因組鑒定方法和數據質量。JGI先前已經開發了用于報告最小元數據的標準。
“病毒序列數據和微生物組數據的巨大增長需要強大的標準和數據質量指標,從而研究人員能夠利用這些數據進行比較分析,”JGI Metagenome計劃負責人,文章通訊作者Emiley Eloe-Fadrosh表示,“通過建立和推廣‘best practices’,研究人員就可以打破數據可訪問性和可重用性的障礙,在最初的項目范圍之外擴大研究范圍。”
研究團隊提出了三類基因組質量:
“Genome fragments”是指由單個或多個片段組成,預測完整性小于90%,或者沒有預測基因組大小,注釋量小;“high-quality draft genome”代表的是基因組序列完成了90%或更多,片段gaps主要是重復區域。最后,“finished genome”是指由沒有gaps的單個連續序列組成的完整基因組和廣泛的注釋。
11月5日凌晨,中國科學院動物研究所攜手華大生命科學研究院、北京基因組研究所(國家生物信息中心),在全球頂尖學術期刊《細胞》(Cell)上發表了最新研究成果,利用華大自主研發的“超廣角百億像素生命照相......
2024年10月12-17日,由中國疾控中心病毒病所應急技術中心主辦的全國繼續教育項目“2024年新型冠狀病毒與猴痘病毒監測檢測技術手把手培訓班”在四川省成都市成功舉辦,來自全國31個省(自治區、直轄......
記者10日了解到,國際頂級學術期刊《Cell》在北京時間9日11時發表了中山大學與阿里云合作的科研成果,研究團隊利用云計算與AI技術發現了180個超群、16萬余種全新RNA病毒,是已知病毒種類的近30......
文|《中國科學報》記者李思輝矛和盾,是冷兵器時代的常見武器。今天,科學家在研究一些病毒性傳染病時,發現它們的致病機理,竟然也類似于古代典故中的“以子之矛,攻子之盾”——病毒進入宿主體內后,讓宿主體內本......
秋冬季是呼吸道傳染病的高發期,這段時間氣溫下降,晝夜溫差大,再加上室內空氣流動有限或室內人群密集,呼吸道傳染病容易傳播開來。如何應對即將到來的呼吸道傳染病流行季?嬰幼兒、兒童等低年齡段人群該如何預防?......
竹子即竹亞科是禾本科的重要分支,廣泛分布于亞洲、非洲和拉丁美洲,約有1,700種。作為一類生長快、多年生、可再生的森林資源,木本竹子越來越多被用作木材的替代品,具有重要的經濟價值和生態價值。有研究發現......
弗吉尼亞大學醫學院孫杰(JieSun)、臧充之(ChongzhiZang)聯合Cedars-Sinai醫療中心PeterChen在Nature雜志上發表了題為Anaberrantimmune-epit......
中國專家團隊應用前沿交叉研究方法揭示多種養殖哺乳動物中的潛在跨物種傳播風險等,將為構建多維度公共衛生風險評估與新發傳染病預測預報體系提供數據支持。北京時間4日23時,最新一期《自然》(Nature)雜......
科技日報北京8月15日電(記者張佳欣)據最新一期《自然》雜志報道,德國康斯坦茨大學和維爾茨堡大學領導的國際研究團隊,對動物界最大基因組的擁有者——肺魚進行了基因組測序。肺魚基因組約為人類基因組大小的3......
在南美洲發現的一種肺魚是迄今測序的擁有最大基因組的動物。8月14日,一項發表于《自然》的研究顯示,美洲肺魚的DNA包含了驚人的910億個化學堿基,是人類基因組的30倍。然而,這910億個堿基只包含與人......