北京基因組所(國家生物信息中心)國家基因組科學數據中心的多個數據庫被Cell期刊推薦使用
近日,國際著名學術期刊Cell在其數據遞交指南中將北京基因組所(國家生物信息中心)國家基因組科學數據中心(CNCB-NGDC)的多個數據庫列為其生命組學數據存儲的推薦數據庫,包括組學原始數據歸檔庫(Genome Sequence Archive,GSA)、人類遺傳資源組學原始數據歸檔庫(Genome Sequence Archive for Human,GSA-Human)、基因組變異數據庫(Genome Variation Map,GVM)、全球生物數據庫目錄(Database Commons),標志著中國在生命組學大數據領域的國際化認可又邁出了重要一步,也標志著CNCB-NGDC的數據庫體系逐漸被國際認可。
此次Cell推薦的數據存儲共涉及組學原始數據、基因組變異數據、生物數據庫三種重要的數據類型。組學原始數據歸檔庫GSA是我國最早及最大的組學數據匯交、存儲、管理和共享平臺,采取公開下載的方式發布數據,已匯聚超過8PB組學原始數據,支撐發表科學論文600余篇。GSA-Human系統專用于歸檔人類遺傳資源數據,采用受控方式存儲和共享數據,已匯聚超過6.8萬人的組學原始數據。基因組變異數據庫GVM是存儲基因組變異信息的二級數據庫,已收錄41個物種6.5萬個樣本的變異數據。全球生物數據庫目錄Database Commons是生物醫學數據庫的存儲與查詢系統,目前已收錄全球5455個數據庫,并提供各個數據庫的關鍵信息、分類和排名。
目前,GSA已被Elsevier、Wiley和Taylor & Francis出版集團列入核酸序列存儲數據庫推薦列表,并被Elsevier指定為亞洲唯一的基因數據歸檔庫。Cell是隸屬于Elsevier出版集團的國際頂尖期刊,目前是首次將中國生命科學數據中心的多個數據庫整體列出并認證。
自2015年10月建成以來,GSA系統不斷豐富完善,已服務于國家重點研發計劃、國家自然科學基金、中科院戰略先導等1000多個國家科研項目的數據匯交、共享與管理,用戶遞交數據量達到8589 TB,收錄來自國內外387個機構所提交的3651個項目、242,414個樣本、335,683個實驗和385,513個測序信息,涵蓋200多個物種,獲得國內外239個學術期刊的認可,支撐科研人員發表634篇研究論文,為我國生命組學大數據存儲與共享,防止數據孤島,提高數據利用價值等做出了重要貢獻。
組學原始數據歸檔庫GSA首頁
人類遺傳資源組學原始數據歸檔庫GSA-Human首頁
基因組變異數據庫GVM首頁
全球生物數據庫目錄Database Commons首頁