北京基因組所(國家生物信息中心)數據資源建設取得階段性進展
11月11日,中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數據中心(CNCB-NGDC)在國際學術期刊《核酸研究》(Nucleic Acids Research)在線發表題為“Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2021”的文章,以整體形式介紹基因組數據資源整合與挖掘體系建設方面的布局與進展。
2020年,CNCB-NGDC與共建單位及合作單位密切合作,開發了6個全新數據庫(新型冠狀病毒信息庫2019nCoVR,Aging Atlas,BrainBase,GTDB,LncExpDB和TransCirc),更新和豐富了多個核心數據庫資源(BioProject,BioSample,GSA,GWH,GVM,GEN和生物多樣性數據資源等),涉及衰老、疾病、調控和生物多樣性等多個前沿領域,初步形成我國生物數據安全匯交管理和多組學數據平臺的國家中心數據資源體系。1月22日,CNCB-NGDC率先發布了新型冠狀病毒信息庫,并始終保持全球最新、最完整的新冠病毒基因組數據發布動態,累計全球訪問量近百萬。此外,基于Elasticsearch技術升級開發了生物大數據搜索引擎BIG Search,系統整合了中心、EBI、NCBI和8個合作機構的38個重要數據資源,實現海量、異構生物數據的一站式跨庫高效檢索。
CNCB-NGDC免費向國內外用戶提供方便快捷的多組學數據匯交和存儲服務。目前已匯交來自331個單位1192個用戶遞交的超過5.4PB的組學數據,相關數據發表于187種國內外期刊的409篇文章。GSA已被國際著名出版商Elsevier收錄為指定的基因數據歸檔庫。2020年1月1日以來,CNCB-NGDC公共數據平臺訪問量超過188萬人次。
該工作得到科技部、中國科學院、自然科學基金委、一帶一路國際科學組織聯盟、國際生物科學聯合會等的資助。
國家生物信息中心-國家基因組科學數據中心數據資源