北京基因組所(國家生物信息中心)發布熱帶作物組學數據庫TCOD
熱帶作物是熱帶農業的重要組成部分,具有資源稀缺性、功能多樣性和廣泛的市場需求,為全球熱帶農業生產國提供了相當可觀的經濟收入。測序技術的飛速發展推動了熱帶作物研究領域里程碑式的發展,積累了海量的多組學數據。然而,大量的數據分散在不同的數據中心或網站,給數據利用帶來了不便。因此,亟需開發一個綜合數據整合與共享平臺,為研究人員提供良好的數據查找和在線分析服務。
近日,中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數據中心趙文明研究團隊與海南大學王文泉研究團隊等合作開發的熱帶作物組學數據庫(TCOD)正式上線。該研究成果以“TCOD: an integrated resource for tropical crops”為題在國際學術期刊Nucleic Acid Research 在線發表。
TCOD整合了木薯、橡膠樹、咖啡、可可、香蕉等15種熱帶作物的多組學數據,包括34個染色體級別的基因組序列、1,255,004個基因的功能注釋、來源于2,048個全基因組重測序樣本的282,436,992個變異位點、88個全轉錄組測序項目的基因表達譜以及13,381條種質描述信息,以基因為橋梁關聯多種組學數據,為用戶提供便捷的數據瀏覽、檢索和下載等一站式服務。同時,TCOD還提供了不同物種基因組間的同源基因關系,支持根據基因功能、通路注釋、基因組變異和基因表達等信息深入探索不同物種之間共有的生物學特征,促進跨物種研究開展。此外,為了方便用戶開展數據挖掘,TCOD提供了一系列在線工具,具體包括序列相似性比較、下游引物設計、文獻檢索、基因通路富集、同源基因查找和基因組共線性可視化。
隨著育種4.0時代的到來和人工智能技術的興起,TCOD集成多物種、多組學數據和在線工具,將為熱帶作物選擇育種和性狀改良研究提供支撐。
中國科學院北京基因組研究所(國家生物信息中心)博士研究生康海龍、碩士研究生黃天昊和博士研究生段光亞為本文共同第一作者,趙文明正高級工程師和王文泉研究員為共同通訊作者。本工作得到了國家重點研發計劃、中科院戰略性先導科技專項和國家自然科學基金等項目的資助。
TCOD數據庫結構框架