北京基因組所(國家生物信息中心)發布人類癌癥代謝物關聯知識庫MACdb
近日,中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數據中心開發的人類癌癥代謝物關聯知識庫(MACdb)正式上線。該研究成果以“MACdb: A curated knowledgebase for metabolic associations across human cancers”為題在Molecular Cancer Research 期刊在線發表。
癌癥代謝組通過對小分子代謝物的全局分析反映癌癥類型、基因組異常、藥物治療方案等癌癥狀態的關鍵信息,鑒定的差異代謝物作為生物標志物被廣泛應用于腫瘤診斷和治療反應評估。隨著代謝組學研究的發展,針對不同癌癥類型、基因組異常、藥物反應評估的代謝物關聯關系已被廣泛報道。癌癥-代謝物的關聯關系分散在不同的研究且存在命名不統一的問題,這為綜合評估代謝產物在癌癥中的作用、尋找可用于癌癥早期診斷的標志物帶來了巨大的挑戰。
MACdb建立了癌癥-代謝物關聯關系的收集標準,通過使用一系列本體(Ontology)對癌癥類型、特征、代謝物標準化,將收錄信息存儲于代謝物(Metabolite)、特征(Trait)、研究(Study)和出版物(Publication)四類瀏覽頁面,實現分散數據的整合與無縫關聯。目前,基于對17類高發病率或高死亡率癌癥代謝組學文獻的人工審編,MACdb共收錄了462篇文獻中的40,710個癌癥-代謝物關聯關系,涵蓋269個癌癥特征。
MACdb提供了一系列友好的用戶界面,以支持研究人員交互式瀏覽、檢索、可視化以及富集癌癥-代謝物關聯關系。MACdb支持從癌癥類型、特征、代謝物名稱、文獻ID等層面快速檢索和篩選信息,提供癌癥、特征、代謝物三個層面關聯的可視化知識圖譜(Knowledge Graph),配備代謝物標準化(NameToCid)工具,實現代謝物名稱與PubChem Cid的映射。此外,基于40,710個癌癥-代謝物關聯關系構建的富集工具(Enrichment),提供代謝物和癌癥類型、特征的富集分析。MACdb是當前最全面的人類癌癥-代謝物關聯知識庫,為全方位研究不同癌癥類型、特征中的代謝物關聯關系,識別癌癥中的關鍵代謝標記物提供支撐。隨著越來越多的代謝物在癌癥中的作用被揭示,MACdb將為人類癌癥研究提供更多增值服務。
北京基因組研究所(國家生物信息中心)工程師孫艷玲及鄭欣暢,博士研究生王國梁及碩士研究生王釔博為本文共同第一作者,趙文明正高級工程師和鮑一明研究員為共同通訊作者。本工作得到中科院戰略性先導科技專項及中國科學院基因組科學數據中心項目的資助。
MACdb內容概覽