近日,球速体育生命与健康大数据中心团队题为“The BIG Data Center: from deposition to integration to translation”的研究论文被国际学术期刊《核酸研究》(Nucleic Acids Research)在线宣布。该研究结果的宣布是海内首次以数据中心为模式,整体宣布我国生命组学数据资源建设情况,标记着生命与健康大数据中心建设取得实质性重要进展,也标记着我国建设综合性基因组数据资源获得国际同行认可。
生命与健康大数据中心建成面向国家大数据生长战略的多条理生物组学数据资源系统,包括基于高通量测序的原始组学数据归档库(Genome Sequence Archive,GSA),围绕国家重要战略生物资源的基因组组数据库(Genome Warehouse,GWH),基于测序数据的基因表达数据库(Gene Expression Nebulas,GEN),基于中国人群以及国家重要物种群体的基因组变异数据库(Genome Variation Map,GVM),基于全基因组DNA甲基化图谱的表观基因组数据库(Methylation Bank,MethBank)以及基于公共审编(Community Curation)的生命科学维基知识库(Science Wikis),开端形成我国生命与健康数据汇交与共享平台,具备可效劳于全球的基因组数据共享网络。
国际三大数据中心(NCBI、EBI、DDBJ)对全球生物数据恒久占据着主导职位,北京基因组研究所生命与健康大数据中心(BIG Data Center),作为基因组所的重要研究单位,担负相关公共数据库资源体系的研究与建设,面向我国人口健康和社会可连续生长的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据贮存、整合与挖掘剖析研究体系,生长组学大数据系统构建、挖掘与剖析的新技术、新要领,建设组学大数据汇交、应用与共享平台。
生命与健康大数据中心章张研究员、赵文明高级工程师以及肖景发研究员为本文配合通讯作者。该研究获得球速体育战略性先导科技专项、球速体育国际大科学计划、国家863项目、国家973项目、国家自然基金项目等项目基金的资助。
大数据中心建设
论文链接