2020年1月22日,国家基因组科学数据中心正式宣布2019新型冠状病毒资源库。该库整合了世界卫生组织(WHO)、中国疾病预防控制中心(CDC)、美国国家生物技术信息中心(NCBI)、全球流感序列数据库(GISAID)等机构果真宣布的冠状病毒基因组序列数据、元信息、学术文献、新闻动态、科普文章。同时,对差别冠状病毒株的基因组序列做了变异剖析与展示。
2019新型冠状病毒基因组序列宣布动态
2019新型冠状病毒资源库收录了来源于NCBI的GenBank数据库和GISAID数据库宣布的2019新型冠状病毒(2019-nCoV)病毒株的株名、采样日期、采样所在、样本提供单位、数据递交单位等元信息。通过该资源库还可会见到国家基因组科学数据中心基因组数据库GWH从公共数据库收录的冠状病毒科基因组和卵白序列,用户可基于Accession号、种名、属名、采样日期、采样所在、宿主、疏散源、宣布日期等元信息筛选感兴趣的冠状病毒株,个性化选取序列进行下载以开展相关的科学研究。
2019新型冠状病毒资源库将连续更新元信息与基因组序列数据,实时监控NCBI的PubMed数据库中宣布的2019新型冠状病毒和其他冠状病毒的学术文献、中新网与新华网宣布的新闻,同步更新世界卫生组织与中国疾病预防控制中心宣布的科普介绍,为用户开展学术研究、掌握科研进展、了解新闻动态与科学知识提供资源与窗口。
GWH数据库收录的冠状病毒科基因组序列信息
2019新型冠状病毒资源库基于差别参考基因组序列开展2019-nCoV病毒株基因组变异剖析,并对结果进行了统计与可视化展示。通过对全基因组序列相似性比较和变异位点剖析,获取2019-nCoV病毒株之间、2019-nCoV病毒株与SARS冠状病毒以及与类SARS冠状病毒蝙蝠株之间的变异水平、变异区域、变异碱基的详细信息。经数据剖析,2019-nCoV与2003年爆发的SARS病毒基因组序列相似度为80%,与2017年2月从海内的蝙蝠中收罗到的Bat SARS-like coronavirus isolate bat-SL-CoVZC45基因组序列相似性最高,相似度为88%。对2019-nCoV病毒株的基因组变异剖析为追溯病毒来源、追踪病毒株变异路径、防控新型冠状病毒引发的疫情、治疗病毒性肺炎提供重要的数据基础与决策支持。
2019新型冠状病毒基因组变异剖析:基因组变异剖析的参考基因组为GenBank宣布的2019新型冠状病毒株基因组序列MN908947.3,SARS-Cov为SARS 冠状病毒,bat-SL-CoVZC45为类SARS冠状病毒蝙蝠株,其余基因组序列来源于GISAID宣布的2019新型冠状病毒株。红色竖线体现变异位点。