北京基因组所(国家生物信息中心)相助开发基于基因遗传信息预测冠心病患病危害的新模型
为实现对个体未来罹患冠心病危害的精准预测,球速体育(国家生物信息中心)汪敏先研究组与美国博德研究所(Broad Institute of MIT and Harvard)Amit V. Khera研究组相助,在利用冠心病单族裔及单疾病遗传关联信息的模型基础上,进一步开发整合差别族裔人群配景及多个冠心病临床危险因素信息的全基因组多基因危害评分新模型——GPSmult。该模型预测的准确性凌驾了美国临床预防医学领域用于评估个体动脉粥样硬化性心血管疾病患病危害的“金标准”——美国心脏病学会/美国心脏协汇合并行列方程组(American College of Cardiology/American Heart Association Pooled Cohort Equations),大幅提高了利用基因组遗传信息预测个体未来患冠心病危害的准确度,能够进一步改善约40%个体的危害预测准确性。相关研究结果于7月7日以“A multi-ancestry polygenic risk score improves risk prediction for coronary artery disease”为题在国际顶尖期刊《自然医学》(Nature Medicine)宣布。该结果有望在冠心病高危害人群的早期识别及精确分层上发挥作用,增进冠心病精准防治。
冠心病是导致人类死亡的最主要疾病之一,受个体遗传、代谢及不良生活方法的配合影响,其中遗传因素的影响约为40%~60%。由于个体基因信息在一生中基本坚持稳定,并且早在婴幼儿时期即可通过血液或唾液等无创方法收罗获得,因此GPSmult模型能够在生命最早期基于个体基因信息预测其未来爆发冠心病的危害,从而为尽早预防与干预疾病争取了辽阔的时间窗口。
利用来源于冠心病全基因组关联研究国际联盟的全球多个族裔人群近27万例冠心病患者和118万例健康人群的全基因组比照关联研究结果,该模型首先剖析了基因变异与疾病之间的相关关系,然后对全基因组规模内与疾病危害相关的所有遗传变异位点进行建模整合。为提高模型预测准确性,进一步整合了基因变异与十种冠心病临床危险因素及关联共病之间的关联关系,使用样本数凌驾了1346万例(图1)。在多族裔人群配景、总计超51万人的独立验证人群中,对新模型的准确性进行了全面评估,与目今已宣布的27种基于全基因组信息预测冠心病危害的模型相比,新模型的准确性均有显著提升。
图1. 模型架构及训练与验证示意图
将英国生物银行(UK Biobank)中的30.8万欧洲人群依据GPSmult评分从小到大平均分为100组,统计每组内实际爆发冠心病的人数比例。结果显示,GPSmult模型盘算出的多基因危害评分与疾病危害之间具有显著的相关性,得分最低的组内冠心病的爆发率小于0.6%,然而得分最高的组内冠心病的爆发率高达16.3%,两组之间疾病的实际爆发率相差近27倍(图2)。
图2. 冠心病患病危害与多基因危害评分漫衍之间的关系
在目前的心血管病预防指南中,推荐对既往有过冠心病、外周动脉疾病、缺血性卒中、糖尿病或严重高胆固醇血症病史的个体使用他汀类药物治疗,以资助降低心血管疾病再次爆发的危害和死亡率�;厥灼饰鲇⒐镆兄�30.8万欧洲人群长达 12年的随访跟踪数据,位于GPSmult评分漫衍前3%的个体,尽管个体没有上述既往病史,其冠心病的爆发危害与已有疾病史的个体险些相当(图3)。
图3. GPSmult识别的3%高危害个体发病危害与有既往病史的个体疾病危害相当
美国心脏协会/美国心脏病学汇合并行列方程主要利用血脂、血压、年龄及性别等古板心血管疾病危险因素建模,预测个体未来10年的动脉粥样硬化性心血管疾病危害。而GPSmult基于个体基因信息预测先天疾病危害,将两种模型整合使用预测效果更优。通过对英国生物银行中32.6万多族裔人群的数据剖析显示,在古板危害模型的多个疾病危害分层中,GPSmult均能进一步增强对个体患病危害的预测,且广泛适用于差别遗传配景的个体,特别是对南亚人群或者是古板危险分层处于高危害(危害大于20%)的个体,其增强效果越创造显(图4)。
图 4. GPSmult与基于古板危险因素的合并行列方程联合使用效果。在古板危害模型的多个疾病危害分层中,GPSmult均能进一步增强对个体患病危害的预测
北京基因组研究所(国家生物信息中心)汪敏先研究组恒久致力于利用人群行列遗传大数据解析冠心病等心血管庞大疾病的遗传基础与机制,预测疾病未来爆发危害。除利用基因遗传信息外,研究组正在开展利用人脸、眼底照片、盘算机断层(CT)扫描和核磁共振等相关影像数据,开发人工智能模型,从医学影像学数据中提取疾病危害特征,从而表征和量化个体后天危害,整合先天遗传和后天情况因素等生命周期多阶段信息开发越发精准的危害预测模型,开发针对中国人群优化适用的疾病危害预测新模型,增进个体健康治理。
该研究由中科院北京基因组研究所(国家生物信息中心)、美国博德研究所(Broad Institute of MIT and Harvard)、麻省总医院(Massachusetts General Hospital)、哈佛大学医学院(Harvard Medical School)和斯坦福大学医学院(Stanford University School of Medicine)等机构配合相助完成。麻省总医院的Aniruddh P. Patel博士与北京基因组研究所(国家生物信息中心)汪敏先研究员为并列第一作者,北京基因组研究所(国家生物信息中心)的汪敏先研究员和博德研究所的Amit V. Khera教授为本研究的配合通讯作者。
论文链接