妙手医生
作为平台对基线时获得的约 54,000 名 UKB 参与者的 EDTA 血浆样本进行了蛋白质组学分析,捕获了 2,941 次检测所针对的 2,923 种独特蛋白质。检测细节之前已有描述,包括与 UKB 中测量的七个重叠临床检测进行比较,得出匹配异构体的强相关性(r = 0.82) 简而言之依赖于邻近延伸试验,该试验通过与互补寡核苷酸偶联的抗体对靶向蛋白质。与靶蛋白结合后,探针之间的杂交可实现扩增,并通过下一代测序进行相对定量。蛋白质靶向试验分为四个 384 重面板:炎症、肿瘤学、心脏代谢和神经病学。 的内部控制包括孵育(具有匹配抗体的非人类抗原)、延伸(与匹配寡核苷酸对偶联的)和扩增控制(合成双链 DNA)。每个板中都包含额外的外部控制,即阴性、板和样品控制。基于三次重复的阴性对照,计算每个板中每个蛋白质靶向测定的检测限值。标准化蛋白质表达 (NPX) 值是通过对延伸对照进行标准化生成的,对数2转换并进一步标准化为板对照。如果内部对照的 NPX 值不在丰度块中板中位数的 ±0.3 NPX 范围内,或者样本的平均检测计数小于 500,则将样本标记为警告。如果阴性对照的三重中位数与 Olink 设置的预定义值偏差超过 5 个标准差,则将检测标记为警告。我们排除了 (1) 从研究中移除的参与者和被定义为异常值的样本。异常值包括标准化第一或第二主成分值与平均值相差超过 5 个标准差或 NPX 中位数或IQR 大于平均中位数或平均 IQR 的 5 个标准差的个体。带有样本或检测警告的单个数据点,或者属于 70 个不满足 QC 标准的板的那些被设置为缺失。( N = 41,931,193 种疾病)中有 80 多例随访期内的发病病例(审查日期为 2020 年 12 月 31 日或死亡日期,如果先发生的话) 或“联盟选择”子集(25 种疾病)中的发病病例。这 218 种疾病包括常见病和罕见病,以及与高发病率、高死亡率或两者相关的疾病。疾病定义基于 Kuan 等人描述的经过验证的表型。通过整合仅供部分参与者使用的初级保健数据(即不使用任何专门为 COVID 研究提供的初级保健数据)、医院发病统计数据、癌症和死亡登记以及 UKB 健康问卷(包括自我报告的疾病)。我们排除了流行病例(在基线评估访问之前或之前首次发生)或在随访前 6 个月内记录的病例。我们注意到,我们没有排除患有其他流行疾病的“对照”(即未患上研究中疾病的个体)。这代表了最接近临床现实的情况,即多重疾病越来越普遍,最有用的预测模型将是那些能够在存在其他潜在疾病或病症的情况下区分感兴趣的结果的模型。我们对 25 种疾病中的 19 种进行了敏感性分析,其中包括联盟选定的参与者中的发病病例。对于这 19 种疾病,UKB-PPP 的随机子集中至少有 60 个发病病例,因此,通过从测试集中排除联盟选定的发病病例,可以证明预测性能与主要分析具有良好的一致性(Pearson r = 0.97)。这表明,根据特定特征或特定疾病的遗传风险选择的参与者的纳入并没有引入强烈的偏见质量控制之后,我们使用 missForest R 包45为随机或联盟选择的子集中所有符合 QC 和纳入标准的个体估算了缺失的 NPX 值,这些个体没有年龄、性别和 BMI 的缺失数据,并且所有蛋白质的缺失值不超过 50%(N = 48,054;41,931 人来自随机子集,6,123 人来自“联盟选择”的病例;补充表2)。按小组进行插补(即分别针对心血管、心血管 II、炎症、炎症 II、神经病学、神经病学 II、肿瘤学和肿瘤学 II 小组),包括年龄和性别的附加信息。使用子抽样(即不重复)来增加每个森林中的树的数量,而后将其设置为 50(“ntree”参数)。作为敏感性分析,我们在验证集中没有缺失值的个体中测试了所有优化模型(对于最终模型中的蛋白质),以评估插补程序的质量。我们观察到从测试集中得出的性能指标之间存在良好的一致性,其中包括一小部分插补蛋白质值和从没有缺失数据的个体中得出的性能指标我们进一步对有临床检测结果的个体 (N = 47,901) 的临床检测 (UKB 类别 17518) 和 9 种血细胞特征 (白细胞、淋巴细胞、单核细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、血小板计数、血红蛋白浓度和血细胞比容百分比) 的缺失值进行。我们采用了三步机器学习框架,包括 (1) 特征选择、(2) 超参数调整和优化以及 (3) 验证。个体分组如下:对于病例数超过 800 例的疾病,50% 进行特征选择,25% 进行模型优化(训练),25% 进行验证;否则,70% 进行特征选择和模型优化,30% 进行验证。验证集包括完全不了解先前模型开发阶段的非重叠个体。
互联网药品交易服务资格证书编号:粤C20150017 ICP备案号:粤ICP备14102178号
Copyright © 2010-2018 广东恒金堂医药连锁有限公司版权所有