nature genetics|最新研究破解关键阿尔茨海默病脑脊液蛋白关键密钥

A-网站首页    应用案例    nature genetics|最新研究破解关键阿尔茨海默病脑脊液蛋白关键密钥

2024年11月11日斯坦福大Tony Wyss-Coray团队在nature genetics发表名为“Proteogenomic analysis of human cerebrospinal fluid identifies neurologically relevant regulation and implicates causal proteins for Alzheimer’s disease”的文章,通过SomaScan 5&7 k panel测量了来自3506份的多中心队列脑脊液(CSF)样本并结合基因组数据通过分析 6361 种蛋白质生成了迄今为止最大的CSF pQTL 图谱。确定了 1883 种蛋白质的 3885 种关联,包括 2885 个新的 pQTL,表明 CSF 中存在独特的基因调控。在 3 号染色体 3q28(OSTN 附近)和 19 号染色体 19q13.32(APOE 附近)鉴定出富含 CSF 的多效性区域,这些区域富含神经元特异性和神经发育相关基因。通过蛋白质组全关联研究(PWAS)、共定位和孟德尔随机化分析,将关联结果与阿尔茨海默病(AD)相结合,确定了 38 种潜在致病蛋白,其中 15 种已有可用药物。最后,开发了一种基于蛋白质组学的 AD 预测模型,其性能优于基于遗传学的模型。这些发现将有助于进一步了解生物学机制,并确定与大脑和神经系统性状相关的致病蛋白和可成药蛋白。

研究队列


ADNI:689 samples;Barcelona-1:198 samples;DIAN:195 samples;FACE:439 samples;Knight-ADRC (Oct 2021):805 samples;Knight-ADRC (June 2023)47 samples;MARS176 samples;PPMI785 samples;Stanford172 samples

研究设计  


图1.研究设计

研究结果


脑脊液蛋白质组学的独特遗传结构

文章使用基于适配体的蛋白质组学检测方法(SomaScan 7k)和来自 3506 名(EUR)具有欧洲血统的无血缘关系的个体遗传数据(图1),对 CSF 进行了蛋白质组学分析(图 1),其中包括 1243 名认知正常对照者、1021 名晚发性 AD 患者和 1242 名其他神经退行性疾病患者(表 1)。确定了 2042 个适配体(1883 种蛋白质)的 2477 个索引 pQTL 关联(图 2b )。在 2477 个关联中,1272 个(51.4%)为顺式 - pQTL,1205 个(48.6%)为反式 - pQTL。与先前的研究一致,作者观察到 CSF pQTL 在组织和分子水平上具有高度特异性。顺式 - pQTL,与血浆 pQTL(1272 个中的 382 个,30.0% 共享)和大脑皮层 eQTL(1272 个中的 288 个,22.6%)的重叠最高,这表明在蛋白质水平以及 CSF 和大脑之间存在相似性。这些发现强调了蛋白质的调控与 RNA 不同,包括通过影响蛋白质定位、分泌和构象变化的翻译后机制(磷酸化、糖基化、剪切等),所有这些因素都可能影响 CSF 蛋白质水平。   

表1.联合分析中使用的质控后样本的人口统计信息

多效性区域调控神经通路

多效性基因组区域可能是生物通路的关键驱动因素,但在 QTL 研究中常常被忽略。作者确定了 166 个与至少两种蛋白质相关的基因组区域(图 2b 顶部),其中三个区域(chr3q28, chr6p22.2–21.32和 chr19q13.32)与超过 50 种蛋白质相关。由于chr6p22.2–21.32上的人类白细胞抗原(HLA)区域的复杂性,对于这些区域,文中进行了通路和细胞类型富集分析,以确定受调控蛋白质的细胞背景。然后使用 GWASCatalog 进行全表型关联研究(pheWAS),以确定每个区域的 pQTL 变体调控的其他性状。chr3q28 区域位于 GMNC OSTN 之间,与 208 种独特蛋白质相关(图 3a),所有这些都是反式的。在血浆中仅观察到该区域的一个 pQTL,表明这是一个 CSF 特异性的 pQTL 热点。该区域调控的蛋白质包括参与突触功能的 syntaxin 家族的五个成员和参与神经发育和记忆的 ephrin 家族的五个成员。对于这 208 种蛋白质中的每一种,文中都分析了大脑相关细胞类型表达数据,以确定细胞特异性,并观察到在神经元中的显著富集(图 3b),支持该区域与大脑相关性状的相关性。此外,还观察到 303 条富集的通路,最显著的几乎完全是神经元和细胞表面通路(图 3c)。对该区域的索引变体进行 pheWAS,确定了 12 种相关性状,其中 11 种是大脑形态、体积或表面积的测量值(图 3d)。重要的是,作者还观察到 rs9877502 与 CSF 中磷酸化 tau 水平之间的关联(P = 1 × 10−36),磷酸化 tau 是 AD 的关键生物标志物。作者同时注意到,该区域 3' 端侧翼的 OSTN 在人类神经元中高表达,调节人类大脑中的树突生长,并被提议为该位点的候选基因,参与 DNA 复制的 GMNC 位于该区域的 5' 端。   

图2b.联合分析中具有显著意义的 2042 个适配体的 2477个索引 pQTL 的二维曼哈顿图。x 轴,pQTL 信号的基因组位置;y 轴,与具有 pQTL 的适配体相对应的蛋白质编码基因的位置。颜色代表索引变体的顺式或反式状态(顺式,蓝色;反式,绿色)。顶部,绘制了基因组的多效性区域(限制为 100 种与同一区域有关联的蛋白质)    

图3.三个多效区域构成了参与神经过程蛋白质调控的热点

与 AD 相关的新蛋白

接下来问研究者试图通过三种互补方法在 AD 背景下扩展这一研究:通过 PWAS 分析遗传预测的蛋白质水平与 AD 的相关性、通过孟德尔随机化(MR)确定 AD 的致病蛋白以及通过共定位(coloc)识别蛋白质和 AD 的共享关联。在经过错误发现率(FDR)校正和多效性过滤后,108 种蛋白质的 125 个 pQTL 与 AD 显著相关。接下来,研究者又进行了 MR,并确定了 17 种独特的蛋白质可能是 AD 的致病蛋白(图 4a,FDR 校正 < 0.05)。最后,评估了 2477 个显著的 pQTL 关联(顺式和反式)与 ADGWAS 之间的共定位。在排除多效性区域后,32 种蛋白质的 QTL 与 AD 风险共定位(PP.H4 > 0.8)(图 4a),进一步分析了通过至少两种方法(PWAS、MR 和共定位)与 AD 相关的蛋白质。在 PWAS、共定位和 MR 优先确定的所有蛋白质中,8 种(均为顺式)在所有三种方法中均显著,38 种(24 种顺式、13 种反式和 1 种顺式和反式)通过两种方法显著(图 4a - d)。文中的发现支持了十个 GWAS 位点的提名功能基因:APOE、ACE、CR1、CTSH、EGFR、GRN、IL34、SHARPIN、TMEM106BTREM2。作者还分析在三个 AD 风险位点提名了替代候选基因。首先,1q32.2 的关联与 CR1 相关,但观察到 CR1 和 CR2 水平与 AD 风险的共定位关联。鉴于 CR1 和 CR2 的相似性,两者可能在涉及 AD 发病机制的神经炎症中起作用。在 7q22.1 的 AD 位点,提名的基因是 ZCWPW1NYAP1。研究者还确定了 14 种由反式 pQTL 驱动与 AD 相关的蛋白质(图 4c),接下来评估了它们在这些机制中的作用。免疫相关蛋白质包括 TREM2,它调节小胶质细胞对神经退行性变的反应。TREM2 与跨膜免疫信号衔接蛋白 TYROBP(DAP12)形成复合物,通过其免疫受体酪氨酸激活基序(ITAM)调节小胶质细胞的激活。另一个高度显著的通路是内溶酶体通路,包括新的 AD 相关蛋白质(图 5b)。最后,作者搜索了 DrugBank 以确定针对 AD 相关蛋白质的治疗化合物,在 38 种蛋白质中,15 种有报道的分子(图 4d)。通过分析,作者确定了许多致病和可成药的蛋白质,这些蛋白质可能为未来的 AD 治疗提供了有希望的靶点。   

图4.AD相关蛋白在小胶质细胞和免疫相关通路中富集   

图5b.免疫和溶酶体蛋白的细胞定位:六种溶酶体蛋白(CLN5、表皮生长因子受体 (EGFR)、TMEM106B、GRN、CTSH、CST8)参与溶酶体处理系统的各个组成部分。AD 优先蛋白以黑色文本突出显示;ER,内质网

鉴定的蛋白质成功预测 AD 状态

确定准确的生物标志物组合以优先识别 AD 风险个体是该领域的一个重点,作者试图确定蛋白质组学(与疾病状态无关)是否可以将蛋白质优先作为 AD 生物标志物。通过选择 PWAS 显著的适配体(n = 456)并在训练数据集((n = 1,325)中进行LASSO回归来选择 AD 状态的预测因子(Npredictors = 100),进而开发了一个蛋白质风险评分。该模型在训练集(曲线下面积(AUC)= 0.949;补充图 25)和测试集((AUC = 0.902;图 4g)中都能准确地对参与者进行分类。使用临床状态开发的模型在根据淀粉样蛋白/tau 生物标志物状态对样本进行分类方面明显更好(AUC = 0.963, P = 8.89 × 10−5),这表明该模型可能能够准确地对具有 AD 临床前特征的个体进行分类。   

补充图25.使用 PWAS 优先蛋白预测 AD 和淀粉样蛋白/tau 状态

讨论


蛋白质由于其在生物过程中的积极参与,所以通常直接导致疾病。然而,对于调节组织间蛋白质水平的遗传基础知之甚少,尤其是在神经系统性状的背景下。CSF 与神经系统相关,因为它是围绕大脑和脊髓的液体,并且许多 CSF 蛋白质来源于中枢神经系统。本文对 CSF 进行了蛋白质组学分析,旨在了解这个特殊身体系统中蛋白质的调节因子。这个数据集在样本量(n = 3506)和蛋白质数量(n = 6361)方面扩展了先前的 CSF pQTL 工作。确定了 1883 种蛋白质的 3885 个全研究范围的独立显著 pQTL 关联(2605 个顺式,1280 个反式),并证实它们具有高度的 CSF 和蛋白质特异性,支持了分析组织相关蛋白质组数据集以理解复杂性状的重要性。研究者观察到位于 3q28 和 19q13.32(靠近 APOE)的高度多效性、CSF 偏向的基因组区域,这些区域富含神经元蛋白质,证明了这些经常被忽视的 pQTL 热点的重要性。同时研究者也将 pQTL 与 ADGWAS 数据相结合,并优先确定了 38 种蛋白质,其中 24 种未被先前的研究提名。文中还确定了 AD 的药物再利用候选物,包括西妥昔单抗、乙酰唑胺和钙受体靶向药物。此外,研究者也使用与 AD 相关的蛋白质开发了一个预测模型,在各个方面都优于 PRS(多基因风险评分),包括在年龄和 APOE 分层的背景下,相比于遗传学,突出了蛋白质与疾病之间的紧密联系。   

文案:何嘉乐

配图来源于网络,如有侵权请联系我们删除


关注我们

      FOLLOW US      



浏览量:0