阿尔茨海默病(AD)是最常见的神经退行性疾病,以由 β 淀粉样蛋白(Aβ)和 tau 蛋白构成的老年斑与神经原纤维缠结为主要病理特征,脑脊液(CSF)中的 Aβ42 和磷酸化 tau(p-tau)是反映 AD 病理特征的经典生物标志物,但仅能体现疾病复杂生物学机制的一小部分,同时认知衰退也是 AD 的典型特征,而现有诊断框架存在不足。随着组学技术的发展,蛋白质作为理想标志物在 AD 研究中受到关注, CSF 蛋白质浓度能反映大脑内持续的病理生理过程,2025年9月30日美国印第安纳大学医学院放射学与影像科学系神经影像学中心Kwangsik Nho团队在Alzheimers Dement发表名为“Cerebrospinal fluid proteins in relation to longitudinal cognitive trajectories”文章,旨在通过 CSF 蛋白质组学和纵向认知域复合评分,揭示 AD 患者纵向认知轨迹背后的生物学过程。



研究队列:
本研究蛋白质组学使用SomaScan 7k panel,从 ADNI 队列中筛选受试者,最终纳入 728 名受试者进行横断面分析,包括 173 名认知正常(CN)老年人、403 名轻度认知障碍(MCI)患者、152 名 AD 患者;同时纳入 697 名具备随访认知评估数据的受试者进行纵向分析,分组为 170 名 CN、398 名 MCI、129 名 AD。
研究亮点
CSF蛋白水平的改变与认知衰退的变化相关
与记忆相关的蛋白质主要富集于小胶质细胞中
与执行功能相关的蛋白质富集于少突胶质细胞中
认知轨迹的预测性能提升幅度最高达 30.9%



与横断面特定认知域复合评分及其纵向轨迹相关的蛋白质
研究者采用线性回归模型和线性混合效应模型进行差异蛋白质分析(DPA),以识别与基线特定认知域复合评分及其纵向变化相关的蛋白质。共鉴定出 690 个适配体与基线记忆(MEM)复合评分显著相关,其中 226 个适配体在 MEM 评分较高的个体中表现出丰度升高, 464 个适配体在 MEM 评分较高的个体中表现出丰度降低(图 1A)。共鉴定出 578 个适配体与基线执行功能(EF)复合评分显著相关,366 个适配体在 EF 评分较高的个体中表现出丰度升高,212 个适配体表现出丰度降低(图 1B)。共鉴定出 526 个适配体与基线语言(LAN)复合评分显著相关,216 个适配体在 LAN 评分较高的个体中表现出丰度升高,310 个适配体在 LAN 评分较高的个体中表现出丰度降低(图 1C)。

图1.基于横断面认知功能DPA及记忆相关差异丰度蛋白火山图
为进一步探究已鉴定蛋白质的生物学意义,研究分析了这些蛋白质在不同认知域间的重叠性与特异性。在所有显著相关的适配体中,311 个适配体为各认知域共有。其中,129 个适配体在认知域评分较高的个体中丰度升高(图 2A),182 个适配体在认知域评分较高的个体中丰度降低(图 2B)。丰度升高的蛋白质富集于突触与轴突发育、细胞表面受体活性相关通路(图 2C),而丰度降低的蛋白质则富集于化学突触传递、磷酸化负调控相关通路(图 2D)。对纵向特定认知域复合评分的DPA显示,854 个适配体与 MEM 的纵向变化显著相关,523 个适配体丰度较高时,与 MEM 随时间缓慢下降相关;而 331 个适配体丰度较高时,与 MEM 快速下降相关(图 3A)。477 个适配体与 EF 复合评分的纵向变化显著相关,257 个适配体丰度较高时,与 EF 缓慢下降相关,220 个适配体丰度较高时,与 EF 快速下降相关(图 3B)。420 个适配体与 LAN 复合评分的纵向变化显著相关,166 个适配体丰度较高时,与 LAN 缓慢下降相关,254 个适配体丰度较高时,与 LAN 快速下降相关(图 3C)。

图2.DPA功能富集分析中显著升高蛋白重叠部分

图3.基于纵向认知功能变化DPA及与记忆相关的差异丰度蛋白火山图
差异丰度蛋白质的功能富集分析
为探究差异丰度蛋白质的生物学功能,作者利用GO术语进行了通路富集分析。富集分析针对基线时各认知域的丰度升高蛋白质和丰度降低蛋白质分别进行。MEM相关的丰度升高蛋白质富集于 264 条与神经元胞体、转移酶活性调节及谷氨酸能突触轴突相关的通路(图 4D),而丰度降低蛋白质则富集于 162 条与神经元胞体、转移酶活性调节及谷氨酸能突触轴突相关的通路(图 4G)。EF相关的丰度升高蛋白质富集于 244 条与神经系统发育、神经元分化调控及细胞黏附识别相关的通路(图 4E),而丰度降低蛋白质则富集于 127 条与囊泡介导的转运调控、泛素蛋白连接酶活性及蛋白质分解代谢过程相关的通路(图 4H)。LAN相关的丰度升高蛋白质富集于 122 条与突触和轴突调控、受体调节信号传导及细胞活化调控相关的通路(图 4F),而丰度降低蛋白质则富集于 133 条与氨基酸修饰、细胞骨架组织调控及细胞外基质相关的通路(图 4I)。针对认知域的纵向变化,MEM相关的丰度升高蛋白质富集于 270 条与神经系统发育、跨膜受体蛋白及上皮细胞调控相关的通路(图 5D),而丰度降低蛋白质则富集于 163 条与细胞骨架组织和突起、蛋白质分解代谢过程及肽基氨基酸相关的通路(图 5G)。EF相关的丰度升高蛋白质富集于 141 条通路,包括与投射神经元发育、受体激酶活性及信号受体功能相关的通路(图 5E)。相反,丰度降低蛋白质富集于 94 条与轴突、谷氨酸能突触及肽基氨基酸修饰相关的通路(图 5H)。LAN相关的丰度升高蛋白质富集于 100 条与细胞黏附突触、神经元胞体及感觉器官发育相关的通路(图 5F),而丰度降低蛋白质则富集于 120 条与突触组织调控、蛋白质分解代谢过程及肽基氨基酸修饰相关的通路(图 5I)。

图4.基于横断面认知功能DPA及功能富集

图5.认知功能纵向变化DPA及功能富集
预测特定认知域复合评分纵向轨迹的机器学习分析
训练机器学习模型以评估蛋白质特征对纵向认知轨迹的预测性能,模型 1 采用逻辑回归训练,以APOE基因型作为输入特征。模型 2 采用八种不同的机器学习算法训练,将APOE及DPA中鉴定的蛋白质整合为输入特征。对于MEM复合评分的纵向轨迹,模型 1 的曲线下面积(AUC)达到 0.63,模型 2 的曲线下面积(AUC)达到 0.76。与MEM预测模型的结果一致,与仅含APOE的模型 1 相比,纳入蛋白质特征的EF和LAN预测模型(模型 2)也表现出性能提升。随后基于弹性网络回归得出的绝对系数值评估特征重要性,以构建最终预测模型。研究者使用特征重要性(FI)评分 > 0.4 的蛋白质构建最终模型。FI分析显示,在MEM预测模型中,包括 YWHAB、YWHAG和YWHAZ在内的 9 种蛋白质的重要性值 > 0.4;在EF模型中,YWHAG、YWHAE、NPTX2和GARS1这 4 种蛋白质的重要性值 > 0.4;在LAN模型中,YWHAZ、YWHAG、NPTX2和MAPRE3这 4 种蛋白质的重要性值 > 0.4。MEM的最终预测模型曲线下面积(AUC)达到 0.79,相较于模型 1 提升了 27.4%。EF的最终预测模型曲线下面积(AUC)达到 0.75,提升了 33.9%。LAN的最终预测模型曲线下面积(AUC)达到 0.76,提升幅度为 35.7%(图 6)。

图6.基于弹性网络回归纵向认知变化机器学习预测
与认知功能特定认知域复合评分相关的蛋白质共丰度网络模块及其通路
研究者构建了无标度网络通过层次聚类树状图识别模块,结果显示在 5256 个适配体中,4488 个基于丰度相关性被聚类为 15 个模块,其余 768 个未聚类适配体被排除于后续分析。这些模块反映了与脑细胞类型及本体相关的多种生物学功能。进一步分析了模块与认知域评分的关联(图 7),在 15 个模块中,4 个模块(ME4、ME5、ME14、ME15)与横断面特定认知域复合评分显著相关,5 个模块(ME4、ME6、ME7、ME14、ME15)与这些评分的纵向变化显著相关。其中,ME15 模块与横断面认知表现的关联最强,包括记忆(MEM,FDR p=6×10⁻¹⁰)、执行功能(EF,FDR p=2×10⁻⁵)和语言(LAN,FDR p=3×10⁻³;图 5A);同时也与 MEM(FDR p=9×10⁻¹⁰)、EF(FDR p=9×10⁻⁴)和 LAN(FDR p=2×10⁻⁵;图 7B)的纵向变化显著相关。

图7.与认知功能及脑细胞类型相关的模块鉴定;行代表每个模块的模块特征基因(MEs),列表示性状及脑细胞类型。热图展示经错误发现率(FDR)校正的 p 值,显著性水平由叠加的星号标注;*FDR p<0.05、**FDR p<0.01、***FDR p<0.001。在(A)和(B)图中,星号颜色表示 β 系数的方向性,蓝色表示负相关,红色表示正相关
基于互作网络的模块核心蛋白(Hub proteins)分析
构建每个网络模块中的互作网络,并通过 MCC 评分确定网络内的核心蛋白(Hub proteins)。ME4 模块包含 263 个蛋白节点和 411 条边,按 MCC 值排名前 20 的核心蛋白包括 HSP90AA1、HSP90AB1和 HSPA8(图 8A)。ME5 模块包含 227 个节点和 146 条边,核心蛋白包括 EGFR、FGF17和 HGF(图 8B)。ME6 模块包含 205 个节点和 372 条边,核心蛋白包括 AHSG、ALB和 SERPINA1(图 8C)。最后,ME7 模块包含 206 个节点和 47 条边,核心蛋白包括 CTLA4、INS和 TIGIT(图 8D)。

图8.蛋白质-蛋白质互作(PPI)网络及核心基因可视化;方形节点代表蛋白质,边代表蛋白质间的关联,节点上显示的颜色代表 MCC 评分,MCC 评分高的蛋白质以红色显示
网络模块蛋白质的功能富集分析
为探究与特定认知域复合评分显著相关的网络模块蛋白质的生物学功能,研究者进行了GO通路分析。ME4中的274种蛋白质富集于200条与结合蛋白调控、蛋白质分解代谢过程、氨酰-tRNA连接酶活性、黏着斑及钙黏蛋白结合相关的通路(图9A)。ME5中的248种蛋白质富集于179条与投射神经元发育、炎症反应及轴突过程相关的通路(图9B)。ME6中的237种蛋白质富集于119条与胆固醇稳态、免疫调节信号及钙离子结合相关的通路(图9C)。ME7中的210种蛋白质富集于99条与免疫效应调控、组蛋白修饰活性及质膜调控相关的通路(图9D)。

图9模块蛋白质GO富集分析结果可视化;节点大小表示蛋白质数量,颜色对应p值,颜色越深表示统计显著性越高



本文讨论部分围绕CSF蛋白质与AD患者认知轨迹的关联展开,首先通过DPA揭示了YWHAG、S100A13、NPTX2等蛋白质与纵向认知轨迹相关;还提到纳入差异蛋白质的机器学习模型对认知轨迹预测性能较仅用APOE基因型的模型最高提升30.9%,特定蛋白质对不同认知领域预测贡献显著;最后指出研究存在样本量有限、无法推断因果关系、数据多来自高加索人群等局限性,需后续研究完善。
文案:何嘉乐
图片来源:图片均来源于参考文献

云准医药科技(上海)有限公司是一家专注于提供单细胞多组学、空间多组学和SomaScan蛋白质组学科研服务的公司。
围绕疾病生物学研究、药物研发、新型诊断技术开发等生物医学领域和公共卫生等全民健康领域,云准实验室已经与众多客户产生合作。
合作方向涉及肿瘤、免疫、慢病、罕见病等诸多方向以及公共卫生等全民健康领域。涉及疾病机理机制研究和分子分型、生物标记物发现、药物新靶点发现、药物机理机制研究、临床前和临床研究以及临床检测等细分领域。
一直以来,质量意识和技术创新都是云准实验室的立身之本。
未来,云准将以创新为驱动,继续对产品进行深度整合与开发,推动慢病诊疗、罕见病研究、肿瘤免疫治疗、病理诊断技术以及药物研发领域的突破性发展,必将为这些领域带来革命性变化。
单细胞+空间多组学技术服务
单细胞原位空间蛋白组表型分析服务 | 空间转录组整体解决方案服务 | PhenoImager多色荧光免疫成像技术服务 | 单细胞多组学解决方案 | 流式细胞分选技术服务 | 激光显微切割服务
显微成像扫片服务
活细胞成像及玻片扫描服务 | Marianas LightSheet 成像技术服务 | CTLS 组织透明化成像服务
基因测序服务
全外显子测序服务 | MassARRAY 核酸质谱基因分型检测 | 肿瘤分子诊断服务
高通量蛋白组学服务
SomaScan新一代高通量蛋白组学检测服务 | Krex自身抗体检测方案
全代谢组检测服务
非靶向代谢检测服务 | 全靶向代谢检测服务 | 靶向代谢检测服务

云准医药科技(上海)有限公司
地址:上海市徐汇区桂平路333号5号楼7楼
电话:021-64157928
邮箱:marketing@accuramed.com
云准医药科技(广州)有限公司
地址:广州市海珠区广州国际生物岛,百济神州创新中心5楼510-511
电话:020-22066070
雲準生物科技有限公司
地址:香港新界香港科技园二期9W1楼CCC13室
电话:852 5933 6081