深度神经网络筛选蛋白质组学高置信度定量 肽段

Abstract

质谱分析是蛋白质组学的重要研究方法。数据不依赖获取是一种稳定且复现性高的质谱仪数据采集方式,具有质荷比范围宽广,通量高等特点。DIA-NN是处理DIA蛋白质组学数据的主流定量软件之一。由于DIA-NN分析DIA数据后输出的肽段中存在低置信度肽段,生物学家需要根据肽段碎片离子色谱峰组图(XICs)的相似性来人工筛选出高置信度肽段。人工筛选的任务量大、耗时长,并且筛选标准因人而异,这导致结果具有主观性。本文提出了一种名为MSDeepFilter的算法,它基于深度学习技术,能够自动筛选出高置信度的肽段。MSDeepFilter算法结合压缩激励神经网络和残差网络设计深度学习模型,从XICs中提取特征,以此区分高置信度和低置信度肽段。与传统机器学习模型Adaboosting和支持向量机模型相比,MSDeepFilter模型在基准数据集上的多项分类性能指标均表现更优,测试集AUC值达到了98.7%。这表明MSDeepFilter具有优秀性能,可以替代人工筛选的环节

Publication
生物物理学, 2023, 11(2), 17-29
帅建伟
帅建伟
课题组组长
PI

长期从事计算生物物理人工智能交叉学科的研究,包括智子力学、智能融合生命体、细胞信号网络动力学、深度学习核心算法构建、健康医疗大数据深度学习分析及深度学习在生物医学中的应用等。