数据不依赖获取的质谱数据的深度学习分析方

Abstract

近年来,数据不依赖获取(data-independentacquisition,DIA)质谱技术在蛋白质组学领域内被广泛关注.然而DIA质谱数据具有维度高、背景噪声大、多种信号混合等特点,这使得DIA质谱数据的分析成为一大挑战.本文提出一种基于深度学习的可直接处理DIA质谱数据的算法:Ultra-DIA.该算法使用深度变分自动编码器提取离子信号的特征来区分不同肽段产生的子离子,最终生成虚拟谱图,进而对肽段和蛋白进行定性和定量分析.对于测试数据,该算法找到的肽段数量和蛋白数量比主流算法DIA-Umpire分别多61.4%和64.5%.此外,相较于 DIA-Umpire,该算法能够找到更多低浓度的蛋白.

Publication
厦门大学学报:自然科学版, 2021
帅建伟
帅建伟
课题组组长
PI

长期从事计算生物物理人工智能交叉学科的研究,包括智子力学、智能融合生命体、细胞信号网络动力学、深度学习核心算法构建、健康医疗大数据深度学习分析及深度学习在生物医学中的应用等。