摘要:从大规模相互作用网络中识别蛋白质复合物,对解释特定的生物进程和预测蛋白质功能具有重要作用,同时也是后基因组时代一个最重要的研究课题.考虑到传统仅基于蛋白质相互作用网络(PPI网络)的蛋白质复合物识别算法可靠性不高,本文提出了一种新的融合PPI网络和基因表达数据的蛋白质复合物识别算法IPCIPG.区别于之前用基因表达数据评估PPI网络可靠性的做法,本文提出在蛋白质复合物的识别过程中将PPI网络和基因表达数据有机地结合起来.算法IPCIPG首先根据边聚集系数(ECC)与蛋白质问共表达的相关性(PCC)计算PPI网络中每个节点的权重,权重最大的节点作为种子,然后从种子节点开始扩充生成稠密子图.基于酵母数据集的实验结果表明,算法IPCIPG较其他算法HUNTER,HC—PIN,CMC,SPICI,MOCDE,MCL能够更准确,更有效地识别出具有特定生物意义的蛋白质复合物.
关键词:系统生物学 蛋白质相互作用网络 蛋白质复合物 基因表达数据
单位:中南大学信息科学与工程学院 长沙410083
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社