System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机领域,尤其涉及一种网络增强及蛋白质复合物预测方法和系统。
技术介绍
1、蛋白质作为生命活动的主要承担者,广泛存在于各种生命体中。但是,单个蛋白质通常无法直接表现生物功能,而是通过与其他蛋白质相互协作,构成功能团簇参与诸多生命活动。这个所构成的功能团簇即蛋白质复合物。
2、蛋白质复合物可以由生物实验识别得到,但是通过该类方法进行复合物检测的成本高且耗时,也为其推广研究造成障碍,无法短时间满足大规模复合物的预测需求。当前伴随生物学数据的急速增长,为通过计算技术预测蛋白质复合物奠定了基础,能在一定程度上与生物实验形成优势互补,且利用计算技术预测复合物已经成为蛋白质组学领域研究中的一个重要课题。
3、计算方法中,利用蛋白质相互作用数据预测蛋白质复合物可以被定义为:给定一个表示蛋白质相互作用的网络(ppi网络),利用数据挖掘的方法,寻找相互作用网络中密集连接的子图。这些密集连接的子图即可视为待选的蛋白质复合物。由此可得,蛋白质相互作用网络的优劣直接影响复合物预测的效果。但是现有技术中存在因缺乏蛋白质相互作用网络拓扑数据的增强环节,导致蛋白质相互作用网络拓扑数据噪声较大,影响复合物预测效果的难题。
技术实现思路
1、为了克服上述问题,本专利技术提出一种基于量子蚁群优化的蛋白质相互作用网络数据增强方法,删除原蛋白质相互作用网络中包含的部分假阳性/假阴性的连边,提升蛋白质复合物预测的效果。
2、为此,本专利技术的一个方面提供一种网络增强及蛋白
3、步骤s1,通过qaco算法优化和重构蛋白质相互作用网络,包括以下步骤:
4、步骤s101,参数初始化,设置网络中所有链路的信息素、链路能见度的初始值以及量子信息素强度;
5、步骤s102,计算每次迭代的转移概率;
6、步骤s103,计算评估蚂蚁游走的适应函数;
7、步骤s104,更新每次迭代后的链路的信息素;
8、步骤s105,设置迭代优化过程的中止条件;
9、步骤s2,针对蛋白质相互作用网络和重构网络,分别基于mcode和ipca算法预测蛋白质复合物;
10、步骤s3,基于蛋白质相互作用网络和重构网络的预测结果进行对比分析;
11、进一步的,所述步骤s1中,在进行蛋白质相互作用网络重构时选定整个网络作为训练集,并通过qaco算法来预测节点间相互连接的可能性。
12、进一步的,步骤s1中,删除蛋白质相互作用网络中相似性分数值较低的5%的链路,保留蛋白质相互作用网络中95%的连边作为重构网络。
13、进一步的,步骤s2中,分别在collins、gavin、krogan和wi-phi四个蛋白质相互作用网络上进行网络重构和复合物预测。
14、进一步的,步骤s3中,选用cyc2008和mips这两个标准复合物数据集进行验证,选用准确率、召回率和f1值作为评价指标。
15、本专利技术的另一个方面提供一种网络增强及蛋白质复合物预测系统,包括算法优化模块,预测模块,以及对比分析模块,其中:
16、算法优化模块,用于通过qaco算法优化和重构蛋白质相互作用网络,包括以下组件:
17、初始化组件,用于参数初始化,设置网络中所有链路的信息素、链路能见度的初始值以及量子信息素强度;
18、状态转移规则组件,用于计算每次迭代的转移概率;
19、适应函数组件,用于计算评估蚂蚁游走的适应函数;
20、信息素更新组件,用于更新每次迭代后的链路的信息素;
21、终止组件,用于设置迭代优化过程的中止条件;
22、预测模块,用于针对蛋白质相互作用网络和重构网络,分别基于mcode和ipca算法预测蛋白质复合物;
23、对比分析模块,用于基于蛋白质相互作用网络和重构网络的预测结果进行对比分析。
24、进一步的,所述算法优化模块中,在进行蛋白质相互作用网络重构时选定整个网络作为训练集,并通过qaco算法来预测节点间相互连接的可能性。
25、进一步的,所述算法优化模块中,删除蛋白质相互作用网络中相似性分数值较低的5%的链路,保留蛋白质相互作用网络中95%的连边作为重构网络。
26、进一步的,所述预测模块中,分别在collins、gavin、krogan和wi-phi四个蛋白质相互作用网络上进行网络重构和复合物预测。
27、进一步的,所述对比分析模块中,选用cyc2008和mips这两个标准复合物数据集进行验证,选用准确率、召回率和f1值作为评价指标。
28、采用了上述技术方案后,与现有技术相比,具有以下有益效果:
29、本专利技术的方法能够全面反映预测算法准确率的f1指标,所提qaco算法对蛋白质相互作用网络的拓扑结构进行数据增强后,能够有效提升蛋白质复合物的预测效果。
本文档来自技高网...【技术保护点】
1.一种网络增强及蛋白质复合物预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,所述步骤S1中,在进行蛋白质相互作用网络重构时选定整个网络作为训练集,并通过QACO算法来预测节点间相互连接的可能性。
3.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,步骤S1中,删除蛋白质相互作用网络中相似性分数值较低的5%的链路,保留蛋白质相互作用网络中95%的连边作为重构网络。
4.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,步骤S2中,分别在Collins、Gavin、Krogan和WI-PHI四个蛋白质相互作用网络上进行网络重构和复合物预测。
5.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,步骤S3中,选用CYC2008和MIPS这两个标准复合物数据集进行验证,选用准确率、召回率和F1值作为评价指标。
6.一种网络增强及蛋白质复合物预测系统,其特征在于,包括算法优化模块,预测模块,以及对比分析模块,其中
7.根据权利要求6所述的一种网络增强及蛋白质复合物预测方法,其特征在于,所述算法优化模块中,在进行蛋白质相互作用网络重构时选定整个网络作为训练集,并通过QACO算法来预测节点间相互连接的可能性。
8.根据权利要求6所述的一种网络增强及蛋白质复合物预测方法,其特征在于,所述算法优化模块中,删除蛋白质相互作用网络中相似性分数值较低的5%的链路,保留了蛋白质相互作用网络中95%的连边作为重构网络。
9.根据权利要求6所述的一种网络增强及蛋白质复合物预测方法,其特征在于,所述预测模块中,分别在Collins、Gavin、Krogan和WI-PHI四个蛋白质相互作用网络上进行网络重构和复合物预测。
10.根据权利要求6所述的一种网络增强及蛋白质复合物预测方法,其特征在于,所述对比分析模块中,选用CYC2008和MIPS这两个标准复合物数据集进行验证,选用准确率、召回率和F1值作为评价指标。
...【技术特征摘要】
1.一种网络增强及蛋白质复合物预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,所述步骤s1中,在进行蛋白质相互作用网络重构时选定整个网络作为训练集,并通过qaco算法来预测节点间相互连接的可能性。
3.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,步骤s1中,删除蛋白质相互作用网络中相似性分数值较低的5%的链路,保留蛋白质相互作用网络中95%的连边作为重构网络。
4.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,步骤s2中,分别在collins、gavin、krogan和wi-phi四个蛋白质相互作用网络上进行网络重构和复合物预测。
5.根据权利要求1所述的一种网络增强及蛋白质复合物预测方法,其特征在于,步骤s3中,选用cyc2008和mips这两个标准复合物数据集进行验证,选用准确率、召回率和f1值作为评价指标。
6.一种网络增强及蛋白质复...
【专利技术属性】
技术研发人员:曹志威,郝璐,张毅超,周琛,刘朝斌,王轼,王议贤,朱海,
申请(专利权)人:中国人民解放军海军军医大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。