System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开一般涉及计算机,尤其涉及一种基于生物信息数据的数据处理方法、系统、设备和介质。
技术介绍
1、随着通信技术和计算机技术的不断发展,通过训练模型帮助用户处理数据已经成为了非常常见的技术手段,在各个领域均有应用,例如金融领域以及生物信息领域。
2、学习训练模型的方式多种多样,其中多节点联邦学习是非常常见的一种学习训练模型的方式。在相关技术中,若在生物信息领域中,假设需要学习训练的生物信息数据分布在多个节点中,且涉及隐私保护,即可以通过联邦学习的学习训练方式,将初始模型下由发送方(例如中心服务器)发至各个学习节点,由各个学习节点利用本地生物信息数据对初始模型进行训练,训练完成后得到训练模型,并将训练模型发送回发送方,由发送方再将各个节点的训练模型通过收敛器收敛。如此,各节点无需输出自身数据,即可完成学习训练。
3、然而,在上述学习训练的过程中,在对各个节点的训练模型进行收敛形成聚合模型的过程中,会根据为各个节点的训练模型使用的生物信息数据的数据量大小考虑模型贡献度,进而在聚合过程中为各个训练模型的权重占比进行划分,然而这种划分方式往往较为简单粗暴,并不能够体现数据的实际贡献情况。
技术实现思路
1、鉴于相关技术中的上述缺陷或不足,期望提供一种基于生物信息数据的数据处理方法、系统、设备和介质,能够解决聚合过程中为各个训练模型的权重占比进行划分,然而这种划分方式往往较为简单粗暴,并不能够体现数据的实际贡献情况的问题,在一定程度上通过提升数据贡献和力度进而提高模型
2、第一方面,提供了一种数据处理方法,该方法包括:
3、在通过多个用户中的每个用户通过本地数据针对初始生物信息模型进行训练,生成第一生物信息训练模型的情况下,获取所述每个用户的本地数据的第一数据特征信息和每个用户的第一生物信息训练模型,所述第一数据特征信息用于指示所述每个用户对应的用户节点特征信息,所述本地数据为包括生物信息的数据;
4、根据所述第一数据特征信息,通过预设深度网络模型确定所述多个用户中每个用户对应的第一生物信息训练模型的第一贡献度配比,并根据所述第一贡献度配比对所述多个第一生物信息训练模型进行聚合,生成第一生物信息聚合模型。
5、本申请中,在多个用户中的每个用户通过本地数据针对初始生物信息模型进行训练,生成第一生物信息训练模型的情况下,获取每个用户的本地数据的第一数据特征信息和每个用户的第一生物信息训练模型(第一数据特征信息用于指示每个用户对应的用户节点特征信息);然后,根据第一数据特征信息,通过预设深度网络模型确定多个用户中每个用户对应的第一生物信息训练模型的第一贡献度配比,并根据第一贡献度配比对多个第一生物信息训练模型进行聚合,生成第一生物信息聚合模型。如此,通过获取到每个用户的用户节点的数据特征以及多个用户节点之间的贡献度配比,在最终聚合模型的过程中,根据多个用户节点之间的贡献度配比为每个用户的第一生物信息训练模型设置合适的聚合比例,从而使得最终聚合后的第一生物信息聚合模型相较于此前不确定贡献度的聚合模型的合理性大幅提高,也大幅度提高了通过多个用户节点训练模型聚合得到所需要的投入使用的模型的训练效率。
6、第二方面,提供了一种基于生物信息数据的数据处理系统,该系统包括:
7、获取单元,用于在多个用户中的每个用户通过本地数据针对初始生物信息模型进行训练,生成第一生物信息训练模型的情况下,获取所述每个用户的本地数据的第一数据特征信息和每个用户的第一生物信息训练模型,所述第一数据特征信息用于指示所述每个用户对应的用户节点特征信息,所述本地数据为包括生物信息的数据;
8、执行单元,用于根据所述第一数据特征信息,通过预设深度网络模型确定所述多个用户中每个用户对应的第一生物信息训练模型的第一贡献度配比,并根据所述第一贡献度配比对所述多个第一生物信息训练模型进行聚合,生成第一生物信息聚合模型。
9、第三方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现上述第一方面所述的方法。
10、第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面所述的方法。
11、第五方面,提供了一种计算机程序产品,计算机程序产品中包含指令,该指令被处理器运行时实现上述第一方面所述的方法。
12、本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
本文档来自技高网...【技术保护点】
1.一种基于生物信息数据的数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在多个用户中的每个用户通过本地数据针对初始生物信息模型进行训练,生成第一生物信息训练模型的情况下,获取所述每个用户的本地数据的第一数据特征信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述第一数据特征信息包括以下至少一种数据特征信息:第一数据质量特征信息,第一数据通信特征信息,第一参与频率特征信息,第一用户节点局部性能特征信息。
4.根据权利要求1所述的方法,其特征在于,在所述第一数据特征信息包括至少两种数据特征信息的情况下,所述根据所述数据特征信息,确定所述多个用户中每个用户的第一贡献度配比,包括:
5.根据权利要求1所述的方法,其特征在于,根据所述第一贡献度配比对所述多个第一生物信息训练模型进行聚合,生成第一生物信息聚合模型之后,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,在所述收敛值大于等于预定阈值的情况下,所述根据第一贡献度配比对所述多个训练模型进行聚合,生成第一生物信息聚合模型之后,所
7.根据权利要求1所述的方法,其特征在于,所述根据第一贡献度配比对所述多个训练模型进行聚合之后,所述方法还包括:
8.一种基于生物信息数据的数据处理系统,其特征在于,包括:
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时,实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
11.一种计算机程序产品,所述计算机程序产品中包含指令,其特征在于,所述指令被处理器运行时实现如权利要求1-7中任一所述的方法。
...【技术特征摘要】
1.一种基于生物信息数据的数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在多个用户中的每个用户通过本地数据针对初始生物信息模型进行训练,生成第一生物信息训练模型的情况下,获取所述每个用户的本地数据的第一数据特征信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述第一数据特征信息包括以下至少一种数据特征信息:第一数据质量特征信息,第一数据通信特征信息,第一参与频率特征信息,第一用户节点局部性能特征信息。
4.根据权利要求1所述的方法,其特征在于,在所述第一数据特征信息包括至少两种数据特征信息的情况下,所述根据所述数据特征信息,确定所述多个用户中每个用户的第一贡献度配比,包括:
5.根据权利要求1所述的方法,其特征在于,根据所述第一贡献度配比对所述多个第一生物信息训练模型进行聚合,生成第一生物信息聚合模型之后,所述方法还包括:
...
【专利技术属性】
技术研发人员:何昆仑,姜明明,
申请(专利权)人:中国人民解放军总医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。