当前位置: 首页 > 专利查询>中山大学专利>正文

基于动态规划的有向无环图比对方法、模块及系统技术方案

技术编号:26762882 阅读:26 留言:0更新日期:2020-12-18 23:17
本发明专利技术公开了一种基于动态规划的有向无环图比对方法,包括:获取预设超参数、DAG文件及节点类型匹配分数文件,预设超参数包括统计检验强度,DAG文件包括源DAG文件及目标DAG文件;通过基于动态规划的DAG比对算法,生成目标DAG文件与源DAG文件的匹配分数;根据统计检验强度,随机分叉生成伪DAG文件,通过基于动态规划的DAG比对算法,生成目标DAG文件与伪DAG文件的匹配分数;根据目标DAG文件与源DAG文件的匹配分数在目标DAG文件与伪DAG文件的匹配分数的分布,生成统计显著指标值。本发明专利技术还公开了一种计算模块及一种基于动态规划的有向无环图比对系统。本发明专利技术将动态规划与有向无环图比对相结合,可以用于解决有向无环图比对计算量庞大的问题。

【技术实现步骤摘要】
基于动态规划的有向无环图比对方法、模块及系统
本专利技术涉及数据处理
,尤其涉及一种基于动态规划的有向无环图比对方法、计算模块及基于动态规划的有向无环图比对系统。
技术介绍
有向无环图(DirectedAcyclicGraph,DAG)是一种在数学、生物、计算机等领域普遍存在的重要数据结构。利用DAG节点标签以寻找全局/局部最大的相似子图结构称为DAG比对,而DAG比对是研究DAG进化和差异的重要方法,可用于定量探究可能影响DAG拓扑结构和节点分布的潜在因素。因此,建立一套DAG比对的客观计算体系,开发出计算不同DAG之间相似程度的算法,将具有广泛的应用前景和重要的意义。然而,当DAG结构规模较大时,DAG比对的计算量成指数增长,无法高效、快速且精准地完成DAG比对。现有技术中,主要借助以下两种技术实现比对:技术1:树上部分节点的比对算法(LozanoA,PinterRY,RokhlenkoO,ValienteG,Ziv-UkelsonM.Seededtreealignment.IEEE/ACMTransComputBiolBioinform.2008;5(4):503-13.)。该技术通过动态规划方法以实现两颗树上选定节点之间的比对,并使用最小共同祖先节点(leastcommonancestor,LCA)的搜索原则,通过动态规划的方案计算出分数比对矩阵,寻找最大匹配分数。技术2:图之间比对的算法(FishkindDE,AdaliS,PatsolicHG,MengL,SinghD,LyzinskiV,etal.SeededGraphMatching.arXiv:12090367[stat].2018.)。该技术通过逐步缩小源图和比对图上的节点匹配后的误差,实现不同图上的节点比对。但是,上述两种技术只能比对树/图/序列上部分的节点,不是完全适用于有向无环图(DAG)的全局比对;同时,这些技术只有一种输出模式,不具备全局和局部穷尽搜索的应用;而且这些技术只局限于部分节点给定的条件下进行比对,不适用于完全已知的末端节点信息条件下的比对,计算量都比较大。因此,本专利技术希望开发出高效、快速且精准的DAG比对算法,并封装成可以跨平台运行的软件,用于解决各种DAG比对问题。
技术实现思路
本专利技术所要解决的技术问题在于,提供一种基于动态规划的有向无环图比对方法、模块及系统,可将动态规划与有向无环图比对相结合,用于解决有向无环图比对计算量庞大的问题。为了解决上述技术问题,本专利技术提供了一种基于动态规划的有向无环图比对方法,包括:获取预设超参数、DAG文件及节点类型匹配分数文件,所述预设超参数包括输出结果数量、删除节点罚分及统计检验强度,所述DAG文件包括源DAG文件及目标DAG文件,所述节点类型匹配分数文件包括节点类型匹配分数矩阵并用于存储源DAG文件及目标DAG文件中的不同节点类型的所有配对及匹配分数;通过基于动态规划的DAG比对算法,根据所述预设超参数、DAG文件及匹配分数文件,生成所述目标DAG文件与源DAG文件的源比对结果,所述源比对结果包括所述目标DAG文件与源DAG文件的匹配分数;根据所述统计检验强度,随机分叉生成伪DAG文件,通过基于动态规划的DAG比对算法,根据所述预设超参数、DAG文件及节点类型匹配分数文件,生成所述目标DAG文件与伪DAG文件的伪比对结果,所述伪比对结果包括所述目标DAG文件与伪DAG文件的匹配分数;根据所述目标DAG文件与源DAG文件的匹配分数在所述目标DAG文件与伪DAG文件的匹配分数的分布,生成统计显著指标值。作为上述方案的改进,所述基于动态规划的DAG比对算法的步骤包括:根据节点匹配分数矩阵,沿正向传播方向,计算待比对DAG文件及目标DAG文件中末端节点之间的正向匹配分数,并将所述正向匹配分数输出至初始动态规划分数矩阵中,所述待比对DAG文件为源DAG文件或伪DAG文件;根据所述节点匹配分数矩阵,沿反向传播方向,计算所述待比对DAG文件及目标DAG文件中内部节点之间的反向匹配分数,并将所述反向匹配分数输出至所述初始动态规划分数矩阵中,以构成目标动态规划分数矩阵;根据最低共同祖先原则,提取所述目标动态规划分数矩阵中最大的匹配分数所对应的祖先节点集合;根据所述祖先节点集合,回溯输出子节点的匹配策略,得到比对关系、待比对DAG文件选择的子节点及目标DAG文件选择的子节点;输出所述最大的匹配分数、祖先节点集合、比对关系、待比对DAG文件选择的子节点及目标DAG文件选择的子节点。作为上述方案的改进,所述沿反向传播方向,计算待比对DAG文件及目标DAG文件中内部节点之间的反向匹配分数的步骤包括:沿反向传播方向,将待比对DAG文件中的内部节点与目标DAG文件中的内部节点进行分组比对;分别求和每组内部节点的比对分数,选择每组的最优内部节点,并根据每组中删除的内部节点数量进行罚分,生成分数比对集合;根据所述分数比对集合中最大的匹配分数,生成并存储每个位置选择的比对策略,所述比对策略包括最大的匹配分数、待比对DAG文件选择的内部节点、目标DAG文件选择的内部节点及待比对DAG文件选择的内部节点与目标DAG文件选择的内部节点之间的对应关系;将所述比对策略中最大的匹配分数作为正向匹配分数。作为上述方案的改进,所述基于动态规划的有向无环图比对方法还包括:输出目标结果,所述目标结果包括比对分数、统计显著指标值、比对成功的两个DAG文件的祖先节点集合、比对得到的节点匹配关系及需要进行的删除节点操作。作为上述方案的改进,所述基于动态规划的有向无环图比对方法还包括:平面化展示显示结果,所述显示结果包括比对成功的两个DAG文件的拓扑结构、节点标签、节点匹配关系、删除节点、删除标识、比对分数及统计显著性指标。相应地,本专利技术还提供了一种计算模块,包括:正向匹配单元,用于根据节点匹配分数矩阵,沿正向传播方向,计算待比对DAG文件及目标DAG文件中末端节点之间的正向匹配分数,并将所述正向匹配分数输出至初始动态规划分数矩阵中,所述待比对DAG文件为源DAG文件或伪DAG文件;反向匹配单元,用于根据所述节点匹配分数矩阵,沿反向传播方向,计算所述待比对DAG文件及目标DAG文件中内部节点之间的反向匹配分数,并将所述反向匹配分数输出至所述初始动态规划分数矩阵中,以构成目标动态规划分数矩阵;节点提取单元,用于根据最低共同祖先原则,提取所述目标动态规划分数矩阵中最大的匹配分数所对应的祖先节点集合;回溯输出单元,用于根据所述祖先节点集合,回溯输出子节点的匹配策略,得到比对关系、待比对DAG文件选择的子节点及目标DAG文件选择的子节点;结果输出单元,用于输出所述最大的匹配分数、祖先节点集合、比对关系、待比对DAG文件选择的子节点及目标DAG文件选择的子节点。作为上述方案的改进,所述反向匹配单元包括:比对子单元,用于沿反向传播方向,将待比对DAG文件中的内部节点与目标DAG文件中的内部节点进行分组比对;罚分子单元,用于求和每组内部节点的比对分数,选择每组的最优内部节点,并本文档来自技高网
...

【技术保护点】
1.一种基于动态规划的有向无环图比对方法,其特征在于,包括:/n获取预设超参数、DAG文件及节点类型匹配分数文件,所述预设超参数包括输出结果数量、删除节点罚分及统计检验强度,所述DAG文件包括源DAG文件及目标DAG文件,所述节点类型匹配分数文件包括节点类型匹配分数矩阵并用于存储源DAG文件及目标DAG文件中的不同节点类型的所有配对及匹配分数;/n通过基于动态规划的DAG比对算法,根据所述预设超参数、DAG文件及节点类型匹配分数文件,生成所述目标DAG文件与源DAG文件的源比对结果,所述源比对结果包括所述目标DAG文件与源DAG文件的匹配分数;/n根据所述统计检验强度,随机分叉生成伪DAG文件,通过基于动态规划的DAG比对算法,根据所述预设超参数、DAG文件及节点类型匹配分数文件,生成所述目标DAG文件与伪DAG文件的伪比对结果,所述伪比对结果包括所述目标DAG文件与伪DAG文件的匹配分数;/n根据所述目标DAG文件与源DAG文件的匹配分数在所述目标DAG文件与伪DAG文件的匹配分数的分布,生成统计显著指标值。/n

【技术特征摘要】
1.一种基于动态规划的有向无环图比对方法,其特征在于,包括:
获取预设超参数、DAG文件及节点类型匹配分数文件,所述预设超参数包括输出结果数量、删除节点罚分及统计检验强度,所述DAG文件包括源DAG文件及目标DAG文件,所述节点类型匹配分数文件包括节点类型匹配分数矩阵并用于存储源DAG文件及目标DAG文件中的不同节点类型的所有配对及匹配分数;
通过基于动态规划的DAG比对算法,根据所述预设超参数、DAG文件及节点类型匹配分数文件,生成所述目标DAG文件与源DAG文件的源比对结果,所述源比对结果包括所述目标DAG文件与源DAG文件的匹配分数;
根据所述统计检验强度,随机分叉生成伪DAG文件,通过基于动态规划的DAG比对算法,根据所述预设超参数、DAG文件及节点类型匹配分数文件,生成所述目标DAG文件与伪DAG文件的伪比对结果,所述伪比对结果包括所述目标DAG文件与伪DAG文件的匹配分数;
根据所述目标DAG文件与源DAG文件的匹配分数在所述目标DAG文件与伪DAG文件的匹配分数的分布,生成统计显著指标值。


2.如权利要求1所述的基于动态规划的有向无环图比对方法,其特征在于,所述基于动态规划的DAG比对算法的步骤包括:
根据节点匹配分数矩阵,沿正向传播方向,计算待比对DAG文件及目标DAG文件中末端节点之间的正向匹配分数,并将所述正向匹配分数输出至初始动态规划分数矩阵中,所述待比对DAG文件为源DAG文件或伪DAG文件;
根据所述节点匹配分数矩阵,沿反向传播方向,计算所述待比对DAG文件及目标DAG文件中内部节点之间的反向匹配分数,并将所述反向匹配分数输出至所述初始动态规划分数矩阵中,以构成目标动态规划分数矩阵;
根据最低共同祖先原则,提取所述目标动态规划分数矩阵中最大的匹配分数所对应的祖先节点集合;
根据所述祖先节点集合,回溯输出子节点的匹配策略,得到比对关系、待比对DAG文件选择的子节点及目标DAG文件选择的子节点;
输出所述最大的匹配分数、祖先节点集合、比对关系、待比对DAG文件选择的子节点及目标DAG文件选择的子节点。


3.如权利要求2所述的基于动态规划的有向无环图比对方法,其特征在于,所述沿反向传播方向,计算待比对DAG文件及目标DAG文件中内部节点之间的反向匹配分数的步骤包括:
沿反向传播方向,将待比对DAG文件中的内部节点与目标DAG文件中的内部节点进行分组比对;
分别求和每组内部节点的比对分数,选择每组的最优内部节点,并根据每组中删除的内部节点数量进行罚分,生成分数比对集合;
根据所述分数比对集合中最大的匹配分数,生成并存储每个位置选择的比对策略,所述比对策略包括最大的匹配分数、待比对DAG文件选择的内部节点、目标DAG文件选择的内部节点及待比对DAG文件选择的内部节点与目标DAG文件选择的内部节点之间的对应关系;
将所述比对策略中最大的匹配分数作为正向匹配分数。


4.如权利要求1所述的基于动态规划的有向无环图比对方法,其特征在于,还包括:输出目标结果,所述目标结果包括比对分数、统计显著指标值、比对成功的两个DAG文件的祖先节点集合、比对得到的节点匹配关系及需要进行的删除节点操作。


5.如权利要求1所述的基于动态规划的有向无环图比对方法,其特征在于,还包括:平面化展示显示结果,所述显示结果包括比对成功的两个DAG文件的拓扑结构、节点标签、节点匹配关系、删除节点、删除标识、比对分数及统计显著性指标。


6.一...

【专利技术属性】
技术研发人员:杨建荣陈小舒袁梦杨绪疆林景华曹小龙陈锋张晓玉李梓彰郑贵锋王学钦
申请(专利权)人:中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1