多种图像检测技术综合分析基因子图相似概率量的方法技术

技术编号:14355160 阅读:121 留言:0更新日期:2017-01-08 22:26
本发明专利技术涉及图像检测与处理技术领域,同时涉及生物信息学领域,具体涉及一种利用多种图像检测技术综合分析基因子图相似概率量的方法,它采用如下的方法步骤:A、人体基因序列全图和目标基因子图的数据准备;B、利用CNN卷积神经网络检测基因子图相似概率量;C、利用HOG+SVM分类检测基因子图相似概率量;D、利用Adaboost+LBP特征算法检测基因子图相似概率量;E、利用标准相关系数模板匹配法检测基因子图相似概率量;F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量;可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。

【技术实现步骤摘要】

本专利技术涉及图像检测与处理
,同时涉及生物信息学领域,具体涉及一种利用多种图像检测技术综合分析基因子图相似概率量的方法
技术介绍
多种图像检测技术主要有四种:CNN卷积神经网络检测算、HOG+SVM分类检测、Boost分类+LBP特征算法、标准相关系数模板匹配法。CNN(ConvolutionalNeuralNetworks)卷积神经网络算法是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点,其优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。HOG(HistogramofOrientedGradient)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子,它通过计算和统计图像局部区域的梯度方向直方图来构成特征。SVM(SupportVectorMachine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。HOG特征结合SVM分类器已经被广泛应用于图像识别领域中。Boosting算法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数,它是一种框架算法。Adaboost是Boosting算法家族中代表算法。LBP(LocalBinaryPattern,局部二值模式)是一种有效的非参数化的图像局部纹理描述方法,其特点是计算简单,能捕捉图像中微量的细节特征,从而可以提取更有利于分类的局部领域关系模式,已广泛的应用于纹理分类、人脸图像分析、图像检索等领域。标准相关系数模板匹配法是目标跟踪的经典方法,其优点是简单准确,适用面广,而且计算速度快。相关系数(r)是一种数学距离,可以用来衡量两个向量的相似程度。所谓模板匹配法,就是指在一帧图像内寻找目标模板的位置,和模板相似最高的就是目标图像。基于相关系数的模板匹配,通常应用于全图中子区域与目标模板(目标图像)的检索,度量全图中子区域与目标模板的相似程度。在各种图像处理检索与识别的技术中,都各自存在一定的局限性。而利用多种图像检索技术,应用于人体基因全图中与目标基因子图像进行检索与识别,分别得到各自的概率量,再通过BP(BackPropagation)神经网络分类器进行加权求和每个检测技术所得到的概率量,最终得到综合概率量,从而能够更精确的预示人体基因是否包含待检测目标基因序列。。
技术实现思路
本专利技术的目的在于针对现有技术的缺陷和不足,提供一种结构简单,设计合理、使用方便的利用多种图像检测技术综合分析基因子图相似概率量的方法,它能够更精确的检测在待检测人体基因序列图谱(人体基因全图)中包含目标基因(基因子图)的概率量。本专利技术技术可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。本专利技术所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它采用如下的方法步骤:A、人体基因序列全图和目标基因子图的数据准备;B、利用CNN卷积神经网络检测基因子图相似概率量;C、利用HOG+SVM分类检测基因子图相似概率量;D、利用Adaboost+LBP特征算法检测基因子图相似概率量;E、利用标准相关系数模板匹配法检测基因子图相似概率量;F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。进一步地,步骤A中人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息;此时利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息。进一步地,步骤B中是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。进一步地,步骤C中是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征,并经SVM分类器进行分类识别,最后得到的相似度系数表示为在人体基因全图中检测到与基因子图相似的概率量(S2)。进一步地,步骤D是使用LBP(局部二值模式)+Adaboost分类器结合的方法,经LBP特征提取得到特征向量后利用Adaboost分类器进行分析,最后得到的基因子图相似概率量(S3)。进一步地,步骤E中是根据模板匹配法对目标基因子图和人体基因序列全图进行匹配比较,在基因全图中识别与目标基因子图相似的子区域,其相似程度(概率量S4)由计算二者的标准相关系数(R)所得。进一步地,方法F是以基因子图相似概率量S1、S2、S3、S4,作为BP神经网络分类器的输入层,以加权求和算法对四个概率量进行综合分析,最后得到最优化的基因子图概率量。进一步地,目标基因子图概率量表示为在人体全基因序列信息中包含目标子基因序列的概率量,若以某项疾病易感基因序列作为目标子基因序列,在基因测序后的人体基因全序列中进行检测,则得到的最后基因子图概率量为包含该疾病易感基因的概率。采用上述结构后,本专利技术有益效果为:本专利技术所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它能够更精确的检测在待检测人体基因序列图谱(人体基因全图)中包含目标基因(基因子图)的概率量。本专利技术技术可应用于疾病基因检测,能够快速并准确地检测出人体基因序列中是否包含疾病易感基因,预测身体患疾病风险。【附图说明】此处所说明的附图是用来提供对本专利技术的进一步理解,构成本申请的一部分,但并不构成对本专利技术的不当限定,在附图中:图1是本专利技术利用多种图像检测技术方案的实施流程图;图2是本专利技术实施中待检测人体基因序列全图和目标基因子图数据准备流程图;图3是本专利技术实施中BP神经网络分类器模型训练流程图;图4是本专利技术实施中子基因信息经可视化转换后的基因子图示例图。【具体实施方式】下面将结合附图以及具体实施例来详细说明本专利技术,其中的示意性实施例以及说明仅用来解释本专利技术,但并不作为对本专利技术的限定。如图1-图4所示,本具体实施方式所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,它采用如下的方法步骤:A、人体基因序列全图和目标基因子图的数据准备;B、利用CNN卷积神经网络检测基因子图相似概率量;C、利用HOG+SVM分类检测基因子图相似概率量;D、利用Adaboost+LBP特征算法检测基因子图相似概率量;E、利用标准相关系数模板匹配法检测基因子图相似概率量;F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。进一步地,步骤A中人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息;此时利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息。进一步地,步骤B中是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。进一步地,步骤C中是利用HO本文档来自技高网
...
多种图像检测技术综合分析基因子图相似概率量的方法

【技术保护点】
利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:它采用如下的方法步骤:A、人体基因序列全图和目标基因子图的数据准备;B、利用CNN卷积神经网络检测基因子图相似概率量;C、利用HOG+SVM分类检测基因子图相似概率量;D、利用Adaboost+LBP特征算法检测基因子图相似概率量;E、利用标准相关系数模板匹配法检测基因子图相似概率量;F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。

【技术特征摘要】
1.利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:它采用如下的方法步骤:A、人体基因序列全图和目标基因子图的数据准备;B、利用CNN卷积神经网络检测基因子图相似概率量;C、利用HOG+SVM分类检测基因子图相似概率量;D、利用Adaboost+LBP特征算法检测基因子图相似概率量;E、利用标准相关系数模板匹配法检测基因子图相似概率量;F、利用BP神经网络分类器综合分析步骤B、步骤C、步骤D、步骤E的各方法所得概率量,得到加权求和后的最终概率量。2.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤A中人体基因序列全图和目标基因子图的数据准备,是人体基因测序后得到四种碱基(A、T、C、G)的序列数据信息,一般储存为BAM/SAM格式,以计算机二进制数值表示四种碱基进行数据转换,得到基因序列二进制字节流的数据信息;此时利用颜色空间的方法可将基因二进制表示的数据信息转换得到二维的可视化图像信息。3.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤B中是利用CNN卷积神经网络检测人体基因序列全图中,所包含的目标基因子图的相似概率量(S1)。4.根据权利要求1所述的利用多种图像检测技术综合分析基因子图相似概率量的方法,其特征在于:步骤C中是利用HOG特征结合SVM分类器的技术方法,HOG通过计算和统计图像局...

【专利技术属性】
技术研发人员:余孟春何庆瑜特伦斯·古力谢清禄朱军王一为
申请(专利权)人:广州麦仑信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1