【技术实现步骤摘要】
本申请涉及数据处理
,具体涉及病毒检测处理
,尤其涉及文件的病毒检测方法及装置。
技术介绍
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。将深度学习和神经网络结合起来用于对文件的病毒检测,能够对病毒文件进行准确识别。现有的通过深度学习结合神经网络的病毒检测方法还存在不足之处,例如,现有的通过深度学习结合神经网络的病毒检测方法在训练病毒检测模型时的样本数据量有限,这就直接导致病毒检测模型只能根据样本数据检测出的少量的病毒,也无法发挥深度学习神经网络的优势;同时,现有的深度学习神经网络没有针对具体的病毒特征进行优化,导致得到的病毒检测模型检测病毒的准确性不高。
技术实现思路
本申请提供了文件的病毒检测方法及装置,以解决
技术介绍
中提到的技术问题。第一方面,本申请提供了一种文件的病毒检测方法,所述方法包括:从待检测文件中提取出特征信息,所述特征信息用于表征所述待检测文件的运行行为;对所述特征信息进行归一化处理,得到对应所述特征信息的归一化数据;将所述归一化数据转换为二进制数据,将所述二进制数据导入预先训练的病毒检测模型进行病毒检测得到病毒检测结果。第二方面,本申请提供了一种文件的病毒检测装置,所述装置包括:特征信息提取单元,用于从待检测文件中提取出特征信息,所述特征信息用于表征所述待检测文件的运行行为;归一化数据获取单元,用于对所述特征信息进行归一化处理,得到对应所述特征信息的归一化数据;病毒检测单元,用于将所述归一化数据转换为二进 ...
【技术保护点】
一种文件的病毒检测方法,其特征在于,所述方法包括:从待检测文件中提取出特征信息,所述特征信息用于表征所述待检测文件的运行行为;对所述特征信息进行归一化处理,得到对应所述特征信息的归一化数据;将所述归一化数据转换为二进制数据,将所述二进制数据导入预先训练的病毒检测模型进行病毒检测得到病毒检测结果。
【技术特征摘要】
1.一种文件的病毒检测方法,其特征在于,所述方法包括:从待检测文件中提取出特征信息,所述特征信息用于表征所述待检测文件的运行行为;对所述特征信息进行归一化处理,得到对应所述特征信息的归一化数据;将所述归一化数据转换为二进制数据,将所述二进制数据导入预先训练的病毒检测模型进行病毒检测得到病毒检测结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括建立病毒检测模型的步骤,所述建立病毒检测模型的步骤包括:获取样本数据,所述样本数据的数量大于设置值;对所述样本数据进行病毒检测,得到对应所述样本数据的风险等级标签,所述风险等级标签用于表征样本数据为病毒数据的可能性;对所述样本数据进行归一化处理,得到对应所述样本数据的样本归一化数据,所述样本归一化数据包括所述风险等级标签;将所述样本归一化数据转换成二进制数据,并将所述二进制数据输入深度学习神经网络,得到多个预选病毒检测模型;通过设定指标对所述预选病毒检测模型进行打分排序,将得分最高的预选病毒检测模型作为最终的病毒检测模型。3.根据权利要求2所述的方法,其特征在于,所述对所述样本数据进行归一化处理,得到对应所述样本数据的样本归一化数据包括:获取所述样本归一化数据的分布曲线,其中所述分布曲线用于表征样本归一化数据在数据区间上的分布趋势;若所述分布曲线无法拟合成正态分布曲线,则在所述样本归一化数据对应的数据区间设置数据插入点,其中,所述数据插入点用于将所述数据区间平均分成设定个数据区间段。4.根据权利要求3所述的方法,其特征在于,所述对所述样本数据进行归一化处理,得到对应所述样本数据的样本归一化数据还包括:若所述数据区间段内的样本归一化数据的分布曲线无法拟合成正态分布曲线,则在所述数据区间上增加数据插入点,直到数据区间段内的样本归一化数据的分布曲线拟合成正态分布曲线。5.根据权利要求2所述的方法,其特征在于,在步骤对所述样本数据进行归一化处理,得到对应所述样本数据的样本归一化数据,和步骤将所述样本归一化数据转换成二进制数据之间还包括:按照所述风险等级标签对样本归一化数据进行随机排序。6.根据权利要求3所述的方法,其特征在于,所述将所述二进制数据输入深度学习神经网络,得到多个预选病毒检测模型包括:在深度学习神经网络的第一隐层和第二隐层分别设置relu函数和双曲正切函数作为激活函数。7.根据权利要求3所述的方法,其特征在于,所述将所述二进制数据输入深度学习神经网络,得到多个预选病毒检测模型包括:在深度学习神经网络设置残留层,通过所述残留层调整所述深度学习神经网络的输入输出关系,所述残留层用于通过深度学习神经网络的输入数据对深度学习神经网络的输出数据进行修正。8.一种文件的病毒检测装置...
【专利技术属性】
技术研发人员:刘金克,吕钦,侯柳平,王磊,周杰,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。