The invention discloses a method and device for the identification of a malicious installation package. The method includes: obtaining the feature sequence after the sandbox is processed, extracting the text information that is in line with the predetermined text extraction rules from the feature sequence, and preprocessing the written information to get the pre configured God. The input data is input through the network recognition model, and the data to be input to the neural network identification model is analyzed to determine whether the pending installation package is a malicious installation package. In this way, the neural network recognition model is used to recognize the malicious installation package which can not be identified by the sandbox, which effectively improves the accuracy of identifying malware, avoids the harm caused by some malicious installation packages, and ensures the security of the user to use the installation package.
【技术实现步骤摘要】
一种恶意安装包的识别方法和装置
本专利技术涉及信息处理领域,特别是涉及一种恶意安装包的识别方法和装置。
技术介绍
随着现在网络技术的不断发展,各个软件开发公司开发出的软件安装包越来越多,用户将自己需要的安装包从网上或通过其他途径进行下载,并放入手机、平板、电脑、笔记本等能够对该安装包进行安装的设备上,利用这些设备对安装包进行解压安装,得到相应的软件程序,以供用户使用。现在很多不法分子开发出一些恶意安装包,来窃取用户的隐私、财产或者干扰用户设备的正常使用,给用户带来极大的不便。针对这种情况一些开发公司开发出了各种杀毒软件,来对这些安装包进行检测,具体的,杀毒软件在安装包安装前会将安装包放入沙箱中进行模拟运行,杀毒软件基于安装包在沙箱中的运行情况,如果安装包运行过程中存在恶意行为,确定该安装包为恶意安装包,进而会对该安装包进行安全处理。但是,根据安装包在沙箱运行过程中是否存在恶意行为,有时很难判断出安装包是否为恶意安装包,容易造成遗漏,进而会给用户造成安全隐患。例如,一些手机安装包,在沙箱运行测试过程中只是读取手机通讯录,并未出现恶意行为,但是该安装包在手机中实际运行时,会将读取到的手机通讯录上传到网络,进而使得给通讯录中的手机号发送骚扰短信,这样的恶意安装包在沙箱中是检测不出来的。
技术实现思路
有鉴于此,本专利技术提供了一种恶意安装包识别方法和装置,主要目的在于可以解决有些安装包在沙箱运行之后,很难判断出该安装包是否为恶意安装包,容易造成遗漏,给用户造成安全隐患的问题。依据本专利技术第一方面,提供了一种恶意安装包的识别方法,包括:获取待检测安装包经过沙箱处理后 ...
【技术保护点】
一种恶意安装包的识别方法,其特征在于,包括:获取待检测安装包经过沙箱处理后的特征序列;从所述特征序列中提取符合预定文字提取规则的文字信息;对所述文字信息进行前处理,得到符合预先配置的神经网络识别模型输入格式的待输入数据;通过将所述待输入数据输入到所述神经网络识别模型进行分析,确定所述待检测安装包是否为恶意安装包。
【技术特征摘要】
1.一种恶意安装包的识别方法,其特征在于,包括:获取待检测安装包经过沙箱处理后的特征序列;从所述特征序列中提取符合预定文字提取规则的文字信息;对所述文字信息进行前处理,得到符合预先配置的神经网络识别模型输入格式的待输入数据;通过将所述待输入数据输入到所述神经网络识别模型进行分析,确定所述待检测安装包是否为恶意安装包。2.根据权利要求1所述的方法,其特征在于,所述神经网络识别模型的获取步骤包括:获取训练安装包经过沙箱处理后的训练特征序列;从所述训练特征序列中提取符合预定文字提取规则的训练文字信息;对所述训练文字信息进行处理,得到训练输入数据;将所述训练输入数据输入到神经网络进行处理,得到训练函数;根据所述训练函数的各项数值对所述神经网络进行训练,获得神经网络识别模型。3.根据权利要求2所述的方法,其特征在于,所述神经网络包括卷积神经网络和长短期记忆网络,将所述训练输入数据输入到神经网络进行处理,得到训练函数,具体包括:将所述训练输入数据输入到卷积神经网络进行卷积处理,得到多维特征数据;将所述多维特征数据输入到长短期记忆网络进行处理,获得训练函数;根据所述训练函数的各项数值对所述神经网络进行训练,获得神经网络识别模型,具体包括:根据所述训练函数的各项数值对所述卷积神经网络和所述长短期记忆网络进行训练,获得卷积神经网络模型和长短期记忆网络模型;将所述卷积神经网络模型和长短期记忆网络模型进行组合得到神经网络识别模型。4.根据权利要求3所述的方法,其特征在于,将所述训练输入数据输入到卷积神经网络进行卷积处理,得到多维特征数据,具体包括:对所述训练文字信息进行分词处理,并为分词处理得到的分词匹配相应的分词向量,所述分词向量为一维输入矩阵;对所述分词向量进行格式转换,将一维输入矩阵转化为二维输入矩阵;将所述二维输入矩阵输入到卷积神经网络进行卷积处理,得到向量矩阵;提取所述向量矩阵中的第一维的向量,并将所述第一维的向量作为多维特征数据。5.根据权利...
【专利技术属性】
技术研发人员:郭祥,周楠,李强,王冬,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。