本发明专利技术公开了一种检测文件安全的方法和装置,其中,所述方法包括:从待检测文件中提取文件特征,并确定提取的文件特征的类别;根据所述文件特征的类别确定人工智能引擎鉴定器,通过所述确定的鉴定器对所述文件特征进行评分,得到第一评分结果;将所述第一评分结果与预置经验分数进行比较,确定所述待检测文件的安全级别。通过本发明专利技术解决了文件安全检测过程速度慢,效率低,检测结果准确度低的问题。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种检测文件安全的方法和装置,其中,所述方法包括:从待检测文件中提取文件特征,并确定提取的文件特征的类别;根据所述文件特征的类别确定人工智能引擎鉴定器,通过所述确定的鉴定器对所述文件特征进行评分,得到第一评分结果;将所述第一评分结果与预置经验分数进行比较,确定所述待检测文件的安全级别。通过本专利技术解决了文件安全检测过程速度慢,效率低,检测结果准确度低的问题。【专利说明】一种检测文件安全的方法和装置
本专利技术涉及互联网
,具体涉及一种检测文件安全的方法和装置。
技术介绍
目前,随着互联网技术的发展,随之而来的病毒文件也越来越多,病毒文件是人为的特制程序代码,其具有如下特点:自我复制能力,很强的感染性,一定的潜伏性,特定的触发性和很大的破坏性。传统未知文件安全的鉴定方法通常将整个文件上传鉴定服务器中,由鉴定服务器对整个文件的数据进行分析鉴定,得到鉴定结果,从而判断出未知文件的安全性。传统的文件安全鉴定方法存在如下问题:第一,将整个文件进行上传,当文件比较大时,需要消耗大量时间进行上传操作、且占用较多的资源。第二,对上传的文件中的全部数据进行分析鉴定,耗时久,效率低。第三,只针对上传的文件中的数据信息进行鉴定,然而,随着病毒文件的不断发展,许多病毒文件中的数据信息与安全文件中的数据信息是相同的,因此得到的鉴定结果准确度低。第四,当有多个未知文件同时需要被鉴定时,需要按顺序排队进行鉴定,鉴定速度慢,效率低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种检测文件安全的方法和相应的一种检测文件安全的装置。依据本专利技术的一个方面,提供了一种检测文件安全的方法,包括:从待检测文件中提取文件特征,并确定提取的文件特征的类别;根据所述文件特征的类别确定人工智能引擎鉴定器,通过所述确定的鉴定器对所述文件特征进行评分,得到第一评分结果;将所述第一评分结果与预置经验分数进行比较,确定所述待检测文件的安全级别。根据本专利技术的另一方面,提供了一种检测文件安全的装置,包括:提取模块,用于从待检测文件中提取文件特征;第一评分模块,用于根据所述文件特征的类别确定人工智能引擎鉴定器,通过所述确定的鉴定器对所述文件特征进行评分,得到第一评分结果;安全级别确定模块,用于将所述第一评分结果与预置经验分数进行比较,确定所述待检测文件的安全级别。本专利技术提供了一种检测文件安全的方法和装置。首先从待检测文件中提取文件特征,提取的待检测文件的文件特征只占用很少的字符(如,IOKB或50KB等),根据对待检测文件的文件特征的进行鉴定,进而判断出未知文件的安全性。由于待检测文件的文件特征很小,因此在待检测文件的文件特征的上传过程中,上传速度快,效率高。同样,由于待检测文件的文件特征很小,因此在对待检测文件的文件特征的鉴定过程中鉴定速度快、效率高。其次,在本专利技术中,根据所述文件特征的类别确定鉴定器,并通过确定的鉴定器完成待检测文件的鉴定,采用分布式鉴定的方法,满足多个待检测文件同时鉴定的需求,提高了鉴定效率。最后,在本专利技术中,由于提取的是待检测文件的文件特征,所述待检测文件的文件特征不仅包括所述待检测文件的文件信息,还可以包括待检测文件的文件路径、IP地址等信息,提高了文件安全鉴定结果的准确性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的【具体实施方式】。【专利附图】【附图说明】通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术第一实施例中一种检测文件安全的方法的流程图;图2是本专利技术第二实施例中一种检测文件安全的方法的流程图;图3是本专利技术第三实施例中一种检测文件安全的装置的结构框图;图4是本专利技术第四实施例中一种检测文件安全的装置的结构框图。【具体实施方式】下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。参照图1,示出了本专利技术第一实施例中一种检测文件安全的方法的流程图。在本实施例中,所述检测文件安全的方法可以包括:步骤102,从待检测文件中提取文件特征,并确定提取的文件特征的类别。在本实施例中,所述待检测文件是一个未知安全级别的文件。在接收到待检测文件之后,对所述待检测文件进行分析,从所述待检测文件中提取相应的文件特征,并将提取的文件特征放入满足设定要求的特征向量内。对提取的文件特征进行分类,例如,可以依据加壳分类标准将所述待检测文件的文件特征分为UPX (Ultimate Packer foreXecutables,可执行程序文件)、NSPack、ASPack、UPack、PECompact (压缩可执行文件的工具)等;或者,还可以据编译器的类型将所述待检测文件的文件特征分为VC4 (MicrosoftVisual C++,简称Visual C++、MSVC、VC++或VC,具有集成开发环境,可提供编辑C语言、C++以及C++/CLI等编程语言)、VC5、VC6、VC7、VC8、Delphi (快速应用程序开发工具)、BC(Binary Calculator, LINUX命令的一种,用于实现任意精度计算)等。其中,所述文件特征包括但不仅限于:文件名、文件路径、文件大小、文件特征(File DNA)、图标特征(Icon DNA)、MD5 值和 IP 地址(Internet Protocol, IP,网络之间互连的协议)中的至少一种。步骤104,根据所述文件特征的类别确定人工智能引擎鉴定器,通过所述确定的鉴定器对所述文件特征进行评分,得到第一评分结果。在本实施例中,所述人工智能弓I擎鉴定器可以是QVM鉴定器。其中,QVM是指QihooSupport Vector Machine,奇虎支持向量机,或称为奇虎虚拟机。步骤106,将所述第一评分结果与预置经验分数进行比较,确定所述待检测文件的安全级别。在本实施例中,所述第一评分结果的分数范围可以是:0?1000分(包括0分和1000分),所述与预置经验分数值可以是520分。当所述第一评分结果对应的分数大于等于520分时,确定所述待检测文件是危险文件(如,携带蠕虫病毒的文件、携带宏病毒的文件、或携带特洛伊木马的文件等);当所述第一评分结果对应的分数小于520分时,则确定所述待检测文件为安全文件,用户可以正常安装使用。其中,所述预置经验分数值可以是通过对大量样本文件进行机器学习训练得到。综上所述,本实施例所述的一种检测文件安全的方法从待检测文件中提取文件特征,提取的待检测文件的文件特征只占用很少的字符(如,文件特征的大小可以是IOKB或50KB等),根据对待检测文件的文件特征的进行鉴定,进而判断出未知文件的安全性。由本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:杨康,王志超,魏自立,李振博,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。