文件样本属性的确定方法及装置制造方法及图纸

技术编号:12016088 阅读:108 留言:0更新日期:2015-09-09 11:40
本发明专利技术提出一种文件样本属性的确定方法及装置,其中,文件样本属性的确定方法包括:获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均包含对应样本类型的属性和判定信息;以及从已知样本类型中选择一个样本类型作为当前样本类型,根据当前样本类型的判定信息从当前文件样本中提取关键信息,将所提取的关键信息与判定信息进行比较,根据比较结果确定当前文件样本的属性。本发明专利技术实施例的文件样本属性的确定方法及装置,通过获得已知样本类型的信息,根据一已知样本类型的判定信息提取当前样本的关键信息,并将所提取的关键信息与对应的判定信息进行比较,并根据比较结果获得属性,减少了大量的重复工作,大大地提高了样本属性的确定效率。

【技术实现步骤摘要】

本专利技术涉及移动安全
,尤其涉及一种文件样本属性的确定方法及装置
技术介绍
由谷歌(Google)公司和开放手机联盟开发的安卓(Android)系统是一种基于Linux的自由及开放源代码的操作系统,其主要应用于移动设备例如智能手机和平板电脑上。信息摘要算法第五版(Message Digest Algorithm,MD5)为计算机安全领域广泛使用的一种散列函数,用以提供消息的完整性保护。MD5的典型应用是对一段信息(Message)产生信息摘要(Message-Digest),以防止被篡改。因此,可以使用文件MD5作为区分文件样本的条件。另外,还可以使用文件内容区分样本,由于MD5签名(sign MD5)可以描述内容相同的安卓安装包(Android Package,APK)文件,因此,可以做到一个sign MD5对应文件内容相同的多个不同文件,故比文件MD5覆盖广。但是,由于sign MD5过于精确,只能描述内容相同的APK文件,而源文件只要稍加改动,比如向APK中增添无用文件,其sign MD5特征就会改变。因此,基于sign MD5区分相似文件样本属性工作量大。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种提高文件样本属性的确定效率的文件样本属性的确定方法及装置。根据本专利技术第一方面实施例提出了一种文件样本属性的确定方法,包括:获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均包含对应样本类型的属性和判定信息;以及从已知样本类型中选择一个样本类型作为当前样本类型,根据当前样本类型的判定信息从所述当前文件样本中提取关键信息,将所提取的关键信息与所述判定信息进行比较,根据比较结果确定所述当前文件样本的属性。本专利技术实施例的文件样本属性的确定方法,通过获得已知样本类型的信息,根据一已知样本类型的判定信息提取当前样本的关键信息,并将所提取的关键信息与对应的判定信息进行比较,并根据比较结果获得属性,减少了大量的重复工作,大大地提高了样本属性的确定效率。本专利技术第二方面实施例提出了一种文件样本属性的确定装置,包括:获得模块,用于获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均包含对应样本类型的属性和判定信息;以及确定模块,用于从已知样本类型中选择一个样本类型作为当前样本类型,根据当前样本类型的判定信息从所述当前文件样本中提取关键信息,将所提取的关键信息与所述判定信息进行比较,根据比较结果确定所述当前文件样本的属性。本专利技术实施例的文件样本属性的确定装置,通过获得模块获得所有已知样本类型信息,通过确定模块提取当前样本的关键信息,并将所提取的关键信息与对应的判定信息进行比较,并根据比较结果获得属性,减少了大量的重复工作,大大地提高了样本属性的确定效率。本专利技术第三方面实施例提出了一种移动终端,该移动终端包括壳体、处理器、存储器、电路板和电源电路,其中,所述电路板安置在所述壳体围成的空间内部,所述处理器和所述存储器设置在所述电路板上;所述电源电路,用于为所述移动终端的各个电路或器件供电;所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行以下步骤:获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均包含对应样本类型的属性和判定信息;以及从已知样本类型中选择一个样本类型作为当前样本类型,根据当前样本类型的判定信息从上述当前文件样本中提取关键信息,将所提取的关键信息与上述判定信息进行比较,根据比较结果确定上述当前文件样本的属性。本专利技术实施例的移动终端,通过获得已知样本类型的信息,根据一已知样本类型的判定信息提取当前样本的关键信息,并将所提取的关键信息与对应的判定信息进行比较,并根据比较结果获得属性,减少了大量的重复工作,大大地提高了样本属性的确定效率。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,图1是根据本专利技术一个实施例的文件样本属性的确定方法的流程图;图2是根据本专利技术一个实施例的获得已知样本类型信息的流程图;图3是根据本专利技术另一个实施例的文件样本属性的确定方法的流程图;图4是根据本专利技术一个实施例的服务(service)类的启动位置的字节码信息的示意图;图5是根据本专利技术一个实施例的文件样本属性的确定装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。在本专利技术的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。下面参考附图描述本专利技术实施例的文件样本属性的确定方法及装置。图1是根据本专利技术一个实施例的文件样本属性的确定方法的流程图。如图1所示,该文件样本属性的确定方法包括:S101,获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均包含对应样本类型的属性和判定信息。在该实施例中,获得所有已知样本类型信息的过程如图2所示,可以包括:S1011,获取文件样本的多个关键信息。其中,关键信本文档来自技高网
...
文件样本属性的确定方法及装置

【技术保护点】
一种文件样本属性的确定方法,其特征在于,包括:获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均包含对应样本类型的属性和判定信息;以及从已知样本类型中选择一个样本类型作为当前样本类型,根据当前样本类型的判定信息从所述当前文件样本中提取关键信息,将所提取的关键信息与所述判定信息进行比较,根据比较结果确定所述当前文件样本的属性。

【技术特征摘要】
1.一种文件样本属性的确定方法,其特征在于,包括:
获得当前文件样本和所有已知样本类型信息,其中,每一个已知样本类型信息中均
包含对应样本类型的属性和判定信息;以及
从已知样本类型中选择一个样本类型作为当前样本类型,根据当前样本类型的判定
信息从所述当前文件样本中提取关键信息,将所提取的关键信息与所述判定信息进行比
较,根据比较结果确定所述当前文件样本的属性。
2.根据权利要求1所述的方法,其特征在于,所述根据比较结果确定所述当前文
件样本的属性包括:
若所提取的关键信息与所述判定信息完全一致,则将所述当前文件样本归属于所述
当前样本类型,且继承所述当前样本类型的属性;若所提取的关键信息与所述判定信息
不完全一致,则继续重复上述操作,直至当前文件样本归属于当前样本类型。
3.根据权利要求2所述的方法,其特征在于,所述根据比较结果确定所述当前文
件样本的属性,还包括:
若当前文件样本不归属于任何一个已知样本类型,则以所述当前文件样本的关键信
息创建新的样本类型,并对所述当前文件样本进行属性分析,将分析出的属性作为所述
新的样本类型的属性和将所述当前文件样本的关键信息作为所述新的样本类型的判定
信息。
4.根据权利要求1所述的方法,其特征在于,所述获得所有已知样本类型信息包
括:
获取文件样本的多个关键信息;
分别从所述多个关键信息中选取部分关键信息的组合作为不同样本类型的判定信
息,分别使用所述判定信息对所述文件样本进行分类,将与对应样本类型的判定信息内
容完全一致的文件样本作为同一类型的样本;以及
获得每一个样本类型的属性。
5.根据权利要求4所述的方法,其特征在于,所述获得每一个样本类型的属性包
括:
从每一个样本类型包含的所有样本中选取部分样本进行分析,将分析结果作为当前
样本类型的属性。
6.根据权利要求4所述的方法,其特征在于,所述获取文件样本的多个关键信息
包括:
获取安装文件中包含的可执行文件中的头信息和数据信息以及所述可执行文件中
的可扩展标记语言XML的描述文件中不同类入口的操作码信息中的一种或几种;
将获取到的信息以预定格式进行记录。
7.根据权利要求6所述的方法,其特征在于,所述不同类入口包括服务类入口、
接收器类入口和控件容器类入口;所述操作码信息包括操作码、指令码和操作符中的一
种或几种。
8.根据权利要求7所述的方法,其特征在于,所述获得不同类入口的操作码信息
包括:
获得对应类入口的操作码的第一列信息。
9.根据权利要求7所述的方法,其特征在于,所述将获取到的信息以预定格式进
行记录包括:
将获取到的信息以二进制、十六进制或哈希值形式进...

【专利技术属性】
技术研发人员:苏海峰袁国庆舒鑫罗斌
申请(专利权)人:珠海市君天电子科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1