一种识别异常APK的方法、电子设备及可读存储介质技术

技术编号:32626620 阅读:13 留言:0更新日期:2022-03-12 18:00
本发明专利技术公开了一种识别异常APK的方法、电子设备及可读存储介质,所述方法包括如下步骤:通过获取目标APK列表,根据目标APK列表中APK反编译得到的文件得到第一目标词列表和第二目标词列表,根据一目标关键词列表和第二目标词列表,得到目标词列表并存储至样本数据库;将目标词列表任一目标词输入至第三模型,得到此目标词进行扩充得到扩充后的词向量并存储至所述样本数据库;基于所述样本数据库,确定待测APK是否为异常APK;发明专利技术的技术方案中能够保证样本数据库的中数据充足和完善,有利于提高确定异常APK的准确性,同时也优化了本数据库的中数据。数据库的中数据。数据库的中数据。

【技术实现步骤摘要】
一种识别异常APK的方法、电子设备及可读存储介质


[0001]本专利技术涉及APK文件
,特别涉及一种识别异常APK的方法、电 子设备及可读存储介质。

技术介绍

[0002]目前,安卓平台中针对安卓安装包(AndroidPackage,简称APK)具有很多的 类型,其中异常类型的APK会对于用户产生负面效果,例如,泄漏用户信息或 者插入异常插件等。
[0003]在现有的技术中,对于安装在设备中的APK,统计的异常APK有限,一方 面是由于APK加密无法进行识别,另一方面由于,异常APK会不断的更新, 数据库中无法满足更新后的APK识别,对用户使用造成负面鲜果,影响到用户 的使用安全。

技术实现思路

[0004]为了解决现有技术的问题,通过计算出任一APK反编译得到的文本中关键 对应的TF值和textrank值,并基于TF值和textrank值筛选出目标词用于扩展若 干关联词,将关联词和目标词存储值样本数据库中,保证样本数据库的中数据 充足和完善,有利于提高确定异常APK的准确性,同时也优化了本数据库的中 数据;本专利技术实施例提供了一种识别异常APK的方法、电子设备及可读存储介 质。所述技术方案如下:
[0005]一方面,一种识别异常APK的方法,所述方法包括如下步骤:
[0006]S101、获取目标APK列表A=(A1,A2,A3,
……
,A
m
),其中,A
i
是指 第i个目标APK,m为目标APK数量;
[0007]S103、根据A对应的目标文件D,得到第一目标列表B=(B1,B2,B3,
……
, Bλ)和第二目标列表其中,Bx是指 第X个第一目标词,x=1
……
λ,λ为第一目标词数量,是指第y个第二目 标词,y=1
……
γ,γ为第二目标词数量;
[0008]其中,S103还包括如下方法确定D:
[0009]将Ai进行反编译处理,得到目标代码包,所述目标代码包包括:若干个的 目标文件,所述目标文件是指若干行的编辑代码;
[0010]将任一行的编辑代码提取的中文语料作为目标语句,并对相邻行的目标语 句之间插入间隔符且对相邻的目标文件之间插入相同的间隔符,得到Di;
[0011]当D1∪D2∪
……
∪Dm时且相邻的Di插入相同的间隔符,得到D;
[0012]S105、根据B和得到目标词列表C=(C1,C2,C3,
……
,Cn)并存 储至样本数据库,其中,Cj是指第j个样本关键词,j=1
……
n,n为样本关键数 量;
[0013]S107、将任一Cj输入至LDA模型,得到Cj对应的词向量(Cj1,C2,Cj3,
……
,Cjk)并存储至所述样本数据库,其中,Cjt是指Cj对应的第t个关联词,t=1
……ꢀ
k,k为关联词数量;
[0014]S109、基于所述样本数据库,确定待测APK是否为异常APK。
[0015]另一方面,一种电子设备,包括处理器和存储器,所述存储器中存储有至 少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处 理器加载并执行以实现如上述任一项所述识别异常APK的方法。
[0016]另一方面,一种计算机可读存储介质,所述计算机可读存储介质中存储有 至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理 器加载并执行以实现如上述任一项所述识别异常APK的方法。
[0017]本专利技术提供的一种识别异常APK的方法、电子设备及可读存储介质,具有 如下技术效果:
[0018]专利技术通过获取目标APK列表,根据目标APK列表中APK反编译后的文件 集成目标文件,根据目标文件得到第一目标词列表和第二目标词列表,根基于 第一目标词列表和第二目标词列表,得到目标词列表并存储至样本数据库;将 目标词列表任一目标词输入至第三模型,得到此目标词进行扩充得到扩充后的 词向量并存储至所述样本数据库;基于所述样本数据库,确定待测APK是否为 异常APK;可见,专利技术的技术方案中保证样本数据库的中数据充足和完善,有 利于提高确定异常APK的准确性,同时也优化了本数据库的中数据。
附图说明
[0019]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
[0020]图1是本专利技术实施例一提供的一种识别异常APK的方法的流程示意图。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是 全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造 性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、
ꢀ“
第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。 应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实 施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括
”ꢀ
和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了 一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的 那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品 或设备固有的其它步骤或单元。
[0023]根据图1,本实施例提供了一种识别异常APK的方法,所述方法包括如下 步骤:
[0024]S101、获取目标APK列表A=(A1,A2,A3,
……
,A
m
),其中,A
i
是指 第i个目标APK,m为目标APK数量;
[0025]具体地,所述目标APK为具有异常标识的APK,其中,A1……
A
m
具有相 同的异常标
识,能够对于同类的APK中关键词进行计算,进而通过关键词扩充 样本数据库,有利于待测APK类型的确定。
[0026]S103、根据A对应的目标文件D,得到第一目标列表B=(B1,B2,B3,
……
, Bλ)和第二目标列表其中,Bx是指 第X个第一目标词,x=1
……
λ,λ为第一目标词数量,是指第y个第二目 标词,y=1
……
γ,γ为第二目标词数量;
[0027]其中,S103还包括如下方法确定D:
[0028]将Ai进行反编译处理,得到目标代码包,所述目标代码包包括:若干个的 目标文件,所述目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别异常APK的方法,其特征在于,所述方法包括如下步骤:S101、获取目标APK列表A=(A1,A2,A3,
……
,A
m
),其中,A
i
是指第i个目标APK,m为目标APK数量;S103、根据A对应的目标文件D,得到第一目标列表B=(B1,B2,B3,
……
,B
λ
)和第二目标列表其中,B
x
是指第X个第一目标词,x=1
……
λ,λ为第一目标词数量,是指第y个第二目标词,y=1
……
γ,γ为第二目标词数量;其中,S103还包括如下方法确定D:将A
i
进行反编译处理,得到目标代码包,所述目标代码包包括:若干个的目标文件,所述目标文件是指若干行的编辑代码;将任一行的编辑代码提取的中文语料作为目标语句,并对相邻行的目标语句之间插入间隔符且对相邻的目标文件之间插入相同的间隔符,得到D
i
;当D1∪D2∪
……
∪D
m
时且相邻的D
i
插入相同的间隔符,得到D;S105、根据B和得到目标词列表C=(C1,C2,C3,
……
,C
n
)并存储至样本数据库,其中,C
j
是指第j个样本关键词,j=1
……
n,n为样本关键数量;S107、将任一C
j
输入至LDA模型,得到C
j
对应的词向量(C
j1
,C
j
2,C
j3

……
,C
jk
)并存储至所述样本数据库,其中,C
jt
是指C
j
对应的第t个关联词,t=1
……
k,k为关联词数量;S109、基于所述样本数据库,确定待测APK是否为异常APK。2.根据权利要求1所述的一种识别异常...

【专利技术属性】
技术研发人员:尹祖勇吕繁荣俞锋锋张雅茹钟杨青
申请(专利权)人:杭州云深科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1