一种获取APP类型的数据处理系统技术方案

技术编号:36565400 阅读:36 留言:0更新日期:2023-02-04 17:21
本发明专利技术涉及一种获取APP类型的数据处理系统,系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,第一数据库包括原始APP集,第二数据库包括样本APP集,第三数据库包括非样本APP集,当计算机程序被处理器执行时,实现以下步骤:获取初始APP列表对应的目标标签集,根据样本APP集和目标标签集获取非样本APP的最终标签,根据最终标签,获取非样本APP对应的APP类型。本发明专利技术提供了一种新的获取APP类型的方法,通过对非样本APP采用不同的处理手段,获取所有APP的标签,从而进行APP的分类,使得获取到的APP类型的准确度较高。型的准确度较高。型的准确度较高。

【技术实现步骤摘要】
一种获取APP类型的数据处理系统


[0001]本专利技术涉及APP处理
,特别是涉及一种获取APP类型的数据处理系统。

技术介绍

[0002]随着智能化的普及和发展,越来越多的应用软件(APP)出现在设备端的应用平台中,技术的不断创新与发展,使得应用软件的类型越来越多,每个类型下应用软件的数量也越来越多,如何对设备端应用平台中的应用软件进行清晰的分类处理成为热门研究问题,通过获取APP标签从而对APP进行精准分类,能够为用户提供更加精准化服务。
[0003]目前,现有技术中,获取APP分类的方法为:基于APP的id获取对应的描述信息,将对应的描述信息输入模型中生成向量,基于APP的id获取预设安装序列生成向量,将生成的所有向量输入到分类模型中进行APP类型的输出,以上所述获取APP类型的方法存在的问题:
[0004]一方面,因方法的局限性,APP标签简单化,使得对APP分类的精确度较低;
[0005]另一方面,因APP数量的巨大,只局限于对特定部分的APP进行分类,不能全面自动覆盖所有APP,使获取到的APP类型的准确度较低。

技术实现思路

[0006]针对上述技术问题,本专利技术采用的技术方案为:一种获取APP类型的数据处理系统,系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,第一数据库包括原始APP集,其中,原始APP集为所有的应用平台中所有APP的集合,第二数据库包括样本APP集,其中,样本APP集包括第一样本APP集和第二样本APP集,第三数据库包括非样本APP集,其中,非样本APP集为原始APP集中除所述样本APP集之外的APP集合,当计算机程序被处理器执行时,实现以下步骤:
[0007]S10,从非样本APP集中获取第一非样本APP列表FA={FA1,
……
,FA
α

……
,FA
λ
}和第二非样本APP列表FB={FB1,
……
,FB
β

……
,FB
γ
},FA
α
为第α个第一非样本APP信息,α=1
……
λ,λ为第一非样本APP的数量,FB
β
为第β个第二非样本APP信息,β=1
……
γ,γ为第二非样本APP的数量。
[0008]S20,根据第一样本APP集,获取初始APP列表B={B1,
……
,B
i

……
,B
m
}、B对应的初始文本列表C={C1,
……
,C
i

……
,C
m
}和B对应的初始pkg列表Q={Q1,
……
,Q
i

……
,Q
m
},B
i
为第i个初始APP名称,C
i
为B
i
对应的初始APP文本,Q
i
为B
i
对应的pkg名称,i=1
……
m,m为初始APP的数量。
[0009]S30,根据B和C,获取B对应的目标标签集D'={D'1,
……
,D'
i

……
,D'
m
},D'
i
为B
i
对应的目标标签列表。
[0010]S40,根据FA
α
和B
i
,获取FA
α
对应的最终标签列表。
[0011]S50,根据FB
β
和Q
i
,获取FB
β
对应的最终标签列表。
[0012]S60,根据FA
α
对应的最终标签列表和FB
β
对应的最终标签列表,获取到FA
α
对应的
APP类型和FB
β
对应的APP类型。
[0013]本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的一种获取APP类型的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
[0014]本专利技术提供了一种获取APP类型的数据处理系统,系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,第一数据库包括原始APP集,其中,原始APP集为所有的应用平台中所有APP的集合,第二数据库包括样本APP集,其中,样本APP集包括第一样本APP集和第二样本APP集,第三数据库包括非样本APP集,其中,非样本APP集为原始APP集中除所述样本APP集之外的APP集合,当计算机程序被处理器执行时,实现以下步骤:从非样本APP集中获取第一非样本APP列表和第二非样本APP列表,根据第一样本APP集获取到的初始APP列表和初始APP列表对应的初始文本列表获取初始APP对应的目标标签列表,根据第一非样本APP和初始APP获取第一非样本APP的最终标签,根据第二非样本APP和初始APP获取第二非样本APP的最终标签,根据第一非样本APP的最终标签和第二非样本APP的最终标签获取非样本APP对应的APP类型。可知,本专利技术一方面,通过模型训练获取样本标签并且将样本的标签进行处理,使APP标签复杂化,使得获取到的APP标签的精确度较高;另一方面,不局限于对特定部分的APP进行分类,通过对APP采用不同的处理方式,能够全面自动覆盖到所有APP,使获取到的APP类型的准确度较高。
附图说明
[0015]图1为本专利技术实施例提供的一种获取APP类型的数据处理系统的执行计算机程序的流程图。
具体实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0017]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0018]本专利技术提供了一种获取APP类型的数据处理,所述系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取APP类型的数据处理系统,其特征在于,所述系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,所述第一数据库包括原始APP集,其中,所述原始APP集为所有的应用平台中所有APP的集合,第二数据库包括样本APP集,其中,所述样本APP集包括第一样本APP集,第三数据库包括非样本APP集,其中,所述非样本APP集为原始APP集中除所述样本APP集之外的APP集合,当所述计算机程序被处理器执行时,实现以下步骤:S10,从所述非样本APP集中获取第一非样本APP列表FA={FA1,
……
,FA
α

……
,FA
λ
}和第二非样本APP列表FB={FB1,
……
,FB
β

……
,FB
γ
},FA
α
为第α个第一非样本APP信息,α=1
……
λ,λ为第一非样本APP的数量,FB
β
为第β个第二非样本APP信息,β=1
……
γ,γ为第二非样本APP的数量;S20,根据所述第一样本APP集,获取初始APP列表B={B1,
……
,B
i

……
,B
m
}、B对应的初始文本列表C={C1,
……
,C
i

……
,C
m
}和B对应的初始pkg列表Q={Q1,
……
,Q
i

……
,Q
m
},B
i
为第i个初始APP名称,C
i
为B
i
对应的初始APP文本,Q
i
为B
i
对应的pkg名称,i=1
……
m,m为初始APP的数量;S30,根据B和C,获取B对应的目标标签集D'={D'1,
……
,D'
i

……
,D'
m
},D'
i
为B
i
对应的目标标签列表;S40,根据FA
α
和B
i
,获取FA
α
对应的最终标签列表;S50,根据FB
β
和Q
i
,获取FB
β
对应的最终标签列表;S60,根据所述FA
α
对应的最终标签列表和所述FB
β
对应的最终标签列表,获取到FA
α
对应的APP类型和FB
β
对应的APP类型。2.根据权利要求1所述的获取APP类型的数据处理系统,其特征在于,所述第一非样本APP信息包括第一非样本APP名称且不包括第一非样本APP的APP文本和第一非样本APP的pkg名称。3.根据权利要求2所述的获取APP类型的数据处理系统,其特征在于,所述第二非样本APP信息包括第二非样本APP的pkg名称且不包括第二非样本APP的APP文本和第二非样本APP的名称。4.根据权利要求1所述的获取APP类型的数据处理系统,其特征在于,在S30中还包括如下步骤:S310,根据B
i
和C
i
,获取B
i
对应的目标词向量列表D
i
={B
0i
,C
0i1

……
,C
0ix

……
,C
0ip(i)
},B
0i
为B
i
对应的第一词向量,C
0ix
为C
i
对应的第x个第二词向量,x=1
……
p(i),p(i)为C
i
对应的第二词向量的数量;S320,将D
i
输入至预设的第一神经网络模型中,获取B
i
对应的第一中间标签列表D
0i
;S330,当D
0i
=Null时,将B
i
对应的初始APP作为第一APP;S340,当D
0i
≠Null且K
0i
≥K0时,将B
i
对应的初始APP作为第一APP,其中,K
0i
为D
0i
对应的第一中间标签数量,K0为预设的标签数量阈值;S350,当D
0i
≠Null且K
0i
<K0时,将B
i
对应的初始APP作为第二APP;S360,对所述第一APP进行第一标记处理,获取第一APP对应的目标标签;S370,对所述第二APP进行第二标记处理,获取第二APP对应的目标标签;S380,根据第一APP对应的目标标签和第二APP对应的目标标签,获取B对应的目标标签
集D'={D'1,
……
,D'
i

……
,D'
m
},D'
i
为B
i
对应的目标标签列表。5.根据权利要求4所述的获取APP类型的数据处理系统,其特征在于,在S310之前还包括如下步骤:S3101,对...

【专利技术属性】
技术研发人员:段永康董霖叶新江朱为宁
申请(专利权)人:每日互动股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1