【技术实现步骤摘要】
一种获取APP类型的数据处理系统
[0001]本专利技术涉及APP处理
,特别是涉及一种获取APP类型的数据处理系统。
技术介绍
[0002]随着智能化的普及和发展,越来越多的应用软件(APP)出现在设备端的应用平台中,技术的不断创新与发展,使得应用软件的类型越来越多,每个类型下应用软件的数量也越来越多,如何对设备端应用平台中的应用软件进行清晰的分类处理成为热门研究问题,通过获取APP标签从而对APP进行精准分类,能够为用户提供更加精准化服务。
[0003]目前,现有技术中,获取APP分类的方法为:基于APP的id获取对应的描述信息,将对应的描述信息输入模型中生成向量,基于APP的id获取预设安装序列生成向量,将生成的所有向量输入到分类模型中进行APP类型的输出,以上所述获取APP类型的方法存在的问题:
[0004]一方面,因方法的局限性,APP标签简单化,使得对APP分类的精确度较低;
[0005]另一方面,因APP数量的巨大,只局限于对特定部分的APP进行分类,不能全面自动覆盖所有APP,使获取到的APP类型的准确度较低。
技术实现思路
[0006]针对上述技术问题,本专利技术采用的技术方案为:一种获取APP类型的数据处理系统,系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,第一数据库包括原始APP集,其中,原始APP集为所有的应用平台中所有APP的集合,第二数据库包括样本APP集,其中,样本APP集包括第一样本APP集和第二样本 ...
【技术保护点】
【技术特征摘要】
1.一种获取APP类型的数据处理系统,其特征在于,所述系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,所述第一数据库包括原始APP集,其中,所述原始APP集为所有的应用平台中所有APP的集合,第二数据库包括样本APP集,其中,所述样本APP集包括第一样本APP集,第三数据库包括非样本APP集,其中,所述非样本APP集为原始APP集中除所述样本APP集之外的APP集合,当所述计算机程序被处理器执行时,实现以下步骤:S10,从所述非样本APP集中获取第一非样本APP列表FA={FA1,
……
,FA
α
,
……
,FA
λ
}和第二非样本APP列表FB={FB1,
……
,FB
β
,
……
,FB
γ
},FA
α
为第α个第一非样本APP信息,α=1
……
λ,λ为第一非样本APP的数量,FB
β
为第β个第二非样本APP信息,β=1
……
γ,γ为第二非样本APP的数量;S20,根据所述第一样本APP集,获取初始APP列表B={B1,
……
,B
i
,
……
,B
m
}、B对应的初始文本列表C={C1,
……
,C
i
,
……
,C
m
}和B对应的初始pkg列表Q={Q1,
……
,Q
i
,
……
,Q
m
},B
i
为第i个初始APP名称,C
i
为B
i
对应的初始APP文本,Q
i
为B
i
对应的pkg名称,i=1
……
m,m为初始APP的数量;S30,根据B和C,获取B对应的目标标签集D'={D'1,
……
,D'
i
,
……
,D'
m
},D'
i
为B
i
对应的目标标签列表;S40,根据FA
α
和B
i
,获取FA
α
对应的最终标签列表;S50,根据FB
β
和Q
i
,获取FB
β
对应的最终标签列表;S60,根据所述FA
α
对应的最终标签列表和所述FB
β
对应的最终标签列表,获取到FA
α
对应的APP类型和FB
β
对应的APP类型。2.根据权利要求1所述的获取APP类型的数据处理系统,其特征在于,所述第一非样本APP信息包括第一非样本APP名称且不包括第一非样本APP的APP文本和第一非样本APP的pkg名称。3.根据权利要求2所述的获取APP类型的数据处理系统,其特征在于,所述第二非样本APP信息包括第二非样本APP的pkg名称且不包括第二非样本APP的APP文本和第二非样本APP的名称。4.根据权利要求1所述的获取APP类型的数据处理系统,其特征在于,在S30中还包括如下步骤:S310,根据B
i
和C
i
,获取B
i
对应的目标词向量列表D
i
={B
0i
,C
0i1
,
……
,C
0ix
,
……
,C
0ip(i)
},B
0i
为B
i
对应的第一词向量,C
0ix
为C
i
对应的第x个第二词向量,x=1
……
p(i),p(i)为C
i
对应的第二词向量的数量;S320,将D
i
输入至预设的第一神经网络模型中,获取B
i
对应的第一中间标签列表D
0i
;S330,当D
0i
=Null时,将B
i
对应的初始APP作为第一APP;S340,当D
0i
≠Null且K
0i
≥K0时,将B
i
对应的初始APP作为第一APP,其中,K
0i
为D
0i
对应的第一中间标签数量,K0为预设的标签数量阈值;S350,当D
0i
≠Null且K
0i
<K0时,将B
i
对应的初始APP作为第二APP;S360,对所述第一APP进行第一标记处理,获取第一APP对应的目标标签;S370,对所述第二APP进行第二标记处理,获取第二APP对应的目标标签;S380,根据第一APP对应的目标标签和第二APP对应的目标标签,获取B对应的目标标签
集D'={D'1,
……
,D'
i
,
……
,D'
m
},D'
i
为B
i
对应的目标标签列表。5.根据权利要求4所述的获取APP类型的数据处理系统,其特征在于,在S310之前还包括如下步骤:S3101,对...
【专利技术属性】
技术研发人员:段永康,董霖,叶新江,朱为宁,
申请(专利权)人:每日互动股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。