应用程序分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:27684742 阅读:20 留言:0更新日期:2021-03-17 03:45
本申请提供了一种应用程序分类方法、装置、计算机设备及存储介质,涉及程序分类技术领域,用于实现应用程序的自动分类。方法主要包括:获取待分类应用程序的程序名称;将所述程序名称转换为对应的程序名称向量;将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别,所述应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的。

【技术实现步骤摘要】
应用程序分类方法、装置、计算机设备及存储介质
本申请涉及程序分类
,尤其涉及一种应用程序分类方法、装置、计算机设备及存储介质。
技术介绍
随着移动智能手机的不断发展和普及,移动智能手机上的应用程序也日渐兴起,用户可以通过搜索关键词的方式来搜索需要的应用程序,进而安装相应的应用程序。为了方便用户快速查找到需要的应用程序,可以在页面上展现多种应用程序分类,用户可以点击应用程序分类,选择该应用程序分类下的应用程序。现有技术中,应用程序的分类和展现是基于人工运营,缺乏自动化的分类及展现方案。
技术实现思路
本申请实施例提供一种应用程序分类方法、装置、计算机设备及存储介质,用于实现应用程序的自动分类。本专利技术实施例提供一种应用程序分类方法,所述方法包括:获取待分类应用程序的程序名称;将所述程序名称转换为对应的程序名称向量;将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别,所述应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的。本专利技术实施例提供一种应用程序分类装置,所述装置包括:获取模块,用于获取待分类应用程序的程序名称;转换模块,用于将所述程序名称转换为对应的程序名称向量;计算模块,用于将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别,所述应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述应用程序分类方法。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述应用程序分类方法。本专利技术提供一种应用程序分类方法、装置、计算机设备及存储介质,首先获取待分类应用程序的程序名称;然后将所述程序名称转换为对应的程序名称向量;最后将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别。与目前基于人工运营对应用程序进行分类相比,由于本专利技术中的应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的,因此在得到待分类应用程序的程序名称对应的向量后,将程序名称向量输入到应用程序分类模型,便可以得到与待分类应用程序对应的程序类别,从而通过本专利技术可实现应用程序的自动分类,提高了应用程序的分类效率,较少了人工分类所带来的成本。附图说明图1为本申请第一实施例提供的应用程序分类方法流程图;图2为本申请第二实施例提供的应用程序分类方法流程图;图3为本申请第二实施例提供的构建的无向图;图4为本申请第三实施例提供的应用程序分类的流程图;图5为本申请第四实施例提供的应用程序分类的流程图;图6为本申请一个实施例提供的应用程序分类装置的结构框图;图7为本申请一个实施例提供的计算机设备的一示意图。具体实施方式为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请实施例的技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请实施例技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。请参阅图1,所示为本专利技术第一实施例当中的应用程序分类方法,所述方法具体包括步骤S10-步骤S30:步骤S10,获取待分类应用程序的程序名称。其中,待分类应用程序是需要进行分类的程序。步骤S20,将所述程序名称转换为对应的程序名称向量。具体的,程序名称向量化,使用预训练词对程序名称进行嵌入得到程序名称向量。步骤S30,将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别。其中,所述应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的。程序标签具体可以为投资类、借贷类、社交类、游戏类、聊天类等,本专利技术实施例不做具体限定。需要说明的是,本实施例中的应用程序分类模型是根据大量的样本数据(样本程序名称向量及对应的程序标签)训练得到的。例如,训练应用程序分类模型的样本数据量级在8000万左右,各个安装量级的应用程序占比如下表1所示。下表统计可以看出百分之一的应用程序安装量超过十万,千分之一应用程序安装量超过百万,万分之一的应用程序安装量超过千万,而最终99%的应用程序安装量都不超过10万,可以定义为小众应用程序。由于本实施例的样本数据中不同安装量级的应用程序占比不同,即安装量级低的样本数据量级相对较多,因此通过本实施例得到的应用程序分类模型可实现对小众应用程序的自动分类,从而提高了小众应用程序的分类效率。表1安装量级占比<1030%10-10030%100-100030%1000-1000009%>1000001%>10000001‰>10000000万分之一本实施例提供一种应用程序分类方法,首先获取待分类应用程序的程序名称;然后将所述程序名称转换为对应的程序名称向量;最后将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别。与目前基于人工运营对应用程序进行分类相比,由于本专利技术中的应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的,因此在得到待分类应用程序的程序名称对应的向量后,将程序名称向量输入到应用程序分类模型,便可以得到与待分类应用程序对应的程序类别,从而通过本专利技术可实现应用程序的自动分类,提高了应用程序的分类效率,较少了人工分类所带来的成本。参阅图2,所示为本专利技术第二实施例当中的应用程序分类方法,应用程序分类模型采用通过下述步骤训练得到:步骤S01,获取多个用户下载的应用程序列表。其中,所述应用程序列表中包括用户下载的多个应用程序的程序名称。应用程序列表为训练应用程序分类模型的样本数据,不同用户对应不同的应用程序列表,每个应用程序列表中包含多个应用程序的名称。步骤S02,根据多个用户下载的应用程序列表中的应用程序的程序名称构建无向图。其中,所述无向图中的节点为应用程序的程序名称,边为属于同一个应用程序列表中两个程序名称的个数。例如,用户A的应用程序列表中包含程序名称1、2、3;用户B的应用程序列表中包含程序名称1、2、4、5;用户C的应用程序列表中包含程序名称2、4、5。则构建的无向图如图3所示,其中节点1、2、3、4、5分别代表应用程序的名称,节点之间边的数值为同属于一个应用程序列表中两个程序名称的个数,如节点1和节点2在用户A和用户B的应用程序列表中出本文档来自技高网...

【技术保护点】
1.一种应用程序分类方法,其特征在于,所述方法包括:/n获取待分类应用程序的程序名称;/n将所述程序名称转换为对应的程序名称向量;/n将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别,所述应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的。/n

【技术特征摘要】
1.一种应用程序分类方法,其特征在于,所述方法包括:
获取待分类应用程序的程序名称;
将所述程序名称转换为对应的程序名称向量;
将所述程序名称向量输入到应用程序分类模型,得到与所述待分类应用程序对应的程序类别,所述应用程序分类模型是根据样本程序名称向量及对应的程序标签训练得到的。


2.根据权利要求1所述的应用程序分类方法,其特征在于,所述方法还包括:
获取多个用户下载的应用程序列表,所述应用程序列表中包括用户下载的多个应用程序的程序名称;
根据多个用户下载的应用程序列表中的应用程序的程序名称构建无向图,所述无向图中的节点为应用程序的程序名称,边为属于同一个应用程序列表中两个程序名称的个数;
确定所述无向图对应的标签;
根据所述无向图对应的标签和所述无向图中各程序名称的程序名称向量进行模型训练得到所述应用程序分类模型。


3.根据权利要求2所述的应用程序分类方法,其特征在于,在根据多个用户下载的应用程序列表中的应用程序的程序名称构建无向图之后,所述方法还包括:
将所述无向图中边的权重值小于预置数值对应的边删除,得到多个子无向图;
所述确定所述无向图对应的标签,包括:
确定所述子无向图分别对应的标签。


4.根据权利要求2或3所述的应用程序分类方法,其特征在于,所述根据所述无向图对应的标签和所述无向图中各程序名称的程序名称向量进行模型训练得到所述应用程序分类模型,包括:
获取所述应用程序列表中各应用程序分别对应的应用截图;
从所述应用截图中提取文字摘要信息;
根据所述无向图对应的标签和所述无向图中各程序名称的程序名称向量、提取的文字摘要信息进行模型训练得到所述应用程序分类模型。


5.根据权利要求4所述的应用程序分类方法,其特征在于,所述方法还包括:
在虚拟环境中安装所述待分类应用程序,以获取所述待分类应用程序的应用截图;
从所述待分类应用程序的应用截图中提取文字摘要信息;
所...

【专利技术属性】
技术研发人员:尹祖勇俞锋锋方毅孙勇韬李正曾昱深
申请(专利权)人:杭州云深科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1