应用分类模型构建方法、应用分类方法及系统技术方案

技术编号：12298659 阅读：136 留言：0更新日期：2015-11-11 09:37

本发明专利技术提供了一种应用分类模型构建方法、应用分类方法及系统，本发明专利技术根据应用的权限列表和主题信息，具体考虑应用产生的行为来反映应用的分类，通过一次和二次匹配模型，能够有效降低人工干预和人力成本，提高平均分类精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种应用分类模型构建方法及系统。
技术介绍
随着手机等移动终端性能的提高和可下载的应用软件规模的极速增长，用户在选择应用时将面对更大的噪声，如何有效的对大规模应用进行分类从而提高用户的体验成为一个手机市场重要的技术手段。目前软件在应用市场进行推广，搜索，下载中，对于新应用的分类使用人工逐个审核的方式对应用归类，这样的方法人力成本高，而且平均精度不高，难以维护。
技术实现思路
本专利技术的目的在于提供一种应用分类模型构建方法及系统，能够有效降低人力成本，提高平均分类精度。为解决上述问题，本专利技术提供一种应用分类模型构建方法，包括：获取不同应用提供商的多数据源的应用基础分类数据作为训练数据；获取训练数据中每个应用的权限列表；根据训练数据中所有应用的权限列表构建一次匹配模型，所述一次匹配模型包括应用的多个第一分类；获取训练数据中每个应用的主题信息，根据训练数据中所有应用的主题信息进行特征选择；根据选择的特征构建二次匹配模型，所述二次匹配模型包括应用的多个第二分类。进一步的，在上述方法中，获取不同应用提供商的多数据源的应用基础分类数据作为训练数据，包括：获取不同应用提供商的多数据源的每个应用的分类向量；统计每个应用的分类向量中每个分类的出现频次，由每个应用的分类向量中出现频次最高的分类作为该应用的应用基础分类，当出现无法判断分类的应用时将其从训练数据集中删除。进一步的，在上述方法中，获取训练数据中每个应用的权限列表中，每个应用的权限列表为根据该应用的权限生成的字典表向量。进一步的，在上述方...

【技术保护点】
一种应用分类模型构建方法，其特征在于，包括：获取不同应用提供商的多数据源的应用基础分类数据作为训练数据；获取训练数据中每个应用的权限列表；根据训练数据中所有应用的权限列表构建一次匹配模型，所述一次匹配模型包括应用的多个第一分类；获取训练数据中每个应用的主题信息，根据训练数据中所有应用的主题信息进行特征选择；根据选择的特征构建二次匹配模型，所述二次匹配模型包括应用的多个第二分类。

【技术特征摘要】

【专利技术属性】
技术研发人员：马松玉，
申请(专利权)人：上海卓悠网络科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人