【技术实现步骤摘要】
一种信息推荐方法及装置
本专利技术涉及计算机
,尤其涉及一种信息推荐方法及装置。
技术介绍
现在,化妆是一种潮流时尚,很多的职场女性或者出去约会的女生都需要化妆,化妆可以美化容貌、增加女性气质,可以说,化妆是现在女性生活中必不可少的一件事情。如何画一个精致又适合自己的妆容是很多美妆女性需要学习的内容,为此,很多女性用户会在互联网上搜索和阅读美妆教程类的相关文章,以提高自己的化妆水平。但是,对于大数据时代,若要用户自己从鱼龙混杂的互联网检索出想要的文章,需要花费大量的时间和精力,检索效率低、获取成本较高。
技术实现思路
本专利技术的目的在于提供一种信息推荐方法及装置,以解决现有美妆类教学文章获取途径繁杂、获取效率低的技术问题。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种信息推荐方法,包括:获取候选文章集、以及所述候选文章集中每一候选文章的标题信息;根据所述候选文章集和标题信息确定候选词集;根据所述候选词集、标题信息和候选文章集生成候选标签组,所述候选标签组中每一候选标签对应至少一篇候选文章;根据所述候选词集、候选标签组和候选文章集建立推荐数据库;基于所述推荐数据库向用户推荐信息。为解决上述技术问题,本专利技术实施例还提供以下技术方案:一种信息推荐装置,包括:获取模块,用于获取候选文章集、以及所述候选文章集中每一候选文章的标题信息;确定模块,用于根据所述候选文章集和标题信息确定候选词集;生成模块,用于根据所述候选词集、标题信息和候选文章集生成候选标签组,所述候选标签组中每一候选标签对应至少一篇候选文章;建立模块,用于根据所述候选词集、候选标签组 ...
【技术保护点】
一种信息推荐方法,其特征在于,包括:获取候选文章集、以及所述候选文章集中每一候选文章的标题信息;根据所述候选文章集和标题信息确定候选词集;根据所述候选词集、标题信息和候选文章集生成候选标签组,所述候选标签组中每一候选标签对应至少一篇候选文章;根据所述候选词集、候选标签组和候选文章集建立推荐数据库;基于所述推荐数据库向用户推荐信息。
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:获取候选文章集、以及所述候选文章集中每一候选文章的标题信息;根据所述候选文章集和标题信息确定候选词集;根据所述候选词集、标题信息和候选文章集生成候选标签组,所述候选标签组中每一候选标签对应至少一篇候选文章;根据所述候选词集、候选标签组和候选文章集建立推荐数据库;基于所述推荐数据库向用户推荐信息。2.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述候选词集、标题信息和候选文章集生成候选标签组,包括:根据所述候选词集和标题信息对所述候选文章集进行分组,得到待处理文章组,每一候选词对应一个待处理文章组;根据所述待处理文章组中待处理文章的标题信息和对应的候选词生成候选标签,并添入候选标签组。3.根据权利要求2所述的信息推荐方法,其特征在于,所述根据所述候选词集和标题信息对所述候选文章集进行分组,得到待处理文章组,包括:将每一候选文章的标题信息与所述候选词集中的候选词进行匹配;将与同一候选词匹配成功的所有候选文章归为同一组,得到待处理文章组。4.根据权利要求2所述的信息推荐方法,其特征在于,所述根据所述待处理文章组中待处理文章的标题信息和对应的候选词生成候选标签,并添入候选标签组,包括:对所述待处理文章组中每一候选文章的标题信息进行语法分析,得到词性信息;获取所述候选词在标题信息中出现的位置信息;根据所述候选词、位置信息、词性信息和标题信息生成候选标签,并添入候选标签组。5.根据权利要求4所述的信息推荐方法,其特征在于,所述根据所述候选词、位置信息、词性信息和标题信息生成候选标签,并添入候选标签组,包括:根据所述位置信息和词性信息,按照预设规则从所述待处理文章组的每一标题信息中确定目标词组,每一标题信息对应一个目标词组,每一目标词组包括至少一个目标词;根据每一目标词组和对应的候选词生成候选标签,并添入候选标签组。6.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述候选文章集和标题信息确定候选词集,包括:对所述候选文章集中每一候选文章进行分词处理,得到词集;利用预设算法对所述词集进行筛选操作,得到筛选后词集;根据所述筛选后词集和标题信息确定候选词集。7.根据权利要求6所述的信息推荐方法,其特征在于,所述根据所述筛选后词集和标题信息确定候选词集,包括:计算所述筛选后词集中每一词在所述标题信息中出现的总次数;将总次数大于第一预设阀值的词确定为候选词,并添入候选词集。8.根据权利要求1-7中任意一项所述的信息推荐方法,其特征在于,所述根据所述候选词集、候选标签组和候选文章集建立推荐数据库,包括:将所述候选文章集中具有相同候选标签的候选文章归为一组,得到候选文章组,每一候选标签对应一个候选文章组;建立所述候选词集中每一候选词与候选标签组之间的关联,得到第一关联关系;根据所述候选标签组和候选文章组确定第二关联关系;将所述第一关联关系和第二关联关系存储在推荐数据库中。9.根据权利要求8所述的信息推荐方法,其特征在于,所述根据所述候选标签组和候选文章组确定第二关联关系,包括:从所述候选文章组中提取出每一候选文章所包含的段落,得到段落组,每一候选文章对应一个段落组;根据所述段落组生成候选片段组,每一段落组对应一个候选片段组;建立每一候选标签和候选文章组之间、以及每一候选文章和候选片段组之间的关联,得到第二关联关系。10.根据权利要求9所述的信息推荐方法,其特征在于,所述根据所述段落组生成候选片段组,包括:从每一段落组中获取内容是图像的段落,作为目标段落;根据所述目标段落对所述段落组进行调整;将调整后段落组中的每一段落作为一个候选片段,得到候选片段组。11.根据权利要求10所述的信息推荐方法,其特征在于,所述根据所述目标段落对所述段落组进行调整,包括:从所述段落组中获取与所述目标段落相邻的下一个段落;计算获取的下一个段落的字数;将字数小于第二预设阀值的下一个段落合并到对应的目标段落中,以对所述段落组进行调整。12.根据权利要求9所述的信息推荐方法,其特征在于,所述基于所述推荐数据库向用户推荐信息,包括:获取信息推荐请求,所述信息推荐请求携带检索词;根据所述检索词和第一关联关系从所述推荐数据库中确定可选标签组;根据所述第二关联关系和可选标签组从所述推荐数据库中确定目标片段;向用户推荐所述目标片段。13.根据权利要求12所述的信息推荐方法,其特征在于,所述根据所述检索词和第一关联关系从所述推荐数据库中确定可选标签组,包括:将...
【专利技术属性】
技术研发人员:孙子荀,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。