本发明专利技术实施例公开了一种软件标签的生成方法和装置。所述方法包括:获取与软件下载行为对应的下载日志信息,根据所述下载日志信息,生成所述软件的软件标签;所述装置包括:下载日志信息获取单元,用于获取与软件下载行为对应的下载日志信息,软件标签生成单元,用于根据所述下载日志信息,生成所述软件的软件标签。本发明专利技术通过获取与软件下载行为对应的下载日志信息,根据下载日志信息,生成软件标签的技术手段,解决了现有技术中软件标签中包括的标签信息内容比较单一的技术问题,丰富了软件标签中包含的信息种类,使得软件标签不仅能够描述软件功能,还可以用来描述用户的行为,进而可以用来进行用户行为分析,大大扩展了软件标签的功能。
【技术实现步骤摘要】
软件标签的生成方法和装置
本专利技术实施例涉及计算机技术,尤其涉及一种软件标签的生成方法和装置。
技术介绍
互联网是人们获取信息的重要途径,传统互联网的主要特点是用户在寻找自己感兴趣的事物时,需要通过浏览器进行大量的搜索,并需要人工过滤掉大量不相关的结果。随着软件技术的不断发展,人们对各种网络应用软件的需求越来越广泛,相应的,各种不同种类的软件也被不断开发和应用,极大的丰富和方便了人们的生活。同时,如何使用户从众多的软件中便捷的获取所需的和感兴趣的软件也成为一个非常重要的研究课题。现有技术中,软件开发商会向自己开发的软件中添加软件标签,以方便搜索引擎(例如,百度搜索或者谷歌搜索等)或者软件下载助手(例如,百度手机软件下载助手或者百度PC(PersonalComputer,个人电脑)软件下载助手等)根据该软件标签将相符合的软件提供至需求用户,以及帮助用户快速了解该软件的主要功能等。例如:Photoshop软件中包括的软件标签为:“图片编辑软件”,当用户通过输入搜索关键词的方式在搜索引擎中搜索图片编辑类的软件时,搜索引擎将该搜索关键词与各个软件的软件标签进行匹配后,会将Photoshop软件作为搜索结果提供给用户。但是,这类软件标签中包括的标签信息内容比较单一,仅仅是对软件的主要功能的描述,无法满足人们日益增长的个性化、便捷化需求。
技术实现思路
有鉴于此,本专利技术实施例提供一种软件标签的生成方法和装置,以丰富软件标签中包含的信息种类,满足人们日益增长的个性化、便捷化需求。在第一方面,本专利技术实施例提供了一种软件标签的生成方法,包括:获取与软件下载行为对应的下载日志信息;根据所述下载日志信息,生成所述软件的软件标签。在第二方面,本专利技术实施例提供了一种软件标签的生成装置,包括:下载日志信息获取单元,用于获取与软件下载行为对应的下载日志信息;软件标签生成单元,用于根据所述下载日志信息,生成所述软件的软件标签。本专利技术实施例通过获取与软件下载行为对应的下载日志信息,根据所述下载日志信息,生成所述软件的软件标签的技术手段,解决了现有技术中软件标签中包括的标签信息内容比较单一的技术问题,丰富了软件标签中包含的信息种类,使得软件标签不仅能够描述软件功能,还可以用来描述用户的行为,进而可以用来进行用户行为分析,大大扩展了软件标签的功能。附图说明图1是本专利技术第一实施例的一种软件标签的生成方法的流程图;图2是本专利技术第二实施例的一种软件标签的生成方法的流程图;图3是本专利技术第三实施例的一种软件标签的生成方法的流程图;图4是本专利技术第四实施例的一种软件标签的生成方法的流程图;图5是本专利技术第五实施例的一种软件标签的生成方法的流程图;图6是本专利技术第六实施例的一种软件标签的生成装置的结构图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。第一实施例图1是本专利技术第一实施例的一种软件标签的生成方法的流程图,本实施例的方法可以由软件标签的生成装置来执行,该装置可通过硬件和/或软件的方式实现,一般可集成于用于为软件添加标签的服务器内。本实施例的方法具体包括如下操作:110、获取与软件下载行为对应的下载日志信息。在本实施例中,软件标签服务器获取与软件下载行为对应的下载日志信息。一般来说,用户下载软件的渠道主要包括:通过在搜索引擎入口(典型的,搜索引擎的搜索输入框)中输入搜索字符串后,直接在搜索引擎返回的搜索结果界面中点击下载;或者通过在搜索引擎入口中输入搜索字符串后,在搜索引擎返回的搜索结果中点击进入对应的软件下载网站的网址后,完成软件下载;或者通过手机软件下载助手或者PC软件下载助手来下载软件等。其中,不论用户通过何种渠道完成软件下载,用户的软件下载行为都会被记录到相应的日志信息中。举例而言,如果用户通过搜索引擎完成软件下载或者点击进入软件下载网站,与上述点击操作或者下载操作对应的日志信息会作为搜索引擎日志信息中的一个日志条目存储于搜索引擎服务器中或者用户终端设备中;如果用户通过软件下载助手完成软件下载,上述日志信息会作为软件下载助手日志信息中的一个日志条目存储于软件下载助手的服务器中或者用户终端设备中。在本实施例中,软件标签服务器可以从用户终端设备、搜索引擎服务器、或者软件下载助手的服务器中获取上述下载日志信息,对此不进行限制。一般来说,日志信息中包括有用户的操作类型,例如:下载、查询或者点击等。因此,软件标签服务器通过简单的类型匹配操作,即可获取日志信息中的下载日志信息。在本实施例的一个优选的实施方式中,可以将搜索引擎日志中与下载操作对应的日志信息以及与点击软件下载网站操作对应的日志信息作为下载日志信息;和/或将软件下载助手日志信息中与下载操作对应的日志信息作为下载日志信息。其中,下载日志信息中一般可以包括:用户标识、软件名称、软件版本、软件下载时间等与用户下载行为相关的信息。120、根据所述下载日志信息,生成所述软件的软件标签。在本实施例中,软件标签服务器根据所述下载日志信息,生成所述软件的软件标签。其中,软件的软件标签具体为所述软件的描述信息。例如,软件功能信息,下载软件的主要人群的信息以及与该软件相似的关联软件的信息等),其一般可与软件的安装包或者软件的软件名称对应存储于所述软件标签服务器中。例如,与Photoshop软件对应的软件标签为:“图片编辑软件”、“照片美化”和“美工”。其中,软件标签将结合用户对软件的下载行为来设置。下载行为可以通过多种数据形式来体现,例如触发此下载行为的下载来源、与此下载行为对应的的查询词、下载次数、下载时间等,均可作为设置软件标签的参考依据。其中,所述下载来源为与所述此下载行为相关联的另一个下载行为所下载的软件。例如,用户首先下载了一个软件“MicrosoftVisualStudio”后,接着下载了另一个软件“Python”,则可以将MicrosoftVisualStudio软件作为触发用户下载“Python”软件的下载行为的下载来源;又例如,用户通过在搜索引擎输入“软件工程师”后下载“MicrosoftVisualStudio”软件,则可以将“软件工程师”作为与所述下载行为对应的查询词等。一般来说,每一条下载日志信息中均包括用户通过搜索引擎入口输入的查询词。因此,软件标签服务器可以通过分析下载日志信息,获取用户下载某一软件之前通过搜索引擎输入的搜索字符串,进而生成与该软件对应的软件标签;也可以通过分析下载日志信息,获取同一用户下载的多个软件的相关性,进而生成与该软件对应的软件标签,对此不进行限制。其中,对上述两种根据下载日志信息,生成所述软件的软件标签的具体详细介绍,请参见后文实施例。本专利技术实施例通过获取与软件下载行为对应的下载日志信息,根据所述下载日志信息,生成所述软件的软件标签的技术手段,解决了现有技术中软件标签中包括的标签信息内容比较单一的技术问题,丰富了软件标签中包含的信息种类,使得软件标签不仅能够描述软件功能,还可以用来描述用户的行为,进而可以用来进行用户行为分析,大大扩展了软件标本文档来自技高网...
【技术保护点】
一种软件标签的生成方法,其特征在于,包括:获取与软件下载行为对应的下载日志信息;根据所述下载日志信息,生成所述软件的软件标签。
【技术特征摘要】
1.一种软件标签的生成方法,其特征在于,包括:获取与软件下载行为对应的下载日志信息;根据所述下载日志信息,生成所述软件的软件标签;其中,根据所述下载日志信息,生成所述软件的软件标签包括:如果根据所述下载日志信息,确定同一用户终端在第二预定时间区间内下载至少两个软件,将所述至少两个软件中任意两个软件之间的关联权值增加第一权重值;如果所述关联权值大于第一预定权重阈值,获取与所述关联权值对应的第一软件和第二软件;将所述第二软件的软件名称作为所述第一软件的软件标签;将所述第一软件的软件名称作为所述第二软件的软件标签。2.根据权利要求1所述的方法,其特征在于,根据所述下载日志信息,生成所述软件的软件标签还包括:通过根据搜索引擎日志信息获取的所述下载日志信息,获取用户通过搜索引擎入口输入的与所述软件对应的搜索字符串;对所述搜索字符串进行分词处理,获取至少一个搜索分词;统计所述至少一个搜索分词的搜索次数,并将搜索次数大于预定频率阈值的高频搜索词作为所述软件的软件标签。3.根据权利要求2所述的方法,其特征在于,获取用户通过搜索引擎入口输入的与所述软件对应的搜索字符串包括:获取在所述软件的下载时刻之前,同一用户终端在第一预定时间区间内通过搜索引擎入口输入的搜索字符串,作为与所述软件对应的搜索字符串;和/或获取在所述软件的下载时刻之前,同一用户终端通过搜索引擎入口输入的预定个数的搜索字符串,作为与软件对应的搜索字符串。4.根据权利要求1所述的方法,其特征在于,还包括:获取所述软件的软件标签中包括的关联软件名称;根据与所述软件的使用行为对应的使用日志信息,获取所述软件的软件启动时间;如果在与所述软件的软件启动时间对应的第三预定时间区间内,与所述软件启动时间对应的同一用户终端的所述关联软件未被启动,将所述关联软件与所述软件之间的非关联权值增加第二权重值;如果所述非关联权值大于第二预定权重阈值,在所述软件的软件标签中去除所述关联软件名称。5.根据权利要求1所述的方法,其特征在于,还包括:获取所述软件的软件标签中包括的关联软件名称;如果获取到所述软件的软件删除信息,获取与所述软件删除信息对应的用户终端的已安装软件列表;如果所述已安装软件列表中包括所述关联软件名称,将所述关联软件与所述软件之间的非关联权值增加第三权重值;如果所述非关联权值大于第三预定权重阈值,在所述软件的软件标签中去除所述关联软件名称。6.根据权利要求1所述的方法,其特征在于,还包括:将至少一个所述软件的软件标签的集合,作为软件标签库。7.一种软件标签的生成装置,其特征在于,包括:下载日志信息获...
【专利技术属性】
技术研发人员:柳阳,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。