本申请提出了一种群体筛选方法、装置、设备及存储介质,其中,方法包括:获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,提供了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,能够满足复杂的筛选计算需求。
【技术实现步骤摘要】
群体筛选方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及一种群体筛选方法、装置、设备及存储介质。
技术介绍
基于用户访问记录、访问频率等历史行为信息和物品的属性,为用户推荐合适的物品,可以有效提升用户体验,而基于用户-物品的推荐系统通常存在冷启动的问题,即推荐结果不准确的问题。基于规则的物品推荐是一种能够解决冷启动问题的方法,而规则推荐的核心就是群体定义及筛选。目前,针对复杂业务系统产生的动态变化数据,需要一种能够适应筛选规则变化、满足业务多级嵌套复杂筛选需求的群体筛选方案。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的第一个目的在于提出一种群体筛选方法,以实现通用的大数据群体筛选方案,能够适应筛选规则的变化,满足复杂的筛选计算需求。本申请的第二个目的在于提出一种群体筛选装置。本申请的第三个目的在于提出一种计算机设备。本申请的第四个目的在于提出一种计算机可读存储介质。本申请第一方面实施例提出了一种群体筛选方法,包括:获取待筛选对象的画像数据;从所述画像数据中获取与预设筛选规则匹配的目标画像数据;根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。本申请实施例的群体筛选方法,通过获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,实现了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,例如可支持增加用户/物品的属性/指标,或支持用户修改筛选规则,若筛选规则发生变更可实时下发计算引擎进行计算,能够满足复杂的筛选计算需求,提高系统可维护性。另外,根据本申请上述实施例的群体筛选方法还可以具有如下附加技术特征:可选地,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,包括:获取预设的对象维度和对象属性;从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。可选地,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,包括:获取预设的模型主题和模型指标;从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据,其中,所述模型指标值按照预设规则对对象的事实数据计算得到。可选地,所述根据所述目标画像数据与预设筛选指标进行计算,包括:通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;若所述目标画像数据满足所述预设筛选指标,则返回值为真;若所述目标画像数据不满足所述预设筛选指标,则返回值为假;其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。可选地,所述筛选指标有多个,所述根据计算结果从所述待筛选对象获取目标筛选群体,包括:获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。本申请第二方面实施例提出了一种群体筛选装置,包括:获取模块,用于获取待筛选对象的画像数据;匹配模块,用于从所述画像数据中获取与预设筛选规则匹配的目标画像数据;筛选模块,用于根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。本申请实施例的群体筛选装置,通过获取待筛选对象的画像数据;从画像数据中获取与预设筛选规则匹配的目标画像数据;根据目标画像数据与预设筛选指标进行计算,根据计算结果从待筛选对象获取目标筛选群体。由此,实现了一种通用的大数据群体筛选方案,能够适应主题指标、维度属性的变化,具有较好的扩展性,例如可支持增加用户/物品的属性/指标,或支持用户修改筛选规则,若筛选规则发生变更可实时下发计算引擎进行计算,能够满足复杂的筛选计算需求,提高系统可维护性。另外,根据本申请上述实施例的群体筛选装置还可以具有如下附加技术特征:可选地,所述匹配模块具体用于:获取预设的对象维度和对象属性;从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。可选地,所述匹配模块具体用于:获取预设的模型主题和模型指标;从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据,其中,所述模型指标值按照预设规则对对象的事实数据计算得到。可选地,所述筛选模块包括:计算单元,用于通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;若所述目标画像数据满足所述预设筛选指标,则返回值为真;若所述目标画像数据不满足所述预设筛选指标,则返回值为假;其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。可选地,所述筛选模块还包括:筛选单元,用于获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。本申请第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的群体筛选方法。本申请第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的群体筛选方法。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明图1为本申请实施例所提供的一种群体筛选方法的流程示意图;图2为本申请实施例所提供的一种群体筛选装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的群体筛选方法、装置及设备。图1为本申请实施例所提供的一种群体筛选方法的流程示意图,如图1所示,该方法包括:步骤101,获取待筛选对象的画像数据。本申请实施例的群体筛选方法,可以应用于数据仓库。本实施例中,在进行群体筛选时,先获取待筛选对象的画像数据,可选地,待筛选对象的画像数据存储于数据仓库中。作为一种示例,待筛选对象可以是用户,画像数据可包括用户的姓名、年龄、性别等。作为另一种示例,待筛选对象可以是物品,画像数据可包括物品的名称、类型等。举例而言,用户画像数据集合P的一种示例如下所示:P=((0,USER,USER.AGE,28),<本文档来自技高网...
【技术保护点】
1.一种群体筛选方法,其特征在于,包括:/n获取待筛选对象的画像数据;/n从所述画像数据中获取与预设筛选规则匹配的目标画像数据;/n根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。/n
【技术特征摘要】
1.一种群体筛选方法,其特征在于,包括:
获取待筛选对象的画像数据;
从所述画像数据中获取与预设筛选规则匹配的目标画像数据;
根据所述目标画像数据与预设筛选指标进行计算,根据计算结果从所述待筛选对象获取目标筛选群体。
2.如权利要求1所述的方法,其特征在于,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,包括:
获取预设的对象维度和对象属性;
从所述画像数据中确定与所述对象维度和对象属性匹配的对象属性值,以将所述对象属性值确定为目标画像数据。
3.如权利要求1所述的方法,其特征在于,所述从所述画像数据中获取与预设筛选规则匹配的目标画像数据,还包括:
获取预设的模型主题和模型指标;
从所述画像数据中确定与所述模型主题和模型指标匹配的模型指标值,以将所述模型指标值确定为目标画像数据;
其中,所述模型指标值按照预设规则对对象的事实数据计算得到。
4.如权利要求1所述的方法,其特征在于,所述根据所述目标画像数据与预设筛选指标进行计算,包括:
通过用户自定义函数对所述目标画像数据和所述预设筛选指标进行计算;
若所述目标画像数据满足所述预设筛选指标,则返回值为真;
若所述目标画像数据不满足所述预设筛选指标,则返回值为假;
其中,所述自定义函数为Z=UDF(X,Y),X为所述预设筛选指标,Y为所述目标画像数据,Z为返回值。
5.如权利要求4所述的方法,其特征在于,所述筛选指标有多个,所述根据计算结果从所述待筛选对象获取目标筛选群体,包括:
获取所述待筛选对象中每个对象对应的多个计算结果,所述多个计算结果对应于多个筛选指标;
若当前对象对应的多个计算结果均为真,则确定所述当前对象属于所述目标筛选群体。
6.一种群体筛选装置,其特征在于,包括:
获取模块,用于获取待筛选对象的画像数据;
匹配模块,用于从所述...
【专利技术属性】
技术研发人员:张红,
申请(专利权)人:杭州数跑科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。