一种圈选对象的方法和装置制造方法及图纸

技术编号：25958860 阅读：48 留言：0更新日期：2020-10-17 03:51

一种圈选对象的方法和装置，本发明专利技术的实施例设置与对象相关的标签、标签条件，并设置不同标签条件之间的逻辑关系，以形成标签条件包然后使用所述标签条件包，从所述数据源中圈选出所述特定对象。本发明专利技术的实施例能够提高对象圈选的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种圈选对象的方法和装置
本专利技术涉及数据分析领域，尤其涉及一种圈选对象的方法和装置。
技术介绍
互联网上的用户会产生数量巨大的行为数据。以电商网站为例，行为数据是指有哪些用户浏览过该电商网站，购买过哪些商品。可以通过行为数据圈选出满足预定条件的人群。从一个大的人群群体中圈选出满足预定条件的人群的操作又称为“圈人”。现有技术中存在利用微软公司的Excel软件的表格来圈人的方案，其缺陷是需要人工输入指定条件来筛选人群，然后再利用数据分析系统来分析被筛选出的人群，因此需要较高的人工参与度，效率低下，准确率不高。
技术实现思路
针对现有技术中存在的问题，本专利技术的目的在于提供一种能够实现高效圈选出特定对象的方法和装置。本专利技术的一方面涉及一种通过计算机从数据源中圈选出特定对象的方法，包括：通过计算机设置与对象相关的标签；通过计算机设置所述标签的标签条件；通过计算机设置不同标签条件之间的逻辑关系，以形成标签条件包；和通过计算机使用所述标签条件包，从所述数据源中圈选出所述特定对象。本专利技术的又一方面涉及一种通过计算机从数据源中圈选出特定对象的方法，包括：用于设置与对象相关的标签的装置；用于设置所述标签的标签条件的装置；用于设置不同标签条件之间的逻辑关系，以形成标签条件包的装置；和用于使用所述标签条件包，从所述数据源中圈选出所述特定对象的装置。本专利技术的实施例能够降低人工参与度，大大提升对象圈选的效率。附图说明图1为实施本专利技术的实施例的系统...

【技术保护点】
1.一种通过计算机从数据源中圈选出特定对象的方法，包括：/n通过计算机设置与对象相关的标签；/n通过计算机设置所述标签的标签条件；/n通过计算机设置不同标签条件之间的逻辑关系，以形成标签条件包；和/n通过计算机使用所述标签条件包，从所述数据源中圈选出所述特定对象。/n

【技术特征摘要】
1.一种通过计算机从数据源中圈选出特定对象的方法，包括：
通过计算机设置与对象相关的标签；
通过计算机设置所述标签的标签条件；
通过计算机设置不同标签条件之间的逻辑关系，以形成标签条件包；和
通过计算机使用所述标签条件包，从所述数据源中圈选出所述特定对象。

2.根据权利要求1所述的方法，其中所述通过计算机使用所述标签条件包，从所述数据源中圈选出所述特定对象的操作包括：
解析所述标签条件包，生成SQL语句；
基于所述SQL语句，创建查询任务；
针对所述数据源，调度所述查询任务以用于执行。

3.根据权利要求2所述的方法，其中所述查询任务是SparkSQL任务。

4.根据权利要求1所述的方法，还包括：
将表示所圈选出所述特定对象的数据导入到第二数据源中；以及
建立所述第二数据源和本地数据库之间的映射关系；
基于所述映射关系，将所述数据从所述第二数据源同步到所述本地数据库。

5.根据权利要求4所述的方法，其中所述第二数据源是Hive数据源，所述本地数据库是MySQL数据库，并且所述同步操作使用DataX...

【专利技术属性】
技术研发人员：梁爽，江敏，
申请(专利权)人：杭州数澜科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人