本公开涉及一种基于数据处理的用户画像自动生成方法和系统,所述方法包括如下步骤:步骤1、收集用户信息,所述用户信息包括用户的静态信息和行为信息;步骤2、根据所收集的用户信息,生成所述用户的特定标签;步骤3、根据预定规则,对所生成的标签进行量化,计算得到所述用户的属性值;步骤4、根据计算出的所述用户的属性值,生成用户画像。本发明专利技术的有益效果主要在于:1、减少用户操作及提高用户体验;2、增加趣味性,用户之间的互动可有助于进行产品的推广和增加产品的日活。
【技术实现步骤摘要】
基于数据处理的用户画像自动生成方法和系统
本专利技术涉及基于互联网应用服务
,尤其涉及一种基于数据处理的用户画像自动生成方法和系统。
技术介绍
随着互联网爆炸式的发展,每天都在产生着大量数据,如何快速抓取信息并生成用户画像,也成了重要的课题。在传统的方法中,需要对用户行为进行人工分类、判定,并在后期提供有针对性的服务或其它处理应对。在海量数据的场景下,数据往往维度多、数据量大,人工很难将用户行为相关的指标统计全面。此外,由于人会出现疲劳等情况,这种传统的人工识别的方法准确率并不高。在互联网逐渐步入大数据时代后,用户的行为在服务商面前都将是可视化的。服务商的关注点日也开始益聚焦于怎样利用大数据来精准营销,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念也就应运而生。大数据使得服务商能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,用户画像(UserProfile)的概念应运而生,其用于通过用户标签抽象出用户的信息全貌,可以看作服务商应用大数据的根基。典型的用户画像是将用户信息标签化,就是服务商通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌,可以看作是服务商应用大数据技术的基本方式。然而,目前,对用户标签的识别、用户画像的建立,主要还是通过人工干预和计算机简单处理转换的方式完成,存在有以下不足:1、耗时很长;2、人工成本高;3、生成的结果不够直观;4、信息录入有因人工导致的错误风险。另外,过于依赖后台工作人员个人因素会导致得到的用户画像结果的差异性很大,而且也没有考虑到标签的时效性,会导致最终得到的用户画像不够精确。在现有技术中,对用户行为进行分类和预测的方法较为单一,参考效果不理想。由于用户行为包括线上和线下行为,数据来源复杂,存在这样的需求:开发能够针对不同的数据来源、结合多种分类预测技术而综合判定和预测用户属性、并生成用户画像的方案。
技术实现思路
考虑到现有技术的上述问题,专利技术人做出了本专利技术,本专利技术不需要用户上传图片,系统可以根据获取的大数据分析人物,大致勾画出人物画像并给出人物的幸运分,在人物画像的周围显示人物的智慧值,财力值,能力值,体力值等,用户也可以将人物画像分析分享给微信好友,好友可以打开并查看对方分享的人物剖析结果,经过授权后,同时可以查询自己的人物画像分析结果,从而有利于APP推广和增加APP的日活。根据本专利技术的实施例,提供了一种基于数据处理的用户画像自动生成方法,其特征在于包括如下步骤:步骤1、收集用户信息,所述用户信息包括用户的静态信息和行为信息;步骤2、根据所收集的用户信息,生成所述用户的特定标签;步骤3、根据预定规则,对所生成的标签进行量化,计算得到所述用户的属性值;步骤4、根据计算出的所述用户的属性值,生成用户画像。根据本专利技术的实施例,所述步骤3包括:步骤3-1、将所述用户的各个标签量化为多个标准值;步骤3-2、针对于所述用户的某个属性,对所述用户的部分标签的量化后的标准值对进行加权求和,生成所述用户的所述属性的属性值。根据本专利技术的实施例,所述标签包括性别标签、学历标签、消费标签、运动标签、职位标签、购物标签、上网查阅标签、兴趣爱好标签、以及活动地方标签,其中,所述用户画像显示量化值较高的标签、以及属性值。根据本专利技术的实施例,如下计算所述属性值:智慧值=学历标签×80%+购物标签×15%+其他类的标签占5%;财力值=消费标签×60%+购物标签×30%+其他类标签占×5%;能力值=职位标签×40%+学历标签×30%+消费标签×20%+其他标签×10%;体力值=运动标签×50%+购物标签×20%+其他标签×30%;其中,上述公式中的各个标签代表其量化后的标准值。根据本专利技术的实施例,所述静态信息包括公共数据、以及机构内部的客户信息,所述包括人口属性、商业属性数据,其中,人口属性包括:地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯。根据本专利技术的实施例,所述行为信息包括所述用户在网络或应用程序上的行为信息,包括用户的网站浏览行为信息、用户交易行为信息。根据本专利技术的实施例,所述步骤1包括:步骤1-1、对静态和行为信息数据进行预处理,根据预处理后的网络访问信息中获取用户在每个预设行为类别中的行为数据,使获取的同一类别的行为数据具有相同的格式。根据本专利技术的实施例,在所述步骤4之后,在社交平台上,根据各个用户之间的评价权限,各个用户可给其它用户的属性进行打分,然后,后台系统根据打分情况,来对用户的属性值进行修正。根据本专利技术的实施例,还提供了一种用于执行所述方法的用户画像自动生成系统,其包括:用户信息收集模块,用于收集用户信息,所述用户信息包括用户的静态信息和行为信息;用户信息分析模块,用于对用户信息进行分析,生成所述用户的特定标签;用户属性计算模块,用于按照特定规则,对每种标签进行量化,再进行加权相加,获得用户的属性值;用户画像生成模块,用于根据用户的标签和属性值,生成用户画像。根据本专利技术的实施例,还提供了一种用于执行所述方法的基于数据处理的用户画像自动生成系统,其包括:页面快照抓取模块,用于抓取所述应用的当前用户界面的页面快照;唯一属性确定模块,用于通过遍历所提取的全部页面组件的所有属性的属性值,确定在当前用户界面中具有唯一性的属性,其中,各个页面组件的所述具有唯一性的组件属性的属性值互不相同;组件属性保存模块,用于将各个组件的属性存储至所述共享文档中,所述共享文档中包括页面组件的属性表格,其中,所述共享文档可由测试人员访问,在各个版本迭代中,测试人员可以检查并更新各个页面组件的属性,并且,可通过各个页面组件的属性的唯一性,在所述共享文档中定位相应组件;测试用例构建模块,用于根据具体测试用例确定与测试用例相关的用户界面中的页面组件,并查找与所述用户界面相关的共享文档,进一步确定所述用户界面中具有唯一性的组件属性,并通过所述具有唯一性的组件属性的属性值确定其所对应的页面组件,由此构建和/或更新与所确定的页面组件相关的测试用例。根据本专利技术的实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有用于上述方法的程序,所述程序被处理器执行时,执行根据所述方法的步骤。本专利技术的有益效果主要在于:1、减少用户操作及提高用户体验;2、增加趣味性,用户之间的互动可有助于进行产品的推广和增加产品的日活;3、考虑到数据的不同来源,进行差异化的处理,提高了处理的精细度和准确度;4、以用户画像作为参照信息,大大提高相关业务的办理速度;5、能够根据样本数据来源的不同,选择不同的分类模型级联和/或并联,使得客户关系管理更加精准。附图说明图1为示出根据本专利技术的实施例的基于数据处理的用户画像自动生成方法的概念示意图;图2为示出根据本专利技术的实施例的基于数据处理的用户画像自动生成方法的流程示意图;图3为根据本专利技术的实施例的基于数据处理的用户画像自动生成系统的功能模块组成示意图;图4为根据本专利技术实施例的安装了应用程序的系统的运行环境的示意图。具体实施方式下面,结合附图对技术方案的实施作进一步的详细描述。本领域的技术人员能够理解,尽管本文档来自技高网...
【技术保护点】
1.一种基于数据处理的用户画像自动生成方法,其特征在于包括如下步骤:步骤1、收集用户信息,所述用户信息包括用户的静态信息和行为信息;步骤2、根据所收集的用户信息,生成所述用户的特定标签;步骤3、对所生成的标签进行量化,计算得到所述用户的属性值;步骤4、根据计算出的所述用户的属性值,生成用户画像。
【技术特征摘要】
1.一种基于数据处理的用户画像自动生成方法,其特征在于包括如下步骤:步骤1、收集用户信息,所述用户信息包括用户的静态信息和行为信息;步骤2、根据所收集的用户信息,生成所述用户的特定标签;步骤3、对所生成的标签进行量化,计算得到所述用户的属性值;步骤4、根据计算出的所述用户的属性值,生成用户画像。2.根据权利要求1所述的用户画像自动生成方法,其特征在于,所述步骤3包括:步骤3-1、将所述用户的各个标签量化为多个标准值;步骤3-2、针对于所述用户的某个属性,对所述用户的部分标签的量化后的标准值对进行加权求和,生成所述用户的所述属性的属性值。3.根据权利要求2所述的用户画像自动生成方法,其特征在于,所述标签包括性别标签、学历标签、消费标签、运动标签、职位标签、购物标签、上网查阅标签、兴趣爱好标签、以及活动地方标签;其中,所述用户画像显示量化值较高的标签以及属性值。4.根据权利要求3所述的用户画像自动生成方法,其特征在于,所述属性值包括智慧值、财力值、能力值,所述智慧值、所述财力值、所述能力值计算公式为:智慧值=学历标签×80%+购物标签×15%+其他类的标签×5%;财力值=消费标签×60%+购物标签×30%+其他类标签×10%;能力值=职位标签×40%+学历标签×30%+消费标签×20%+其他标签×10%;体力值=运动标签×50%+购物标签×20%+其他标签×30%;其中,上述公式中的各个标签代表其量化后的标准值。5.根据权利要求3所述的用户画像自动生成方法,其特征在于,所述静态信息包括公共数据、以及机构内部的客户信息,所述客户信息包括人口属性、商业属性数据;其中,人口属性包括:地域、年龄、性别、文化、职业、收入、生活习惯...
【专利技术属性】
技术研发人员:张仁娟,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。