基于社交平台的分组方法和装置制造方法及图纸

技术编号:13864192 阅读:90 留言:0更新日期:2016-10-19 17:01
本发明专利技术公开了一种基于社交平台的分组方法和装置。其中,该基于社交平台的分组方法包括:爬取社交平台的用户资料数据和用户发布的言论数据;根据用户资料数据进行计算得到第一分值,并根据言论数据进行计算得到第二分值,其中,第二分值根据言论数据中的预设词汇的提及量、与预设词汇关联的需求词汇和与预设词汇关联的情绪词汇计算得到;将第一分值和第二分值之和作为用户的总分;根据转化漏斗模型将总分对应到转化漏斗模型的相应阶段;以及将用户对应的阶段作为用户所处的分组。通过本发明专利技术,解决了现有技术中无法对用户进行精准分组的问题,达到了提高对用户分组的准确性的效果。

【技术实现步骤摘要】

本专利技术涉及互联网领域,具体而言,涉及一种基于社交平台的分组方法和装置
技术介绍
企业对于用户在社交平台(例如微博)上的关注一直是营销的重要话题,通过分析用户在社交平台上与产品的关联能够精准的在社交媒体上挖掘潜在用户。由于每一个潜在用户可能处在购买产品之前的各种阶段(如需求了解、产生兴趣、需求确定、转化行为),如果不能监控到每一个潜在用户所处的购买阶段,就不能针对不同的用户提供相应的服务以促进转化行为的发生。现有技术大多是通过预设抓取微博人物信息中的性别地域兴趣标签等静态信息来为微博用户进行营销分组,例如:女性,年龄为25~30,在北京,标签为喜欢美食和母婴用品的人群就被认为是奶粉品牌进行营销的很好对象。但是,并不是每个这样的人群都需要买奶粉,只能说买奶粉的可能性较其他用户群体要大一些,但即使在这群人群中有买奶粉需求的人,也没法分辨出这些人处于奶粉购买的什么阶段,比如有的人就认定了A品牌的奶粉,关注了很久,就等打折的时候去购买,而有的人却仅仅是刚怀上小孩,正在关注各种奶粉以备后用,这两种人就分别处于需求确定和需求了解两个不同的阶段。也就是说,上述这种粗狂的分组方法并不能精准确定用户的需要,也无法确定用户处于哪个购物阶段,也就不能提供与购物阶段相对应的服务促进转化行为的发生。针对现有技术中无法对用户进行精准分组的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种基于社交平台的分组方法和装置,以解决无法对用户进行精准分组的问题。为了实现上述目的,根据本专利技术实施例的一个方面,提供了一种基于社交平台的分组方法。根据本专利技术的基于社交平台的分组方法包括:爬取社交平台的用户资料数据和用户发布的言论数据;根据所述用户资料数据进行计算得到第一分值,并根据所述言论数据进行计算得到第二分值;其中,所述第二分值根据所述言论数据中的预设词汇的提及量、与所述预设词汇关联的需求词汇和与所述预设词汇关联的情绪词汇计
算得到;将所述第一分值和所述第二分值之和作为用户的总分;根据转化漏斗模型将所述总分对应到所述转化漏斗模型的相应阶段;以及将所述用户对应的阶段作为所述用户所处的分组。进一步地,根据所述言论数据进行计算得到第二分值包括:根据所述预设词汇的提及量计算所述用户对所述预设词汇所指示的产品的关注度;根据所述需求词汇和所述需求词汇对应的第一权重计算所述用户对所述产品的需求度;根据所述情绪词汇和所述情绪词汇对应的第二权重计算所述用户对所述产品的好感度;以及根据所述关注度及对应的关注权重、所述需求度及对应的需求权重和所述好感度及对应的好感权重进行计算,得到所述第二分值。进一步地,根据所述预设词汇的提及量计算所述用户对所述预设词汇所指示的产品的关注度包括:获取一段时间内所述言论数据中所述预设词汇的提及量;分析所述提及量的变化趋势;在预设变化趋势与关注度的对应关系中查找所述提及量的变化趋势所对应的关注度。进一步地,根据所述需求词汇和所述需求词汇对应的第一权重计算所述用户对所述产品的需求度包括:提取所述言论数据中的需求词汇;从预设需求词汇与所述第一权重的对应表中查找各个提取的需求词汇所对应的第一权重Pi;根据各个所述提取的需求词汇的出现次数Qi和查找的第一权重Pi计算所述需求度,其中,所述n为所述需求词汇的个数。进一步地,根据所述情绪词汇和所述情绪词汇对应的第二权重计算所述用户对所述产品的好感度包括:从所述言论数据中提取情绪词汇,其中,所述情绪词汇包括正面词汇和负面词汇;获取各个所述正面词汇所对应的第三权重和所述负面词汇所对应的第四权重;根据各个所述正面词汇的出现次数Ag及对应的第三权重Xg、所述负面词汇出现次数Bh及对应的第四权重Yh计算所述好感度,其中,所述其中,l为所述正面词汇的个数,s为所述负面词汇的个数。进一步地,根据所述用户资料数据进行计算得到第一分值包括:从所述用户资料数据中提取信息种类,其中,所述信息种类包括下述一个或多个:年龄、性别、学历、职业和兴趣;根据每个所述信息种类与产品的匹配结果Rj和所述信息种类的权重Tj进行计算,得到所述第一分值,其中,所述m为所述信息种类的个数。为了实现上述目的,根据本专利技术实施例的另一方面,提供了一种基于社交平台的分组装置。根据本专利技术的基于社交平台的分组装置包括:爬取单元,用于爬取社交平台的用户资料数据和用户发布的言论数据;计算单元,用于根据所述用户资料数据进行计算得到第一分值,并根据所述言论数据进行计算得到第二分值,其中,所述第二分值根据所述言论数据中的预设词汇的提及量、与所述预设词汇关联的需求词汇和与所述预设词汇关联的情绪词汇计算得到;汇总单元,用于将所述第一分值和所述第二分值之和作为用户的总分;对应单元,用于根据转化漏斗模型将所述总分对应到所述转化漏斗模型的相应阶段;以及确定单元,用于将所述用户对应的阶段作为所述用户所处的分组。进一步地,所述计算单元包括:第一计算模块,用于根据所述预设词汇的提及量计算所述用户对所述预设词汇所指示的产品的关注度;第二计算模块,用于根据所述需求词汇和所述需求词汇对应的第一权重计算所述用户对所述产品的需求度;第三计算模块,用于根据所述情绪词汇和所述情绪词汇对应的第二权重计算所述用户对所述产品的好感度;以及第四计算模块,用于根据所述关注度及对应的关注权重、所述需求度及对应的需求权重和所述好感度及对应的好感权重进行计算,得到所述第二分值。进一步地,所述第一计算模块包括:第一获取子模块,用于获取一段时间内所述言论数据中所述预设词汇的提及量;分析子模块,用于分析所述提及量的变化趋势;第一查找子模块,用于在预设变化趋势与关注度的对应关系中查找所述提及量的变化趋势所对应的关注度。进一步地,所述第二计算模块包括:第一提取子模块,用于提取所述言论数据中的需求词汇;第二查找子模块,用于从预设需求词汇与所述第一权重的对应表中查找各个提取的需求词汇所对应的第一权重Pi;第一计算子模块,用于根据各个所述提取的需求词汇的出现次数Qi和查找的第一权重Pi计算所述需求度,其中,所述n为所述需求词汇的个数。进一步地,所述第三计算模块包括:第二提取子模块,用于从所述言论数据中提取情绪词汇,其中,所述情绪词汇包括正面词汇和负面词汇;第二获取子模块,用于获取各个所述正面词汇和所述负面词汇所对应权重;第二计算子模块,用于根据各个所述正面词汇的出现次数Ag及对应的第三权重Xg、所述负面词汇出现次数Bh及对应的第四权重Yh计算所述好感度,其中,所述其中,l为所述正面词汇的个数,s为所述负面词汇的个数。进一步地,所述计算单元包括:提取模块,用于从所述用户资料数据中提取信息种类,其中,所述信息种类包括下述一个或多个:年龄、性别、学历、职业和兴趣;第五计算模块,用于根据每个所述信息种类与产品的匹配结果Rj和所述信息种类的权重Tj进行计算,得到所述第一分值,其中,所述m为所述信息种类的个数。根据专利技术实施例,爬取社交平台的用户资料数据和用户发布的言论数据;根据用户资料数据进行计算得到第一分值,并根据言论数据进行计算得到第二分值,其中,第二分值根据言论数据中的预设词汇的提及量、与预设词汇关联的需求词汇和与预设词汇关联的情绪词汇计算得到;将第一分值和第二分值之和作为用户的本文档来自技高网
...

【技术保护点】
一种基于社交平台的分组方法,其特征在于,包括:爬取社交平台的用户资料数据和用户发布的言论数据;根据所述用户资料数据进行计算得到第一分值,并根据所述言论数据进行计算得到第二分值;其中,所述第二分值根据所述言论数据中的预设词汇的提及量、与所述预设词汇关联的需求词汇和与所述预设词汇关联的情绪词汇计算得到;将所述第一分值和所述第二分值之和作为用户的总分;根据转化漏斗模型将所述总分对应到所述转化漏斗模型的相应阶段;以及将所述用户对应的阶段作为所述用户所处的分组。

【技术特征摘要】
1.一种基于社交平台的分组方法,其特征在于,包括:爬取社交平台的用户资料数据和用户发布的言论数据;根据所述用户资料数据进行计算得到第一分值,并根据所述言论数据进行计算得到第二分值;其中,所述第二分值根据所述言论数据中的预设词汇的提及量、与所述预设词汇关联的需求词汇和与所述预设词汇关联的情绪词汇计算得到;将所述第一分值和所述第二分值之和作为用户的总分;根据转化漏斗模型将所述总分对应到所述转化漏斗模型的相应阶段;以及将所述用户对应的阶段作为所述用户所处的分组。2.根据权利要求1所述的分组方法,其特征在于,根据所述言论数据进行计算得到第二分值包括:根据所述预设词汇的提及量计算所述用户对所述预设词汇所指示的产品的关注度;根据所述需求词汇和所述需求词汇对应的第一权重计算所述用户对所述产品的需求度;根据所述情绪词汇和所述情绪词汇对应的第二权重计算所述用户对所述产品的好感度;以及根据所述关注度及对应的关注权重、所述需求度及对应的需求权重和所述好感度及对应的好感权重进行计算,得到所述第二分值。3.根据权利要求2所述的分组方法,其特征在于,根据所述预设词汇的提及量计算所述用户对所述预设词汇所指示的产品的关注度包括:获取一段时间内所述言论数据中所述预设词汇的提及量;分析所述提及量的变化趋势;在预设变化趋势与关注度的对应关系中查找所述提及量的变化趋势所对应的关注度。4.根据权利要求2所述的分组方法,其特征在于,根据所述需求词汇和所述需求词汇对应的第一权重计算所述用户对所述产品的需求度包括:提取所述言论数据中的需求词汇;从预设需求词汇与第一权重的对应表中查找各个提取的需求词汇所对应的第一权重Pi;根据各个所述提取的需求词汇的出现次数Qi和查找的第一权重Pi计算所述需求度,其中,所述n为所述需求词汇的个数。5.根据权利要求2所述的分组方法,其特征在于,根据所述情绪词汇和所述情绪词汇对应的第二权重计算所述用户对所述产品的好感度包括:从所述言论数据中提取情绪词汇,其中,所述情绪词汇包括正面词汇和负面词汇;获取各个所述正面词汇所对应的第三权重和所述负面词汇所对应的第四权重;根据各个所述正面词汇的出现次数Ag及对应的第三权重Xg、所述负面词汇出现次数Bh及对应的第四权重Yh计算所述好感度,其中,所述其中,l为所述正面词汇的个数,s为所述负面词汇的个数。6.根据权利要求1所述的分组方法,其特征在于,根据所述用户资料数据进行计算得到第一分值包括:从所述用户资料数据中提取信息种类,其中,所述信息种类包括下述一个或多个:年龄、性别、学历、职业和兴趣;根据每个所述信息种类与产品的匹配结果Rj和所述信息种类的权重Tj进行计算,得到所述第一分值,其中,所述m为所述信息种类的个数。7.一种基于社交平台的分组装置,其特征在于,包括:爬取单...

【专利技术属性】
技术研发人员:陈俊宏余德乐杨韬赵冬玲
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1