用于社交数据网络用户行为细分的系统和方法技术方案

技术编号:13552928 阅读:71 留言:0更新日期:2016-08-18 19:51
提供了用于分析来自社交网络平台上的多个用户的数据的方法和系统,所述方法包括:接收与所述社交网络平台相关的话题的查询;确定在所述社交网络平台上具有与所述话题相关的至少一个社交网络行为的一组用户;针对这组用户的每个用户选择预定数量的帖子并且使所述预定数量的帖子的每个与各个用户相关;针对每个用户细分选择的帖子以确定在这组用户中选择的帖子的每个的似然;并且针对每个用户的选择的帖子进行聚类以限定多个聚类并且确定从每个用户到所述多个聚类的至少一个的映射,每个聚类包括表示这组用户之间的预定数量的帖子的聚类内频繁使用的话题的代表性话题。

【技术实现步骤摘要】
【国外来华专利技术】201480071719

【技术保护点】
一种用于分析来自社交网络平台上的多个用户的数据的计算机实施的方法,包括:接收与所述社交网络平台相关的话题的查询;确定在所述社交网络平台上具有与所述话题相关的至少一个社交网络行为的一组用户;针对这组用户的每个用户选择预定数量的帖子并且使所述预定数量的帖子的每个与各个用户相关;针对每个用户细分选择的帖子以确定在这组用户中选择的帖子的每个的似然;并且针对每个用户的选择的帖子进行聚类以限定多个聚类并且确定从每个用户到所述多个聚类的至少一个的映射,每个聚类包括表示这组用户之间的预定数量的帖子的聚类内频繁使用的话题的代表性话题。

【技术特征摘要】
【国外来华专利技术】2013.11.05 US 61/900,1351.一种用于分析来自社交网络平台上的多个用户的数据的计算机实施的方法,包括:接收与所述社交网络平台相关的话题的查询;确定在所述社交网络平台上具有与所述话题相关的至少一个社交网络行为的一组用户;针对这组用户的每个用户选择预定数量的帖子并且使所述预定数量的帖子的每个与各个用户相关;针对每个用户细分选择的帖子以确定在这组用户中选择的帖子的每个的似然;并且针对每个用户的选择的帖子进行聚类以限定多个聚类并且确定从每个用户到所述多个聚类的至少一个的映射,每个聚类包括表示这组用户之间的预定数量的帖子的聚类内频繁使用的话题的代表性话题。2.根据权利要求1所述的方法,其中所述至少一个社交网络行为包括以下各项的至少一种:与所述社交网络平台上的话题相关的推文、帖子、评论。3.根据权利要求1所述的方法,其中确定一组用户还包括根据与所述话题相关的所述社交网络行为的至少一个共同属性从所述多个用户细分这组用户。4.根据权利要求1所述的方法,其中确定具有所述至少一个社交网络行为的片段内的这组用户还包括动态追踪每个用户的社交媒体活动并且当所述活动满足与所述话题相关的预定行为模式时确定这组用户。5.根据权利要求4所述的方法,还包括相比于现有区段从与至少一个用户的话题相关的当前和过去的活动的至少一个选择的社交媒体活动的重复共性,并且更新所述区段以包括具有所述重复共性的所述至少一个用户。6.根据权利要求1所述的方法,其中针对每个用户选择预定数量的帖子并且与各个用户相关还包括:将这组用户中的每个用户建模为结点并且基于所述社交网络平台上的社交网络活动确定每个用户的话题列表并且与所述各个用户相关;从所述社交网络活动提取文本并且通过针对与每个用户相关的每个话题执行文本处理来滤掉无关话题;并且提供每个提取的话题和与所述话题相关的对应的用户之间的关系映射。7.根据权利要求6所述的方法,还包括:执行文本处理以确定来自与每个用户相关的所述话题的文本的至少一个预定子集与这组用户的其他用户的关系;并且生产针对文本的每个子集的用户之间的统计重复以及针对每个所述用户的文本的所述至少子集的发生似然。8.根据权利要求7所述的方法,还包括:利用所述生产的重复以及发生似然用于聚类所述选择的帖子。9.根据权利要求1所述的方法,还包括根据预定数量的排名最高的话题标记每个聚类。10.根据权利要求7所述的方法,其中生成所述统计重复进一步包括:基于预定片段大小生成n-gram概率矩阵。11.根据权利要求1所述的方法,其中聚类还包括利用k-means聚类、球形k-means聚类、主成分分析(PCA)、均值漂移聚类的至少一种。12.根据权利要求1所述的方法,还包...

【专利技术属性】
技术研发人员:布莱恩·佳利·耿爱德华·东晋·金
申请(专利权)人:西斯摩斯公司
类型:发明
国别省市:加拿大;CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1