一种基于微博数据的话题跟踪方法及装置制造方法及图纸

技术编号:9198240 阅读:146 留言:0更新日期:2013-09-26 02:26
本发明专利技术提供了一种基于微博数据的话题跟踪方法及装置,其中所述方法包括:采集多个微博网页的文档数据,建立每个文档数据的第一空间向量;获取预设话题的第二空间向量;依次计算所述文档数据的第一空间向量与第二空间向量的相似度;依据所述相似度判断所述第一空间向量对应的文档数据是否为所述预设话题的关联信息。本发明专利技术可以克服现有技术中容易出现话题漂移现象、话题跟踪的质量不高的缺点。

【技术实现步骤摘要】

【技术保护点】
一种基于微博数据的话题跟踪方法,其特征在于,包括:采集多个微博网页的文档数据,建立每个文档数据的第一空间向量;获取预设话题的第二空间向量;依次计算所述文档数据的第一空间向量与第二空间向量的相似度;依据所述相似度判断所述第一空间向量对应的文档数据是否为所述预设话题的关联信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:杜毅罗峰黄苏支李娜
申请(专利权)人:亿赞普北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1