一种基于图分解的多模式网络话题生成方法及其系统技术方案

技术编号：10678990 阅读：200 留言：0更新日期：2014-11-26 12:48

本发明专利技术公开了一种基于图分解的多模式网络话题生成方法及其系统，包括：网络话题检测步骤用于将网络数据转化为一无向图，基于预定阈值将无向图截断为多个截断图，并在截断图中寻找表示候选网络话题的极大团，基于极大团获取多模式种子话题；网络话题排序步骤用于通过种子话题对原始的无向图进行重构，获取种子话题的重构系数，根据重构系数对种子话题进行排序。本发明专利技术还公开了一种基于图分解的多模式网络话题生成系统。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于图分解的多模式网络话题生成方法及其系统，包括：网络话题检测步骤用于将网络数据转化为一无向图，基于预定阈值将无向图截断为多个截断图，并在截断图中寻找表示候选网络话题的极大团，基于极大团获取多模式种子话题；网络话题排序步骤用于通过种子话题对原始的无向图进行重构，获取种子话题的重构系数，根据重构系数对种子话题进行排序。本专利技术还公开了一种基于图分解的多模式网络话题生成系统。【专利说明】一种基于图分解的多模式网络话题生成方法及其系统
本专利技术涉及网络中的话题检测技术，特别涉及一种基于图分解的多模式网络话题生成方法及其系统。
技术介绍
随着信息技术的快速发展，用户越来越倾向于从网络上获取所需的信息。然而，高速膨胀的网络数据使得用户很难从中发现感兴趣的内容，因此，按照话题组织网络数据显得愈发重要，从而使得从网络中进行话题检测成为当前研究的热点问题之一。话题检测可以帮助用户快速有效地寻找和了解感兴趣的信息，同时也能帮助网络管理员合理地管理和分析网络数据。然而，从网络中检测出有意义的话题十分困难，其原因在于:1)在网络上，有助于检测话题的监督信息难以获得；2)网络话题具有稀有性，也就是说，每天网络上会出现大量元素，但是只有一少部分会形成话题；3)网络话题具有重叠性，也即同一个网络元素可能同时属于多个话题，不同的话题会有重叠；4)话题具有不同模式——有些是紧密连接的，有些是疏松连接的；5)用户的网络行为可能出现关注转移，也就是说可能从一个话题转移到另一话题；6)在网络中存在的话题数目难以确定；7)已有的评测...
一种基于图分解的多模式网络话题生成方法及其系统

【技术保护点】
一种基于图分解的多模式网络话题生成方法，其特征在于，包括：网络话题检测步骤：将网络数据转化为一无向图，基于预定阈值将所述无向图截断为多个截断图，并在所述截断图中寻找表示候选网络话题的极大团，基于所述极大团获取多模式种子话题；网络话题排序步骤：通过所述种子话题对原始的所述无向图进行重构，获取所述种子话题的重构系数，根据所述重构系数对所述种子话题进行排序，使用户发现感兴趣的话题。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄庆明，贾飞，庞俊彪，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人