System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于k-truss嵌套索引的社区搜索方法、系统及存储介质技术方案_技高网

一种基于k-truss嵌套索引的社区搜索方法、系统及存储介质技术方案

技术编号:43223894 阅读:1 留言:0更新日期:2024-11-05 17:14
本发明专利技术提供的是一种基于k‑truss嵌套索引的社区搜索方法、系统及存储介质。本发明专利技术所述的系统包括数据采集装置、索引构造装置、单节点搜索装置、个性化社区搜索装置。所述的方法采用k‑truss社区模型作为社区的结构约束条件。CSKNI方法能够高效率地在普通网络与符号网络上完成索引构建,并利用索引进行社区搜索,获得指定的连通k‑truss社区或具有基本内聚特征的社区。同时,本研究针对网络数据中边与节点的增加、删除情况,设计了相应的索引维护算法,保证索引可以高效正确地应对数据变化,以满足社区搜索的正确性和实时性。本发明专利技术可部署在各服务器机房后端,可广泛应用于社交网络场景下社区搜索等应用领域。

【技术实现步骤摘要】

本专利技术属于社交网络,具体涉及一种基于k-truss嵌套索引的社区搜索方法、系统及存储介质


技术介绍

1、社区搜索的目标是根据一个或多个搜索节点找到包含所有搜索节点的社区。社区结构自然存在于许多现实世界的网络中,例如社会、生物、协作和通信网络[xin h,lakshmanan l,xu j.community search over big graphs:models,algorithms,andopportunities[c].icde,2017:1451-1454.]。社区搜索问题在现实世界中具有广泛的应用场景,例如在电商平台网络中,如果能够通过社区搜索方法,根据用户的喜好、浏览记录、关注列表等属性找到其所属的用户社区,就可以为该用户做推荐。这是因为,有理由认为社区内大部分用户都喜好的商品,该用户也可能会喜欢。

2、由于社区的重要性,如何从一个现实世界中的大型网络里有效地找到符合要求的目标社区是一个重要的研究方向。因此,为了应对现实需求,社区搜索方法应具有的性质如下[fang y,huang x,qin l,et al.a survey of community search over big graphs[j].vldb,2020,29(1):353-392.]。

3、高效率:社区搜索任务往往是实时的,而现实世界的数据集具有百万级的数据量或更大规模,因此高效率是社区搜索任务必须考虑的要素。

4、高可伸缩性:社区搜索任务必须能够处理真实数据集,因此搜索方法需要能够适应上千万到更多数据量的变化情况。

5、高个性化:现实世界中,人们往往会指定一个或多个查询节点,此外可能还会对查询出来的社区的紧密程度作出要求。社区搜索方法应该能够支持定制输入参数,获取满足用户需求的社区。

6、高质量:搜索的结果应该能够保证满足社区的定义且具有良好的评价指标。

7、支持动态图:现实世界中的数据常常会随着时间推移而发生变化,这样网络中节点与节点间的关系就可能会发生变化进而导致社区发生变化。社区搜索方法必须能够应对这种变化并给出正确的结果。

8、社区搜索方法可以在简单网络与复杂网络上进行,在简单网络上的搜索方法通过社区模型来对社区的结构作出约束以获取社区,而复杂网络上的搜索方法则进一步利用了复杂网络所携带的额外语义信息,在结构约束之外引入新的指标以获取社区。此外,为了能在线性时间内完成搜索并返回目标社区,部分方法预先提取了网络的特征和信息以构建索引,然后通过索引加速搜索过程。

9、基本社区搜索方法通过约束社区的结构来获取目标社区。sozio等人[mauro s,aristides g.the community-search problem and how to plan a successfulcocktail party[c].sigkdd,2010:939-948.]给出社区搜索的定义,并同时提出了一种贪婪算法,该算法通过计算最密集子图,并迭代去除度不满足条件的节点,最终得到一个k-core社区。cui等人[cui w,xiao y,wang h,et al.online search of overlappingcommunities[c].sigmod,2013:277.]指出了k-clique社区模型的约束和定义不够灵活的问题。因此,他们将k-clique定义中的社区内每个节点必须与其余k-1个节点相连改成了必须和α个节点相连。同时,他们将k-clique的限制放宽,定义成了γ-quasi-k-clique模型,以此对k-clique模型在处理现实世界数据的过程作出了优化。wang等人[wang c,zhuj.forbidden nodes aware communitysearch[c].aaai,2019,33(01):758-765p.]考虑了在现实世界中某些不会存在于社区中的特定节点的情况,并将这样的节点称为“禁止节点”。他们提出了基于k-core模型、基于k-truss模型和基于加权的三种搜索方法,并将禁止节点纳入考虑。huang等人[huang x,lakshmanan l,yu j x,et al.approximate closestcommunity search in networks[j].vldb,2015,9(4):276-287.]在搜索时还将搜索距离纳入考虑,该研究使用k-truss模型对社区结构进行约束,然后通过大量删除远离查询节点的节点来加速搜索过程。esfahani等人[esfahani f,daneshmand m,srinivasan v,etal.truss decompositionon large probabilistic networks using h-index[c].ssdbm,2021:145-156.]提出了一种基于概率图分解truss的有效算法,在这样的图中,每条边都有一个独立于其他边的存在概率。他们使用了在[xin h,wei l,lakshmanan l.trussdecomposition of probabilistic graphs:semantics and algorithms[c].the 2016international conference.acm,2016:77-90.]中引入的(k,η)-truss的概念,其目标是从原图中计算出一个最大的子图,并且要求原图的边都至少包含在这个子图的k个三角形中,这样的包含概率不小于一个用户指定的阈值η,即阈值η定义了输出truss的期望确定性水平。sun等人[sun z,huang x,xu j,et al.efficient probabilistic truss indexing onuncertain graphs[c].www,2021:354-366.]对于不确定图提出了一种基于(k,γ)-truss的索引社区搜索模型,他们研究了不确定图上的(k,γ)-truss索引构建和查询问题。(k,γ)-truss是给定的图g的最大子图,该模型要求图中每条边包含在至少k-2个三角形的概率不小于γ。该方法对任何给定k和γ的truss社区检索问题,都可以在一个最优的线性时间内获取所查询的(k,γ)-truss子图。

10、在复杂网络上的社区搜索方法会将网络携带的额外语义信息纳入考虑。例如,在社交网络中,每个社交参与者代表的节点都携带属性信息,一个真实社区内的社交参与者会拥有更相似的属性。huang等人[huang x,lakshmanan l v s.attribute-drivencommunity search[j].vldb,2017,10(9):949-960.]在获取社区时引入了节点属性相似性的概念,他们基于(k,d)-truss模型,一种同时限制了社区的直径和边支持度的社区模型,以及属性相似性来获取目标社区。此外,网络中边可以反映出边的两个端点的交互关系,边上的权值越大就代表这种关系越强烈。zheng等人[zheng z,ye f,l本文档来自技高网...

【技术保护点】

1.一种基于k-truss嵌套索引的社区搜索方法,其特征在于:具体步骤如下:

2.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤1具体为:

3.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤2中索引树的生成,根据网络数据的特征和k-truss社区的定义,将网络划分为多个层级的社区结构;同时,建立节点和社区的映射关系,将每个节点与其所属的基本社区以及其上层嵌套的k-truss社区联系起来。

4.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤3具体为:

5.根据权利要求4所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述最近公共祖先社区包含了所有查询节点的目标社区。

6.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤4中节点添加操作,首先找到新增节点所关联的社区,然后根据这些社区的层级关系,可能进行社区的合并或拆分,并更新节点与其邻居节点的边支持度;边添加操作,找到新边端点对应的社区,进行合并或者直接更新社区内的边支持度;节点或边的移除操作,在相应的社区中移除节点或边,并重新计算社区的k-truss特性。

7.根据权利要求1-6任意一项所述的一种基于k-truss嵌套索引的社区搜索系统,其特征在于:包括数据采集装置、索引构造装置、社区搜索装置及索引维护装置;

8.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于:该计算机程序/指令被处理器执行时实现权利要求1至6中任一项所述方法的步骤。

9.一种计算机程序产品,包括计算机程序/指令,其特征在于:该计算机程序/指令被处理器执行时实现权利要求1至6中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种基于k-truss嵌套索引的社区搜索方法,其特征在于:具体步骤如下:

2.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤1具体为:

3.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤2中索引树的生成,根据网络数据的特征和k-truss社区的定义,将网络划分为多个层级的社区结构;同时,建立节点和社区的映射关系,将每个节点与其所属的基本社区以及其上层嵌套的k-truss社区联系起来。

4.根据权利要求1所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述步骤3具体为:

5.根据权利要求4所述的一种基于k-truss嵌套索引的社区搜索方法,其特征在于:所述最近公共祖先社区包含了所有查询节点的目标社区。

6.根据权利要求1所述的一种基于k-trus...

【专利技术属性】
技术研发人员:谢晓芹杨武苘大鹏王焕然王翰博谭静文吕继光韩帅许晨刘双源张佳琪
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1