【技术实现步骤摘要】
一种基于索引文件的社会关系网络创建与检索系统及方法
本专利技术涉及一种基于索引文件的社会关系网络创建与检索系统及方法,属于计算机网络
技术介绍
对社会人员关系分析,现有技术一般是将人员社会活动数据采集到关系型数据库表中(如ORACLE、MYSQL、SQLSERVER等),再通过SQL语句或者存储过程对人员的社会关系进行预处理。依据规则计算出每一个人的关系人并按关系类别存储到关系表中。现有技术主要有两大致命缺点:(1)通过SQL在检索关系时,只能检索一层关系,无法通过一次查询完成对多层关系的检索与挖掘;(2)由于关系型数据库存储容量有限,并且在海量数据下关系挖掘有着无法跨越性能瓶颈。因此现有技术,为了减小数据量、提高性能,一般只采集特定人群的社会关系数据,造成了大量有价值关系的丢失。
技术实现思路
本专利技术技术解决问题:克服现有技术的不足,提供一种基于索引文件的社会关系网络创建与检索系统及方法,建立全民社会关系网络,并可以在海量的社会关系数据中高效、快速地完成对人员的多层关系过滤与挖掘。本专利技术技术解决方案:一种基于索引文件的社会关系网络创建与检索系统,其特征在于包括:关系计算引擎、关系存储系统及关系检索引擎;其中:关系计算引擎,对输入的社会关系数据进行计算处理,分析出社会人员之间两两关系,具体实现为:(1)按抽取时间戳,获取原始待处理数据(如旅馆住宿数据),将数据按指定字段排序(如按住宿时间从大到小排列);(2)取第一条数据放入计算数据缓冲池(使用Redis实现),然后取第二条数据按关系规则与放入池内的数据进行比较,若符合关系规则【旅馆号相同、房 ...
【技术保护点】
一种基于索引文件的社会关系网络创建与检索系统,其特征在于包括:关系计算引擎、关系存储系统及关系检索引擎;其中:关系计算引擎,对输入的社会关系数据进行计算处理,分析出社会人员之间的两两原始关系数据,具体实现为:(1)按抽取时间戳,获取原始待处理数据,将数据按指定字段排序;(2)取第一条数据放入计算数据缓冲池,然后取第二条数据按关系规则与放入池内的数据进行比较,若符合关系规则的,生成关系数据,将关系数据存入关系型数据库;(3)依据所述关系规则,清除计算数据缓冲池中的一定范围的缓冲数据;(4)更新计算时间戳,循环执行步骤(1)‑(3),得到原始关系数据送至关系存储系统;关系存储系统,将关系计算引擎计算出的原始关系数据,按关系点、关系、属性、索引分类,以文件方式进行磁盘存储;关系检索引擎,对关系存储系统中的关系数据通过RSQL进行查询与过滤,返回结果给检索客户端,包括有以下步骤:A.通过对外接口,获取检索客户端提交的RSQL语句;B.对RSQL语句进行语法与词法分析,并从中提取开始结点编号;C.根据B中结点编号,检索关系存储系统,获取结点数据;D.从C中的结点数据结构中,获取该结点最后创建的关 ...
【技术特征摘要】
1.一种基于索引文件的社会关系网络创建与检索系统,其特征在于包括:关系计算引擎、关系存储系统及关系检索引擎;其中:关系计算引擎,对输入的社会关系数据进行计算处理,分析出社会人员之间的两两原始关系数据,具体实现为:(1)按抽取时间戳,获取原始待处理数据,将数据按指定字段排序;(2)取第一条数据放入计算数据缓冲池,然后取第二条数据按关系规则与放入池内的数据进行比较,若符合关系规则的,生成关系数据,将关系数据存入关系型数据库;(3)依据所述关系规则,清除计算数据缓冲池中的一定范围的缓冲数据;(4)更新计算时间戳,循环执行步骤(1)-(3),得到原始关系数据送至关系存储系统;关系存储系统,将关系计算引擎计算出的原始关系数据,按关系点、关系、属性、索引分类,以文件方式进行磁盘存储;关系检索引擎,对关系存储系统中的关系数据通过RSQL进行查询与过滤,返回结果给检索客户端,包括有以下步骤:A.通过对外接口,获取检索客户端提交的RSQL语句;B.对RSQL语句进行语法与词法分析,并从中提取开始结点编号;C.根据B中结点编号,检索关系存储系统,获取结点数据;D.从C中的结点数据中,获取该结点最后创建的关系编号;E.根据D中的关系编号,检索关系存储系统,获取关系数据;F.从E中的关系数据提取关系属性,与RSQL输入的关系参数进行比对,符合条件的,将关系结束结点作为查询结果加入结果列表,并返回关系数据;G.从F中返回的关系数据中,获取当前关系开始结点和结束结点的前一条关系编号和后一条关系编号,重复E-F步骤;H.将检索过程中的关系和结点加入系统缓存,下次检索时直接从缓存读取数据;I.返回结果数据;所述RSQL是类SQL的关系检索语言,RSQL结构描述:Restful对外接口层用于外界将Rsql传递给检索引擎;Rsql语法解析器对外部传入的Rsql语句进行语法解析,不符合语法规范的直接抛出异常;RSQL词法解析器对外部传入的RSQL语句进行词法解析,不符合词法规范的直接抛出异常;RSQL缓冲区检索引擎会将所有解析过的RSQL语句经过hash算法后,放入到缓冲区,当执行RSQL时,检索引擎直接从缓冲区获取对应的相关参数以提高解析效率;结果内容缓存检索引擎对所检索人员和关系使用LRU算法进行缓存;索引文件访问层检索引擎访问索引文件的适配层;RSQL语法结构如下:START:关系检索的开始,索引关系的开始结点;MATCH:用于和START绑定,定义一个查询匹配模型;WHERE:用于查询条件过滤;RETURN:用于返回结果集;CREATE:用于创建人员结点与人与人之间的关系;DELETE:用于删除人员或者关系;SET:用于设置结点或者关系的属性;FOREACH:对结点或者关系进行循环迭代操作;WITH:将查询结果切分成几个不同的部分。2.根据权利要求1所述的基于索引文件的社会关系网络创建与检索系统,其特征在于:所述关系存储系统具体实现为:(11)获取关系型数据库中的关系数据;(12)提取每一条关系数据中的关系人和目标人,生成结点数据存储文件,具体存储内容为该结点编号、该结点最后创建的关系编号、最后创建的属性编号;(13)提取每一条关系数据中的关...
【专利技术属性】
技术研发人员:冯祥,邱志超,吴波,黄忠伟,刘磊,刘磊,徐振兴,孙权,高明,汤东梅,
申请(专利权)人:安徽讯飞智元信息科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。