The invention discloses a tool and method applied to mass labeled entity data storage, belonging to the field of mass data storage and label data storage. The tool includes tag metadata module, entity tag data module and unified access API module. Users input username password and request, access API module according to username and password, access tag metadata module and read tag metadata, package metadata according to user request, convert it into data format of data layer, transfer corresponding interface to data layer to perform operation on tag data, entity tag Data module performs corresponding operations according to requests from Unified Access API module, and persists data. At the same time, the entity label data module returns the processing results to the unified access API module, and the unified access API module returns the data package to the tool interface according to the prescribed format. The invention has high pertinence, expansibility and persistence, and supports higher level business requirements.
【技术实现步骤摘要】
一种应用于海量标签化实体数据存储的工具和方法
本专利技术涉及一种应用于海量标签化实体数据存储的工具和方法,属于海量数据存储、标签数据存储领域。
技术介绍
近年来,国内互联网业务不断发展,移动互联网技术不断成熟,但是随着业务的发展,数据的大量积累,数据分散的问题也越来越严重,导致数据的价值严重弱化,而类似于目标管理、自动智能推荐等系统或应用,又要求以完整的、高度融合的、准确的、时效的数据作为基础,这使得如何提取并存储高价值实体数据的问题,显得更加紧迫。在这样的背景下,标签系统、画像系统这类应用,受到越来越多的关注和研究。而在实际的业务场景中,实体标签并不是简简单单地存储一个标签值而已,还有许多存储问题关系到能否支撑上层业务,例如:如何根据业务发展的需求灵活地扩展标签体系?如何同时保存标签值的附加属性?如何设置标签值的生命周期?如何让标签值具备确认状态的属性,使得未确认的标签值不被发布?如何支撑标签值维度的自定义扩充?如何存储历史版本,以便支持版本回溯?以及如何实现海量离线数据的快速导入?等这些问题显然已经无法通过传统的存储模型,或者通过简单的关系型数据库来解决。
技术实现思路
本专利技术为了解决海量标签化实体数据存储过程中存在的各种实际问题,提供灵活高效的标签数据存储和访问,充分发挥标签数据的价值,从而支撑更高层次上的业务需求;提出了一种应用于海量标签化实体数据存储的工具和方法。所述的应用于海量标签化实体数据存储的工具,分布在互联网业务中,具体包括标签元数据模块、实体标签数据模块和统一存取API模块。互联网业务包括展现层,业务层和数据层;展现层为工具界面,标签元 ...
【技术保护点】
1.一种应用于海量标签化实体数据存储的工具,其特征在于,分布在互联网业务中,具体包括标签元数据模块、实体标签数据模块和统一存取API模块;互联网业务包括展现层,业务层和数据层;展现层为工具界面,标签元数据模块和统一存取API模块分布在业务层;实体标签数据模块分布在数据层;统一存取API模块作为桥梁连接展现层和数据层,同时还连接同层的标签元数据模块;用户通过工具界面输入用户名密码和请求,统一存取API模块根据用户名和密码,访问标签元数据模块并读取标签的元数据,按用户请求对元数据进行包装,转换成数据层的数据格式,传输到数据层的对应接口对标签数据执行操作,实体标签数据模块负责对标签数据进行增、删、改和查操作,根据统一存取API模块发出的请求执行相应的操作,从StoreServer中对数据进行操作,并对数据做持久化处理;同时将处理结果返回给统一存取API模块,统一存取API模块将数据进行包装按照规定格式返回到工具界面;统一存取API模块对标签元数据模块的元数据和实体标签数据模块的处理结果分别进行封装,并对客户端开放接口;标签元数据模块主要存储标签定义信息,以及标签名称到底层存储字段的映射信息; ...
【技术特征摘要】
1.一种应用于海量标签化实体数据存储的工具,其特征在于,分布在互联网业务中,具体包括标签元数据模块、实体标签数据模块和统一存取API模块;互联网业务包括展现层,业务层和数据层;展现层为工具界面,标签元数据模块和统一存取API模块分布在业务层;实体标签数据模块分布在数据层;统一存取API模块作为桥梁连接展现层和数据层,同时还连接同层的标签元数据模块;用户通过工具界面输入用户名密码和请求,统一存取API模块根据用户名和密码,访问标签元数据模块并读取标签的元数据,按用户请求对元数据进行包装,转换成数据层的数据格式,传输到数据层的对应接口对标签数据执行操作,实体标签数据模块负责对标签数据进行增、删、改和查操作,根据统一存取API模块发出的请求执行相应的操作,从StoreServer中对数据进行操作,并对数据做持久化处理;同时将处理结果返回给统一存取API模块,统一存取API模块将数据进行包装按照规定格式返回到工具界面;统一存取API模块对标签元数据模块的元数据和实体标签数据模块的处理结果分别进行封装,并对客户端开放接口;标签元数据模块主要存储标签定义信息,以及标签名称到底层存储字段的映射信息;实体标签数据模块将所有的实体数据,根据索引按一定的数据结构存储于Elasticsearch中,在Elasticsearch中创建唯一的Index,存储该对象类别下的所有实体数据;在Index中,type0总是存储最新版本的标签数据,且动态地创建typeN用于存储完整的历史版本,N>=1。2.如权利要求1所述的一种应用于海量标签化实体数据存储的工具,其特征在于,所述的客户端的作用在于:统一存取API模块管理标签元数据,包括标签的创建、修改、删除和查询操作;同时管理实体标签数据,包括实体的创建、删除、修改、查询,标签数据的人工确认、生命周期管理和历史版本管理。3.如权利要求1所述的一种应用于海量标签化实体数据存储的工具,其特征在于,所述的标签定义信息包括用户登录账户、用户密码、用户权限、用户访问日志、系统日志、对象名称、对象和标签之间的关系、标签名称、标签的状态、标签别名和标签ID。4.如权利要求1所述的一种应用于海量标签化实体数据存储的工具,其特征在于,所述的映射信息是指:标签是动态的,允许用户在使用过程中根据业务发展的需求灵活地创建新的标签,或者删除过时的标签,因此,标签名称与底层字段不是一一对应,而映射表中,维护了标签名称与底层字段的映射关系...
【专利技术属性】
技术研发人员:孙波,姚珊,姜栋,张建松,高昕,董建武,王梦禹,胡晓旭,刘云昊,梁维,谢铭,王峰,汪军强,
申请(专利权)人:北京赛思信安技术股份有限公司,国家计算机网络与信息安全管理中心,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。