数据聚类方法和系统、数据存储方法和系统以及存储介质技术方案

技术编号：33538068 阅读：19 留言：0更新日期：2022-05-21 09:38

本申请涉及数据聚类方法和系统、数据存储方法和系统以及存储介质，所述数据聚类方法包括如下步骤：解析历史聚类数据并据其各部分的性质将其分解成聚类原子，所述聚类原子关联到其所属的历史聚类数据的聚类属性中的至少一者；根据所述聚类原子的性质形成聚类原子池，所述聚类原子池中包括所述聚类原子的非结构化关系；从所述聚类原子池查找所述聚类原子以构成备选聚类原子，所述查找基于目标聚类数据的目标聚类属性、所述聚类原子关联的聚类属性和所述聚类原子的性质；以及引用所述备选聚类原子形成所述目标聚类数据。本申请的数据聚类方法可以提高聚类数据的效率。方法可以提高聚类数据的效率。方法可以提高聚类数据的效率。

全部详细技术资料下载

【技术实现步骤摘要】
数据聚类方法和系统、数据存储方法和系统以及存储介质

[0001]本申请涉及数据加工领域，具体而言，涉及数据聚类方法和系统、数据存储方法和系统以及存储介质。

技术介绍

[0002]基于诸如语料数据的文本在很多时候都可以采纳历史文本中的内容，若每次制作新的文本时都重新编写并组织语料则效率十分低下。此外，现成的语料数据一般都经过较长时间的检验，其稳定性、准确性较高，若重新编写文本恐难避免语义上的疏漏。
[0003]通常历史文本中的语料数据是按照规则排列或者组织的，且这些语料数据之间也存在语义属性上的关联，将这些语料数据作为材料并按照新的文本的要求来制作新的文本是可以考虑的方向。

技术实现思路

[0004]本申请的实施例提供了一种数据聚类方法和系统、数据存储方法和系统以及存储介质，数据存储方法和系统用于将历史聚类数据打散成聚类原子并存储，数据聚类方法和系统可以进一步根据聚类原子制作符合要求的新聚类数据，从而提高聚类数据的效率、降低聚类数据时的错误概率。
[0005]根据本申请的一方面，提供一种数据聚类方法，包括：解析历史聚类数据并据其各部分的性质将其分解成聚类原子，所述聚类原子关联到其所属的历史聚类数据的聚类属性中的至少一者；根据所述聚类原子的性质形成聚类原子池，所述聚类原子池中包括所述聚类原子的非结构化关系；从所述聚类原子池查找所述聚类原子以构成备选聚类原子，所述查找基于目标聚类数据的目标聚类属性、所述聚类原子关联的聚类属性和所述聚类原子的性质；以及引用所述备选聚类原子形成所述目标聚类数据。...

【技术保护点】

【技术特征摘要】
1.一种数据聚类方法，包括：解析历史聚类数据并据其各部分的性质将其分解成聚类原子，所述聚类原子关联到其所属的历史聚类数据的聚类属性中的至少一者；根据所述聚类原子的性质形成聚类原子池，所述聚类原子池中包括所述聚类原子的非结构化关系；从所述聚类原子池查找所述聚类原子以构成备选聚类原子，所述查找基于目标聚类数据的目标聚类属性、所述聚类原子关联的聚类属性和所述聚类原子的性质；以及引用所述备选聚类原子形成所述目标聚类数据。2.根据权利要求1所述的方法，所述历史聚类数据为历史语料聚类数据，所述聚类原子为语料聚类原子。3.根据权利要求2所述的方法，所述查找还基于语料匹配。4.根据权利要求1所述的方法，所述聚类原子以图数据库形式组织并存储在聚类原子池中。5.根据权利要求4所述的方法，所述查找基于图搜索方法。6. 根据权利要求4所述的方法，所述聚类原子存在层级关系，其中：将上级聚类原子作为所述备选聚类原子的同时也将其下级聚类原子作为所述备选聚类原子；以及通过作为所述备选聚类原子的下级聚类原子能够上溯其上级聚类原子，并将所述上级聚类原子作为所述备选聚类原子。7.根据权利要求1所述的方法，所述聚类属性包括：对象、种类、地区、性别、年龄、期间。8.根据权利要求1所述的方法，若所引用的备选聚类原子之间不兼容，则产生提示信息。9. 一种数据存储方法，包括：解析历史聚类数据并据其各部分的性质将其分解成聚类原子，所述聚类原子关联到其所属的历史聚类数据的聚类属性中的至少一者；以及根据所述聚类原子的性...

【专利技术属性】
技术研发人员：莫元武，K，
申请(专利权)人：易保网络技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人