基于字符匹配的数据分类方法、装置、设备以及存储介质制造方法及图纸

技术编号：30766493 阅读：17 留言：0更新日期：2021-11-10 12:26

本发明专利技术公开了一种基于字符匹配的数据分类方法，包括：获取待分类的业务数据；将所述业务数据与预设的数据模型中的每个数据进行字符匹配，得到所述数据模型中与所述业务数据相匹配的匹配数据；根据所述匹配数据在所述数据模型中对应的目标数据分类，将所述业务数据分类至所述数据模型中的所述目标数据分类中。可见，本发明专利技术能够通过简单的字符匹配的方式实现对业务数据的分类，减少数据分类中进行的复杂的数据分析过程，在保证数据分类的准确性的同时，兼顾数据分类的效率。本发明专利技术还涉及区块链技术领域。技术领域。技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
基于字符匹配的数据分类方法、装置、设备以及存储介质

[0001]本专利技术涉及数据建模
，尤其涉及一种基于字符匹配的数据分类方法、装置、计算机设备以及存储介质。

技术介绍

[0002]随着信息化社会的到来，信息技术已逐渐渗透在人类的日常生活中，为人类的日常生活带来了极大的便利，如，当前的通信技术、人工智能技术、互联网技术、物联网技术等信息技术均为人类创造了更好的生活条件。在信息技术被广泛应用的同时，随之而来的是大量数据的产生，这些数据经过大数据技术处理之后，即能够为用户提供各种数据服务。而在大数据技术中，对源数据进行数据建模是其中的关键一环。在实际应用中，源数据通常较为散乱(如，数据类型不统一、数据内容缺乏统一的标准等)，若将这些源数据直接用于提供数据服务，显然是无法实现对数据的高效利用，无法提供高质量的数据服务的。所以，在利用大数据技术为用户提供技术服务之前，通常需要对源数据进行数据建模。
[0003]数据建模是一项比较复杂的任务，通常不同的行业应用会有不同的建模需求，如，在某些行业应用中，进行数据建模时通常需要将业务数据分类至数据模型的各个数据分类中。在对业务数据进行分类的过程中，为了将业务数据准确地分类至合适的数据分类中，往往需要对业务数据进行较为复杂的分析(如，对业务数据中的字符进行语义理解、对业务数据进行聚类等)。通常对业务数据的分析过程越复杂，则得到的分类结果越准确，但是，更复杂的分析过程也意味着在分析过程中需要进行大量的计算，这将会导致数据分类效率的降低。目前，现有技术中亟需一种能够较好地...

【技术保护点】

【技术特征摘要】
1.一种基于字符匹配的数据分类方法，其特征在于，所述方法包括：获取待分类的业务数据；将所述业务数据与预设的数据模型中的每个数据进行字符匹配，得到所述数据模型中与所述业务数据相匹配的匹配数据，其中，所述数据模型中预设有多个数据分类，且所述数据模型中的每个数据均已被预先划分至各个数据分类中；根据所述匹配数据在所述数据模型中对应的目标数据分类，将所述业务数据分类至所述数据模型中的所述目标数据分类中；其中，所述匹配数据为相同数据或者近似数据，所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据，所述近似数据指所述数据模型中与所述业务数据的字符未完全一致，且包含所述业务数据中所有字符的数据。2.根据权利要求1所述的基于字符匹配的数据分类方法，其特征在于，所述根据所述匹配数据在所述数据模型中对应的目标数据分类，将所述业务数据分类至所述数据模型中的所述目标数据分类中，包括：当所述匹配数据为所述相同数据时，将所述相同数据在所述数据模型的数据分类确定为所述目标数据分类，并将所述业务数据分类至所述目标数据分类中；当所述匹配数据为所述近似数据时，按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据，基于所述相似数据在所述数据模型的数据分类确定所述目标数据分类，并将所述业务数据分类至所述目标数据分类中。3.根据权利要求2所述的基于字符匹配的数据分类方法，其特征在于，所述按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据，包括：将所述业务数据和所述数据模型中的数据分别映射为数据向量空间中的数据向量；基于所述业务数据和所述数据模型中的数据分别对应的数据向量，从所述数据模型的数据中筛选出与所述业务数据对应的相似数据。4.根据权利要求3所述的基于字符匹配的数据分类方法，其特征在于，所述基于所述业务数据和所述数据模型中的数据分别对应的数据向量，从所述数据模型的数据中筛选出与所述业务数据对应的相似数据，包括：根据历史半径确定出当前半径，其中，所述历史半径是上一次筛选相似数据的过程中所确定出的半径，所述当前半径大于所述历史半径；根据业务数据向量和所述当前半径确定出数据向量范围，其中，所述业务数据向量是所述业务数据在所述数据向量空间中所对应的向量，所述数据向量范围是在所述数据向量空间中，以所述业务数据向量为中心，以所述当前半径为半径的圆形范围；判断所述数据向量范围内的数据向量的数量是否大于历史数据向量范围内的数据向量的数量，其中，所述历史数据向量范围是在所述数据向量空间中，以所述业务数据向量为中心，以所述历史半径为半径的圆形范围；当所述数据向量范围内的数据向量的数量未大于所述历史数据向量范围内的数据向量的数量时，将所述数据向量范围内的数据向量在所述数据模型中所对应的数据确定为与所述业务数据对应的相似数据。5.根据权利要求4所述的基于字符匹配的数据分类方法，其特征在于，所述根据历史半径确定出当前半径，包括：
通过以下公式以指数增长的方式，根据历史半...

【专利技术属性】
技术研发人员：谢峥，
申请(专利权)人：平安国际智慧城市科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人