基于字符匹配的数据分类方法、装置、设备以及存储介质制造方法及图纸

技术编号:30766493 阅读:17 留言:0更新日期:2021-11-10 12:26
本发明专利技术公开了一种基于字符匹配的数据分类方法,包括:获取待分类的业务数据;将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据;根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中。可见,本发明专利技术能够通过简单的字符匹配的方式实现对业务数据的分类,减少数据分类中进行的复杂的数据分析过程,在保证数据分类的准确性的同时,兼顾数据分类的效率。本发明专利技术还涉及区块链技术领域。技术领域。技术领域。

【技术实现步骤摘要】
基于字符匹配的数据分类方法、装置、设备以及存储介质


[0001]本专利技术涉及数据建模
,尤其涉及一种基于字符匹配的数据分类方法、装置、计算机设备以及存储介质。

技术介绍

[0002]随着信息化社会的到来,信息技术已逐渐渗透在人类的日常生活中,为人类的日常生活带来了极大的便利,如,当前的通信技术、人工智能技术、互联网技术、物联网技术等信息技术均为人类创造了更好的生活条件。在信息技术被广泛应用的同时,随之而来的是大量数据的产生,这些数据经过大数据技术处理之后,即能够为用户提供各种数据服务。而在大数据技术中,对源数据进行数据建模是其中的关键一环。在实际应用中,源数据通常较为散乱(如,数据类型不统一、数据内容缺乏统一的标准等),若将这些源数据直接用于提供数据服务,显然是无法实现对数据的高效利用,无法提供高质量的数据服务的。所以,在利用大数据技术为用户提供技术服务之前,通常需要对源数据进行数据建模。
[0003]数据建模是一项比较复杂的任务,通常不同的行业应用会有不同的建模需求,如,在某些行业应用中,进行数据建模时通常需要将业务数据分类至数据模型的各个数据分类中。在对业务数据进行分类的过程中,为了将业务数据准确地分类至合适的数据分类中,往往需要对业务数据进行较为复杂的分析(如,对业务数据中的字符进行语义理解、对业务数据进行聚类等)。通常对业务数据的分析过程越复杂,则得到的分类结果越准确,但是,更复杂的分析过程也意味着在分析过程中需要进行大量的计算,这将会导致数据分类效率的降低。目前,现有技术中亟需一种能够较好地兼顾分类效率和分类准确性的数据分类方法。

技术实现思路

[0004]本专利技术所要解决的技术问题在于,目前的数据分类方法未能很好地兼顾数据分类的效率和准确性。
[0005]为了解决上述技术问题,本专利技术第一方面公开了一种基于字符匹配的数据分类方法,所述方法包括:
[0006]获取待分类的业务数据;
[0007]将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据,其中,所述数据模型中预设有多个数据分类,且所述数据模型中的每个数据均已被预先划分至各个数据分类中;
[0008]根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中;
[0009]其中,所述匹配数据为相同数据或者近似数据,所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据,所述近似数据指所述数据模型中与所述业务数据的字符未完全一致,且包含所述业务数据中所有字符的数据。
[0010]本专利技术第二方面公开了一种基于字符匹配的数据分类装置,所述装置包括:
[0011]获取模块,用于获取待分类的业务数据;
[0012]匹配模块,用于将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据,其中,所述数据模型中预设有多个数据分类,且所述数据模型中的每个数据均已被预先划分至各个数据分类中;
[0013]分类模块,用于根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中;
[0014]其中,所述匹配数据为相同数据或者近似数据,所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据,所述近似数据指所述数据模型中与所述业务数据的字符未完全一致,且包含所述业务数据中所有字符的数据。
[0015]本专利技术第三方面公开了一种计算机设备,所述计算机设备包括:
[0016]存储有可执行程序代码的存储器;
[0017]与所述存储器连接的处理器;
[0018]所述处理器调用所述存储器中存储的所述可执行程序代码,执行本专利技术第一方面公开的基于字符匹配的数据分类方法中的部分或全部步骤。
[0019]本专利技术第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本专利技术第一方面公开的基于字符匹配的数据分类方法中的部分或全部步骤。
[0020]本专利技术实施例中,首先获取待分类的业务数据,然后将业务数据中的字符与已存在的数据模型中的每一个数据中的字符进行匹配,得到业务数据对应的匹配数据,最后根据匹配数据在数据模型中的数据分类,将业务数据分类至数据模型的数据分类中,从而能够在进行业务数据的数据分类时,先通过字符匹配的方式从数据模型中匹配出业务数据对应的匹配数据,然后参照匹配数据在数据模型中的数据分类对待分类的业务数据进行分类,从而能够通过简单的字符匹配的方式实现对业务数据的分类,减少数据分类中进行的复杂的数据分析过程,在保证数据分类的准确性的同时,兼顾数据分类的效率。
附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本专利技术实施例公开的一种基于字符匹配的数据分类方法的流程示意图;
[0023]图2是本专利技术实施例公开的一种基于字符匹配的数据分类装置的结构示意图;
[0024]图3是本专利技术实施例公开的一种计算机设备的结构示意图;
[0025]图4是本专利技术实施例公开的一种计算机存储介质的结构示意图。
具体实施方式
[0026]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员
在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
[0028]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0029]本专利技术公开了一种基于字符匹配的数据分类方法、装置、计算机设备以及存储介质,首先获取待分类的业务数据,然后将业务数据中的字符与已存在的数据模型中的每一个数据中的字符进行匹配,得到业务数据对应的匹配数据,最后根据匹配数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于字符匹配的数据分类方法,其特征在于,所述方法包括:获取待分类的业务数据;将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据,其中,所述数据模型中预设有多个数据分类,且所述数据模型中的每个数据均已被预先划分至各个数据分类中;根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中;其中,所述匹配数据为相同数据或者近似数据,所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据,所述近似数据指所述数据模型中与所述业务数据的字符未完全一致,且包含所述业务数据中所有字符的数据。2.根据权利要求1所述的基于字符匹配的数据分类方法,其特征在于,所述根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中,包括:当所述匹配数据为所述相同数据时,将所述相同数据在所述数据模型的数据分类确定为所述目标数据分类,并将所述业务数据分类至所述目标数据分类中;当所述匹配数据为所述近似数据时,按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据,基于所述相似数据在所述数据模型的数据分类确定所述目标数据分类,并将所述业务数据分类至所述目标数据分类中。3.根据权利要求2所述的基于字符匹配的数据分类方法,其特征在于,所述按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据,包括:将所述业务数据和所述数据模型中的数据分别映射为数据向量空间中的数据向量;基于所述业务数据和所述数据模型中的数据分别对应的数据向量,从所述数据模型的数据中筛选出与所述业务数据对应的相似数据。4.根据权利要求3所述的基于字符匹配的数据分类方法,其特征在于,所述基于所述业务数据和所述数据模型中的数据分别对应的数据向量,从所述数据模型的数据中筛选出与所述业务数据对应的相似数据,包括:根据历史半径确定出当前半径,其中,所述历史半径是上一次筛选相似数据的过程中所确定出的半径,所述当前半径大于所述历史半径;根据业务数据向量和所述当前半径确定出数据向量范围,其中,所述业务数据向量是所述业务数据在所述数据向量空间中所对应的向量,所述数据向量范围是在所述数据向量空间中,以所述业务数据向量为中心,以所述当前半径为半径的圆形范围;判断所述数据向量范围内的数据向量的数量是否大于历史数据向量范围内的数据向量的数量,其中,所述历史数据向量范围是在所述数据向量空间中,以所述业务数据向量为中心,以所述历史半径为半径的圆形范围;当所述数据向量范围内的数据向量的数量未大于所述历史数据向量范围内的数据向量的数量时,将所述数据向量范围内的数据向量在所述数据模型中所对应的数据确定为与所述业务数据对应的相似数据。5.根据权利要求4所述的基于字符匹配的数据分类方法,其特征在于,所述根据历史半径确定出当前半径,包括:
通过以下公式以指数增长的方式,根据历史半...

【专利技术属性】
技术研发人员:谢峥
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1