一种数据标签的识别方法及设备技术

技术编号:37806349 阅读:18 留言:0更新日期:2023-06-09 09:36
本申请的目的是提供一种数据标签的识别方法及设备,本申请通过构建用于识别数据的标签下标的识别模型;获取待识别数据,并对所述待识别数据依序进行特征提取和位置标记,得到所述待识别数据对应的特征值及其位置标记位;将所述待识别数据对应的特征值及其位置标记位输入至所述识别模型,进行深度学习,得到所述待识别数据的标签下标,实现先构建高精度识别模型,再对待识别数据进行数据处理得到特征信息,最终利用高精度的识别模型对特征信息进行识别,达成数据标签识别结合深度模型的识别方式,突破原始数据标签的识别方式,提高标签识别的速率和精准度。识别的速率和精准度。识别的速率和精准度。

【技术实现步骤摘要】
一种数据标签的识别方法及设备


[0001]本申请涉及计算机
,尤其涉及一种数据标签的识别方法及设备。

技术介绍

[0002]随着数字化时代的到来,数据信息被广泛使用,并得到企业资产越来越多的重视。如何对资产数据信息进行标签识别成为资产数据信息使用的重要环节,只有对资产数据信息进行准确的标签识别才能更好的使用资产数据,保证资产数据在使用过程中的安全可控。
[0003]在现有技术中,对数据进行数据标签识别主要通过人工方式、正则表达式方式和字典库方式完成,使用人工方式进行数据标签识别需要耗费大量人力成本;使用正则表达式方式和字典库方式进行数据标签识别时,识别准确度会随着正则表达式和字典库的数据准确度变化而产生较大的差异。

技术实现思路

[0004]本申请的一个目的是提供一种数据标签的识别方法及设备,解决数据标签的识别过程中人力成本和普通识别方法识别不准确问题,利用构建的识别模型,并结合对待识别数据进行特征操作之后的特征值及其位置标记位,共同精准识别出待识别数据的标签下标,提高待识别数据识别速度的同时,精准准确的得到标签下标。
[0005]根据本申请的一个方面,提供了一种数据标签的识别方法,其中,所述方法包括:
[0006]构建用于识别数据的标签下标的识别模型;
[0007]获取待识别数据,并对所述待识别数据依序进行特征提取和位置标记,得到所述待识别数据对应的特征值及其位置标记位;
[0008]将所述待识别数据对应的特征值及其位置标记位输入至所述识别模型,进行深度学习,得到所述待识别数据的标签下标。
[0009]进一步地,上述方法中,其中,所述构建用于识别数据的标签下标的识别模型,包括:
[0010]获取用于训练所述识别模型的数据集,所述数据集包括至少一行标签数据,每行所述标签数据包括多个数据且每行所述标签数据各对应一个标签下标;
[0011]对所述数据集中的每行所述标签数据依序进行特征提取和位置标记,得到每行所述标签数据对应的特征值及其位置标记位;
[0012]基于所述数据集中的每行所述标签数据对应的特征值及其位置标记位,进行深度学习模型的训练,得到用于识别数据的标签下标的识别模型。
[0013]进一步地,上述方法中,所述对所述数据集中的每行所述标签数据依序进行特征提取和位置标记,得到每行所述标签数据对应的特征值及其位置标记位,包括:
[0014]对所述数据集中的每行所述标签数据进行特征提取,得到每行所述标签数据对应的特征值;
[0015]对每行所述标签数据对应的特征值进行位置标记,得到每行所述标签数据对应的特征值的位置标记位。
[0016]进一步地,上述方法中,所述对所述数据集中的每行所述标签数据依序进行特征提取,得到每行所述标签数据对应的特征值,包括:
[0017]对所述数据集中的每行所述标签数据进行语义特征提取和特征值提取,得到每行所述标签数据对应的特征值。
[0018]进一步地,上述方法中,所述对每行所述标签数据对应的特征值进行位置标记,得到每行所述标签数据对应的特征值的位置标记位,包括:
[0019]计算每行所述标签数据对应的特征值在所述标签数据中的标记位置,查找每行所述标签数据中的数据分隔符,并对每个数据分隔符进行特征值的位置标记,依次计算所述标签数据对应的特征值中的每个所述特征值对应的位置标记位。
[0020]进一步地,上述方法中,所述基于所述数据集中的每行所述标签数据对应的特征值及其位置标记位,进行深度学习模型的训练,得到用于识别数据的标签下标的识别模型,包括:
[0021]基于所述数据集中的每行所述标签数据对应的特征值及其位置标记位,进行深度学习模型的训练,得到用于识别数据的标签下标的初始模型;
[0022]对所述初始模型进行预设次数的模型优化训练,得到预设次数中的每次优化训练对应的优化模型及其精度值;
[0023]将精度值最高时对应的优化模型,确定为用于识别数据的标签下标的识别模型。
[0024]进一步地,上述方法中,所述获取待识别数据的同时,还包括:
[0025]获取所述待识别数据对应的标签及其标签下标的映射关系;
[0026]所述一种数据标签的识别方法还包括:
[0027]根据所述映射关系和所述待识别数据的标签下标,识别所述待识别数据对应的标签。
[0028]根据本申请的另一方面,还提供了一种非易失性存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,使所述处理器实现如上述一种数据标签的识别方法。
[0029]根据本申请的另一方面,还提供了一种数据标签的识别设备,其中,该设备包括:
[0030]一个或多个处理器;
[0031]计算机可读介质,用于存储一个或多个计算机可读指令,
[0032]当所述一个或多个计算机可读指令被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述一种数据标签的识别方法。
[0033]与现有技术相比,本申请通过构建用于识别数据的标签下标的识别模型;获取待识别数据,并对所述待识别数据依序进行特征提取和位置标记,得到所述待识别数据对应的特征值及其位置标记位;将所述待识别数据对应的特征值及其位置标记位输入至所述识别模型,进行深度学习,得到所述待识别数据的标签下标,实现先构建高精度识别模型,再对待识别数据进行数据处理得到特征信息,最终利用高精度的识别模型对特征信息进行识别,达成数据标签识别结合深度模型的识别方式,突破原始数据标签的识别方式,提高标签识别的速率和精准度。
附图说明
[0034]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0035]图1示出根据本申请一个方面的一种数据标签的识别方法的流程示意图;
[0036]图2示出根据本申请一个方面的一种数据标签的识别方法在实际应用场景中流程示意图;
[0037]图3示出根据本申请一个方面的一种数据标签的识别方法在实际应用场景中训练识别模型的流程示意图。
[0038]附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
[0039]下面结合附图对本申请作进一步详细描述。
[0040]在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0041]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0042]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(S本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据标签的识别方法,其中,所述方法包括:构建用于识别数据的标签下标的识别模型;获取待识别数据,并对所述待识别数据依序进行特征提取和位置标记,得到所述待识别数据对应的特征值及其位置标记位;将所述待识别数据对应的特征值及其位置标记位输入至所述识别模型,进行深度学习,得到所述待识别数据的标签下标。2.根据权利要求1所述的方法,其中,所述构建用于识别数据的标签下标的识别模型,包括:获取用于训练所述识别模型的数据集,所述数据集包括至少一行标签数据,每行所述标签数据包括多个数据且每行所述标签数据各对应一个标签下标;对所述数据集中的每行所述标签数据依序进行特征提取和位置标记,得到每行所述标签数据对应的特征值及其位置标记位;基于所述数据集中的每行所述标签数据对应的特征值及其位置标记位,进行深度学习模型的训练,得到用于识别数据的标签下标的识别模型。3.根据权利要求2所述的方法,所述对所述数据集中的每行所述标签数据依序进行特征提取和位置标记,得到每行所述标签数据对应的特征值及其位置标记位,包括:对所述数据集中的每行所述标签数据进行特征提取,得到每行所述标签数据对应的特征值;对每行所述标签数据对应的特征值进行位置标记,得到每行所述标签数据对应的特征值的位置标记位。4.根据权利要求3所述的方法,所述对所述数据集中的每行所述标签数据依序进行特征提取,得到每行所述标签数据对应的特征值,包括:对所述数据集中的每行所述标签数据进行语义特征提取和特征值提取,得到每行所述标签数据对应的特征值。5.根据权利要求4所述的方法,其中,所述对每行所述标签数据对应的特征值...

【专利技术属性】
技术研发人员:任养超李玉亮徐岩
申请(专利权)人:上海上讯信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1