System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及文本标签处理,特别是涉及一种文本标签验证方法、电子设备及存储介质。
技术介绍
1、在数据标注领域,通常需要对大量文本进行打标签,例如对于论文、新闻等各类文本的标签抽取,提取出的标签可以作为比摘要更加精炼的词语或片段,有助于筛选到符合要求的文本,对于文本的分类、推荐、关联具有重要的作用。
2、现有技术中,传统方式是人为打标,人为主观性大,会影响打标的准确性,因此目前多采用机器学习模型抽取标签的方式,对于不同的平台,可能采用的是不同的模型,抽取的标签也不完全相同,因此这种方式虽然能够通过自动化打标提升效率,但是模型的准确性也常常需要通过人工验证。
3、在申请号为2017105414810,名称为“文本标签生成方法和装置”的专利文件中,提出了一种文本标签生成方法,通过在不同标签类型之间进行交叉验证,筛选出目标文本的目标标签,但是,在交叉验证过程中,仅根据不同标签类型的候选标签之间的重合字符,对候选标签进行验证筛选,筛选方式较为单一,影响标签验证的准确性。
技术实现思路
1、针对上述技术问题,本专利技术采用的技术方案为:
2、一种文本标签验证方法,所述方法包括如下步骤:
3、s100,将预设文本输入至若干个预设标签模型中,获取到每一预设标签模型对所述预设文本标记的若干第二预测文本标签。
4、s200,根据每一预设标签模型对所述预设文本标记的若干第二预测文本标签和预先获取的预设文本的若干第一预测文本标签,获取到每一预设
5、s300,根据每一预设标签模型对所述预设文本标记的若干第二预测文本标签、每一预设标签模型对应的标签重叠率和每一预设标签模型的预设模型可信度,获取到每一第二预测文本标签的可信度优先级。
6、s400,当存在第二预测文本标签的可信度优先级大于预设的可信度优先级阈值时,验证对应可信度优先级大于预设的可信度优先级阈值的第二预测文本标签的结果为符合预设要求。
7、本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的一种文本标签验证方法、电子设备及存储介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:
8、本专利技术提供了一种文本标签验证方法,根据人工对预设文本标记的若干第一预测文本标签和每一预设标签模型对预设文本标记的若干第二预测文本标签,获取到每一预设标签模型对应的标签重叠率,根据每一预设标签模型标记的若干第二预测文本标签、每一预设标签模型的预设模型可信度结合每一预设标签模型对应的标签重叠率,能够计算得到每一第二预测文本标签的可信度优先级,通过可信度优先级筛选出符合预设要求的若干第二预测文本标签,由上述方法可知,本专利技术采用人工打标和多个预设标签模型对预设文本打标两种方式的结合,还引入了预设标签模型对应的标签重叠率和预设标签模型的预设模型可信度,能够将可信度优先级高的第二预测文本标签准确地筛选出来,因而实现了对标签的准确性验证。
本文档来自技高网...【技术保护点】
1.一种文本标签验证方法,其特征在于,所述方法包括如下步骤:
2.根据权利要求1所述的一种文本标签验证方法,其特征在于,在步骤S200中,通过如下步骤获取任一预设标签模型对应的标签重叠率:
3.根据权利要求2所述的文本标签验证方法,其特征在于,所述任一预设标签模型对应的标签重叠率符合如下条件:
4.根据权利要求3所述的文本标签验证方法,其特征在于,在步骤S300中,通过如下步骤获取任一第二预测文本标签的可信度优先级:
5.根据权利要求4所述的文本标签验证方法,其特征在于,所述任一第二预测文本标签的可信度优先级符合如下条件:
6.根据权利要求1所述的文本标签验证方法,其特征在于,所述方法通过如下步骤获取可信度优先级阈值:
7.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的文本标签验证方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机
...【技术特征摘要】
1.一种文本标签验证方法,其特征在于,所述方法包括如下步骤:
2.根据权利要求1所述的一种文本标签验证方法,其特征在于,在步骤s200中,通过如下步骤获取任一预设标签模型对应的标签重叠率:
3.根据权利要求2所述的文本标签验证方法,其特征在于,所述任一预设标签模型对应的标签重叠率符合如下条件:
4.根据权利要求3所述的文本标签验证方法,其特征在于,在步骤s300中,通过如下步骤获取任一第二预测文本标签的可信度优先级:
5.根据权利要求4所述的文本标签验证方法,其特征在于,所述任一第...
【专利技术属性】
技术研发人员:靳雯,赵洲洋,于伟,王全修,石江枫,
申请(专利权)人:北京睿企信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。