System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理领域,尤其涉及一种实体属性信息确定方法、装置、计算机设备及存储介质。
技术介绍
1、自然语言文本中包括实体以及实体属性信息,实体属性信息包括实体的肯定属性和实体的否定属性。肯定属性是指实体在自然语言文本中呈现肯定语义的表达,否定属性是指实体在自然语言文本中呈现否定语义的表达。现有确定实体的否定属性的方式是通过线索词识别和作用范围识别两个子任务确定的。其中,线索词是指具有不确定或否定语义的词和短语,如“不”、“无”、“not”等,作用范围是指线索词在语义上作用的文本范围。
2、但现有的确定实体的否定属性的方法存在线索词不典型,或者语句语义上是否定态度,但并未出现明确的线索词,或者作用范围太宽,导致信息粒度太粗等问题,导致确定实体的否定属性的准确率较低的问题。
技术实现思路
1、本专利技术实施例提供一种实体属性信息确定方法、装置、计算机设备和存储介质,以提高对文本数据所包含实体的属性信息(肯定属性和否定属性)的识别准确率。
2、为了解决上述技术问题,本申请实施例提供一种实体属性信息确定方法,包括:
3、获取目标文本数据;
4、对所述目标文本数据进行实体提取处理,得到多个目标作用实体,所述目标作用实体用于指示在所述目标文本数据上具有作用范围,且需要确定属性信息的实体;
5、确定所述目标作用实体在所述目标文本数据中所属语句;
6、基于各所述目标作用实体,以及所述目标作用实体所属语句,构建各所述目标
7、将所述输入数据输入预设模型中,以使所述预设模型针对每一所述目标作用实体,对所述目标作用实体的输入数据进行属性分类处理,得到所述目标作用实体的属性信息,所述预设模型基于与所述目标文本数据相同领域的语料数据作为训练样本,进行有监督微调训练得到。
8、为了解决上述技术问题,本申请实施例还提供一种实体属性信息确定装置,包括:
9、数据获取模块,用于获取目标文本数据;
10、目标作用实体提取模块,用于对所述目标文本数据进行实体提取处理,得到多个目标作用实体,所述目标作用实体用于指示在所述目标文本数据上具有作用范围,且需要确定属性信息的实体;
11、语句确定模块,用于确定所述目标作用实体在所述目标文本数据中所属语句;
12、输入数据构建模块,用于基于各所述目标作用实体,以及所述目标作用实体所属语句,构建各所述目标作用实体对应的输入数据;
13、属性分类模块,用于将所述输入数据输入预设模型中,以使所述预设模型针对每一所述目标作用实体,对所述目标作用实体的输入数据进行属性分类处理,得到所述目标作用实体的属性信息,所述预设模型基于与所述目标文本数据相同领域的语料数据作为训练样本,进行有监督微调训练得到。
14、为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实体属性信息确定方法的步骤。
15、为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实体属性信息确定方法的步骤。
16、本专利技术实施例提供的实体属性信息确定方法、装置、计算机设备及存储介质,通过获取目标文本数据;对所述目标文本数据进行实体提取处理,得到多个目标作用实体,所述目标作用实体用于指示在目标文本数据上具有作用范围,且需要确定属性信息的实体;确定所述目标作用实体在所述目标文本数据中所属语句;基于各所述目标作用实体,以及所述目标作用实体所属语句,构建各所述目标作用实体对应的输入数据;将所述输入数据输入预设模型中,以使所述预设模型针对每一所述目标作用实体,对所述目标作用实体的输入数据进行属性分类处理,得到所述目标作用实体的属性信息,所述预设模型基于与所述目标文本数据相同领域的语料数据作为训练样本,进行有监督微调训练得到。通过对原始文本数据进行细粒度实体提取,结合原始文本数据进行属性二分类,以使得在控制实体作用范围的同时,减少了在实体的属性信息为否定属性的情况下对线索词的依赖,提高了对文本数据所包含实体的否定属性的识别准确率。
本文档来自技高网...【技术保护点】
1.一种实体属性信息确定方法,其特征在于,所述实体属性信息确定方法包括:
2.如权利要求1所述的实体属性信息确定方法,其特征在于,所述基于各所述目标作用实体,以及所述目标作用实体所属语句,构建各所述目标作用实体对应的输入数据,包括:
3.根据权利要求2所述的实体属性信息确定方法,其特征在于,所述预设模型至少包括输入层,数据处理层、全连接层和输出层,所述将所述输入数据输入预设模型中,以使所述预设模型针对每一所述目标作用实体,对所述目标作用实体的输入数据进行属性分类处理,得到所述目标作用实体的属性信息,包括:
4.根据权利要求3所述的实体属性信息确定方法,其特征在于,在所述数据处理层中应用全局注意力机制,以使得到的预测结果包含对应输入数据的全局信息。
5.根据权利要求1至4任一项所述的实体属性信息确定方法,其特征在于,所述对所述目标文本数据进行实体提取处理,得到多个目标作用实体,包括:
6.根据权利要求5所述的实体属性信息确定方法,其特征在于,所述目标文本数据包括若干目标语句文本,同一目标语句文本中包括至少两个语义相同的目标
7.根据权利要求6所述的实体属性信息确定方法,其特征在于,所述将所述输入数据输入预设模型中,以使所述预设模型针对每一所述目标作用实体,对所述目标作用实体的输入数据进行属性分类处理,得到所述目标作用实体的属性信息,包括:
8.一种实体属性信息确定装置,其特征在于,所述实体属性信息确定装置包括:
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的实体属性信息确定方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的实体属性信息确定方法。
...【技术特征摘要】
1.一种实体属性信息确定方法,其特征在于,所述实体属性信息确定方法包括:
2.如权利要求1所述的实体属性信息确定方法,其特征在于,所述基于各所述目标作用实体,以及所述目标作用实体所属语句,构建各所述目标作用实体对应的输入数据,包括:
3.根据权利要求2所述的实体属性信息确定方法,其特征在于,所述预设模型至少包括输入层,数据处理层、全连接层和输出层,所述将所述输入数据输入预设模型中,以使所述预设模型针对每一所述目标作用实体,对所述目标作用实体的输入数据进行属性分类处理,得到所述目标作用实体的属性信息,包括:
4.根据权利要求3所述的实体属性信息确定方法,其特征在于,在所述数据处理层中应用全局注意力机制,以使得到的预测结果包含对应输入数据的全局信息。
5.根据权利要求1至4任一项所述的实体属性信息确定方法,其特征在于,所述对所述目标文本数据进行实体提取处理,得到多个目标作用实体,包括:
6.根据权利要求5所述的实体属性信...
【专利技术属性】
技术研发人员:吴俊江,马源,李文昊,
申请(专利权)人:智慧眼科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。