训练属性预测模型的方法、属性预测方法和装置制造方法及图纸

技术编号:27742181 阅读:21 留言:0更新日期:2021-03-19 13:35
本公开公开了一种训练属性预测模型的方法、属性预测方法、装置、设备、介质和产品,涉及人工智能领域,尤其涉及深度学习、自然语言处理等领域。训练属性预测模型的方法包括:获取多个文本对象,每个文本对象具有文本信息、关联信息以及标签,关联信息指示文本对象和参考对象之间的关联,标签指示文本对象的至少一个属性;利用属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,特征数据表征文本对象的属性、参考对象的属性以及文本对象和参考对象之间的关联关系;利用属性预测模型处理特征数据,得到针对文本对象的属性预测结果;基于属性预测结果和文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。

【技术实现步骤摘要】
训练属性预测模型的方法、属性预测方法和装置
本公开涉及人工智能
,尤其涉及深度学习、自然语言处理等领域,更具体地,涉及一种训练属性预测模型的方法、属性预测方法、训练属性预测模型的装置、属性预测装置、电子设备、介质和程序产品。
技术介绍
文本对象的属性对于了解文本对象具有重要作用。以文本对象为医疗实体信息为例,医疗实体信息例如包括疾病名称、症状名称等等。例如疾病名称为“肠胃炎”,该“肠胃炎”的属性例如包括“消化系统”。相关技术为了得到文本对象的属性,在一方面通常通过人工进行判断,但是人工判断的方法效率低、成本高;在另一方面通过属性预测模型来自动预测文本对象的属性,但是相关技术的属性预测模型的预测准确性较低。
技术实现思路
本公开提供了一种训练属性预测模型的方法、属性预测方法、装置、电子设备以及存储介质。根据本公开的一方面,提供了一种训练属性预测模型的方法,包括:获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性;利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象之间的关联关系;利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果;基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。根据本公开的另一方面,提供了一种训练属性预测模型的方法,包括:获取多个文本对象,其中,所述多个文本对象包括第一文本对象和第二文本对象,所述第一文本对象具有文本信息和第一标签,所述第一标签指示所述第一文本对象的至少一个属性,所述第二文本对象具有所述文本信息和第二标签,所述第二标签指示所述第二文本对象的至少一个属性,所述第二标签是基于所述第一文本对象的属性预测结果得到的,所述属性预测结果是上述属性预测模型对所述第一文本对象进行预测得到的;处理每个文本对象的文本信息,得到针对所述文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性;处理所述特征数据,得到针对所述文本对象的属性预测结果;基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。根据本公开的另一面,提供了一种属性预测方法,包括:获取待预测文本对象,利用具有关联信息的文本对象训练得到的属性预测模型对所述待预测文本对象进行预测,以得到针对所述待预测文本对象的属性预测结果。根据本公开的另一方面,提供了一种属性预测方法,包括:获取待预测文本对象,在所述待预测文本对象具有关联信息的情况下,利用具有关联信息的文本对象训练得到的属性预测模型对所述待预测文本对象进行预测,以得到针对所述待预测文本对象的属性预测结果。在所述待预测文本对象不具有关联信息的情况下,利用不具有关联信息的第一文本对象和第二文本对象训练得到的属性预测模型对所述待预测文本对象进行预测,以得到针对所述待预测文本对象的属性预测结果。根据本公开的另一方面,提供了一种训练属性预测模型的装置,包括:第一获取模块、第一处理模块、第二处理模块以及第一调整模块。其中,第一获取模块用于获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性。第一处理模块用于处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象的关联关系。第二处理模块,用于处理所述特征数据,得到针对所述文本对象的属性预测结果。第一调整模块用于基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。根据本公开的另一方面,提供了一种训练属性预测模型的装置,包括:第二获取模块、第三处理模块、第四处理模块以及第二调整模块。其中,第二获取模块用于获取多个文本对象,其中,所述多个文本对象包括第一文本对象和第二文本对象,所述第一文本对象具有文本信息和第一标签,所述第一标签指示所述第一文本对象的至少一个属性,所述第二文本对象具有所述文本信息和第二标签,所述第二标签指示所述第二文本对象的至少一个属性,所述第二标签是基于所述第一文本对象的属性预测结果得到的,所述属性预测结果是利用具有关联信息的文本对象进行训练得到的属性预测模型对所述第一文本对象进行预测得到的。第三处理模块用于处理每个文本对象的文本信息,得到针对所述文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性。第四处理模块用于处理所述特征数据,得到针对所述文本对象的属性预测结果。第二调整模块基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的训练属性预测模型的方法。根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的属性预测方法。根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的训练属性预测模型的方法。根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的属性预测方法。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述的训练属性预测模型的方法。根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述的属性预测方法。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本公开的限定。其中:图1示意性示出了根据本公开一实施例的训练属性预测模型和属性预测的方法的应用场景;图2示意性示出了根据本公开一实施例的训练属性预测模型的方法的流程图;图3示意性示出了根据本公开一实施例的训练属性预测模型的方法的原理图;图4A~图4C示意性示出了根据本公开一实施例的关联关系的示意图;图5示意性示出了根据本公开另一实施例的训练属性预测模型的方法的原理图;图6示意性示出了根据本公开一实施例的第二特征数据的计算示意图;图本文档来自技高网...

【技术保护点】
1.一种训练属性预测模型的方法,包括:/n获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性;/n利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象之间的关联关系;/n利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果;以及/n基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。/n

【技术特征摘要】
1.一种训练属性预测模型的方法,包括:
获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性;
利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象之间的关联关系;
利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果;以及
基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。


2.根据权利要求1所述的方法,其中,所述利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据包括:
利用所述属性预测模型处理所述文本对象的文本信息,得到针对所述文本对象的第一特征数据,其中,所述第一特征数据表征所述文本对象的属性;以及
利用所述属性预测模型处理所述文本对象的关联信息,得到针对所述文本对象的第二特征数据,其中,所述第二特征数据表征所述文本对象和所述参考对象的关联关系以及所述参考对象的属性。


3.根据权利要求2所述的方法,其中,所述文本信息包括多个字符,所述属性预测模型包括第一编码层和循环层;所述利用所述属性预测模型处理所述文本对象的文本信息,得到针对所述文本对象的第一特征数据包括:
将所述文本信息输入至所述第一编码层,以便所述第一编码层输出针对每个字符的字符向量;以及
将针对每个字符的字符向量输入至所述循环层,以便所述循环层输出针对所述文本对象的第一特征数据。


4.根据权利要求2所述的方法,其中,所述属性预测模型包括第二编码层和卷积层;所述利用所述属性预测模型处理所述文本对象的关联信息,得到针对所述文本对象的第二特征数据包括:
将所述关联信息输入至所述第二编码层,以便所述第二编码层输出所述文本对象的初始向量和所述参考对象的初始向量;以及
将所述文本对象的初始向量和所述参考对象的初始向量输入至所述卷积层,以便所述卷积层输出针对所述文本对象的第二特征数据。


5.根据权利要求4所述的方法,其中,所述参考对象包括第一类型的对象和第二类型的对象,所述文本对象属于第一类型的对象;所述将所述文本对象的初始向量和所述参考对象的初始向量输入至所述卷积层,以便所述卷积层输出针对所述文本对象的第二特征数据包括:
从所述第二类型的对象中确定与所述文本对象直接关联的至少一个第二类型的对象;
针对所述至少一个第二类型的对象中的每个第二类型的对象,从所述第一类型的对象中确定与所述第二类型的对象直接关联的至少一个第一类型的对象;
基于所述至少一个第一类型的对象的初始向量和所述第二类型的对象的初始向量,确定所述第二类型的对象的更新向量;以及
基于所述至少一个第二类型的对象的更新向量和所述文本对象的初始向量,确定所述文本向量的更新向量作为所述第二特征数据。


6.根据权利要求2所述的方法,其中,所述标签包括第一属性值和第二属性值,所述第一属性值指示所述文本对象的属性包括第一属性,所述第二属性值指示所述文本对象的属性不包括第二属性;所述属性预测结果包括与第一属性对应的概率值和与第二属性对应的概率值;
其中,所述基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数包括:
基于与第一属性对应的概率值和所述第一属性值,确定第一损失值;
基于与第二属性对应的概率值和所述第二属性值,确定第二损失值;以及
基于所述第一损失值和所述第二损失值,调整属性预测模型的模型参数。


7.根据权利要求2所述的方法,其中,所述属性预测模型包括全连接层;所述利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果包括:
将所述第一特征数据和所述第二特征数据进行组合,得到目标特征数据;以及
将所述目标特征数据输入至所述全连接层,以便所述全连接层输出针对所述文本对象的属性预测结果。


8.根据权利要求1-7中任意一项所述的方法,其中,所述参考对象包括多个参考对象;
所述关联信息包括:所述文本对象的编码信息和邻接矩阵;
所述邻接矩阵表征了所述文本对象和所述每个参考对象之间的关联关系以及所述多个参考对象中任意两个之间的关联关系。


9.根据权利要求1-7中任意一项所述的方法,其中,所述属性预测模型包括第一编码层、第二编码层、循环层、卷积层和全连接层中的至少一层;
其中,所述调整属性预测模型的模型参数包括:调整第一编码层、第二编码层、循环层、卷积层和全连接层中的至少...

【专利技术属性】
技术研发人员:陈俊陆超黄海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1