【技术实现步骤摘要】
训练属性预测模型的方法、属性预测方法和装置
本公开涉及人工智能
,尤其涉及深度学习、自然语言处理等领域,更具体地,涉及一种训练属性预测模型的方法、属性预测方法、训练属性预测模型的装置、属性预测装置、电子设备、介质和程序产品。
技术介绍
文本对象的属性对于了解文本对象具有重要作用。以文本对象为医疗实体信息为例,医疗实体信息例如包括疾病名称、症状名称等等。例如疾病名称为“肠胃炎”,该“肠胃炎”的属性例如包括“消化系统”。相关技术为了得到文本对象的属性,在一方面通常通过人工进行判断,但是人工判断的方法效率低、成本高;在另一方面通过属性预测模型来自动预测文本对象的属性,但是相关技术的属性预测模型的预测准确性较低。
技术实现思路
本公开提供了一种训练属性预测模型的方法、属性预测方法、装置、电子设备以及存储介质。根据本公开的一方面,提供了一种训练属性预测模型的方法,包括:获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性;利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象之间的关联关系;利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果;基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。根据本 ...
【技术保护点】
1.一种训练属性预测模型的方法,包括:/n获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性;/n利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象之间的关联关系;/n利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果;以及/n基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。/n
【技术特征摘要】
1.一种训练属性预测模型的方法,包括:
获取多个文本对象,所述多个文本对象中的每个文本对象具有文本信息、关联信息以及标签,所述关联信息指示所述文本对象和参考对象之间的关联,所述标签指示所述文本对象的至少一个属性;
利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据,其中,所述特征数据表征所述文本对象的属性、所述参考对象的属性以及所述文本对象和所述参考对象之间的关联关系;
利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果;以及
基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数,以得到经训练的属性预测模型。
2.根据权利要求1所述的方法,其中,所述利用所述属性预测模型处理每个文本对象,得到针对每个文本对象的特征数据包括:
利用所述属性预测模型处理所述文本对象的文本信息,得到针对所述文本对象的第一特征数据,其中,所述第一特征数据表征所述文本对象的属性;以及
利用所述属性预测模型处理所述文本对象的关联信息,得到针对所述文本对象的第二特征数据,其中,所述第二特征数据表征所述文本对象和所述参考对象的关联关系以及所述参考对象的属性。
3.根据权利要求2所述的方法,其中,所述文本信息包括多个字符,所述属性预测模型包括第一编码层和循环层;所述利用所述属性预测模型处理所述文本对象的文本信息,得到针对所述文本对象的第一特征数据包括:
将所述文本信息输入至所述第一编码层,以便所述第一编码层输出针对每个字符的字符向量;以及
将针对每个字符的字符向量输入至所述循环层,以便所述循环层输出针对所述文本对象的第一特征数据。
4.根据权利要求2所述的方法,其中,所述属性预测模型包括第二编码层和卷积层;所述利用所述属性预测模型处理所述文本对象的关联信息,得到针对所述文本对象的第二特征数据包括:
将所述关联信息输入至所述第二编码层,以便所述第二编码层输出所述文本对象的初始向量和所述参考对象的初始向量;以及
将所述文本对象的初始向量和所述参考对象的初始向量输入至所述卷积层,以便所述卷积层输出针对所述文本对象的第二特征数据。
5.根据权利要求4所述的方法,其中,所述参考对象包括第一类型的对象和第二类型的对象,所述文本对象属于第一类型的对象;所述将所述文本对象的初始向量和所述参考对象的初始向量输入至所述卷积层,以便所述卷积层输出针对所述文本对象的第二特征数据包括:
从所述第二类型的对象中确定与所述文本对象直接关联的至少一个第二类型的对象;
针对所述至少一个第二类型的对象中的每个第二类型的对象,从所述第一类型的对象中确定与所述第二类型的对象直接关联的至少一个第一类型的对象;
基于所述至少一个第一类型的对象的初始向量和所述第二类型的对象的初始向量,确定所述第二类型的对象的更新向量;以及
基于所述至少一个第二类型的对象的更新向量和所述文本对象的初始向量,确定所述文本向量的更新向量作为所述第二特征数据。
6.根据权利要求2所述的方法,其中,所述标签包括第一属性值和第二属性值,所述第一属性值指示所述文本对象的属性包括第一属性,所述第二属性值指示所述文本对象的属性不包括第二属性;所述属性预测结果包括与第一属性对应的概率值和与第二属性对应的概率值;
其中,所述基于所述属性预测结果和所述文本对象的标签,调整属性预测模型的模型参数包括:
基于与第一属性对应的概率值和所述第一属性值,确定第一损失值;
基于与第二属性对应的概率值和所述第二属性值,确定第二损失值;以及
基于所述第一损失值和所述第二损失值,调整属性预测模型的模型参数。
7.根据权利要求2所述的方法,其中,所述属性预测模型包括全连接层;所述利用所述属性预测模型处理所述特征数据,得到针对所述文本对象的属性预测结果包括:
将所述第一特征数据和所述第二特征数据进行组合,得到目标特征数据;以及
将所述目标特征数据输入至所述全连接层,以便所述全连接层输出针对所述文本对象的属性预测结果。
8.根据权利要求1-7中任意一项所述的方法,其中,所述参考对象包括多个参考对象;
所述关联信息包括:所述文本对象的编码信息和邻接矩阵;
所述邻接矩阵表征了所述文本对象和所述每个参考对象之间的关联关系以及所述多个参考对象中任意两个之间的关联关系。
9.根据权利要求1-7中任意一项所述的方法,其中,所述属性预测模型包括第一编码层、第二编码层、循环层、卷积层和全连接层中的至少一层;
其中,所述调整属性预测模型的模型参数包括:调整第一编码层、第二编码层、循环层、卷积层和全连接层中的至少...
【专利技术属性】
技术研发人员:陈俊,陆超,黄海峰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。