本发明专利技术实施例提供一种文本内容的评价方法、装置、电子设备及存储介质,该方法包括:获取待评价文本;将所述待评价文本输入融合评价模型中,得到至少两个文本评价维度的评价结果,其中,所述融合评价模型为基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练后得到的,所述至少两个目标评价结果为将各所述第一文本样本输入至少两类内容评价模型中得到。本发明专利技术实施例提供的文本内容的评价方法、装置、电子设备及存储介质可以提高融合评价模型的准确性,进而可以提高文本评价结果的精确度。文本评价结果的精确度。文本评价结果的精确度。
【技术实现步骤摘要】
文本内容的评价方法、装置、电子设备及存储介质
[0001]本专利技术涉及文本处理
,尤其涉及一种文本内容的评价方法、装置、电子设备及存储介质。
技术介绍
[0002]在某些应用领域,需要对文本进行评价,比如,在教育领域,通常需要对学生的作文进行评分等。由于在批改学生作文时,评价人员可能会关注多个文本评价维度,比如需要找出作文中的拼写错误及语法错误、识别亮点句式以及细节描写手法等相关内容。
[0003]为了实现上述目的,现有技术中通常会将多个文本评价任务各自对应的训练数据随机打乱,并输入至融合评价模型中,以训练出具备多任务文本评价能力的模型,从而实现对文本进行自动评价的目的,其中,不同的文本评价任务对应不同的评价维度。
[0004]然而,在上述文本评价过程中,不同文本评价任务的训练数据的样本量往往也不一样,这会导致融合评价模型在进行文本评价时,会过于关注训练数据的样本量多的任务,而忽略了训练数据的样本量少的任务,从而降低了融合评价模型的准确性,使得文本评价的结果不够精确。
技术实现思路
[0005]本专利技术提供一种文本内容的评价方法、装置、电子设备及存储介质,用以解决现有技术中由于不同任务的训练数据的样本量不一致而导致的融合评价模型的准确性不高,使得文本评价结果不够精确的缺陷,实现了提高融合评价模型的准确性,进而提高文本评价结果的精确度的目的。
[0006]本专利技术提供一种文本内容的评价方法,包括:
[0007]获取待评价文本;
[0008]将所述待评价文本输入融合评价模型中,得到至少两个文本评价维度的评价结果,其中,所述融合评价模型为基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练后得到的,所述至少两个目标评价结果为将各所述第一文本样本输入至少两类内容评价模型中得到。
[0009]根据本专利技术提供的一种文本内容的评价方法,所述将所述待评价文本输入融合评价模型中,得到至少两个文本评价维度的评价结果,包括:
[0010]将所述待评价文本输入所述融合评价模型中,得到所述待评价文本中各个元素的位置标记和至少两个文本评价维度的目标预测评价结果;
[0011]基于所述待评价文本中各个元素的位置标记和至少两个文本评价维度的目标预测评价结果,确定所述待评价文本在至少两个文本评价维度的评价结果。
[0012]根据本专利技术提供的一种文本内容的评价方法,所述基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练,得到所述融合评价模型,包括:
[0013]将所述第一文本样本输入所述初始融合评价模型中,得到所述第一文本样本的标注序列,所述标注序列中包括所述第一文本样本中各个元素的位置标记和至少两个文本评价维度的第一预测评价结果;
[0014]将所述第一文本样本对应的至少两个目标评价结果作为所述第一文本样本的标签信息,并基于所述第一文本样本的标签信息和对应的标注序列,对所述初始融合评价模型进行迭代训练,得到所述融合评价模型。
[0015]根据本专利技术提供的一种文本内容的评价方法,所述基于所述第一文本样本的标签信息和对应的标注序列,对所述初始融合评价模型进行迭代训练,得到所述融合评价模型,包括:
[0016]基于所述第一文本样本中各个元素的位置标记和至少两个文本评价维度的第一预测评价结果,确定所述第一文本样本的第二预测评价结果;
[0017]基于所述第一文本样本的标签信息和第二预测评价结果,确定所述第一文本样本的损失信息;
[0018]基于所述第一文本样本的损失信息,对所述初始融合评价模型进行迭代训练,得到所述融合评价模型。
[0019]根据本专利技术提供的一种文本内容的评价方法,各类所述内容评价模型中包括至少两个目标内容评价模型;
[0020]所述第一文本样本对应的至少两个目标评价结果为基于如下方式得到:
[0021]针对各类内容评价模型,将所述第一文本样本分别输入所述内容评价模型对应的至少两个目标内容评价模型中,得到所述第一文本样本对应的至少两个初始评价结果;
[0022]基于所述第一文本样本对应的至少两个初始评价结果,确定所述第一文本样本对应的所述目标评价结果。
[0023]根据本专利技术提供的一种文本内容的评价方法,所述目标内容评价模型的数量为至少三个;
[0024]所述基于所述第一文本样本对应的至少两个初始评价结果,确定所述第一文本样本对应的所述目标评价结果,包括:
[0025]将所述第一文本样本对应的至少三个初始评价结果中,占比最高的初始评价结果,确定为所述第一文本样本对应的所述目标评价结果。
[0026]根据本专利技术提供的一种文本内容的评价方法,所述方法还包括:
[0027]获取多个有标注信息的第二文本样本,每个所述第二文本样本的标注信息为基于目标文本评价维度对所述第二文本样本进行评价后得到的,所述目标文本评价维度为所述至少两个文本评价维度中的任意一个;
[0028]基于各所述第二文本样本和对应的所述标注信息,对初始内容评价模型进行迭代训练,得到与所述目标文本评价维度对应的内容评价模型。
[0029]本专利技术还提供一种文本内容的评价装置,包括:
[0030]获取模块,用于获取待评价文本;
[0031]输入模块,用于将所述待评价文本输入融合评价模型中,得到至少两个文本评价维度的评价结果,其中,所述融合评价模型为基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练后得
到的,所述至少两个目标评价结果为将各所述第一文本样本输入至少两类内容评价模型中得到。
[0032]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文本内容的评价方法。
[0033]本专利技术还提供一种电子设备,包括显示屏,还包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序中的融合评价模型,对待评价文本进行处理,得到至少两个文本评价维度的评价结果;
[0034]所述显示屏用于显示所述评价结果;
[0035]其中,所述融合评价模型为基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练后得到的,所述至少两个目标评价结果为将各所述第一文本样本输入至少两类内容评价模型中得到的。
[0036]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文本内容的评价方法。
[0037]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述文本内容的评价方法。
[0038]本本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文本内容的评价方法,其特征在于,包括:获取待评价文本;将所述待评价文本输入融合评价模型中,得到至少两个文本评价维度的评价结果,其中,所述融合评价模型为基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练后得到的,所述至少两个目标评价结果为将各所述第一文本样本输入至少两类内容评价模型中得到的。2.根据权利要求1所述的文本内容的评价方法,其特征在于,所述将所述待评价文本输入融合评价模型中,得到至少两个文本评价维度的评价结果,包括:将所述待评价文本输入所述融合评价模型中,得到所述待评价文本中各个元素的位置标记和至少两个文本评价维度的目标预测评价结果;基于所述待评价文本中各个元素的位置标记和至少两个文本评价维度的目标预测评价结果,确定所述待评价文本在至少两个文本评价维度的评价结果。3.根据权利要求1所述的文本内容的评价方法,其特征在于,所述基于多个无标注信息的第一文本样本以及各所述第一文本样本对应的至少两个目标评价结果,对初始融合评价模型进行迭代训练,得到所述融合评价模型,包括:将所述第一文本样本输入所述初始融合评价模型中,得到所述第一文本样本的标注序列,所述标注序列中包括所述第一文本样本中各个元素的位置标记和至少两个文本评价维度的第一预测评价结果;将所述第一文本样本对应的至少两个目标评价结果作为所述第一文本样本的标签信息,并基于所述第一文本样本的标签信息和对应的标注序列,对所述初始融合评价模型进行迭代训练,得到所述融合评价模型。4.根据权利要求3所述的文本内容的评价方法,其特征在于,所述基于所述第一文本样本的标签信息和对应的标注序列,对所述初始融合评价模型进行迭代训练,得到所述融合评价模型,包括:基于所述第一文本样本中各个元素的位置标记和至少两个文本评价维度的第一预测评价结果,确定所述第一文本样本的第二预测评价结果;基于所述第一文本样本的标签信息和第二预测评价结果,确定所述第一文本样本的损失信息;基于所述第一文本样本的损失信息,对所述初始融合评价模型进行迭代训练,得到所述融合评价模型。5.根据权利要求1
‑
4任一项所述的文本内容的评价方法,其特征在于,各类所述内容评价模型中包括至少两个目标内容评价模型;所述第一文本样本对应的至少两个目标评价结果为基于如下方式得到:针对各类内容评价模型,将所述第一文本样本分别输入所述内容评价模型对应的至少两个目标内容评价模型中,得到...
【专利技术属性】
技术研发人员:郭冬杰,竺博,王士进,汪洋,盛志超,魏思,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。