评语生成模型训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39304930 阅读:11 留言:0更新日期:2023-11-12 15:54
本发明专利技术涉及人工智能及医疗健康技术领域,公开了一种评语生成模型训练方法、装置、计算机设备及存储介质,包括:通过获取到的预训练模型和微调模型生成评语样本,并将标签标注后的评语样本作为模型训练样本进行模型训练,得到文本质量评价模型,从而根据所述文本质量评价模型对所述微调模型生成的评语文本进行评价,以根据评价结果对所述微调模型进行训练,得到评语生成模型,通过文本质量评价模型对所述微调模型生成的评语文本进行评价,实现了对评语生成模型的训练自动化,使得评语生成模型自动学习如何生成高质量文本,从而提高评语生成模型的训练效率,提高评语的准确性和实用性。性。性。

【技术实现步骤摘要】
评语生成模型训练方法、装置、计算机设备及存储介质


[0001]本专利技术涉及人工智能及医疗健康
,尤其涉及一种评语生成模型训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着社会的进步和科技的发展,人们生活水平的不断提高,医疗健康也逐渐引起了人们的重视。由于慢性疾病会收到饮食印象,对于患有慢性疾病的患者,饮食健康尤为重要。而对其饮食的评语能够更好的帮助患者了解饮食的注意事项,指导患者选择健康、科学的饮食结构、饮食习惯,从而通过合理饮食帮助患者控制疾病,达到控制病情,健康医疗的目的,同时,这些饮食的评语信息能够让医护人员反向了解患者需求,对医疗健康具有着重要意义。
[0003]通过基于文本模型训练得到的评语生成模型能够针对食物生成食物评语,帮助人们高效地分析食物评语信息,得到可用结果,是将非结构化的评语文本转化为结构数据的重要一环,但是,由于食物评语样本的样本数量匮乏、文本质量难以把控、医疗针对性较低等问题,评语生成模型的模型输出结果无法满足医疗健康的行业要求,需要人工根据模型输出结果对评语生成模型进行训练和调整,使得现有评语生成模型的训练周期长、训练效率低。

技术实现思路

[0004]本专利技术提供一种人工智能的评语生成模型训练方法、装置、计算机设备及介质,以将实现对评语生成模型的训练自动化,提高评语生成模型的训练效率。
[0005]第一方面,提供了一种评语生成模型训练方法,包括:
[0006]获取预训练模型和微调模型,其中,所述微调模型通过预设评语语料对所述预训练模型进行模型微调得到;
[0007]通过所述预训练模型和/或所述微调模型生成评语样本,并根据所述评语样本的文本质量对所述评语样本标注标签,以将标签标注后的评语样本作为模型训练样本对预设的神经网络模型进行模型训练,得到文本质量评价模型;
[0008]根据所述文本质量评价模型对所述微调模型生成的评语文本进行评价,以根据评价结果对所述微调模型进行训练,并将训练完成的微调模型确定为评语生成模型。
[0009]第二方面,提供了一种评语生成模型训练装置,包括:
[0010]获取模块,用于获取预训练模型和微调模型,其中,所述微调模型通过预设评语语料对所述预训练模型进行模型微调得到;
[0011]第一训练模块,用于通过所述预训练模型和/或所述微调模型生成评语样本,并根据所述评语样本的文本质量对所述评语样本标注标签,以将标签标注后的评语样本作为模型训练样本对预设的神经网络模型进行模型训练,得到文本质量评价模型;
[0012]第二训练模块,用于根据所述文本质量评价模型对所述微调模型生成的评语文本
进行评价,以根据评价结果对所述微调模型进行训练,并将训练完成的微调模型确定为评语生成模型。
[0013]第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述评语生成模型训练方法的步骤。
[0014]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述评语生成模型训练方法的步骤。
[0015]上述评语生成模型训练方法、装置、计算机设备及存储介质所实现的方案中,通过获取到的预训练模型和微调模型生成评语样本,并将标签标注后的评语样本作为模型训练样本进行模型训练,得到文本质量评价模型,从而根据所述文本质量评价模型对所述微调模型生成的评语文本进行评价,以根据评价结果对所述微调模型进行训练,得到评语生成模型。这样,通过文本质量评价模型对所述微调模型生成的评语文本进行评价,实现了对评语生成模型的训练自动化,使得评语生成模型自动学习如何生成高质量文本,从而提高评语生成模型的训练效率,提高评语的准确性和实用性。
附图说明
[0016]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本专利技术一实施例中评语生成模型训练方法的一应用环境示意图;
[0018]图2是本专利技术一实施例中评语生成模型训练方法的一流程示意图;
[0019]图3是本专利技术一实施例中步骤S10的一具体实施方式流程示意图;
[0020]图4是本专利技术一实施例中步骤S20的一具体实施方式流程示意图;
[0021]图5是本专利技术一实施例中步骤S30的一具体实施方式流程示意图;
[0022]图6是本专利技术另一实施例中评语生成模型训练方法的一流程示意图;
[0023]图7是本专利技术一实施例中评语生成模型训练装置的一结构示意图;
[0024]图8是本专利技术一实施例中计算机设备的一结构示意图;
[0025]图9是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]对本专利技术实施例进行进一步详细说明之前,对本专利技术实施例中涉及的名词和术语进行说明,本专利技术实施例中涉及的名词和术语适用于如下的解释。
[0028]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理
论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0029]神经网络(Neural Network,NN):人工神经网络(Artificial Neural Network,ANN),简称神经网络或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。
[0030]机器学习(ML,Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评语生成模型训练方法,其特征在于,包括:获取预训练模型和微调模型,其中,所述微调模型通过预设评语语料对所述预训练模型进行模型微调得到;通过所述预训练模型和/或所述微调模型生成评语样本,并根据所述评语样本的文本质量对所述评语样本标注标签,以将标签标注后的评语样本作为模型训练样本对预设的神经网络模型进行模型训练,得到文本质量评价模型;根据所述文本质量评价模型对所述微调模型生成的评语文本进行评价,以根据评价结果对所述微调模型进行训练,并将训练完成的微调模型确定为评语生成模型。2.根据权利要求1所述的方法,其特征在于,获取预训练模型和微调模型,包括:获取基础语言模型;根据预设的文本数据集对所述基础语言模型进行预训练,得到预训练模型,其中,所述文本数据集包括无标签文本数据样本;根据预设评语语料对所述预训练模型进行模型微调,得到微调模型。3.根据权利要求2所述的方法,其特征在于,根据预设评语语料对所述预训练模型进行模型微调,得到微调模型,包括:预先设置多个语料类型,其中,所述语料类型包括语言风格类型和/或点评对象类型;根据各所述语料类型对预设评语语料进行分类,得到各所述语料类型分别对应的分类评语语料;根据各所述分类评语语料分别对所述预训练模型进行模型微调,得到各所述语料类型分别对应的微调模型。4.根据权利要求2所述的方法,其特征在于,通过所述预训练模型和/或所述微调模型生成评语样本,包括:获取提示符样本;将所述提示符样本分别输入所述预训练模型和所述微调模型,并将所述预训练模型的输出结果、所述微调模型的输出结果分别作为评语样本。5.根据权利要求4所述的方法,其特征在于,通过以下方法将标签标注后的评语样本作为模型训练样本对预设的神经网络模型进行模型训练,得到文本质量评价模型:预先设置样本数量阈值,并将标签标注后的评语样本作为模型训练样本;若所述模型训练样本的数量大于或等于所述样本数量阈值,则根据所述模型训练样本对预设的神经网络模型进行模型训练,得到文本质量评价模型,其中,所述文本质量评价模型用于从所述评语文本中提取文本特征,并根据所述文本特征生成评价结果。6.根据权利要求1至5任一项所述的方法,其特征在于,根据所述文本质量评价模型对所述微调模型生成的评语文本进行评价,以根据评价...

【专利技术属性】
技术研发人员:陈思玥周晓峰李松岭王科强倪渊
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1