本发明专利技术提供一种基于强化学习的口语书面语转换方法、装置、设备和介质,其中方法包括:获取口语文本;将所述口语文本输入到转换模型中,得到所述转换模型输出的书面文本;所述转换模型是以样本口语文本中各分词的编辑操作为动作,以所述编辑操作执行所得的样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度为奖励,强化学习得到的。本发明专利技术提供的方法、装置、设备和介质,强化学习的过程脱离了标注数据不足的限制,并且语义一致程度和书面化程度给出了高层次、可解释的奖励,应用由此得到的转换模型进行文本转换,保证了口语文本到书面文本转换的可靠性和可解释性。可靠性和可解释性。可靠性和可解释性。
【技术实现步骤摘要】
基于强化学习的口语书面语转换方法、装置、设备和介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于强化学习的口语书面语转换方法、装置、设备和介质。
技术介绍
[0002]由于人们在说话和写作时的语言应用方式存在差异,且说话时可能存在句法和语法错误、不流利的情况,以及语音录制时携带的噪声,都会对语音识别所得的口语文本的可访问性和可读性造成影响。
[0003]因此,将口语文本转换为书面文本,对于降低文本内容理解难度十分重要。而在口语到书面的文本转换的研究中,标注数据不足、可解释性差是目前重要的研究难点。
技术实现思路
[0004]本专利技术提供一种基于强化学习的口语书面语转换方法、装置、电子设备和存储介质,用以解决现有技术中文本转换标注数据不足、可解释性差的缺陷。
[0005]本专利技术提供一种基于强化学习的口语书面语转换方法,包括:
[0006]获取口语文本;
[0007]将所述口语文本输入到转换模型中,得到所述转换模型输出的书面文本;
[0008]所述转换模型是以样本口语文本中各分词的编辑操作为动作,以所述编辑操作执行所得的样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度为奖励,强化学习得到的。
[0009]根据本专利技术提供的一种基于强化学习的口语书面语转换方法,所述转换模型的获取步骤包括:
[0010]将所述样本口语文本中上一分词的编辑操作,以及所述样本口语文本分词中当前分词的语义特征,输入到策略模型中,得到所述策略模型输出的所述当前分词的编辑操作,并将所述当前分词的下一分词作为所述当前分词返回获取编辑操作,直至得到所述样本口语文本中每一分词的编辑操作;
[0011]基于所述样本口语文本中每一分词的编辑操作,确定所述样本书面文本;
[0012]基于所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所述奖励;
[0013]基于所述奖励,对所述策略模型进行强化学习,得到所述转换模型。
[0014]根据本专利技术提供的一种基于强化学习的口语书面语转换方法,所述基于所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所述奖励,包括:
[0015]基于所述样本口语文本中每一分词的编辑操作,以及所述样本口语文本的编辑标签,确定第一奖励;
[0016]基于所述第一奖励,以及所述样本书面文本与所述样本口语文本之间的语义一致
程度和/或所述样本书面文本的书面化程度,确定所述奖励。
[0017]根据本专利技术提供的一种基于强化学习的口语书面语转换方法,所述样本口语文本中各分词的语义特征的获取步骤包括:
[0018]将所述样本口语文本输入到语言模型中,得到所述语言音模型输出的所述样本口语文本中各分词的语义特征;
[0019]所述语言模型是基于对口语文本分词的编辑标签进行监督分类学习训练微调得到;或者,所述语言模型是无监督预训练语言模型。
[0020]根据本专利技术提供的一种基于强化学习的口语书面语转换方法,所述语义一致程度的获取步骤包括:
[0021]将所述样本口语文本和所述样本书面文本输入到一致程度打分模型中,得到所述一致程度打分模型输出的所述语义一致程度;
[0022]所述一致程度打分模型是基于正样本对和负样本对训练得到,所述正样本对包括语义一致的预设口语文本和预设书面文本,所述负样本对包括所述预设口语文本,以及对所述预设口语文本进行扰动所得的扰动文本。
[0023]根据本专利技术提供的一种基于强化学习的口语书面语转换方法,所述书面化程度的获取步骤包括:
[0024]将所述样本书面文本输入到书面化程度打分模型中,得到所述书面化程度打分模型输出的所述书面化程度;
[0025]所述书面化程度打分模型是基于预设口语文本和预设书面文本进行训练得到的分类模型。
[0026]本专利技术还提供一种基于强化学习的口语书面语转换装置,包括:
[0027]获取单元,用于获取口语文本;
[0028]转换单元,用于将所述口语文本输入到转换模型中,得到所述转换模型输出的书面文本;
[0029]所述转换模型是以样本口语文本中各分词的编辑操作为动作,以所述编辑操作执行所得的样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度为奖励,强化学习得到的。
[0030]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于强化学习的口语书面语转换方法。
[0031]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于强化学习的口语书面语转换方法。
[0032]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于强化学习的口语书面语转换方法。
[0033]本专利技术提供的基于强化学习的口语书面语转换方法、装置、设备和介质,以样本口语文本中各分词的编辑操作为动作,以编辑操作执行所得的样本书面文本与样本口语文本之间的语义一致程度和/或样本书面文本的书面化程度为奖励,进行强化学习以获取转换模型,强化学习的过程脱离了标注数据不足的限制,并且语义一致程度和书面化程度给出了高层次、可解释的奖励,应用由此得到的转换模型进行文本转换,保证了口语文本到书面
文本转换的可靠性和可解释性。
附图说明
[0034]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0035]图1是本专利技术提供的基于强化学习的口语书面语转换方法的流程示意图;
[0036]图2是本专利技术提供的转换模型的获取方法的流程示意图;
[0037]图3是本专利技术提供的强化学习示意图;
[0038]图4是本专利技术提供的基于强化学习的口语书面语转换装置的结构示意图;
[0039]图5是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0040]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0041]在口语到书面的文本转换的研究中,标注数据不足、可解释性差是目前重要的研究难点。针对这一问题,本专利技术提供一种基于强化学习的口语书面语转换方法。图1是本专利技术提供的基于强化学习的口本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的口语书面语转换方法,其特征在于,包括:获取口语文本;将所述口语文本输入到转换模型中,得到所述转换模型输出的书面文本;所述转换模型是以样本口语文本中各分词的编辑操作为动作,以所述编辑操作执行所得的样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度为奖励,强化学习得到的。2.根据权利要求1所述的基于强化学习的口语书面语转换方法,其特征在于,所述转换模型的获取步骤包括:将所述样本口语文本中上一分词的编辑操作,以及所述样本口语文本分词中当前分词的语义特征,输入到策略模型中,得到所述策略模型输出的所述当前分词的编辑操作,并将所述当前分词的下一分词作为所述当前分词返回获取编辑操作,直至得到所述样本口语文本中每一分词的编辑操作;基于所述样本口语文本中每一分词的编辑操作,确定所述样本书面文本;基于所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所述奖励;基于所述奖励,对所述策略模型进行强化学习,得到所述转换模型。3.根据权利要求2所述的基于强化学习的口语书面语转换方法,其特征在于,所述基于所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所述奖励,包括:基于所述样本口语文本中每一分词的编辑操作,以及所述样本口语文本的编辑标签,确定第一奖励;基于所述第一奖励,以及所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所5述奖励。4.根据权利要求2所述的基于强化学习的口语书面语转换方法,其特征在于,所述样本口语文本中各分词的语义特征的获取步骤包括:将所述样本口语文本输入到语言模型中,得到所述语音模型输出的所述样本口语文本中各分词的语义特征;0所述语言模型是基于对预设口语文本中各分词的编辑标签进行监督分类学习训练微调得到;或者,所...
【专利技术属性】
技术研发人员:赵云龙,徐爽,徐波,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。