基于神经网络生成模型的诗词生成质量的优化方法及系统技术方案

技术编号:23149926 阅读:32 留言:0更新日期:2020-01-18 13:47
本发明专利技术实施例提供一种基于神经网络生成模型的诗词生成质量的优化方法。该方法包括:构建基于encoder‑decoder框架的神经网络生成模型;将诗词训练数据集中的诗词上句作为初始语句,将与诗词上句对应的诗词下句作为目标语句;将初始语句、初始语句的字符向量和平仄信息作为生成模型编码层的输入;在解码层中添加预测字符向量任务和平仄信息预测任务,在解码层输出与初始语句对应的字符预测和平仄预测;通过反向传播训练,使神经网络生成模型融合诗词平仄规律的特性。本发明专利技术实施例还提供一种基于神经网络生成模型的诗词生成质量的优化系统。本发明专利技术使模型融入诗词平仄规律的特性,输出符合平仄规律的诗句,以及诗句的押韵,提升了输出诗词的质量。

The optimization method and system of Poetry Quality Based on neural network generation model

【技术实现步骤摘要】
基于神经网络生成模型的诗词生成质量的优化方法及系统
本专利技术涉及自然语言处理领域,尤其涉及一种基于神经网络生成模型的诗词生成质量的优化方法及系统。
技术介绍
自然语言生成是自然语言处理的重要内容,它广泛应用于自动翻译、摘要提取、新闻撰写、阅读理解、智能聊天机器人等领域。比如在中英文本翻译中,对模型输入“这个多少钱”,模型会输出“howmuchisit”。在自然语言生成的技术上,业界普遍使用的算法框架是“编码-解码”(encode-decode)框架,例如有“seq2seq-attention”、“tansformer”等。这些算法能够有效的学习到输入文本的特征,并巧妙的利用这些特征组织输出文本。从而也可以将这些算法框架应用到古诗词生成中。在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:对于生成汉语古诗词,现有模型虽然能够学到一部分诗词风格的文字组合方式以及格律韵脚,但是从整体上看远远不能满足用户的审美需求,大多数生成诗词与现存诗词在平仄和押韵美感上差距较大。这是因为诗词内的每个字都是遵循诗词格律并且上下句直接还存在着押韵关系。现有的模型难以完整的学习到诗词内在的平仄规律,也难以建立上下句中的押韵联系,从而使得生成的古诗语句难以满足用户的审美需求。
技术实现思路
为了至少解决现有技术中难以完整的学习到诗词内在的平仄规律,也难以建立上下句中的押韵联系,从而使得生成的古诗语句难以满足用户的审美需求的问题。第一方面,本专利技术实施例提供一种基于神经网络生成模型的诗词生成质量的优化方法,包括:构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。第二方面,本专利技术实施例提供一种基于神经网络生成模型的诗词生成质量的优化系统,包括:生成模型构建程序模块,用于构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;训练语句确定程序模块,用于将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;编码层输入程序模块,用于将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;解码层输出程序模块,用于在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;优化程序模块,用于根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的基于神经网络生成模型的诗词生成质量的优化方法的步骤。第四方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本专利技术任一实施例的基于神经网络生成模型的诗词生成质量的优化方法的步骤。本专利技术实施例的有益效果在于:在encoder-decoder框架的编码层的输入增加了诗词格律以及韵脚特征,在解码层融入了专门的预测格律和韵脚的任务,通过对应的训练,使得所述神经网络生成模型融合诗词平仄规律的特性,进而输出符合平仄规律的诗句,整体上提升了输出诗词的质量同时满足诗歌对字的压韵的需求。使得生成的诗句的押韵效果显著增强附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例提供的一种基于神经网络生成模型的诗词生成质量的优化方法的流程图;图2是本专利技术一实施例提供的一种基于神经网络生成模型的诗词生成质量的优化系统的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示为本专利技术一实施例提供的一种基于神经网络生成模型的诗词生成质量的优化方法的流程图,包括如下步骤:S11:构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;S12:将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;S13:将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;S14:在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;S15:根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。对于步骤S11,为了使生成模型学习到诗词内在的平仄规律以及上下句的押韵联系,重新构建基于encoder-decoder框架的神经网络生成模型。其中,所述encoder-decoder框架的特征就是一个End-to-End学习的算法;这样的模型往往用在机器翻译中,比如将法语翻译成英语。这样的模型也被叫做SequencetoSequencelearning(序列到序列学习本文档来自技高网...

【技术保护点】
1.一种基于神经网络生成模型的诗词生成质量的优化方法,包括:/n构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;/n将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;/n将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;/n在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;/n根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。/n

【技术特征摘要】
1.一种基于神经网络生成模型的诗词生成质量的优化方法,包括:
构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;
将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;
将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;
在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;
根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。


2.根据权利要求1所述的方法,其中,所述用于生成诗词的数据库包括:
确定押韵规则的格律形式数据库、确定平仄规律的诗词数据库、用于诗词生成的平声字库、仄声字库、既属于平又属于仄的字库、平水韵字库、字符库;
所述平仄信息包括:平声、仄声、既属于平声又属于仄声、无法确定平仄声。


3.根据权利要求2所述的方法,其中,所述字符预测包括:字符库中每个字符预测的概率集合Ot1,每个字符预测的标注集合Lt1;
所述平仄预测包括:平仄信息预测的概率集合Ot2,平仄信息的预测标注Lt2;
所述根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练包括:
根据所述目标语句预测的概率集合Ot1以及每个字符预测的标注集合Lt1对所述预测字符向量任务进行交叉熵训练;
根据所述平仄信息预测的概率集合Ot2以及平仄信息的预测标注Lt2对所述平仄信息预测任务进行条件随机场训练。


4.根据权利要求3所述的方法,其中,
所述字符预测以及平仄预测确定的目标语句预测包括:
将所述平仄信息预测的概率集合Ot2中各平仄信息的预测概率平摊到所述字符库内对应的各字符中,确定出所述字符库中每个字符预测的平仄信息概率集合;
将所述平仄信息概率集合与所述字符库中每个字符预测的概率集合Ot1相叠加,确定出目标语句预测的概率集合Ot3。


5.根据权利要求1所述的方法,其中,所述初始语句以及目标语句都为诗词语句的倒叙,用于优先确定出句尾的字符,贴合诗词格律的押韵特性;
在所述神经网络生成模型融合诗词平仄规律的特性后,所述方法还包括:
将需要生成诗词的句首以及格律形式输入至所述神经网络生成模型;
根据所述格律形式确定需要生成的目标诗词的押韵规则;
根据所述押韵规则相对应的提升目标语句预测的概率集合中,与所述句首相押韵字的概率,用于建立诗词上下句的押韵联系;
通过所述建立押韵联系后的目标语句预测的概率集合,输出目标诗词。


6.一...

【专利技术属性】
技术研发人员:朱钦佩吴仁守
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1