【技术实现步骤摘要】
基于神经网络生成模型的诗词生成质量的优化方法及系统
本专利技术涉及自然语言处理领域,尤其涉及一种基于神经网络生成模型的诗词生成质量的优化方法及系统。
技术介绍
自然语言生成是自然语言处理的重要内容,它广泛应用于自动翻译、摘要提取、新闻撰写、阅读理解、智能聊天机器人等领域。比如在中英文本翻译中,对模型输入“这个多少钱”,模型会输出“howmuchisit”。在自然语言生成的技术上,业界普遍使用的算法框架是“编码-解码”(encode-decode)框架,例如有“seq2seq-attention”、“tansformer”等。这些算法能够有效的学习到输入文本的特征,并巧妙的利用这些特征组织输出文本。从而也可以将这些算法框架应用到古诗词生成中。在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:对于生成汉语古诗词,现有模型虽然能够学到一部分诗词风格的文字组合方式以及格律韵脚,但是从整体上看远远不能满足用户的审美需求,大多数生成诗词与现存诗词在平仄和押韵美感上差距较大。这是因为诗词内的每个字都是遵循诗词格律并且上下句直接还存在着押韵关系。现有的模型难以完整的学习到诗词内在的平仄规律,也难以建立上下句中的押韵联系,从而使得生成的古诗语句难以满足用户的审美需求。
技术实现思路
为了至少解决现有技术中难以完整的学习到诗词内在的平仄规律,也难以建立上下句中的押韵联系,从而使得生成的古诗语句难以满足用户的审美需求的问题。第一方面,本专利技术实施例提供一种基于神经网络生 ...
【技术保护点】
1.一种基于神经网络生成模型的诗词生成质量的优化方法,包括:/n构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;/n将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;/n将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;/n在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;/n根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。/n
【技术特征摘要】
1.一种基于神经网络生成模型的诗词生成质量的优化方法,包括:
构建基于encoder-decoder框架的神经网络生成模型,所述神经网络生成模型包括encoder-编码层以及decoder-解码层;
将诗词训练数据集中的诗词上句作为初始语句,将与所述诗词上句对应的诗词下句作为目标语句,其中,所述诗词训练数据集带有每个字的平仄信息;
将所述初始语句、所述初始语句中每个字的字符向量以及平仄信息作为所述生成模型编码层的输入;
在所述解码层中添加预测字符向量任务以及平仄信息预测任务,根据对应的用于生成诗词的数据库,在所述解码层输出与所述初始语句对应的字符预测以及平仄预测;
根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练,以将任务训练后的字符预测以及平仄预测确定的目标语句预测趋近所述目标语句,使所述神经网络生成模型融合诗词平仄规律的特性。
2.根据权利要求1所述的方法,其中,所述用于生成诗词的数据库包括:
确定押韵规则的格律形式数据库、确定平仄规律的诗词数据库、用于诗词生成的平声字库、仄声字库、既属于平又属于仄的字库、平水韵字库、字符库;
所述平仄信息包括:平声、仄声、既属于平声又属于仄声、无法确定平仄声。
3.根据权利要求2所述的方法,其中,所述字符预测包括:字符库中每个字符预测的概率集合Ot1,每个字符预测的标注集合Lt1;
所述平仄预测包括:平仄信息预测的概率集合Ot2,平仄信息的预测标注Lt2;
所述根据所述字符预测以及平仄预测对所述预测字符向量任务以及平仄信息预测任务进行反向传播训练包括:
根据所述目标语句预测的概率集合Ot1以及每个字符预测的标注集合Lt1对所述预测字符向量任务进行交叉熵训练;
根据所述平仄信息预测的概率集合Ot2以及平仄信息的预测标注Lt2对所述平仄信息预测任务进行条件随机场训练。
4.根据权利要求3所述的方法,其中,
所述字符预测以及平仄预测确定的目标语句预测包括:
将所述平仄信息预测的概率集合Ot2中各平仄信息的预测概率平摊到所述字符库内对应的各字符中,确定出所述字符库中每个字符预测的平仄信息概率集合;
将所述平仄信息概率集合与所述字符库中每个字符预测的概率集合Ot1相叠加,确定出目标语句预测的概率集合Ot3。
5.根据权利要求1所述的方法,其中,所述初始语句以及目标语句都为诗词语句的倒叙,用于优先确定出句尾的字符,贴合诗词格律的押韵特性;
在所述神经网络生成模型融合诗词平仄规律的特性后,所述方法还包括:
将需要生成诗词的句首以及格律形式输入至所述神经网络生成模型;
根据所述格律形式确定需要生成的目标诗词的押韵规则;
根据所述押韵规则相对应的提升目标语句预测的概率集合中,与所述句首相押韵字的概率,用于建立诗词上下句的押韵联系;
通过所述建立押韵联系后的目标语句预测的概率集合,输出目标诗词。
6.一...
【专利技术属性】
技术研发人员:朱钦佩,吴仁守,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。