一种基于序列到序列预训练语言模型的楹联生成算法制造技术

技术编号：36380188 阅读：52 留言：0更新日期：2023-01-18 09:41

本发明专利技术公开了一种基于序列到序列预训练语言模型的楹联生成算法，包括步骤一.首先利用Transformer神经网络建立楹联模型的模型结构及损失函数，即初始化的楹联模型；步骤二.利用降噪序列到序列方法对楹联模型进行预训练，提高楹联模型的泛化性能；步骤三.再对预训练后的楹联模型在楹联数据集上进行序列到序列任务微调，得到楹联生成模型；本算法通过将楹联应对任务建模为一个序列到序列的生成问题，将楹联的上联作为输入，并能够自递归地生成出符合楹联标准要求的下联，具有楹联生成效果好、准确性高和计算快捷的特点。准确性高和计算快捷的特点。准确性高和计算快捷的特点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于序列到序列预训练语言模型的楹联生成算法

[0001]本专利技术自然语言处理
，具体涉及一种基于序列到序列预训练语言模型的楹联生成算法。

技术介绍

[0002]楹联，也称对联，是中华传统文化的独特结晶；楹联和楹联文化出现在人们生活的方方面面；作为楹联文化的活动形式之一，楹联应对是一种受到群众喜爱的游戏；其形式为，出题者给出上联，应对者根据上联给出适当的下联；要求下联与给定的上联在文字上整齐对仗、意义上对照呼应、音律讲究平仄有节奏；楹联应对在文字、意义以及音律上的要求，使楹联艺术具有形式美、意义美及声律美的审美体验的同时，也为楹联艺术在年轻人中传播，以及初学者的学习，带来了一定阻碍；如果能开发一套楹联应对的算法系统，输入上联，机器自动给出符合要求的下联，则可以帮助楹联文化的初学者、爱好者更好地学习、交流楹联文化，从而对中国的传统文化进行有效传承；
[0003]关于自动楹联生成，研究者尝试了多种方法来完成该任务。文献“张开旭，孙茂松.统计与规则相结合的古文对联应对模型[J].中文信息学报，2009”提出了一种统计与规则相结合的古文对联应对模型，该方法使用统计方法建立软规则模型，同时在候选搜索阶段通过硬规则排除不合理的解；文献“LongJiang,MingZhou.GeneratingChineseCoupletsusingaStatisticalMTApproach[J].Proceedingsofthe22ndInternationalConferenceonComputationalLinguis...

【技术保护点】

【技术特征摘要】
1.一种基于序列到序列预训练语言模型的楹联生成算法，其特征在于：包括步骤一.首先利用Transformer神经网络建立楹联模型的模型结构及损失函数；步骤二.利用降噪序列到序列方法对楹联模型进行预训练，提高楹联模型泛化性能；步骤三.对预训练后的楹联模型在楹联数据集上进行序列到序列任务微调，得到楹联生成模型。2.根据权利要求1所述的一种基于序列到序列预训练语言模型的楹联生成算法，其特征在于：步骤一所述的Transformer神经网络包括编码器和解码器，其中所述编码器和解码器各由6层Transformer组成。3.根据权利要求2所述的一种基于序列到序列预训练语言模型的楹联生成算法，其特征在于：步骤一所述的初始化的楹联模型的建立过程包括步骤S1.1在Transformer神经网络中，对输入序列X＝[x1，x2，...，x
n
]，生成对应序列Y＝[y1，y2，...，y
m
]；S1.2根据步骤S1.1的序列转换要求，基于统计的n
‑
gram语言模型计算输入序列X转化为对应输出序列Y的条件概率其中，P(y
i
|y1，...，y
i
‑1，X)由对应序列在训练数据集上出现的频数之比得到；S1.3通过Transformer神经网络的双向自注意力机制对输入序列X＝[x1，x2，...，x
n
]进行编码，得到每个位置的向量表示：H
enc
＝Encoder(X)＝[h1，h2，
…
，h
n
]在解码阶段，模型自递归地自左向右逐个进行解码；S1.4当生成第i个词时，模型将上次预测的输出作为输入，并利用注意力机制考虑全部的编码器输出及第i个词之前的解码器输出来计算第步的解码器输出，并生成出第i个...

【专利技术属性】
技术研发人员：乔露，乔超，宋晓焕，占琦，薛茹，张静，于小婷，贺雯静，
申请(专利权)人：西北大学现代学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人