对联信息生成方法和装置制造方法及图纸

技术编号：24092961 阅读：20 留言：0更新日期：2020-05-09 08:55

本申请公开了一种对联信息生成方法和装置，涉及计算机技术领域中的数据处理子领域，其中，方法包括：获取用户输入的文本信息，提取文本信息中包含的词序列；将词序列输入到第一深度学习模型，获取与文本信息对应的上联信息；将上联信息输入到第二深度学习模型，获取与上联信息对应的下联信息；获取至少一个候选横批信息，计算上联信息和下联信息与每个候选横批信息的相似度；根据相似度在至少一个候选横批信息中确定目标横批信息，从而生成包括上联信息、下联信息和目标横批信息的对联信息。由此，实现了对联的自动生成的智能化，且生成的对联与用户的个性化需求一致。

Generation method and device of couplet information

全部详细技术资料下载

【技术实现步骤摘要】
对联信息生成方法和装置
本申请涉及计算机
中的数据处理
，尤其设计一种对联信息生成方法和装置。
技术介绍
每逢春节，张贴春联是中国人习俗，通常，用户根据网络上已有的对联进行搜索，确定出自己满意的对联。然而，在网络上以后的对联中搜索，不但搜索量巨大而且难以快速找到用户满意的对联，因此，亟需一种可以为用户定制对联的智能生成方式。
技术实现思路
本申请的第一个目的在于提出一种对联信息生成方法。本申请的第二个目的在于提出一种对联信息生成装置。本申请的第三个目的在于提出一种电子设备。本申请的第四个目的在于提出一种存储有计算机指令的非瞬时计算机可读存储介质。为达上述目的，本申请第一方面实施例提出了一种对联信息生成方法，包括：获取用户输入的文本信息，提取所述文本信息中包含的词序列；将所述词序列输入到第一深度学习模型，获取与所述文本信息对应的上联信息；将所述上联信息输入到第二深度学习模型，获取与所述上联信息对应的下联信息；获取至少一个候选横批信息，计算所述上联信息和所述下联信息与每个候选横批信息的相似度；根据所述相似度在所述至少一个候选横批信息中确定目标横批信息，从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。为达上述目的，本申请第二方面实施例提出了一种对联信息生成装置，包括：提取模块，用于获取用户输入的文本信息，提取所述文本信息中包含的词序列；第一获取模块，用于将所述词序列输入到第一深度学习模型，获取与所述文本信息对应的上联信息；第...

【技术保护点】
1.一种对联信息生成方法，其特征在于，包括：/n获取用户输入的文本信息，提取所述文本信息中包含的词序列；/n将所述词序列输入到第一深度学习模型，获取与所述文本信息对应的上联信息；/n将所述上联信息输入到第二深度学习模型，获取与所述上联信息对应的下联信息；/n获取至少一个候选横批信息，计算所述上联信息和所述下联信息与每个候选横批信息的相似度；/n根据所述相似度在所述至少一个候选横批信息中确定目标横批信息，从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。/n

【技术特征摘要】
1.一种对联信息生成方法，其特征在于，包括：
获取用户输入的文本信息，提取所述文本信息中包含的词序列；
将所述词序列输入到第一深度学习模型，获取与所述文本信息对应的上联信息；
将所述上联信息输入到第二深度学习模型，获取与所述上联信息对应的下联信息；
获取至少一个候选横批信息，计算所述上联信息和所述下联信息与每个候选横批信息的相似度；
根据所述相似度在所述至少一个候选横批信息中确定目标横批信息，从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。

2.如权利要求1所述的方法，其特征在于，在所述提取所述文本信息中包含的词序列之前，包括：
判断所述文本信息中是否包含人名信息；
若包含人名信息，则识别所述人名信息中的姓信息和名信息；
判断所述名信息是否大于预设阈值；
若小于所述预设阈值，则复制所述名信息，并拼接所述名信息和复制后的名信息生成目标名信息；
将所述文本信息中所述名信息替换为所述目标名信息。

3.如权利要求1所述的方法，其特征在于，在所述将所述词序列输入到第一深度学习模型之前，包括：
将所述词序列中包含的每个分词，与预设高频词集合中的高频词进行语义匹配；
判断所述预设高频词集合中，是否包含与所述每个分词的匹配度大于预设阈值的目标高频词；
若包含所述目标高频词，则通过所述目标高频词替换对应的分词。

4.如权利要求1所述的方法，其特征在于，所述将所述上联信息输入到第二深度学习模型，获取与所述上联信息对应的下联信息，包括：
将所述上联信息输入到预先训练的语义理解模型，获取与所述上联信息对应的语义编码；
将所述语义编码输入所述第二深度学习模型中的解码端，获取所述下联信息。

5.如权利要求4所述的方法，其特征在于，在所述将所述上联信息输入到预先训练的语义理解模型之前，包括：
获取满足预设对联条件的样本上联信息和所述样本上联信息的标注语义信息；
对所述样本对联信息切词处理获取样本词序列；
将所述样本词序列输入预先构建的语义理解模型，获取训练语义信息；
计算所述训练语义信息对应的所述标注语义信息的匹配度，当所述匹配度大于预设阈值时完成对所述预先构建的语义理解模型的训练。

6.如权利要求4所述的方法，其特征在于，在所述完成对所述预先构建的语义理解模型的训练后，还包括：
计算所述样本词序列中的样本分词，与预设常用词汇集中的每个常用词的语义相似度；
在所述常用词汇集中确定所述语义相似度大于预设阈值的目标常用词；
根据所述目标常用词替换所述样本词序列中的对应样本词，获取...

【专利技术属性】
技术研发人员：姜博健，毕天驰，熊皓，何中军，李芝，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人