对联信息生成方法和装置制造方法及图纸

技术编号:24092961 阅读:20 留言:0更新日期:2020-05-09 08:55
本申请公开了一种对联信息生成方法和装置,涉及计算机技术领域中的数据处理子领域,其中,方法包括:获取用户输入的文本信息,提取文本信息中包含的词序列;将词序列输入到第一深度学习模型,获取与文本信息对应的上联信息;将上联信息输入到第二深度学习模型,获取与上联信息对应的下联信息;获取至少一个候选横批信息,计算上联信息和下联信息与每个候选横批信息的相似度;根据相似度在至少一个候选横批信息中确定目标横批信息,从而生成包括上联信息、下联信息和目标横批信息的对联信息。由此,实现了对联的自动生成的智能化,且生成的对联与用户的个性化需求一致。

Generation method and device of couplet information

【技术实现步骤摘要】
对联信息生成方法和装置
本申请涉及计算机
中的数据处理
,尤其设计一种对联信息生成方法和装置。
技术介绍
每逢春节,张贴春联是中国人习俗,通常,用户根据网络上已有的对联进行搜索,确定出自己满意的对联。然而,在网络上以后的对联中搜索,不但搜索量巨大而且难以快速找到用户满意的对联,因此,亟需一种可以为用户定制对联的智能生成方式。
技术实现思路
本申请的第一个目的在于提出一种对联信息生成方法。本申请的第二个目的在于提出一种对联信息生成装置。本申请的第三个目的在于提出一种电子设备。本申请的第四个目的在于提出一种存储有计算机指令的非瞬时计算机可读存储介质。为达上述目的,本申请第一方面实施例提出了一种对联信息生成方法,包括:获取用户输入的文本信息,提取所述文本信息中包含的词序列;将所述词序列输入到第一深度学习模型,获取与所述文本信息对应的上联信息;将所述上联信息输入到第二深度学习模型,获取与所述上联信息对应的下联信息;获取至少一个候选横批信息,计算所述上联信息和所述下联信息与每个候选横批信息的相似度;根据所述相似度在所述至少一个候选横批信息中确定目标横批信息,从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。为达上述目的,本申请第二方面实施例提出了一种对联信息生成装置,包括:提取模块,用于获取用户输入的文本信息,提取所述文本信息中包含的词序列;第一获取模块,用于将所述词序列输入到第一深度学习模型,获取与所述文本信息对应的上联信息;第二获取模块,用于将所述上联信息输入到第二深度学习模型,获取与所述上联信息对应的下联信息;计算模块,用于获取至少一个候选横批信息,计算所述上联信息和所述下联信息与每个候选横批信息的相似度;生成模块,用于根据所述相似度在所述至少一个候选横批信息中确定目标横批信息,从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。为达上述目的,本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例描述的对联生成方法。为达上述目的,本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述实施例描述的停车位数据的对联生成方法。上述申请中的一个实施例具有如下优点或有益效果:获取用户输入的文本信息,提取所述文本信息中包含的词序列,将词序列输入到第一深度学习模型,获取与文本信息对应的上联信息,将上联信息输入到第二深度学习模型,获取与上联信息对应的下联信息,进而,获取至少一个候选横批信息,计算上联信息和下联信息与每个候选横批信息的相似度,最后,根据相似度在至少一个候选横批信息中确定目标横批信息,从而生成包括上联信息、下联信息和目标横批信息的对联信息。由此,实现了对联的自动生成的智能化,且生成的对联与用户的个性化需求一致。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的对联生成方法的流程图;图2是根据本申请第二实施例的对联生成场景图;图3是根据本申请第三实施例的对联生成场景图;图4是根据本申请第四实施例的对联生成场景图;图5是根据本申请第五实施例的对联生成场景图;图6是根据本申请第六实施例的对联生成装置的结构示意图;以及图7是用来实现本申请实施例的对联生成方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。下面参考附图描述本申请实施例的对联信息生成方法和装置。具体而言,图1是根据本申请一个实施例的对联信息生成方法的流程图,在该方法中提供了一种定制化对联的智能生成方法,改进了现有技术中的用户主动搜索其满意的对联的人工对联获取方式,该方法结合预先训练的模型,快速精准的为用户生成与其个性化需求吻合的对联。如图1所示,该方法包括:步骤101,获取用户输入的文本信息,提取文本信息中包含的词序列。其中,用户输入的文本信息可以包含一个关键词,也可以包含多个关键词,在本申请中,根据用户输入的文本信息为依据自动生成对联。在不同的应用场景中,获取用户输入的文本信息的方式不同,作为一种可能的实现方式,开发与本申请的对联生成方法对应的应用,在该应用的界面上提供文本信息的输入框,可以在界面的有关区域显示该输入框的提示信息,以提示用户输入文本信息,以及输入文本信息的要求,比如,显示“请输入不大于4个字的文本信息,我们将为您生成对联”。在获取到用户输出的有效的文本信息后,提取文本信息中包含的词序列,即可以将文本信息拆分为一个一个的分词生成词序列,也可以将文本信息拆分为一个一个的字,生成词序列。在实际执行过程中,为了能够根据用户输入的文本信息把握用户的对联定制化需求,还可以对文本信息中的特殊分词进行处理。作为一种可能的实现方式,判断文本信息中是否包含人名信息,若是包含人名信息,则识别人名信息中的姓信息和名信息,判断名信息是否大于预设阈值,以识别该名信息是否足够体现对应的文本是人名而不是其他词,其中,该预设阈值可以为2等,若是小于预设阈值,则为了强调该名信息对应的文字人名,复制名信息,并拼接名信息和复制后的名信息生成目标名信息,将文本信息中名信息删除,并将名信息替换为目标名信息。也就是说,将名信息简单的重复,若是名信息大于等于预设阈值,则保留该名信息。步骤102,将词序列输入到第一深度学习模型,获取与文本信息对应的上联信息。具体的,预先训练第一深度学习模型,该第一深度学习模型的输入可为词序列,输出为与该词序列对应的上联信息,因而,可以将获取的词序列输入到第一深度学习模型,获取与文本信息对应的上联信息。其中,由于将词序列输入到第一深度学习模型后,任由第一深度学习模型产出而不加任何限制,会出现上联信息中文字的大量重复,例如:输入的词序列为:春光,在可能会输出:春光无限春光无,这种重复在7-9字春联中十分影响整体效果,所以我们在第一深度学习模型解码过程中加入了重复限制,一个上联信息中只允许一个字重复,且最多重复两次,加完限制后效果:“春光”对应的上联信息为“春光无限江山秀”。在本申请的一个实施例中,为了避免一些生僻字由于没有预先得到训练,导致第一深度学习模型无法输出与其对应的准确的上联信息,还可以对一些特殊的生僻字进行语义扩展处理。具体而言,将本文档来自技高网...

【技术保护点】
1.一种对联信息生成方法,其特征在于,包括:/n获取用户输入的文本信息,提取所述文本信息中包含的词序列;/n将所述词序列输入到第一深度学习模型,获取与所述文本信息对应的上联信息;/n将所述上联信息输入到第二深度学习模型,获取与所述上联信息对应的下联信息;/n获取至少一个候选横批信息,计算所述上联信息和所述下联信息与每个候选横批信息的相似度;/n根据所述相似度在所述至少一个候选横批信息中确定目标横批信息,从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。/n

【技术特征摘要】
1.一种对联信息生成方法,其特征在于,包括:
获取用户输入的文本信息,提取所述文本信息中包含的词序列;
将所述词序列输入到第一深度学习模型,获取与所述文本信息对应的上联信息;
将所述上联信息输入到第二深度学习模型,获取与所述上联信息对应的下联信息;
获取至少一个候选横批信息,计算所述上联信息和所述下联信息与每个候选横批信息的相似度;
根据所述相似度在所述至少一个候选横批信息中确定目标横批信息,从而生成包括所述上联信息、所述下联信息和所述目标横批信息的对联信息。


2.如权利要求1所述的方法,其特征在于,在所述提取所述文本信息中包含的词序列之前,包括:
判断所述文本信息中是否包含人名信息;
若包含人名信息,则识别所述人名信息中的姓信息和名信息;
判断所述名信息是否大于预设阈值;
若小于所述预设阈值,则复制所述名信息,并拼接所述名信息和复制后的名信息生成目标名信息;
将所述文本信息中所述名信息替换为所述目标名信息。


3.如权利要求1所述的方法,其特征在于,在所述将所述词序列输入到第一深度学习模型之前,包括:
将所述词序列中包含的每个分词,与预设高频词集合中的高频词进行语义匹配;
判断所述预设高频词集合中,是否包含与所述每个分词的匹配度大于预设阈值的目标高频词;
若包含所述目标高频词,则通过所述目标高频词替换对应的分词。


4.如权利要求1所述的方法,其特征在于,所述将所述上联信息输入到第二深度学习模型,获取与所述上联信息对应的下联信息,包括:
将所述上联信息输入到预先训练的语义理解模型,获取与所述上联信息对应的语义编码;
将所述语义编码输入所述第二深度学习模型中的解码端,获取所述下联信息。


5.如权利要求4所述的方法,其特征在于,在所述将所述上联信息输入到预先训练的语义理解模型之前,包括:
获取满足预设对联条件的样本上联信息和所述样本上联信息的标注语义信息;
对所述样本对联信息切词处理获取样本词序列;
将所述样本词序列输入预先构建的语义理解模型,获取训练语义信息;
计算所述训练语义信息对应的所述标注语义信息的匹配度,当所述匹配度大于预设阈值时完成对所述预先构建的语义理解模型的训练。


6.如权利要求4所述的方法,其特征在于,在所述完成对所述预先构建的语义理解模型的训练后,还包括:
计算所述样本词序列中的样本分词,与预设常用词汇集中的每个常用词的语义相似度;
在所述常用词汇集中确定所述语义相似度大于预设阈值的目标常用词;
根据所述目标常用词替换所述样本词序列中的对应样本词,获取...

【专利技术属性】
技术研发人员:姜博健毕天驰熊皓何中军李芝
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1