用于生成自然语言文本的方法、装置、电子设备和介质制造方法及图纸

技术编号:27354667 阅读:22 留言:0更新日期:2021-02-19 13:33
本公开提供了一种用于生成自然语言文本的方法,包括获得多个主题词,基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量,基于注意力机制处理已生成的语句中的词语,以得到参考语句向量,基于所述参考主题词向量以及所述参考语句向量,生成当前时刻的词语。本公开还提供了一种用于生成自然语言文本的装置、一种电子设备以及一种计算机可读存储介质。存储介质。存储介质。

【技术实现步骤摘要】
用于生成自然语言文本的方法、装置、电子设备和介质


[0001]本公开涉及计算机
,更具体地,涉及一种用于生成自然语言文本的方法、装置、电子设备和介质。

技术介绍

[0002]伴随着科学技术的不断发展,自动生成文本的需求也越来越多,目前已经有很多场景都已经应用了自动生成文本技术,比如自动生成诗歌、自动生成广告文案、自动生成歌词等。现有基于神经网络的文本生成技术需要用户给定一组关键词,依次利用每个关键词生成一句话,依次将生成的句子组合在一起得到生成文本。但是,本专利技术人发现,该技术对用户选择的主题词的顺序非常敏感,同一组主题词,输入顺序不同,生成结果的质量也会大相径庭,影响用户体验。

技术实现思路

[0003]有鉴于此,本公开提供了一种用于生成自然语言文本的方法、装置、电子设备和介质。
[0004]本公开的一个方面提供了一种用于生成自然语言文本的方法,包括获得多个主题词,基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量,基于注意力机制处理已生成的语句中的词语,以得到参考语句向量,基于所述参考主题词向量以及所述参考语句向量,生成当前时刻的词语。
[0005]可选地,所述方法还包括判断已经生成的语句数量是否达到预设数量,在已生成的语句数量达到预设数量时,停止生成词语的过程。
[0006]可选地,所述预设数量小于所述主题词的数量。
[0007]可选地,所述基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量包括将所述多个主题词向量化,基于经训练的参数和隐层向量确定多个权重值,以及基于所述权重值处理向量化的主题词,得到参考主题词向量。
[0008]本公开的另一个方面提供了一种用于生成自然语言文本的装置,包括获得模块、第一处理模块、第二处理模块以及生成模块。获得模块,用于获得多个主题词。第一处理模块,用于基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量。第二处理模块,用于基于注意力机制处理已生成的语句中的词语,以得到参考语句向量。生成模块,用于基于所述参考主题词向量以及所述参考语句向量,生成当前时刻的词语。
[0009]可选地,所述装置还包括判断模块和停止模块。判断模块,用于判断已经生成的语句数量是否达到预设数量。停止模块,用于在已生成的语句数量达到预设数量时,停止生成词语的过程。
[0010]可选地,所述预设数量小于所述主题词的数量。
[0011]可选地,所述第一处理模块包括向量化子模块、确定子模块以及处理子模块。向量化子模块,用于将所述多个主题词向量化。确定子模块,用于基于经训练的参数和隐层向量
确定多个权重值。处理子模块,用于基于所述权重值处理向量化的主题词,得到参考主题词向量。
[0012]本公开的另一个方面提供了一种电子设备,包括,至少一个处理器以及至少一个存储器,用于存储一个或多个计算机可读指令,其中,当所述一个或多个计算机可读指令被所述至少一个处理器执行时,使得所述处理器执行如上所述的方法。
[0013]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
[0014]本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
[0015]本公开实施例的方法通过对主题词引入注意力机制,处理多个主题词以得到当前时刻的参考主题词向量,至少部分地解决了生成文本质量依赖于输入主题词顺序的缺陷。
附图说明
[0016]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0017]图1示意性示出了根据本公开实施例的用于生成自然语言文本的方法的应用场景;
[0018]图2示意性示出了根据本公开实施例的用于生成自然语言文本的方法的流程图;
[0019]图3示意性示出了根据本公开实施例的用于生成自然语言文本的方法的示意图;
[0020]图4示意性示出了根据本公开另一实施例的用于生成自然语言文本的方法的流程图;
[0021]图5示意性示出了根据本公开实施例的用于生成自然语言文本的装置的示意图;以及
[0022]图6示意性示出了根据本公开实施例的适于实现用于生成自然语言文本的装置的计算机系统的示意图。
具体实施方式
[0023]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
[0024]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0025]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0026]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本
领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
[0027]本公开的实施例提供了一种用于生成自然语言文本的方法,包括获得多个主题词,基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量,基于注意力机制处理已生成的语句中的词语,以得到参考语句向量,基于所述参考主题词向量以及所述参考语句向量,生成当前时刻的词语。
[0028]图1示意性示出了根据本公开实施例的用于生成自然语言文本的方法的应用场景。
[0029]如图1所示,展示了给定一组关键词生成一段除夕祝福语的示例,用户给定一组关键词,然后机器可以利用这组关键词生成一首除夕祝福语。
[0030]图2示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于生成自然语言文本的方法,包括:获得多个主题词;基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量;基于注意力机制处理已生成的语句中的词语,以得到参考语句向量;基于所述参考主题词向量以及所述参考语句向量,生成当前时刻的词语。2.根据权利要求1所述的方法,还包括:判断已经生成的语句数量是否达到预设数量;在已生成的语句数量达到预设数量时,停止生成词语的过程。3.根据权利要求2所述的方法,其中,所述预设数量小于所述主题词的数量。4.根据权利要求1所述的方法,其中,所述基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量包括:将所述多个主题词向量化;基于经训练的参数和隐层向量确定多个权重值;基于所述权重值处理向量化的主题词,得到参考主题词向量。5.一种用于生成自然语言文本的装置,包括:获得模块,用于获得多个主题词;第一处理模块,用于基于注意力机制处理所述多个主题词,以得到当前时刻的参考主题词向量;第二处理模块,用于基于注意力机制...

【专利技术属性】
技术研发人员:宋阳陈蒙刘晓华
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1