System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本生成方法、装置、电子设备及存储介质制造方法及图纸_技高网

一种文本生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:42426542 阅读:7 留言:0更新日期:2024-08-16 16:40
本申请涉及文本生成和分析技术领域,具体涉及一种文本生成方法、装置、电子设备及存储介质,本申请通过获取目标文本的生成参数,其中,目标文本为待生成的文本,生成参数为用户输入的、用于指示目标文本的文本主题和文本字数的参数;根据生成参数指示的文本主题和文本字数,确定目标文本的文本大纲,其中,文本大纲中携带有目标文本中每个段落的段落简介和每个段落的段落字数;根据文本大纲中所有段落的段落简介和段落字数,生成目标文本,由于可以通过目标文本的大纲中的每个段落的段落简介和段落字数,生成每个段落的内容,最后再根据每个段落的内容得到整篇文本内容,采用这种方式解决了使用大模型生成文本时,存在生成文本字数限制的问题。

【技术实现步骤摘要】

本申请涉及文本生成和分析,具体涉及一种文本生成方法、装置、电子设备及存储介质


技术介绍

1、随着通用人工智能(agi,artificial general intelligence)技术的迅猛发展,特别是通用大模型的出现,人工智能生成内容(aigc,artificial intelligencegenerated content)正逐渐成为文案生产领域的新宠。无论是企业内部自主研发的ai解决方案,还是各大ai模型企业提供的开放平台,aigc技术都为企业和客户服务领域带来了显著的效率提升。然而,在这一技术飞速发展的同时,也暴露出了一些亟待解决的问题。

2、首先,当前agi大模型生成的文本字数有限,这直接影响了其在实际应用场景中的广泛性和实用性。在大多数情况下,企业需要的文本长度远超出现有大模型的输出限制,这导致了一次性完成整篇文本的生成变得不切实际。其次,由于agi大模型的推理生成原理,相同或类似主题的输入往往会导致生成的文本内容高度重复。这不仅降低了生成内容的多样性和丰富性,而且可能无法完全满足用户对于内容独特性和创新性的需求。最后,当采用分部分生成再续写的策略时,随着生成过程的推进,特别是在文本尾部,生成的内容与上下文和主题方向的偏离现象愈发严重。这种现象被称为agi大模型的“幻觉问题”,它严重影响了生成内容的连贯性和一致性。

3、由此可见,尽管aigc技术为企业和客户服务领域带来了显著的生产效率提升,但其在实际应用中仍面临着生成字数限制、内容重复度高以及幻觉问题等挑战。


技术实现思路

1、本申请的目的在于提供一种文本生成方法、装置、电子设备及存储介质,以解决现有技术中使用大模型生成文本时,存在生成文本字数限制的问题。

2、为了实现上述目的,本申请采用的技术方案如下:

3、根据本申请实施例的一个方面,提供了一种文本生成方法,包括:获取目标文本的生成参数,其中,目标文本为待生成的文本,生成参数为用户输入的、用于指示目标文本的文本主题和文本字数的参数;根据生成参数指示的文本主题和文本字数,确定目标文本的文本大纲,其中,文本大纲中携带有目标文本中每个段落的段落简介和每个段落的段落字数;根据文本大纲中所有段落的段落简介和段落字数,生成目标文本。

4、根据上述技术手段,由于可以通过目标文本的大纲中的每个段落的段落简介和段落字数,生成每个段落的内容,最后再根据每个段落的内容得到整篇文本内容,采用这种方式解决了使用大模型生成文本时,存在生成文本字数限制的问题。

5、进一步,根据生成参数指示的文本主题和文本字数,确定目标文本的文本大纲,包括:根据文本主题,确定目标文本的生成因子组合,其中,生成因子组合用于确定目标文本中每个段落的段落简介;根据文本字数和生成因子组合,确定每个段落的段落字数。

6、根据上述技术手段,可以根据目标文本的文本主题确定每个段落的段落简介和段落字数,由于每个段落的段落字数是根据文本的段落数量和文本字数确定的,因此,可以有效解决使用大模型生成文本时,存在生成文本字数限制的问题。

7、进一步,根据文本主题,确定目标文本的生成因子组合,包括:根据文本主题,确定目标文本的需求场景,其中,需求场景为目标文本的实际应用的场景;获取需求场景对应的所有随机因子项目,其中,随机因子项目为需求场景下的文本内容要素,一个文本内容要素用于表征目标文本的一个特定需求,一个随机因子项目包括至少一个随机因子,随机因子为随机因子项目的具体内容;将所有随机因子项目中的所有随机因子进行组合,得到至少一个随机因子组合,其中,一个随机因子组合包括所有随机因子项目中各个随机因子项目中的一个随机因子;根据文本主题,从所有随机因子组合中选取一个随机因子组合作为生成因子组合。

8、根据上述技术手段,可以通过目标文本的文本主题确定生成因子组合,生成因子组合用于确定目标文本中每个段落的段落简介,由于采用随机因子项目、随机因子的方式可以生成贴合文本主题的生成因子组合,且每个生成因子组合中随机因子不同,因此可以有效避免出现多次同样主题生成文本重复度过高问题。

9、进一步,根据文本大纲中所有段落的段落简介和段落字数,生成目标文本,包括:根据每个段落的段落简介和每个段落的段落字数,生成每个段落的段落内容;将所有段落的段落内容拼接,得到目标文本。

10、根据上述技术手段,由于先根据每个段落的段落简介和段落字数生成每个段落的内容,然后再将所有段落的内容拼接得到目标文本,采用这种方式可以有效解决使用大模型生成文本时,存在生成文本字数限制的问题。

11、进一步,根据文本大纲中所有段落的段落简介和段落字数,生成目标文本,还包括:在生成每个段落的段落内容之后,确定已经生成的所有段落的段落内容是否与目标文本的文本主题一致。

12、根据上述技术手段,由于可以在生成下一个段落的段落内容之前,将已经生成的所有段落的段落内容与文本的主题来进一步对比,判断已生成的内容是否偏离文本主题,进而解决了上下文风格不一致等幻觉问题。

13、进一步,在根据文本大纲中所有段落的段落简介和段落字数,生成目标文本之后,还包括:对目标文本进行校稿,得到校稿结果,其中,校稿用于校验目标文本是否符合预设规则,校稿结果用于表征目标文本的校稿是否通过;在校稿结果表明目标文本的校稿通过的情况下,将目标文本确定为最终的文本;在校稿结果表明目标文本的校稿未通过的情况下,重新生成目标文本。

14、进一步,对目标文本进行校稿,得到校稿结果,包括:根据目标文本的生成参数和目标文本,确定目标文本是否符合预设规则;在确定目标文本符合预设规则的情况下,确定校稿结果为通过,表明目标文本的校稿通过;在确定目标文本不符合预设规则的情况下,确定校稿结果为未通过,表明目标文本的校稿未通过。

15、根据上述技术手段,由于可以通过校稿确定已生成的目标文本是否可以使用,进一步保证了当前生成的目标文本与文本主题贴合。

16、根据本申请实施例的又一个方面,还提供了一种文本生成装置,包括:获取模块,用于获取目标文本的生成参数,其中,目标文本为待生成的文本,生成参数为用户输入的、用于指示目标文本的文本主题和文本字数的参数;确定模块,用于根据生成参数指示的文本主题和文本字数,确定目标文本的文本大纲,其中,文本大纲中携带有目标文本中每个段落的段落简介和每个段落的段落字数;生成模块,用于根据文本大纲中所有段落的段落简介和段落字数,生成目标文本。

17、根据本申请实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行存储器上所存储的计算机程序来执行上述任一实施例中的文本生成方法步骤。

18、根据本申请实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算本文档来自技高网...

【技术保护点】

1.一种文本生成方法,其特征在于,包括:

2.根据权利要求1所述的文本生成方法,其特征在于,所述根据所述生成参数指示的所述文本主题和所述文本字数,确定所述目标文本的文本大纲,包括:

3.根据权利要求2所述的文本生成方法,其特征在于,所述根据所述文本主题,确定所述目标文本的生成因子组合,包括:

4.根据权利要求1所述的文本生成方法,其特征在于,所述根据所述文本大纲中所有段落的所述段落简介和所述段落字数,生成所述目标文本,包括:

5.根据权利要求4所述的文本生成方法,其特征在于,所述根据所述文本大纲中所有段落的所述段落简介和所述段落字数,生成所述目标文本,还包括:

6.根据权利要求1所述的文本生成方法,其特征在于,在根据所述文本大纲中所有段落的所述段落简介和所述段落字数,生成所述目标文本之后,还包括:

7.根据权利要求6所述的文本生成方法,其特征在于,所述对所述目标文本进行校稿,得到校稿结果,包括:

8.一种文本生成装置,其特征在于,包括:

9.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,其特征在于,

10.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至7中任一项中所述文本生成方法。

...

【技术特征摘要】

1.一种文本生成方法,其特征在于,包括:

2.根据权利要求1所述的文本生成方法,其特征在于,所述根据所述生成参数指示的所述文本主题和所述文本字数,确定所述目标文本的文本大纲,包括:

3.根据权利要求2所述的文本生成方法,其特征在于,所述根据所述文本主题,确定所述目标文本的生成因子组合,包括:

4.根据权利要求1所述的文本生成方法,其特征在于,所述根据所述文本大纲中所有段落的所述段落简介和所述段落字数,生成所述目标文本,包括:

5.根据权利要求4所述的文本生成方法,其特征在于,所述根据所述文本大纲中所有段落的所述段落简介和所述段落字数,生成所述目标文本,还包括:

6....

【专利技术属性】
技术研发人员:张轩铭周雷皓高玉石
申请(专利权)人:北京轻松怡康信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1