System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及构建信息库领域,尤其涉及一种信息库构建方法、文本信息生成方法、装置、设备和介质。
技术介绍
1、语言处理模型能够出色的完成各种自然语言处理任务,如语言翻译、文本摘要、对话生成等,但仍然无法完全满足用户输入的所有要求。
2、现有的语言处理模型在基于用户给定的任务要求,生成对应的原创文本时,核心思想是先用大量的数据对模型进行预训练,然后再对特定任务进行微调,从而可以根据用户输入提示语和已学到的自然语言基本规律来生成原创内容。
3、然而,受语言处理模型在理解和处理自然语言的能力限制,现有方法在使用语言处理模型在进行文本生成时,存在使用效果不好的问题。
技术实现思路
1、本申请提供一种信息库构建方法、文本信息生成方法、装置、设备和介质,用以解决现有方法在使用语言处理模型在进行文本生成时,存在使用效果不好的问题。
2、第一方面,本申请提供一种信息库构建方法,方法包括:
3、获取待构建任务要求信息和待构建文本示例,待构建文本示例为与待构建任务要求信息对应的文本示例;
4、确定待构建任务要求信息的关键词;
5、基于关键词和待构建文本示例,生成并向用户展示原创文本信息;
6、响应于用户对原创文本信息的反馈操作,确定原创文本信息中的目标原创文本信息和非目标原创文本信息,其中,目标原创文本信息为用户从原创文本信息中选择的、满足任务要求的信息,非目标原创文本信息为原创文本信息中除目标原创文本信息之外的其他原创文
7、若目标原创文本信息与非目标原创文本信息满足预设相似度要求,则将关键字和待构建文本示例存储至信息库,并在信息库中构建关键字和待构建文本示例的索引关系,以便语言处理模型在接收到任务要求信息后,进行目标文本信息生成时的使用。
8、在本申请实施例中,在响应于用户对原创文本信息的反馈操作,确定原创文本信息中的目标原创文本信息和非目标原创文本信息之后,方法还包括:
9、若原创文本信息全部为用户选择的、满足任务要求的目标原创文本信息,则将关键字和待构建文本示例存储至信息库,并在信息库中构建关键字和待构建文本示例的索引关系。
10、在本申请实施例中,若目标原创文本信息与非目标原创文本信息满足预设相似度要求,则将关键字和待构建文本示例存储至信息库,并在信息库中构建关键字和待构建文本示例的索引关系,包括:
11、确定非目标原创文本信息中的目标文本信息段,目标文本信息段为与目标原创文本信息满足预设相似度要求的文本信息段;
12、若目标文本信息段的数量与非目标原创文本信息中文本信息段的总数量满足预设比例阈值要求,则确定原创文本信息为满足待构建任务要求信息的标准原创文本信息;
13、基于标准原创文本信息,将关键字和待构建文本示例存储至信息库,并在信息库中构建关键字和待构建文本示例的索引关系。
14、在本申请实施例中,在若目标原创文本信息与非目标原创文本信息满足预设相似度要求,则将关键字和待构建文本示例存储至信息库,并在信息库中构建关键字和待构建文本示例的索引关系之后,方法还包括:
15、若目标原创文本信息与非目标原创文本信息未满足相似度要求,则获取下一文本示例,下一文本示例为根据任务要求信息重新获取的、与文本示例不同的示例;
16、将下一文本示例作为文本示例,重新执行基于关键词和文本示例,生成原创文本信息的步骤,直至原创文本信息中目标原创文本信息与非目标原创文本信息满足相似度要求后,将关键字和下一文本示例存储至信息库,并在信息库中构建关键字和下一文本示例的索引关系。
17、第二方面,本申请提供一种文本信息生成方法,方法包括:
18、响应于用户的任务输入操作,获取任务要求信息;
19、基于任务要求信息,确定目标关键字信息,目标关键字信息为与信息库中任务关键词匹配的关键字,信息库为信息库构建方法中任一项的信息库;
20、根据任务关键词,从信息库中获取与任务关键词具有索引关系的目标文本示例;
21、基于目标文本示例,生成满足任务要求信息的目标文本信息;
22、展示目标文本信息。
23、在本申请实施例中,基于目标文本示例,生成满足任务要求信息的目标文本信息,包括:
24、基于目标文本示例和任务要求信息,构建示例样本,示例样本包括文本要点示例、文本例句示例、任务要求信息;
25、将示例样本输入至预设的生成模型中,得到满足任务要求信息的目标文本信息。
26、在本申请实施例中,基于目标文本示例和任务要求信息,构建示例样本,示例样本包括文本要点示例、文本例句示例、任务要求信息,包括:
27、基于目标文本的类型,对目标文本示例进行划分,得到文本要点示例、以及文本例句示例;
28、基于文本要点示例、文本例句示例,确定文本要点示例的连接词、文本例句示例的连接词;
29、基于文本要点示例的连接词、文本例句示例的连接词、以及任务要求信息,构建示例样本。
30、在本申请实施例中,在展示目标文本信息之后,方法还包括:
31、响应于用户根据目标文本信息的反馈操作,得到第一用户反馈信息;
32、若第一用户反馈信息为表征目标文本信息为与任务要求信息未匹配的信息,则获取用户输入的目标文本示例;
33、基于用户输入的目标文本示例,生成满足任务要求信息的优化文本信息;
34、展示优化文本信息。
35、在本申请实施例中,在展示优化文本信息之后,方法还包括:
36、响应于用户根据优化文本信息的反馈操作,得到第二用户反馈信息;
37、若第二用户反馈信息为表征优化文本信息为与任务要求信息匹配的信息,则将用户输入的目标文本示例存储至预设信息库,并建立目标文本示例与目标关键字信息之间的索引关系;
38、若第二用户反馈信息表征优化文本信息为与任务要求信息未匹配的信息,则重新获取用户输入的其他目标文本示例,并将其他目标文本示例作为目标文本示例,执行基于用户输入的目标文本示例,生成满足任务要求信息的优化文本信息的步骤。
39、第三方面,本申请提供一种信息库构建装置,装置包括:
40、信息获取模块,用于获取待构建任务要求信息和待构建文本示例,待构建文本示例为与待构建任务要求信息对应的文本示例;
41、关键词确定模块,用于确定待构建任务要求信息的关键词;
42、信息生成模块,用于基于关键词和待构建文本示例,生成并向用户展示原创文本信息;
43、信息确定模块,用响应于用户对原创文本信息的反馈操作,确定原创文本信息中的目标原创文本信息和非目标原创文本信息,其中,目标原创文本信息为用户从原创文本信息中选择的、满足任务要求的信息,非目标原创文本信息为原创文本信息中除目标原创文本信本文档来自技高网...
【技术保护点】
1.一种信息库构建方法,其特征在于,应用于语言处理模型中的信息库,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述响应于所述用户对所述原创文本信息的反馈操作,确定所述原创文本信息中的目标原创文本信息和非目标原创文本信息之后,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述若所述目标原创文本信息与所述非目标原创文本信息满足预设相似度要求,则将所述关键字和所述待构建文本示例存储至所述信息库,并在所述信息库中构建所述关键字和所述待构建文本示例的索引关系,以便所述语言处理模型在接收到任务要求信息后,进行目标文本信息生成时的使用,包括:
4.根据权利要求1所述的方法,其特征在于,在所述若所述目标原创文本信息与所述非目标原创文本信息满足预设相似度要求,则将所述关键字和所述待构建文本示例存储至所述信息库,并在所述信息库中构建所述关键字和所述待构建文本示例的索引关系,以便所述语言处理模型在接收到任务要求信息后,进行目标文本信息生成时的使用之后,所述方法还包括:
5.一种文本信息生成方法,其特征在于,应用于语言处理模型
6.根据权利要求5所述的方法,其特征在于,所述基于所述目标文本示例,生成满足所述任务要求信息的目标文本信息,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述目标文本示例和所述任务要求信息,构建示例样本,所述示例样本包括文本要点示例、文本例句示例、任务要求信息,包括:
8.根据权利要求5所述的方法,其特征在于,在所述展示所述目标文本信息之后,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,在所述展示所述优化文本信息之后,所述方法还包括:
10.一种信息库构建装置,其特征在于,应用于语言处理模型中的信息库,所述装置包括:
11.一种文本信息生成装置,其特征在于,应用于语言处理模型,所述装置包括:
12.一种设备,其特征在于,包括:
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1至9中任一项所述的方法。
...【技术特征摘要】
1.一种信息库构建方法,其特征在于,应用于语言处理模型中的信息库,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述响应于所述用户对所述原创文本信息的反馈操作,确定所述原创文本信息中的目标原创文本信息和非目标原创文本信息之后,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述若所述目标原创文本信息与所述非目标原创文本信息满足预设相似度要求,则将所述关键字和所述待构建文本示例存储至所述信息库,并在所述信息库中构建所述关键字和所述待构建文本示例的索引关系,以便所述语言处理模型在接收到任务要求信息后,进行目标文本信息生成时的使用,包括:
4.根据权利要求1所述的方法,其特征在于,在所述若所述目标原创文本信息与所述非目标原创文本信息满足预设相似度要求,则将所述关键字和所述待构建文本示例存储至所述信息库,并在所述信息库中构建所述关键字和所述待构建文本示例的索引关系,以便所述语言处理模型在接收到任务要求信息后,进行目标文本信息生成时的使用之后,所述方法还包括:
5.一种文本信息生成方...
【专利技术属性】
技术研发人员:杨必琨,廉士国,郭嘉琦,苏建辉,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。