【技术实现步骤摘要】
一种生成样本的方法、装置、存储介质及电子设备
本说明书涉及计算机
,尤其涉及一种生成样本的方法、装置、存储介质及电子设备。
技术介绍
目前,诸如智能客服等对话机器人已经应用于各个领域中,对话机器人的要求也不断提高,通常来说,对话机器人是采用训练样本对机器学习模型进行训练得到的对话模型。在现有技术中,用于训练对话模型的训练样本通常需要对自然人之间的对话进行采样得到,而由于能够作为训练样本的对话往往具有一定的要求,因此需要较为专业的标注人员进行对话,才能生成训练样本。有鉴于此,如何降低生成用于训练对话模型的训练样本的难度成为一个亟待解决的问题。
技术实现思路
本说明书实施例提供一种生成样本的方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。本说明书实施例采用下述技术方案:本说明书提供的一种生成样本的方法,包括:根据已发生对话,确定当前对话的对话目标;根据所述当前对话的对话目标,确定所述当前对话中所需包含的关键词类型;针对所述关键词类型中包含的每个待选关键词,根据该待选关键词以及所述已发生对话中包含的已知关键词,从预设的数据库中查询与该待选关键词以及所述已知关键词相关的数据;根据针对每个待选关键词进行查询得到的查询结果,在各待选关键词中,确定所述关键词类型对应的目标关键词;向用户提供所述对话目标和所述目标关键词,以便所述用户采用所述目标关键词完成所述当前对话,并实现所述对话目标;根据所述用户完成的所述当 ...
【技术保护点】
1.一种生成样本的方法,其特征在于,包括:/n根据已发生对话,确定当前对话的对话目标;/n根据所述当前对话的对话目标,确定所述当前对话中所需包含的关键词类型;/n针对所述关键词类型中包含的每个待选关键词,根据该待选关键词以及所述已发生对话中包含的已知关键词,从预设的数据库中查询与该待选关键词以及所述已知关键词相关的数据;/n根据针对每个待选关键词进行查询得到的查询结果,在各待选关键词中,确定所述关键词类型对应的目标关键词;/n向用户提供所述对话目标和所述目标关键词,以便所述用户采用所述目标关键词完成所述当前对话,并实现所述对话目标;/n根据所述用户完成的所述当前对话,生成训练样本,所述训练样本用于训练对话模型,所述对话模型为机器学习模型。/n
【技术特征摘要】
1.一种生成样本的方法,其特征在于,包括:
根据已发生对话,确定当前对话的对话目标;
根据所述当前对话的对话目标,确定所述当前对话中所需包含的关键词类型;
针对所述关键词类型中包含的每个待选关键词,根据该待选关键词以及所述已发生对话中包含的已知关键词,从预设的数据库中查询与该待选关键词以及所述已知关键词相关的数据;
根据针对每个待选关键词进行查询得到的查询结果,在各待选关键词中,确定所述关键词类型对应的目标关键词;
向用户提供所述对话目标和所述目标关键词,以便所述用户采用所述目标关键词完成所述当前对话,并实现所述对话目标;
根据所述用户完成的所述当前对话,生成训练样本,所述训练样本用于训练对话模型,所述对话模型为机器学习模型。
2.如权利要求1所述的方法,其特征在于,根据所述当前对话的对话目标,确定所述当前对话中所需包含的关键词类型,具体包括:
根据所述当前对话所在的业务类型,确定预设的所述业务类型对应的各关键词类型;
根据所述当前对话的对话目标,在所述业务类型对应的各关键词类型中,确定所述当前对话中所需包含的关键词类型。
3.如权利要求2所述的方法,其特征在于,预设的所述业务类型对应的各关键词类型包括:与其他业务类型相关的关键词类型。
4.如权利要求3所述的方法,其特征在于,从预设的数据库中查询与该待选关键词以及所述已知关键词相关的数据,具体包括:
从预设的与所述业务类型对应的数据库中查询与该待选关键词以及所述已知关键词相关的数据;
其中,与所述业务类型对应的数据库中包括:与其他业务类型相关的关键词类型中包含的每个待选关键词对应的数据。
5.如权利要求1所述的方法,其特征在于,根据针对每个待选关键词进行查询得到的查询结果,在各待选关键词中,确定所述关键词类型对应的目标关键词,具体包括:
针对每个待选关键词,若针对该待选关键词进行查询得到的查询结果的数量大于设定数量,则将该待选关键词确定为目标关键词。
6.如权利要求1所述的方法,其特征在于,根据所述用户完成的所述当前对话,生成训练样本,具体包括:
若所述用户...
【专利技术属性】
技术研发人员:陈瑞年,刘瑜,李明,陆恒通,杨玉树,江会星,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。