当前位置: 首页 > 专利查询>清华大学专利>正文

对抗文本的生成方法、装置、设备及存储介质制造方法及图纸

技术编号:29527343 阅读:16 留言:0更新日期:2021-08-03 15:13
本发明专利技术实施例提供一种对抗文本的生成方法、装置、设备及存储介质,该方法包括:获取待处理的文本信息集,其中文本信息集中包括有原始文本;对原始文本进行扰动处理,生成原始文本对应的多个候选文本;对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,对抗文本用于对目标模型进行训练。本发明专利技术实施例能够生成与原始文本的语义相似度高的对抗文本,即得到高质量的对抗文本,进而利用该高质量对抗文本可以对目标模型进行有效的训练,以使训练后的目标模型具有高鲁棒性。

【技术实现步骤摘要】
对抗文本的生成方法、装置、设备及存储介质
本专利技术涉及计算机
,尤其涉及一种对抗文本的生成方法、装置、设备及存储介质。
技术介绍
随着深度学习技术的发展,深度学习模型也面临着各种安全问题,其中,对抗攻击是一个热点问题。在自然语言处理领域,对抗攻击指在原始文本上添加微小的扰动得到对抗文本,通过输入对抗文本使深度学习模型输出一个错误语义标签,而用户却不能察觉对抗文本相较于原始文本在语义上的改动。为解决这一安全问题,需要使用对抗文本对目标模型进行防御对抗攻击的训练,以使目标模型可以有效抵御外界的对抗攻击。现有技术中,针对中文,采用映射的方式实现对抗文本的生成,即将原始文本中的词语映射到向量空间,得到词向量,在词向量上添加扰动,并将词向量映射回文本格式生成对抗文本。然而,现有方法中大量的词向量难以映射回文本格式,且生成的对抗文本与原始文本的语义相差较大,对抗文本质量低,导致对抗文本的训练价值较低。
技术实现思路
本专利技术实施例提供一种对抗文本的生成方法、装置、设备及存储介质,以解决针对中文,现有技术中生成的对抗文本与原始文本的语义相差较大,对抗文本质量低,进而导致对抗文本的训练价值较低的技术问题。第一方面,本专利技术实施例提供一种对抗文本的生成方法,所述方法包括:获取待处理的文本信息集,其中所述文本信息集中包括有原始文本;对所述原始文本进行扰动处理,生成所述原始文本对应的多个候选文本;对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,所述对抗文本用于对目标模型进行训练。在一种可能的实施方式中,所述对所述原始文本进行扰动处理,生成所述原始文本对应的多个候选文本,包括:确定原始文本对应的字词序列,并确定各字词在所述原始文本中的优先级;根据所述各字词的优先级从各字词中选出待处理字词,并对所述待处理字词进行多种扰动处理;根据对所述待处理字词的多种扰动处理结果以及当前的原始文本生成所述原始文本对应的多个候选文本。在一种可能的实施方式中,所述待处理的文本信息集中还包括有目标语义标签以及原始文本对应的真实语义标签,所述目标语义标签与所述真实语义标签不同;所述对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,包括:对各候选文本进行语义识别处理,得到各候选文本的语义标签以及各候选文本的置信度;根据各候选文本的语义标签,选出语义标签与所述目标语义标签一致的任一候选文本作为所述对抗文本。在一种可能的实施方式中,所述确定原始文本对应的字词序列,并确定各字词在所述原始文本中的优先级,包括:确定攻击场景,根据所述攻击场景确定原始文本对应的字词序列;根据所述攻击场景对应的优先级算法,对所述各字词在所述原始文本中的优先级进行计算。在一种可能的实施方式中,若所述各候选文本的语义标签均与所述目标语义标签不一致,则所述方法还包括:根据所述各候选文本以及各候选文本的置信度,对所述原始文本进行更新,并将更新后的原始文本作为新的原始文本;针对所述新的原始文本进行所述扰动处理,得到所述新的原始文本对应的多个新的候选文本,并判断是否能够根据各新的候选文本的语义标签,选出语义标签与所述目标语义标签一致的任一新的候选文本作为所述对抗文本;若否,则对所述新的原始文本再次进行更新并重复上述处理直至获得所述对抗文本。在一种可能的实施方式中,所述多种扰动处理包括以下处理中的至少一种:基于同义词的字词替换处理、基于语序的交换处理、基于拼音的字词替换处理、基于偏旁的字词拆分处理以及基于部首的替换处理。在一种可能的实施方式中,所述基于部首的替换处理包括:根据预设的偏旁部首表,对所述待处理字词中的每个待处理字符进行偏旁的拆分,得到所述每个待处理字符对应的至少一个偏旁;判断所述偏旁是否属于部首,若是,则对所述部首进行多次部首替换处理,以得到多个候选字符;从多个候选字符中选出与所述待处理字符字形相似度最高的候选字符作为基于部首的替换处理的处理结果。第二方面,本专利技术实施例提供一种对抗文本的生成装置,包括:获取模块,用于获取待处理的文本信息集,其中所述文本信息集中包括有原始文本;处理模块,用于对所述原始文本进行扰动处理,生成所述原始文本对应的多个候选文本;执行模块,用于对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,所述对抗文本用于对目标模型进行训练。第三方面,本专利技术实施例提供一种对抗文本的生成设备,包括:存储器和至少一个处理器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的对抗文本的生成方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的方法。本专利技术实施例提供的对抗文本的生成方法、装置、设备及存储介质,通过获取包括有原始文本的待处理的文本信息集,对原始文本进行扰动处理,生成原始文本对应的多个候选文本,进而对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,能够生成与原始文本的语义相似度高的对抗文本,即得到高质量的对抗文本,进而利用该高质量对抗文本可以对目标模型进行有效的训练,以使训练后的目标模型具有高鲁棒性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种应用场景示意图;图2为本专利技术实施例提供的一种对抗文本的生成方法的流程示意图;图3为本专利技术实施例提供的另一种对抗文本的生成方法的流程示意图;图4为本专利技术实施例提供的一种对抗文本的生成装置的结构示意图;图5为本专利技术实施例提供的一种对抗文本的生成设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。不良信息是对用户终端造成安全隐患的信息,一般的,不良信息可伪装成安全信息的样子,以诱使用户对不良信息进行点击和触发,达到破坏用户终端的设备安全和数据安全的目的。深度学习模型是一种可识别出哪些信息为不良信息并进行相应标识,以为用户进行安全预警的机器学习算法。其对到达用户终端的包括不本文档来自技高网...

【技术保护点】
1.一种对抗文本的生成方法,其特征在于,包括:/n获取待处理的文本信息集,其中所述文本信息集中包括有原始文本;/n对所述原始文本进行扰动处理,生成所述原始文本对应的多个候选文本;/n对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,所述对抗文本用于对目标模型进行训练。/n

【技术特征摘要】
1.一种对抗文本的生成方法,其特征在于,包括:
获取待处理的文本信息集,其中所述文本信息集中包括有原始文本;
对所述原始文本进行扰动处理,生成所述原始文本对应的多个候选文本;
对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,所述对抗文本用于对目标模型进行训练。


2.根据权利要求1所述的生成方法,其特征在于,所述对所述原始文本进行扰动处理,生成所述原始文本对应的多个候选文本,包括:
确定原始文本对应的字词序列,并确定各字词在所述原始文本中的优先级;
根据所述各字词的优先级从各字词中选出待处理字词,并对所述待处理字词进行多种扰动处理;
根据对所述待处理字词的多种扰动处理结果以及当前的原始文本生成所述原始文本对应的多个候选文本。


3.根据权利要求2所述的生成方法,其特征在于,所述待处理的文本信息集中还包括有目标语义标签以及原始文本对应的真实语义标签,所述目标语义标签与所述真实语义标签不同;
所述对各候选文本进行语义识别处理,根据语义识别处理结果确定原始文本对应的对抗文本,包括:
对各候选文本进行语义识别处理,得到各候选文本的语义标签以及各候选文本的置信度;
根据各候选文本的语义标签,选出语义标签与所述目标语义标签一致的任一候选文本作为所述对抗文本。


4.根据权利要求2所述的生成方法,其特征在于,所述确定原始文本对应的字词序列,并确定各字词在所述原始文本中的优先级,包括:
确定攻击场景,根据所述攻击场景确定原始文本对应的字词序列;
根据所述攻击场景对应的优先级算法,对所述各字词在所述原始文本中的优先级进行计算。


5.根据权利要求3所述的生成方法,其特征在于,若所述各候选文本的语义标签均与所述目标语义标签不一致,则所述方法还包括:
根据所述各候选文本以及各候选文本的置信度,对所述原始文本进行更新,并将更新后的原始文本作为新的原始文本;
...

【专利技术属性】
技术研发人员:张超张子晗刘明烜段海新孙东红李琦
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1