一种多要素语义验证码及其生成方法技术

技术编号:38232032 阅读:18 留言:0更新日期:2023-07-25 17:59
本发明专利技术公开了一种多要素语义验证码及其生成方法,包括以下两个环节:S100.图文素材生成;通过图文素材生成模块实现图文素材生成,其中,图文素材包括描述文本库和与描述文本对应的图片库和信息库;S200.语义验证码生成;通过语义验证码生成模块实现语义验证码生成,包括确定多要素语义验证码对应的描述文本,确定目标图片和干扰图片,并将描述文本、目标图片和干扰图片组合成多要素语义验证码。采用本方法的验证码生产图片素材效率高、基于图文的多要素语义匹配难以轻易被模型破解,安全性高。安全性高。安全性高。

【技术实现步骤摘要】
一种多要素语义验证码及其生成方法


[0001]本专利技术涉及计算机及网络安全
,尤其是涉及一种多要素语义验证码及其生成方法。

技术介绍

[0002]验证码是一种网络安全技术,它能有效地验证用户的身份,防止恶意攻击和风险事件。验证码在人机交互界面中扮演着重要的角色,广泛应用于网站和APP的各种场景,如注册、登录、交易、交互等,对于保护用户账户的安全起到了关键作用。然而,验证码也面临着黑灰产的破解威胁,他们利用各种技术手段进行快速大规模的破解,从而实施批量注册、批量登录、恶意爬虫等违法行为。验证码是一种用于验证用户身份的技术,它可以防止机器人或恶意软件冒充人类进行网络操作。验证码的发展历经了多个阶段,从最初的图形验证码,到后来的行为验证码,再到现在的各种新型验证码,都是为了提高验证码的安全性和用户体验而不断创新的。
[0003]谷歌推出的验证码reCAPTCHA,在国外被广泛使用,其利用在绘制地图时通过车辆拍下的街景图为验证码提供素材,以九宫格的形式呈现。当检测到用户行为异常的时候,要求用户点选九宫格中包含某物体的图片,直至不再出现包含该物体的图片为止,以达到区分人和机器行为的目的。现有的验证码,无论是最常见的滑块验证码,还是文字或图标点选验证码,通常需要一张或多张图片,构成验证码的素材。黑灰产破解各种形式验证码,主要是机器破解和人工打码两种,其中机器破解主要是通过识别图片中的相关验证要素来进行破解。
[0004]现有验证码技术至少面临以下两方面的问题:一是为了防止被黑产爬取图片素材构建图库,进而利用图像匹配进行破解,验证码厂商往往需要不断更新用于验证码的图片素材,而这就需要通过互联网等途经不断搜集图片素材或由设计师不断创造图片,这一过程耗时耗力,限制了图片素材的更新频率,从而限制了验证码的安全性。
[0005]二是随着深度学习技术的发展,人工智能在视觉领域已经能媲美甚至超越人类水平。利用深度学习技术,黑灰产能自动、较为准确地识别图片中的文字或物体,对现有验证码的安全性带来了极大的挑战。

技术实现思路

[0006]针对现有技术存在的问题,本专利技术的目的在于提出一种多要素语义验证码及利用AIGC技术的生成方法,能有效克服现有验证码生产图片素材效率低、基于图片识别的验证码能轻易被深度学习模型破解的缺点。
[0007]为实现上述目的,本专利技术提供一种多要素语义验证码的生成方法,所述方法包括以下两个环节:S100. 图文素材生成;通过图文素材生成模块实现图文素材生成,其中,图文素材
包括描述文本库和与描述文本对应的图片库和信息库;S200. 语义验证码生成;通过语义验证码生成模块实现语义验证码生成,包括确定多要素语义验证码对应的描述文本,确定目标图片和干扰图片,并将描述文本、目标图片和干扰图片组合成多要素语义验证码。
[0008]进一步,S100中进一步包括以下步骤:S1.生成描述文本库;描述文本包含三个要素:物体、背景和行为;S2.生成描述文本对应的图片库和图片信息库。
[0009]进一步,步骤S1中生成描述文本库的具体实现流程如下:S11.生成物体列表;物体可以包含属性;S12.生成背景列表;背景可以包含属性;S13.生成行为列表;具体行为由动作组成;S14.从上述三个列表中随机组合物体、背景和行为,生成多条描述文本,存储到描述文本库中,存储内容包括描述文本及对应的三个要素。
[0010]进一步,步骤S2具体实现流程如下:S21.遍历或抽取描述文本库中的描述文本;S22.利用AI图片生成模型生成符合该文本描述的任意多张图片;模型生成过程中需要将目标图片的描述文本作为输入;S23.在图片库中存储生成的图片,并在图片信息库中存储图片对应的信息,包括物体、背景、行为、描述文本以及存储路径和生成时间。
[0011]进一步,使用的AI图片生成模型包括但不限于Stable Diffusion、DALL

E、VAE或GAN。
[0012]进一步,S200中语义验证码生成环节包括以下步骤:S3.确定多要素语义验证码对应的目标图片和描述文本;S4.按预定规则,抽取指定数目的干扰图片;S5.将目标图片、描述文本、干扰图片组合成多要素语义验证码。
[0013]进一步,步骤S4具体实现流程如下:S41.确定干扰图片的数目;S42.确定抽取干扰图片的规则;规则根据验证码的难度需求而设置;S43.在图片信息库中随机选取符合规则的、指定数量的干扰图片。
[0014]进一步,验证码的难度分别低难度和高难度;低难度要求时,要求三个要素之一的“物体”与目标图片不一致;高难度要求时,要求三个要素之一的“物体”与目标图片一致,“背景”和/或“行为”不同。
[0015]进一步,确定验证码的布局为n*m,准备好n*m

1张干扰图片后,和目标图片随机排列成n*m的布局。
[0016]另一方面,本专利技术提供一种多要素语义验证码,所述多要素语义验证码由根据本专利技术所述的多要素语义验证码的生成方法所生成,所述多要素语义验证码包含一句文字描述和多张图片,其中多张图片中有且仅有一张目标图片与文字描述相吻合,用户需要根据文字描述选择正确图片,才能通过验证。
[0017]本专利技术提出的多要素语义验证码及其生成方法的有益效果如下:
其一,利用AIGC技术让机器自动生成符合文本描述的图片,大大提高了产图的效率,能大幅提高用于验证码的图片素材的更新频率,进而使得黑产进行“图库攻击”的手段失效,提高了验证码的安全性。其二,该多要素语义验证码,要求用户在九宫格中找出符合文本描述的图片,其中文本包含了物体、背景、行为三大要素。破解谷歌的验证码reCAPTCHA,可视为目标检测的任务,仅要求单要素(物体)匹配,现有深度学习技术能轻松解决;而相比之下,该多要素语义验证码要求的是多要素的匹配,只有完全理解图片的语义才能实现,大大提升了黑灰产破解的难度;加之利用AIGC自动从文本生成图片,具有随机性和不可逆性,即使训练大语言模型进行破解,也需要大量的算力,大大提升了破解的成本,通常黑灰产不具备这方面的破解能力。
附图说明
[0018]图1示出了根据本专利技术实施例的多要素语义验证码生成方法流程图;图2示出了根据本专利技术实施例的生成描述文本流程图;图3示出了根据本专利技术实施例的生成图片素材流程图;图4示出了根据本专利技术实施例的语义验证码生成流程图;图5示出了根据本专利技术实施例的多要素语义验证码的示意图。
具体实施方式
[0019]下面将结合附图,对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多要素语义验证码的生成方法,其特征在于,所述方法包括以下两个环节:S100. 图文素材生成;通过图文素材生成模块实现图文素材生成,其中,图文素材包括描述文本库和与描述文本对应的图片库和信息库;S200. 语义验证码生成;通过语义验证码生成模块实现语义验证码生成,包括确定多要素语义验证码对应的描述文本,确定目标图片和干扰图片,并将描述文本、目标图片和干扰图片组合成多要素语义验证码。2.根据权利要求1所述的一种多要素语义验证码的生成方法,其特征在于,S100中进一步包括以下步骤:S1.生成描述文本库;描述文本包含三个要素:物体、背景和行为;S2.生成描述文本对应的图片库和图片信息库。3.根据权利要求2所述的一种多要素语义验证码的生成方法,其特征在于,其中步骤S1中生成描述文本库的具体实现流程如下:S11.生成物体列表;物体包含属性;S12.生成背景列表;背景包含属性;S13.生成行为列表;具体行为由动作组成;S14.从上述三个列表中随机组合物体、背景和行为,生成多条描述文本,存储到描述文本库中,存储内容包括描述文本及对应的三个要素。4.根据权利要求2所述的一种多要素语义验证码的生成方法,其特征在于,步骤S2具体实现流程如下:S21.遍历或抽取描述文本库中的描述文本;S22.利用AI图片生成模型生成符合该文本描述的任意多张图片;模型生成过程中需要将目标图片的描述文本作为输入;S23.在图片库中存储生成的图片,并在图片信息库中存储图片对应的信息,包括物体、背景、行为、描述文本以及存储路径和生成时间。5.根据权利要求4所述的一种多要素语义验证码的生成方法,其特征在于,使用...

【专利技术属性】
技术研发人员:陈龙陈德蕾陈树华
申请(专利权)人:北京顶象技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1