System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本信息处理的方法、装置、设备及计算机存储介质制造方法及图纸_技高网

文本信息处理的方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:43075158 阅读:0 留言:0更新日期:2024-10-22 14:49
本申请公开了一种文本信息处理的方法、装置、设备及计算机存储介质。本公开通过获取词单元中的文本信息,利用文本划分线划分文本信息对应的区域,能够得到多个包括子文本信息的子区域,其中,多个子区域中的子文本信息拼接得到文本信息。本公开通过绘制多个子区域中子文本信息对应的子文本图片,将多个子文本图片替换文本信息,得到目标信息,能够降低目标信息被爬取并识别成功的风险,提高目标信息的安全性。

【技术实现步骤摘要】

本公开涉及信息安全领域,尤其涉及一种文本信息处理的方法、装置、设备及计算机存储介质


技术介绍

1、目前,普通用户可以通过互联网浏览网页得到自身感兴趣的内容信息。但是,存在部分非正常用户使用爬虫技术爬取网页中的敏感文本信息并用于非正常用途,造成极大的信息安全泄露风险。

2、相关技术中,通常采用标注文本信息并打乱顺序或者将文本信息对应的字符编码重新映射的方法防止网页中的敏感文本信息被爬取。但是利用相关技术保护的敏感文本信息仍然容易被破解识别,导致网页敏感文本信息的安全性不高。


技术实现思路

1、本公开实施例提供一种文本信息处理的方法、装置、设备、计算机存储介质和计算机程序产品,能够提高网页敏感文本信息的安全性。

2、第一方面,本专利技术实施例提供一种文本信息处理的方法,方法包括:

3、获取词单元中的文本信息,词单元是网页中目标词的集合;

4、利用文本划分线划分文本信息对应的区域,得到多个包括子文本信息的子区域,所述子区域中的子文本信息是所述文本信息的一部分,多个子区域中的子文本信息拼接得到文本信息;

5、绘制多个子区域中子文本信息对应的子文本图片;

6、将多个子文本图片替换文本信息,得到目标信息。

7、在一个可以实现的实施方式中,包括子文本信息的子区域包括第一划分区域和第二划分区域,子文本信息包括第一子文本信息和第二子文本信息,利用文本划分线划分文本信息对应的区域,得到多个包括子文本信息的子区域,包括

8、利用文本划分线划分文本信息对应的区域,得到第一划分区域和第二划分区域;

9、将文本划分线沿第一方向平移第一距离得到第一目标划分线,第一方向是指向第一划分区域的方向;将文本划分线沿第二方向平移第一距离得到第二目标划分线,第二方向是指向第二划分区域的方向;

10、将第一目标划分线沿第二方向包括的区域对应的文本信息确定为第一子文本信息;将第二目标划分线沿第一方向包括的区域对应的文本信息确定为第二子文本信息。

11、在一个可以实现的实施方式中,子文本图片包括第一子文本图片和第二子文本图片,绘制多个子区域中子文本信息对应的子文本图片,包括:

12、将第一子文本信息拓印在预设第一画布,得到第一子文本图片;将第二子文本信息拓印在预设第二画布,得到第二子文本图片。

13、在一个可以实现的实施方式中,在将第一子文本信息拓印在预设第一画布,得到第一子文本图片;将第二子文本信息拓印在预设第二画布,得到第二子文本图片之前,方法还包括:

14、确定与第一子文本信息所在区域大小对应的第一画布;确定与第二子文本信息所在区域大小对应的第二画布。

15、在一个可以实现的实施方式中,在将多个子文本图片替换文本信息,得到目标信息之前,方法还包括:

16、检测第一子文本图片和第二子文本图片;

17、在检测到第一子文本图片和第二子文本图片的情况下,将第一子文本图片和第二子文本图片替换文本信息,得到目标信息。

18、第二方面,本公开实施例提供了一种文本信息处理的装置,装置包括:

19、获取模块,获取模块用于获取词单元中的文本信息,词单元是网页中目标词的集合;

20、划分模块,划分模块用于利用文本划分线划分文本信息对应的区域,得到多个包括子文本信息的子区域,多个子区域中的子文本信息拼接得到文本信息;

21、绘制模块,绘制模块用于绘制多个子区域中子文本信息对应的子文本图片;

22、替换模块,替换模块用于将多个子文本图片替换文本信息,得到目标信息。

23、第三方面,本公开实施例提供了一种文本信息处理的设备,设备包括处理器,以及存储有计算机程序指令的存储器;处理器读取并执行计算机程序指令,以实现如第一方面的任意一项的文本信息处理的方法。

24、第四方面,本公开实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的任意一项的文本信息处理的方法。

25、第五方面,本公开实施例提供了一种计算机程序产品,包括计算机程序,计算机程序被处理其执行时实现如第一方面的任意一项的文本信息处理的方法。

26、本公开实施例提供的文本信息处理的方法、装置、设备、计算机存储介质及计算机程序产品,获取词单元中的文本信息,利用文本划分线划分文本信息对应的区域,将文本信息划分为多个子文本信息,每个子文本信息只包括文本信息的一部分,得到多个包括子文本信息的子区域,即得到的子区域中包括的子文本信息都不是完整的文本信息。然后绘制多个子区域中子文本信息对应的子文本图片,将多个子文本图片替换文本信息,得到目标信息。由于子文本图片中的子文本信息不是完整的文本信息,基于此,降低了目标信息被爬取并识别成功的风险,提高目标信息的安全性。

本文档来自技高网...

【技术保护点】

1.一种文本信息处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述包括子文本信息的子区域包括第一划分区域和第二划分区域,所述子文本信息包括第一子文本信息和第二子文本信息,所述利用文本划分线划分所述文本信息对应的区域,得到多个包括子文本信息的子区域,包括:

3.根据权利要求2所述的方法,其特征在于,所述子文本图片包括第一子文本图片和第二子文本图片,所述绘制多个所述子区域中子文本信息对应的子文本图片,包括:

4.根据权利要求3所述的方法,其特征在于,在所述将所述第一子文本信息拓印在预设第一画布,得到第一子文本图片;将所述第二子文本信息拓印在预设第二画布,得到第二子文本图片之前,所述方法还包括:

5.根据权利要求2-4中任意一项所述的方法,其特征在于,在所述将所述多个子文本图片替换所述文本信息,得到目标信息之前,所述方法还包括:

6.一种文本信息处理的装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述包括子文本信息的子区域包括第一划分区域和第二划分区域,所述子文本信息包括第一子文本信息和第二子文本信息,所述划分模块采用如下方式利用文本划分线划分所述文本信息对应的区域,得到多个包括子文本信息的子区域:

8.一种文本信息处理的设备,其特征在于,所述设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-5任意一项所述的文本信息处理的方法。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-5任意一项所述的文本信息处理的方法。

10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理其执行时实现权利要求1-5任一项所述的文本信息处理的方法。

...

【技术特征摘要】

1.一种文本信息处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述包括子文本信息的子区域包括第一划分区域和第二划分区域,所述子文本信息包括第一子文本信息和第二子文本信息,所述利用文本划分线划分所述文本信息对应的区域,得到多个包括子文本信息的子区域,包括:

3.根据权利要求2所述的方法,其特征在于,所述子文本图片包括第一子文本图片和第二子文本图片,所述绘制多个所述子区域中子文本信息对应的子文本图片,包括:

4.根据权利要求3所述的方法,其特征在于,在所述将所述第一子文本信息拓印在预设第一画布,得到第一子文本图片;将所述第二子文本信息拓印在预设第二画布,得到第二子文本图片之前,所述方法还包括:

5.根据权利要求2-4中任意一项所述的方法,其特征在于,在所述将所述多个子文本图片替换所述文本信息,得到目标信息之前,所述方法还包括:

6.一种文本信息...

【专利技术属性】
技术研发人员:任晋宏张飞
申请(专利权)人:中移物联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1