富文本文档的风险检测方法、装置及可读存储介质制造方法及图纸

技术编号：32365250 阅读：21 留言：0更新日期：2022-02-20 03:38

本申请公开一种富文本文档的风险检测方法、装置及可读存储介质，用以解决现有技术中存在的检测富文本文档风险的方法不准确的问题。该方法包括：在富文本文档中，定位第一数据流；其中，所述第一数据流是设定的第一控制字前的起始符与所述起始符匹配的结束符之间的数据；读取所述第一数据流中控制字的读位属性，基于所述读位属性删除或保留所述第一数据流中控制字后的数据，得到第一数据；其中，当读位属性为删除时，指示删除对应控制字之后到相邻的下一个控制字之间的数据；基于所述第一数据中的内嵌对象或者链接，确定所述富文本文档存在风险。存在风险。存在风险。

全部详细技术资料下载

【技术实现步骤摘要】
富文本文档的风险检测方法、装置及可读存储介质

[0001]本申请涉及网络安全
，尤其涉及富文本文档的风险检测方法、装置及可读存储介质。

技术介绍

[0002]富文本文档(Rich Text Format，RTF文档)，是一种采用ASCII作为编码格式的文档，RTF文档能够被多种解析器解析。由于不同解析器对RTF文档规范中未进行严格要求(或者不够细化)的内容存在理解差异，所得到的解析结果也会出现差异。上述这种差异性，使得攻击者能在RTF文档中插入恶意对象，并对其字符串流进行混淆，得以绕过普通的第三方解析工具，达到静态反检测的目的。
[0003]因此，现有技术中检测富文本文档风险的方法不准确。

技术实现思路

[0004]本申请提供一种富文本文档的风险检测方法、装置及可读存储介质，用以解决现有技术中存在的检测富文本文档风险的方法不准确的问题。
[0005]第一方面，本申请提供一种富文本文档的风险检测方法，所述方法包括：
[0006]在富文本文档中，定位第一数据流；其中，所述第一数据流是设定的第一控制字前的起始符与所述起始符匹配的结束符之间的数据；
[0007]读取所述第一数据流中控制字的读位属性，基于所述读位属性删除或保留所述第一数据流中控制字后的数据，得到第一数据；其中，当读位属性为删除时，指示删除对应控制字之后到相邻的下一个控制字之间的数据；
[0008]基于所述第一数据中的内嵌对象或者链接，确定所述富文本文档存在风险。
[0009]上述操作通过读取

【技术保护点】

【技术特征摘要】
1.一种富文本文档的风险检测方法，其特征在于，所述方法包括：在富文本文档中，定位第一数据流；其中，所述第一数据流是设定的第一控制字前的起始符与所述起始符匹配的结束符之间的数据；读取所述第一数据流中控制字的读位属性，基于所述读位属性删除或保留所述第一数据流中控制字后的数据，得到第一数据；其中，当读位属性为删除时，指示删除对应控制字之后到相邻的下一个控制字之间的数据；基于所述第一数据中的内嵌对象或者链接，确定所述富文本文档存在风险。2.如权利要求1所述的方法，其特征在于，所述第一控制字为objdata。3.如权利要求2所述的方法，其特征在于，所述在富文本文档中，定位第一数据流之前，包括：检测富文本文档是否包含基础恶意特征；其中，所述基础恶意特征指任一安全解析软件识别出的恶意特征；若是，则确定所述富文本文档存在风险；若否，则定位第一数据流。4.如权利要求3所述的方法，其特征在于，所述基础恶意特征包括：不合规的头部标志、可疑的文档创建者和最后修改者、头部前或后的设定范围内出现控制字、非期望控制字、控制字连续次数超过第一阈值、特定字符使用次数超过第二阈值、控制字长度超过第三阈值、两个16进制字符中出现非期望字符。5.如权利要求1～4任一所述的方法，其特征在于，所述读取所述第一数据流中控制字的读位属性，包括；当读取到任一控制字的读位属性为空时，则基于所述读位属性的追溯性，依次向所述任一控制字之前追溯距离最近的控制字的读位属性，直到确定所述任一控制字的读位属性；其中，所述追溯性指所述任一控制字的读位属性与距离最近的，同级控制字或者上级控制字的读位属性相同。6.如权利要求5所述的方法，其特征在于，所述基...

【专利技术属性】
技术研发人员：魏阳，宋倚天，赵光远，杨晖，吴铁军，
申请(专利权)人：北京神州绿盟科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人