数据检测的方法、装置、设备及计算机存储介质制造方法及图纸

技术编号：44498002 阅读：8 留言：0更新日期：2025-03-04 18:05

本申请公开了一种数据检测的方法、装置、设备及计算机存储介质。该方法获取云盘中的目标数据，利用加密算法对目标数据加密，得到加密数据。在加密数据与违规内容数据库的数据不匹配的情况下，从视频数据中提取关键帧数据。将关键帧数据输入图像语义分割模型，利用图像语义分割模型提取关键帧数据中的第一特征信息和语义信息得到语义分割图像，利用图像语义分割模型中将语义分割图像进行分类，得到人物图像集合和场景图像集合。基于第一目标模型中的分类器对对应的图像集合的特征向量进行计算，得到目标类别概率值。本公开通过从视频数据中提取关键帧数据确定视频文件是否违规，减少了检测视频文件的时间，能够提高对视频文件的检测效率。

全部详细技术资料下载

【技术实现步骤摘要】

本领域涉及云，尤其涉及一种数据检测的方法、装置、设备、计算机存储介质及计算机程序产品。

技术介绍

1、随着信息化的发展，越来越多的用户选择将自己的隐私数据存放在云盘中。

2、目前，存在部分用户将违规视频文件存放至云盘的现象，使违规视频文件通过云盘分享的形式流传开，对社会治安造成了极大的影响。为了避免违规视频文件的流传和保存，相关技术中，通常采用人工检测的方式对用户保存的视频文件进行识别和屏蔽，但是，采用人工检测的方式检测视频违规信息所需时长较长，导致检测效率不高。

技术实现思路

1、本公开实施例提供一种数据检测的方法、装置、设备、计算机存储介质及计算机程序产品，能够提高对视频文件的检测效率。

2、第一方面，本公开实施例提供一种数据检测的方法，方法包括：

3、获取云盘中的目标数据，目标数据包括视频数据；

4、将视频数据中的关键帧数据输入图像语义分割模型，利用图像语义分割模型提取关键帧数据中的第一特征信息和语义信息得到语义分割图像，利用图像语义分割模型中的分类模块将语义分割图像进行分类，得到人物图像集合和场景图像集合；

5、基于第一目标模型中的分类器对对应的人物图像集合或场景图像集合的特征向量进行计算，得到目标类别概率值；

6、在目标类别概率值大于目标阈值的情况下，标记视频数据存在违规视频信息。

7、在一个可以实现的实施方式中，在将视频数据中的关键帧数据输入图像语义分割模型之前，数据检测的方法还包括：</p>

8、利用加密算法对目标数据进行加密，得到加密数据；

9、在加密数据与违规内容数据库的数据不匹配的情况下，从视频数据中提取关键帧数据；

10、从视频数据中提取关键帧数据，包括：

11、对视频数据进行帧截取操作，得到多个图像帧数据；

12、基于多个图像帧数据的对应的图像熵，选取不同图像熵之间的差值大于预设阈值的图像熵或为极值的图像熵对应的图像帧，得到备选图像帧数据；

13、对备选图像帧数据进行差分运算，提取备选图像帧数据中的关键帧数据。

14、在一个可以实现的实施方式中，利用图像语义分割模型提取关键帧数据中的第一特征信息和语义信息得到语义分割图像，包括：

15、利用图像语义分割模型中的特征提取模块，对关键帧数据进行特征提取，得到第一特征信息；

16、利用图像语义分割模型中的语义提取模块，对第一特征信息进行语义边界提取，得到语义信息；

17、利用图像语义分割模型中的融合模块，对第一特征信息和语义信息进行融合，得到语义分割图像。

18、在一个可以实现的实施方式中，第一目标模型包括多个子模型，子模型用于识别不同类型的违规行为；类型包括第一类型，第一类型对应的子模型识别第一类型的违规行为的具体过程，包括：

19、利用第一类型对应的子模型中的特征提取模块，对人物图像集合中的人物图像进行特征提取操作，得到尺度不变特征变换sift特征信息；

20、利用第一预设算法，计算人物图像的当前帧和下一帧的光流特征向量信息；

21、利用第二预设算法，计算人物图像的图像颜色特征信息；

22、将sift特征信息、光流特征向量信息和图像颜色特征信息拼接，得到第二特征信息；

23、将第二特征信息转换得到特征向量。

24、在一个可以实现的实施方式中，第一目标模型包括多个子模型，子模型用于识别不同类型的违规行为；类型包括第二类型，第二类型对应的子模型识别第二类型的违规行为具体过程，包括：

25、对场景图像集合中的场景图像进行下采样操作，得到操作信息；

26、利用第二类型对应的子模型中的第一卷积模块对场景图像进行卷积操作，得到卷积映射信息；

27、将操作信息和卷积映射信息进行融合，得到融合信息；

28、利用第二类型对应的子模型中的第二卷积模块和第三卷积模块对融合信息进行特征提取，得到第三特征信息；

29、将第三特征信息转换得到特征向量。

30、在一个可以实现的实施方式中，目标数据还包括文本数据，在加密数据与违规内容数据库的数据不匹配的情况下，方法还包括：

31、利用第二目标模型对文本数据的文本进行截取操作，得到截取文本；

32、基于预设数据库中的数据信息，计算截取文本的相似度信息；

33、在相似度信息大于第一阈值的截取文本的数量大于第二阈值的情况下，标记文本数据存在违规文本信息。

34、在一个可以实现的实施方式中，在第二目标模型是敏感词模型的情况下，利用第二目标模型对文本数据的文本进行截取操作，得到截取文本，包括：

35、利用敏感词模型对文本数据的文本进行分词处理，得到词序列；

36、基于预设数据库中的数据信息，计算截取文本的相似度信息；在相似度信息大于第一阈值的截取文本的数量大于第二阈值的情况下，标记文本数据存在违规文本信息，包括：

37、基于预设敏感词数据库中的数据信息，计算词序列中的词汇的敏感相似度信息；

38、在敏感相似度信息大于第一阈值的词汇的数量大于第二阈值的情况下，标记文本数据存在违规文本信息。

39、在一个可以实现的实施方式中，在第二目标模型是主题模型的情况下，利用第二目标模型对文本数据的文本进行截取操作，得到截取文本，包括：

40、利用主题模型对文本数据的文本进行文本主题提取处理，得到文本主题；

41、基于预设数据库中的数据信息，计算截取文本的相似度信息；在相似度信息大于第一阈值的截取文本的数量大于第二阈值的情况下，标记文本数据存在违规文本信息，包括：

42、基于预设违规主题数据库中的数据信息，计算文本主题的违规主题相似度信息；

43、在违规主题相似度信息大于第一阈值的文本主题的数量大于第二阈值的情况下，标记文本数据存在违规文本信息。

44、在一个可以实现的实施方式中，目标数据还包括图像数据，在加密数据与违规内容数据库的数据不匹配的情况下，方法还包括：

45、将图像数据输入第三目标模型；

46、利用第三目标模型中的分类器对图像数据的特征向量进行计算，得到图像类别概率值；

47、在图像类别概率值大于第三阈值的情况下，标记图像数据存在违规图像信息。

48、在一个可以实现的实施方式中，数据检测的方法还包括：

49、在检测到存在违规视频信息、违规文本信息和违规图像信息中的任意一项的目标数据的数量大于预设数量阈值的情况下，标记目标数据对应的用户为违规用户。

50、第二方面，本公开实施例提供了一种数据检测的装置，装置包括：

51、获取模块，用于获取云盘中的目标数据，目标数据包括视频数据；

52、输入模块，用于将关键帧数据输入图像语义分割模型本文档来自技高网...

【技术保护点】

1.一种数据检测的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述将所述视频数据中的关键帧数据输入图像语义分割模型之前，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述利用所述图像语义分割模型提取所述关键帧数据中的第一特征信息和语义信息得到语义分割图像，包括：

4.根据权利要求1所述的方法，其特征在于，所述第一目标模型包括多个子模型，所述子模型用于识别不同类型的违规行为；类型包括第一类型，所述第一类型对应的子模型识别第一类型的违规行为的具体过程，包括：

5.根据权利要求1所述的方法，其特征在于，所述第一目标模型包括多个子模型，子模型用于识别不同类型的违规行为；类型包括第二类型，所述第二类型对应的子模型识别第二类型的违规行为具体过程，包括：

6.根据权利要求2所述的方法，其特征在于，所述目标数据还包括文本数据，在所述加密数据与违规内容数据库的数据不匹配的情况下，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，在所述第二目标模型是敏感词模型的情况下，所述利用第

8.根据权利要求6所述的方法，其特征在于，在所述第二目标模型是主题模型的情况下，所述利用第二目标模型对所述文本数据的文本进行截取操作，得到截取文本，包括：

9.根据权利要求2所述的方法，其特征在于，所述目标数据还包括图像数据，在所述加密数据与违规内容数据库的数据不匹配的情况下，所述方法还包括：

10.根据权利要求1至9任意一项所述的方法，其特征在于，所述方法还包括：

...

【技术特征摘要】

1.一种数据检测的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述将所述视频数据中的关键帧数据输入图像语义分割模型之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述第一目标模型包括多个子模型，子模型用于识别不同类型的违规行为；类型包括第二类型，所述第二类型对应的子模型识别第二类型的违规行为具体过程，包...

【专利技术属性】
技术研发人员：黎伟健，李小青，张云，王德才，胡莎，黄珊珊，徐佳明，蔡一栋，
申请(专利权)人：中移互联网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人