一种新闻内容安全监测方法、系统、装置和存储介质制造方法及图纸

技术编号:27511014 阅读:30 留言:0更新日期:2021-03-02 18:41
本申请涉及一种新闻内容安全监测方法、系统、装置和存储介质,包括建立监测词列表,监测词列表内包含错别字、敏感词和红标词;依次调取所述监测词列表内的错别字、敏感词和红标词,与新闻内容匹配;若新闻内容存在监测词列表内的错别字、敏感词和红标词,则根据出现的监测词做出不同级别的警报提示,以提示编辑对所述新闻内容修改;获取并识别所述新闻内容中的图片和视频,根据图片和视频做相关处理;发送修改后的新闻内容至主编端,以提示主编对所述新闻内容人工检查,修改后的新闻内容确认无误后对修改后的新闻内容进行发布。本申请具有减小新闻发布内容的错字、敏感词和红标词的几率,提高用户的阅读体验效果。提高用户的阅读体验效果。提高用户的阅读体验效果。

【技术实现步骤摘要】
一种新闻内容安全监测方法、系统、装置和存储介质


[0001]本申请涉及新闻内容监测的领域,尤其是涉及一种新闻内容安全监测方法、系统、装置和存储介质。

技术介绍

[0002]在新闻稿件编写过程中,编辑难免会存在写错别字的情况,甚至编辑会不小心发布一些存在敏感词或红标词的内容,现在一般均由编辑写完自己检查内容,再由给主编检查,检查无误后即发布新闻内容。
[0003]但是人为检查出错几率较大,且影响因素较多,例如编辑或主编当天精神状态不好,检查效果不佳,导致带有错别字、敏感词和红标词的稿件发布到网络上。
[0004]现在网络传播速度快,传播面广,若发布的新闻内容出现错别字、敏感词和红标词,容易带来不好的谬论影响,同时影响网友的阅读体验。

技术实现思路

[0005]为了减小新闻发布内容的错字、敏感词和红标词的几率,本申请提供一种新闻内容安全监测方法、系统和装置。
[0006]第一方面,本申请提供的一种新闻内容安全监测方法,采用如下的技术方案:一种新闻内容安全监测方法,包括:建立监测词列表,所述监测词列表内包含错别字、敏感词和红标词;依次调取所述监测词列表内的错别字、敏感词和红标词,与新闻内容匹配;若所述新闻内容存在所述监测词列表内的错别字、敏感词和红标词,则根据出现的监测词做出不同级别的警报提示,以提示编辑对所述新闻内容修改;获取并识别所述新闻内容中的图片或视频,根据所述图片或所述视频做相关处理,所述相关处理包括根据所述图片或所述视频的类别对所述图片或所述视频做打码或删除处理;发送修改后的新闻内容至主编端,以提示主编通过所述主编端对所述新闻内容人工检查,所述修改后的新闻内容确认无误后对所述修改后的新闻内容进行发布。
[0007]通过采用上述技术方案,当编辑写完一篇新闻稿时,对这篇新闻稿做内容安全监测,将监测词列表中的监测词调取并对新闻稿的文本进行匹配,若在新闻稿中出现监测词,则针对不同的监测词做不同的警报提示,以提醒编辑对新闻稿做修改;监测词包含错别字、敏感词和红标词,其中敏感词表示国家领导人姓名、国家重要机构领导人、省市县歌曲领导和机构领导人、某些敏感事件等,红标词表示带有敏感政治倾向、暴力倾向、不健康色彩的词或不文明词等,若新闻稿中出现这类词语,监测出后提示编辑对新闻内容及时进行修改,避免不慎将带有这类词语的新闻稿发布,造成不好的谬论影响;服务器同时对新闻内容中的图片和视频做相关处理,避免新闻稿中的图片和视频出现违规现象;当编辑将新闻稿修改好后,将新闻稿发送至主编,以使主编人工检查,避免出现未监测到的违规词语、图片或
视频,进一步降低新闻稿出现违规词语、图片或视频的现象,进一步避免造成不好的谬论影响,同时进一步提高阅读者的阅读体验。
[0008]本专利技术在一较佳示例中可以进一步配置为:所述获取并识别所述新闻内容中的图片,根据所述图片做相关处理包括:对各图片类别准备对应的预设数量的样本图片,并标定每一样本对应的图片类别;利用所述样本图片对预设类型的识别模型进行训练;获取所述新闻内容中的图片;将所述图片输入至所述识别模型中进行识别,并输出识别结果;根据所述识别结果对所述图片做相关处理;若所述识别结果为所述图片出现人物露脸,则对所述图片出现人物的面部进行打码;若所述识别结果为所述图片出现暴力,则删除所述图片。
[0009]通过采用上述技术方案,先根据多个样本图片进行训练,并分别标记识别模型的不同类别,再将新闻内容中的图片输入至识别模型中,从而判断该图片的类别,若该图片出现人物露脸,应对该图片的人物面部进行打码,避免新闻内容侵犯肖像权;若该图片为暴力图片,应删除该图片,避免编辑不慎将暴力图片发至网络,造成不好的影响。
[0010]本专利技术在一较佳示例中可以进一步配置为:所述获取并识别所述新闻内容中的图片,根据所述图片做相关处理还包括:获取所述图片;将所述图片与云服务器中的图片比对;获取所述云服务器中与所述图片相同的所有网站;获取所述所有网站的图片发布日期,选出发布日期最早的网站图片的作者;对所述新闻内容中的图片下方标注转自所述作者。
[0011]通过采用上述技术方案,获取新闻内容中的图片,以根据图片在云服务器搜索一样的图片,并找到发布这些相同图片的所有网站,再获取所有网站中对于图片发布日期最早的那一个,则判定该网站的图片发布为源文件,则自动在本新闻内容的图片下方标明图片或视频转自改为昂展的作者,避免本新闻内容发布后出现侵权现象。
[0012]本专利技术在一较佳示例中可以进一步配置为:所述获取并识别所述新闻内容中的视频,根据所述视频做相关处理还包括:获取所述视频的所有帧图像,并识别所述帧图像的对应像素值;比对相邻所述帧图像的对应像素值,若相邻所述帧图像的对应像素值差值大于预设值,则提取两张相邻所述帧图像的后一帧图像,并定义所述后一帧图像为场景帧;获取所述云服务器中同时包含所有所述场景帧的视频的网站;获取所述网站的视频发布日期,选出发布日期最早的网站视频的作者;对所述新闻内容中的视频下方标注转自所述作者。
[0013]通过采用上述技术方案,获取新闻内容中的视频的所有帧图像,并根据所有帧图像中每相邻两帧的像素值比对,找出视频中每次场景转换的第一帧,并定义该帧为场景帧,根据该视频中的所有场景帧,匹配云服务器中所有视频,找出同时包含所有场景帧的视频,并根据找出的相同或视频,获取发布该相同视频最早的网站,则判定该网站的视频为源文件,则自动在本新闻内容的视频下方标明图片转自该网站的作者,避免本新闻内容发布后
出现侵权现象本专利技术在一较佳示例中可以进一步配置为:所述发送修改后的新闻内容至主编端后包括:主编端接收所述修改后的新闻内容,以使主编通过所述主编端对所述修改后的新闻内容进行人工检查;若发现出现新的错别字、新的敏感词和新的红标词,主编端对所述新的错别字、所述新的敏感词和所述新的红标词进行标记并将所述新的错别字、所述新的敏感词和所述新的红标词补充至所述监测词列表;将进行标记后的新闻内容发送至所述编辑端,以使编辑对所述标记后的新闻内容进行修改。
[0014]通过采用上述技术方案,当新闻内容修改完后,还需主编对修改后的新闻内容再做一次人工检查,避免出现某些词语未被监测到的情况,若出现新的错别字、敏感词或红标词,主编对新的错别字、敏感词或红标词补充到监测词列表内,避免编辑出现同样的错误后,服务器依旧未能监测到,不断对监测词列表进行更新,进一步降低新闻内容出现错别字、敏感词或红标词的几率。
[0015]本专利技术在一较佳示例中可以进一步配置为:当编辑端对所述新闻内容修改完成后,所述方法还包括:提取所述新闻内容的关键词,根据所述关键词与所述云服务器中的新闻内容匹配;选择匹配度大于预设值的新闻内容的网站,获取所述网站中新闻内容的发布时间;获取所述编辑端对所述新闻内容修改完成后的时间,将所述时间与所述发布时间比对,若差值大于预设值,则判定所述修改后的新闻内容不具备时效性。
[0016]通过采用上述技术方案,根据写好的新闻内容,提取新闻内容的关键词,关键词可为标题和新闻本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种新闻内容安全监测方法,其特征在于,包括:建立监测词列表,所述监测词列表内包含错别字、敏感词和红标词;依次调取所述监测词列表内的错别字、敏感词和红标词,与新闻内容匹配;若所述新闻内容存在所述监测词列表内的错别字、敏感词和红标词,则根据出现的监测词做出不同级别的警报提示,以提示编辑对所述新闻内容修改;获取并识别所述新闻内容中的图片或视频,根据所述图片或所述视频做相关处理,所述相关处理包括根据所述图片或所述视频的类别对所述图片或所述视频做打码或删除处理;发送修改后的新闻内容至主编端,以提示主编通过所述主编端对所述新闻内容人工检查,所述修改后的新闻内容确认无误后对所述修改后的新闻内容进行发布。2.根据权利要求1所述的方法,其特征在于,所述获取并识别所述新闻内容中的图片,根据所述图片做相关处理包括:对各图片类别准备对应的预设数量的样本图片,并标定每一样本对应的图片类别;利用所述样本图片对预设类型的识别模型进行训练;获取所述新闻内容中的图片;将所述图片输入至所述识别模型中进行识别,并输出识别结果;根据所述识别结果对所述图片做相关处理;若所述识别结果为所述图片出现人物露脸,则对所述图片出现人物的面部进行打码;若所述识别结果为所述图片出现暴力,则删除所述图片。3.根据权利要求2所述的方法,其特征在于,所述获取并识别所述新闻内容中的图片,根据所述图片做相关处理还包括:获取所述图片;将所述图片与云服务器中的图片比对;获取所述云服务器中与所述图片相同的所有网站;获取所述所有网站的图片发布日期,选出发布日期最早的网站图片的作者;对所述新闻内容中的图片下方标注转自所述作者。4.根据权利要求2所述的方法,其特征在于,所述获取并识别所述新闻内容中的视频,根据所述视频做相关处理还包括:获取所述视频的所有帧图像,并识别所述帧图像的对应像素值;比对相邻所述帧图像的对应像素值,若相邻所述帧图像的对应像素值差值大于预设值,则提取两张相邻所述帧图像的后一帧图像,并定义所述后一帧图像为场景帧;获取所述云服务器中同时包含所有所述场景帧的视频的网站;获取所述网站的视频发布日期,选出发布日期最早的网站视频的作者;对所述新闻内容中的视频下方标注转自所述作者。5.根据权利要求1所述的方法,其特征在于,所述发送修改后的新闻内容至主编端后包括:主编端接收所述修改后的新闻内容,以使主编通过所述主编端对所述修改后的新闻内容进行人工检查;若发现出现新的错别字、新的敏感词和新的红标词,主编端对所述新的错别字、所述新
的敏感词和所述新的红标词进行标记并将所述新的错别字、所述新的敏感词和所述新的红标词补充至所述监测词列表;将进行标记后的新闻内容发送至所述编辑端,以使编辑对所述标记后的新闻内容进行修改。6.根据权利要求3所述的方法,其特征在于,当所述编辑端对所述新闻内容修改完成后,所述方法还包括:提取所述新闻内容的关键词,根据所述关键词与所述云服务器中的新闻内容匹配;选择匹配度大于预设值的新闻内容的网站,获取所述网站中新闻内容的发布时间;获取所述编辑端对所述新闻内容修改完成后的时间,将所述时间与所述发布时间比对,若差值大于预设值,则判定所述修改后的新闻内容不具备时效性。7.根据权利要求3所述的...

【专利技术属性】
技术研发人员:康维舒斌贺弘联方华孔泽平王冠华周珞肖顺红陈光林周欣霓谢宇周超
申请(专利权)人:湖南红网新媒体集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1