一种信息识别方法、装置、设备及存储介质、程序产品制造方法及图纸

技术编号:38932620 阅读:17 留言:0更新日期:2023-09-25 09:36
本申请提供了一种信息识别方法、装置、设备及存储介质、程序产品;本申请实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景,涉及人工智能技术;该方法包括:针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息;账号维度是指与待识别信息的交互账号相关的信息维度,内容维度是指与待识别信息的内容相关的信息维度;从账号维度和内容维度中筛选出目标维度,并针对目标维度的属性信息进行组合处理,得到待识别信息的组合属性信息;对组合属性信息进行特征转换,得到待识别信息对应的待识别特征;基于对待识别特征进行分类识别,确定待识别信息对应的信息识别结果。通过本申请,能够提高信息识别的准确度。能够提高信息识别的准确度。能够提高信息识别的准确度。

【技术实现步骤摘要】
一种信息识别方法、装置、设备及存储介质、程序产品


[0001]本申请涉及人工智能技术,尤其涉及一种信息识别方法、装置、设备及存储介质、程序产品。

技术介绍

[0002]网络上流转的信息中,有相当一部分为异常内容,当异常内容被使用者接收到时,会给使用者带来负面的影响,基于此,需要在使用者接收到信息之前,先对信息进行识别,以提前为使用者鉴别信息中是否异常内容。相关技术中,在确定信息是否为异常内容时,通常会基于信息的属性信息来实现。然而,无论是考虑属性的影响,还是将不同维度的属性向量进行结合,都是只考虑了不同属性自身的情况,忽略了不同属性之间的关联性,导致信息识别的准确度较低。

技术实现思路

[0003]本申请实施例提供一种信息识别方法、装置、设备及计算机可读存储介质、程序产品,能够提高信息识别的准确度。
[0004]本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供一种信息识别方法,包括:
[0006]针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息;所述账号维度是指与所述待识别信息的交互账号相关的信息维度,所述内容维度是指与所述待识别信息的内容相关的信息维度;
[0007]从所述账号维度和所述内容维度中筛选出目标维度,并针对所述目标维度的属性信息进行组合处理,得到所述待识别信息的组合属性信息;
[0008]对所述组合属性信息进行特征转换,得到所述待识别信息对应的待识别特征;
[0009]基于对所述待识别特征进行分类识别,确定所述待识别信息对应的信息识别结果;所述信息识别结果表征所述待识别信息是否为异常信息。
[0010]本申请实施例提供一种信息识别装置,包括:
[0011]属性确定模块,用于针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息;所述账号维度是指与所述待识别信息的交互账号相关的信息维度,所述内容维度是指与所述待识别信息的内容相关的信息维度;
[0012]属性组合模块,用于从所述账号维度和所述内容维度中筛选出目标维度,并针对所述目标维度的属性信息进行组合处理,得到所述待识别信息的组合属性信息;
[0013]特征转换模块,用于对所述组合属性信息进行特征转换,得到所述待识别信息对应的待识别特征;
[0014]结果识别模块,用于基于对所述待识别特征进行分类识别,确定所述待识别信息对应的信息识别结果;所述信息识别结果表征所述待识别信息是否为异常信息。
[0015]在本申请的一些实施例中,所述信息识别装置还包括:信息确定模块;所述信息确
定模块,用于针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息之前,获取新增入库信息;所述新增入库信息是最新接收到的信息;针对所述新增入库信息进行聚类处理,得到所述新增入库信息所属的聚类类别;将所述聚类类别的类簇中心所对应的信息样本,确定为所述待识别信息。
[0016]在本申请的一些实施例中,所述属性确定模块,还用于获取所述待识别信息的历史异常次数和历史拦截次数;其中,所述历史异常次数表征历史时间段内所述聚类类别所包含的信息样本的交互账号发生异常行为的次数;所述历史拦截次数表征所述历史时间段所述聚类类别所包含的信息样本被拦截的次数;针对所述新增入库信息的交互账号进行异常行为次数的统计,得到新增异常次数,以及针对所述新增入库信息进行拦截次数的统计,得到新增拦截次数;将所述新增异常次数和所述历史异常次数的累计结果,确定为所述待识别信息对应的所述账号维度的属性信息;依据所述新增拦截次数和所述历史拦截次数的累计结果,确定所述待识别信息对应的所述内容维度的属性信息。
[0017]在本申请的一些实施例中,所述属性确定模块,还用于获取所述新增入库信息对应的内容描述信息,以及所述新增入库信息的交互账号的基础账号信息;其中,所述内容描述信息中至少包括:所述新增入库信息的类别标签,所述新增入库信息所包含的网页链接的比例;所述基础账号信息至少包括:所述交互账号的白名单数量、所述交互账号的登录地址;将所述基础账号信息确定为所述待识别信息对应的所述账号维度的属性信息,以及将所述内容描述信息确定为所述内容维度的属性信息。
[0018]在本申请的一些实施例中,所述属性组合模块,还用于当所述目标维度包括账号维度时,从所述账号维度的属性信息中,筛选出至少两个目标账号属性,并对至少两个所述目标账号属性进行组合处理,得到所述待识别信息的所述组合属性信息;当所述目标维度包括内容维度时,从所述内容维度的属性信息中,筛选出至少两个目标内容属性,并对至少两个所述目标内容属性进行组合处理,得到所述待识别信息的所述组合属性信息;当所述目标维度包括所述内容维度和所述目标维度时,从所述账号维度的属性信息中筛选出待组合账号属性,并针对所述待组合账号属性,从所述内容维度的属性信息中筛选出匹配内容属性,以及利用所述待组合账号属性和所述匹配内容属性,确定所述待识别信息对应的所述组合属性信息。
[0019]在本申请的一些实施例中,所述组合属性信息包括:多个子属性信息;所述特征转换模块,还用于针对每个所述子属性信息进行特征转换,得到每个所述子属性信息对应的子特征;利用每个所述子属性信息对应的子特征,拼接得到所述待识别信息对应的所述待识别特征。
[0020]在本申请的一些实施例中,所述信息识别装置还包括:信息处理模块;所述信息处理模块,用于基于对所述待识别特征进行分类识别,确定所述待识别信息对应的信息识别结果之后,当所述信息识别结果表征所述待识别信息为异常信息时,对所述待识别信息进行拦截,并将所述待识别信息添加至异常名单;当所述信息识别结果表征所述待识别信息为正常信息时,对所述待识别信息进行转发,并将所述待识别信息添加至正常名单。
[0021]在本申请的一些实施例中,所述结果识别模块,还用于利用特征识别模型,对所述待识别特征进行异常信息的分类识别,得到异常预测概率;依据所述异常预测概率和概率阈值,确定所述待识别信息对应的所述信息识别结果。
[0022]在本申请的一些实施例中,所述特征识别模型包括:多个决策树模型;所述结果识别模块,还用于利用多个所述决策树模型,对所述待识别特征分别进行异常信息的分类识别,得到多个所述决策树模型对应的多个子预测概率;将多个所述子预测概率进行加权融合,得到所述待识别特征对应的所述异常预测概率。
[0023]在本申请的一些实施例中,所述信息识别装置还包括:模型训练模块;所述模型训练模块,用于针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息之前,获取初始识别模型、多个训练样本信息,以及多个所述训练样本信息各自的标签数据;针对多个所述训练样本信息,分别确定对应的账号维度的样本属性和内容维度的样本属性,并从所述账号维度和所述内容维度中筛选出所述目标维度,利用所述目标维度的样本属性组合得到多个所述训练样本信息的训练组合属性;依据所述训练组合属性,构建多个所述训练样本信息分别对应的训练识别特征;利用所述初始识别模型,对所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息识别方法,其特征在于,所述方法包括:针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息;所述账号维度是指与所述待识别信息的交互账号相关的信息维度,所述内容维度是指与所述待识别信息的内容相关的信息维度;从所述账号维度和所述内容维度中筛选出目标维度,并针对所述目标维度的属性信息进行组合处理,得到所述待识别信息的组合属性信息;对所述组合属性信息进行特征转换,得到所述待识别信息对应的待识别特征;基于对所述待识别特征进行分类识别,确定所述待识别信息对应的信息识别结果;所述信息识别结果表征所述待识别信息是否为异常信息。2.根据权利要求1所述的方法,其特征在于,所述针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息之前,所述方法还包括:获取新增入库信息;所述新增入库信息是最新接收到的信息;针对所述新增入库信息进行聚类处理,得到所述新增入库信息所属的聚类类别;将所述聚类类别的类簇中心所对应的信息样本,确定为所述待识别信息。3.根据权利要求2所述的方法,其特征在于,所述针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息,包括:获取所述待识别信息的历史异常次数和历史拦截次数;其中,所述历史异常次数表征历史时间段内所述聚类类别所包含的信息样本的交互账号发生异常行为的次数;所述历史拦截次数表征所述历史时间段所述聚类类别所包含的信息样本被拦截的次数;针对所述新增入库信息的交互账号进行异常行为次数的统计,得到新增异常次数,以及针对所述新增入库信息进行拦截次数的统计,得到新增拦截次数;将所述新增异常次数和所述历史异常次数的累计结果,确定为所述待识别信息对应的所述账号维度的属性信息;依据所述新增拦截次数和所述历史拦截次数的累计结果,确定所述待识别信息对应的所述内容维度的属性信息。4.根据权利要求2所述的方法,其特征在于,所述针对待识别信息确定对应的账号维度的属性信息和内容维度的属性信息,包括:获取所述新增入库信息对应的内容描述信息,以及所述新增入库信息的交互账号的基础账号信息;其中,所述内容描述信息中至少包括:所述新增入库信息的类别标签,所述新增入库信息所包含的网页链接的比例;所述基础账号信息至少包括:所述交互账号的白名单数量、所述交互账号的登录地址;将所述基础账号信息确定为所述待识别信息对应的所述账号维度的属性信息,以及将所述内容描述信息确定为所述内容维度的属性信息。5.根据权利要求1至4任一项所述的方法,其特征在于,所述针对所述目标维度的属性信息进行组合处理,得到所述待识别信息的组合属性信息,包括:当所述目标维度包括账号维度时,从所述账号维度的属性信息中,筛选出至少两个目标账号属性,并对至少两个所述目标账号属性进行组合处理,得到所述待识别信息的所述组合属性信息;
当所述目标维度包括内容维度时,从所述内容维度的属性信息中,筛选出至少两个目标内容属性,并对至少两个所述目标内容属性进行组合处理,得到所述待识别信息的所述组合属性信息;当所述目标维度包括所述内容维度和所述目标维度时,从所述账号维度的属性信息中筛选出待组合账号属性,并针对所述待组合账号属性,从所述内容维度的属性信息中筛选出匹配内容属性,以及利用所述待组合账号属性和所述匹配内容属性,确定所述待识别信息对应的所述组合属性信息。6.根据权利要求1至4任一项所述的方法,其特征在于,所述组合属性信息包括:多个子属性信息;所述对所述组合属性信息进行特征转换,得到所述待识别信息对应的待识别特征,包括:针对每个所述子属性信息进行特征转换,得到每个所述子属性信息对应的子特征;利用每个所述子属性信息对应的子特征,拼接得到所述待识别信息对应的所述待识别特征。7.根据权利要求1至4任一项所述的方法,其特征在于,所述基于对所述待识别特征进行分类识别,确定所述待识别信息对应的信息识别结果之后,所述方法还包括:当所述信息识别结果表征所述待识别信息为异常信息时,对所述待识别信息进行拦截,并将所述待识别信息添加至异常名单;当所...

【专利技术属性】
技术研发人员:陈德和林初仁李晶
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1