本发明专利技术公开了一种识别恶意信息的方法及装置,属于互联网通信领域。所述方法包括:接收用户发送的第一通讯信息;获取所述用户的历史信息记录,所述历史信息记录中包括在离当前时间最近的预设时间段内所述用户发送的每个第二通讯信息;根据所述历史信息记录,识别所述第一通讯信息是否为恶意信息。所述装置包括:接收模块、第一获取模块和识别模块。本发明专利技术能够识别出不包括特征词集合中的特征词的恶意信息。
【技术实现步骤摘要】
本专利技术设及互联网通信领域,特别设及一种识别恶意信息的方法及装置。
技术介绍
目前,用户经常通过即时通讯应用或社交网络与好友进行聊天W增进与好友之间 的感情,但是越来越多的恶意份子通过即时通讯应用或社交网络发送恶意信息给用户,如 此会给用户带来打扰。为了屏蔽运些恶意信息W避免给用户带来打扰,服务器需要识别运 些恶意信息,W便屏蔽运些恶意信息。 当前,现有技术提供了一种识别恶意信息的方法,包括:技术人员根据经验捜集恶 意信息中常用的特征词,将捜集到的特征词组成特征词集合,将特征词集合发布到服务器 上。当服务器接收到用户发送的通讯信息时,查看特征词集合,如果该通讯信息中包括特征 词集合中包括的特征词,则将该通讯信息确定为恶意信息。 在实现本专利技术的过程中,专利技术人发现现有技术至少存在W下问题: 阳〇化]当恶意份子利用新的特征词组合成恶意信息时,由于特征词集合中不包括运些新 的特征词,所W导致服务器无法识别出该恶意信息。
技术实现思路
为了识别出不包括特征词集合中的特征词的恶意信息,本专利技术提供了一种识别恶 意信息的方法及装置。所述技术方案如下: 一种识别恶意信息的方法,所述方法包括: 接收用户发送的第一通讯信息; 获取所述用户的历史信息记录,所述历史信息记录中包括在离当前时间最近的预 设时间段内所述用户发送的每个第二通讯信息; 根据所述历史信息记录,识别所述第一通讯信息是否为恶意信息。 一种识别恶意信息的装置,所述装置包括: 接收模块,用于接收用户发送的第一通讯信息; 第一获取模块,用于获取所述用户的历史信息记录,所述历史信息记录中包括在 离当前时间最近的预设时间段内所述用户发送的每个第二通讯信息; 识别模块,用于根据所述历史信息记录,识别所述第一通讯信息是否为恶意信息。 在本专利技术实施例中,接收用户发送的第一通讯信息;获取该用户的历史信息记录, 该历史信息记录中包括在离当前时间最近的预设时间段内该用户发送的每个第二通讯信 息;根据该历史信息记录,识别第一通讯信息是否为恶意信息。由于获取了用户的历史信息 记录,如此当第一通讯信息中不包括特征词集合中的特征词时,可W根据用户的历史信息 记录来识别第一通讯信息是否为恶意信息,如此能够识别出不包括特征词集合中的特征词 的恶意f旨息D【附图说明】 图1是本专利技术实施例1提供的一种识别恶意信息的方法流程图; 图2是本专利技术实施例2提供的一种识别恶意信息的方法流程图;[001引图3是本专利技术实施例3提供的一种识别恶意信息的方法流程图; 图4是本专利技术实施例4提供的一种识别恶意信息的装置结构示意图。【具体实施方式】 为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方 式作进一步地详细描述。 阳OW 实施例1 阳02引参见图1,本专利技术实施例提供了一种识别恶意信息的方法,包括: 步骤101 :接收用户发送的第一通讯信息; 步骤102 :获取该用户的历史信息记录,该历史信息记录中包括在离当前时间最 近的预设时间段内该用户发送的每个第二通讯信息; 阳0巧]步骤103 :根据该历史信息记录,识别第一通讯信息是否为恶意信息。 优选地,根据该历史信息记录,识别第一通讯信息是否为恶意信息,包括: 根据第一通讯信息和历史信息记录,计算第一通讯信息分别与历史信息记录中包 括的每个第二通讯信息之间的相似度; 获取与第一通讯信息之间的相似度超过预设相似度阔值的第二通讯信息的数 目; 当获取的第二通讯信息的数目超过预设数目阔值时,确定第一通讯信息为恶意信 息。 优选地,根据第一通讯信息和历史信息记录,计算第一通讯信息分别与历史信息 记录中包括的每个第二通讯信息之间的相似度,包括: 将第一通讯信息转换为第一信息矩阵,W及将第二通讯信息转换为第二信息矩 阵; 计算第一信息矩阵与第二信息矩阵之间的距离方差; 根据第一信息矩阵与第二信息矩阵之间的距离方差,计算第一通讯信息与第二通 讯信息之间的相似度。 阳034] 优选地,将第一通讯信息转换为第一信息矩阵,包括: 从第一通讯信息包括的单词中获取关系表中存在的单词作为第一单词,W及获取 关系表中不存在的单词作为第二单词,该关系表中包括单词与索引值的对应关系; 从关系表中获取第一单词对应的索引值; 为第二单词分配对应的索引值; 将第一单词对应的索引值和第二单词对应的索引值组成第一通讯信息对应的第 一信息矩阵。 优选地,根据第一信息矩阵与第二信息矩阵之间的距离方差,计算第一通讯信息 与第二通讯信息之间的相似度,包括: 计算第一信息矩阵与第二信息矩阵之间的距离方差的倒数; 将该倒数确定为第一通讯信息与第二通讯信息之间的相似度。 进一步地,获取用户的历史信息记录之前,还包括: 确定第一通讯信息中是否包括特征词集合中的特征词,如果包括,则识别出第一 通讯信息为恶意信息,如果不包括,则执行获取用户的历史信息记录的操作。 进一步地,该方法还包括: 如果第一通讯信息不包括特征词集合中的特征词且识别出第一通讯信息为恶意 信息,则从第一通讯信息中获取特征词; 将获取的特征词添加到特征词集合中。 优选地,根据历史信息记录,识别第一通讯信息是否为恶意信息,包括: 获取第一通讯信息和每个第二通讯信息中包括的每个单词,组成单词集合; 根据第一通讯信息和历史信息记录,生成单词集合中包括的每个单词分别对应的 单词矩阵; 根据单词集合中包括的每个单词对应的单词矩阵,确定第一通讯信息中包括的特 征词; 当第一通讯信息中包括的特征词的数目超过第二预设数目阔值时,识别第一通讯 f目息为恶意f目息。 优选地,根据单词集合中包括的每个单词对应的单词矩阵,确定第一通讯信息中 包括的特征词,包括: 计算第=单词对应的单词矩阵分别与单词集合中包括的除第=单词W外的每个 单词对应的单词矩阵之间的距离方差,第=单词为第一通讯信息中包括的任一单词; 获取与第=单词对应的单词矩阵之间的距离方差小于预设方差阔值的每个单词 矩阵; 当获取的单词矩阵的数目超过第=预设数目阔值时,将第=单词确定为特征词。 在本专利技术实施例中,接收用户发送的第一通讯信息;获取该用户的历史信息记录, 该历史信息记录中包括在离当前时间最近的预设时间段内该用户发送的每个第二通讯信 息;根据该历史信息记录,识别第一通讯信息是否为恶意信息。由于获取了用户的历史信息 记录,如此当第一通讯信息中不包括特征词集合中的特征词时,可W根据用户的历史信息 记录来识别第一通讯信息是否为恶意信息,如此能够识别出不包括特征词集合中的特征词 的恶意f目息。 实施例2 本专利技术实施例提供了一种识别恶意信息的方法。 目前,用户经常通过即时通讯应用或社交网络发送通讯信息给好友,但是越来越 多的恶意份子通过即时通讯应用或社交网络发送恶意信息给用户,恶意信息可W为广告信 息或欺诈信息等,运些恶意信息会给用户带来打扰。为了屏蔽运些恶意信息W避免给用户 带来打扰,服务器可W通过本专利技术实施例提供的方法来识别运些恶意信息,W便屏蔽运些 恶意f目息。 参见图2,该方法具体包括: 步骤201 :接收用户发送的第一通讯信息和该用户的用户账号; 其中,用户在通过即时通讯应用或社交网络与好友进行聊天时,用户编辑第一通 讯信息,第一通讯信息包括至少一个单词。用户对应的终本文档来自技高网...
【技术保护点】
一种识别恶意信息的方法,其特征在于,所述方法包括:接收用户发送的第一通讯信息;获取所述用户的历史信息记录,所述历史信息记录中包括在离当前时间最近的预设时间段内所述用户发送的每个第二通讯信息;根据所述历史信息记录,识别所述第一通讯信息是否为恶意信息。
【技术特征摘要】
【专利技术属性】
技术研发人员:詹奕深,
申请(专利权)人:广州华多网络科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。