对象识别方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:20842246 阅读:18 留言:0更新日期:2019-04-13 08:42
本公开实施例公开了一种对象识别方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;利用第一预设词库识别所述相关文本信息中出现的第一新词;在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。本公开实施例能够从相关文本信息识别出未知对象的变种关键词,进而能够正确识别出未知对象。

【技术实现步骤摘要】
对象识别方法、装置、电子设备及计算机可读存储介质
本公开涉及计算机
,具体涉及一种对象识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,各种各样的应用平台应运而生,同时也出现了不少不发分子利用互联网技术的一些漏洞规则进行一些违法犯罪活动。例如,目前现金贷等无抵押贷款十分火爆,引起不法分子利用漏洞规则进行套现等违法犯罪活动。蚂蚁花呗、京东白条等是目前十分普遍的套现产品,其原理是一个虚假卖家发布虚拟商品,买家用花呗支付,商家提成10%。这种虚拟商品在电商平台上十分普遍。为了打击这种现象,传统的方法是通过文字检索识别虚假商品,但是现在很多虚假卖家会进行隐蔽工程,将虚假商品进行伪装,比如改变商品名称,将商品名称变为拼音等其他别名,或者利用图片式文字对虚假商品进行描述。而传统的方式对这类现象无法识别,因此需要一种更好的识别方法来进行虚假商品的识别。
技术实现思路
本公开实施例提供一种对象识别方法、装置、电子设备及计算机可读存储介质。第一方面,本公开实施例中提供了一种对象识别方法。具体的,所述对象识别方法,包括:获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;利用第一预设词库识别所述相关文本信息中出现的第一新词;在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。结合第一方面,本公开在第一方面的第一种实现方式中,获取相关文本信息之后,还包括:对所述相关文本信息进行预处理,并对预处理后的所述相关文本信息进行语义分割。结合第一方面,本公开在第一方面的第二种实现方式中,所述已知对象和/或未知对象为系统平台上发布的虚拟对象;所述获取相关文本信息,包括:获取所述虚拟对象在所述系统平台上的发布内容和/或用户评论;根据所述发布内容和/或用户评论确定所述相关文本信息。结合第一方面、第一方面的第一种实现方式或第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别,包括:根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量;根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别。结合第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量,包括:根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的多个第一词向量构成的词向量矩阵;根据训练完成后所述词向量生成模型输出的结果获取所述已知对象的关键词汇对应的第二词向量;其中,所述关键词汇包含在所述第二文本信息中。结合第一方面的第四种实现方式,本公开在第一方面的第五种实现方式中,根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别,包括:确定所述第二词向量与所述词向量矩阵的相似度,并确定所述未知对象是否为已知对象。第二方面,本公开实施例提供了一种对象识别装置,包括:获取模块,被配置为获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;新词识别模块,被配置为利用第一预设词库识别所述相关文本信息中出现的第一新词;分词模块,被配置为在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;对象识别模块,被配置为将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。结合第二方面,本公开在第二方面的第一种实现方式中,所述获取模块之后,还包括:预处理模块,被配置为对所述相关文本信息进行预处理,并对预处理后的所述相关文本信息进行语义分割。结合第二方面,本公开在第二方面的第二种实现方式中,所述已知对象和/或未知对象为系统平台上发布的虚拟对象;所述获取模块,包括:第一获取子模块,被配置为获取所述虚拟对象在所述系统平台上的发布内容和/或用户评论;第一确定子模块,被配置为根据所述发布内容和/或用户评论确定所述相关文本信息。结合第二方面、第二方面的第一种实现方式或第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,所述对象识别模块,包括:第二获取子模块,被配置为根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量;识别子模块,被配置为根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别。结合第二方面的第三种实现方式,本公开在第二方面的第四种实现方式中,所述第二获取子模块,包括:第三获取子模块,被配置为根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的多个第一词向量构成的词向量矩阵;第四获取子模块,被配置为根据训练完成后所述词向量生成模型输出的结果获取所述已知对象的关键词汇对应的第二词向量;其中,所述关键词汇包含在所述第二文本信息中。结合第二方面的第四种实现方式,本公开在第二方面的第五种实现方式中,所述识别子模块,包括:第二确定子模块,被配置为确定所述第二词向量与所述词向量矩阵的相似度,并确定所述未知对象是否为已知对象。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,对象识别装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持对象识别装置执行上述第一方面中对象识别方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述对象识别装置还可以包括通信接口,用于对象识别装置与其他设备或通信网络通信。第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现第一方面所述的方法步骤。第四方面,本公开实施例提供了一种计算机可读存储介质,用于存储对象识别装置所用的计算机指令,其包含用于执行上述第一方面中对象识别方法所涉及的计算机指令。本公开实施例提供的技术方案可以包括以下有益效果:本公开实施例在获取了相关文本信息后,利用第一预设词库识别出相关文本信息中出现的第一新词,并在确保不拆分第一新词的前提下,对相关文本信息进行分词处理,分词处理后的相关文本信息输入至预先训练好的词向量生成模型,并根据词向量生成模型输出的结果确定与所述未知对象相关的已知对象。通过这种方式,在对相关文本信息进行词向量识别之前,先从中识别出新词,以防止通过分词处理将这些新词给拆分开来,导致相关文本信息没有按照常规用词对未知对象进行描述的情况下,无法正确识别出未知对象的问题,本公开实施例能够从相关文本信息识别出未知对象的变种关键词,进而能够正确识别出未知对象。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限本文档来自技高网...

【技术保护点】
1.一种对象识别方法,其特征在于,包括:获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;利用第一预设词库识别所述相关文本信息中出现的第一新词;在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。

【技术特征摘要】
1.一种对象识别方法,其特征在于,包括:获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;利用第一预设词库识别所述相关文本信息中出现的第一新词;在不拆分所述第一新词的前提下,对相关文本信息进行分词处理;将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。2.根据权利要求1所述的对象识别方法,其特征在于,获取相关文本信息之后,还包括:对所述相关文本信息进行预处理,并对预处理后的所述相关文本信息进行语义分割。3.根据权利要求1所述的对象识别方法,其特征在于,所述已知对象和/或未知对象为系统平台上发布的虚拟对象;所述获取相关文本信息,包括:获取所述虚拟对象在所述系统平台上的发布内容和/或用户评论;根据所述发布内容和/或用户评论确定所述相关文本信息。4.根据权利要求1-3任一项所述的对象识别方法,其特征在于,将分词处理后的所述相关文本信息输入至词向量生成模型进行训练,在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别,包括:根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量;根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别。5.根据权利要求4所述的对象识别方法,其特征在于,根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量,包括:根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的多个第一词向量构成的词向量矩阵;根据训练完成后所述词向量生成模型输出的结果获取所述已知对象的关键词汇对应的第二词向量;其中,所述关键词汇包含在所述第二文本信息中。6.根据权利要求5所述的对象识别方法,其特征在于,根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别,包括:确定所述第二词向量与所述词向量矩阵的相似度,并确定所述未知对象是否为已知对象。7.一种对象识别装置,其特征在于,包括:获取模块,被配置为获取相关文本信息;其中,所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息;新词...

【专利技术属性】
技术研发人员:张林江
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1