对象识别方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：20842246 阅读：18 留言：0更新日期：2019-04-13 08:42

本公开实施例公开了一种对象识别方法、装置、电子设备及计算机可读存储介质，所述方法包括：获取相关文本信息；其中，所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息；利用第一预设词库识别所述相关文本信息中出现的第一新词；在不拆分所述第一新词的前提下，对相关文本信息进行分词处理；将分词处理后的所述相关文本信息输入至词向量生成模型进行训练，在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。本公开实施例能够从相关文本信息识别出未知对象的变种关键词，进而能够正确识别出未知对象。

全部详细技术资料下载

【技术实现步骤摘要】
对象识别方法、装置、电子设备及计算机可读存储介质
本公开涉及计算机
，具体涉及一种对象识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展，各种各样的应用平台应运而生，同时也出现了不少不发分子利用互联网技术的一些漏洞规则进行一些违法犯罪活动。例如，目前现金贷等无抵押贷款十分火爆，引起不法分子利用漏洞规则进行套现等违法犯罪活动。蚂蚁花呗、京东白条等是目前十分普遍的套现产品，其原理是一个虚假卖家发布虚拟商品，买家用花呗支付，商家提成10％。这种虚拟商品在电商平台上十分普遍。为了打击这种现象，传统的方法是通过文字检索识别虚假商品，但是现在很多虚假卖家会进行隐蔽工程，将虚假商品进行伪装，比如改变商品名称，将商品名称变为拼音等其他别名，或者利用图片式文字对虚假商品进行描述。而传统的方式对这类现象无法识别，因此需要一种更好的识别方法来进行虚假商品的识别。
技术实现思路
本公开实施例提供一种对象识别方法、装置、电子设备及计算机可读存储介质。第一方面，本公开实施例中提供了一种对象识别方法。具体的，所述对象识别方法，包括：获取相关文本信息；其中，所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息；利用第一预设词库识别所述相关文本信息中出现的第一新词；在不拆分所述第一新词的前提下，对相关文本信息进行分词处理；将分词处理后的所述相关文本信息输入至词向量生成模型进行训练，在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。结合第一方面，本公开在第一方面的第一种实现方式中，获取相关文本信息之后，还包括：对所述相关文本信息进...

【技术保护点】
1.一种对象识别方法，其特征在于，包括：获取相关文本信息；其中，所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息；利用第一预设词库识别所述相关文本信息中出现的第一新词；在不拆分所述第一新词的前提下，对相关文本信息进行分词处理；将分词处理后的所述相关文本信息输入至词向量生成模型进行训练，在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。

【技术特征摘要】
1.一种对象识别方法，其特征在于，包括：获取相关文本信息；其中，所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息；利用第一预设词库识别所述相关文本信息中出现的第一新词；在不拆分所述第一新词的前提下，对相关文本信息进行分词处理；将分词处理后的所述相关文本信息输入至词向量生成模型进行训练，在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别。2.根据权利要求1所述的对象识别方法，其特征在于，获取相关文本信息之后，还包括：对所述相关文本信息进行预处理，并对预处理后的所述相关文本信息进行语义分割。3.根据权利要求1所述的对象识别方法，其特征在于，所述已知对象和/或未知对象为系统平台上发布的虚拟对象；所述获取相关文本信息，包括：获取所述虚拟对象在所述系统平台上的发布内容和/或用户评论；根据所述发布内容和/或用户评论确定所述相关文本信息。4.根据权利要求1-3任一项所述的对象识别方法，其特征在于，将分词处理后的所述相关文本信息输入至词向量生成模型进行训练，在训练完成后根据所述词向量生成模型的训练结果对所述未知对象进行识别,包括：根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量；根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别。5.根据权利要求4所述的对象识别方法，其特征在于，根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的至少一个第一词向量和所述第二文本信息对应的至少一个第二词向量，包括：根据训练完成后所述词向量生成模型输出的结果获取所述第一文本信息对应的多个第一词向量构成的词向量矩阵；根据训练完成后所述词向量生成模型输出的结果获取所述已知对象的关键词汇对应的第二词向量；其中，所述关键词汇包含在所述第二文本信息中。6.根据权利要求5所述的对象识别方法，其特征在于，根据所述第一词向量与第二词向量之间的相似度对所述未知对象进行识别，包括：确定所述第二词向量与所述词向量矩阵的相似度，并确定所述未知对象是否为已知对象。7.一种对象识别装置，其特征在于，包括：获取模块，被配置为获取相关文本信息；其中，所述相关文本信息包括未知对象的第一文本信息和已知对象的第二文本信息；新词...

【专利技术属性】
技术研发人员：张林江，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人