一种图片识别方法和装置制造方法及图纸

技术编号：25916280 阅读：24 留言：0更新日期：2020-10-13 10:35

本发明专利技术公开了图片识别方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括接收图片，识别图片中的文本；根据预设的字符类别，分别将文本进行类别提取，以计算得到对应字符类别的相关性分析报告；根据各字符类别的相关性分析报告进行文本的预处理；基于预设的目标词库，对预处理后的文本进行截取；通过文本语义提取模型，对截取后的文本进行处理得到文本的向量表征；将文本的向量表征输入至预设的识别模型，确定是否存在目标行为信息。从而，本发明专利技术的实施方式能够解决现有图片审核效率低、精准度差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种图片识别方法和装置
本专利技术涉及计算机
，尤其涉及一种图片识别方法和装置。
技术介绍
在电商平台上有大量的物品在售卖，物品的用户评价对消费者的购买行为至关重要。但是，为了提高物品好评率，在物品主图，或者详情页上会印有好评返现的相关信息，比如：好评返现等。这种行为严重误导了消费者，并且会导致比较差的购物体验。在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：由于每天的物品变动数量十分庞大，而每个物品的图片数量有的十几张，甚至几十张。使用人工的方式来审核不能够覆盖全部的待审核的物品，而且标准不统一。使用规则方式审核，没有考虑语境的信息，如，如果商家坚持正常经营，不搞好评返现，因此会在物品详情页中，表述此类意思：“我们没有好评返现”，或者“我们拒绝好评返现”，使用规则的方式则会导致误判。使用规则加上人工的方式进行审核，先使用规则构建待审核的物品集合，然后由人工进行审核，这种方式无法做到实时处理，对商家的体验非常不好。
技术实现思路
有鉴于此，本专利技术实施例提供一种图片识别方法和装置，能够解决现有图片审核效率低、精准度差的问题。为实现上述目的，根据本专利技术实施例的一个方面，提供了一种图片识别方法，包括接收图片，识别图像中的文本；根据预设的字符类别，分别将文本进行类别提取，以计算得到对应字符类别的相关性分析报告；根据各字符类别的相关性分析报告进行文本的预处理；基于预设的目标词库，对预处理后的文本进行截取；通过文本语义提取模型，对截取后的文本进行处理得到...

【技术保护点】
1.一种图片识别方法，其特征在于，包括：/n接收图片，识别图片中的文本；/n根据预设的字符类别，分别将文本进行类别提取，以计算得到对应字符类别的相关性分析报告；/n根据各字符类别的相关性分析报告进行文本的预处理；/n基于预设的目标词库，对预处理后的文本进行截取；/n通过文本语义提取模型，对截取后的文本进行处理得到文本的向量表征；/n将文本的向量表征输入至预设的识别模型，确定是否存在目标行为信息。/n

【技术特征摘要】
1.一种图片识别方法，其特征在于，包括：
接收图片，识别图片中的文本；
根据预设的字符类别，分别将文本进行类别提取，以计算得到对应字符类别的相关性分析报告；
根据各字符类别的相关性分析报告进行文本的预处理；
基于预设的目标词库，对预处理后的文本进行截取；
通过文本语义提取模型，对截取后的文本进行处理得到文本的向量表征；
将文本的向量表征输入至预设的识别模型，确定是否存在目标行为信息。

2.根据权利要求1所述的方法，其特征在于，计算得到对应字符类别的相关性分析报告，包括：
提取文本中对应字符类别的所有字符，基于皮尔逊系数将所述所有字符映射成预设数量的维度向量，进而得到对应的分析报告。

3.根据权利要求2所述的方法，其特征在于，根据各字符类别的相关性分析报告进行文本的预处理，包括：
在字符类别的相关性分析报告中，判断是否存在数值大于预设阈值的；若存在则确定该字符类别与目标行为信息存在关系，保留对象文本中属于该字符类别的所有字符；若不存在则确定该字符类别与目标行为信息不存在关系，舍弃对象文本中属于该字符类别的所有字符。

4.根据权利要求1所述的方法，其特征在于，基于预设的目标词库，对预处理后的文本进行截取，包括：
基于预设的目标词库，定位预处理后的文本中的目标字符；
在目标字符前截取第一预设长度的第一文本，且在目标字符后截取第二预设长度的第二文本；
根据第一文本、目标字符和第二文本，得到截取后的文本。

【专利技术属性】
技术研发人员：周彬，黄明星，李银锋，刘婷婷，赖晨东，
申请(专利权)人：北京沃东天骏信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人