物品质量检测模型建立的方法和装置制造方法及图纸

技术编号:25891426 阅读:21 留言:0更新日期:2020-10-09 23:33
本发明专利技术公开了物品质量检测模型建立的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对物品的文本信息进行预处理,生成所述物品的第一信息;根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量;根据所述特征向量,建立物品质量检测模型。该实施方式解决了现有技术中存在的词库维护成本高、召回率低、需要耗费大量人力资源的技术缺陷,进而达到在不提高开发成本的前提下、提高检测的准确率和召回率、提升工作效率、节约人力成本的技术效果。

【技术实现步骤摘要】
物品质量检测模型建立的方法和装置
本专利技术涉及计算机
,尤其涉及一种物品质量检测模型建立的方法和装置。
技术介绍
为了保证物品的质量,需要建立准确可靠的模型对物品质量进行检测,从而指导物品生产者改善商品质量。现有技术采用:业务相关的工作人员,通过阅读物品的文本信息确定物品的质量。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:1.词库维护成本高,召回率低,需要耗费大量人力资源从历史文本里提取关键词;2.现有技术准确率低,开发成本高。
技术实现思路
有鉴于此,本专利技术实施例提供一种物品质量检测模型建立,能够达到在不提高开发成本的前提下、提高检测的准确率和召回率、提升工作效率、节约人力成本的技术效果。为实现上述目的,根据本专利技术实施例的一个方面,提供了物品质量检测模型建立的方法,包括:对物品的文本信息进行预处理,生成所述物品的第一信息;根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量;根据所述特征向量,建立物品质量检测模型。可选地,对物品的文本信息进行预处理,生成所述物品的第一信息,包括:剔除所述物品的文本信息中的特殊字符,生成第一文本信息;将所述第一文本信息转换为按照文本顺序排列的字符序列;根据预设序列长度截取所述字符序列,并在截取的所述字符序列的首尾添加分隔符,生成所述物品的第二文本信息;将所述第二文本信息进行向量化,生成所述物品的第一信息。可选地,将所述第二文本信息进行向量化,生成所述物品的第一信息,包括:对所述第二文本信息中的每个字符对应的数值进行编码,生成数值编码;对所述字符在所述第二文本信息中的位置进行编码,生成位置编码;其中,所述数值编码和所述位置编码的维度相同;将所述数值编码和所述位置编码按对应的维度进行加和的结果,确定为将所述第二文本信息进行向量化生成的第一信息。可选地,根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量,包括:对所述第一信息进行特征提取,生成文本特征向量;将所述文本特征向量与所述物品的属性信息进行拼接,生成所述物品的特征向量。可选地,对所述第一信息进行特征提取,生成文本特征向量,包括:将所述第一信息中每个字符向量输入至自然语言理解预训练模型中;其中,所述自然语言理解预训练模型包含预设个数的隐藏层;循环预设个数的隐藏层,对所述第一信息进行特征提取,生成文本特征向量;其中,所述特征向量每个维度的取值范围为-1至1。可选地,所述每个隐藏层包含第一子层和第二子层;针对每一隐藏层,对所述第一信息进行特征提取,包括:计算所述第一信息中每个字符向量与所述第一信息中的其他字符向量的相关关系;将所述相关关系放入自然语言理解预训练模型的全连接层的输出,与所述相关关系相加后,进归一化操作,获取第一子层的输出;确定所述第一子层的输出进行升维经过激活函数后进行降维的输出,与所述第一子层的输出相加后,进归一化操作,获取第二子层的输出。可选地,根据所述特征向量,建立物品质量检测模型,包括:将所述特征向量划分为测试集和训练集;根据所述训练集,训练物品质量检测模型;根据所述测试集,对训练好的所述物品质量检测模型进行评估。可选地,根据所述训练集,训练物品质量检测模型,包括:将所述训练集中的数据输入至强分类器模型进行训练;利用网格搜索算法对所述强分类器模型的参数进行优化;将训练好的强分类器模型结合完成优化后的参数,生成物品质量检测模型。可选地,根据所述测试集,对训练好的所述物品质量检测模型进行评估,包括:将所述测试集中的数据输入至训练好的物品质量检测模型,得到所述物品质量检测模型确定的第一差品率;根据预设差品率阈值和第一差品率,确定所述物品质量检测模型得出的判断物品是否存在质量问题;根据所述训练集中已知的存在质量问题的物品数量,确定所述物品质量检测模型的准确率和召回率。根据本专利技术实施例的再一个方面,提供了一种物品质量检测模型建立的装置,包括:第一信息生成模块,由于对物品的文本信息进行预处理,生成所述物品的第一信息;特征向量建立模块,用于根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量;模型建立模块,用于根据所述特征向量,建立物品质量检测模型。根据本专利技术实施例的另一个方面,提供了一种物品质量检测模型建立电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术提供的物品质量检测模型建立方法。根据本专利技术实施例的还一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术提供的物品质量检测模型建立方法。上述专利技术中的一个实施例具有如下优点或有益效果:本申请提取生成物品的特征向量,再根据特征向量建立物品质量检测模型的技术手段,解决了现有技术中存在的词库维护成本高、召回率低、需要耗费大量人力资源的技术缺陷,进而达到在不提高开发成本的前提下、提高检测的准确率和召回率、提升工作效率、节约人力成本的技术效果。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的物品质量检测模型建立的方法的主要流程的示意图;图2是根据本专利技术具体实施例的特征提的详细流程的示意图;图3是根据本专利技术实施例的物品质量检测模型建立的方法的详细流程的示意图;图4是根据本专利技术实施例的物品质量检测模型建立的装置的主要模块的示意图;图5是本专利技术实施例可以应用于其中的示例性系统架构图;图6是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本专利技术实施例的物品质量检测模型建立的方法的主要流程的示意图,如图1所示,包括:步骤S101、对物品的文本信息进行预处理,生成所述物品的第一信息;步骤S102、根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量;步骤S103、根据所述特征向量,建立物品质量检测模型。所述物品的文本信息包括物品相关的描述信息,例如所述物品的用户对物品的评价、测评等。由于物品的文本信息是由文字组成的,在本申请中可以本文档来自技高网...

【技术保护点】
1.一种物品质量检测模型建立的方法,其特征在于,包括:/n对物品的文本信息进行预处理,生成所述物品的第一信息;/n根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量;/n根据所述特征向量,建立物品质量检测模型。/n

【技术特征摘要】
1.一种物品质量检测模型建立的方法,其特征在于,包括:
对物品的文本信息进行预处理,生成所述物品的第一信息;
根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量;
根据所述特征向量,建立物品质量检测模型。


2.根据权利要求1所述的方法,其特征在于,对物品的文本信息进行预处理,生成所述物品的第一信息,包括:
剔除所述物品的文本信息中的特殊字符,生成第一文本信息;
将所述第一文本信息转换为按照文本顺序排列的字符序列;
根据预设序列长度截取所述字符序列,并在截取的所述字符序列的首尾添加分隔符,生成所述物品的第二文本信息;
将所述第二文本信息进行向量化,生成所述物品的第一信息。


3.根据权利要求2所述的方法,其特征在于,将所述第二文本信息进行向量化,生成所述物品的第一信息,包括:
对所述第二文本信息中的每个字符对应的数值进行编码,生成数值编码;
对所述字符在所述第二文本信息中的位置进行编码,生成位置编码;
其中,所述数值编码和所述位置编码的维度相同;
将所述数值编码和所述位置编码按对应的维度进行加和的结果,确定为将所述第二文本信息进行向量化生成的第一信息。


4.根据权利要求2所述的方法,其特征在于,根据所述第一信息和所述物品的属性信息,建立所述物品的特征向量,包括:
对所述第一信息进行特征提取,生成文本特征向量;
将所述文本特征向量与所述物品的属性信息进行拼接,生成所述物品的特征向量。


5.根据权利要求4所述的方法,其特征在于,对所述第一信息进行特征提取,生成文本特征向量,包括:
将所述第一信息中每个字符向量输入至自然语言理解预训练模型中;其中,所述自然语言理解预训练模型包含预设个数的隐藏层;
循环预设个数的隐藏层,对所述第一信息进行特征提取,生成文本特征向量;
其中,所述特征向量每个维度的取值范围为-1至1。


6.根据权利要求5所述的方法,其特征在于,所述每个隐藏层包含第一子层和第二子层;
针对每一隐藏层,对所述第一信息进行特征提取,包括:
计算所述第一信息中每个字符向量与所述第一信息中的其他字符向量的相关关系;

【专利技术属性】
技术研发人员:李银锋黄明星刘婷婷周彬黄建杰赖晨东
申请(专利权)人:北京沃东天骏信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1