System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息分类方法、装置和服务器制造方法及图纸_技高网

信息分类方法、装置和服务器制造方法及图纸

技术编号:43345095 阅读:0 留言:0更新日期:2024-11-15 20:42
本公开涉及一种信息分类方法、装置和服务器,涉及计算机技术领域。该信息分类方法,包括:利用卷积处理,提取用户的查询信息与多个对象类别中的每一个对象类别的第一匹配特征;利用交叉注意力处理,提取查询信息和每一个对象类别的第二匹配特征;根据第一匹配特征和第二匹配特征,确定与查询信息对应的对象类别。本公开的技术方案能够提高分类处理的泛化能力,从而查询信息的分类准确率。

【技术实现步骤摘要】

本公开涉及计算机,特别涉及一种信息分类方法、信息分类装置、服务器和非易失性计算机可读存储介质。


技术介绍

1、电子商务平台为消费者提供数以亿计的产品。典型的电商搜索系统通常由以下模块组成:查询解析、物品召回、相关性过滤和物品排序。

2、查询解析由分词、纠错、查询改写、命名实体识别和用户意图检测等部分组成。作为其中重要的一部分,查询意图分类有助于召回和相关性模块过滤不相关的物品,提升用户的购买体验。此外,预测的用户查询语句的类别可以用作物品排序的特征,以帮助用户快速找到最相关的物品。因此,查询意图分类任务越来越受到学术界和工业界的关注,提高意图分类的准确率对于检索系统来说是至关重要的。

3、在相关技术中,通过多标签分类模型来学习文档的上下文信息,以增强查询的表示学习。


技术实现思路

1、本公开的专利技术人发现上述相关技术中存在如下问题:分类处理的泛化能力不足,导致查询信息的分类准确率下降。

2、鉴于此,本公开提出了一种信息分类技术方案,能够提高分类处理的泛化能力,从而查询信息的分类准确率。

3、根据本公开的一些实施例,提供了一种信息分类方法,包括:利用卷积处理,提取用户的查询信息与多个对象类别中的每一个对象类别的第一匹配特征;利用交叉注意力处理,提取查询信息和每一个对象类别的第二匹配特征;根据第一匹配特征和第二匹配特征,确定与查询信息对应的对象类别。

4、在一些实施例中,提取用于的查询信息和多个对象类别中的每一个对象类别的第一匹配特征包括:根据查询信息的查询特征与每一个对象类别的类别特征的点积处理结果,提取第一匹配特征。

5、在一些实施例中,提取第一匹配特征包括:根据查询信息、类别特征的转置和权重参数,计算点积处理结果,权重参数通过对第一机器学习模型进行训练确定。

6、在一些实施例中,提取第一匹配特征包括:在多个通道上,对点积处理结果进行二维卷积处理,确定卷积特征图;根据卷积特征图,提取第一匹配特征。

7、在一些实施例中,提取第一匹配特征包括:对卷积特征图进行最大池化处理,以提取第一匹配特征。

8、在一些实施例中,提取查询信息和每一个对象类别的第二匹配特征包括:在每一个对象类别的相关信息的时间步上,对每一个对象类别的类别特征进行均值池化处理,以确定均值池化处理结果;根据均值池化处理结果、查询信息的查询特征,提取第二匹配特征。

9、在一些实施例中,提取用户的查询信息与多个对象类别中的每一个对象类别的第一匹配特征包括:根据每一个对象类别的相关信息、属于对象类别的对象的相关信息,提取每一个对象类别的类别特征;根据查询信息包含的至少一个词,提取查询信息的查询特征;根据查询特征、类别特征,提取第一匹配特征;提取查询信息和每一个对象类别的第二匹配特征包括:根据查询特征、类别特征,提取第二匹配特征。

10、在一些实施例中,对象类别的相关信息包括对象类别的名称信息,对象的相关信息包括对象的描述信息中的关键词。

11、在一些实施例中,信息分类方法还包括:根据查询信息包含的至少一个词,提取查询信息的查询特征;根据查询特征,利用自注意力处理提取查询信息的自注意力特征;其中,确定与查询信息对应的对象类别包括:根据自注意力特征,确定与查询信息对应的对象类别。

12、在一些实施例中,确定与查询信息对应的对象类别包括:根据第一匹配特征、第二匹配特征和自注意力特征,利用非线性变换处理,确定与查询信息对应的对象类别。

13、在一些实施例中,对象类别包括物品类别或服务类别中的至少一个,确定与查询信息对应的对象类别包括:在查询信息涉及服务类别的对象的情况下,根据第一匹配特征和第二匹配特征,利用第一机器学习模型的第一分类模块,确定与查询信息对应的服务类别。

14、在一些实施例中,信息分类方法还包括:根据查询信息的查询特征和每一个对象类别的类别特征,利用第二机器学习模型,确定与查询信息对应的物品类别,第二机器学习模型与第一机器学习模型不同;在查询信息涉及服务类别的对象的情况下,根据查询信息对应的服务类别和查询信息对应的物品类别,确定查询信息的分类结果。

15、在一些实施例中,信息分类方法还包括:利用第一机器学习模型的第二分类模块,判断查询信息是否涉及服务类别的对象。

16、在一些实施例中,第一匹配特征通过第一机器学习模型的卷积模块提取,第二匹配特征通过第一机器学习模型的交叉注意力模块提取,与查询信息对应的对象类别通过第一机器学习模型的第一分类模块确定,第一机器学习模型通过多标签交叉熵损失函数进行训练,多标签交叉熵损失函数根据与查询信息样本对应的对象类别和查询信息样本的标注结果计算。

17、根据本公开的另一些实施例,提供一种信息分类装置,包括:卷积模块,用于提取用户的查询信息与多个对象类别中的每一个对象类别的第一匹配特征;交叉注意力模块,用于提取查询信息和每一个对象类别的第二匹配特征;第一分类模块,用于根据第一匹配特征和第二匹配特征,确定与查询信息对应的对象类别。

18、在一些实施例中,卷积模块根据查询信息的查询特征与每一个对象类别的类别特征的点积处理结果,提取第一匹配特征。

19、在一些实施例中,卷积模块根据查询信息、类别特征的转置和权重参数,计算点积处理结果,权重参数通过对第一机器学习模型进行训练确定。

20、在一些实施例中,卷积模块在多个通道上,对点积处理结果进行二维卷积处理,确定卷积特征图;根据卷积特征图,提取第一匹配特征。

21、在一些实施例中,卷积模块对卷积特征图进行最大池化处理,以提取第一匹配特征。

22、在一些实施例中,交叉注意力模块在每一个对象类别的相关信息的时间步上,对每一个对象类别的类别特征进行均值池化处理,以确定均值池化处理结果;根据均值池化处理结果、查询信息的查询特征,提取第二匹配特征。

23、在一些实施例中,信息分类装置还包括:特征提取模块,用于根据每一个对象类别的相关信息、属于对象类别的对象的相关信息,提取每一个对象类别的类别特征,根据查询信息包含的至少一个词,提取查询信息的查询特征;卷积模块根据查询特征、类别特征,提取第一匹配特征;交叉注意力模块根据查询特征、类别特征,提取第二匹配特征。

24、在一些实施例中,对象类别的相关信息包括对象类别的名称信息,对象的相关信息包括对象的描述信息中的关键词。

25、在一些实施例中,信息分类装置还包括:特征提取模块,用于根据查询信息包含的至少一个词,提取查询信息的查询特征;自注意力模块,根据查询特征,提取查询信息的自注意力特征;第一分类模块根据自注意力特征,确定与查询信息对应的对象类别。

26、在一些实施例中,第一分类模块根据第一匹配特征、第二匹配特征和自注意力特征,利用非线性变换处理,确定与查询信息对应的对象类别。

27、在一些实施例中,对象类别包括物品类别或本文档来自技高网...

【技术保护点】

1.一种信息分类方法,包括:

2.根据权利要求1所述的信息分类方法,其中,所述提取用于的查询信息和多个对象类别中的每一个对象类别的第一匹配特征包括:

3.根据权利要求2所述的信息分类方法,其中,所述提取所述第一匹配特征包括:

4.根据权利要求2所述的信息分类方法,其中,所述提取所述第一匹配特征包括:

5.根据权利要求4所述的信息分类方法,其中,所述提取所述第一匹配特征包括:

6.根据权利要求1所述的信息分类方法,其中,所述提取所述查询信息和所述每一个对象类别的第二匹配特征包括:

7.根据权利要求1所述的信息分类方法,其中,所述提取用户的查询信息与多个对象类别中的每一个对象类别的第一匹配特征包括:

8.根据权利要求7所述的信息分类方法,其中,所述对象类别的相关信息包括所述对象类别的名称信息,所述对象的相关信息包括所述对象的描述信息中的关键词。

9.根据权利要求1所述的信息分类方法,还包括:

10.根据权利要求9所述的信息分类方法,其中,所述确定与所述查询信息对应的对象类别包括

11.根据权利要求1所述的信息分类方法,其中,所述对象类别包括物品类别或服务类别中的至少一个,

12.根据权利要求11所述的信息分类方法,还包括:

13.根据权利要求11所述的信息分类方法,还包括:

14.根据权利要求1~13任一项所述的信息分类方法,其中:

15.一种信息分类装置,包括:

16.一种信息分类装置,包括:

17.一种非易失性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-14任一项所述的信息分类方法。

...

【技术特征摘要】

1.一种信息分类方法,包括:

2.根据权利要求1所述的信息分类方法,其中,所述提取用于的查询信息和多个对象类别中的每一个对象类别的第一匹配特征包括:

3.根据权利要求2所述的信息分类方法,其中,所述提取所述第一匹配特征包括:

4.根据权利要求2所述的信息分类方法,其中,所述提取所述第一匹配特征包括:

5.根据权利要求4所述的信息分类方法,其中,所述提取所述第一匹配特征包括:

6.根据权利要求1所述的信息分类方法,其中,所述提取所述查询信息和所述每一个对象类别的第二匹配特征包括:

7.根据权利要求1所述的信息分类方法,其中,所述提取用户的查询信息与多个对象类别中的每一个对象类别的第一匹配特征包括:

8.根据权利要求7所述的信息分类方法,其中,所述对象类别的相关信息包括所述对象...

【专利技术属性】
技术研发人员:袁春园秋义明胡海青王松林刘林徐夙龙
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1