System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,更具体地,涉及一种信息检索方法、装置、电子设备和计算机可读存储介质。
技术介绍
1、随着数据量的不断增长,信息检索的重要性变得越来越高。但用户输入的查询语句有时会存在表述不准确的缺陷,因此会降低信息检索的准确性。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种信息检索方法、装置、电子设备和计算机可读存储介质,以通过对查询语句中的关键词语进行词形扩展的方式降低查询语句表述不准确的可能性,从而提高信息检索的准确性。
2、第一方面,本专利技术实施例公开了一种信息检索方法,所述方法包括:
3、确定初始查询语句中的待扩展词语;
4、根据所述待扩展词语进行词形扩展处理,获取第一词语集合,所述第一词语集合包括所述待扩展的变形词语;
5、根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果。
6、可选地,所述根据所述待扩展词语进行词形扩展处理,获取第一词语集合包括:
7、对所述待扩展词语进行词干还原处理,获取第二词语集合,所述第二词语集合包括所述待扩展词语的词干;
8、对所述第二词语集合进行词形扩展处理,获取所述第一词语集合。
9、可选地,所述确定初始查询语句中的待扩展词语包括:
10、对所述初始查询语句中的各词语进行词性标注,确定各所述词语的词性信息;
11、将所述词性信息为目标词性的所述词语确定为所述待扩展词语,所述目标词性为名词或动词
12、可选地,所述根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果包括:
13、确定所述初始查询语句的意图分类结果;
14、根据所述意图分类结果从所述第一词语集合中筛选出目标词语;
15、根据所述目标词语获取所述检索结果。
16、可选地,所述意图分类结果包括名词分类结果和动词分类结果;
17、所述根据所述意图分类结果从所述第一词语集合中筛选出目标词语包括:
18、响应于所述意图分类结果为名词分类结果,将词性信息为名词的所述变形词语确定为所述目标词语;
19、响应于所述意图分类结果为动词分类结果,将词性信息为动词的所述变形词语确定为所述目标词语。
20、可选地,所述确定所述初始查询语句的意图分类结果包括:
21、根据所述初始查询语句和预先训练的自然语言处理模型获取所述意图分类结果,所述自然语言处理模型基于训练样本集合训练获得,所述训练样本集合中的各训练样本包括样本查询语句和所述样本查询语句的意图分类信息。
22、可选地,所述对所述第二词语集合进行词形扩展处理包括:
23、响应于所述词干的所述词性信息为动词,基于预先设置的词形扩展规则获取所述变形词语。
24、可选地,所述方法还包括:
25、获取预定查询语句;
26、响应于所述预定查询语句使用非目标语言,将所述预定查询语句转化为初始查询语句,所述初始查询语句为使用目标语言的查询语句。
27、第二方面,本专利技术实施例公开了一种信息检索装置,所述装置包括:
28、词语确定单元,用于确定初始查询语句中的待扩展词语;
29、处理单元,用于根据所述待扩展词语进行词形扩展处理,获取第一词语集合,所述第一词语集合包括所述待扩展的变形词语;
30、根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果。
31、检索单元,用于根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果。
32、检索单元,用于根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果。
33、第三方面,本专利技术实施例公开了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面中任一项所述的方法。
34、第四方面,本专利技术实施例公开了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面中任一项所述的方法。
35、第五方面,本专利技术实施例公开了一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如第一方面中任一项所述的方法。
36、本专利技术实施例在获取到查询语句后,可以获取查询语句中的待扩展词语,并根据待扩展词语进行词形扩展处理,得到待扩展词语的变形词语,从而基于得到的变形词语进行信息检索,得到查询语句的检索结果。本专利技术实施例通过对查询语句中的关键词语进行词形扩展的方式降低了表述不准确的可能性,因此能够提高信息检索的准确性。
本文档来自技高网...【技术保护点】
1.一种信息检索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述待扩展词语进行词形扩展处理,获取第一词语集合包括:
3.根据权利要求1所述的方法,其特征在于,所述确定初始查询语句中的待扩展词语包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果包括:
5.根据权利要求4所述的方法,其特征在于,所述意图分类结果包括名词分类结果和动词分类结果;
6.根据权利要求4所述的方法,其特征在于,所述确定所述初始查询语句的意图分类结果包括:
7.根据权利要求2所述的方法,其特征在于,所述对所述第二词语集合进行词形扩展处理包括:
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
9.一种信息检索装置,其特征在于,所述装置包括:
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如权利要求1-8中任一项所述的方法。
...【技术特征摘要】
1.一种信息检索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述待扩展词语进行词形扩展处理,获取第一词语集合包括:
3.根据权利要求1所述的方法,其特征在于,所述确定初始查询语句中的待扩展词语包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一词语集合进行信息检索,获取所述初始查询语句的检索结果包括:
5.根据权利要求4所述的方法,其特征在于,所述意图分类结果包括名词分类结果和动词分类结果;
6.根据权利要求4所述的方法,其特征在于,所述确定所述初始查询语句的意图分类结果包括:
7.根据权利要求2所述的方法,其特征在于,所述对所述第二词语集合进行词形...
【专利技术属性】
技术研发人员:李芮,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。