System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本搜索结果排序方法、装置、电子设备、可读介质及程序产品制造方法及图纸_技高网

文本搜索结果排序方法、装置、电子设备、可读介质及程序产品制造方法及图纸

技术编号:43829200 阅读:6 留言:0更新日期:2024-12-31 18:29
本申请公开了一种文本搜索结果排序方法、装置、电子设备、存储介质及程序产品,涉及数据检索技术领域,文本搜索结果排序方法包括:当接收到搜索语句时,读取预配置干预参数;根据搜索语句和预配置干预参数,确定搜索语句对应的多个搜索结果和各搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值;根据各搜索结果的标题和正文的内容,确定各搜索结果与搜索语句的匹配情况;根据各搜索结果的匹配情况、各搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,对各搜索结果进行排序,得到并返回排序后的搜索结果。本申请的技术方案解决了目前的文本搜索方案的搜索结果排序合理性较差的问题。

【技术实现步骤摘要】

本申请涉及数据检索,尤其涉及文本搜索结果排序方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


技术介绍

1、目前,常用的文本搜索排序方式一般是针对互联网文档,主要通过依据对搜索关键词在被搜索文件的相关度进行综合打分,然后根据该分值对搜索到的文档集进行排序。其中,影响打分的因素有搜索关键字词频、每个文档的长度及搜索关键字出现在所有文档中的覆盖率等。

2、但是,这种文本搜索方案中由于搜索关键词的权重不明晰,容易导致标题、正文全命中参数权重过低。而在用户搜索时标题、正文没有全部匹配的情况下,其他部分字段全部匹配的情况下会出现搜索结果排序过高的现象,文本搜索结果的排序合理性较差,需要用户再次人工查询,降低了搜索效率。

3、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本申请的主要目的在于提供一种文本搜索结果排序方法、装置、电子设备、计算机可读存储介质及计算机程序产品,旨在解决目前的文本搜索方案的搜索结果排序合理性较差的技术问题。

2、为实现上述目的,本申请提出一种文本搜索结果排序方法,所述文本搜索结果排序方法包括:

3、当接收到搜索语句时,读取预配置干预参数,其中,所述预配置干预参数至少包括全匹配值、部分匹配值以及发布时间特征值;

4、根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值;p>

5、根据各所述搜索结果的标题和正文的内容,确定各所述搜索结果与所述搜索语句的匹配情况;

6、根据各所述搜索结果的匹配情况、各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,对各所述搜索结果进行排序,得到并返回排序后的搜索结果。

7、在一实施例中,所述根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果的步骤包括:

8、将各存量文档输入预设的实体识别模型,生成对应的实体词典;

9、判断所述搜索语句是否命中所述实体词典;

10、若命中,则在各所述存量文档中搜索所述搜索语句对应的搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值;

11、若未命中,则判断所述搜索语句在所述存量文档中是否全部命中,并在全命中的情况下返回所述搜索语句对应的搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值。

12、在一实施例中,在所述读取预配置干预参数的步骤之前,所述方法还包括:

13、将所述搜索语句输入预设的实体识别模型,获得所述搜索语句对应的至少一个实体;

14、根据各所述实体间的关联关系,生成更新后的搜索语句,其中,更新后的搜索语句用于供搜索服务确定对应的搜索结果。

15、在一实施例中,在所述根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值的步骤之前,所述方法包括:

16、过滤所述搜索语句中的敏感词,并对过滤后的搜索语句进行纠错;

17、对纠错后的搜索语句进行分词,得到至少一个搜索词;

18、根据预设的停用词表去除各所述搜索词中的停用词,基于去除停用词后的搜索词和预设的同义词表,添加同义词,得到更新后的搜索词;

19、将更新后的搜索词修改为预设标准的语法形式,以供通过搜索服务返回更新后的搜索词对应的搜索结果。

20、在一实施例中,所述根据各所述搜索结果的匹配情况、各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,对各所述搜索结果进行排序,得到并返回排序后的搜索结果的步骤包括:

21、根据各所述搜索结果的匹配情况、各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,确定每个搜索结果分别对应的多个特征以及各特征分别对应的特征值,其中,所述匹配情况至少包括标题匹配或正文匹配中的一种;

22、根据各所述特征分别对应的特征值和对应的权重,计算每个搜索结果的特征得分,其中,全匹配值的权重大于部分匹配值的权重,标题匹配的权重大于正文匹配的权重;

23、基于各所述搜索结果的特征得分,按从大到小的顺序对各所述搜索结果进行排序,得到并返回排序后的搜索结果。

24、在一实施例中,在所述基于各所述搜索结果的特征得分,按从大到小的顺序对各所述搜索结果进行排序的步骤之前,所述方法还包括:

25、筛选特征得分低于预设得分阈值的搜索结果;

26、滤除各所述特征得分低于预设得分阈值的搜索结果;

27、基于预设的自定义得分字典,对所述自定义得分字典对应类型的搜索结果的特征得分进行更新,得到更新后的特征得分。

28、此外,本申请还提出一种文本搜索结果排序装置,所述文本搜索结果排序装置包括:

29、参数读取模块,用于当接收到搜索语句时,读取预配置干预参数,其中,所述预配置干预参数至少包括全匹配值、部分匹配值以及发布时间特征值;

30、语句搜索模块,用于根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值;

31、语句匹配模块,用于根据各所述搜索结果的标题和正文的内容,确定各所述搜索结果与所述搜索语句的匹配情况;

32、结果排序模块,用于根据各所述搜索结果的匹配情况、各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,对各所述搜索结果进行排序,得到并返回排序后的搜索结果。

33、此外,为实现上述目的,本申请还提出一种电子设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的文本搜索结果排序方法的步骤。

34、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的文本搜索结果排序方法的步骤。

35、此外,为实现上述目的,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的文本搜索结果排序方法的步骤。

36、本申请提出了一种文本搜索结果排序方法,首先当接收到搜索语句时,读取预配置干预参数,其中,所述预配置干预参数至少包括全匹配值、部分匹配值以及发布时间特征值;根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值;根据各所述搜索结果的标题和正文的内容,确定各所述搜索结果与所述搜索语句的匹配情况;根据各所述搜索结果的匹配情况、各所述搜本文档来自技高网...

【技术保护点】

1.一种文本搜索结果排序方法,其特征在于,所述文本搜索结果排序方法包括:

2.如权利要求1所述的文本搜索结果排序方法,其特征在于,所述确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值的步骤包括:

3.如权利要求1所述的文本搜索结果排序方法,其特征在于,在所述读取预配置干预参数的步骤之前,所述方法还包括:

4.如权利要求1所述的文本搜索结果排序方法,其特征在于,在所述根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值的步骤之前,所述方法还包括:

5.如权利要求1所述的文本搜索结果排序方法,其特征在于,所述根据各所述搜索结果的匹配情况、各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,对各所述搜索结果进行排序,得到并返回排序后的搜索结果的步骤包括:

6.如权利要求5所述的文本搜索结果排序方法,其特征在于,在所述基于各所述搜索结果的特征得分,按从大到小的顺序对各所述搜索结果进行排序的步骤之前,所述方法还包括:

7.一种文本搜索结果排序装置,其特征在于,所述文本搜索结果排序装置包括:

8.一种电子设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至6中任一项所述的文本搜索结果排序方法的步骤。

9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的文本搜索结果排序方法的步骤。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的文本搜索结果排序方法的步骤。

...

【技术特征摘要】

1.一种文本搜索结果排序方法,其特征在于,所述文本搜索结果排序方法包括:

2.如权利要求1所述的文本搜索结果排序方法,其特征在于,所述确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值的步骤包括:

3.如权利要求1所述的文本搜索结果排序方法,其特征在于,在所述读取预配置干预参数的步骤之前,所述方法还包括:

4.如权利要求1所述的文本搜索结果排序方法,其特征在于,在所述根据所述搜索语句和所述预配置干预参数,确定所述搜索语句对应的多个搜索结果和各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值的步骤之前,所述方法还包括:

5.如权利要求1所述的文本搜索结果排序方法,其特征在于,所述根据各所述搜索结果的匹配情况、各所述搜索结果分别对应的全匹配值、部分匹配值以及发布时间特征值,对各所述搜索结果进行排序,得到并返回排序后的搜索结果的步骤包括...

【专利技术属性】
技术研发人员:黄岩朱志斌莫菲赵冲冲滕滨赵永刚杨明
申请(专利权)人:中移动信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1