一种搜索对象的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35650271 阅读:26 留言:0更新日期:2022-11-19 16:45
本发明专利技术公开一种搜索对象的方法、装置、电子设备及存储介质,应用于数据挖掘技术领域。该方法为:接收对待搜索对象的搜索请求,搜索请求中携带有搜索指示信息和待搜索对象的标识信息和请求触发时刻;搜索指示信息为内容搜索信息、内容组搜索信息,以及内容和内容组搜索信息中的任一种;搜索指示信息用于指示对多种非结构化数据的单一搜索和/或组合搜索;基于与搜索指示信息对应的目标搜索规则和待搜索对象的关联信息,确定目标搜索结果;目标搜索结果包括从预设数据库中确定的,与待搜索对象相关联的至少两种非结构化数据。可见,本发明专利技术可以获得与待搜索对象相关联的至少两种非结构化数据,例如图文、视频以及资讯等非结构化数据。化数据。化数据。

【技术实现步骤摘要】
一种搜索对象的方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及数据挖掘
,尤其涉及一种搜索对象的方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,随着科学技术的不断发展,越来越多的用户使用终端设备进行信息的搜索。例如,在终端设备中搜索与“秋天”相关的视频、图文或资讯等非结构化数据。
[0003]然而,现有技术中,各种搜索平台一次只能提供单一场景下的搜索需求,例如,用户在搜索平台中,针对“夏天”这一词汇进行搜索时,仅可以选择单一场景下的搜索,其中,单一场景可以为网页搜索、图片搜索、资讯搜索或者视频搜索中的任一种。
[0004]可见,现有技术中亟需针对多种非结构化数据一次搜索的技术方案。

技术实现思路

[0005]本专利技术实施例提供一种搜索对象的方法、装置、电子设备及存储介质,用于获得与待搜索对象相关联的至少两种非结构化数据,例如图文、视频以及资讯等多种非结构化数据。
[0006]第一方面,提供一种搜索对象的方法,所述方法包括:
[0007]接收对待搜索对象的搜索请求,所述搜索请求中携带有搜索指示信息和待搜索对象的标识信息和请求触发时刻;所述搜索指示信息为内容搜索信息、内容组搜索信息,以及内容和内容组搜索信息中的任一种;所述搜索指示信息用于指示对多种非结构化数据的单一搜索和/或组合搜索;
[0008]基于与所述搜索指示信息对应的目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果;所述目标搜索结果包括从预设数据库中确定的,与所述待搜索对象相关联的至少两种非结构化数据。
[0009]在一种可能的实施方式中,所述搜索指示信息为内容搜索信息,所述基于所述目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果,包括:
[0010]根据所述标识信息和所述内容搜索信息从所述预设数据库,确定第一候选搜索结果数据集;所述第一候选搜索结果数据集中每个候选搜索结果至少包括内容标题、内容正文、内容摘要、发布时刻、内容类型以及创建时刻;
[0011]分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,并基于确定的匹配值,筛选符合第一筛选条件的候选搜索结果,作为目标搜索结果;所述匹配值用于指示所述候选搜索结果与待搜索对象有效相关的程度。
[0012]在一种可能的实施方式中,分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,包括:
[0013]针对每个所述候选搜索结果,分别执行以下操作:
[0014]根据一个候选搜索结果中内容标题与所述待搜索对象的标题相似度、所述一个候
选搜索结果中内容正文与所述待搜索对象的正文相似度,以及所述一个候选搜索结果中内容简介与所述待搜索对象的简介相似度,确定所述一个候选搜索结果的内容初始相似度;
[0015]根据第一创建评分值和第一更新评分值,确定第一时效评分值;所述第一创建评分值基于所述一个候选搜索结果中内容创建时刻、所述请求触发时刻和评分规则所确定;所述第一更新评分值基于所述一个候选搜索结果中内容更新时刻、所述请求触发时刻和所述评分规则所确定;
[0016]基于所述内容初始相似度和所述第一时效评分值,确定一个所述候选搜索结果与所述待搜索对象的匹配值。
[0017]在一种可能的实施方式中,所述搜索指示信息为内容组搜索信息,所述基于所述目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果,包括:
[0018]根据所述标识信息和所述内容组搜索信息从所述预设数据库,确定第二候选搜索结果数据集;所述第二候选搜索结果数据集中每个候选搜索结果至少包括内容组标题、内容组正文、内容组摘要、内容组发布时刻、内容组类型、内容组创建时刻,以及内容组包括的各个嵌套内容分别对应的内容标题、内容正文以及内容简介;
[0019]分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,并基于确定的匹配值,筛选符合第二筛选条件的候选搜索结果,作为目标搜索结果,所述匹配值用于指示所述候选搜索结果与待搜索对象有效相关的程度。
[0020]在一种可能的实施方式中,分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,包括:
[0021]针对每个所述候选搜索结果,分别执行以下操作:
[0022]根据一个候选搜索结果的内容组初始相似度和内容组时效评分值,确定内容组相似度;
[0023]根据所述一个候选搜索结果中各个嵌套内容标题与所述待搜索对象的标题相似度、所述一个候选搜索结果中各个嵌套内容正文与所述待搜索对象的正文相似度,以及所述一个候选搜索结果中各个嵌套内容简介与所述待搜索对象的简介相似度,确定嵌套内容相似度;
[0024]基于所述内容组相似度和所述嵌套内容相似度,确定一个所述候选搜索结果与所述待搜索对象的匹配值。
[0025]在一种可能的实施方式中,根据内容组初始相似度和内容组时效评分值,确定内容组相似度,包括:
[0026]根据所述一个候选搜索结果中内容组标题与所述待搜索对象的标题相似度,和所述一个候选搜索结果中内容组简介与所述待搜索对象的简介相似度,确定内容组初始相似度;
[0027]根据第二创建评分值和第二更新评分值,确定第二时效评分值;所述第二创建评分值基于所述一个候选搜索结果中内容组创建时刻、所述请求触发时刻和评分规则所确定;所述第二更新评分值基于所述一个候选搜索结果中内容组更新时刻、所述请求触发时刻和所述评分规则所确定;
[0028]根据所述内容组初始相似度和对应的权值的乘积,以及所述内容组时效评分值和对应的权值的乘积,确定内容组相似度。
[0029]在一种可能的实施方式中,所述搜索指示信息为内容和内容组搜索信息,所述基于所述目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果,包括:
[0030]根据所述标识信息以及所述内容和内容组搜索信息,从所述预设数据库,确定第一候选搜索结果数据集和第二候选搜索结果数据集;
[0031]分别确定第一候选搜索结果数据集中每个候选搜索结果与所述待搜索对象的匹配值,并基于确定的匹配值,筛选符合第一筛选条件的候选搜索结果,作为第一搜索结果;所述匹配值用于指示所述候选搜索结果与待搜索对象的相关程度;以及;
[0032]分别确定第二候选搜索结果数据集中每个候选搜索结果与所述待搜索对象的匹配值,并基于确定的匹配值,筛选符合第二筛选条件的候选搜索结果,作为第二搜索结果;
[0033]根据所述第一搜索结果和所述第二搜索结果,确定目标搜索结果。
[0034]第二方面,提供一种搜索对象的装置,所述装置包括:
[0035]接收单元,用于接收对待搜索对象的搜索请求,所述搜索请求中携带有搜索指示信息和待搜索对象的标识信息和请求触发时刻;所述搜索指示信息为内容搜索信息、内容组搜索信息,以及内容和内容组搜索信息中的任一种;所述搜索指示信息用于指示对多种非结构化数据的单一搜索和/或组合搜索;
[0036]处理单元,用于基于与所述搜索指示信息对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索对象的方法,其特征在于,所述方法包括:接收对待搜索对象的搜索请求,所述搜索请求中携带有搜索指示信息和待搜索对象的标识信息和请求触发时刻;所述搜索指示信息为内容搜索信息、内容组搜索信息,以及内容和内容组搜索信息中的任一种;所述搜索指示信息用于指示对多种非结构化数据的单一搜索和/或组合搜索;基于与所述搜索指示信息对应的目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果;所述目标搜索结果包括从预设数据库中确定的,与所述待搜索对象相关联的至少两种非结构化数据。2.如权利要求1所述的方法,其特征在于,所述搜索指示信息为内容搜索信息,所述基于所述目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果,包括:根据所述标识信息和所述内容搜索信息从所述预设数据库,确定第一候选搜索结果数据集;所述第一候选搜索结果数据集中每个候选搜索结果至少包括内容标题、内容正文、内容摘要、发布时刻、内容类型以及创建时刻;分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,并基于确定的匹配值,筛选符合第一筛选条件的候选搜索结果,作为目标搜索结果;所述匹配值用于指示所述候选搜索结果与待搜索对象有效相关的程度。3.如权利要求2所述的方法,其特征在于,分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,包括:针对每个所述候选搜索结果,分别执行以下操作:根据一个候选搜索结果中内容标题与所述待搜索对象的标题相似度、所述一个候选搜索结果中内容正文与所述待搜索对象的正文相似度,以及所述一个候选搜索结果中内容简介与所述待搜索对象的简介相似度,确定所述一个候选搜索结果的内容初始相似度;根据第一创建评分值和第一更新评分值,确定第一时效评分值;所述第一创建评分值基于所述一个候选搜索结果中内容创建时刻、所述请求触发时刻和评分规则所确定;所述第一更新评分值基于所述一个候选搜索结果中内容更新时刻、所述请求触发时刻和所述评分规则所确定;基于所述内容初始相似度和所述第一时效评分值,确定一个所述候选搜索结果与所述待搜索对象的匹配值。4.如权利要求1所述的方法,其特征在于,所述搜索指示信息为内容组搜索信息,所述基于所述目标搜索规则和所述待搜索对象的关联信息,确定目标搜索结果,包括:根据所述标识信息和所述内容组搜索信息从所述预设数据库,确定第二候选搜索结果数据集;所述第二候选搜索结果数据集中每个候选搜索结果至少包括内容组标题、内容组正文、内容组摘要、内容组发布时刻、内容组类型、内容组创建时刻,以及内容组包括的各个嵌套内容分别对应的内容标题、内容正文以及内容简介;分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,并基于确定的匹配值,筛选符合第二筛选条件的候选搜索结果,作为目标搜索结果,所述匹配值用于指示所述候选搜索结果与待搜索对象有效相关的程度。5.如权利要求4所述的方法,其特征在于,分别确定每个所述候选搜索结果与所述待搜索对象的匹配值,包括:
针对每个所述候选搜索结果,分别执行以下操作:根据一个候选搜索结果的内容组初始相似度和内容组时效评分值,确定内容组相似度;根据所述一个候选搜索结果中各个嵌套内容标题与所述待搜索对象的标题相似度、...

【专利技术属性】
技术研发人员:谢鸣晓李斌张圳
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1