一种搜索结果多样化均衡化搜索方法及计算机设备技术

技术编号:31310733 阅读:26 留言:0更新日期:2021-12-12 21:41
本发明专利技术涉及一种搜索结果多样化均衡化搜索方法及计算机设备。该方法包括下述步骤:S1、建立行业词库,行业词库包括多个行业专业词汇;将各类型原始数据模型转化为预设数据模型;S2、接收用户输入的搜索内容,按照行业词库从搜索内容中提取搜索关键词;S3、使用搜索关键词检索所所有预设数据模型,计算搜索结果中每个预设数据模型的总权重值,根据总权重值对搜索结果进行排序。本发明专利技术将各类型原始数据模型统一转化为预设数据模型,避免因数据类型的表现形式影响搜索,使得搜索结果更加多样化均衡化。衡化。衡化。

【技术实现步骤摘要】
一种搜索结果多样化均衡化搜索方法及计算机设备


[0001]本专利技术涉及搜索领域,更具体地说,涉及一种搜索结果多样化均衡化搜索方法及计算机设备。

技术介绍

[0002]搜索技术是互联网常用技术,用户通过输入搜索内容查找目标内容。现有搜索技术中多数仅考虑搜索内容和目标内容的关联性,例如出现次数越高则关联性越高,按照关联性高低进行排序显示,这种搜索方式没有考虑目标内容的种类多样性,导致一些种类的目标内容很少被展示,而一些种类的目标内容又过多被展示,搜索结果不够多样化均衡化。

技术实现思路

[0003]本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种搜索结果多样化均衡化搜索方法及计算机设备。
[0004]本专利技术解决其技术问题所采用的技术方案是:构造一种搜索结果多样化均衡化搜索方法,包括下述步骤:
[0005]S1、建立行业词库,所述行业词库包括多个行业专业词汇;将各类型原始数据模型转化为预设数据模型;
[0006]S2、接收用户输入的搜索内容,按照所述行业词库从所述搜索内容中提取搜索关键词;
[0007]S3、使用所述搜索关键词检索所所有所述预设数据模型,计算搜索结果中每个所述预设数据模型的总权重值,根据所述总权重值对搜索结果进行排序。
[0008]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,所述预设数据模型包括内容标题、内容摘要、正文、关键词和内容类型。
[0009]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,所述步骤S1中将各类型原始数据模型转化为预设数据模型包括:
[0010]将各类型原始数据模型转化为预设数据模型并设置所述预设数据模型各部分内容的权重值,其中所述关键词的权重值大于所述内容标题的权重值,所述内容标题的权重值大于所述内容摘要的权重值,所述内容摘要的权重值大于所述正文的权重值。
[0011]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,所述步骤S3中计算搜索结果中每个所述预设数据模型的总权重值包括:分别计算所述搜索关键词在所述内容标题、内容摘要、正文、关键词和内容类型的分权重值,由所有所述分权重值得到总权重值。
[0012]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,在计算所述搜索关键词在所述内容标题、内容摘要、正文、关键词和内容类型的分权重值时,所述分权重值与所述搜索关键词出现次数正相关。
[0013]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,在所述步骤S3之后还包括:
[0014]S4、根据所述搜索结果中各类型数据模型对应预设数据模型的分布情况调整所述预设数据模型各部分内容的权重值,以使所述搜索结果中各类型分布均衡。
[0015]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,所述步骤S3中使用所述搜索关键词检索所所有所述预设数据模型包括:
[0016]S31、按照分类标准将所有所述预设数据模型进行分类;
[0017]S32、统计每种类别中所述预设数据类型的总数,将总数相当的类别划分在同一个组;
[0018]S33、使用所述搜索关键词检索每个组中所有所述预设数据模型。
[0019]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,在所述步骤S33之后还包括:使每个组产生预设数量的预设数据模型。
[0020]进一步,在本专利技术所述的搜索结果多样化均衡化搜索方法中,每个组对应的预设数量与该组的总数正相关。
[0021]另外,本专利技术还提供一种计算机设备,包括存储器和处理器,所述处理器通信连接所述存储器。所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序以实现如上述的搜索结果多样化均衡化搜索方法。
[0022]实施本专利技术的一种搜索结果多样化均衡化搜索方法及计算机设备,具有以下有益效果:本专利技术将各类型原始数据模型统一转化为预设数据模型,避免因数据类型的表现形式影响搜索,使得搜索结果更加多样化均衡化。
附图说明
[0023]下面将结合附图及实施例对本专利技术作进一步说明,附图中:
[0024]图1是本专利技术实施例提供的一种搜索结果多样化均衡化搜索方法的流程图;
[0025]图2是本专利技术实施例提供的一种搜索结果多样化均衡化搜索方法的流程图。
具体实施方式
[0026]为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。
[0027]在一优选实施例中,参考图1,本实施例的搜索结果多样化均衡化搜索方法包括下述步骤:
[0028]S1、建立行业词库,行业词库包括多个行业专业词汇;将各类型原始数据模型转化为预设数据模型。具体的,行业专业词汇是指某一行业中使用的专业术语,该专业术语不同于日常生活用语,是专有名词,在行业中有专属含义。设置行业词库有利于对用户输入的搜索内容进行科学分词,从而提高搜索专业性和准确性。行业词库可为一个或多个,在行业词库为多个时按照内容类型对行业词库进行分类,形成多个不同类别的行业词库,也即每个行业词库包含的行业专业词汇为同一类词汇。
[0029]现有技术中在搜索时使用原始数据模型,即保持原始资料原有格式直接进行搜索,因各类原始数据模型千差万别,各类原始数据模型不在“同一起跑线”,会导致搜索结果中某些类型显示过多,有些类型显示过少,甚至有些类型始终得不到显示,搜索结果不够多样化均衡化。例如,新闻、影视、歌曲、百科和综艺等原始数据模型均包含“刘德华”,因新闻、
影视、歌曲、百科和综艺在数据类型上有较大差异,在利用词频搜索时,新闻中包含较多“刘德华”关键词,会导致搜索结果中排序考前的基本都是新闻,而很少出现影视、歌曲、百科和综艺等,特别是影视和歌曲,因数据类型的限制,很少能直接出现在首页搜索结果中,导致用户看到的搜索结果较为单一,不够多样化均衡化。为解决因数据模型差异带来的搜索结果不够多样化均衡化问题,本实施例将各类型原始数据模型转化为预设数据模型,转化后所有原始数据模型具有统一数据模型,从而使所有预设数据模型具有“同一起跑线”,在被检索时所有预设数据模型被搜索到的概率更加均衡,从而使得搜索结果更加多样化均衡化。作为选择,行业词库和转化后的所有预设数据模型存储在服务器上。
[0030]S2、接收用户输入的搜索内容,按照行业词库从搜索内容中提取搜索关键词。具体的,用户在搜索框中输入搜索内容,搜索内容通过网络上传至服务器,服务器按照行业词库中的行业专业词汇对搜索内容进行分词,提取搜索内容对应的搜索关键词。例如,搜索内容为“epson S1C17801 mcu数据手册”,按行业词库进行识别得到分词结果:“epson”为厂牌词,“S1C17801”为型号词,“mcu”为品类词,“数据手册”为资源词,则提取的搜索关键词为:“epson”、“S1C17801”、“mcu”、“数据手册”。作为选择,若行业词库未涵盖搜索内容,则可使用基本语言结构提取搜索关键词,即使用主谓宾定状补本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索结果多样化均衡化搜索方法,其特征在于,包括下述步骤:S1、建立行业词库,所述行业词库包括多个行业专业词汇;将各类型原始数据模型转化为预设数据模型;S2、接收用户输入的搜索内容,按照所述行业词库从所述搜索内容中提取搜索关键词;S3、使用所述搜索关键词检索所所有所述预设数据模型,计算搜索结果中每个所述预设数据模型的总权重值,根据所述总权重值对搜索结果进行排序。2.根据权利要求1所述的搜索结果多样化均衡化搜索方法,其特征在于,所述预设数据模型包括内容标题、内容摘要、正文、关键词和内容类型。3.根据权利要求2所述的搜索结果多样化均衡化搜索方法,其特征在于,所述步骤S1中将各类型原始数据模型转化为预设数据模型包括:将各类型原始数据模型转化为预设数据模型并设置所述预设数据模型各部分内容的权重值,其中所述关键词的权重值大于所述内容标题的权重值,所述内容标题的权重值大于所述内容摘要的权重值,所述内容摘要的权重值大于所述正文的权重值。4.根据权利要求3所述的搜索结果多样化均衡化搜索方法,其特征在于,所述步骤S3中计算搜索结果中每个所述预设数据模型的总权重值包括:分别计算所述搜索关键词在所述内容标题、内容摘要、正文、关键词和内容类型的分权重值,由所有所述分权重值得到总权重值。5.根据权利要求4所述的搜索结果多样化均衡化搜索方法,其特征在于...

【专利技术属性】
技术研发人员:包伟
申请(专利权)人:深圳市世强元件网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1