信息搜索方法及装置制造方法及图纸

技术编号:14190066 阅读:110 留言:0更新日期:2016-12-15 02:05
本发明专利技术公开了一种信息搜索方法及装置,属于互联网技术领域。所述方法包括:接收用于进行信息搜索的交互语句;从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板;将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;根据所述单查询条件进行搜索。本发明专利技术将与目标语义属性模板匹配的多个连续字词组成的短语获取为用于信息搜索的单查询条件,由于该单查询条件所表示的语义信息较完整,能够作为一个完整的查询限定条件,因此搜索结果能够最大程度符合用户的搜索需求,且能够避免由于丢失信息造成的搜索准确性低的问题。

Information searching method and device

The invention discloses a method and a device for searching information, which belongs to the technical field of the internet. The method includes: receiving the statement for interactive information search; semantic attributes from the target template set of semantic attribute template, the target semantic attribute template for semantic attribute template corresponding semantic attributes of multiple consecutive words of the interaction in the statement; multiple consecutive words matching with the target semantic attribute template phrase to obtain single query conditions for the exchange statement; according to the single query search. In the invention, multiple consecutive words matching and object semantic attribute template phrase for single query for information search, the semantic information representation of the query condition is more complete, can be used as a complete query conditions, so the search results to the greatest extent meet the search needs of users, and can to avoid the loss of information caused by the problem of low accuracy of search.

【技术实现步骤摘要】

本专利技术涉及互联网
,特别涉及一种信息搜索方法及装置
技术介绍
随着互联网技术的不断发展及网络数据的日益丰富,为了使得用户能够快速从大量网络数据中获取想要的信息,可以向用户提供搜索服务;也即是,用户可以在搜索框中输入语句,从而根据用户输入的语句从大量网络数据中搜索相关信息。在现有技术中,信息搜索方法可以为:获取用户输入的语句,从该语句中提取出关键词,根据所提取出的关键词搜索相关信息;例如,当用户输入的语句为“周星驰导演、吴孟达主演的电影”时,从该语句中提取关键词“周星驰、吴孟达、电影”,并根据该关键词进行搜索,以得到搜索结果。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:由于从语句中所提取的关键词往往为实体词,容易忽略动词和表示时间信息的词,因此,根据关键词“周星驰、吴孟达、电影”得到的搜索结果并不一定都是“周星驰导演、吴孟达主演的电影”,即在搜索结果中可能还包括周星驰和吴孟达主演的非周星驰导演的电影等其他结果。因此,通过从语句中提取关键词的方法进行信息搜索,容易造成信息丢失,进而导致搜索结果准确性低。
技术实现思路
本专利技术提供了一种信息搜索方法及装置,用以解决现有技术中存在的根据关键词搜索造成信息丢失,进而导致搜索结果准确性低的技术问题。所述技术方案如下:一方面,提供了一种信息搜索方法,所述方法包括:接收用于进行信息搜索的交互语句;从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;根据所述单查询条件进行搜索。另一方面,提供了一种信息搜索装置,所述装置包括:接收模块,用于接收用于进行信息搜索的交互语句;确定模块,用于从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;单查询条件获取模块,用于将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;搜索模块,用于根据所述单查询条件进行搜索。本专利技术实施例提供的技术方案带来的有益效果是:通过接收用于信息搜索的交互语句,从语义属性模板集合中确定与该交互语句中多个连续字词的语义属性一一对应的目标语义属性模板,并根据所确定的目标语义属性模板从该交互语句中获取单查询条件,由于从该交互语句中获取到的单查询条件是由该交互语句中的多个连续字词组成的短语,因此与关键词相比较,该单查询条件所表示的语义信息更完整,能够作为一个完整的查询限定条件,根据所获取到的单查询条件进行信息搜索,能够使搜索结果最大程度符合用户的搜索需求,且能够避免由于丢失信息造成的搜索准确性低的问题。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种信息搜索方法流程图;图2是本专利技术实施例提供的一种目标语义属性模板确定方法流程图;图3是本专利技术实施例提供的一种信息搜索装置框图;图4是本专利技术实施例提供的一种终端400的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。在对本专利技术实施例进行详细的解释说明之前,先对本专利技术实施例的应用场景予以介绍。本专利技术实施例提供的方法应用于电视机、手机、电脑、平板电脑等具有搜索功能或能够安装搜索引擎的智能设备。示例的,本专利技术实施例提供的方法应用于电视机,该电视机内部配置有能够搜索相关影片的多媒体视听资源库,以使得电视机能够根据用户输入的交互语句,在该多媒体视听资源库中进行垂直搜索,以搜索相关视听资源如电影、电视剧等的名称等信息,从而满足用户搜索需求。其中,该垂直搜索是指针对某一个行业的专业搜索,在本专利技术实施例中,以该垂直搜索针对的行业为影视行业为例,对本专利技术所提供的信息搜索方法进行具体说明;相比较通用搜索的海量信息无序化,垂直搜索则显得更加专注、具体和深入,当然,此处仅是举例说明,并不代表本专利技术实施例的信息搜索方法局限于此。图1是本专利技术实施例提供的一种信息搜索方法流程图,该实施例的执行主体为具有信息搜索功能的终端,如电视机、电脑或手机等,以下将以应用场景为从多媒体视听资源库中搜索影视资源为例,对本专利技术所提供的信息搜索方法进行具体说明。如图1所示,包括以下步骤:101、接收用于进行信息搜索的交互语句。具体地,该交互语句可以是用户通过触摸屏输入的,也可以是用户通过按键输入的,还可以是用户通过麦克风语音输入的。本专利技术实施例对该交互语句的具体输入方式不做限定。示例的,用户在搜索页面的搜索栏输入信息,终端接收用户输入的信息,并将该信息接收为交互语句,如“90年代以后的电影”或“周星驰导演吴孟达主演的电影”;本专利技术实施例对该交互语句的具体形式不作限定。102、通过对该交互语句的分词结果进行语义属性标注,获取该语句中各个字词的语义属性。上述分词结果可以是对该交互语句进行分词处理后得到,对语句进行分词处理是指将连续的汉字序列切分成一个个单独的词的过程。分词处理的方法可以是基于字典、词库匹配的分词方法,也可以是基于词的频度统计的分词方法或基于知识理解的分词方法;还可以采用其他分词方法,本专利技术实施例对所采用的具体分词方法不作限定。语义属性标注是指根据分词结果对每一个词标注语义属性,该语义属性的标注方法可以为:根据语义属性模板集合或者本专利技术所提供方法的具体使用场景或所针对的领域,对每一个词标注语义属性。在本专利技术实施例中,以所针对的领域为影视领域,也即是数据库为多媒体视听资源数据库为例,对该标注过程进行具体说明,当该交互语句为“周星驰导演、吴孟达主演的电影”时,对该语句的分词结果进行语义属性标注后得到的结果可以为“周星驰(导演名称)/导演(动词(导演))、吴孟达(演员名称)/主演(动词(演))/的(助词)/电影(多媒体类型(电影))”。进一步地,还可以根据每个词的词性进行标注,例如将每个词标注为名词、动词、形容词或其他词性。需要说明的是,在本专利技术实施例中,除了采用上述方法对该交互语句进行分词处理和语义属性标注处理外,还可以采用其他方法对该交互语句进行语义属性标注,本专利技术实施例对此不作具体限定。103、从语义属性模板集合中确定目标语义属性模板,该目标语义属性模板为与该交互语句中多个连续字词的语义属性一一对应的语义属性模板,该语义属性模板集合包含至少一个语义属性模板,该语本文档来自技高网...
信息搜索方法及装置

【技术保护点】
一种信息搜索方法,其特征在于,所述方法包括:接收用于进行信息搜索的交互语句;从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;根据所述单查询条件进行搜索。

【技术特征摘要】
1.一种信息搜索方法,其特征在于,所述方法包括:接收用于进行信息搜索的交互语句;从语义属性模板集合中确定目标语义属性模板,所述目标语义属性模板为与所述交互语句中多个连续字词的语义属性一一对应的语义属性模板,所述语义属性模板集合包含至少一个语义属性模板,所述语义属性模板由至少一个语义属性顺序构成;将与所述目标语义属性模板匹配的多个连续字词组成的短语获取为所述交互语句的单查询条件;根据所述单查询条件进行搜索。2.根据权利要求1所述的方法,其特征在于,所述根据所述单查询条件进行搜索包括:按照预设规则对所述单查询条件进行参数化,以转换为结构化查询条件,所述预设规则是指与所述目标语义属性模板对应的参数化规则;根据所述结构化查询条件进行搜索。3.根据权利要求2所述的方法,其特征在于,所述结构化查询条件包括条件参数,所述条件参数为主语类参数、谓语类参数、宾语相关属性类参数、宾语类型类参数、条件类型类参数、宾语的数据类型类参数和权值类参数中的至少一类参数;相应地,所述按照预设规则对所述单查询条件进行参数化,以转换为结构化查询条件包括:根据所述单查询条件,对所述预设规则中包含的条件参数进行赋值;将所述赋值结果转化为结构化查询条件。4.根据权利要求3所述的方法,其特征在于,所述权值类参数根据所述单查询条件的优先权确定;或,所述权值类参数根据所述单查询条件的热度信息确定。5.根据权利要求2所述的方法,其特征在于,所述根据所述结构化查询条件进行搜索包括:将所述结构化查询条件转换为与查询工具对应的查询语言;通过所述查询语言实...

【专利技术属性】
技术研发人员:李金凯
申请(专利权)人:海信集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1