搜索引擎关键字的关联建立系统及方法技术方案

技术编号:2876935 阅读:194 留言:0更新日期:2012-04-11 18:40
一种搜寻引擎的关键字关联建立系统,包括一查询行为资料库、一浏览行为资料库及一关联分析器。查询行为资料库中记录一第一关键字及相应的一第一搜寻资讯与一第二关键字及相应的一第二搜寻资讯。浏览行为资料库中记录第一关键字及第一搜寻资讯所相应的一第一浏览资讯与第二关键字及第二搜寻资讯所相应的一第二浏览资讯。关联分析器则依据第一搜寻资讯、第二搜寻资讯、第一浏览资讯、及第二浏览资讯,决定第一关键字与第二关键字所相应的一关联值。一种搜寻引擎的关键字关联建立方法,是记录所述第一及第二关键字及相关的搜寻资讯,然后,记录该相关资讯所对应的浏览资讯,最后,依据该第一、第二搜寻资讯,第一、第二浏览资讯,决定该第一关键字与该第二关键字所相应的一关联值。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术系有关于一种,且特别有关于一种可以依据使用者的查询行为及浏览行为来决定关联词的关联建立系统及方法。另一方面,如果以人工的方式建立关联词,则必须花费大量的人力与时间成本,而且对于不同领域的关联词也不一定能适用,因此,必须重新建立关联词而更加浪费人力与时间。此外,由于国际互连网世界不断地有新词出现,因此,在现存搜寻引擎中,也必须不断地将新词建立关联,以维持整体搜寻引擎的关联正确率。有鉴于此,本专利技术的主要目的为提供一种可以依据使用者的查询行为及浏览行为来决定关联词的关联建立系统及方法。为了达成本专利技术的上述目的,可借由本专利技术所提供的搜寻引擎的关键字关联建立系统来达成。本专利技术搜寻引擎的关键字关联建立系统包括一查询行为资料库、一浏览行为资料库及一关联分析器。查询行为资料库中记录一第一关键字及相应的一第一搜寻资讯与一第二关键字及相应的一第二搜寻资讯。浏览行为资料库中记录第一关键字及第一搜寻资讯所相应的一第一浏览资讯与第二关键字及第二搜寻资讯所相应的一第二浏览资讯。关联分析器则依据第一搜寻资讯、第二搜寻资讯、第一浏览资讯、及第二浏览资讯,决定第一关键字与第二关键字所相应的一关联值。此外,本专利技术亦提出一种搜寻引擎的关键字关联建立方法。首先,记录一第一关键字及相应的一第一搜寻资讯与一第二关键字及相应的一第二搜寻资讯。然后,记录第一关键字及第一搜寻资讯所相应的一第一浏览资讯与第二关键字及第二搜寻资讯所相应的一第二浏览资讯。最后,依据第一搜寻资讯、第二搜寻资讯、第一浏览资讯、及第二浏览资讯,决定第一关键字与第二关键字所相应的一关联值。本专利技术的第一搜寻资讯与第二搜寻资讯分别包括一第一文件集合与一第二文件集合,且关联值包含一搜寻关联值。其中,搜寻关联值系依据第一文件集合与第二文件集合中出现的相同文件的数目来决定。上述关联值更可以包含一浏览关联值,且第一浏览资讯与第二浏览资讯,分别包括相应第一文件集合与第二文件集合的一第一浏览时间集合与一第二浏览时间集合。其中,浏览关联值系依据第一文件集合与第二文件集合中每一相同文件的重要性来决定。而每一相同文件的重要性系依据每一相同文件所分别相应第一浏览时间集合与第二浏览时间集合中的一第一浏览时间与一第二浏览时间来决定。附图说明为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合附图,详细说明如下图1为依据本专利技术实施例的搜寻引擎的关键字关联建立系统的系统架构示意图。图2为依据本专利技术实施例的搜寻引擎的关键字关联建立方法的操作流程图。依据本专利技术实施例的搜寻引擎的关键字关联建立系统包括一搜寻引擎10、查询行为资料库11、浏览行为资料库12、关联分析器13、以及一关联词资料库14。搜寻引擎10系用以接收使用者输入的关键字,而依照输入的关键字进行查询。假设使用者输入一第一关键字与一第二关键字,则藉由搜寻引擎10的查询可以分别得到相应的第一搜寻资讯与第二搜寻资讯。其中,第一搜寻资讯与第二搜寻资讯分别包括一第一文件集合与一第二文件集合,换句话说,第一文件集合与第二文件集合分别包括了多篇与第一关键字与第二关键字相关的文件。查询行为资料库11中则记录使用者输入的第一关键字及相应的第一搜寻资讯与第二关键字及相应的第二搜寻资讯。浏览行为资料库12中则记录第一关键字及第一搜寻资讯所相应的第一浏览资讯与第二关键字及第二搜寻资讯所相应的第二浏览资讯。其中,第一浏览资讯与第二浏览资讯,分别包括相应第一文件集合与第二文件集合的一第一浏览时间集合与一第二浏览时间集合。第一浏览时间集合与第二浏览时间集合分别记录使用者针对第一文件集合与第二文件集合中不同文件的浏览时间。关联分析器13则依据第一搜寻资讯、第二搜寻资讯、第一浏览资讯、以及第二浏览资讯,决定第一关键字与第二关键字所相应的一关联值。关联词资料库14则用来记录此第一关键字、第二关键字及相应的关联值。其中,关联值包含一搜寻关联值与一浏览关联值,主要系依据使用者的查询行为与浏览行为来分别决定。接下来,关联分析器13如何依据第一搜寻资讯、第二搜寻资讯、第一浏览资讯、以及第二浏览资讯,来决定第一关键字与第二关键字所相应的关联值将进行说明如下。首先,相应于第一关键字与第二关键字的关联值中的搜寻关联值可以以下列方程式计算 其中,N1表示第一关键字所相应的第一文件集合中所包含的文件数目,N2表示第二关键字所相应的第二文件集合中所包含的文件数目,且S表示第一文件集合与第二文件集合中相同文件的数目。因此,搜寻关联值可以依据第一文件集合与第二文件集合中出现的相同文件的数目来决定。另一方面,相应于第一关键字与第二关键字的关联值中的浏览关联值可以以下列方程式计算 且Wi=TiΣj=1PTjP]]>其中,Wi表示S篇相同的文件中,文件i对于使用者的重要性。P表示S篇相同的文件中使用者浏览的文件数目,Ti表示使用者浏览文件i所花费的时间。换言之,所谓文件的重要性系依据此文件相对于其他相同文件中被使用者浏览的文件所花费的浏览时间而决定。之后,可以利用搜寻关联值与浏览关联值计算第一关键字与第二关键字所相应的关联值关联值1,2=α×搜寻关联值1,2+(1-α)×浏览关联值1,2,其中,0≤α≤1,且α值可以依据不同的领域或应用而有所调整。此外,本专利技术亦可依据不同使用者对于关键字的搜寻与文件的浏览行为来相互进行关键字间的关联。假设使用者A与使用者B分别输入第一关键字与第二关键字进行查询。第一关键字所相应的第一文件集合中包含了N1篇文件,第二关键字所相应的第二文件集合中包含了N2篇文件,且S表示第一文件集合与第二文件集合中相同文件的数目。因此,相应于第一关键字与第二关键字的关联值中的搜寻关联值可以以下列方程式计算 另一方面,相应于第一关键字与第二关键字的关联值中的浏览关联值可以以下列方程式计算 且Wi,k=Ti,kAiΣj=1PTj,kAjPk]]>其中,Wi,k表示S篇相同的文件中,文件i对于使用者k的重要性。Pk表示S篇相同的文件中使用者k浏览的文件数目,Ti,k表示使用者k浏览文件i所花费的时间,Ai表示所有使用者浏览文件i所花费时间的平均。在此情况中,浏览行为资料库12中可以依据不同使用者分别记录其浏览资讯,因此,Ai可以透过简单的运算求得。相同地,可以利用搜寻关联值与浏览关联值计算第一关键字与第二关键字所相应的关联值关联值1,2=α×搜寻关联值1,2+(1-α)×浏览关联值1,2,其中,0≤α≤1,且α值可以依据不同的领域或应用而有所调整。接下来,图2显示依据本专利技术实施例的搜寻引擎的关键字关联建立方法的操作流程,同时参考图1与图2,本专利技术实施例的操作流程将说明于下。首先,如步骤S20,使用者利用搜寻引擎10查询第一关键字与第二关键字,从而分别得到相应第一关键字与第二关键字的第一搜寻资讯与第二搜寻资讯。然后,如步骤S22,将第一关键字及相应的第一搜寻资讯与第二关键字及相应的第二搜寻资讯记录于查询行为资料库11中。其中,第一搜寻资讯与第二搜寻资讯分别包括一第一文件集合与一第二文件集合,也就是说,第一文件集合与第二文件集合分别包括了多篇与第一关键字与第二关键字相关的文件。并如步骤S24,将使用者对于第一搜寻资讯的本文档来自技高网...

【技术保护点】
一种搜寻引擎的关键字关联建立系统,其特征在于,包括: 一查询行为资料库,记录一第一关键字及相应的一第一搜寻资讯与一第二关键字及相应的一第二搜寻资讯; 一浏览行为资料库,记录该第一关键字及该第一搜寻资讯所相应的一第一浏览资讯与该第二关键字及该第二搜寻资讯所相应的一第二浏览资讯;以及 一关联分析器,依据该第一搜寻资讯、该第二搜寻资讯、该第一浏览资讯、及该第二浏览资讯,决定该第一关键字与该第二关键字所相应的一关联值。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈文鋕张履平
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1