一种词库的加载方法及装置制造方法及图纸

技术编号:15724807 阅读:307 留言:0更新日期:2017-06-29 11:14
本申请提供了一种词库的加载方法及装置,当搜索服务器的硬盘中的词库中添加了新的词语时,添加了新的词语的文件的自身的末次修改时间和预设位置中记录的末次修改时间不同,此时,会将词库中保存的每个文件中的所有词语保存到内存中。本发明专利技术中将词库中保存的每个文件中的所有词语保存到内存中时,不需要重新启动搜索服务器。解决了在将添加了新的词语的词库中的词语保存到搜索服务器的内存时,需要重新启动搜索服务器的问题。

【技术实现步骤摘要】
一种词库的加载方法及装置
本专利技术涉及计算机字符输入领域,更具体的说,涉及一种词库的加载方法及装置。
技术介绍
当用户想要在网页上搜索某一文本时,搜索服务器会根据搜索服务器的内存中保存的词语,去搜索与用户输入的文本相近的文章。其中,搜索服务器只有在启动时,才会将保存在搜索服务器的硬盘中的词库中的词语加载到搜索服务器的内存中,加载的过程为将搜索服务器的硬盘中的词库中的词语保存到搜索服务器的内存中。当人工发现有新的词语添加到词库中时,需要重新启动搜索服务器,才能够将新的词语保存到搜索服务器的内存中。由于重新启动搜索服务器时,用户不能使用搜索服务器进行搜索,降低了用户体验。因此,亟需一种能够不重新启动搜索服务器而将添加了新的词语的词库中的词语保存到搜索服务器的内存的方法。
技术实现思路
有鉴于此,本专利技术提供了一种词库的加载方法及装置,以解决在将添加了新的词语的词库中的词语保存到搜索服务器的内存时,需要重新启动搜索服务器的问题。为解决上述技术问题,本专利技术采用了如下技术方案:一种词库的加载方法,包括:判断词库中是否保存有预设位置中记录的末次修改时间为空白的文件;当判断出所述词库中没有保存有预设位置中记录的末次修改时间为空白的文件,判断所述词库中保存的所有文件中是否包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件;当判断出所述词库中保存的所有文件中包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件,将所述词库中保存的每个文件中的所有词语保存到内存中。优选地,当判断出所述词库中保存有预设位置中记录的末次修改时间为空白的文件后,还包括:将所述词库中保存的每个文件中的所有词语保存到内存中。优选地,所述将所述词库中保存的每个文件中的所有词语保存到内存中后,还包括:将自身的末次修改时间和预设位置中记录的末次修改时间不相同的每个文件的预设位置中记录的末次修改时间修改为自身的末次修改时间。优选地,所述将所述词库中保存的每个文件中的所有词语保存到内存中之前,还包括:保存自身的末次修改时间和预设位置中记录的末次修改时间不相同的每个文件中的所有词语。优选地,所述词库中包含有多个搜索词文件和多个停用词文件;其中,所述搜索词文件中记录有多个非停用词的词语,所述停用词文件中记录有多个停用词。一种词库的加载装置,包括:第一判断单元,用于判断词库中是否保存有预设位置中记录的末次修改时间为空白的文件;第二判断单元,用于当所述第一判断单元判断出所述词库中没有保存有预设位置中记录的末次修改时间为空白的文件,判断所述词库中保存的所有文件中是否包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件;第一保存单元,用于当所述第二判断单元判断出所述词库中保存的所有文件中包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件,将所述词库中保存的每个文件中的所有词语保存到内存中。优选地,所述第一保存单元还用于:当所述第一判断单元判断出所述词库中保存有预设位置中记录的末次修改时间为空白的文件后,将所述词库中保存的每个文件中的所有词语保存到内存中。优选地,还包括:修改保存单元,用于所述第一保存单元将所述词库中保存的每个文件中的所有词语保存到内存中后,将自身的末次修改时间和预设位置中记录的末次修改时间不相同的每个文件的预设位置中记录的末次修改时间修改为自身的末次修改时间。优选地,还包括:第二保存单元,用于所述第一保存单元将所述词库中保存的每个文件中的所有词语保存到内存中之前,保存自身的末次修改时间和预设位置中记录的末次修改时间不相同的每个文件中的所有词语。相较于现有技术,本专利技术具有以下有益效果:本专利技术提供了一种词库的加载方法及装置,当搜索服务器的硬盘中的词库中添加了新的词语时,添加了新的词语的文件的自身的末次修改时间和预设位置中记录的末次修改时间不同,此时,会将词库中保存的每个文件中的所有词语保存到内存中。本专利技术中将词库中保存的每个文件中的所有词语保存到内存中时,不需要重新启动搜索服务器。解决了在将添加了新的词语的词库中的词语保存到搜索服务器的内存时,需要重新启动搜索服务器的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术提供的一种词库的加载方法的方法流程图;图2为本专利技术提供的另一种词库的加载方法的方法流程图;图3为本专利技术提供的一种词库的加载装置的结构示意图;图4为本专利技术提供的另一种词库的加载装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种词库的加载方法,参照图1,包括:S101、判断词库中是否保存有预设位置中记录的末次修改时间为空白的文件;其中,词库为搜索服务器的硬盘中的词库,词库中包含有多个搜索词文件和多个停用词文件;其中,搜索服务器为基于Lucene的搜索服务器Elasticsearch搜索服务器,预设位置为数据库或者内存。其中,搜索词文件中记录有多个非停用词的词语,例如:苹果、梨等词语。其中,搜索词文件中的每个文件可以是一类词的文件,如,其中一个搜索词文件中包含的词语为苹果、梨等形容水果的词语,另一个搜索词文件中包含的词语为猴子、大象等形容动物的词语。停用词文件中记录有多个停用词,其中。停用词包括阿、的、了等停用词。需要说明的一点是,为了能够区分每个文件是停用词文件还是搜索词文件,此时按照文件的文件名称进行区分,可以将停用词文件和搜索词文件的文件名称的开头设置为不同的名称。如,搜索词文件的文件名称的开头为dnamic,停用词文件的文件名称的开头为dnamicStop。文件的预设位置中记录的末次修改时间为空白,说明这个文件是新建的。新建的这个文件中记录有一个或多个词语。这些词语可能和词库中保存的其他文件中的词语相同,也可能不同,但一般情况下,新建的这个文件中记录的词语与词库中保存的其他文件中的词语不相同。S102、判断词库中保存的所有文件中是否包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件;具体的,当判断出词库中没有保存有预设位置中记录的末次修改时间为空白的文件,判断词库中保存的所有文件中是否包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件;其中,文件的自身的末次修改时间和预设位置中记录的末次修改时间不相同,说明这个文件在预设位置中记录了末次修改时间后,又进行了修改。其中,修改包括增加词语或者删除词语。S103、将词库中保存的每个文件中的所有词语保存到内存中。具体的,当判断出词库中保存的所有文件中包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件,将词库中保存的每个文件中的所有词语保存到内存中。其中,将词库中保存的每个文件中的所有词语保存到内存中后,当用户本文档来自技高网...
一种词库的加载方法及装置

【技术保护点】
一种词库的加载方法,其特征在于,包括:判断词库中是否保存有预设位置中记录的末次修改时间为空白的文件;当判断出所述词库中没有保存有预设位置中记录的末次修改时间为空白的文件,判断所述词库中保存的所有文件中是否包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件;当判断出所述词库中保存的所有文件中包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件,将所述词库中保存的每个文件中的所有词语保存到内存中。

【技术特征摘要】
1.一种词库的加载方法,其特征在于,包括:判断词库中是否保存有预设位置中记录的末次修改时间为空白的文件;当判断出所述词库中没有保存有预设位置中记录的末次修改时间为空白的文件,判断所述词库中保存的所有文件中是否包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件;当判断出所述词库中保存的所有文件中包含有自身的末次修改时间和预设位置中记录的末次修改时间不相同的文件,将所述词库中保存的每个文件中的所有词语保存到内存中。2.根据权利要求1所述的加载方法,其特征在于,当判断出所述词库中保存有预设位置中记录的末次修改时间为空白的文件后,还包括:将所述词库中保存的每个文件中的所有词语保存到内存中。3.根据权利要求1所述的加载方法,其特征在于,所述将所述词库中保存的每个文件中的所有词语保存到内存中后,还包括:将自身的末次修改时间和预设位置中记录的末次修改时间不相同的每个文件的预设位置中记录的末次修改时间修改为自身的末次修改时间。4.根据权利要求1所述的加载方法,其特征在于,所述将所述词库中保存的每个文件中的所有词语保存到内存中之前,还包括:保存自身的末次修改时间和预设位置中记录的末次修改时间不相同的每个文件中的所有词语。5.根据权利要求1所述的加载方法,其特征在于,所述词库中包含有多个搜索词文件和多个停用词文件;其中,所述搜索词文件中记录有多个非停用词的词语,所述停用词文件中记录有多个停用词。...

【专利技术属性】
技术研发人员:薛庆元袁玮玮
申请(专利权)人:北京焦点新干线信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1