The invention discloses a retrieval method, a English literature includes: creating a cache table, storage table and a plurality of retrieval units on the server; the first retrieval server to the client to upload to retrieve keywords English group; keywords group and the server all the first retrieval match, the high degree of one of the top ten the first section is the retrieval retrieval unit associated English document storage, cache table; keywords group and server all second retrieval matches will match, high in the top ten of the second search bar belongs to search associated English documents stored in the cache table; all English Literature Association in the cache table retrieval unit ID and the current time and group related keywords, and stored into the storage table, the cache table in all English documents sent to the client, empty slowly Storage area. The English document retrieval method designed by the invention not only has high correlation with the key to be tested, but also has fast retrieval speed.
【技术实现步骤摘要】
一种英文文献的检索方法
本专利技术涉及一种英文文献的检索方法。
技术介绍
计算机和网络不断的发展,全球进入了信息大融合的时代。科学工作这几乎每天都要查找英文文章,以了解最新的科学发展动向,我们要想快速的了解到国外科学研究的动态,就要的不断的阅读国外最新的文献,但是目前的英文检索系统往往检索出的文章数量太多且相关度不高,给阅读者造成了很大的困扰。在中国专利申请号为201110112548.1中提到了一种检索的方法,其主要利用N-Gram语言模型,虽然提高了检索的相关度,但是,这种检索方法数据量庞大,需要很大的服务器支持,而且检索出的相关文献的数量也十分巨大,需要检索人员在人工挑选,且这种检索方法并非针对英语检索,所以对英文检索的相关度也不是很高。
技术实现思路
本专利技术针对目前英文检索中存在的问题,提供一种英文文献的检索方法。本专利技术提供的技术方案为:一种英文文献的检索方法,包括:步骤1、在服务器上创建缓存表、存储表和多个检索单位,每篇英文文献关联一个检索单位,对于任意一个检索单位均包括ID、英文文献录入时间、第一检索条和第二检索条,所述第一检索条为由所述检索单位关联的英文文献的题目中的所有名词和实意动词组成,所述第二检索条包括所述检索单位关联的英文文献正文中所有名词和实意动词,在第二检索条中的每个名词与其在所述检索单位关联的英文文献中出现的频率数关联;步骤2、首次检索,客户端上传要检索的英文关键词群到服务器上,利用分词器删除关键词群中的非名词和非实意动词,任意一个关键词群至少包括一个名词和一个实意动词;将关键词群与服务器上所有第一检索条匹配,将匹配度高的位 ...
【技术保护点】
一种英文文献的检索方法,其特征在于,包括:步骤1、在服务器上创建缓存表、存储表和多个检索单位,每篇英文文献关联一个检索单位,对于任意一个检索单位均包括ID、英文文献录入时间、第一检索条和第二检索条,所述第一检索条为由所述检索单位关联的英文文献的题目中的所有名词和实意动词组成,所述第二检索条包括所述检索单位关联的英文文献正文中所有名词和实意动词,在第二检索条中的每个名词与其在所述检索单位关联的英文文献中出现的频率数关联;步骤2、首次检索,客户端上传要检索的英文关键词群到服务器上,利用分词器删除关键词群中的非名词和非实意动词,任意一个关键词群至少包括一个名词和一个实意动词;将关键词群与服务器上所有第一检索条匹配,将匹配度高的位于前十位的第一检索条所属的检索单位关联的英文文献存储到缓存表中;将关键词群与服务器上所有第二检索条匹配,将匹配度高的位于前十位的第二检索条所属的检索单位关联的英文文献存储到缓存表中;将缓存表中所有英文文献关联的检索单位的ID和当前时间与关键词群关联,并存储到存储表中,将缓存表中的所有英文文献发送到客户端,清空缓存区;步骤3、当进行非首次检索时,客户端上传要检索的英文关 ...
【技术特征摘要】
1.一种英文文献的检索方法,其特征在于,包括:步骤1、在服务器上创建缓存表、存储表和多个检索单位,每篇英文文献关联一个检索单位,对于任意一个检索单位均包括ID、英文文献录入时间、第一检索条和第二检索条,所述第一检索条为由所述检索单位关联的英文文献的题目中的所有名词和实意动词组成,所述第二检索条包括所述检索单位关联的英文文献正文中所有名词和实意动词,在第二检索条中的每个名词与其在所述检索单位关联的英文文献中出现的频率数关联;步骤2、首次检索,客户端上传要检索的英文关键词群到服务器上,利用分词器删除关键词群中的非名词和非实意动词,任意一个关键词群至少包括一个名词和一个实意动词;将关键词群与服务器上所有第一检索条匹配,将匹配度高的位于前十位的第一检索条所属的检索单位关联的英文文献存储到缓存表中;将关键词群与服务器上所有第二检索条匹配,将匹配度高的位于前十位的第二检索条所属的检索单位关联的英文文献存储到缓存表中;将缓存表中所有英文文献关联的检索单位的ID和当前时间与关键词群关联,并存储到存储表中,将缓存表中的所有英文文献发送到客户端,清空缓存区;步骤3、当进行非首次检索时,客户端上传要检索的英文关键词群到服务器上;将关键词群与服务器上存储表中的关键词群进行匹配,判断是否存在与要检索的关键词群相同的已存储在存储表中的关键词群,如不存在,则进行步骤2,若存在,则查找是否存在在该关键词群关联的当前时间之后的英文文献录入时间,若不存在,则将与该关键词群关联的ID所属的检索单位关联的英文文献发送到客户端,若存在,则将该关键词群关联的当前时间之后的英文文献录入时间所属的检索单位关联的英文文献与该关键词群关联ID所属的检索单位关联的英文文献合并为合并集,删除存储表中该关键词群以及和该关键词群关联的ID和当前时间,在合并集中进行步骤2。2.如权利要求1所述的英文文献的检索方法,其特征在于,所述步骤2中,将关键词群与服务器上所有第一检索条匹配的具体过程为:a、统计关键词群中的名词与每一第一检索条中包括的所有名词的匹配度,滤除与关键词中的名词匹配度为零的第一检索条,将匹配度相同且不为零的第一检索条放置在同一个第一匹配组中,若匹配度高的前三个第一匹配组中第一检索条的个数小于等于十个,则将这些第一检索条所属的检索单元关联的英文文献存储到缓存表中,...
【专利技术属性】
技术研发人员:杨天地,刘曲,付姗姗,
申请(专利权)人:辽宁医学院,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。