System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及信息处理,特别是涉及一种大气水收集专利检索方法、装置以及存储介质。
技术介绍
1、随着经济全球化的深入发展和知识经济的蓬勃兴起,专利信息增长尤为迅速。全世界每年出版的专利说明书在百万件以上,我国每年公布的专利也呈快速增长趋势。专利信息的如此快速增长带来了信息超载,要从海量专利信息里寻找自己想要的专利是一件相当费时费力的事情。
2、尤其是大气水收集领域,在该领域中表达同一意思的专有名词较多,因此不熟悉该领域的工作人员则无法兼顾所有的用于检索的关键字,从而准确检索到想要的专利文本,并且此种类型的检索式的构建也比较繁琐,从而导致工作效率降低,不能准确检索到专利文本等技术问题。
3、针对上述的现有技术中存在的检索式不准确导致的工作效率降低以及检索准确率低的技术问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请的实施例提供了一种大气水收集专利检索方法、装置以及存储介质,以至少解决现有技术中存在的检索式不准确导致的工作效率降低以及检索准确率低的技术问题。
2、根据本申请实施例的一个方面,提供了一种大气水收集专利检索方法,包括:获取与大气水收集领域相关的多个专利文本;利用与大气水收集领域相关的实体类型对各个专利文本进行命名实体识别,确定与各个专利文本对应的实体;根据所识别的实体进行关系抽取,确定各个专利文本的实体之间的关系;根据所确定的实体和关系,确定与各个专利文本对应的知识图谱;接收用户输入的检索信息,并确定与检索信息对应的实体信息,其中
3、根据本申请实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上所述的方法。
4、根据本申请实施例的另一个方面,还提供了一种大气水收集专利检索装置,包括:文本获取模块,用于获取与大气水收集领域相关的多个专利文本;实体确定模块,用于利用与大气水收集领域相关的实体类型对各个专利文本进行命名实体识别,确定与各个专利文本对应的实体;关系确定模块,用于根据所识别的实体进行关系抽取,确定各个专利文本的实体之间的关系;知识图谱确定模块,用于根据所确定的实体和关系,确定与各个专利文本对应的知识图谱;信息确定模块,用于接收用户输入的检索信息,并确定与检索信息对应的实体信息,其中检索信息包括检索关键字和检索文本;以及专利确定模块,用于根据所确定的实体信息从多个专利文本的知识图谱中进行检索,确定与检索信息对应的专利。
5、根据本申请实施例的另一个方面,还提供了一种大气水收集专利检索装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取与大气水收集领域相关的多个专利文本;利用与大气水收集领域相关的实体类型对各个专利文本进行命名实体识别,确定与各个专利文本对应的实体;根据所识别的实体进行关系抽取,确定各个专利文本的实体之间的关系;根据所确定的实体和关系,确定与各个专利文本对应的知识图谱;接收用户输入的检索信息,并确定与检索信息对应的实体信息,其中检索信息包括检索关键字和检索文本;以及根据所确定的实体信息从多个专利文本的知识图谱中进行检索,确定与检索信息对应的专利。
6、在本申请实施例中,服务器利用大气水收集领域的专利文本中的实体以及实体之间的关系构建知识图谱作为专利库。之后服务器利用与检索信息对应的实体信息对知识图谱进行检索,其中实体信息与检索信息可能不相同。与现有技术中通过检索式中的关键字对各个专利文本精确匹配的方法相比,本技术方案生成与检索信息对应的实体信息,从而利用实体信息在专利库中进行检索,从而通过此种类型的模糊查询,扩大了检索的范围,并不局限于只获取存在与检索信息完全相同的字词的专利文本,从而准确确定相应的专利文本,减少了检索的局限性。
7、并且本技术方案还可以将文本(即,检索文本)作为检索信息,从而服务器自动从检索文本中生成实体信息,进而进行检索。从而本技术方案无需再构建繁琐的检索式就可以找到与检索文本相近的其他专利文本,从而提高了检索效率。进而解决了现有技术中存在的检索式不准确导致的工作效率降低以及检索准确率低的技术问题。
本文档来自技高网...【技术保护点】
1.一种大气水收集专利检索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,利用与所述大气水收集领域相关的实体类型对各个专利文本进行命名实体识别,确定与所述各个专利文本对应的实体的操作,包括:
3.根据权利要求2所述的方法,其特征在于,通过预设的命名实体识别模型的多特征融合嵌入层,对所述专利文本进行处理,生成多特征融合向量的操作,包括:
4.根据权利要求2所述的方法,其特征在于,根据所识别的实体进行关系抽取,确定所述各个专利文本的实体之间的关系的操作,包括:
5.根据权利要求1所述的方法,其特征在于,所述检索信息为检索关键字,其中确定与所述检索信息对应的实体信息的操作,包括:
6.根据权利要求2所述的方法,其特征在于,所述检索信息为检索文本,其中确定与所述检索信息对应的实体信息的操作,还包括:
7.根据权利要求6所述的方法,其特征在于,通过预设的实体抽取方法,根据所述多个分句确定相应的第一候选分词的操作,包括:
8.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所
9.一种大气水收集专利检索装置,其特征在于,包括:
10.一种大气水收集专利检索装置,其特征在于,包括:
...【技术特征摘要】
1.一种大气水收集专利检索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,利用与所述大气水收集领域相关的实体类型对各个专利文本进行命名实体识别,确定与所述各个专利文本对应的实体的操作,包括:
3.根据权利要求2所述的方法,其特征在于,通过预设的命名实体识别模型的多特征融合嵌入层,对所述专利文本进行处理,生成多特征融合向量的操作,包括:
4.根据权利要求2所述的方法,其特征在于,根据所识别的实体进行关系抽取,确定所述各个专利文本的实体之间的关系的操作,包括:
5.根据权利要求1所述的方法,其特征在于,所述检索信息为检索关...
【专利技术属性】
技术研发人员:张丽玮,张媛,杨洋,周晓磊,闫瑾,张京,乔剑锋,
申请(专利权)人:首都经济贸易大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。