一种遥感卫星资讯推荐方法、系统及设备技术方案

技术编号:36453596 阅读:21 留言:0更新日期:2023-01-25 22:50
本发明专利技术涉及一种遥感卫星资讯推荐方法、系统及设备,包括:采集卫星资讯文本并进行初步处理,将资讯文本组织为预设的数据存储结构并存储;对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯;利用上述带有标签及置信度的卫星资讯,构建卫星知识图谱;根据用户的查询内容,对上述存储的卫星资讯进行初步召回;基于构建的卫星知识图谱,挖掘上述召回资讯结果的关联资讯,作为推荐候选资讯集;对上述推荐候选资讯集中的候选资讯进行相关性评测,根据评测结果进行最终推荐。根据评测结果进行最终推荐。根据评测结果进行最终推荐。

【技术实现步骤摘要】
一种遥感卫星资讯推荐方法、系统及设备


[0001]本专利技术专利涉及智能推荐
,具体为一种遥感卫星资讯的推荐方法、系统架构、装置、设备及存储介质。

技术介绍

[0002]随着卫星遥感技术的迅猛发展,全球进入了一个对地观测的新时代。遥感卫星发射数量整体不断增加,商用遥感卫星比例逐渐提高,基于卫星遥感数据的商业化应用层出不穷,取得了巨大的社会经济效益。同时,互联网的蓬勃发展,遥感卫星相关信息量大幅增长。在海量的资讯中快速定位符合用户需求的有效信息,并进一步对目标信息进行深度挖掘、关联分析以及趋势研究,对于卫星遥感领域的国家战略、行业研究、商业分析等应用具有重要意义。
[0003]一方面,遥感卫星行业范围广,相关资讯涉及到遥感卫星制造、卫星发射服务、地面设备制造、遥感卫星运营、遥感卫星应用服务等多个环节。另一方面,遥感卫星信息专业化程度高,获取遥感卫星情报需要具备专业领域的知识。目前常用的推荐方法有基于关键词推荐和基于用户行为推荐,其中基于关键词的检索推荐,由于上下文语义信息缺失,割裂了数据的关联性,使得召回的遥感卫星信息效果不佳,信息利用率不高;基于用户行为的推荐算法,经常会受到用户与对象之间的行为关系数据的稀疏性影响,同时新用户或者新物品进行推荐时存在的冷启动问题也会导致推荐效果不佳。
[0004]知识图谱本质上一种语义网络,其中蕴含着大量实体与实体之间的关系。通过构建关于商业遥感卫星资讯的图谱信息,并将资讯标签映射为知识图谱的实体,一定程度上弥补了标签之间潜在的语义关联信息的丢失,这样可以有效解决数据稀疏的问题,以提高系统性能和推荐效果。

技术实现思路

[0005]本专利技术解决的技术问题是:为解决上述存在的问题,本专利技术提供一种遥感卫星资讯的智能推荐方法、系统及设备。
[0006]本专利技术解决技术的方案是:一种遥感卫星资讯推荐方法,包括:
[0007]采集卫星资讯文本并进行初步处理,将资讯文本组织为预设的数据存储结构并存储;
[0008]对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯;
[0009]利用上述带有标签及置信度的卫星资讯,构建卫星知识图谱;
[0010]根据用户的查询内容,对上述存储的卫星资讯进行初步召回;
[0011]基于构建的卫星知识图谱,挖掘上述召回资讯结果的关联资讯,作为推荐候选资讯集;
[0012]对上述推荐候选资讯集中的候选资讯进行相关性评测,根据评测结果进行最终推荐。
[0013]优选的,所述系统所述初步处理包括:
[0014]从新闻网站、遥感卫星运营商官网以及各国航天政府机构网站进行多线程爬取,获取卫星资讯的原始文本信息;
[0015]选择检索引擎作为卫星资讯的存储组件;
[0016]通过抽取、转换清洗、加载流程对原始文本信息进行处理,将资讯文本组织为预设的数据存储结构并存储至上述检索引擎。
[0017]优选的,所述系统所述的检索引擎选择ES全文检索引擎,全文检索引擎以集群的方式进行部署。
[0018]优选的,所述系统得到带有标签及置信度的卫星资讯包括:
[0019]提取检索引擎中遥感卫星领域的关键词作为标签,形成卫星资讯标签库;
[0020]设计可配置的智能标签匹配模型,所述匹配模型概括不同特征的标签对资讯文本的匹配逻辑,并能计算得到标签于资讯文本的匹配置信度;
[0021]利用所述智能标签匹配模型对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯。
[0022]优选的,所述系统所述可配置的智能标签匹配模型包括标签匹配策略、标签匹配模式、结果置信度计算模式三部分;
[0023]所述的标签匹配策略中存储预先设计的多个匹配策略;
[0024]所述标签匹配模式用于根据需求从标签匹配策略中选择不同的匹配策略组成单策略模式或组合匹配模式;
[0025]所述结果置信度计算模式中存储不同的置信度计算模式。
[0026]优选的,所述系统所述匹配策略包括正则标签匹配策略、文本相似度标签匹配策略、深度学习标签匹配策略;
[0027]所述正则标签匹配策略适用于遥感卫星领域的专业词组或固定表达构成的标签匹配;
[0028]所述文本相似度标签匹配策略用于使用资讯与标准表述的文本相似度来判断是否满足标签匹配,所述标准为参考标准,是标签特征设计的概括性表述;
[0029]所述深度学习标签匹配策略以资讯文本作为输入,标签匹配得分作为输出进行网络训练;网络输出的得分超过设置的阈值,则认为标签匹配,得分作为置信度。
[0030]优选的,所述系统通过最大通用性的表设计方式,将智能标签匹配模型的配置方式存放在MySQL数据库中,保证智能标签匹配模型的开闭原则,使匹配策略能够进行灵活快速地迭代。
[0031]优选的,所述系统最大通用型的表设计内容包括:
[0032]设计验证阶段:卫星资讯文本数量小于500,匹配策略和标签匹配模式为:正则匹配策略或文本相似度匹配策略的单策略模式;结果置信度计算模式为直接使用单一策略的置信度结果作为模型的最终置信度结果;
[0033]开发实施阶段:卫星资讯文本数量500

2000,匹配策略和标签匹配模式为:正则匹配+深度学习标签匹配策略;或者文本相似度+深度学习标签匹配策略的组合策略模式;结果置信度计算模式为求取不同策略置信度结果的平均值作为模型的最终置信度结果;
[0034]试运行阶段:卫星资讯文本数量2000

5000时,匹配策略和标签匹配模式为:正则
匹配+深度学习标签匹配策略;或者文本相似度+深度学习标签匹配策略的组合策略模式;结果置信度计算模式为求取不同策略置信度结果的加权平均值作为模型的最终置信度结果;
[0035]运行阶段:卫星资讯文本数量大于5000时,匹配策略和标签匹配模式为:深度学习标签匹配策略的单策略模式,结果置信度计算模式为直接使用单一策略的置信度结果作为模型的最终置信度结果。
[0036]优选的,所述系统对匹配结果进行人工校验,其中,设计验证阶段以及开发实施阶段均辅以人工全校验;试运行阶段辅以人工定期抽样校验;运行阶段辅以人工不定期抽样校验。
[0037]优选的,所述系统开发实施阶段,资讯每增加预设的篇幅,深度学习网络迭代更新一次,整个开发实施阶段,更新次数为10

20次。
[0038]优选的,所述系统深度学习网络由嵌入层、2层双向LSTM层、3层全连接层构成;以资讯文本作为输入,标签匹配得分作为输出进行网络训练;网络输出的得分超过设置的阈值,则认为标签匹配,得分作为置信度。
[0039]优选的,所述系统所述构建卫星知识图谱包括:
[0040]将卫星资讯标签库的每一个标签以标签实体的形式,存入图数据库;
[0041]将资讯文本以资讯实体的形式,存入图数据库;
[0042]建立资讯实体与标签本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遥感卫星资讯推荐方法,其特征在于包括:采集卫星资讯文本并进行初步处理,将资讯文本组织为预设的数据存储结构并存储;对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯;利用上述带有标签及置信度的卫星资讯,构建卫星知识图谱;根据用户的查询内容,对上述存储的卫星资讯进行初步召回;基于构建的卫星知识图谱,挖掘上述召回资讯结果的关联资讯,作为推荐候选资讯集;对上述推荐候选资讯集中的候选资讯进行相关性评测,根据评测结果进行最终推荐。2.根据权利要求1所述的方法,其特征在于:所述初步处理包括:从新闻网站、遥感卫星运营商官网以及各国航天政府机构网站进行多线程爬取,获取卫星资讯的原始文本信息;选择检索引擎作为卫星资讯的存储组件;通过抽取、转换清洗、加载流程对原始文本信息进行处理,将资讯文本组织为预设的数据存储结构并存储至上述检索引擎。3.根据权利要求2所述的方法,其特征在于:所述的检索引擎选择ES全文检索引擎,全文检索引擎以集群的方式进行部署。4.根据权利要求1所述的方法,其特征在于:得到带有标签及置信度的卫星资讯包括:提取检索引擎中遥感卫星领域的关键词作为标签,形成卫星资讯标签库;设计可配置的智能标签匹配模型,所述匹配模型概括不同特征的标签对资讯文本的匹配逻辑,并能计算得到标签于资讯文本的匹配置信度;利用所述智能标签匹配模型对存储的资讯文本进行智能标签匹配,得到带有标签及置信度的卫星资讯。5.根据权利要求4所述的方法,其特征在于:所述可配置的智能标签匹配模型包括标签匹配策略、标签匹配模式、结果置信度计算模式三部分;所述的标签匹配策略中存储预先设计的多个匹配策略;所述标签匹配模式用于根据需求从标签匹配策略中选择不同的匹配策略组成单策略模式或组合匹配模式;所述结果置信度计算模式中存储不同的置信度计算模式。6.根据权利要求5所述的方法,其特征在于:所述匹配策略包括正则标签匹配策略、文本相似度标签匹配策略、深度学习标签匹配策略;所述正则标签匹配策略适用于遥感卫星领域的专业词组或固定表达构成的标签匹配;所述文本相似度标签匹配策略用于使用资讯与标准表述的文本相似度来判断是否满足标签匹配,所述标准为参考标准,是标签特征设计的概括性表述;所述深度学习标签匹配策略以资讯文本作为输入,标签匹配得分作为输出进行网络训练;网络输出的得分超过设置的阈值,则认为标签匹配,得分作为置信度。7.根据权利要求5所述的方法,其特征在于:通过最大通用性的表设计方式,将智能标签匹配模型的配置方式存放在MySQL数据库中,保证智能标签匹配模型的开闭原则,使匹配策略能够进行灵活快速地迭代。8.根据权利要求7所述的方法,其特征在于:最大通用型的表设计内容包括:设计验证阶段:卫星资讯文本数量小于500,匹配策略和标签匹配模式为:正则匹配策
略或文本相似度匹配策略的单策略模式;结果置信度计算模式为直接使用单一策略的置信度结果作为模型的最终置信度结果;开发实施阶段:卫星资讯文本数量500

2000,匹配策略和标签匹配模式为:正则匹配+深度学习标签匹配策略;或者文本相似度+深度学习标签匹配策略的组合策略模式;结果置信度计算模式为求取不同策略置信度结果的平均值作为模型的最终置信度结果;试运行阶段:卫星资讯文本数量2000

5000时,匹配策略和标签匹配模式为:正则匹配+深度学习标签匹配策略;或者文本相似度+深度学习标签匹配策略的组合策略模式;结果置信度计算模式为求取不同策略置信度结果的加权平均值作为模型的最终置信度结果;运行阶段:卫星资讯文本数量大于5000时,匹配策略和标签匹配模式为:深度学习标签匹配策略的单策略模式,结果置信度计算模式为直接使用单一策略的置信度结果作为模型的最终置信度结果。9.根据权利要求8所述的方法,其特征在于:对匹配结果进行人工校验,其中,设计验证阶段以及开发实施阶段均辅以人工全校验;试运行阶段辅以人工定期抽样校验;运行阶段辅以人工不定期抽样校验。10.根据权利要求8所述的方法,其特征在于:开发实施阶段,资讯每增加预设的篇幅,深度学习网络迭代更新一次,整个开发实施阶段,更新次数为10

20次。11.根据权利要求6所述的方法,其特征在于:深度学习网络由嵌入层、2层双向LSTM层、3层全连接层构成;以资讯文本作为输入,标签匹配得分作为输出进行网络训练;网络输出的得分超过设置的阈值,则认为标签匹配,得分作为置信度。12.根据权利要求4所述的方法,其特征在...

【专利技术属性】
技术研发人员:玉龙飞雪万伟王冠珠唐珂黄涛王浩天刘国栋乔亦实闫大鹏李辉
申请(专利权)人:中国四维测绘技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1