【技术实现步骤摘要】
一种基于语义分析的知识推送系统及方法
本专利技术涉及一种基于语义分析的知识推送系统及方法。
技术介绍
传统的通过搜索技术获取知识的方式不能满足用户在缺乏关键词情况时的知识需求,且搜索方式获取的知识内容准确性低,知识之间缺乏关联关系,设计人员甚至不希望在执行任务时花费大量的时间在搜索上,而希望在需要相关知识时,系统能够“雪中送炭”。知识推送系统的出现使得知识的获取方式由“搜索”变为“推送”,解决了该问题。目前的知识推送系统一般是基于设计人员自定义关键词的方式进行知识推送,不能对设计人员的真实需求做出准确的判断,导致推送的知识难以符合设计人员的需求。另外,在获取设计人员需求之后,获取知识的方式一般采用关键词出现的频率决定搜索结果的排序,获取方式过于单一。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于语义分析的知识推送系统及方法,能够自动准确捕获用户设计场景下的实际需求,并可以获得更加准确、具有关联关系、符合设计人员需求的知识资源,节省了大量搜索知识的时间,提高了工作效率。本专利技术技术方案如下:一种基于语义分析的知识推送系统,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信 ...
【技术保护点】
一种基于语义分析的知识推送系统,其特征在于,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。
【技术特征摘要】
1.一种基于语义分析的知识推送系统,其特征在于,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;通过知识捕获模块自动捕获用户设计场景下的实际需求;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;知识的类别包括设计规范、最佳实践、经验技巧和故障案例;所述主题计算的方法如下:(1)对上传的文档进行分句,形成文章句子列向量S;(2)对文档进行分词,过滤常用词,统计词频选取全文的特征词形成关键词行向量T;(3)建立T×S矩阵,矩阵中元素的值取其行向量在对应列向量中出现的次数;(4)计算T×S矩阵的奇异值分解,分解T×S矩阵成3个矩阵U,S,VT;U和V是正交矩阵,S是奇异值的对角矩阵(r×r);(5)用相似度算法计算所有句子之间的相似度;(6)按相似度对句子进行排序,选取相似度较高句子作为本文档的主题;相似度较高句子是总句子数的百分之十;知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;所述设计场景信息包括具体参数信息、任务信息、模型信息和文档信息,所述任务信息包括任务名称、任务描述和任务所属专业名称,所述模型信息包括模型名称、类别名称以及模型打开工具名称,所述文档信息为文档的关键词;设计场景信息捕获方式主要包括任务提取、模型提取、文档提取和参数提取四种方式,任务提取主要通过软件集成技术根据当前设计人员的用户名,在工作流中获取当前用户正在执行的任务信息;模型提取通过软件集成技术获取任务附件名称,再对任务附件本身进行格式判别,根据任务附件格式从系统配置信息中获取设计人员当前操作的模型名称、类别名称以及模型打开工具名称;文档提取通过软件集成技术获取任务附件,经过格式判别后获取文档的名称信息,并在后台打开该文档,对该文档做分词、滤词、频率统计处理,获取该文档的关键词;参数是任务的指标信息,包括输入参数和输出参数,参数提取通过软件集成技术获取参数的名称;知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计...
【专利技术属性】
技术研发人员:褚厚斌,杜俊鹏,王立伟,贾倩,毕经元,章乐平,王长庆,杨玉堃,侯雄,许怡婷,章雯,杨秋皓,张巍,
申请(专利权)人:中国运载火箭技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。