一种基于语义分析的知识推送系统及方法技术方案

技术编号:9694682 阅读:158 留言:0更新日期:2014-02-21 00:59
本发明专利技术公开了一种基于语义分析的知识推送系统,包括知识捕获模块、知识推送模块、知识采集模块和知识库;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;知识捕获模块每隔一段时间调用一次设计系统的接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;知识推送模块根据捕获的设计场景信息按知识的类别将相应的知识推送至设计系统。本发明专利技术能够自动准确捕获用户设计场景下的实际需求,并可以获得更加准确、符合设计人员需求的知识资源,节省了大量搜索知识的时间。

【技术实现步骤摘要】
一种基于语义分析的知识推送系统及方法
本专利技术涉及一种基于语义分析的知识推送系统及方法。
技术介绍
传统的通过搜索技术获取知识的方式不能满足用户在缺乏关键词情况时的知识需求,且搜索方式获取的知识内容准确性低,知识之间缺乏关联关系,设计人员甚至不希望在执行任务时花费大量的时间在搜索上,而希望在需要相关知识时,系统能够“雪中送炭”。知识推送系统的出现使得知识的获取方式由“搜索”变为“推送”,解决了该问题。目前的知识推送系统一般是基于设计人员自定义关键词的方式进行知识推送,不能对设计人员的真实需求做出准确的判断,导致推送的知识难以符合设计人员的需求。另外,在获取设计人员需求之后,获取知识的方式一般采用关键词出现的频率决定搜索结果的排序,获取方式过于单一。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于语义分析的知识推送系统及方法,能够自动准确捕获用户设计场景下的实际需求,并可以获得更加准确、具有关联关系、符合设计人员需求的知识资源,节省了大量搜索知识的时间,提高了工作效率。本专利技术技术方案如下:一种基于语义分析的知识推送系统,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。所述知识的类别包括设计规范、最佳实践、经验技巧和故障案例。所述设计场景信息包括具体参数信息、任务信息、模型信息和文档信息;所述任务信息包括任务名称、任务描述和任务所属专业名称;所述文档信息为文档的关键词;所述模型信息包括模型名称、类别名称以及模型打开工具名称。一种基于语义分析的知识推送方法,包括如下步骤:录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;每隔一段时间调用一次设计系统中的接口函数从而捕获设计场景信息;对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。本专利技术与现有技术相比具有如下有益效果:(1)本专利技术通过知识捕获模块自动捕获用户设计场景下的实际需求,解决了现有知识推送系统获取设计人员需求的不准确性问题。(2)采用基于潜在语义分析技术的知识采集技术,实际上对上传的知识资源做了“降噪”处理,使得主题更加清晰、准确,提高了知识推送时捕获信息与知识资源匹配的精确度,使得推送的知识资源与设计人员的需求更加吻合。(3)通过知识捕获信息与知识资源主题进行匹配计算,与传统的全文匹配计算相比,大大提升了计算速度。(4)采用推送技术节省了设计人员搜索知识时花费的大量时间,提高了工作效率。采用推送技术使得知识管理系统与企业业务系统相互融合,解决了一般知识管理系统访问量低的问题,大大提高了知识资源的使用率。附图说明图1为本专利技术系统的总体结构图;图2为本专利技术中知识捕获模块的算法流程图;图3为本专利技术中知识推送模块的算法流程图;图4为本专利技术中知识采集模块中主题计算的算法流程图。具体实施方式如图1所示,本专利技术的系统包括知识捕获模块、知识推送模块、知识采集模块和知识库。1、知识捕获,主要通过软件集成技术实现对设计人员的设计场景信息进行捕获,获取设计人员设计场景的具体任务信息、模型信息、文档信息、参数信息,然后将捕获的信息发送给知识推送模块。如图1所示,在业务系统或者设计系统的设计场景中包括任务(例如任务1、任务2和任务3)、模型(例如设计模型、有限元模型)、文档(例如分析报告)和参数(例如指标参数1、指标参数2、指标参数3和指标参数4)。知识捕获模块的知识捕获方式主要包括任务提取、模型提取、文档提取和参数提取四种方式,四种知识捕获方式使用的软件集成技术主要通过web服务技术实现,具体在业务系统或者设计系统中封装上述四种捕获方式所需的接口函数,并对外开放,知识推送模块每隔一段时间会调用一次接口函数,来获取设计人员的设计场景信息,并将捕获的设计场景信息发送至知识推送模块。四种获取方式的算法执行流程如图2所示。(1)任务提取,一般设计人员的任务通过设计系统进行发放和审核,其主要实现机制一般基于工作流技术实现,任务提取主要通过软件集成技术根据当前设计人员的用户名,在工作流中获取当前用户正在执行的任务信息,获取的任务信息包括任务名称、任务描述、任务所属专业名称,然后将获取的信息发送至知识推送模块。例如,通过捕获某结构模态分析任务信息,可以知道该任务的结构件名称信息及载荷特性专业信息。(2)模型提取,设计人员操作的模型一般作为任务附件进行管理,通过软件集成技术获取任务的附件名称,再对交付物本身进行格式判别,根据文件格式可以从系统配置信息中获取设计人员当前操作的模型名称、类别名称以及模型打开工具名称,然后将获取的信息发送至知识推送模块。(3)文档提取,设计人员查看和编写的文档一般作为任务附件进行管理,同样通过软件集成技术获取任务附件,经过格式判别后获取文档的名称信息,并在后台打开该文档对该文档做分词、滤词、频率统计处理,获取该文档的关键词,然后将获取的信息发送至知识推送模块。(4)参数提取,参数是任务的指标信息包括输入参数和输出参数,可以通过软件集成技术获取参数的名称,然后将获取的信息发送至知识推送模块。2、知识推送,知识推送模块在获取设计人员需求信息后,对信息进行分词、权重计算,然后与知识库中经过知识采集处理的知识资源信息进行匹配计算,对匹配结果进行分类、排序后推送至设计人员桌面,详细执行过程如图3所示。(1)对从知识捕获模块获得的设计场景信息进行分词形成特征词集合G={g1,g2,g3...gn};(2)计算每个特征词在设计场景信息中的权重形成权重集合Q={q1,q2,q3...qn};(3)遍历知识库中所有的知识资源,该类知识资源在本文档来自技高网...
一种基于语义分析的知识推送系统及方法

【技术保护点】
一种基于语义分析的知识推送系统,其特征在于,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计系统。

【技术特征摘要】
1.一种基于语义分析的知识推送系统,其特征在于,包括知识捕获模块、知识推送模块、知识采集模块和知识库;在设计系统中封装用于捕获设计场景信息的接口函数;通过知识捕获模块自动捕获用户设计场景下的实际需求;通过知识采集模块录入知识的基本信息、进行知识上传、对上传的知识进行主题计算获得该知识对应的主题,并将上传的知识和该知识对应的基本信息、主题存入知识库;其中主题计算采用基于潜在语义分析的算法进行处理;所述知识的基本信息包括知识资源名称、所属知识的类别、创建人和创建时间;知识的类别包括设计规范、最佳实践、经验技巧和故障案例;所述主题计算的方法如下:(1)对上传的文档进行分句,形成文章句子列向量S;(2)对文档进行分词,过滤常用词,统计词频选取全文的特征词形成关键词行向量T;(3)建立T×S矩阵,矩阵中元素的值取其行向量在对应列向量中出现的次数;(4)计算T×S矩阵的奇异值分解,分解T×S矩阵成3个矩阵U,S,VT;U和V是正交矩阵,S是奇异值的对角矩阵(r×r);(5)用相似度算法计算所有句子之间的相似度;(6)按相似度对句子进行排序,选取相似度较高句子作为本文档的主题;相似度较高句子是总句子数的百分之十;知识捕获模块每隔一段时间调用一次所述接口函数从而捕获设计场景信息,并将捕获的设计场景信息发送至知识推送模块;所述设计场景信息包括具体参数信息、任务信息、模型信息和文档信息,所述任务信息包括任务名称、任务描述和任务所属专业名称,所述模型信息包括模型名称、类别名称以及模型打开工具名称,所述文档信息为文档的关键词;设计场景信息捕获方式主要包括任务提取、模型提取、文档提取和参数提取四种方式,任务提取主要通过软件集成技术根据当前设计人员的用户名,在工作流中获取当前用户正在执行的任务信息;模型提取通过软件集成技术获取任务附件名称,再对任务附件本身进行格式判别,根据任务附件格式从系统配置信息中获取设计人员当前操作的模型名称、类别名称以及模型打开工具名称;文档提取通过软件集成技术获取任务附件,经过格式判别后获取文档的名称信息,并在后台打开该文档,对该文档做分词、滤词、频率统计处理,获取该文档的关键词;参数是任务的指标信息,包括输入参数和输出参数,参数提取通过软件集成技术获取参数的名称;知识推送模块对捕获的设计场景信息进行分词形成特征词集合;计算特征词集合中每个特征词在设计场景信息中的权重形成权重集合;遍历知识库中所有的知识,使用特征词集合与知识库中的每个知识的主题进行匹配计算,统计特征词集合的每个特征词的匹配次数获得匹配次数集合;将匹配次数集合与权重集合中的对应元素相乘后求和获得该知识的主题与特征词集合的匹配度;对知识库中的所有知识按知识的类别进行匹配度排序获得排序后的结果;将排序后的结果按知识的类别推送至设计...

【专利技术属性】
技术研发人员:褚厚斌杜俊鹏王立伟贾倩毕经元章乐平王长庆杨玉堃侯雄许怡婷章雯杨秋皓张巍
申请(专利权)人:中国运载火箭技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1