基于人工智能的科技成果转化数据智能监测方法及系统技术方案

技术编号:36104856 阅读:13 留言:0更新日期:2022-12-28 14:05
本发明专利技术涉及人工智能技术领域,具体涉及基于人工智能的科技成果转化数据智能监测方法及系统。该方法包括:采集历史转化数据,随机遮挡历史转化数据中的某一词项,计算遮挡后的转化数据与历史转化数据之间的语义差异度,选取第一遮挡词;将第一遮挡词向两侧扩张,直至语义差异度大于预设阈值得到第一遮挡区域;增加第一遮挡词的词项,直至最小的语义差异度大于预设阈值,得到第二遮挡区域;根据第一遮挡区域和第二遮挡区域的交并比构建第一结构向量;将所有第一结构向量分组;并获取历史转化数据的关键词;获取当前转化数据的第二结构向量,选取与其最相似的组,判断当前转化数据是否异常。本发明专利技术实施例能够实现转化数据的内容异常监测。监测。监测。

【技术实现步骤摘要】
基于人工智能的科技成果转化数据智能监测方法及系统


[0001]本专利技术涉及人工智能
,具体涉及基于人工智能的科技成果转化数据智能监测方法及系统。

技术介绍

[0002]科技成果转化是指为提高生产力水平而对科学研究与技术开发所产生的具有实用价值的科技成果所进行的后续试验、开发、应用、推广直至形成新产品、新工艺、新材料,发展新产业等活动。促进科技成果转化、加速科技成果产业化,已经成为世界各国科技政策的新趋势。
[0003]随着科技体制改革的持续发力,尤其是资源配置、计划管理、科技成果转化等方面重大改革措施的出台,以及大众创业万众创新局面的兴起,科技成果转化为现实生产力的速度在加快。同时,对科技成果转化数据的监测也逐渐提上日程。
[0004]现有技术对于科技成果转化数据的智能监测通常采用人工手段,这种方式需要耗费较高的人力成本,且人为监测的主观性过强导致监测效果有偏差,因此有现有技术提出通过人工智能网络进行进程监测,但是现有的只能监测仅针对于转化进程进行监测,未考虑到科技成果转化数据本身的数据异常,因此有潜在的数据篡改风险,从而导致科技成果转化进程受阻。

技术实现思路

[0005]为了解决上述技术问题,本专利技术的目的在于提供一种基于人工智能的科技成果转化数据智能监测方法及系统,所采用的技术方案具体如下:
[0006]第一方面,本专利技术一个实施例提供了一种基于人工智能的科技成果转化数据智能监测方法,该方法包括以下步骤:
[0007]采集历史成果转化文件的历史转化数据,随机遮挡所述历史转化数据中的某一词项,计算遮挡后的转化数据与所述历史转化数据之间的语义差异度,以最小的语义差异度对应的词项作为第一遮挡词;
[0008]将所述第一遮挡词向两侧扩张,再对所述历史转化数据进行遮挡,直至语义差异度大于预设阈值,以此时的遮挡词作为第一遮挡区域;
[0009]增加所述第一遮挡词的词项,并对所述历史转化数据进行遮挡,增加词项时遍历未遮挡词项,进而选取出第二遮挡词,继续将所述第二遮挡词进行遍历词项的扩张,直至最小的语义差异度大于所述预设阈值,以此时的遮挡词作为第二遮挡区域;
[0010]根据所述第一遮挡区域和所述第二遮挡区域的交并比构建第一结构向量;将所有所述历史转化数据的所述第一结构向量通过聚类分为多组;在每个所述历史转化数据中去除所述第一结构向量包含的词项,得到所述历史转化数据的关键词;
[0011]获取当前转化数据的第二结构向量,选取与所述第二结构向量最相似的组;将所述当前转化数据的关键词与该组内每个所述第一结构向量对应的关键词进行对比,当对比
得出的最大相似度在相似度阈值以下时,当前转化数据为异常数据。
[0012]优选的,所述历史转化数据的采集步骤包括:
[0013]建立科技成果转化的历史文件库,以每个文件的主题文字作为该文件的标识,以所述标识对应的词向量作为所述历史转化数据。
[0014]优选的,所述语义差异度的计算过程包括:
[0015]通过自编码器将遮挡词项后的历史转化数据进行重构,得到遮挡后的转化数据,计算所述历史转化数据以及所述遮挡后的转化数据对应词向量之间的欧氏距离作为所述语义差异度。
[0016]优选的,所述第一遮挡区域的获取步骤包括:
[0017]以所述第一遮挡词为中心,以所述第一遮挡词的词项长度作为扩张尺寸向两侧扩张得到第一扩张词项,利用所述第一扩张词项遮挡所述历史转化数据得到第一转化数据,计算所述历史转化数据和所述第一转化数据的词向量之间的语义差异度,将其与预设阈值相比,当该语义差异度不大于预设阈值时,以所述第一扩张词项为中心继续根据所述扩张尺寸向两侧扩张,直至语义差异度大于所述预设阈值,得到所述第一遮挡区域。
[0018]优选的,所述第二遮挡区域的获取步骤包括:
[0019]对所述第一遮挡词随机增加一个词项将其扩张为第二扩张词项,利用所述第二扩张词项遮挡所述历史转化数据得到第二转化数据,计算所述历史转化数据和所述第二转化数据的词向量之间的语义差异度,遍历未遮挡词,以语义差异度的最小值对应的遮挡词作为第二遮挡词,当其不大于预设阈值时,对所述第二遮挡词继续进行随机增加一个词项的扩张,直至语义差异度大于所述预设阈值,得到所述第二遮挡区域。
[0020]优选的,所述第一结构向量的构建步骤包括:
[0021]根据所述第一遮挡区域和所述第二遮挡区域对应的词项数量计算所述交并比;
[0022]获取所述第一遮挡区域和所述第二遮挡区域的交集与并集的差异词项的差异位置,根据所述差异位置和所述交并比构建所述第一结构向量。
[0023]优选的,所述将所有所述历史转化数据的所述第一结构向量通过聚类分为多组,包括:
[0024]预设聚类的初始类别数量,对所有所述第一结构向量进行聚类,得到多个初始类别,计算每个所述初始类别中的所述第一结构向量的差异,进而获取所有初始类别差异之间的类别差异;
[0025]逐步增加所述初始类别数量,依次计算所述类别差异,选取最小的类别差异对应的类别数量作为理想数量,以所述理想数量对应的聚类结果作为分组结果。
[0026]优选的,所述选取与所述第二结构向量最相似的组,包括:
[0027]获取每组中处于几何中心的中心结构向量,分别计算每个中心结构向量与所述第二结构向量之间的相似度,以相似度最大值对应的组作为与所述第二结构向量最相似的组。
[0028]第二方面,本专利技术另一个实施例提供了一种基于人工智能的科技成果转化数据智能监测系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于人工智能的科技成果转化数据智能监测方法方法的步骤。
[0029]本专利技术实施例至少具有如下有益效果:
[0030]通过对历史转化数据进行分析得到第一结构向量,将第一结构向量进行分组;然后获取当前转化数据的第二结构向量,选取与第二结构向量最相似的组,将其分别与第二结构向量进行关键词对比,进而判断当前转化数据是否异常,本专利技术实施例能够在获取未知的成果转化文件时,快速匹配至相应的组内,并进行关键词对比,进而实现转化数据的异常监测,提高数据智能监测的效率。
附图说明
[0031]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0032]图1为本专利技术一个实施例提供的基于人工智能的科技成果转化数据智能监测方法的步骤流程图。
具体实施方式
[0033]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的基于人工智能的科技成果转化数据智能监测方法及系统,其具体实施方式、结构、特征及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于人工智能的科技成果转化数据智能监测方法,其特征在于,该方法包括以下步骤:采集历史成果转化文件的历史转化数据,随机遮挡所述历史转化数据中的某一词项,计算遮挡后的转化数据与所述历史转化数据之间的语义差异度,以最小的语义差异度对应的词项作为第一遮挡词;将所述第一遮挡词向两侧扩张,再对所述历史转化数据进行遮挡,直至语义差异度大于预设阈值,以此时的遮挡词作为第一遮挡区域;增加所述第一遮挡词的词项,并对所述历史转化数据进行遮挡,增加词项时遍历未遮挡词项,进而选取出第二遮挡词,继续将所述第二遮挡词进行遍历词项的扩张,直至最小的语义差异度大于所述预设阈值,以此时的遮挡词作为第二遮挡区域;根据所述第一遮挡区域和所述第二遮挡区域的交并比构建第一结构向量;将所有所述历史转化数据的所述第一结构向量通过聚类分为多组;在每个所述历史转化数据中去除所述第一结构向量包含的词项,得到所述历史转化数据的关键词;获取当前转化数据的第二结构向量,选取与所述第二结构向量最相似的组;将所述当前转化数据的关键词与该组内每个所述第一结构向量对应的关键词进行对比,当对比得出的最大相似度在相似度阈值以下时,当前转化数据为异常数据。2.根据权利要求1所述的方法,其特征在于,所述历史转化数据的采集步骤包括:建立科技成果转化的历史文件库,以每个文件的主题文字作为该文件的标识,以所述标识对应的词向量作为所述历史转化数据。3.根据权利要求1所述的方法,其特征在于,所述语义差异度的计算过程包括:通过自编码器将遮挡词项后的历史转化数据进行重构,得到遮挡后的转化数据,计算所述历史转化数据以及所述遮挡后的转化数据对应词向量之间的欧氏距离作为所述语义差异度。4.根据权利要求1所述的方法,其特征在于,所述第一遮挡区域的获取步骤包括:以所述第一遮挡词为中心,以所述第一遮挡词的词项长度作为扩张尺寸向两侧扩张得到第一扩张词项,利用所述第一扩张词项遮挡所述历史转化数据得到第一转化数据,计算所述历史转化数据和所述第一转化数据的词向量之间的语义差异度,将其与预设阈值相比,...

【专利技术属性】
技术研发人员:温杨馨王淑芸
申请(专利权)人:南通奥普科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1