一种基于人工智能的成果转移转化数据筛选方法技术

技术编号:31768072 阅读:16 留言:0更新日期:2022-01-05 16:53
本发明专利技术涉及人工智能技术领域,具体涉及一种基于人工智能的成果转移转化数据筛选方法。该方法基于已有的技术文档数据获取初始转化数据筛选网络;对初始转化数据筛选网络进行网络参数的更新以得到转化数据筛选网络;将待筛选的技术文档数据通过转化数据筛选网络进行筛选以将筛选后的技术文档数据存储在数据存储库中。通过训练泛化能力更强的转化数据筛选网络,利用训练好的转化数据筛选网络进行技术文档数据的数据筛选,可避免恶意数据的批量攻击,进而防止恶意数据、无关数据或缺失数据被存储,以干扰用户检索结果的准确性。以干扰用户检索结果的准确性。以干扰用户检索结果的准确性。

【技术实现步骤摘要】
一种基于人工智能的成果转移转化数据筛选方法


[0001]本专利技术涉及人工智能
,具体涉及一种基于人工智能的成果转移转化数据筛选方法。

技术介绍

[0002]我们通常所说的科技成果转移大多指技术成果的转化,即将具有创新性的技术成果从科研单位转移到生产部门,使新产品增加、工艺改进、效益提高等,最终经济得到进步,所讲的科技成果转化率就是指技术成果的应用数与技术成果总数的比。
[0003]现有用于成果转化的数据筛选方法主要针对检索过程进行优化,提高检索文件的相关度,提高技术文件匹配效率和匹配准确度,而现有技术存在的技术问题在于,仅考虑了检索过程中检索人员与存储数据库的交互,进而实现转化数据的高效检索,但未考虑到存储数据库中技术文件数据的有效性和准确性,若存在的存储数据库中技术文件数据破损或被篡改,会导致用户检索结果中的准确率和匹配效率大大降低。

技术实现思路

[0004]为了解决上述技术问题,本专利技术的目的在于提供一种基于人工智能的成果转移转化数据筛选方法,所采用的技术方案具体如下:基于已有的技术文档数据获取初始转化数据筛选网络,所述已有的技术文档数据包括通过筛选和未通过筛选的技术文档数据,其中,所述通过筛选的技术文档数据是指正常的技术文档,所述未通过筛选的技术文档数据是指存在数据缺失或数据异常的技术文档;对所述初始转化数据筛选网络进行网络参数的更新以得到转化数据筛选网络;将待筛选的技术文档数据通过所述转化数据筛选网络进行筛选以将筛选后的技术文档数据存储在数据存储库中;所述初始转化数据筛选网络的网络参数的更新方法包括:获取未知技术文档数据中未通过筛选的技术文档数据作为第一技术文档数据,将所述第一技术文档数据通过自编码器得到非数据缺失的所述第一技术文档数据;当非数据缺失的所述第一技术文档数据的文档数量满足要求时,提取非数据缺失的所述第一技术文档数据中每个技术文档的特征张量,根据所述特征张量获取当前训练过程中的目标梯度影响系数;将所述目标梯度影响系数与所述当前训练过程中由反向梯度算法得到的梯度进行相乘以得到新网络参数。
[0005]进一步地,所述未通过筛选的技术文档数据是通过所述初始转化数据筛选网络得到的。
[0006]进一步地,所述非数据缺失的所述第一技术文档数据的获取方法,包括:将所述第一技术文档数据送入自编码器中,输出重构技术文档数据,将所述重构技术文档数据送入所述初始转化数据筛选网络,以获取通过筛选类别的所述重构技术文档数据的置信度变化;
设置置信度变化阈值,所述置信度变化小于所述置信度变化阈值的所述重构技术文档数据所对应的所述第一技术文档数据即为非数据缺失的所述第一技术文档数据。
[0007]进一步地,所述非数据缺失的所述第一技术文档数据的要求是指非数据缺失的所述第一技术文档数据中包含的文档数量大于或等于设定数量阈值。
[0008]进一步地,利用自编码器的编码器获取非数据缺失的所述第一技术文档数据中每个技术文档的所述特征张量。
[0009]进一步地,所述根据所述特征张量获取当前训练过程中的目标梯度影响系数的方法,包括:任选一个所述特征张量作为参考特征张量,分别计算参考特征张量与其他每个所述特征张量之间的欧式距离,构成一个距离集合;对所述距离集合进行聚类得到多个聚类集合;根据设定的采样总数量对各个所述聚类集合进行随机均匀采样,根据所述聚类集合中被采样的所述特征张量的数量和被采样的所述特征张量之间的类间方差计算对应所述聚类集合的梯度影响系数;根据每个所述聚类集合的所述梯度影响系数获取目标梯度影响系数。
[0010]进一步地,所述目标梯度影响系数为最小的所述梯度影响系数。
[0011]进一步地,所述聚类采用的是DBSCAN聚类算法。
[0012]进一步地,所述梯度影响系数的获取方法,包括:计算所述聚类集合中被采样的所述特征张量的数量和采样总数量之间比值, 结合所述比值和所述类间方差计算对应聚类集合的所述梯度影响系数。
[0013]进一步地,所述梯度影响系数与所述比值呈正相关关系、所述梯度影响系数与所述类间方差呈负相关关系。
[0014]本专利技术实施例至少具有如下有益效果:基于分类网络构建初始转化数据筛选网络,利用未知技术文档数据对该网络进行网络参数的更新得到泛化能力更强的转化数据筛选网络,训练好的转化数据筛选网络进行技术文档数据的数据筛选,可避免恶意数据的批量攻击,进而防止恶意数据、无关数据或缺失数据被存储,以干扰用户检索结果的准确性。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0016]图1为本专利技术一个实施例提供的一种基于人工智能的成果转移转化数据筛选方法的步骤流程图。
具体实施方式
[0017]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种基于人工智能的成果转移转化数据筛选方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施
例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
[0018]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0019]下面结合附图具体的说明本专利技术所提供的一种基于人工智能的成果转移转化数据筛选方法的具体方案。
[0020]本专利技术实施例所转对的具体场景为:对成果转移转化数据所对应的数据存储库的筛选过程。
[0021]请参阅图1,其示出了本专利技术一个实施例提供的一种基于人工智能的成果转移转化数据筛选方法的步骤流程图,该方法包括以下步骤:步骤S001,基于已有的技术文档数据获取初始转化数据筛选网络,已有的技术文档数据包括通过筛选和未通过筛选的技术文档数据,其中,通过筛选的技术文档数据是指正常的技术文档,未通过筛选的技术文档数据是指存在数据缺失或数据异常的技术文档。
[0022]具体的,基于分类网络构建初始转化数据筛选网络,该网络结构为编码器

全连接层,其中,初始转化数据筛选网络的训练过程为:(1)网络的输入为单个已有的技术文档,网络的输出为单个已有的技术文档所对应的类别,类别包括两类:通过筛选类别和未通过筛选类别。
[0023](2)采用已有的技术文档数据作为训练数据集,并进行人为标注,其中未通过筛选的技术文档数据的实际问题可包括:数据缺失和数据异常等。
[0024](3)损失函数采用二值交叉熵损失函数。
[0025]步骤S002,对初始转化数据筛选网络进行网络参数的更新以得到转化数据筛选网络。
[0026]具体的,为了适应未知技术文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的成果转移转化数据筛选方法,其特征在于,该方法包括:基于已有的技术文档数据获取初始转化数据筛选网络,所述已有的技术文档数据包括通过筛选和未通过筛选的技术文档数据,其中,所述通过筛选的技术文档数据是指正常的技术文档,所述未通过筛选的技术文档数据是指存在数据缺失或数据异常的技术文档;对所述初始转化数据筛选网络进行网络参数的更新以得到转化数据筛选网络;将待筛选的技术文档数据通过所述转化数据筛选网络进行筛选以将筛选后的技术文档数据存储在数据存储库中;所述初始转化数据筛选网络的网络参数的更新方法包括:获取未知技术文档数据中未通过筛选的技术文档数据作为第一技术文档数据,将所述第一技术文档数据通过自编码器得到非数据缺失的所述第一技术文档数据;当非数据缺失的所述第一技术文档数据的文档数量满足要求时,提取非数据缺失的所述第一技术文档数据中每个技术文档的特征张量,根据所述特征张量获取当前训练过程中的目标梯度影响系数;将所述目标梯度影响系数与所述当前训练过程中由反向梯度算法得到的梯度进行相乘以得到新网络参数。2.如权利要求1所述的方法,其特征在于,所述未通过筛选的技术文档数据是通过所述初始转化数据筛选网络得到的。3.如权利要求1所述的方法,其特征在于,所述非数据缺失的所述第一技术文档数据的获取方法,包括:将所述第一技术文档数据送入自编码器中,输出重构技术文档数据,将所述重构技术文档数据送入所述初始转化数据筛选网络,以获取通过筛选类别的所述重构技术文档数据的置信度变化;设置置信度变化阈值,所述置信度变化小于所述置信度变化阈值的所述重构技术文档数据所...

【专利技术属性】
技术研发人员:李建雪崔智恩
申请(专利权)人:河南省启研科技评价研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1