System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种基于生成式人工智能的科技情报智能化分析方法及系统。
技术介绍
1、长期以来,科技情报为科学研究、技术创新、产业发展、社会进步、管理决策发挥着重要的支撑作用,充分体现了“耳目、尖兵、参谋”的核心价值。随着世界变局的快速复杂演进,全球科技创新竞争格局正经历深刻调整与变化,国家间竞争博弈愈发激烈,特别是在大国竞争核心的光电子信息领域。要在日趋激烈的竞跑中攻克系列关键、瓶颈技术,抢占技术高地,离不开科技情报工作持续深入的跟进支撑。
2、但是目前许多数据分析工具的功能主要停留在数据可视化和基础数据处理阶段,对于数据的深层次挖掘和智能分析方面还有很大的欠缺,需要人工投入大量的时间和精力。
3、上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
1、本专利技术的主要目的在于提供一种基于生成式人工智能的科技情报智能化分析方法及系统,旨在解决现有技术对于数据的分析深度与智能化有限,仍需要借助人工去分析,降低了分析效率的技术问题。
2、为实现上述目的,本专利技术提供了一种基于生成式人工智能的科技情报智能化分析方法,所述基于生成式人工智能的科技情报智能化分析方法包括以下步骤:
3、对获取到的原始科技情报数据进行预处理,得到处理后的科技情报数据;
4、根据所述处理后的科技情报数据构建对应的多个文本图;
5、获取所述文本图对应的初始嵌入矩阵,以所述初始嵌入矩阵为
6、根据所述词嵌入表示确定各个文本图对应的全局表示;
7、通过拼接方式将各个文本图对应的全局表示进行融合,得到所述文本图对应的文本特征;
8、利用分析模型基于所述文本特征对所述处理后的科技情报数据进行智能化分析。
9、可选地,所述对获取到的原始科技情报数据进行预处理,得到处理后的科技情报数据,包括:
10、确定获取到的原始科技情报数据对应的原始文本;
11、对所述原始文本进行分词处理;
12、根据分词结果识别所述原始文本中的停用词与出现频率低于预设频率的低频词,并将所述停用词与所述低频词从所述原始文本中剔除,以得到处理后的科技情报数据。
13、可选地,所述根据所述处理后的科技情报数据构建对应的多个文本图,包括:
14、确定所述处理后的科技情报数据对应的文本的文本结构;
15、获取所述文本中的单词,并基于所述文本结构确定各个单词之间的语义关系;
16、以所述文本中的单词为节点,以所述语义关系为边,按照预设尺寸的滑动窗口在文本对应的文本序列上进行滑动,基于同一窗口内各个单词之间的共现关系得到第一文本图;
17、根据所述语义关系确定各个单词之间的依存关系;
18、以所述文本中的单词为节点,以所述依存关系为边,构建各个单词之间的第二文本图。
19、可选地,所述获取所述文本图对应的初始嵌入矩阵,以所述初始嵌入矩阵为基准按照预设维度确定各个文本图对应的词嵌入表示,包括:
20、根据所述各个节点之间的共线关系或依存关系获取对应的文本图的邻接矩阵;
21、根据预设权重系数、所述邻接矩阵以及文本图对应的初始嵌入矩阵获取聚合邻居信息;
22、根据所述聚合邻居信息、所述预设权重系数以及所述邻接矩阵构建更新门与重置门;
23、利用所述更新门与所述重置门并结合预设激活函数获取数据传递过程产生的新信息;
24、基于所述新信息、所述更新门以及各个文本图对应的历史词嵌入表示得到各个文本图对应的词嵌入表示,所述各个文本图对应的历史词嵌入表示为上一时刻的词嵌入表示,所述各个文本图对应的词嵌入表示为当前时刻的词嵌入表示。
25、可选地,所述基于生成式人工智能的科技情报智能化分析方法还包括:
26、初始化预设模型,以确定预设模型的超参数,所述超参数至少包括网络层数、每层网络的神经元数量以及丢弃比率,所述预设模型包括输入层、卷积层、池化层以及全连接层;
27、对预设训练数据进行清洗与格式化,以将所述预设训练数据转换为单词或字符的序列,并对所述序列进行编码;
28、按照预设训练轮次通过编码后的序列对所述预设模型进行训练;
29、对每一次训练后的模型进行评估,基于评估结果调整所述超参数,并基于调整后的超参数进行下一次训练;
30、将评估结果满足预设目标的模型作为分析模型。
31、可选地,所述利用分析模型基于所述文本特征对所述处理后的科技情报数据进行智能化分析,包括:
32、将所述文本特征作为分析模型的输入,通过输入层将所述文本特征传输至卷积层;
33、通过所述分析模型的卷积层按照不同大小的卷积核从所述文本特征中提取出参考文本特征;
34、通过所述分析模型的池化层利用预设滤波器对所述目标文本特征池化操作,以得到所述参考文本特征对应的特征向量;
35、通过所述分析模型的全连接层将所述特征向量进行连接,以得到目标文本特征;
36、根据所述目标文本特征对所述处理后的科技情报数据进行分类。
37、可选地,所述基于生成式人工智能的科技情报智能化分析方法还包括:
38、获取原始科技情报数据关联的视频数据;
39、从所述视频数据中提取图像特征;
40、将所述文本特征与所述图像特征进行特征融合;
41、将融合后的特征作为分析模型的输入,并返回执行通过输入层将所述融合后的特征传输至卷积层。
42、此外,为实现上述目的,本专利技术还提出一种基于生成式人工智能的科技情报智能化分析系统,所述基于生成式人工智能的科技情报智能化分析系统包括:
43、处理模块,用于对获取到的原始科技情报数据进行预处理,得到处理后的科技情报数据;
44、构建模块,用于根据所述处理后的科技情报数据构建对应的多个文本图;
45、计算模块,用于获取所述文本图对应的初始嵌入矩阵,以所述初始嵌入矩阵为基准按照预设维度确定各个文本图对应的词嵌入表示;
46、所述计算模块,还用于根据所述词嵌入表示确定各个文本图对应的全局表示;
47、融合模块,用于通过拼接方式将各个文本图对应的全局表示进行融合,得到所述文本图对应的文本特征;
48、分析模块,用于利用分析模型基于所述文本特征对所述处理后的科技情报数据进行智能化分析。
49、可选地,所述处理模块,还用于确定获取到的原始科技情报数据对应的原始文本;
50、对所述原始文本进行分词处理;
51、根据分词结果识别所述原始文本中的停用词与出现频率低于预设频率的低频词,并将所述停用词与所述低频词从所述原始文本中剔除,以得到处理后的科技本文档来自技高网...
【技术保护点】
1.一种基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述基于生成式人工智能的科技情报智能化分析方法包括:
2.如权利要求1所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述对获取到的原始科技情报数据进行预处理,得到处理后的科技情报数据,包括:
3.如权利要求1所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述根据所述处理后的科技情报数据构建对应的多个文本图,包括:
4.如权利要求3所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述获取所述文本图对应的初始嵌入矩阵,以所述初始嵌入矩阵为基准按照预设维度确定各个文本图对应的词嵌入表示,包括:
5.如权利要求1所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述基于生成式人工智能的科技情报智能化分析方法还包括:
6.如权利要求5所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述利用分析模型基于所述文本特征对所述处理后的科技情报数据进行智能化分析,包括:
7.如权利要求6所述的基
8.一种基于生成式人工智能的科技情报智能化分析系统,其特征在于,所述基于生成式人工智能的科技情报智能化分析系统:
9.如权利要求8所述的基于生成式人工智能的科技情报智能化分析系统,其特征在于,所述处理模块,还用于确定获取到的原始科技情报数据对应的原始文本;
10.如权利要求8所述的基于生成式人工智能的科技情报智能化分析系统,其特征在于,所述构建模块,还用于确定所述处理后的科技情报数据对应的文本的文本结构;
...【技术特征摘要】
1.一种基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述基于生成式人工智能的科技情报智能化分析方法包括:
2.如权利要求1所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述对获取到的原始科技情报数据进行预处理,得到处理后的科技情报数据,包括:
3.如权利要求1所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述根据所述处理后的科技情报数据构建对应的多个文本图,包括:
4.如权利要求3所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述获取所述文本图对应的初始嵌入矩阵,以所述初始嵌入矩阵为基准按照预设维度确定各个文本图对应的词嵌入表示,包括:
5.如权利要求1所述的基于生成式人工智能的科技情报智能化分析方法,其特征在于,所述基于生成式人工智能的科技情报智能化分析方...
【专利技术属性】
技术研发人员:房超,张开猛,靳如意,汪立坤,陈露莹,涂瑜,黄珊珊,
申请(专利权)人:湖北光谷实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。