System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,具体为基于人工智能的产品注册资料管理方法及系统。
技术介绍
1、在产品注册资料管理领域,现有的
技术介绍
主要涉及手动和半自动化的管理方法。
2、手动管理方法主要依靠人力进行资料的整理、分类和审核。虽然这种方法具有一定的灵活性和适应性,但人工处理资料耗时较长,效率低下,尤其在资料量大的情况下,容易出现延误;半自动化管理方法利用一定的软件工具和技术辅助进行资料管理,例如使用文本处理工具进行简单的文本分析和分类。这种方法比手动管理有所改进,但仍缺乏对资料变化和趋势的动态适应能力,难以及时更新和调整;一些方法基于预定义的规则和模板进行资料管理和审核,例如使用关键词匹配和简单的规则判断;这种方法在一定程度上提高了效率,但基于规则的方法难以处理复杂的资料关系和依赖性,限制了其应用范围。
技术实现思路
1、本专利技术的目的在于提供基于人工智能的产品注册资料管理方法及系统,以解决上述
技术介绍
中提出的问题。
2、为了解决上述技术问题,本专利技术提供如下技术方案:基于人工智能的产品注册资料管理方法,该方法包括以下步骤:
3、s1、对数据库中已注册的资料进行关键词提取,根据关键词所属领域对资料分类;
4、s2、对于同一领域的资料,以日为单位,对每日的资料进行特征的提取和分析确定共性内容;
5、s3、计算每日资料共性内容的梯度变化,确定资料所属的不同时段;
6、s4、对于每个时段的资料,对其关键内容进行确定,建立
7、s5、将待注册资料与评审模板进行比对,得出评审建议并进行反馈;
8、s6、根据资料所属的不同时段对模板变化时间进行预测,待注册资料的申请时间在预测时间之后时,对用户进行反馈提醒。
9、在步骤s1中,所述关键词提取的具体方式为:
10、s2-1、去除资料文本信息中的标点符号和特殊符号;
11、s2-2、使用分词工具将文本分解为单个的词语或词组;
12、s2-3、定义停用词表,去除文本中常见但无实际意义的词语;
13、s2-4、统计每个词语在文档中出现的次数tf:
14、tf(t,d)=ft,d/nd
15、其中,tf(t,d)是词语t在资料d中出现的词频;ft,d是词语t在资料d中出现的次数;nd是资料d中除去停用词之后的总词数;
16、词频tf(t,d)值最大的词语为关键词;
17、定义关键词所属领域;
18、将提取的关键词与定义关键词相匹配,根据关键词所属领域对资料分类。
19、在步骤s2中,所述特征的提取指对资料内容特征的提取,每日所有资料均包含的内容特征即为共性内容特征,表示为:f1、f2、…、fn;共性内容特征值由格式值表示,每一个共性内容特征由多种格式共同表示;共性内容特征值可表示为:v(fi)=(gi1,gi2,…,gim);
20、其中,n为正整数,表示共性内容特征的数量;fi表示第i个共性内容特征;1≤i≤n,i为正整数;v(fi)表示共性内容特征fi的值;m为正整数,表示第i个共性内容特征的格式数量;gim表示第i个共性内容特征的第m个格式值;
21、对共性内容特征值进行数值化和向量化;计算不同资料相同共性内容特征值之间的余弦相似度;所有余弦相似度为1对应的共性内容特征及格式即为共性内容。
22、在步骤s3中,所述每日资料共性内容的梯度变化计算的具体方式为:
23、将共性内容表示为c,由步骤s2可知,c由所有不同资料相同共性内容特征值之间余弦相似度为1对应的共性内容特征及格式构成;对c进行数值化处理;不同日期共性内容表示为tj(c),不同日期共性内容之间的梯度变化表示为:δc=tj(c)-tj-1(c);
24、其中,tj(c)表示日期为j时的共性内容;tj-1(c)表示日期为j-1时的共性内容;
25、所述确定资料所属的不同时段具体方式为:
26、设置阈值a1,当δc>a1时,梯度变化较大;记录所有满足δc>a1的日期,并按序排列;根据日期划分不同时段。
27、在步骤s4中,根据步骤s3所划分的时段,对不同时段的资料关键内容进行确定;
28、提取每个时段所有资料均包含的内容特征为关键内容特征,表示为:k1、k2、…、kp;关键内容特征值由格式值表示,每一个关键内容特征由多种格式共同表示;关键内容特征值可表示为:v(kr)=(lr1,lr2,…,lrq);
29、其中,p为正整数,表示关键内容特征的数量;kr表示第r个关键内容特征;1≤r≤p,r为正整数;v(kr)表示关键内容特征kr值;q为正整数,表示第r个关键内容特征的格式数量;lrq表示第r个关键内容特征的第q个格式值;
30、对关键内容特征值进行数值化和向量化;计算不同资料相同关键内容特征值之间的余弦相似度;所有余弦相似度为1对应的关键内容特征及格式即为关键内容;根据关键内容特征及格式建立评审模板。
31、在步骤s5中,提取待注册资料内容特征以及相应的格式值;
32、所述对比包括完整性对比以及格式对比;
33、完整性对比:根据文本匹配的方式判断待注册资料内容特征是否完全包含步骤s4中的关键特征;完全包含则进行格式对比,未完全包含则反馈不完整建议以及相应的修改方法;
34、格式对比:通过完整性对比之后,选择待注册资料内容特征值和模板中与之相对应的关键内容特征值,对二者进行同一规则下的数值化向量化处理,然后计算二者的余弦相似度;当所有待注册资料内容特征值和模板中与之相对应的关键内容特征值余弦相似度值均为1时,反馈审批通过建议,否则反馈格式错误建议以及相应的错误详情、修改方案。
35、在步骤s6中,根据步骤s3中所记录所有满足δc>a1且按序排列的日期,预测模板变化时间;
36、数据处理:将时间序列数据转换为监督学习问题;设定滑动窗口大小u,将时间序列数据分割为大小为u的窗口,每个窗口包含u天的数据;每个窗口的前u-1天的数据作为输入,第u天的数据作为输出,形成用于监督学习的输入输出对;
37、特征选择:使用年月日作为日期特征,将日期特征编码为[年,月,日];使用上一次梯度变化后的天数作为变化特征,数值上为上次变化以来的天数;计算时间窗口内梯度变化的频率作为统计特征,数值上为在滑动窗口u内共性内容梯度的变化次数;
38、模型训练:
39、构建lstm模型;输入层接受窗口大小为u的时间序列输入,x={x1,x2,…,xu};其中,x为输入,x表示特征向量,由日期、变化和统计特征表示;
40、lstm层捕捉时间序列的长期依赖关系,hs=σ(wh×[hs-1,xs]+bh);其中,s表示时间步,s∈{1,2,…,u},hs是第s步的隐藏状态,wh是权重矩阵,xs是本文档来自技高网...
【技术保护点】
1.基于人工智能的产品注册资料管理方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤S1中,所述关键词提取的具体方式为:
3.根据权利要求1所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤S2中,所述特征的提取指对资料内容特征的提取,每日所有资料均包含的内容特征即为共性内容特征,表示为:F1、F2、…、Fn;共性内容特征值由格式值表示,每一个共性内容特征由多种格式共同表示;共性内容特征值可表示为:V(Fi)=(Gi1,Gi2,…,Gim);
4.根据权利要求3所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤S3中,所述每日资料共性内容的梯度变化计算的具体方式为:
5.根据权利要求4所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤S4中,根据步骤S3所划分的时段,对不同时段的资料关键内容进行确定;
6.根据权利要求5所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤S5中,提取待注册资料内容特征以及相应的格式值
7.根据权利要求6所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤S6中,根据步骤S3中所记录所有满足ΔC>A1且按序排列的日期,预测模板变化时间;
8.基于人工智能的产品注册资料管理系统,其特征在于:该系统包括领域划分模块、时段划分模块、对比反馈模块和模板变化预测模块;
9.根据权利要求8所述的基于人工智能的产品注册资料管理系统,其特征在于:所述领域划分模块包括数据库单元、关键词提取单元和资料分类单元;
10.根据权利要求8所述的基于人工智能的产品注册资料管理系统,其特征在于:所述对比反馈模块包括关键内容分析单元、模板建立单元、对比单元和反馈单元;
...【技术特征摘要】
1.基于人工智能的产品注册资料管理方法,其特征在于:该方法包括以下步骤:
2.根据权利要求1所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤s1中,所述关键词提取的具体方式为:
3.根据权利要求1所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤s2中,所述特征的提取指对资料内容特征的提取,每日所有资料均包含的内容特征即为共性内容特征,表示为:f1、f2、…、fn;共性内容特征值由格式值表示,每一个共性内容特征由多种格式共同表示;共性内容特征值可表示为:v(fi)=(gi1,gi2,…,gim);
4.根据权利要求3所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤s3中,所述每日资料共性内容的梯度变化计算的具体方式为:
5.根据权利要求4所述的基于人工智能的产品注册资料管理方法,其特征在于:在步骤s4中,根据步骤s3...
【专利技术属性】
技术研发人员:张向飞,滕天宇,王栋梁,蒋浩,王轶,方海宾,顾琦,
申请(专利权)人:上海市大数据中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。