System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能预览分析文件处理方法、系统、装置与介质制造方法及图纸_技高网

一种智能预览分析文件处理方法、系统、装置与介质制造方法及图纸

技术编号:39980538 阅读:10 留言:0更新日期:2024-01-09 01:29
本申请公开了一种智能预览分析文件处理方法、系统、装置和存储介质,用于通过智能预览分析文件处理设备实现,设备包括若干个分布式训练设备以及智能分析处理装置,智能分析处理装置包括第一训练模型,文件处理方法包括:将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征;将函数处理特征通过知识传递至第一训练模型,以调整第一训练模型;重复将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征这一步骤,直至第一损失函数收敛或者待训练模型的迭代次数为最大值,得到目标智能分析处理装置;将第二版式文件输入目标智能分析处理装置,得到目标文件。本申请可应用于人工智能技术领域。

【技术实现步骤摘要】

本申请涉及人工智能,尤其是一种智能预览分析文件处理方法、系统、装置与存储介质。


技术介绍

1、在互联网技术和人工智能技术不断发展的背景下,越来越多的企业和机构采用智能oa门户系统来提高工作效率和管理水平。然而,在实际应用过程中,传统的版式文件处理方法面临一系列挑战和问题,如误识别、低准确性和无法满足大规模数据处理等。因此,相关技术中仍存在需要解决的技术问题。


技术实现思路

1、本申请的目的在于至少一定程度上解决现有技术中存在的技术问题之一。

2、为此,本申请实施例的一个目的在于提供一种智能预览分析文件处理方法、系统、装置与存储介质,该方法、系统、装置与存储介质可以提高智能预览分析文件处理识别准确度;本申请的方法可以被配置在某公司的办公系统中,可对用户上传的各种版式文件进行快速准确的识别、分析和管理,有效地简化了用户的工作流程和文件管理过程,提高了工作效率和准确度,实现了更加智能化、便捷化和个性化的服务。

3、为了达到上述技术目的,本申请实施例所采取的技术方案包括:一种智能预览分析文件处理方法,用于通过智能预览分析文件处理设备实现,设备包括若干个分布式训练设备以及智能分析处理装置,其中每个分布式训练设备配置一个待训练模型,智能分析处理装置包括第一训练模型,对于任意一个分布式训练设备,文件处理方法包括步骤:将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征;将所述函数处理特征通过知识传递至所述第一训练模型,以调整所述第一训练模型;重复将基于业务场景的版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征这一步骤,直至所述第一损失函数收敛或者所述待训练模型的迭代次数为最大值,得到目标智能分析处理装置;将第二版式文件输入目标智能分析处理装置,得到目标文件,所述目标文件用于表征对文件中的表格以及图表进行解析后的文件。本申请将卷积神经网络模型置入装置流程,实现模型自动化调整迭代的处理办法。本申请采取分布式训练、多任务联合训练的技术优化方向,对卷积神经网络模型进行优化的方式。本申请能够实现自动化处理和分析,减少人工干预的必要性,提高工作效率和数据处理质量,可以处理各种类型的版式文件,包括电子文档、图像以及视频等,应用范围更为广泛。

4、另外,根据本专利技术中上述实施例的一种智能预览分析文件处理的方法,还可以有以下附加的技术特征:

5、进一步地,本申请实施例中,所述将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征这一步骤,具体包括:

6、对输入每个分布式训练设备版式文件进行数据筛选以及增强处理,得到第一版式文件;将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征。

7、进一步地,本申请实施例中,所述对输入每个分布式训练设备版式文件进行数据筛选以及增强处理,得到第一版式文件这一步骤,具体包括:对输入每个分布式训练设备版式文件进行数据筛选以及通过imgauge库对版式文件进行图像增强处理,得到第一版式文件;或者,对输入每个分布式训练设备版式文件进行数据筛选以及通过augmentor库对版式文件进行图像增强处理,得到第一版式文件。

8、进一步地,本申请实施例中,所述待训练模型通过以下步骤配置:构建深度卷积神经网络模型并对所述深度卷积神经网络模型进行训练,得到训练好的第一深度卷积神经网络模型;对所述第一深度卷积神经网络模型进行删除权重以及删除连接操作,得到待训练模型;将所述待训练模型配置至任意一个分布式训练设备中。

9、进一步地,本申请实施例中,所述第一版式文件包括若干个第一子文件以及若干个第二子文件;每个所述第一子文件和一个所述第二子文件存在唯一对应关系,且存在唯一对应关系的所述第一子文件和所述第二子文件互为镜像文件。

10、进一步地,本申请实施例中,所述将所述函数处理特征通过知识传递至所述第一训练模型,以调整所述第一训练模型,这一步骤包括:计算所述待训练模型以及所述第一训练模型的相似度,当所述相似度大于预设阈值,以待训练模型为教师网络以及以所述第一训练模型为学生网络,将待训练模型每次训练迭代产生的所述函数处理特征以及第一损失函数通过知识传递至所述第一训练模型,以调整所述第一训练模型。

11、进一步地,本申请实施例中,所述计算所述待训练模型以及所述第一训练模型的相似度这一步骤,具体包括:使用kl散度公式计算所述待训练模型以及所述第一训练模型之间相似度,或者使用均方误差公式计所述待训练模型以及所述第一训练模型之间相似度。

12、另一方面,本申请实施例还提供一种智能预览分析文件处理系统,包括第一处理单元,用于将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征;第二处理单元,用于将所述函数处理特征通过知识传递至所述第一训练模型,以调整所述第一训练模型;第三处理单元,用于重复将基于业务场景的版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征这一步骤,直至所述第一损失函数收敛或者所述待训练模型的迭代次数为最大值,得到目标智能分析处理装置;第四处理单元,用于将第二版式文件输入目标智能分析处理装置,得到目标文件,所述目标文件用于表征对文件中的表格以及图表进行解析后的文件。

13、另一方面,本申请还提供一种智能预览分析文件处理装置,包括:

14、至少一个处理器;

15、至少一个存储器,用于存储至少一个程序;

16、当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如
技术实现思路
中任一项所述一种智能预览分析文件处理方法。

17、此外,本申请还提供一种计算机可读存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行如上述任一项所述一种智能预览分析文件处理方法。

18、本申请的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到:

19、本申请可以将第一版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征;将所述函数处理特征通过知识传递至所述第一训练模型,以调整所述第一训练模型;重复将基于业务场景的版式文件输入待训练模型进行训练,得到第一损失函数以及函数处理特征这一步骤,直至所述第一损失函数收敛或者所述待训练模型的迭代次数为最大值,得到目标智能分析处理装置;将第二版式文件输入目标智能分析处理装置,得到目标文件,所述目标文件用于表征对文件中的表格以及图表进行解析后的文件。本申请通过通过人工智能模型对版式文件的表格以及图表进行解析,可以减少文件解析的误识别,提高文件解析的准确度。

本文档来自技高网...

【技术保护点】

1.一种智能预览分析文件处理方法,其特征在于,用于通过智能预览分析文件处理设备实现,所述智能预览分析文件处理设备包括若干个分布式训练设备以及智能分析处理装置,其中每个所述分布式训练设备用于配置一个待训练模型,智能分析处理装置部署有第一训练模型,文件处理方法包括:

2.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述将第一版式文件通过以下步骤得到:

3.根据权利要求2所述一种智能预览分析文件处理方法,其特征在于,所述对输入每个分布式训练设备的版式文件进行数据筛选以及增强处理,得到第一版式文件这一步骤,具体包括:

4.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述待训练模型通过以下步骤配置:

5.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述第一版式文件包括若干个第一子文件以及若干个第二子文件;每个所述第一子文件和一个所述第二子文件存在唯一对应关系,且存在唯一对应关系的所述第一子文件和所述第二子文件互为镜像文件。

6.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述将所述函数处理特征通过知识传递至所述第一训练模型,以调整所述第一训练模型,这一步骤包括:

7.根据权利要求6所述一种智能预览分析文件处理方法,其特征在于,所述计算所述待训练模型以及所述第一训练模型的相似度这一步骤,具体包括:

8.一种智能预览分析文件处理系统,其特征在于,包括:

9.一种智能预览分析文件处理装置,其特征在于,包括:

10.一种计算机可读存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-7任一项所述一种智能预览分析文件处理方法。

...

【技术特征摘要】

1.一种智能预览分析文件处理方法,其特征在于,用于通过智能预览分析文件处理设备实现,所述智能预览分析文件处理设备包括若干个分布式训练设备以及智能分析处理装置,其中每个所述分布式训练设备用于配置一个待训练模型,智能分析处理装置部署有第一训练模型,文件处理方法包括:

2.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述将第一版式文件通过以下步骤得到:

3.根据权利要求2所述一种智能预览分析文件处理方法,其特征在于,所述对输入每个分布式训练设备的版式文件进行数据筛选以及增强处理,得到第一版式文件这一步骤,具体包括:

4.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述待训练模型通过以下步骤配置:

5.根据权利要求1所述一种智能预览分析文件处理方法,其特征在于,所述第一版式文件包括若干个第一子文件以...

【专利技术属性】
技术研发人员:叶延兴赵子颖汤嘉诚
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1