System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于财务人工智能领域,具体涉及一种基于超轻量级特征压缩的财务凭证处理方法。
技术介绍
1、在现代医疗领域,随着数字化进程的不断推进,医院需要处理海量的财务凭证数据。这些数据不仅体量巨大,而且多样性高,包含多种格式和结构的信息。因此,如何高效地存储、传输和处理这些数据成为亟待解决的问题。现有技术中,普遍存在着数据冗余和资源消耗过大的问题。为了应对这一挑战,引入了特征压缩技术。特征压缩旨在通过保留数据中的重要特征信息而去掉冗余,从而减少存储空间和提高数据处理速度。然而,传统的特征压缩方法如pca等,往往依赖复杂的数学模型和运算,难以在资源受限的环境下应用。
2、超轻量级特征压缩技术提供了一种有效的解决方案。它通过简化的压缩算法,能够在不显著损失数据特征信息的前提下,大幅度减少数据维度。这种方法特别适合在计算能力有限的设备上运行,如嵌入式系统或移动设备。此外,借助该技术,财务凭证数据可以被快速处理并用于实时分析和决策支持,大大提升了医院运营的效率。因此,基于超轻量级特征压缩的财务凭证处理方法的开发,正是为了解决当前医疗财务数据处理过程中所面临的资源和效率问题,以实现更智能、高效的医疗财务管理系统。
技术实现思路
1、本专利技术为了解决上述问题,提供了一种基于超轻量级特征压缩的财务凭证处理方法。
2、本专利技术为实现上述目的,通过以下技术方案实现:
3、本专利技术提供一种基于超轻量级特征压缩的财务凭证处理方法,包括以下步骤:
4、s
5、s2.对训练集的图像数据使用hsv亮度增强方法进行数据预处理,得到财务图像数据;
6、s3.构建基于超轻量级特征压缩的财务凭证处理模型,所述模型包括全局轻量特征提取器、局部轻量特征提取器、压缩感知机、注意力模块、分类器以及文本提取器;所述财务图像数据输入到所述模型中,对模型进行训练;
7、s4.通过分类损失函数和文本损失函数对所述模型进行优化,得到训练好的模型;
8、s5.测试集中待检测的财务凭证图像输入到训练好的模型中,得到财务凭证处理结果。
9、进一步地,步骤s1包括:
10、为每一张财务凭证图像建立一个标签文件,记录财务凭证图像的文本信息;收集的财务凭证图像分为四类,包括购销合同、收据、发票、支付凭证;对四类财务凭证图像建立四个文件夹独立存放,依次命名为1、2、3、4;
11、在每一类财务凭证图像中随机选择80%的数据量作为训练集,将剩余的数据作为测试集。
12、进一步地,步骤s3中全局轻量特征提取器:
13、所述全局轻量特征提取器包括第一卷积层、relu激活函数、平均池化层、宽度最大计算层、宽度平均计算层、高度平均计算层、高度最大计算层、第二卷积层、第三卷积层、softmax()函数、第四卷积层、relu激活函数、最大池化层;
14、所述财务图像数据输入到第一卷积层、relu激活函数、平均池化层中,得到第一卷积特征;将第一卷积特征输入到宽度最大计算层、宽度平均计算层、高度平均计算层、高度最大计算层中,分别得到宽度最大向量、宽度平均向量、高度平均向量、高度最大向量;将宽度最大向量在维度dim=1的维度方向上使用concat函数与宽度平均向量拼接,得到双层宽度最大向量,将宽度平均向量在维度dim=1的维度方向上使用concat函数与宽度最大向量拼接,得到双层宽度平均向量,将高度最大向量和高度平均向量在通道维度上相加,得到高度向量;将双层宽度最大向量输入到第二卷积层中,得到单层宽度最大向量,将双层宽度平均向量输入到第三卷积层中,得到单层宽度平均向量,将单层宽度最大向量和单层宽度平均向量相乘并输入softmax函数,得到宽度矩阵;将宽度矩阵和高度向量相乘,输入到第四卷积层、relu激活函数、最大池化层中,得到全局特征。
15、进一步地,步骤s3中局部轻量特征提取器:
16、所述局部轻量特征提取器包括第一卷积层、relu激活函数、第一池化层、第二卷积层、relu激活函数、第二池化层;
17、所述全局特征经过局部轻量特征提取器得到局部特征。
18、进一步地,步骤s3中压缩感知机:
19、所述压缩感知机包括离散层、霍夫曼编码层、卷积层、relu激活函数;
20、将所述全局特征和局部特征相加后输入到压缩感知机中,得到融合特征。
21、进一步地,步骤s3中注意力模块:
22、所述注意力模块包括第一注意力模块和第二注意力模块;
23、所述融合特征经过第一注意力模块得到第一注意力,公式表示如下:
24、,
25、其中,表示点乘操作,表示逐元素相乘,d表示降维维度,表示sigmoid激活函数,α、β、γ分别表示第一可学习加权系数、第二可学习加权系数、第三可学习加权系数,表示第一卷积层,表示第二卷积层,表示全局平均池化,表示全局最大池化,、、是与融合特征维度匹配的可学习的query矩阵、key矩阵、value矩阵,、分别表示由融合特征线性变换后的第一矩阵和第二矩阵,r表示压缩率;
26、所述融合特征经过第二注意力模块得到第二注意力,公式表示如下:
27、。
28、进一步地,步骤s3中分类器和文本提取器:
29、所述分类器包括压缩层、第一全连接层、第二全连接层、max函数;
30、第一注意力经过分类器进行处理,得到财务凭证分类预测;
31、所述文本提取器包括压缩层、第一全连接层、第二全连接层、字符串输出层;
32、所述第一注意力和第二注意力经过文本提取器进行处理,得到凭证文本预测
33、进一步地,步骤s4中,所述分类损失函数通过交叉熵损失函数计算损失,所述文本损失函数通过连接主义时序分类ctc损失函数计算损失。
34、本专利技术还提供一种基于超轻量级特征压缩的财务凭证处理系统,包括:
35、数据获取模块:用于收集财务凭证图像及文本信息,构建mini-fin数据集,并划分为训练集和测试集;
36、数据预处理模块:用于对训练集的图像数据使用hsv亮度增强方法进行数据预处理,得到财务图像数据;
37、模型构建模块:用于构建基于超轻量级特征压缩的财务凭证处理模型,所述模型包括全局轻量特征提取器、局部轻量特征提取器、压缩感知机、注意力模块、分类器以及文本提取器;所述财务图像数据输入到所述模型中,对模型进行训练;
38、模型优化模块:用于通过分类损失函数和文本损失函数对所述模型进行优化,得到训练好的模型;
39、财务凭证处理模块:用于将测试集中待检测的财务凭证图像输入到训练好的模型中,得到财务凭证处理结果。
40、本专利技术的优点在于:
41、本专利技术通过融合全局轻本文档来自技高网...
【技术保护点】
1.一种基于超轻量级特征压缩的财务凭证处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S1包括:
3.根据权利要求1所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S3中全局轻量特征提取器:
4.根据权利要求3所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S3中局部轻量特征提取器:
5.根据权利要求4所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S3中压缩感知机:
6.根据权利要求5所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S3中注意力模块:
7.根据权利要求6所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S3中分类器和文本提取器:
8.根据权利要求1所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤S4中,所述分类损失函数通过交叉熵损失函数计算损失,所述文本损失函数通过连接主义时序分类CTC损失函数计算损失。
9.一种基于
...【技术特征摘要】
1.一种基于超轻量级特征压缩的财务凭证处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤s1包括:
3.根据权利要求1所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤s3中全局轻量特征提取器:
4.根据权利要求3所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤s3中局部轻量特征提取器:
5.根据权利要求4所述的基于超轻量级特征压缩的财务凭证处理方法,其特征在于,步骤s3中压缩感...
【专利技术属性】
技术研发人员:潘立才,张新斌,陈瑶瑶,张杰,张姗姗,赵金栋,张玲玉,李春苗,
申请(专利权)人:山东第一医科大学附属肿瘤医院山东省肿瘤防治研究院,山东省肿瘤医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。