System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理领域,尤其是涉及一种招投标数据处理方法、装置、电子设备及存储介质。
技术介绍
1、招投标数据处理是现代企业管理和政府采购的重要环节,随着信息化水平的提高,招投标过程中的数据处理变得越来越复杂。传统的手动处理方式不仅效率低下,而且容易出错,无法满足大规模、高频率的招投标需求。近年来,随着大数据和人工智能技术的发展,自动化招投标数据处理系统逐渐成为研究热点,这些系统能够高效地完成招投标文件的接收、分类、数据提取和分析等工作,大大提升了工作效率和准确性。
2、在现有的招投标数据处理技术中,常用的方法之一是基于自然语言处理的技术。具体来说,可以通过预训练的语言模型,对招投标文件进行深度解析,提取关键信息并生成结构化的数据。然而,现有的基于自然语言处理的招投标数据处理技术往往依赖于固定的规则或简单的特征匹配,难以应对复杂的文件格式和多变的内容结构。导致在实际应用中,影响文件提出过程中数据提取的精度和可靠性。因此,如何提高招投标数据处理系统的准确性,成为一个亟待解决的技术问题。
技术实现思路
1、为了提高招投标数据处理系统的准确性,本申请一种招投标数据处理方法、装置、电子设备及存储介质。
2、第一方面,本申请提供一种招投标数据处理方法,采用如下的技术方案:
3、一种招投标数据处理方法,包括:
4、接收当前招投标文件,并确定所述当前招投标文件对应的文件类型;
5、基于所述文件类型,对所述当前招投标文件进行数据提取,以得
6、对所述招投标数据进行分析,得到所述当前招投标文件对应的分析结果;
7、基于所述分析结果,生成所述当前招投标文件对应的分析报告。
8、通过采用上述技术方案,通过接收招投标文件并识别该招投标文件的文件类型,针对不同类型文件采用不同的提取方式进行数据提取,以得到该招投标文件对应的招投标数据,在一定程度上能够提高数据处理的效率和精度,然后通过对招投标数据的深入分析,挖掘出关键信息,为决策提供依据,最终生成的分析报告,从而提高招投标数据处理系统的准确性。
9、在一种可能的实现方式中,确定所述当前招投标文件对应的文件类型,包括:
10、识别所述当前招投标文件对应的基础信息,所述基础信息包括发布单位、文件篇幅以及文件关键词,其中,文件关键词包括时间节点、项目预算以及项目要求;
11、确定所述当前招投标文件对应的发布单位的发展状态,所述发展状态为发展成熟或发展不成熟;
12、若所述当前招投标文件对应的发布单位的发展状态为发展成熟,则确定所述文件篇幅是否超过篇幅阈值;若所述文件篇幅超过所述篇幅阈值,则确定所述招投标文件对应的文件类型为第一类型;若所述文件篇幅不超过所述篇幅阈值,则确定所述招投标文件对应的文件类型为第二类型;
13、若所述当前招投标文件对应的发布单位的发展状态为发展不成熟,则基于识别出的文件关键词,确定所述当前招投标文件是否存在关键词内容不一致;若所述当前招投标文件不存在关键词内容不一致,则确定所述当前招投标文件对应的文件类型为第三类型;若所述当前招投标文件存在关键词内容不一致,则确定所述当前招投标文件对应的文件类型为第四类型。
14、通过采用上述技术方案,通过识别基础信息,如发布单位、文件篇幅及关键词,为文件类型的初步判断提供了重要依据,考虑发布单位的发展状态,针对不同成熟度单位采取不同判断逻辑,既考虑了实际情况的多样性,也提升了判断的合理性;再者,对于发展成熟的单位,依据文件篇幅是否超阈值来区分文件类型,便于快速识别文件规模及复杂度;而对于发展不成熟的单位,则通过关键词内容的一致性检查来确定文件类型,有助于识别潜在的信息不一致问题,确保文件处理的准确性和高效性。
15、在一种可能的实现方式中,当所述当前招投标文件对应的文件类型为第一类型时,基于所述文件类型,对所述当前招投标文件进行数据提取,以得到所述当前招投标文件对应的招投标数据,包括:
16、确定所述文件类型对应的提取权重,并基于所述提取权重确定所述文件类型对应的提取模式,所述提取模式包括提取模型以及每个提取模型对应的提取次数;
17、基于每个提取模型并按照每个提取模型对应的提取次数对所述当前招投标文件进行提取,得到所述当前招投标文件对应的初始数据;
18、对所述初始数据进行数据检查,以得到检查结果,所述检查结果包括数据准确程度;
19、基于所述检查结果对所述初始数据进行迭代数据提取以及数据检查,直至满足预设条件,将满足所述预设条件的初始数据作为所述当前招投标文件对应的招投标数据,所述预设条件为迭代次数达到迭代次数阈值或数据准确程度大于准确程度阈值。
20、通过采用上述技术方案,通过确定文件类型对应的提取权重和提取模式,能够精准匹配最适合该类型文件的提取策略,包括选择合适的提取模型及设定合理的提取次数,从而提高了数据提取的针对性和效率,采用多次提取并伴随数据检查的方式,确保了提取数据的准确性和完整性,通过迭代提取和数据检查的过程,不断优化数据质量,直至满足预设条件(迭代次数达阈值或数据准确程度超阈值),最终获得的招投标数据既全面又可靠,为后续分析提供了坚实的基础。
21、在一种可能的实现方式中,所述提取模型包括go语言模型、cnn语言模型以及rnn语言模型,所述基于每个提取模型并按照每个提取模型对应的提取次数对所述当前招投标文件进行提取,得到所述当前招投标文件对应的初始数据,包括:
22、对所述当前招投标文件进行预处理,得到预处理后的当前招投标文件;
23、基于每个提取模型对应的提取次数,确定所述当前招投标文件对应的提取序列,所述提取序列包括至少两个按照顺序排列的提取模型组,每个提取模型组包括至少一个提取模型,且每个提取模型组中的提取模型按提取顺序排列;
24、确定当前提取模型组,对所述当前招投标文件执行提取步骤,得到所述当前招投标文件对应的初始数据;
25、所述提取步骤包括:
26、确定所述当前提取模型组中所述go语言模型的提取次数是否为0,若所述go语言模型的提取次数不为0,则将预处理后的当前招投标文件输入至所述go语言模型中,并获取所述go语言模型输出的文本数据;
27、确定所述当前提取模型组中所述cnn语言模型的提取次数是否为0,若所述cnn语言模型的提取次数不为0,则将所述文本数据输入至所述cnn语言模型中,并获取所述cnn语言模型输出的第一关键数据以及局部特征;
28、确定所述当前提取模型组中所述rnn语言模型的提取次数是否为0,若所述rnn语言模型的提取次数不为0,则将所述文本数据输入至所述rnn语言模型中,并获取所述rnn语言模型输出的第二关键数据以及序列特征;
29、当所述当前提取模型组中所述rnn语言模型的提取次数不为0且所述cnn语本文档来自技高网...
【技术保护点】
1.一种招投标数据处理方法,其特征在于,包括:
2.根据权利要求1所述的招投标数据处理方法,其特征在于,所述确定所述当前招投标文件对应的文件类型,包括:
3.根据权利要求2所述的招投标数据处理方法,其特征在于,当所述当前招投标文件对应的文件类型为第一类型时,基于所述文件类型,对所述当前招投标文件进行数据提取,以得到所述当前招投标文件对应的招投标数据,包括:
4.根据权利要求3所述的招投标数据处理方法,其特征在于,所述提取模型包括Go语言模型、CNN语言模型以及RNN语言模型,所述基于每个提取模型并按照每个提取模型对应的提取次数对所述当前招投标文件进行提取,得到所述当前招投标文件对应的初始数据,包括:
5.根据权利要求2所述的招投标数据处理方法,其特征在于,当所述当前招投标文件对应的文件类型为第二类型时,基于所述文件类型,对所述当前招投标文件进行数据提取,以得到所述当前招投标文件对应的招投标数据,包括:
6.根据权利要求2所述的招投标数据处理方法,其特征在于,当所述当前招投标文件对应的文件类型为第三类型时,基于所述文件类型
7.根据权利要求1至6任一项所述的招投标数据处理方法,其特征在于,所述对所述招投标数据进行分析,得到所述当前招投标文件对应的分析结果,包括:
8.一种招投标数据处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,该电子设备包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令所述计算机执行权利要求1~7任一项所述的招投标数据处理方法。
...【技术特征摘要】
1.一种招投标数据处理方法,其特征在于,包括:
2.根据权利要求1所述的招投标数据处理方法,其特征在于,所述确定所述当前招投标文件对应的文件类型,包括:
3.根据权利要求2所述的招投标数据处理方法,其特征在于,当所述当前招投标文件对应的文件类型为第一类型时,基于所述文件类型,对所述当前招投标文件进行数据提取,以得到所述当前招投标文件对应的招投标数据,包括:
4.根据权利要求3所述的招投标数据处理方法,其特征在于,所述提取模型包括go语言模型、cnn语言模型以及rnn语言模型,所述基于每个提取模型并按照每个提取模型对应的提取次数对所述当前招投标文件进行提取,得到所述当前招投标文件对应的初始数据,包括:
5.根据权利要求2所述的招投标数据处理方法,其特征在于,当所述当前招投标文件对应的文件类型为第二类型时,基于...
【专利技术属性】
技术研发人员:彭宁,徐梦,晋好林,陈朋举,
申请(专利权)人:法正智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。