System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及文档评审,特别是涉及一种基于自然语言处理的物资采购文档评审方法、基于自然语言处理的物资采购文档评审装置、计算机设备、计算机可读存储介质和计算机程序产品。
技术介绍
1、随着电网公司电子招投标规模的不断扩大,招投标活动产生的数据量呈海量式爆发。在招投标采购日常工作中,在需求审核、招标方案审核、招标文件/招标公告内容审核、合同审核的过程中,有大量评审工作采用人工分析比对的方式进行,从而需要专职人员进行评审工作。
2、但是,由于当前人工评审的工作,存在重复性量大、耗时,且容易出错等问题,从而降低了整体招标环节的工作效率与质量。
技术实现思路
1、针对上述问题,本公开提供一种基于自然语言处理的物资采购文档评审方法、基于自然语言处理的物资采购文档评审装置、计算机设备、计算机可读存储介质和计算机程序产品。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种基于自然语言处理的物资采购文档评审方法,包括:
3、获取待处理文档;所述待处理文档包括用于物资采购的招投标文档;
4、基于预设的自然语言提取方式,从所述待处理文档中提取出至少一个评审阶段的特征信息;其中,处于不同所述评审阶段的特征信息所对应的特征实体、实体关系和特征事件不相同;所述自然语言提取方式包括基于文档定位的模糊提取方式和/或精确提取方式;
5、从匹配于各所述评审阶段的评审规则库中,分别提取对应评审规则;
6、基于所述评审规则,对所述至少一个评
7、在一示例性实施例中,所述方法还包括:
8、基于预设的第一条件构建采购需求评审规则,并基于所述采购需求评审规则,构建得到第一评审规则库;所述采购需求评审规则用于评审所述招投标文档中关于采购方案的合规性;
9、基于预设的第二条件构建招投标方案评审规则,并基于所述招投标方案评审规则,构建得到第二评审规则库;所述招投标方案评审规则用于评审所述招投标文档中关于招投标方案的合规性;
10、基于预设的第三条件构建公示和评标内容评审规则,并基于所述公示和评标内容评审规则,构建得到第三评审规则库;所述公示和评标内容评审规则用于评审所述招投标文档中关于公示方案和评标方案的合规性。
11、在一示例性实施例中,所述基于预设的自然语言提取方式,从所述待处理文档中提取出至少一个评审阶段的特征信息,包括:
12、针对每一所述评审阶段,对所述待处理文档进行文档定位处理,确定各所述评审阶段所对应的文档内容;
13、基于所述精确匹配方式,从所述文档内容中,精确匹配出第一类关键词;所述第一类关键词为所述文档内容中表征预设特征实体、实体关系和特征事件的文本字词;
14、针对所述文档内容中不存在的第一类关键词,基于所述模糊匹配方式,从所述文档内容中,模糊匹配出第二类关键词;所述模糊匹配用于匹配所述文档内容中是否存在与所述第一类关键词相似的第二类关键词;
15、将所述第一类关键词和所述第二类关键词作为对应评审阶段的特征信息。
16、在一示例性实施例中,所述基于所述模糊匹配方式,从所述文档内容中,模糊匹配出第二类关键词,包括:
17、从所述文档内容中,匹配出与所述第一类关键词之间的编辑距离处于预设阈值内的相似关键词作为第二类关键词;
18、其中,所述编辑距离表征将所述相似关键词转换为所述第一类关键词所需的最少转换操作的次数;
19、所述转换操作至少包括插入字符、删除字符和替换字符。
20、在一示例性实施例中,在所述对所述至少一个评审阶段的特征信息进行语义评审处理之前,还包括:
21、对所述第一类关键词和所述第二类关键词进行结构化处理,得到对应标准化结构的特征词组;所述标准化结构基于特征实体-实体关系-特征事件的结构表征;
22、基于预设的词袋字典,将所述特征词组中的各个关键词依次转换为预设格式的语料向量,得到针对各所述特征词组的语料向量列表;
23、其中,所述词袋字典中包括多个的词数组合,每一所述词数组合中包括一个目标词语和与所述目标词义相绑定的标志位数字;
24、所述预设格式的语料向量中包括关于所述关键词的标志位数字和所述关键词对应出现在所述文档内容中的次数数值。
25、在一示例性实施例中,所述基于所述评审规则,对所述至少一个评审阶段的特征信息进行语义评审处理,得到对应的评审结果,包括:
26、基于所述词袋字典,确定各所述评审阶段所对应的语料向量列表中关于所述语料向量的文本语义,以得到针对各所述特征词组的文本语义数据;
27、将所述文本语义数据与所述评审规则进行语义评审处理,得到对应的评审结果;
28、其中,所述评审结果包括针对目标特征词组评审通过的第一结果或者评审不通过的第二结果。
29、在一示例性实施例中,在所述得到对应的评审结果之后,还包括:
30、针对所述评审结果为第二结果的目标特征词组,基于所述目标特征词组所对应的文本语义数据和评审规则,生成提示信息,并将所述提示信息发送于人工坐席,以对所述文档内容进行调整。
31、根据本公开实施例的第二方面,提供一种基于自然语言处理的物资采购文档评审装置,包括:
32、数据获取单元,被配置为执行获取待处理文档;所述待处理文档包括用于物资采购的招投标文档;
33、信息提取单元,被配置为执行基于预设的自然语言提取方式,从所述待处理文档中提取出至少一个评审阶段的特征信息;其中,处于不同所述评审阶段的特征信息所对应的特征实体、实体关系和特征事件不相同;所述自然语言提取方式包括基于文档定位的模糊提取方式和/或精确提取方式;
34、规则提取单元,被配置为执行从匹配于各所述评审阶段的评审规则库中,分别提取对应评审规则;
35、语义评审单元,被配置为执行基于所述评审规则,对所述至少一个评审阶段的特征信息进行语义评审处理,得到对应的评审结果;所述语义评审处理用于确定所述特征信息所表达的语义逻辑满足于所述评审规则的程度。
36、根据本公开实施例的第三方面,提供一种计算机设备,包括:
37、处理器;
38、用于存储所述处理器的可执行指令的存储器;
39、其中,所述处理器被配置为执行所述可执行指令,以实现如上述任一项所述的基于自然语言处理的物资采购文档评审方法。
40、根据本公开实施例的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质中包括程序数据,当所述程序数据由计算机设备的处理器执行时,使得所述计算机设备能够执行如上述任一项所述的基于自然语言处理的物资采购文档评审方法。
41、根据本公开实施本文档来自技高网...
【技术保护点】
1.一种基于自然语言处理的物资采购文档评审方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述基于预设的自然语言提取方式,从所述待处理文档中提取出至少一个评审阶段的特征信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述模糊匹配方式,从所述文档内容中,模糊匹配出第二类关键词,包括:
5.根据权利要求3所述的方法,其特征在于,在所述对所述至少一个评审阶段的特征信息进行语义评审处理之前,还包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述评审规则,对所述至少一个评审阶段的特征信息进行语义评审处理,得到对应的评审结果,包括:
7.根据权利要求6所述的方法,其特征在于,在所述得到对应的评审结果之后,还包括:
8.一种基于自然语言处理的物资采购文档评审装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,所述计算机可读存
...【技术特征摘要】
1.一种基于自然语言处理的物资采购文档评审方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述基于预设的自然语言提取方式,从所述待处理文档中提取出至少一个评审阶段的特征信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述模糊匹配方式,从所述文档内容中,模糊匹配出第二类关键词,包括:
5.根据权利要求3所述的方法,其特征在于,在所述对所述至少一个评审阶段的特征信息进行语义评审处理之前,还包括:
6.根...
【专利技术属性】
技术研发人员:卢旻,李站,汤新跃,张希,张建勇,
申请(专利权)人:南方电网大数据服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。