一种基于NLP的投标文件查重方法及系统技术方案

技术编号:36536726 阅读:14 留言:0更新日期:2023-02-01 16:22
本发明专利技术公开了一种基于NLP的投标文件查重方法及系统,涉及查重管理领域,其中,所述方法包括:根据投标文件质量管理系统,获取投标文件集合;将投标文件集合输入文件分区模型中,根据文件分区模型,输出文件分区结果;基于文件分区结果中的技术分区进行提取,连接NLP语义识别系统,根据NLP语义识别系统对技术分区进行识别,得到识别特征集合;将识别特征集合输入文件查重模型中,根据文件查重模型,输出文件查重结果;根据技术相似度集合,获取标识投标文件;基于投标文件质量管理系统对标识投标文件进行标识提醒。达到了提高对投标文件进行查重的准确性、全面性,提高投标文件的查重质量等技术效果。质量等技术效果。质量等技术效果。

【技术实现步骤摘要】
一种基于NLP的投标文件查重方法及系统


[0001]本专利技术涉及查重管理领域,具体地,涉及一种基于NLP的投标文件查重方法及系统。

技术介绍

[0002]众所周知,地铁建设项目、学校食堂承包项目等很多项目会按照投标、招标的形式进行,投标、招标对保证项目的公平、公正、公开具有重要影响。然而,在实际的投标、招标过程中,因投标文件查重质量不高造成的陪标、串标等行为时有发生,严重影响了投标、招标的正常进行,同时,也极大地提升了企业的竞标风险。如何对投标文件进行高质量的查重已成为人们关注的热点话题。
[0003]现有技术中,存在针对投标文件的查重准确性不足,进而造成投标文件的查重效果不佳的技术问题。

技术实现思路

[0004]本申请提供了一种基于NLP的投标文件查重方法及系统。解决了现有技术中针对投标文件的查重准确性不足,进而造成投标文件的查重效果不佳的技术问题。
[0005]鉴于上述问题,本申请提供了一种基于NLP的投标文件查重方法及系统。
[0006]第一方面,本申请提供了一种基于NLP的投标文件查重方法,其中,所述方法应用于投标文件质量管理系统,所述系统与NLP语义识别系统通信连接,所述方法包括:根据所述投标文件质量管理系统,获取投标文件集合;将所述投标文件集合输入文件分区模型中,根据所述文件分区模型,输出文件分区结果,其中,所述文件分区结果包括资信分区、技术分区和报价分区;基于所述文件分区结果中的所述技术分区进行提取,连接所述NLP语义识别系统,根据所述NLP语义识别系统对所述技术分区进行识别,得到识别特征集合;将所述识别特征集合输入文件查重模型中,根据所述文件查重模型,输出文件查重结果,其中,所述文件查重结果为技术相似度集合;根据所述技术相似度集合,获取标识投标文件;基于所述投标文件质量管理系统对所述标识投标文件进行标识提醒。
[0007]第二方面,本申请还提供了一种基于NLP的投标文件查重系统,其中,所述系统包括:投标文件获取模块,所述投标文件获取模块用于根据投标文件质量管理系统,获取投标文件集合;文件分区模块,所述文件分区模块用于将所述投标文件集合输入文件分区模型中,根据所述文件分区模型,输出文件分区结果,其中,所述文件分区结果包括资信分区、技术分区和报价分区;识别模块,所述识别模块用于基于所述文件分区结果中的所述技术分区进行提取,连接NLP语义识别系统,根据所述NLP语义识别系统对所述技术分区进行识别,得到识别特征集合;文件查重模块,所述文件查重模块用于将所述识别特征集合输入文件查重模型中,根据所述文件查重模型,输出文件查重结果,其中,所述文件查重结果为技术相似度集合;标识投标文件获取模块,所述标识投标文件获取模块用于根据所述技术相似度集合,获取标识投标文件;标识提醒模块,所述标识提醒模块用于基于所述投标文件质量
管理系统对所述标识投标文件进行标识提醒。
[0008]本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0009]通过投标文件质量管理系统,获取投标文件集合;将投标文件集合输入文件分区模型中,输出文件分区结果;对文件分区结果中的技术分区进行提取,连接NLP语义识别系统,根据NLP语义识别系统对技术分区进行识别,获得识别特征集合;将识别特征集合输入文件查重模型中,输出技术相似度集合;根据技术相似度集合,获取标识投标文件;基于投标文件质量管理系统对标识投标文件进行标识提醒。达到了提高对投标文件进行查重的准确性、全面性,提高投标文件的查重质量;同时,提高投标文件查重的智能化、科学化、自动化,提高投标文件查重的效率,实现快速、高效地投标文件查重的技术效果。
附图说明
[0010]图1为本申请一种基于NLP的投标文件查重方法的流程示意图;
[0011]图2为本申请一种基于NLP的投标文件查重方法中输出文档重复指数的流程示意图;
[0012]图3为本申请一种基于NLP的投标文件查重方法中输出同义重复指数的流程示意图;
[0013]图4为本申请一种基于NLP的投标文件查重系统的结构示意图。
[0014]附图标记说明:投标文件获取模块11,文件分区模块12,识别模块13,文件查重模块14,标识投标文件获取模块15,标识提醒模块16。
具体实施方式
[0015]本申请通过提供一种基于NLP的投标文件查重方法及系统。解决了现有技术中针对投标文件的查重准确性不足,进而造成投标文件的查重效果不佳的技术问题。达到了提高对投标文件进行查重的准确性、全面性,提高投标文件的查重质量;同时,提高投标文件查重的智能化、科学化、自动化,提高投标文件查重的效率,实现快速、高效地投标文件查重的技术效果。
[0016]实施例一
[0017]请参阅附图1,本申请提供一种基于NLP的投标文件查重方法,其中,所述方法应用于投标文件质量管理系统,所述系统与NLP语义识别系统通信连接,所述方法具体包括如下步骤:
[0018]步骤S100:根据所述投标文件质量管理系统,获取投标文件集合;
[0019]进一步的,本申请步骤S100还包括:
[0020]步骤S110:将所述投标文件集合输入文件格式检验区中进行文件格式检验,获取格式异常的投标文件;
[0021]步骤S120:将所述格式异常的投标文件输入文件格式转换区中进行文件格式转换,输出格式转换后的投标文件;
[0022]步骤S130:将所述格式转换后的投标文件覆盖所述格式异常的投标文件,生成所述投标文件集合。
[0023]具体而言,从投标文件质量管理系统中随机选取投标文件,获得投标文件集合。此
外,也可以根据投标文件查重的需要对投标文件质量管理系统进行投标文件的定性、定量选择,获得投标文件集合。进一步,将投标文件集合输入文件格式检验区,获得格式异常的投标文件。进而,将格式异常的投标文件输入文件格式转换区,获得格式转换后的投标文件,并根据其对格式异常的投标文件进行覆盖,从而更新投标文件集合。其中,所述投标文件质量管理系统为使用所述一种基于NLP的投标文件查重方法对投标文件进行查重管理的智能化系统。且,所述投标文件质量管理系统内存储了大量的投标文件。所述投标文件集合包括多个投标文件。所述文件格式检验区、所述文件格式转换区与所述投标文件质量管理系统通信连接。所述文件格式检验区具有对投标文件集合进行文件格式检验的功能。所述格式异常的投标文件包括投标文件集合中具有异常文件格式的投标文件。所述文件格式转换区具有对格式异常的投标文件进行文件格式转换的功能。所述格式转换后的投标文件包括对格式异常的投标文件进行文件格式转换后的投标文件。达到了对投标文件集合进行文件格式检验、文件格式转换、覆盖更新,防止因投标文件集合的文件格式异常对后续的查重产生影响,为后续对投标文件集合进行查重提供可靠的数据支持的技术效果。
[0024]步骤S200:将所述投标文件集合输入文件分区模型中,根据所述文件分区模型,输出文件分区结果,其中,所述文件分区结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NLP的投标文件查重方法,其特征在于,所述方法应用于投标文件质量管理系统,所述系统与NLP语义识别系统通信连接,所述方法包括:根据所述投标文件质量管理系统,获取投标文件集合;将所述投标文件集合输入文件分区模型中,根据所述文件分区模型,输出文件分区结果,其中,所述文件分区结果包括资信分区、技术分区和报价分区;基于所述文件分区结果中的所述技术分区进行提取,连接所述NLP语义识别系统,根据所述NLP语义识别系统对所述技术分区进行识别,得到识别特征集合;将所述识别特征集合输入文件查重模型中,根据所述文件查重模型,输出文件查重结果,其中,所述文件查重结果为技术相似度集合;根据所述技术相似度集合,获取标识投标文件;基于所述投标文件质量管理系统对所述标识投标文件进行标识提醒。2.如权利要求1所述的方法,其特征在于,所述方法还包括:将所述识别特征集合输入所述文件查重模型中,其中,所述文件查重模型包括文档重复性、同义重复性和标识重复性;根据所述文件查重模型,输出文档重复指数、同义重复指数和标识重复指数;根据所述文档重复指数、所述同义重复指数和所述标识重复指数,生成所述技术相似度集合;将所述技术相似度集合作为所述文件查重结果进行输出。3.如权利要求2所述的方法,其特征在于,所述方法还包括:连接文件自查重系统,将所述文件自查重系统链接至所述文件查重模型中;根据所述文件查重模型对各个投标文件进行文件内容自查重,获取内容重复占比;根据所述内容重复占比,输出所述文档重复指数。4.如权利要求2所述的方法,其特征在于,所述方法还包括:搭建同义语句识别库;将所述同义语句识别库链接至所述文件查重模型中,根据所述同义语句识别库对输入的所述识别特征集合进行同义分析,获取同义查重结果;根据所述同义查重结果,对各个投标文件进行同义重复占比分析,获取同义占比系数;根据所述同义占比系数,输出所述同义重复指数。5.如权利要求2所述的方法,其特征在于,所述方法还包括:获取所述投标文件集合中各个投标文件对应的文件...

【专利技术属性】
技术研发人员:郭海波胡鹏丁
申请(专利权)人:成都仁帆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1