公司名称比对的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27879226 阅读:50 留言:0更新日期:2021-03-31 01:08
本申请涉及一种公司名称比对的方法、装置、计算机设备和存储介质。方法包括:获取第一公司的第一名称和第二公司的第二名称;对第一名称和第二名称进行预处理;分别对预处理后的第一名称和第二名称进行分割,得到第一名称和第二名称的各个区域;将第一名称的区域与对应的第二名称的区域进行对比,得到各个区域的相似度;对各个区域的相似度进行加权求和,得到第一名称和第二名称的最终相似度;当最终相似度大于预设阈值时,第一公司和第二公司属于同一公司,这种方式考虑到了文本、拼音相似度层面的计算,对错别字、名称缩写有一定的容忍度,具有很高的稳定性和准确性,提高了审批效率,也减少了审批的人工成本和时间成本。

【技术实现步骤摘要】
公司名称比对的方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种公司名称比对的方法、装置、计算机设备和存储介质。
技术介绍
公司名称是独立法人成立的公司的名称,在办理公司业务时,基本上都要填写公司名称,对应的办事机构则会核实填写的公司和实际公司名称是否相同。但是,同一家公司可以有不同的填写方法,例如公司全名叫“ABCD服务有限公司”,客户可能填写的是“ABCD”。传统技术中,一般采用的审批方式是通过人工去一件件去审,但是这种方法非常耗时耗力,且效率较低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高公司名称比对效率的公司名称比对的方法、装置、计算机设备和存储介质。一种公司名称比对的方法,所述方法包括:获取第一公司的第一名称和第二公司的第二名称;对所述第一名称和所述第二名称进行预处理;分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域;将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度;对各个区域的相似度进行加权求和,得到所述第一名称和所述第二名称的最终相似度;当所述最终相似度大于预设阈值时,确定所述第一名称和所述第二名称属于同一公司名称。一种公司名称比对的装置,所述装置包括:公司名称获取模块,用于获取第一公司的第一名称和第二公司的第二名称;预处理模块,用于对所述第一名称和所述第二名称进行预处理;区域分割模块,用于分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域;区域对比模块,用于将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度;相似度确认模块,对各个区域的相似度进行加权求和,得到所述第一名称和所述第二名称的最终相似度;当所述最终相似度大于预设阈值时,确定所述第一名称和所述第二名称属于同一公司名称。一种计算机设备,包括存储器、处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取第一公司的第一名称和第二公司的第二名称;对所述第一名称和所述第二名称进行预处理;分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域;将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度;对各个区域的相似度进行加权求和,得到所述第一名称和所述第二名称的最终相似度;当所述最终相似度大于预设阈值时,确定所述第一名称和所述第二名称属于同一公司名称。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取第一公司的第一名称和第二公司的第二名称;对所述第一名称和所述第二名称进行预处理;分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域;将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度;对各个区域的相似度进行加权求和,得到所述第一名称和所述第二名称的最终相似度;当所述最终相似度大于预设阈值时,确定所述第一名称和所述第二名称属于同一公司名称。上述公司名称比对的方法、装置、计算机设备和存储介质,先对第一公司的第一名称和第二公司的第二名称进行预处理,并进行分词处理,对第一名称和第二名称进行分割,将第一名称和第二名称分割成多个区域,并将第一名称的区域与对应的第二名称的区域进行对比,从而得到各个区域的相似度,对各个区域的相似度进行加权求和,得到第一名称和第二名称的最终相似度,从而可以根据最终相似度确定第一名称和第二名称是否属于同一公司名称。当最终相似度大于预设阈值时,可以确定第一公司和第二公司属于同一公司;当最终相似度小于或等于预设阈值时,可以确定第一名称和第二名称不属于同一公司名称,这种公司名称的比对方式不仅考虑到了文本、拼音相似度层面的计算,也对错别字、名称缩写有一定的容忍度,具有很高的稳定性和准确性,大幅度的提高了审批效率,也减少了审批的人工成本和时间成本。附图说明图1为一个实施例中公司名称比对的方法的应用环境图;图2为一个实施例中公司名称比对的方法的流程示意图;图3为一个实施例中公司名称比对的方法的流程图;图4为另一个实施例中公司名称比对的示意图;图5为一个实施例中公司名称比对的装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的公司名称比对的方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104通过网络获取到用户通过终端102输入的公司名称作为第一名称,并从数据库中获取到与第一名称进行比对的第二名称。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种公司名称比对的方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤201,获取第一公司的第一名称和第二公司的第二名称。获取用户通过终端输入公司名称,可以将用户输入的公司名称作为第一名称,将数据库中预先存储的公司名称作为第二名称,以此对第一名称和第二名称进行比对。步骤202,对第一名称和第二名称进行预处理。在获取到第一名称和第二名称后,需要先对第一名称和第二名称进行预处理操作,再进行下一步具体的比对操作。在一个实施例中,对第一名称和第二名称进行预处理,包括:对第一名称和第二名称进行清洗,删除第一名称和第二名称中的特殊字符,特殊字符为除中文、英文以及数字之外的字符;将清洗后的第一名称和第二名称进行格式的统一。在对第一名称和第二名称进行预处理时,可以先对第一名称和第二名称进行清洗操作,即删除第一名称和第二名称中的特殊字符。特殊字符为除中文、英文以及数字之外的字符,比如标点符号、运算符号、下划线或横杠线等。即,清洗操作就是将第一名称和第二名称中的标点符号、运算符号、下划线或横杠线等特殊符号进行删除,只保留运算第一名称和第二名称中的中文、英文或数字,使得清洗后的第一名称和第二名称内容全部都是中文、英文或数字。然后,还可以对清洗后的第一名称和第二名称进行格式的统一,比如将进行繁体简体的转换,可以将第一名称和第二名称全部统一转换成简体格式。还可以将第一名称和第二名称中的中文数字统一转换成阿拉伯数字,将英文全部统一成小写格式,且将英文单词中的全角符号全部统一转换为半角符号,等本文档来自技高网...

【技术保护点】
1.一种公司名称比对的方法,其特征在于,所述方法包括:/n获取第一公司的第一名称和第二公司的第二名称;/n对所述第一名称和所述第二名称进行预处理;/n分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域;/n将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度;/n对各个区域的相似度进行加权求和,得到所述第一名称和所述第二名称的最终相似度;/n当所述最终相似度大于预设阈值时,所述第一公司和所述第二公司属于同一公司。/n

【技术特征摘要】
1.一种公司名称比对的方法,其特征在于,所述方法包括:
获取第一公司的第一名称和第二公司的第二名称;
对所述第一名称和所述第二名称进行预处理;
分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域;
将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度;
对各个区域的相似度进行加权求和,得到所述第一名称和所述第二名称的最终相似度;
当所述最终相似度大于预设阈值时,所述第一公司和所述第二公司属于同一公司。


2.根据权利要求1所述的方法,其特征在于,所述分别对预处理后的所述第一名称和所述第二名称进行分割,得到所述第一名称和所述第二名称的各个区域,包括:
分别将预处理后的所述第一名称和第二名称分割成预设数量的区域,所述区域包括组织机构区域、行政划分区域、行业信息区域以及公司字号区域。


3.根据权利要求2所述的方法,其特征在于,在所述分别对预处理后的所述第一名称和所述第二名称进行分割,得到与所述第一名称和所述第二名称的各个区域之后,所述方法还包括:
将所述第一名称和所述第二名称的组织机构区域进行清除,对除所述组织机构区域以外的其他区域进行对比;
确定所述行政划分区域对应的行政相似度、行业信息区域对应的行业信息相似度以及公司字号区域对应的公司字号相似度。


4.根据权利要求3所述的方法,其特征在于,所述将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度,包括:
将所述第一名称与所述第二名称的行政划分区域进行对比,当所述第一名称与第二名称的行政划分区域一致时,则所述第一名称与所述第二名称的行政划分区域的相似度为第一行政相似度;
当所述第一名称与第二名称的行政划分区域不一致时,则所述第一名称与所述第二名称的行政划分区域的相似度为第二行政相似度;
当所述第一名称与第二名称的行政划分区域至少有一个为空时,则所述第一名称与所述第二名称的行政划分区域的相似度为第三行政相似度。


5.根据权利要求3所述的方法,其特征在于,所述将所述第一名称的区域与对应的所述第二名称的区域进行对比,得到各个区域的相似度,包括:
...

【专利技术属性】
技术研发人员:林建明王文杰
申请(专利权)人:深圳无域科技技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1