System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据库的构建方法、装置、系统、可读存储介质及芯片制造方法及图纸_技高网

数据库的构建方法、装置、系统、可读存储介质及芯片制造方法及图纸

技术编号:42505931 阅读:6 留言:0更新日期:2024-08-22 14:20
本申请提供了一种数据库的构建方法、装置、系统、可读存储介质及芯片,该方法包括:获取多个POI数据和多个工商企业数据;将多个POI数据与多个工商企业数据进行关联匹配,获得待校验数据集;利用运单数据集对待校验数据集中的每个POI数据的地址和每个工商企业数据的地址进行校验,获得每个POI数据的地址的第一校验分值和每个工商企业数据的地址的第二校验分值;利用待校验数据集、每个POI数据的地址的第一校验分值和每个工商企业数据的地址的第二校验分值,构建POI‑工商企业信息数据库。上述方法得到的POI‑工商企业信息数据库,可以提供POI数据和工商企业数据的关联数据,并且给出POI数据的地址和工商企业数据的地址的准确度值。

【技术实现步骤摘要】

本申请属于计算机,尤其涉及一种数据库的构建方法、装置、系统、可读存储介质及芯片


技术介绍

1、随着互联网电子地图服务与lbs(location based services,基于位置的服务)的普及,poi(point of interest,兴趣点)数据的应用越来越广泛。poi数据泛指互联网电子地图中的点类数据,例如网约车平台提供的上车点,o2o(online to offline,线上线下电子商务)行业提供的推荐收货地址等;一个poi数据可以包括名称、地址、坐标、电话、类型等信息。另外,当前公开的工商企业信息会公开企业的一些相关注册信息,例如注册地址、信用代码、法人、联系电话等。

2、可以理解的是,在一些情况下用户需要获得poi数据和工商企业的对应关系,但是目前公开的数据库中不存在poi数据和工商企业信息的关联数据。因此,当前公开数据库中poi数据和工商企业信息的关联数据的缺失难以满足用户的需求。另外,目前公开数据库中的poi数据的地址信息和工商企业信息中的地址信息经常存在准确性不够的问题,而用户根据当前的数据库难以确定地址信息的准确性。


技术实现思路

1、本申请实施例提供了一种数据库的构建方法、装置、系统、可读存储介质及芯片,可以提供poi数据和工商企业数据的关联数据,并且给出poi数据的地址和工商企业数据的地址的准确度值。

2、第一方面,本申请实施例提供了一种数据库的构建方法,该方法包括:获取多个poi数据和多个工商企业数据;将多个poi数据与多个工商企业数据进行关联匹配,获得待校验数据集,待校验数据集包括:相互匹配的一个poi数据和一个工商企业数据组成的数据对、未匹配到工商企业数据的poi数据、或者未匹配到poi数据的工商企业数据中的一个或多个;利用运单数据集对待校验数据集中的每个poi数据的地址和每个工商企业数据的地址进行校验,获得每个poi数据的地址的第一校验分值和每个工商企业数据的地址的第二校验分值;利用待校验数据集、每个poi数据的地址的第一校验分值和每个工商企业数据的地址的第二校验分值,构建poi-工商企业信息数据库。

3、第一方面数据库的构建方法中,多个poi数据和多个工商企业数据均是从公开数据库获得的数据,在获得的poi-工商企业信息数据库中,既有poi数据和工商企业数据的关联关系,使得用户可以快速确定感兴趣的工商企业所对应的poi数据,进而可以根据poi数据来进行业务处理,例如营销拓客或者营销推广信息发送等;另外,数据库的构建方法还采用运单数据对poi数据的地址和工商企业数据的地址均进行了校验,第一校验分值和第二校验分值可以表明对应的地址的准确性,从而使得用户可以根据数据库的内容来判断感兴趣的poi数据或工商企业数据的地址的准确性,用户可以选择准确度较高的地址进行业务处理,从而使得业务处理更加精准,例如可以使得用户营销拓客的目标更加准确、营销推广信息的触达率更高等。

4、在第一方面的一种可能的实现方式中,poi-工商企业信息数据库中还包括每个poi数据的父级关系,第一poi数据的父级关系包括第一poi数据存在的至少一级父级poi数据,第一poi数据为多个poi数据中的任意一个。在该实现方式中,通过在poi-工商企业信息数据库设置每个poi数据的父级关系,使得poi数据之间的关联关系更加明确,从而可以增强poi数据中的地址信息的可解释性以及地理范围的准确度。

5、在第一方面的一种可能的实现方式中,方法还包括:从多个poi数据中确定出疑似父级poi集合,疑似父级poi集合包括第二poi数据和poi类型为楼宇、园区、住宅区或者商区的poi数据,第二poi数据包括:每个父级id所对应的poi数据,多个poi数据中的至少部分poi数据分别包括父级id;根据多个poi数据和疑似父级poi集合,确定多个poi数据中的每个poi数据的父级关系。在该实现方式中,首先确定疑似父级poi集合,再根据疑似父级poi集合来确定每个poi数据的父级关系,通过疑似父级poi集合来限制数据的量级,保证计算性能。

6、在第一方面的一种可能的实现方式中,根据多个poi数据和疑似父级poi集合,确定多个poi数据中的每个poi数据的父级关系,包括:根据多个poi数据中的每个poi数据对应的省市区和/或aoi信息,与疑似父级poi集合中的每个poi数据对应的省市区和/或aoi信息,从疑似父级poi集合中,确定多个poi数据中的每个poi数据的疑似父级poi子集,其中疑似父级poi子集包括每个poi数据的至少一个疑似父级poi数据;根据每个poi数据的疑似父级poi子集,确定每个poi数据的一级父级关系;根据多个poi数据中每个poi数据的一级父级关系,确定每个poi数据的多级父级关系。在该实现方式中,通过为每个poi数据限定一个疑似父级poi子集,将每个poi数据和疑似父级poi数据限定在一个的更小的范围内,方便后续对该父级关系的准确度进行进一步确定;同时通过疑似父级poi子集来进一步限制数据的量级,保证计算性能。

7、在第一方面的一种可能的实现方式中,根据每个poi数据的疑似父级poi子集,确定每个poi数据的一级父级关系,包括:若第一疑似父级poi数据的类型为预设类型和/或对应的经纬度距离小于预设值,则确定第一疑似父级poi数据属于第一集合,第一疑似父级poi数据为第一poi数据的疑似父级poi子集中的任意一个疑似父级poi数据,经纬度距离为第一疑似父级poi数据和第一poi数据的经纬度距离;根据第一集合中的每个疑似父级poi数据的地址与第一poi数据的地址的相似度,确定第一poi数据的一级父级poi数据。

8、在第一方面的一种可能的实现方式中,第三poi数据为所述多个poi数据中任意一个包括数据id和父级id的poi数据,第三poi数据的父级关系包括m级父级关系,m为大于或者等于2的正整数;第三poi数据的m父级关系是以第三poi数据的数据id和父级id为关联键,采用自连接的方式对第三poi数据组成的数据集进行m-1次关联来确定的。该实施方式中,用自连接的方式对数据集进行多次关联,对每一个第三poi数据的父级关系进行溯源,明确各级poi数据的从属关系,强化poi数据的定位价值。

9、在第一方面的一种可能的实现方式中,将多个poi数据与多个工商企业数据进行关联匹配,获得待校验数据集,包括:利用信用代码、全名称、联系信息和地理位置范围中的任一维度,将第一poi数据与多个工商企业数据中的每个工商企业数据进行匹配,确定第一poi数据的疑似工商企业数据集合,第一poi数据为多个poi数据中的任意一个;将第一poi数据与第一poi数据的疑似工商企业数据集合中的每个疑似工商企业数据,进行地址和名称的匹配,获得与第一poi数据对应的匹配结果;根据多个匹配结果,确定待校验数据集。该实现方式中,通过构建poi数据和疑似工商企业数据集合,将poi数据和工商企业数据的对应关系限定在一定的范围内,方便后续对该对应关系的准确度进行进一步的本文档来自技高网...

【技术保护点】

1.一种数据库的构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述POI-工商企业信息数据库中还包括每个POI数据的父级关系,第一POI数据的父级关系包括所述第一POI数据存在的至少一级父级POI数据,所述第一POI数据为所述多个POI数据中的任意一个。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述多个POI数据和所述疑似父级POI集合,确定所述多个POI数据中的每个POI数据的父级关系,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述每个POI数据的疑似父级POI子集,确定所述每个POI数据的一级父级关系,包括:

6.根据权利要求2所述的方法,其特征在于,第三POI数据为所述多个POI数据中包括数据ID和父级ID的任意一个,所述第三POI数据的父级关系包括M级父级关系,M为大于或者等于2的正整数;所述第三POI数据的M父级关系是以所述第三POI数据的数据ID和父级ID为关联键,采用自连接的方式进行M-1次关联来确定的。

7.根据权利要求1至6任一项所述的方法,其特征在于,所述将多个POI数据与多个工商企业数据进行关联匹配,获得待校验数据集,包括:

8.根据权利要求7所述的方法,其特征在于,不同匹配维度的匹配优先级不同,在将第一POI数据与所述多个工商企业数据中的每个工商企业数据进行匹配时,按照匹配优先级由高到低的顺序逐个匹配维度进行匹配,当第一POI数据在一个匹配维度匹配到至少一个疑似工商企业数据时,则不再进行其他匹配维度的匹配。

9.根据权利要求8所述的方法,其特征在于,所述将所述第一POI数据与所述第一POI数据的疑似工商企业数据集合中的每个疑似工商企业数据,进行地址和名称的匹配,获得与所述第一POI数据对应的匹配结果,包括:

10.根据权利要求9所述的方法,其特征在于,所述信用代码、所述全名称、所述联系信息和所述地理位置范围的匹配优先级逐渐降低;

11.根据权利要求1至6任一项所述的方法,其特征在于,所述利用运单数据集对所述待校验数据集中的每个POI数据的地址进行校验,获得每个POI数据的地址的第一校验分值,包括:

12.根据权利要求11所述的方法,其特征在于,若所述每个POI数据和所述第一运单数据的匹配方式为全名称匹配,则所述第一运单数据的校验分值根据下式获得:

13.一种数据库的构建装置,其特征在于,所述装置包括用于执行如权利要求1至12中任一项所述的方法的各个步骤的单元。

14.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至12中任一项所述方法的步骤。

15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序或指令,当计算机读取并执行所述计算机程序或指令时,使得计算机执行如权利要求1至12中任一项所述的方法。

16.一种芯片,其特征在于,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的计算机设备执行如权利要求1至12中任一项所述的方法。

...

【技术特征摘要】

1.一种数据库的构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述poi-工商企业信息数据库中还包括每个poi数据的父级关系,第一poi数据的父级关系包括所述第一poi数据存在的至少一级父级poi数据,所述第一poi数据为所述多个poi数据中的任意一个。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述多个poi数据和所述疑似父级poi集合,确定所述多个poi数据中的每个poi数据的父级关系,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述每个poi数据的疑似父级poi子集,确定所述每个poi数据的一级父级关系,包括:

6.根据权利要求2所述的方法,其特征在于,第三poi数据为所述多个poi数据中包括数据id和父级id的任意一个,所述第三poi数据的父级关系包括m级父级关系,m为大于或者等于2的正整数;所述第三poi数据的m父级关系是以所述第三poi数据的数据id和父级id为关联键,采用自连接的方式进行m-1次关联来确定的。

7.根据权利要求1至6任一项所述的方法,其特征在于,所述将多个poi数据与多个工商企业数据进行关联匹配,获得待校验数据集,包括:

8.根据权利要求7所述的方法,其特征在于,不同匹配维度的匹配优先级不同,在将第一poi数据与所述多个工商企业数据中的每个工商企业数据进行匹配时,按照匹配优先级由高到低的顺序逐个匹配维度进行匹配,当第一poi数据在一个匹配维度匹配到至少一个疑似工商企业数据时,则...

【专利技术属性】
技术研发人员:蓝嘉文余电
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1