System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 地址资源匹配方法、装置、计算机设备和存储介质制造方法及图纸_技高网

地址资源匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40247588 阅读:7 留言:0更新日期:2024-02-02 22:43
本申请涉及计算机与人工智能技术领域,特别是涉及一种地址资源匹配方法、装置、计算机设备和存储介质。该方法包括:根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址;将候选坐标地址输入至文本地址匹配模型中,得到文本地址匹配模型输出的候选坐标地址对应的候选地址文本表示;根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址。本申请能够提高地址资源匹配准确度和效率。

【技术实现步骤摘要】

本申请涉及计算机与人工智能,特别是涉及一种地址资源匹配方法、装置、计算机设备和存储介质


技术介绍

1、经常出现非大众化的兴趣点(poi(point of interest,poi)是一种代表真实地理的点状数据,poi一般包括名称、类别、经纬度、地址等基本信息,它可以代表人们感兴趣的实体如酒店、景点等。伴随着大数据与基于位置服务的电子地图的发展,网络上poi数据也出现了快速增长,以兴趣点表示的空间数据逐渐受到关注。poi对面向用户的人地关系研究有着重要的意义,作为地名地址库的重要组成部分,为智慧城市的发展提供服务;

2、当前在一线电信业务中往往会遇到以下问题:由于办理业务时用户提供的地址信息不规范,导致系统地址资源无法自动匹配用户提供的地址,从而可能出现“一址多名”的情况,即一个地址对应多个名称。这种情况可能会增加一线员工的工作量,降低工作效率。

3、为了解决该问题,一种方法是进行人工地址匹配,这种方法准确率高但需耗费大量时间;另外一种方法是利用机器学习或深度学习技术对地址文本表示进行相似度匹配,但这种方法却始终难以达到较高的准确率,且在时间上无法满足对于大规模地址的匹配的需求。

4、因此,对于大规模地址匹配问题,仍存在耗时高的问题,故,亟需改进。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高地址资源匹配准确度和效率的地址资源匹配方法、装置、计算机设备和存储介质。

2、第一方面,本申请提供了一种地址资源匹配方法,该方法包括:

3、根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址;

4、将候选坐标地址输入至文本地址匹配模型中,得到文本地址匹配模型输出的候选坐标地址对应的候选地址文本表示;

5、根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址。

6、在其中一个实施例中,根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址,包括:

7、在地图的各坐标地址中,确定与用户坐标地址之间曼哈顿距离小于距离阈值的相似坐标地址;

8、将相似坐标地址,作为与用户坐标地址在空间上满足相似性条件的候选坐标地址。

9、在其中一个实施例中,文本地址匹配模型采用如下方式训练得到:

10、确定地址库中各真实坐标地址对应的真实地址文本表示,并将各真实坐标地址和各真实坐标地址对应的真实地址文本表示作为训练样本;

11、采用训练样本,对初始模型进行训练,得到文本地址匹配模型。

12、在其中一个实施例中,确定地址库中各真实坐标地址对应的真实地址文本表示,包括:

13、针对地址库中任一真实坐标地址,对该真实坐标地址对应的真实文本地址进行文本分词处理,得到各词语;

14、对各词语进行量化处理,得到该真实坐标地址的真实地址文本表示。

15、在其中一个实施例中,对各词语进行量化处理,得到该真实坐标地址的真实地址文本表示,包括:

16、采用词频逆文档频率算法,对各词语进行量化处理,得到各词语的向量化表示;

17、根据各词语在真实文本地址中的位置,对各词语的向量化表示进行拼接,得到该真实坐标地址的真实地址文本表示。

18、在其中一个实施例中,若候选坐标地址的数量为至少两个,则根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址,包括:

19、针对每一候选坐标地址对应的候选坐标地址文本表示,确定候选地址文本表示与地址库中各真实地址文本表示之间的相似度,并将相似度最大的真实地址文本表示所对应的真实坐标地址,作为备用坐标地址;

20、从各备用坐标地址中,选择用户坐标地址在地址库中匹配的真实坐标地址。

21、第二方面,本申请还提供了一种地址文本匹配装置,该装置包括:

22、预筛选模块,用于根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址;

23、地址文本表示模块,用于将候选坐标地址输入至文本地址匹配模型中,得到文本地址匹配模型输出的候选坐标地址对应的候选地址文本表示;

24、匹配模块,用于根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址。

25、第三方面,本申请还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:

26、根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址;

27、将候选坐标地址输入至文本地址匹配模型中,得到文本地址匹配模型输出的候选坐标地址对应的候选地址文本表示;

28、根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址。

29、第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

30、根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址;

31、将候选坐标地址输入至文本地址匹配模型中,得到文本地址匹配模型输出的候选坐标地址对应的候选地址文本表示;

32、根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址。

33、第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

34、根据待匹配的用户坐标地址,从地图中确定与用户坐标地址在空间上满足相似性条件的候选坐标地址;

35、将候选坐标地址输入至文本地址匹配模型中,得到文本地址匹配模型输出的候选坐标地址对应的候选地址文本表示;

36、根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址。

37、上述地址资源匹配方法、装置、计算机设备和存储介质,在用户提供的用户坐标地址匹配不规范的情况下,本申请中从地图中选择多个候选坐标地址,目的是对用户坐标地址在预设相似范围内进行拓展,在空间维度上,通过拓展出的多个候选坐标地址来与地址库中的各真实地址进行匹配,提高匹配成功的准确度;在文本维度上,通过文本地址匹配模型确定各候选坐标地址对应的候选地址文本表示,再根据候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定用户坐标地址在地址库中匹配的真实坐标地址;本申请通过空间维度和文本维度的两次筛选,提高了匹配准确度,且匹本文档来自技高网...

【技术保护点】

1.一种地址资源匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据待匹配的用户坐标地址,从地图中确定与所述用户坐标地址在空间上满足相似性条件的候选坐标地址,包括:

3.根据权利要求1所述的方法,其特征在于,所述文本地址匹配模型采用如下方式训练得到:

4.根据权利要求3所述的方法,其特征在于,所述确定所述地址库中各真实坐标地址对应的真实地址文本表示,包括:

5.根据权利要求4所述的方法,其特征在于,所述对各词语进行量化处理,得到该真实坐标地址的真实地址文本表示,包括:

6.根据权利要求1所述的方法,其特征在于,若所述候选坐标地址的数量为至少两个,则所述根据所述候选地址文本表示与地址库中各真实地址文本表示之间的相似度,确定所述用户坐标地址在所述地址库中匹配的真实坐标地址,包括:

7.一种地址文本匹配装置,其特征在于,所述装置包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种地址资源匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据待匹配的用户坐标地址,从地图中确定与所述用户坐标地址在空间上满足相似性条件的候选坐标地址,包括:

3.根据权利要求1所述的方法,其特征在于,所述文本地址匹配模型采用如下方式训练得到:

4.根据权利要求3所述的方法,其特征在于,所述确定所述地址库中各真实坐标地址对应的真实地址文本表示,包括:

5.根据权利要求4所述的方法,其特征在于,所述对各词语进行量化处理,得到该真实坐标地址的真实地址文本表示,包括:

6.根据权利要求1所述的方法,其特征在于,若所述候选坐标地址的数量为至少两个,则...

【专利技术属性】
技术研发人员:张弛
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1