本申请提供一种发现新路名的方法,包括:从地址库中获取包括路名的地址;通过对所述地址进行分词,获得对应于所述地址的使用路名;如果所述使用路名不同于已有的路名,则所述使用路名为新路名。通过本申请的技术方案,为在地图上标示自动发现的新路提供了基础,加快了提高地图完备性和用户便利性的速度。
【技术实现步骤摘要】
本申请涉及数据处理
,尤其涉及一种发现新路名的方法和装置。
技术介绍
一般的道路地图是由测绘人员在对道路进行测绘后制成的。测绘人员驾驶带有GPS(GlobalPositioningSystem,全球定位系统)的地图车在被测绘的道路上来回行驶,利用GPS上传的数据、结合途中采集的周边信息来生成地图上的道路路径,并按照市政对道路的命名来标注路名。由于道路始终随着经济的发展处在不断更新的过程中,经常有新路出现,而专业的道路测绘往往在时间上滞后太多;另外,对一些偏远地区的道路,出于道路的利用率和测绘成本考虑可能不会进行专业测绘。现有技术中,可以利用车辆、行人等的定位数据来发现地图上未标示的道路,但是仍然需要人工来向市政查询这些道路的路名,使得地图上道路的命名严重滞后,对于需要通过道路名称来使用这些道路的情况,比如对要寻找这些道路上的商户或住房的用户来说,在相当长的时间里仍然极为不便。
技术实现思路
有鉴于此,本申请提供一种发现新路名的方法,包括:从地址库中获取包括路名的地址;通过对所述地址进行分词,获得对应于所述地址的使用路名;如果所述使用路名不同于已有的路名,则所述使用路名为新路名。本申请还提供了一种发现新路名的装置,包括:地址获取单元,用于从地址库中获取包括路名的地址;使用路名单元,用于通过对所述地址进行分词,获得对应于所述地址的使用路名;新路名单元,用于在所述使用路名不同于已有的路名时,以所述使用路名为新路名。由以上技术方案可见,本申请的实施例通过对地址库中的地址进行分词,得到对应于地址的使用路名,从中发现不同于已有路名的新路名,为在地图上标示自动发现的新路提供了基础,加快了提高地图完备性和用户便利性的速度。附图说明图1是本申请实施例一中一种发现新路名的方法的流程图;图2是本申请实施例二中一种发现新路名的方法的流程图;图3是本申请实施例二中一种发现新路路径的方法的流程图;图4是本申请应用示例中所使用的数据库以及数据处理过程的示意图;图5是应用本申请实施例的设备的一种硬件结构图;图6是本申请实施例中的一种发现新路名的装置的逻辑结构图。具体实施方式当新建道路、或偏远地区道路周边的商户或住户进行商业活动或处理生活事项时,经常需要留下自己的地址,这些包括新路名的地址会出现在各种地址库中。本申请的实施例提出一种发现新路名的方法,利用在地址库中这些地址来进行新路名的自动发现,加快了对地图上的新道路进行名称标注,以解决现有技术存在的问题。本申请的实施例可以应用在任何具有运算功能的设备上,其中实施例一的流程如图1所示。步骤110,从地址库中获取包括路名的地址。地址库可以是各种保存有地址的数据库,例如,包括收货地址的电商数据库、快递公司包括取件地址的发件人信息数据库和包括送件地址的收件人信息数据库、注册信息包括地址的注册用户信息数据库等等,本申请的实施例中不做限定。如果地址库中的地址可能存在不包括路名的情况(例如,北京市朝阳区潘家园南里50号楼908,在市辖区后直接以小区名称定位,地址中不出现道路名称),则可以通过在地址中查找是否包括在命名道路时所使用的关键字等方式来去除不包括路名的地址。步骤120,通过对所获取的地址进行分词,获得对应于该地址的使用路名。可以采用各种分词技术来对步骤110中所获取的地址进行分词,例如,最少切分法、双向最大匹配法等,本实施例中对所采用的分词算法不做限定。在分词结果中能够得到该地址中的路名。可以将该地址中的路名作为对应于该地址的使用路名,也可以先对该地址中的路名进行纠错后得到对应于所述地址的使用路名。由于填写地址的用户可能因打字错误、记忆偏差等原因输入有误的路名,采用后一种方式能够提高自动发现新路名的准确性。需要说明的是,由于对路名纠错时只能采用已有路名作为正确值,而地址中的路名可能是尚未包括在已有路名中的新路名,如果地址中的路名与已有路名不同,既可能是因为地址中的路名是新路名,也可能是因为地址中的路名是错误的已有路名。纠错的结果不是把所有与已有路名不同的地址中的路名更改为正确值(即已有路名),而是筛选出地址中的路名是错误的已有路名的概率超过一定程度的情况,将这种情况下的地址中的路名修改为已有路名。因此,可以根据道路的变化程度、对新路名的准确度要求等实际应用环境的需要来决定所采用的纠错方式。一种实现方式中,可以采用如下的纠错方式:如果地址中的路名与已有路名相同,则以地址中的路名作为对应于该地址的使用路名;如果地址中的路名不同于已有路名并且不存在与地址中的路名在一定编辑距离(editdistance)内的已有路名,则以地址中的路名作为对应于该地址的使用路名;如果地址中的路名不同于已有路名并且存在与地址中的路名在一定编辑距离内的已有路名(称为候选纠错结果),则根据地址中的路名与候选纠错结果之间的编辑距离、候选纠错结果的词频、和/或候选纠错结果在该地址中的上下文概率,在地址中的路名、候选纠错结果中选择其一来作为对应于该地址的使用路名。这种实现方式中,编辑距离是将地址中的路名修改为候选纠错结果时所需要进行的编辑操作次数,确定中文词语之间的编辑距离可以考虑所采用的输入法。编辑距离越小,候选纠错结果的词频越高,地址中的路名属于错误输入的可能性越高;此外,路名在地址中的上下文也可以作为判断可能性的参考,例如,地址为杭州市西湖区文一路888号,地址中的路名为文一路,而文一西路在上文为“西湖区”、下文为“888号”之间出现的概率越高,意味着文一路属于错误输入了文一西路的可能性越高。因此,可以采用编辑距离、候选纠错结果的词频、候选纠错结果在地址中的上下文概率中的一个或者多个的组合作为条件,来判断将地址中的路名和一个至多个候选纠错结果中的哪一个作为使用路名。其中,候选纠错结果的词频、候选纠错结果在地址中的上下文概率可以经过对高质量语料库的统计来得到。步骤130,如果所述使用路名不同于已有的路名,则所述使用路名为新路名。将不同于已有路名、并且已经在地址库中出现的使用路名,作为新路名。本实施例中,通过对地址库中的地址进行分词来获得使用路名,并且将不同于已有路名的使用路名作为新路名,为在地图上标示自动发现的新路提供了基础,提高了完善地图的速度,使得用户能够更快的从更加完备的地图中获得便利。在本申请的实施例二中,对发现的新路路径,利用发现的新路名为其命名,从而自动完成新路路径的发现和命名。其流程如图2所示。步骤210,从地址库中获取包括路名的地址。步骤220,通过对所获取的地址进行分词,获得对应于该地址的使用路名。步骤230,如果所述使用路名不同于已有的路名,则所述使用路名为新路名。对上述三个步骤的详细描述请参见实施例一,不再重复。步骤240,利用定位终端的运动轨迹进行新路路径的发现。定位终端包括各种通过不同定位技术将位置信息上传给定位服务器的移动设备,例如车载定位仪、手机、平板电脑等,所采用的定位技术如GPS、LBS(LocationBasedService,移动位置服务)等。定位服务器上定位终端上传的位置和时间信息反映了定位终端的运动轨迹,利用车辆和/或行人的运动轨迹,可以进行新路路径的自动发现。本步骤可以采用各种现有技术中发现新路路径的方法,本实施例不做限定。需要说明的是,步骤本文档来自技高网...
【技术保护点】
一种发现新路名的方法,其特征在于,包括:从地址库中获取包括路名的地址;通过对所述地址进行分词,获得对应于所述地址的使用路名;如果所述使用路名不同于已有的路名,则所述使用路名为新路名。
【技术特征摘要】
1.一种发现新路名的方法,其特征在于,包括:从地址库中获取包括路名的地址;通过对所述地址进行分词,获得对应于所述地址的使用路名;如果所述使用路名不同于已有的路名,则所述使用路名为新路名。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用定位终端的运动轨迹进行新路路径的发现;将所述新路路径一定距离内的地址对应的新路名作为所述新路路径的名称。3.根据权利要求2所述的方法,其特征在于,所述将新路路径一定距离内的地址对应的新路名作为所述新路路径的名称,包括:根据新路名对应的地址与所述新路路径的距离远近、以及新路名的个数,给出所述新路路径的可能路名和概率。4.根据权利要求2所述的方法,其特征在于,所述利用定位终端的运动轨迹进行新路路径的发现,包括:将在已有路径之外的定位终端的运动轨迹作为候选序列;根据候选序列起点和终点确定候选序列的中心点,将中心点的距离在第一阈值范围内的候选序列汇集为簇;根据簇中候选序列之间的差异程度筛选出近似的候选序列;将所述近似的候选序列平均后得到新路路径。5.根据权利要求4所述的方法,其特征在于,所述根据簇中候选序列之间的差异程度筛选出近似的候选序列,包括:在每个候选序列上取N个离散点,每个候选序列上的第k个离散点具有相同的经度或纬度;N为自然数,k为1到N之间的自然数;对簇中的候选序列进行两两对比,将两个候选序列中具有相同的经度或纬度的离散点之间的距离加总后作为对比结果;根据所述对比结果筛选出近似的候选序列。6.根据权利要求2所述的方法,其特征在于,所述定位终端的运动轨迹为运行速度超过行车阈值的运动轨迹。7.根据权利要求1至6任意一项所述的方法,其特征在于,所述通过对地址进行分词,获得对应于所述地址的使用路名,包括:通过分词获得所述地址中的路名;对所述地址中的路名进行纠错后得到对应于所述地址的使用路名。8.根据权利要求7所述的方法,其特征在于,所述对地址中的路名进行纠错后得到对应于所述地址的使用路名,包括:当所述地址中的路名不同于已有路名时,如果不存在与所述地址中的路名在一定编辑距离内的已有路名,则以所述地址中的路名作为对应于所述地址的使用路名;如果存在,则根据所述地址中的路名与所述已有路名之间的编辑距离、所述已有路名的词频、和/或所述已有路名在所述地址中的上下文概率,在所述地址中的路名、所述已有路名中择一来作为对应于所述地址的使用路名。9.一种发现新路名的装置,其特征在于,包括:地址获取单元,用于从地...
【专利技术属性】
技术研发人员:王瑜,王瑞,叶舟,王金明,闵万里,傅巍伟,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。