酒店信息数据处理方法及装置制造方法及图纸

技术编号:34451357 阅读:13 留言:0更新日期:2022-08-06 16:52
本公开实施例公开了一种酒店信息数据处理方法及装置,包括将每个渠道提供的酒店信息数据标准化后,将预设渠道对应的标准化后的数据作为第一酒店信息数据,其中,所述标准化的过程包括提取酒店信息数据中位置信息、和酒店信息数据中的身份信息;遍历其他渠道提供的第二酒店信息数据,以针对每一条第二酒店信息数据确定与其最相似的第一酒店信息数据,其中,该条第二酒店信息数据与所述最相似的第一酒店信息数据合并为一条,最终得到酒店信息数据列表;如果接收到用户端发送的酒店信息数据查询请求后,从合并后的酒店信息数据中确定与该请求相匹配的目标酒店信息数据。降低了酒店信息的重复率,提高了查询效率。提高了查询效率。提高了查询效率。

【技术实现步骤摘要】
酒店信息数据处理方法及装置


[0001]本公开涉及数据处理
,具体涉及到一种酒店信息数据处理方法及装置。

技术介绍

[0002]商城系统可以实现为通过接口接入多个提供酒店数据的渠道供应商,而每个渠道供应商通常提供的酒店数据达到几十万到几百万,进而最终得到的酒店数据量大并且存在大量重复的酒店数据。大量重复的酒店信息数据对大量的服务器资源的占用率大,进而导致响应查询的效率低,以及对酒店信息数据的处理效率低。

技术实现思路

[0003]本公开的主要目的在于提供一种酒店信息数据处理方法及装置。
[0004]为了实现上述目的,根据本公开的第一方面,提供了一种酒店信息数据处理方法,包括:将每个渠道提供的酒店信息数据标准化后,将预设渠道对应的标准化后的数据作为第一酒店信息数据,其中,所述标准化的过程包括提取酒店信息数据中位置信息、和酒店的身份信息;遍历其他渠道提供的第二酒店信息数据,以针对每一条第二酒店信息数据确定与其最相似的第一酒店信息数据,其中,该条第二酒店信息数据与所述最相似的第一酒店信息数据合并为一条;被配置成如果接收到用户端发送的酒店信息数据查询请求后,从合并后的酒店信息数据中确定与该请求相匹配的目标酒店信息数据,其中,所述目标酒店信息数据在用户端可通过列表的形式进行展示。
[0005]可选地,方法还包括:针对每一条第二酒店信息数据从数据库中确定与其最相似的第一酒店信息数据包括:将第二酒店信息数据输入至预先建立的用于酒店信息数据合并的模型,以输出得到与每一条第二酒店信息数据最相似的第一酒店信息数据;其中,所述模型分别基于第一酒店信息数据的身份信息与第二酒店信息数据的身份信息的相似度、第一酒店信息数据的位置信息与第二酒店信息数据的位置信息的距离,确定与每一条第二酒店信息数据最相似的第一酒店信息数据。
[0006]可选地,模型包括:计算第一酒店信息数据的名称信息与第二酒店信息数据的名称信息的相似度,其中,所述相似度用于确定是否存在与第二酒店信息数据相同的第一酒店信息数据;和/或,如果存在,则对第一酒店信息数据的其他身份信息、与第一酒店信息数据相同的第二酒店信息数据的其他身份信息进行相似度计算,以确定是否仍存在与第二酒店信息数据相同的第一酒店信息数据;和/或,如果仍存在与第二酒店信息数据相同的第一酒店信息数据,则基于位置信息确定与第二酒店信息数据相似的第一酒店信息数据。
[0007]可选地,方法还包括:获取多渠道的酒店信息数据作为样本数据,以将所述样本数据输入至所述模型中,得到合并后的酒店信息数据;调整基于其他身份信息进行相似度计算的步骤、与基于位置信息确定与第二酒店信息数据相似的第一酒店信息数据的步骤的优先级,以得到所述模型的不同输出结果;基于所述不同输出结果的合并错误率,确定最优模型。
[0008]可选地,计算第一酒店信息数据的身份信息与第二酒店信息数据的身份信息的相似度包括:计算第一酒店信息数据的身份信息与第二酒店信息数据的身份信息的语义相似度、以及词序相似度。
[0009]可选地,计算第一酒店信息数据的位置信息与第二酒店信息数据的位置信息的距离包括:基于第一酒店信息数据的经纬位置、第二酒店信息数据的经纬位置,利用半正矢公式确定第一酒店与第二酒店之间距离,其中,将经线和纬线视为近似垂直的两条线,并基于此计算第一酒店和第二酒店之间距离。
[0010]根据本公开的第二方面,提供了一种酒店信息数据合并装置,包括:标准化单元,被配置成将每个渠道提供的酒店信息数据标准化后,将预设渠道对应的标准化后的数据作为第一酒店信息数据,其中,所述标准化的过程包括提取酒店信息数据中位置信息、和酒店的身份信息;数据合并单元,被配置成遍历其他渠道提供的第二酒店信息数据,以针对每一条第二酒店信息数据确定与其最相似的第一酒店信息数据,其中,该条第二酒店信息数据与所述最相似的第一酒店信息数据合并为一条;如果接收到用户端发送的酒店信息数据查询请求后,从合并后的酒店信息数据中确定与该请求相匹配的目标酒店信息数据,其中,所述目标酒店信息数据在用户端可通过列表的形式进行展示。
[0011]可选地,针对每一条第二酒店信息数据从数据库中确定与其最相似的第一酒店信息数据包括:将第二酒店信息数据输入至预先建立的用于酒店信息数据合并的模型,以输出得到与每一条第二酒店信息数据最相似的第一酒店信息数据;其中,所述模型分别基于第一酒店信息数据的身份信息与第二酒店信息数据的身份信息的相似度、第一酒店信息数据的位置信息与第二酒店信息数据的位置信息的距离,确定与每一条第二酒店信息数据最相似的第一酒店信息数据。
[0012]根据本公开的第三方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项实现方式所述的酒店信息数据处理方法。
[0013]根据本公开的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实现方式所述的酒店信息数据处理方法。
[0014]在本公开实施例酒店信息数据处理方法及装置中,包括将每个渠道提供的酒店信息数据标准化后,将预设渠道对应的标准化后的数据作为第一酒店信息数据,其中,所述标准化的过程包括提取酒店信息数据中位置信息、和酒店的身份信息;遍历其他渠道提供的第二酒店信息数据,以针对每一条第二酒店信息数据确定与其最相似的第一酒店信息数据,其中,该条第二酒店信息数据与所述最相似的第一酒店信息数据合并为一条,最终得到酒店信息数据列表。在处理酒店信息数据时,通过从多个维度来判断酒店是否是同一个,提高了酒店信息数据的识别精度、以及通过将识别出的同一个酒店信息数据进行合并,提高了查询效率,节约了服务端的计算资源。进而解决了相关技术中酒店信息数据查询效率低的技术问题。
附图说明
[0015]为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是根据本公开实施例的酒店信息数据处理方法流程图;
[0017]图2是根据本公开实施例的酒店信息数据处理方法的一个应用场景图;
[0018]图3是根据本公开实施例的酒店信息数据处理方法的另一个应用场景图;
[0019]图4是根据本公开实施例的电子设备的示意图。
具体实施方式
[0020]为了使本
的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种酒店信息数据处理方法,其特征在于,包括:对每个渠道提供的酒店信息数据标准化后,将预设渠道对应的标准化后的数据作为第一酒店信息数据,其中,所述标准化的过程包括提取酒店信息数据中的位置信息、和酒店信息数据中的身份信息;遍历其他渠道提供的第二酒店信息数据,以针对每一条第二酒店信息数据确定与其最相似的第一酒店信息数据,其中,该条第二酒店信息数据与所述最相似的第一酒店信息数据合并为一条;和/或,如果接收到用户端发送的酒店信息数据查询请求后,从合并后的酒店信息数据中确定与该请求相匹配的目标酒店信息数据,其中,所述目标酒店信息数据在用户端可通过列表的形式进行展示。2.根据权利要求1所述的酒店信息数据处理方法,其特征在于,针对每一条第二酒店信息数据从数据库中确定与其最相似的第一酒店信息数据包括:将第二酒店信息数据输入至预先建立的用于酒店信息数据合并的模型,以输出得到与每一条第二酒店信息数据最相似的第一酒店信息数据;其中,所述模型分别基于第一酒店信息数据的身份信息与第二酒店信息数据的身份信息的相似度、第一酒店信息数据的位置信息与第二酒店信息数据的位置信息之间的距离,确定与每一条第二酒店信息数据最相似的第一酒店信息数据。3.根据权利要求2所述的酒店信息数据处理方法,其特征在于,模型包括:计算第一酒店信息数据的名称信息与第二酒店信息数据的名称信息的相似度,其中,所述相似度用于确定是否存在与第二酒店信息数据相同的第一酒店信息数据;和/或,如果存在,则对第一酒店信息数据的其他身份信息、与第一酒店信息数据相同的第二酒店信息数据的其他身份信息进行相似度计算,以确定是否仍存在与第二酒店信息数据相同的第一酒店信息数据;和/或,如果仍存在与第二酒店信息数据相同的第一酒店信息数据,则基于位置信息确定与第二酒店信息数据相似的第一酒店信息数据。4.根据权利要求3所述的酒店信息数据处理方法,其特征在于,方法还包括:获取多渠道的酒店信息数据作为样本数据,以将所述样本数据输入至所述模型中,得到合并后的酒店信息数据;调整基于其他身份信息进行相似度计算的步骤、与基于位置信息确定与第二酒店信息数据相似的第一酒店信息数据的步骤的优先级,以得到所述模型的不同输出结果;基于所述不同输出结果的合并错误率,确定最优模型。5.根据权利要求2所述的酒店信息数据处理方法,其特征在于,计算第一酒店信息数据的身份信息与第二酒店信息数据的身份信息...

【专利技术属性】
技术研发人员:马春荃俞德明王秘
申请(专利权)人:北京合思信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1