用于挖掘实体别名的方法、设备及电子设备技术

技术编号:15938830 阅读:36 留言:0更新日期:2017-08-04 21:43
本发明专利技术公开了一种用于挖掘实体别名的方法、设备及电子设备。该方法包括:获取目标实体的命名名称;根据命名规则,将命名名称分成实体名称和至少一个修饰部分,其中,所述实体名称直接表示该目标实体;以及将所述实体名称与所述至少一个修饰部分中的至少一个进行组合,以形成目标实体的至少一个实体别名。根据本发明专利技术的实施例,可以提升用户查询时的使用体验。

Method, apparatus and electronic device for mining entity aliases

The invention discloses a method, an apparatus and an electronic device for excavating an entity alias. The method includes: obtaining the target entity name; according to the naming rules, will be divided into the name of the entity name and at least one of which, the modified part, direct representation of the target entity entity name; and the name of the entity and the at least one modified part of at least one of the combination of at least one an entity alias to form the target entity. According to the embodiment of the invention, the user experience can be improved when a user inquires.

【技术实现步骤摘要】
用于挖掘实体别名的方法、设备及电子设备
本专利技术涉及数据处理
,更具体地,涉及一种用于挖掘实体别名的方法、设备及电子设备。
技术介绍
随着计算机技术以及互联网技术的发展,通过浏览器或者具有类似浏览器功能的应用程序访问互联网,以查询或者搜索与自己兴趣相关的实体(例如景点、餐馆、商品等)的信息,已经成为互联网用户日常生活中必不可少的一种信息获取方式。随着大数据时代的到来,如何在爆发式增长的大量数据中精准地获取与用户查询的实体对应的信息,是提升用户体验的关键。在目前一些通用的方法中,通常根据用户历史查询日志,挖掘与用户查询意图对应的实体的别名。以实体的别名进行查询,以期望提升用户对查询返回的信息的满意度。但是,随着垂直行业的发展,通用的别名挖掘方法不能有效地针对垂直行业的特点进行别名挖掘。这影响用户对查询信息的满意度。对于例如旅游类应用行业的某些垂直行业,旅游类实体的查询匹配和旅游类实体的数据整合都涉及别名挖掘。这里,垂直行业又称为细分行业。它指的是诸如旅游、视频、游戏等的某一类行业。垂直行业网站指的是针对某一类行业的网站,例如,视频网站、旅游网站、游戏网站等。因此,专利技术人认为,有必要对上述现有技术中存在的问题进行改进。
技术实现思路
本专利技术的一个目的是提供一种用于挖掘实体别名的新技术方案。根据本专利技术的第一方面,提供了一种用于挖掘实体别名的方法,包括:获取目标实体的命名名称;根据命名规则,将命名名称分成实体名称和至少一个修饰部分,其中,所述实体名称直接表示该目标实体;以及将所述实体名称与所述至少一个修饰部分中的至少一个进行组合,以形成目标实体的至少一个实体别名。优选地,所述实体别名还包括所述实体名称。优选地,所述修饰部分包括目标后缀词,以及向实体名称附加修饰词包括:获取与所述目标后缀词对应的同义后缀词;将所述实体名称与所述同义后缀词进行组合,以形成目标实体的至少一个实体别名。优选地,所述方法还包括:通过使用别名模式,基于所获取的用户原创内容,获取与所述实体名称对应的实体别名,其中,所述别名模式是表明实体名称与实体别名的对应关系的模式。优选地,所述方法还包括:获取用户针对目标实体的多个查询条目;从最终的查询条目中获取所述实体名称;以及基于多个查询条目中的其他查询条目与所述最终的查询条目的区别,获取目标实体的至少一个实体别名。优选地,所述目标实体是旅游实体,所述实体名称是景点名称,所述至少一个修饰部分包括位置信息和旅游后缀词,以及通过将位置信息和旅游后缀词中的至少一个与景点名称进行组合,形成旅游实体的旅游别名。优选地,旅游实体的旅游别名还包括所述景点名称。优选地,向实体名称附加修饰词包括:获取与所述旅游后缀词对应的同义后缀词;将所述景点名称与所述同义后缀词进行组合,以形成旅游实体的至少一个旅游别名。优选地,所述方法还包括:通过使用别名模式,基于所获取的用户原创内容,获取与所述旅游景点对应的旅游别名,其中,所述别名模式是表明旅游别名与旅游景点的对应关系的模式。优选地,所述方法还包括:获取用户针对旅游实体的多个查询条目;从最终的查询条目中获取所述景点名称;以及基于多个查询条目中的其他查询条目与所述最终的查询条目的区别,获取旅游实体的至少一个旅游别名。根据本专利技术的第二方面,提供了一种用于挖掘实体别名的设备,包括:用于获取目标实体的命名名称的装置;用于根据命名规则将命名名称分成实体名称和至少一个修饰部分的装置,其中,所述实体名称直接表示该目标实体;以及用于将所述实体名称与所述至少一个修饰部分中的至少一个进行组合以形成目标实体的至少一个实体别名的装置。根据本专利技术的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行根据任意一个实施例所述的方法。通过本专利技术的实施例,可以提供一种扩展实体别名,从而提升用户查询时的使用体验。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1示出了根据本专利技术的一个实施例的用于挖掘实体别名的方法的流程图。图2示出了根据本专利技术的一个实施例的电子设备的示意性框图。图3示出了可以应用本专利技术的一个实施例的示意性网络的例子。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。下面,参照附图说明根据本专利技术的各个实施例和例子。<方法>图1示出了根据本专利技术的一个实施例的用于挖掘实体别名的方法的流程图。在步骤S1100,获取目标实体的命名名称。例如,所述目标实体是旅游实体。例如,所述命名名称是“杭州西湖旅游风景区”。在步骤S1200,根据命名规则,将命名名称分成实体名称和至少一个修饰部分,其中,所述实体名称直接表示该目标实体。例如,在旅游实体的情况下,所述实体名称是景点名称,例如,“西湖”。例如,所述至少一个修饰部分包括位置信息和旅游后缀词,例如,“杭州”、“旅游风景区”。在步骤S1300,将所述实体名称与所述至少一个修饰部分中的至少一个进行组合,以形成目标实体的至少一个实体别名。例如,在旅游实体的情况下,可以通过将位置信息和旅游后缀词中的至少一个与景点名称进行组合,形成旅游实体的旅游别名。例如,“杭州西湖旅游风景区”的旅游别名可以包括“杭州西湖”、“西湖旅游风景区”。此外,所述实体别名还可以包括所述实体名称本身。例如,在旅游实体的情况下,旅游实体的旅游别名还包括所述景点名称。例如,“杭州西湖旅游风景区”的旅游别名可以包括“西湖”。在一个例子中,所述修饰部分包括目标后缀词。可以获取与所述目标后缀词对应的同义后缀词。通过将所述实体名称与所述同义后缀词进行组合,以形成目标实体的至少一个实体别名。例如,目标后缀词“旅游风景区”的同义词包括“风景区”、“景区”、“风景名胜区”等。因此,“杭州西湖旅游风景区”的旅游别名还可以包括“杭州西湖风景区”、“杭州西湖景区”、“杭州西湖风景名胜区”等。例如,在旅游实体的情况下,可以获取与所述旅游后缀词对应的同义后缀词;将所述景点名称与所述同义后缀词进行组合,以形成旅游实体的至少一个旅游别名。在另一个例子中,可以通过使用别名模式,基于所获取的用户原创内容,获取与所述实体名称对应的实体别名。所述别名模式是表明实体名称与实体别名的对应关系的模式。目前,许多用户将自己对某些事物的解释发布到网络中的网站上,例如,知乎、百度知道等网站。用户所发布的这些内容被称为用户原创内本文档来自技高网...
用于挖掘实体别名的方法、设备及电子设备

【技术保护点】
一种用于挖掘实体别名的方法,包括:获取目标实体的命名名称;根据命名规则,将命名名称分成实体名称和至少一个修饰部分,其中,所述实体名称直接表示该目标实体;以及将所述实体名称与所述至少一个修饰部分中的至少一个进行组合,以形成目标实体的至少一个实体别名。

【技术特征摘要】
1.一种用于挖掘实体别名的方法,包括:获取目标实体的命名名称;根据命名规则,将命名名称分成实体名称和至少一个修饰部分,其中,所述实体名称直接表示该目标实体;以及将所述实体名称与所述至少一个修饰部分中的至少一个进行组合,以形成目标实体的至少一个实体别名。2.根据权利要求1所述的方法,其中,所述实体别名还包括所述实体名称。3.根据权利要求1所述的方法,其中,所述修饰部分包括目标后缀词,以及向实体名称附加修饰词包括:获取与所述目标后缀词对应的同义后缀词;将所述实体名称与所述同义后缀词进行组合,以形成目标实体的至少一个实体别名。4.根据权利要求1所述的方法,其中,所述方法还包括:通过使用别名模式,基于所获取的用户原创内容,获取与所述实体名称对应的实体别名,其中,所述别名模式是表明实体名称与实体别名的对应关系的模式。5.根据权利要求1所述的方法,其中,所述方法还包括:获取用户针对目标实体的多个查询条目;从最终的查询条目中获取所述实体名称;以及基于多个查询条目中的其他查询条目与所述最终的查询条目的区别,获取目标实体的至少一个实体别名。6.根据权利要求1所述的方法,其中,所述目标实体是旅游实体,所述实体名称是景点名称,所述至少一个修饰部分包括位置信息和旅游后缀词,以及通过将位置信息和旅游后缀词中的至少一个与景点名称...

【专利技术属性】
技术研发人员:王刚李前令叶新
申请(专利权)人:广州神马移动信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1