【技术实现步骤摘要】
一种处理实体模型描述信息的方法及装置
[0001]本申请涉及信息处理的领域,具体而言,涉及一种处理实体模型描述信息的方法及装置。
技术介绍
[0002]目前,在搜索实体模型时,主要通过对比实体模型的描述信息和用户的搜索信息的文本相似度,将实体模型进行排序来为用户的搜索信息匹配对应的实体模型。
[0003]但是,在上述匹配的过程中由于实体模型的描述信息的不足、描述不准确或者实体模型中子实体的描述信息不足或者描述不准确,导致最终匹配的实体模型不准确或者实体模型中的子实体模型不是用户所搜索的。
[0004]因此,如何准确的搜索实体模型,是一个需要解决的技术问题。
技术实现思路
[0005]本申请实施例的目的在于提供一种处理实体模型描述信息的方法,通过本申请的实施例的技术方案可以达到准确的搜索实体模型的效果。
[0006]第一方面,本申请实施例提供了一种处理实体模型描述信息的方法,包括,确定实体模型集合对应的参考实体模型;将参考实体模型和实体模型集合中的待扩展实体模型的描述信息进行对比,得到对比结果,其中,参考实体模型的描述信息比待扩展实体模型的描述信息丰富;基于对比结果,对待扩展实体模型的描述信息进行扩展。
[0007]在上述过程中,由于实体模型的描述信息不充足,导致搜索实体模型的不准确,为此,本申请通过将更为丰富的实体模型的描述信息扩展到实体模型的描述信息相对不丰富的实体模型的描述信息当中,通过该方法可以使实体模型的描述信息更丰富,进而可以达到准确的搜索实体模型的效果。r/>[0008]一种实施例中,一个实体模型的描述信息包括:一个实体模型的特征描述信息和一个实体模型中的子实体模型的特征描述信息;
[0009]基于对比结果,对待扩展实体模型的描述信息进行扩展,包括:
[0010]基于对比结果,对待扩展实体模型的特征描述信息进行扩展;
[0011]和/或
[0012]基于对比结果,对待扩展实体模型中的子实体模型的特征描述信息进行扩展。
[0013]在上述过程中,本申请可以对实体模型的描述信息进行扩展,也可以对实体模型中的子实体模型的描述信息进行扩展,因此,通过本申请的方法,无论是搜索实体模型和子实体模型都会更准确。
[0014]一种实施例中,基于对比结果,对待扩展实体模型的特征描述信息进行扩展,包括:
[0015]计算参考实体模型的特征描述信息中的每一标签描述信息和待扩展实体模型的特征描述信息中的主题描述信息的相似度,得到多个相似度的值;
[0016]基于多个相似度的值和对比结果,对待扩展实体模型的特征描述信息中的标签描述信息进行扩展。
[0017]在上述过程中,在扩展实体模型的描述信息时,可以进一步的对比参考实体模型的标签描述信息和待扩展实体模型的主题描述信息的相似度,进而判断两个模型的相关性,保证参考实体模型和待扩展实体模型的类型尽可能相似。
[0018]一种实施例中,基于多个相似度的值和对比结果,对待扩展实体模型的特征描述信息中的标签描述信息进行扩展,包括:
[0019]将多个相似度的值转化成多个概率的值;
[0020]基于多个概率的值和对比结果,将参考实体模型的特征描述信息中的每一标签描述信息随机扩展到待扩展实体模型的特征描述信息中的标签描述信息中。
[0021]在上述过程中,将相似度转化成概率值,在描述信息的扩展时可以根据对应的概率值随机的进行扩展,保证了实体模型描述信息扩展的随机性和相关性。
[0022]一种实施例中,基于多个相似度的值和对比结果,对待扩展实体模型的特征描述信息中的标签描述信息进行扩展,包括:
[0023]将多个相似度的值中相似度的值大于相似阈值对应的参考实体模型的特征描述信息中的标签描述信息扩展到待扩展实体模型的特征描述信息中的标签描述信息中。
[0024]在上述过程中,以相似阈值为临界,大于相似阈值对应的参考实体模型的特征描述信息中的标签描述信息可以扩展到待扩展实体模型的特征描述信息中的标签描述信息,保证了描述信息扩展的相关性,更为相似的实体模型之间可以扩展对应的描述信息。
[0025]一种实施例中,基于对比结果,对待扩展实体模型中的子实体模型的特征描述信息进行扩展,包括:
[0026]基于待扩展实体模型中的子实体模型的特征描述信息,识别待扩展实体模型中存在的子实体模型;
[0027]基于参考实体模型中的子实体模型的特征描述信息中的位置描述信息和待扩展实体模型中存在的子实体模型的特征描述信息中的位置描述信息,确定待扩展实体模型中存在的子实体模型对应的参考实体模型中的参考子实体模型;
[0028]将待扩展实体模型中存在的子实体模型的特征描述信息中的资源文件信息和参考子实体模型的特征描述信息中的资源文件信息进行对比,得到第二对比结果;
[0029]基于对比结果和第二对比结果,对待扩展实体模型中的子实体模型的特征描述信息进行扩展。
[0030]在上述过程中,在对待扩展实体模型的子实体模型的描述信息进行扩展时,通过识别待扩展实体模型中可能存在的子实体,再通过对应的位置信息确定参考实体模型中对应子实体,对比两个子实体的资源文件信息,保证对待扩展模型中的子实体模型的描述信息扩展的更准确。
[0031]一种实施例中,在确定实体模型集合对应的参考实体模型之前,方法还包括:
[0032]将数据库中的多个实体模型的描述信息转化成向量,得到向量集合;
[0033]计算向量集合中任意两个向量的相似度,得到向量集合对应的多个相似度;
[0034]基于多个相似度,对多个实体模型进行聚类,得到多个实体模型对应的多个类簇,其中,每一类簇中的实体模型是相同或者相似的;
[0035]其中,实体模型集合为多个类簇中的一个类簇。
[0036]在上述过程中,通过模型的聚类可以确定实体模型集合,可以保证每个集合中全部的实体模型是相同或者相似的。
[0037]一种实施例中,确定实体模型集合中的参考实体模型,包括:
[0038]从实体模型集合中筛选一个或多个参考实体模型;
[0039]或者
[0040]从实体模型集合中筛选一个实体模型并人工对一个实体模型的描述信息进行标注,得到参考实体模型;
[0041]或者
[0042]获取用户设备发送的一个或多个实体模型作为参考实体模型。
[0043]在上述过程中,可以从实体模型集合中确定出参考实体模型,也可以对其中的实体模型进行人工的标注,还可以直接从系统上传参考实体模型,目的在于保证参考实体模型的描述信息更丰富。
[0044]第二方面,本申请实施例提供了一种搜索实体模型的方法,包括,获取用户搜索信息和扩展后的实体模型的描述信息,其中,扩展后的实体模型的描述信息是通过参考实体模型和待扩展实体模型的描述信息的对比,并基于得到的对比结果,对待扩展实体模型的描述信息进行扩展得到的;基于用户搜索信息和扩展本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种处理实体模型描述信息的方法,其特征在于,包括:确定实体模型集合对应的参考实体模型;将所述参考实体模型和所述实体模型集合中的待扩展实体模型的描述信息进行对比,得到对比结果,其中,所述参考实体模型的描述信息比所述待扩展实体模型的描述信息丰富;基于所述对比结果,对所述待扩展实体模型的描述信息进行扩展。2.根据权利要求1所述的方法,其特征在于,一个实体模型的描述信息包括:所述一个实体模型的特征描述信息和所述一个实体模型中的子实体模型的特征描述信息;所述基于所述对比结果,对所述待扩展实体模型的描述信息进行扩展,包括:基于所述对比结果,对所述待扩展实体模型的特征描述信息进行扩展;和/或基于所述对比结果,对所述待扩展实体模型中的子实体模型的特征描述信息进行扩展。3.根据权利要求2所述的方法,其特征在于,所述基于所述对比结果,对所述待扩展实体模型的特征描述信息进行扩展,包括:计算所述参考实体模型的特征描述信息中的每一标签描述信息和所述待扩展实体模型的所述特征描述信息中的主题描述信息的相似度,得到多个相似度的值;基于所述多个相似度的值和所述对比结果,对所述待扩展实体模型的所述特征描述信息中的标签描述信息进行扩展。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个相似度的值和所述对比结果,对所述待扩展实体模型的所述特征描述信息中的标签描述信息进行扩展,包括:将所述多个相似度的值转化成多个概率的值;基于所述多个概率的值和所述对比结果,将所述参考实体模型的所述特征描述信息中的所述每一标签描述信息随机扩展到所述待扩展实体模型的所述特征描述信息中的所述标签描述信息中。5.根据权利要求3所述的方法,其特征在于,所述基于所述多个相似度的值和所述对比结果,对所述待扩展实体模型的所述特征描述信息中的标签描述信息进行扩展,包括:将所述多个相似度的值中相似度的值大于相似阈值对应的所述参考实体模型的特征描述信息中的标签描述信息扩展到所述待扩展实体模型的特征描述信息中的所述标签描述信息中。6.根据权利要求2所述的方法,其特征在于,所述基于所述对比结果,对所述待扩展实体模型中的子实体模型的特征描述信息进行扩展,包括:基于所述待扩展实体模型中的子实体模型的特征描述信息,识别所述待扩展实体模型中存在的子实体模型;基于所述参考实体模型中的子实体模型的特征描述信息中的位置描述信息和所述待扩展实体模型中存在的子实体模型的特征描述信息中的位置描述信息,确定所述待扩展实体模型中所述存在的子实体模型对应的所述参考实体模型中的参考子实体模型;将所述待扩展实体模型中所述存在的子实体模型的特征描述信息中的资源文件信息和所述参考子实体模型的特征描述信息中的资源文件信息进行对比,得到第二对比结果;
基于对比结果和所述第二对比结果,对所述待扩展实体模型中的子实体模型的特征描述信息进行扩展。7.根据权利要求1
‑
6任一项所述的方法,其特征在于,在所述确定实体模型集合对应的参考实体模型之前,所述方法还包括:将数据库中的多个实体模型的描述信息转化成向量,得到向量集合...
【专利技术属性】
技术研发人员:邸楠,吴晓斌,焦玉楼,苟小刚,岳勇,
申请(专利权)人:炫我信息技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。