域名推荐方法、域名推荐模型训练方法及电子设备技术

技术编号:23765890 阅读:62 留言:0更新日期:2020-04-11 19:48
本发明专利技术公开了一种域名推荐方法、域名推荐模型训练方法及电子设备,其中方法包括:获取待识别词语;对待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词;将待识别词语和第一近似词输入深度学习模型,得到待识别词语的第一近义词;根据第一近义词进选择可注册域名进行推荐。通过词向量的相似性得到近似词后,可能近似词虽然字形相似,再通过深度学习模型对近似词中具有相同或相近的含义的词筛选出来,以无论在字形还是在字义上均能达到用户的需求。通过对近似词识别,并利用深度学习模型对同义或近义词识别,使得在进行域名推荐算法的时候,能够更提供更精准的推荐词语。

Domain name recommendation method, domain name recommendation model training method and electronic equipment

【技术实现步骤摘要】
域名推荐方法、域名推荐模型训练方法及电子设备
本专利技术的实施方式涉及自然语言信息处理领域,更具体地,本专利技术的实施方式涉及一种域名推荐方法、域名推荐模型训练方法及电子设备。
技术介绍
随着互联网和人工智能的快速发展,类似域名这些互联网的早期资源已经越来越难以获取,大部分的域名都掌握在商业机构手里,如何注册一个便于记忆,又符合企业相关特性的域名,是很多企业在注册域名的时候必须要考虑的事情。目前为了提高域名未被注册的算法,一般都是通过添加一些固定的后缀或者是随机字符来增加域名的随机性,然而这种处理方式,往往破坏了域名的整体性,也有可能导致域名结构相对混乱,面对一些比较热门的词语,这种简单的随机算法,往往无法符合用户在选择时的真实需求。
技术实现思路
本专利技术实施例提供了一种域名推荐方法、域名推荐模型训练方法及电子设备以解决现有技术中使用随机或者特定后缀的方法给域名进行打乱的算法,无法精准判断用户的真实需要的问题。根据第一方面,本专利技术实施例提供了一种域名推荐方法,包括:获取待识别词语;对所述待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词;将所述待识别词语和第一近似词输入深度学习模型,得到所述待识别词语的第一近义词,所述深度学习模型通过近似词样本进行训练得到的;根据所述第一近义词进选择可注册域名进行推荐。可选地,所述对待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词包括:将所述待识别词语和预设语料库中的词语输入词向量模型,分别构建各个词语的第一词向量;对所述第一词向量进行余弦相似性计算,得到所述待识别词语的第一近似词。可选地,所述将所述待识别词语和第一近似词输入深度学习模型,得到所述待识别词语的第一近义词包括:通过深度学习模型识别所述待识别词语和第一近似词的词义的近义值;将所述近义值与预设近义阈值比较,将大于所述预设近义阈值的第一近似词作为所述待识别词语的第一近义词。可选地,所述根据所述第一近义词进选择可注册域名进行推荐包括:分别检测所述第一近义词的注册状态;基于所述注册状态选择可注册的第一近义词作为域名进行推荐。可选地,所述基于所述注册状态选择可注册的第一近义词作为域名进行推荐包括:根据所述第一近义词库进行域名多样化推断和选取;对多样化推断和选取的第一近义词的注册状态进行检测。根据第二方面,本专利技术实施例提供了一种域名推荐模型训练方法,所述域名推荐模型包括:词向量模型和深度学习模型,所述训练方法包括:利用所述词向量模型针对预设语料库中词语建立对应的第二词向量;对所述第二词向量进行相似性计算得到预设语料库中词语的第二近似词;将所述第二近似词作为所述深度学习模型的训练样本对深度学习模型进行训练,得到训练好得深度学习模型。可选地,域名推荐模型训练方法还包括:对所述预设语料库的词语进行分词和词向量标注得到词向量训练样本;利用所述词向量训练样本对所述词向量模型进行训练,得到训练好的向量模型。可选地,所述将所述第二近似词作为所述深度学习模型的训练样本对深度学习模型进行训练,得到训练好得深度学习模型包括:对所述第二近似词的词义进行识别,得到词义相似值;基于所述相似值更新所述深度学习模型的参数,得到近义词阈值。根据第三方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行上述第一方面任意一项描述的域名推荐方法和/或第二方面任意一项描述的域名推荐模型训练方法。根据第四方面,本专利技术实施例提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器执行上述第一方面任一项描述的域名推荐方法和/或第二方面任意一项描述的域名推荐模型训练方法。通过词向量的相似性得到近似词后,可能近似词虽然字形相似,再通过深度学习模型对近似词中具有相同或相近的含义的词筛选出来,以无论在字形还是在字义上均能达到用户的需求,通过对近似词识别,并利用深度学习模型对同义或近义词识别,使得在进行域名推荐算法的时候,能够更提供更精准的推荐词语,以及更多可用于注册的域名选择,提高了域名的选择准确度和丰富性,基于深度学习域名近义词的模型,实现智能化运算域名词语选择的趋势和概率。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本实施例的域名推荐方法的示意图;图2示出了本实施例的域名推荐模型训练方法的示意图;图3示出了本专利技术实施例的电子设备的示意图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种域名推荐方法。具体的可以参见图1,该域名推荐方法可以包括如下步骤:S11.获取待识别词语。示例性的,所称待识别词语可以为用户自行选择的任意词语,例如可以为英文文本、也可以为中文文本。在本实施例中,待识别词语可以为候选的待注册的域名。S12.对所述待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词。作为示例性的实施例,预设语料库可以为任意语料库,可以分别对待识别词语和预设语料库中的所有词语分别建立词向量。作为可选的实施例,建立词向量可以通过词向量模型建立,例如可以通过Word2vec进行词向量分析,分别构建每一个词语的向量。在本实施例中,词向量模型可以为预先训练好的模型,在本实施例中,词向量模型可以将各个词语进行低维实数向量词表示方法。例如,词语apple的可以表示为:apple=[0.23,0.4,0.13,0.45]。并对构建的词向量进行相似性计算,已得到各个词之间的相似性,在本实施例中,可以分别计算预设语料库中的各个词语与待识别词语之间的相似性。具体的,可以对所述预设语料库中的各个词语的词向量与待识别词语的词向量进行余弦相似性计算,得到所述待识别词语的第一近似词。示例性的,计算两个词语相似度就是通过两个向量的余弦夹角cos来进行描述,词语相似性公式如下:其中,分子表示两个向量的点乘积,分母表示两个向量的模的积。下面以实际例子为例进行说明:从词向量里面随机获取两个词语的表示,例如,可以选取apple=[0.23,0.4,0.13,0.45]和applet=[0.98,0.23,0.56,0.16]。通过余弦夹角计算得到的值为:0.25389,余弦值越接近1,表示向量夹角越接近0,也本文档来自技高网...

【技术保护点】
1.一种域名推荐方法,其特征在于,包括:/n获取待识别词语;/n对所述待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词;/n将所述待识别词语和第一近似词输入深度学习模型,得到所述待识别词语的第一近义词,所述深度学习模型通过近似词样本进行训练得到的;/n根据所述第一近义词进选择可注册域名进行推荐。/n

【技术特征摘要】
1.一种域名推荐方法,其特征在于,包括:
获取待识别词语;
对所述待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词;
将所述待识别词语和第一近似词输入深度学习模型,得到所述待识别词语的第一近义词,所述深度学习模型通过近似词样本进行训练得到的;
根据所述第一近义词进选择可注册域名进行推荐。


2.如权利要求1所述的域名推荐方法,其特征在于,
所述对待识别词语和预设语料库中的词语的词向量进行相似性计算,得到待识别词语的第一近似词包括:
将所述待识别词语和预设语料库中的词语输入词向量模型,分别构建各个词语的第一词向量;
对所述第一词向量进行余弦相似性计算,得到所述待识别词语的第一近似词。


3.如权利要求1所述的域名推荐方法,其特征在于,所述将所述待识别词语和第一近似词输入深度学习模型,得到所述待识别词语的第一近义词包括:
通过深度学习模型识别所述待识别词语和第一近似词的词义的近义值;
将所述近义值与预设近义阈值比较,将大于所述预设近义阈值的第一近似词作为所述待识别词语的第一近义词。


4.如权利要求1所述的域名推荐方法,其特征在于,所述根据所述第一近义词进选择可注册域名进行推荐包括:
分别检测所述第一近义词的注册状态;
基于所述注册状态选择可注册的第一近义词作为域名进行推荐。


5.如权利要求1所述域名推荐方法,其特征在于,所述基于所述注册状态选择可注册的第一近义词作为域名进行推荐包括:
根据所述第一近义词库进行域名多样化推断和选取;
对多样化推断和选取的第一近义词的注册状态进行检测。...

【专利技术属性】
技术研发人员:王林乐金华
申请(专利权)人:亿众骏达网络科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1