数据处理方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:32429807 阅读:20 留言:0更新日期:2022-02-24 18:38
本发明专利技术公开了一种数据处理方法、装置、存储介质及计算机设备。其中,该方法包括:接收搜索请求文本;通过相关性模型,从预定数据库中确定与所述搜索请求文本相关的目标数据,其中,预定数据库中包括多个数据,以及通过相关性模型确定的所述多个数据的数据向量;返回目标数据。本发明专利技术解决了由于文本类型的数据比较复杂,造成难以快速通过检索返回与文本相关的数据的技术问题。数据的技术问题。数据的技术问题。

【技术实现步骤摘要】
数据处理方法、装置、存储介质及计算机设备


[0001]本专利技术涉及数据处理领域,具体而言,涉及一种数据处理方法、装置、存储介质及计算机设备。

技术介绍

[0002]在相关技术中,在根据搜索文本返回与搜索文本相关的内容时,所采用的方法基本有以下几类:一种是,基于逻辑回归拟合文本相关性特征值的方法,该方法计算复杂度非常高,不能及时返回与搜索文本相关的内容,即无法通过在线相关性过滤,得到与搜索文本相关性较强的内容。另一种是,将文本中每一个词映射为词向量,计算两个文本中每个词之间的词向量相似度,得到词向量相似度矩阵,再通过卷积神经网络将相似度矩阵变换为相关性的方法,这种方法同样计算复杂度高,也不能解决在线相关性过滤的问题。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种数据处理方法、装置、存储介质及计算机设备,以至少解决相关技术中,在进行文本搜索时,难以及时返回与文本相关的数据的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种数据处理方法,包括:接收搜索请求文本;通过相关性模型,从预定数据库中确定与所述搜索请求文本相关的目标数据,其中,所述预定数据库中包括多个数据,以及通过所述相关性模型确定的所述多个数据的数据向量;返回所述目标数据。
[0006]根据本专利技术实施例的另一方面,还提供了一种数据处理方法,包括:在线接收搜索请求文本;通过相关性模型,从预定广告库中确定与所述搜索请求文本相关的目标广告,其中,所述预定广告库中包括多个广告,以及通过所述相关性模型确定的所述多个广告的广告向量;在线返回所述目标广告。
[0007]根据本专利技术实施例的一方面,提供了一种数据处理装置,包括:第一接收模块,用于接收搜索请求文本;第一确定模块,用于通过相关性模型,从预定数据库中确定与所述搜索请求文本相关的目标数据,其中,所述预定数据库中包括多个数据,以及通过所述相关性模型确定的所述多个数据的数据向量;第一返回模块,用于返回所述目标数据。
[0008]根据本专利技术实施例的又一方面,还提供了一种数据处理装置,包括:第二接收模块,用于在线接收搜索请求文本;第二确定模块,用于通过相关性模型,从预定广告库中确定与所述搜索请求文本相关的目标广告,其中,所述预定广告库中包括多个广告,以及通过所述相关性模型确定的所述多个广告的广告向量;第二返回模块,用于在线返回所述目标广告。
[0009]根据本专利技术实施例的一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述方法中任意一项所述的数据处理方法。
[0010]根据本专利技术实施例的另一方面,提供了一种计算机设备,包括:存储器和处理器,所述存储器存储有计算机程序;所述处理器,用于执行所述存储器中存储的计算机程序,所述计算机程序运行时使得所述处理器执行上述方法中任意一项所述的数据处理方法。
[0011]根据本专利技术实施例的一方面,提供了一种数据处理方法,包括:确定待推荐文本;通过相关性模型,从预定数据库中确定与所述待推荐文本相关的目标数据,其中,所述预定数据库中包括多个数据,以及通过所述相关性模型确定的所述多个数据的数据向量;展示所述目标数据。
[0012]根据本专利技术实施例的另一方面,提供了一种数据处理装置,包括:第三确定模块,用于确定待推荐文本;第四确定模块,用于通过相关性模型,从预定数据库中确定与所述待推荐文本相关的目标数据,其中,所述预定数据库中包括多个数据,以及通过所述相关性模型确定的所述多个数据的数据向量;展示模块,用于展示所述目标数据。
[0013]在本专利技术实施例中,采用接收搜索请求文本的方式,通过相关性模型,以及通过所述相关性模型确定的预定数据库中多个数据的数据向量,达到了从预定数据库中确定并返回与搜索请求文本相关的目标数据的目的,从而实现了依据搜索请求文本快速查找并返回与该搜索请求文本相关的数据的技术效果,进而解决了相关技术中,在进行文本搜索时,难以及时返回与文本相关的数据的技术问题。
附图说明
[0014]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0015]图1示出了一种用于实现数据处理方法的计算机终端的硬件结构框图;
[0016]图2是根据本专利技术实施例1的数据处理方法一的流程图;
[0017]图3是根据本专利技术实施例1的数据处理方法二的流程图;
[0018]图4是根据本专利技术实施例提供的相关性模型训练的流程图;
[0019]图5是根据本专利技术优选实施方式提供的广告文本相关性模型应用的流程图;
[0020]图6是根据本专利技术实施例1的数据处理方法三的流程图;
[0021]图7是根据本专利技术实施例提供的数据处理装置一的结构框图;
[0022]图8是根据本专利技术实施例提供的数据处理装置二的结构框图;
[0023]图9是根据本专利技术实施例提供的数据处理装置三的结构框图;
[0024]图10是根据本专利技术实施例的一种计算机终端的结构框图。
具体实施方式
[0025]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0026]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0027]首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
[0028]向量表征,利用深度学习技术,将文本表示为向量,并且向量满足模型训练中指定的一些目标,如相似的文本其表征向量也相似。
[0029]向量检索,使用哈希和树方法快速查找相似向量的技术。
[0030]模型蒸馏,使用小模型拟合大模型,以克服模型过大带来的存储和计算要求过高的问题。
[0031]文本相关性,用于表示两个文本,或者文本与文档之间的相关性。可以用于文本相似度计算和文本检索等应用场景。
[0032]实施例1
[0033]根据本专利技术实施例,还提供了一种数据处理的方法实施例,需要说明的是,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:接收搜索请求文本;通过相关性模型,从预定数据库中确定与所述搜索请求文本相关的目标数据,其中,所述预定数据库中包括多个数据,以及通过所述相关性模型确定的所述多个数据的数据向量;返回所述目标数据。2.根据权利要求1所述的方法,其特征在于,通过相关性模型,从预定数据库中确定与所述搜索请求文本相关的目标数据包括:通过所述相关性模型的第一层,确定所述搜索请求文本对应的搜索向量;通过所述相关性模型的第二层,分别确定所述搜索向量与所述多个数据向量的相关性;确定与所述搜索向量相关性最大的数据向量为目标向量;确定与所述目标向量对应的数据为所述目标数据。3.根据权利要求2所述的方法,其特征在于,确定与所述目标向量对应的数据为所述目标数据包括:确定所述目标向量的向量索引,其中,所述向量索引用于标识所述目标向量以及所述目标向量对应的目标数据;根据所述向量索引确定所述目标数据。4.根据权利要求1所述的方法,其特征在于,在通过相关性模型,从预定数据库中确定与所述搜索请求文本相关的目标数据之前,还包括:获取多对样本,其中,所述多个样本中的每对样本均包括:两个样本文本,以及所述两个样本文本之间的相关性;采用所述多对样本对初始模型进行训练,得到达到预定训练目标的所述相关性模型。5.根据权利要求1所述的方法,其特征在于,接收所述搜索请求文本包括:通过互联网在线的方式,接收所述搜索请求文本;返回所述目标数据包括:通过互联网在线的方式,返回所述目标数据。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述预定数据库中的数据包括以下至少之一:广告数据,商品数据,检索结果数据。7.一种数据处理方法,其特征在于,包括:在线接收搜索请求文本;通过相关性模型,从预定广告库中确定与所述搜索请求文本相关的目标广告,其中,所述预定广告库中包括多个广告,以及通过所述相关性模型确定的所述多个广告的广告向量;在线返回所述目标广告。8.根据权利要求7所述的方法,其特征在于,通过相关性模型,从预定广告库中确定与所述搜索请求文本相关的目标广告包括:通过所述相关性模型,确定所述预定广告库中与所述搜索请求文本最相关的目标广告标题文本;确定所述目标广告标题文本对应的广告为所述目标广告。
9.根据权利要求8所述的方法,其特征在于,通过所述相关性模型,确定所述预定广告库中与所述搜索请求文本最相关的目标...

【专利技术属性】
技术研发人员:裴勇泉吕晓雨吴小琼徐林龙金龑林方全张继海崔紫强魏朝张海波杨程黄忠强张京桥
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1