一种基于深度学习的文本推荐方法、装置及相关介质制造方法及图纸

技术编号:31011779 阅读:15 留言:0更新日期:2021-11-30 00:39
本发明专利技术公开了一种基于深度学习的文本推荐方法、装置及相关介质,该方法包括:采集不同类别的文本信息构建文本资料库,通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量;将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中;在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量;在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息,并基于Milvus向量索引信息和文本特征向量的对应关系,在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。本发明专利技术实施例通过构建文本资料库和引入Milvus数据库,从而在推荐文本时,能做到快速检索,实时反馈且准确率高。确率高。确率高。

【技术实现步骤摘要】
一种基于深度学习的文本推荐方法、装置及相关介质


[0001]本专利技术涉及计算机软件
,特别涉及一种基于深度学习的文本推荐方法、装置及相关介质。

技术介绍

[0002]随着科技的快速发展,机器学习领域在深度学习方向也取得了具有前景的迅猛发展。自然语言处理是人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。通常来说,自然语言处理技术包括文本处理、机器翻译、语义理解、知识图谱、智能问答等技术。其中,文本匹配是文本处理的一个非常重要的应用方向,在现实生活中起到了十分重要的作用。与此同时,这一技术的发展,为用户在纷繁冗杂的信息海洋中进行比较好的检索、匹配提供了一个可行的方案。事实上,文本匹配在很多实际场景中都扮演着重要角色。比如,在搜索场景中,用户输入一条待匹配文本,系统需要去语料库中寻找与该待匹配文本尽可能语义相似的内容,并将匹配结果返回给用户。再比如,在智能问答系统中,用户提出一个问题,系统需根据用户提出的问题在问答库中找到最相似的问题,并返回该相似问题对应的答案。在这些场景中,文本匹配的准确性直接影响用户体验效果。
[0003]所谓文本匹配,其过程一般是针对两个文本,通过算法计算二者语义相似度,通过相似度大小来判定二者的匹配度。相似度数值越高,越匹配。反之,越不匹配。当前文本匹配主要是采用较为复杂的方法,且不具备动态扩展性。这里,动态扩展性指文本资料库不自动进行扩充,需要人为手动扩充。

技术实现思路

[0004]本专利技术实施例提供了一种基于深度学习的文本推荐方法、装置、计算机设备及存储介质,旨在提高文本推荐效率和精度。
[0005]第一方面,本专利技术实施例提供了一种基于深度学习的文本推荐方法,包括:采集不同类别的文本信息构建文本资料库,通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量;将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中;在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量;在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息,并基于Milvus向量索引信息和文本特征向量的对应关系,在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。
[0006]第二方面,本专利技术实施例提供了一种基于深度学习的文本推荐装置,包括:第一向量生成单元,用于采集不同类别的文本信息构建文本资料库,通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量;
第一向量转换单元,用于将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中;第二向量生成单元,用于在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量;文本匹配单元,用于在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息,并基于Milvus向量索引信息和文本特征向量的对应关系,在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。
[0007]第三方面,本专利技术实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于深度学习的文本推荐方法。
[0008]第四方面,本专利技术实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于深度学习的文本推荐方法。
[0009]本专利技术实施例提供了一种基于深度学习的文本推荐方法、装置、计算机设备及存储介质,该方法包括:采集不同类别的文本信息构建文本资料库,通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量;将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中;在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量;在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息,并基于Milvus向量索引信息和文本特征向量的对应关系,在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。本专利技术实施例通过构建文本资料库和引入Milvus数据库,解决了将待匹配文本与文本信息逐条匹配这一耗时耗力的缺陷,并且本实施例的推荐匹配过程实现简单、准确率高且耗时不长,在推荐文本时,能做到快速检索,实时反馈,且具备文本资料库文本数据的动态扩展性。
附图说明
[0010]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1为本专利技术实施例提供的一种基于深度学习的文本推荐方法的流程示意图;图2为本专利技术实施例提供的一种基于深度学习的文本推荐方法的子流程示意图;图3为本专利技术实施例提供的一种基于深度学习的文本推荐装置的示意性框图;图4为本专利技术实施例提供的一种基于深度学习的文本推荐装置的子示意性框图。
具体实施方式
[0012]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0013]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和
ꢀ“
包含”指示
所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0014]还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0015]还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0016]下面请参见图1,图1为本专利技术实施例提供的一种基于深度学习的文本推荐方法的流程示意图,具体包括:步骤S101~S104。
[0017]S101、采集不同类别的文本信息构建文本资料库,通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量;S102、将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中;S103、在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量;S104、在所述Milvus数据库选取语义相似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的文本推荐方法,其特征在于,包括:采集不同类别的文本信息构建文本资料库,通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量;将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中;在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量;在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息,并基于Milvus向量索引信息和文本特征向量的对应关系,在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。2.根据权利要求1所述的基于深度学习的文本推荐方法,其特征在于,所述通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量,包括:将所述文本资料库中的文本信息两两组合,并将组合中的两个文本信息分别依次输入至相同结构的BERT网络模型和平均池化层中,并分别输出得到两个文本信息对应的编码结果,然后将所述编码结果作为两个文本信息对应的文本特征向量。3.根据权利要求1所述的基于深度学习的文本推荐方法,其特征在于,所述将所述文本特征向量转换为Milvus向量索引信息,并存储至Milvus数据库中,包括:对所述文本特征向量进行归一化处理,得到归一化的文本特征向量;将归一化的文本特征向量转换为Milvus向量索引信息。4.根据权利要求1所述的基于深度学习的文本推荐方法,其特征在于,所述在对待匹配文本进行匹配时,通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量,包括:将待匹配文本单独输入至BERT网络模型,得到待匹配文本对应的文本语义表示;通过平均池化层对所述文本语义表示进行向量大小固定,得到所述句子向量。5.根据权利要求1所述的基于深度学习的文本推荐方法,其特征在于,所述在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息,包括:利用余弦相似度方法计算所述句子向量与每一所述Milvus向量索引信息的相似度得分;选取相似度得分最高的前N条Milvus向量索引信息。6.根据权利要求1所述的基于深度学习的文本...

【专利技术属性】
技术研发人员:钱启王天星杨东泉程佳宇
申请(专利权)人:深圳前海环融联易信息科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1