一种基于深度学习的文本推荐方法、装置及相关介质制造方法及图纸

技术编号：31011779 阅读：15 留言：0更新日期：2021-11-30 00:39

本发明专利技术公开了一种基于深度学习的文本推荐方法、装置及相关介质，该方法包括：采集不同类别的文本信息构建文本资料库，通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量；将所述文本特征向量转换为Milvus向量索引信息，并存储至Milvus数据库中；在对待匹配文本进行匹配时，通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量；在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息，并基于Milvus向量索引信息和文本特征向量的对应关系，在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。本发明专利技术实施例通过构建文本资料库和引入Milvus数据库，从而在推荐文本时，能做到快速检索，实时反馈且准确率高。确率高。确率高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的文本推荐方法、装置及相关介质

[0001]本专利技术涉及计算机软件
，特别涉及一种基于深度学习的文本推荐方法、装置及相关介质。

技术介绍

[0002]随着科技的快速发展，机器学习领域在深度学习方向也取得了具有前景的迅猛发展。自然语言处理是人工智能领域中的一个重要方向，它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。通常来说，自然语言处理技术包括文本处理、机器翻译、语义理解、知识图谱、智能问答等技术。其中，文本匹配是文本处理的一个非常重要的应用方向，在现实生活中起到了十分重要的作用。与此同时，这一技术的发展，为用户在纷繁冗杂的信息海洋中进行比较好的检索、匹配提供了一个可行的方案。事实上，文本匹配在很多实际场景中都扮演着重要角色。比如，在搜索场景中，用户输入一条待匹配文本，系统需要去语料库中寻找与该待匹配文本尽可能语义相似的内容，并将匹配结果返回给用户。再比如，在智能问答系统中，用户提出一个问题，系统需根据用户提出的问题在问答库中找到最相似的问题，并返回该相似问题对应的答案。在这些场景中，文本匹配的准确性直接影响用户体验效果。
[0003]所谓文本匹配，其过程一般是针对两个文本，通过算法计算二者语义相似度，通过相似度大小来判定二者的匹配度。相似度数值越高，越匹配。反之，越不匹配。当前文本匹配主要是采用较为复杂的方法，且不具备动态扩展性。这里，动态扩展性指文本资料库不自动进行扩充，需要人为手动扩充。

技术实现思路

[0004]本专利技术实施例提供了一种基于深...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的文本推荐方法，其特征在于，包括：采集不同类别的文本信息构建文本资料库，通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量；将所述文本特征向量转换为Milvus向量索引信息，并存储至Milvus数据库中；在对待匹配文本进行匹配时，通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量；在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息，并基于Milvus向量索引信息和文本特征向量的对应关系，在所述文本资料库中选取对应的前N条文本信息作为待匹配文本的匹配结果。2.根据权利要求1所述的基于深度学习的文本推荐方法，其特征在于，所述通过孪生神经网络结构为所述文本资料库中的每一文本信息生成文本特征向量，包括：将所述文本资料库中的文本信息两两组合，并将组合中的两个文本信息分别依次输入至相同结构的BERT网络模型和平均池化层中，并分别输出得到两个文本信息对应的编码结果，然后将所述编码结果作为两个文本信息对应的文本特征向量。3.根据权利要求1所述的基于深度学习的文本推荐方法，其特征在于，所述将所述文本特征向量转换为Milvus向量索引信息，并存储至Milvus数据库中，包括：对所述文本特征向量进行归一化处理，得到归一化的文本特征向量；将归一化的文本特征向量转换为Milvus向量索引信息。4.根据权利要求1所述的基于深度学习的文本推荐方法，其特征在于，所述在对待匹配文本进行匹配时，通过孪生神经网络结构获取所述待匹配文本中包含语义信息的句子向量，包括：将待匹配文本单独输入至BERT网络模型，得到待匹配文本对应的文本语义表示；通过平均池化层对所述文本语义表示进行向量大小固定，得到所述句子向量。5.根据权利要求1所述的基于深度学习的文本推荐方法，其特征在于，所述在所述Milvus数据库选取语义相似度最高的前N条Milvus向量索引信息，包括：利用余弦相似度方法计算所述句子向量与每一所述Milvus向量索引信息的相似度得分；选取相似度得分最高的前N条Milvus向量索引信息。6.根据权利要求1所述的基于深度学习的文本...

【专利技术属性】
技术研发人员：钱启，王天星，杨东泉，程佳宇，
申请(专利权)人：深圳前海环融联易信息科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人