一种确定文本匹配方法及装置制造方法及图纸

技术编号：34700507 阅读：11 留言：0更新日期：2022-08-27 16:36

本申请提供一种确定文本匹配方法及装置，应用于深度学习的技术领域。该方法包括：获取第一文本和第二文本，从所述第一文本中提取第一关键词，构建第一特征图，从所述第二文本中提取第二关键词，构建第二特征图。将第一特征图输入预设神经网络模型训练，获得第一向量，将第二特征图输入预设神经网络模型训练，获得第二向量，基于处理长度不同且粒度相同的匹配任务的多任务学习模型，根据第一向量、第二向量的乘积确定第一匹配概率。响应于所述第一匹配概率大于第一阈值，确定第一文本和第二文本匹配。本申请中通过训练好的多任务学习模型确定文本匹配概率，可以处理长度不同且粒度相同的多种匹配任务，提高确定文本匹配效率。提高确定文本匹配效率。提高确定文本匹配效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种确定文本匹配方法及装置

[0001]本申请涉及深度学习的
，特别是涉及一种确定文本匹配方法。

技术介绍

[0002]近年来，随着互联网的高速发展，网络平台上时常会出现一些相似或者冗余的文本，由于文本中大多存在大量文字内容，用户难以在短时间进行判别两个或者多个文本是否相似。而且运营商也很难为用户推荐表意不同的文本。所以需要对不同文本进行匹配，以筛选出匹配文本。
[0003]目前，通过transformer模型确定两个文本是否匹配，由于transformer模型只能解决一类特定的匹配任务，例如，长长文本匹配、长短文本匹配等原因，导致其有确定文本匹配效率低缺点。
[0004]因此，如何处理所有类型的匹配任务，提高确定文本匹配效率，是本领域技术人员急需解决的技术问题。

技术实现思路

[0005]基于上述问题，本申请提供了一种确定文本匹配方法及装置，以能够处理所有类型的匹配任务，提高确定文本匹配效率。本申请实施例公开了如下技术方案。
[0006]第一方面，本申请提的一种确定文本匹配方法，包括：获取第一文本和第二文本；从所述第一文本中提取第一关键词，构建第一特征图，从所述第二文本中提取第二关键词，构建第二特征图；将所述第一特征图输入预设神经网络模型训练，获得第一向量，将所述第二特征图输入所述预设神经网络模型训练，获得第二向量；基于多任务学习模型，根据所述第一向量和所述第二向量的乘积确定第一匹配概率，所述多任务学习模型用于处理长度不同且粒度相同的匹配任务；响应于所述第一匹配概率大于...

【技术保护点】

【技术特征摘要】
1.一种确定文本匹配方法，其特征在于，包括：获取第一文本和第二文本；从所述第一文本中提取第一关键词，构建第一特征图，从所述第二文本中提取第二关键词，构建第二特征图；将所述第一特征图输入预设神经网络模型训练，获得第一向量，将所述第二特征图输入所述预设神经网络模型训练，获得第二向量；基于多任务学习模型，根据所述第一向量和所述第二向量的乘积确定第一匹配概率，所述多任务学习模型用于处理长度不同且粒度相同的匹配任务；响应于所述第一匹配概率大于第一阈值，确定所述第一文本和所述第二文本匹配。2.根据权利要求1中所述的方法，其特征在于，所述从所述第一文本中提取第一关键词，构建第一特征图，包括：从所述第一文本中提取第一关键词，获得第一节点集合；从所述第一节点集合中确定多个第二节点，通过所述多个第二节点构建所述第一特征图，第二节点为所述第一节点集合中处于同一句话的节点。3.根据权利要求2中所述的方法，其特征在于，在所述构建所述第一特征图之前，所述方法还包括：计算第一相关性，所述第一相关性为所述多个第二节点之间的相关性；响应于所述第一相关性大于第一相关性阈值，连接所述多个第二节点，构建所述第一特征图。4.根据权利要求1中所述的方法，其特征在于，所述基于多任务学习模型，根据所述第一向量和所述第二向量的乘积确定第一匹配概率包括：根据所述第一向量和所述第二向量的乘积确定第一训练参数；将所述第一训练参数、事件粒度常数和话题粒度常数输入多任务学习模型；根据所述第一训练参数、所述事件粒度常数和所述话题粒度常数的乘积确定所述第一匹配概率，所述事件粒度常数用于指示文本匹配中事件匹配的重要程度，所述话题粒度常数用于指示文本匹配中话题匹配的重要程度。5.根据权利要求1中所述的方法，其特征在于，在确定所述第一文本和所述第二文本匹配之后，所述方法还包括：基于所述第一匹配概率，训练第一模型，所述第一模型用于判断第三文本和第四文本是...

【专利技术属性】
技术研发人员：王卿云，亓克娜，朱凯泉，
申请(专利权)人：北京搜狐新媒体信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人