神经网络训练方法、语义相似度计算方法及语义检索系统技术方案

技术编号：33922643 阅读：13 留言：0更新日期：2022-06-25 21:15

本发明专利技术公开一种神经网络训练方法、语义相似度计算方法及语义检索系统。神经网络训练方法包括步骤：S1:对句子相似度进行标注；S2:将标注好的二个句子输入神经网络；S3:对二个句子的特征进行处理，计算损失函数；S4:根据损失函数的损失值，对神经网络进行训练。本发明专利技术采取的技术方案使用的神经网络训练方法得到的神经网络参数少，检索速度快，能够准确计算出语义相似度，从而能够获取文本的语义信息，从而提高了检索的准确率，适用于高并发、低延迟的需求场景。的需求场景。的需求场景。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络训练方法、语义相似度计算方法及语义检索系统

[0001]本专利技术涉及信息检索
，尤其涉及一种神经网络训练方法、语义相似度计算方法及语义检索系统。

技术介绍

[0002]自然语言处理(Nature Language processing,NLP)是计算机科学以及人工智能的一个重要研究方向。主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法，是一门集成语言学、计算机科学、数学于一体的学科。
[0003]在自然语言处理中，有很多场景需要对不同的文本之间进行语义的相似度匹配。因此，语义相似度计算是解决这类需求的技术方向之一，是文本查重、智能问答等应用的基础技术。语义相似度意在对于给定的两个文本，从语义的角度度量二者之间的相似性，通常会给出一个0到1之间的语义相似度分值，分值越高代表越相似。
[0004]现有的技术中，有的基于Word2Vec等静态词向量计算语义相似度，但这种静态词向量存在的主要技术缺陷是无法考虑一词多义的情况、分词错误等情况，从而导致计算结果的准确度受到很大的影响。
[0005]此外，自从bert模型出来之后，以BERT为代表的预训练语言模型在众多NLP任务中取得了惊人的效果，因此基于bert模型进行的文本语义相似度也进行有益的探索，基于bert模型进行的文本相似度虽然取得了明显的进步，但基于bert参数量巨大，导致模型预测速度慢，在很多的场景下，无法满足互联网高并发，低延时的需求。

技术实现思路

[0006]本专利技术为解决现有技术中存...

【技术保护点】

【技术特征摘要】
1.一种神经网络训练方法，其特征是，包括步骤：S1:对二个句子相似度进行标注；S2:将标注好的二个句子输入神经网络，得到句子中每个字的特征；S3:对每个字的特征取均值，得到二个句子的特征S1、S2，计算损失函数；S4:根据损失函数的损失值，对神经网络进行训练。2.如权利要求1所述的神经网络训练方法，其特征是，步骤S1:对句子相似度进行标注为：sentenceA sentenceB Score。3.如权利要求1所述的神经网络训练方法，其特征是，步骤S3中计算损失函数包括：将S1和S2求余弦相似度，即sim＝cos(S1,S2)；把1
‑
5分的标签分别除以5，归一化到0至1之间，得到归一化的标签label；根据sim和标签label计算损失函数。4.如权利要求3所述的神经网络训练方法，其特征是，所述损失函数公式为：Loss＝|sim
‑
label|其中，sim＝cos(S1,S2)，cos为余弦相似度。5.如权利要求1所述的神经网络训练方法，其特征是，所述神经网络结构包括线性网络单元、嵌入单元、特征抽取单元以及压缩单元，其中：线性网络单元用以将输入变量复制为三份作为输入，分别获取到句子的query、key以及value；嵌入单元用以对输入的字、绝对位置以及所属段落编号进行编码...

【专利技术属性】
技术研发人员：曾祥云，朱姬渊，
申请(专利权)人：上海易康源医疗健康科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人