信息识别方法、装置、终端设备以及存储介质制造方法及图纸

技术编号:34913263 阅读:16 留言:0更新日期:2022-09-15 07:02
本发明专利技术公开了一种信息识别方法、装置、终端设备以及存储介质,其信息识别方法包括:获取待识别信息;将所述待识别信息输入信息识别模型中进行预测,得到预测结果,其中,所述信息识别模型基于预设的矩阵编码器、预先创建的语句通顺性模型训练得到;根据所述预测结果判断所述待识别信息是否为垃圾信息。本发明专利技术解决了信息识别准确率的问题,提升信息识别的准确率。率。率。

【技术实现步骤摘要】
信息识别方法、装置、终端设备以及存储介质


[0001]本专利技术涉及通信
,尤其涉及一种信息识别方法、装置、终端设备以及存储介质。

技术介绍

[0002]随着信息时代通信服务业的高速发展,垃圾信息已经对人们的生活造成了一定的困扰,因此信息识别具有重要的社会价值和实用意义。
[0003]现有的信息识别方法通常利用Word2Vec产生词向量,完成信息文本及其拼音文本的向量化表示,然后将相应训练集通过CNN模型或RNN模型对信息特征和信息类别之间的关系进行建模,最后以此判断一个信息是否为垃圾信息。
[0004]但是,基于Word2Vec对信息进行向量化,所考虑的信息较为单一,无法解决多义词的问题;CNN模型和RNN模型的特征提取能力不够强,导致对信息特征和信息类别之间关系的建模不够充分;且RNN模型处理数据的并行计算能力差。

技术实现思路

[0005]本专利技术的主要目的在于提供一种信息识别方法、装置、终端设备以及存储介质,旨在提高信息识别的准确率。
[0006]为实现上述目的,本专利技术提供一种信息识别方法,所述信息识别方法包括以下步骤:
[0007]获取待识别信息;
[0008]将所述待识别信息输入信息识别模型中进行预测,得到预测结果,其中,所述信息识别模型基于预设的矩阵编码器、预先创建的语句通顺性模型训练得到;
[0009]根据所述预测结果判断所述待识别信息是否为垃圾信息。
[0010]可选地,所述将所述待识别信息输入信息识别模型中进行预测,得到预测结果的步骤之前还包括:
[0011]创建所述信息识别模型,具体包括:
[0012]获取训练用的第一样本信息,所述第一样本信息包括第一垃圾信息和第一正常信息;
[0013]基于第一BERT模型、Transformer编码器、预先创建的语句通顺性模型、预测层、交互层,构建得到初始信息识别模型;
[0014]将所述第一样本信息输入所述初始信息识别模型,并结合第一损失函数对所述初始信息识别模型进行迭代训练,得到创建后的信息识别模型。
[0015]可选地,所述将所述待识别信息输入信息识别模型中进行预测,得到预测结果的步骤包括:
[0016]将所述待识别信息输入所述信息识别模型中进行以下处理:
[0017]通过所述信息识别模型中的第一BERT模型对所述信息文本及所述拼音文本进行
文本向量化表示,得到对应的信息矩阵及拼音矩阵;
[0018]将所述信息矩阵输入预先创建的语句通顺性模型进行判断,得到所述信息文本对应的第一通顺性向量;
[0019]将所述信息矩阵及拼音矩阵分别对应输入到所述第一Transformer编码器及所述第二Transformer编码器进行特征提取,得到对应的信息特征矩阵及拼音特征矩阵;
[0020]通过所述交互层对所述信息特征矩阵及所述拼音特征矩阵进行处理,得到对应的信息向量及拼音向量;
[0021]通过所述预测层对所述信息向量、所述拼音向量及所述第一通顺性向量进行计算,得到预测结果。
[0022]可选地,所述通过所述交互层对所述信息特征矩阵及所述拼音特征矩阵进行处理,得到对应的信息向量及拼音向量的步骤包括:
[0023]通过所述交互层对所述信息特征矩阵及所述拼音特征矩阵进行交互,得到交互注意力矩阵;
[0024]基于所述交互注意力矩阵,分别对所述信息特征矩阵及所述拼音特征矩阵进行最大池化操作,得到对应的信息向量及拼音向量。
[0025]可选地,所述预测层包括拼接层、第一全连接层、第一Sigmoid函数,所述通过所述预测层对所述信息向量、所述拼音向量及所述第一通顺性向量进行计算,得到预测结果的步骤包括:
[0026]通过所述拼接层将所述信息向量、所述拼音向量及所述通顺性向量进行拼接,得到拼接后的预测向量;
[0027]通过所述第一全连接层及所述第一Sigmoid函数对所述预测向量进行计算,得到所述待识别信息为垃圾信息的概率,作为预测结果。
[0028]可选地,所述将所述待识别信息输入信息识别模型中进行预测,得到预测结果,其中,所述信息识别模型基于预设的矩阵编码器、预先创建的语句通顺性模型训练得到的步骤之前还包括:
[0029]创建所述语句通顺性模型,具体包括:
[0030]获取训练用的第二样本信息,所述第二样本信息包括第二垃圾信息和第二正常信息;
[0031]基于第二BERT模型、第三Transformer编码器、池化层、第二全连接层及第二Sigmoid函数,构建得到初始语句通顺性模型;
[0032]将所述第二样本信息输入所述初始语句通顺性模型,并结合第二损失函数对所述初始语句通顺性模型进行迭代训练,得到创建后的语句通顺性模型。
[0033]可选地,所述将所述第二样本信息输入所述初始语句通顺性模型,并结合第二损失函数对所述初始语句通顺性模型进行迭代训练,得到创建后的语句通顺性模型的步骤包括:
[0034]将所述第二样本信息输入所述初始语句通顺性模型中进行以下处理:
[0035]通过第二BERT模型对所述第二样本信息进行向量化,得到所述第二样本信息对应的第二样本矩阵;
[0036]通过所述第三Transformer编码器对所述第二样本矩阵进行特征提取,得到所述
第二样本矩阵对应的第二样本特征矩阵;
[0037]通过所述池化层对所述第二样本特征矩阵按预设的方向进行处理,得到所述第二样本特征矩阵对应的第二样本向量;
[0038]基于所述第二全连接层及第二Sigmoid函数,对所述第二样本向量进行计算,得到通顺度和第二通顺性向量;
[0039]基于标准交叉熵损失函数对所述通顺度进行计算,得到总损失值;
[0040]基于梯度下降算法及所述总损失值,得到修补参数;
[0041]结合所述修补参数训练所述初始语句通顺性模型;并返回步骤:将所述第二样本信息输入所述初始语句通顺性模型,得到通顺度和第二通顺性向量;
[0042]按照预设的循环次数以此循环,直到循环完毕,终止训练,得到创建后的语句通顺性模型。
[0043]本申请实施例还提出一种信息识别装置,所述信息识别装置包括:
[0044]获取信息模块,用于获取待识别信息;
[0045]信息识别模块,用于将所述待识别信息输入信息识别模型中进行预测,得到预测结果,其中,所述信息识别模型基于预设的矩阵编码器、预先创建的语句通顺性模型训练得到;
[0046]信息判断模块:用于根据所述预测结果判断所述待识别信息是否为垃圾信息。
[0047]本申请实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的信息识别程序,所述信息识别程序被所述处理器执行时实现如上所述的信息识别方法的步骤。
[0048]本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息识别方法,其特征在于,所述信息识别方法包括以下步骤:获取待识别信息;将所述待识别信息输入信息识别模型中进行预测,得到预测结果,其中,所述信息识别模型基于预设的矩阵编码器、预先创建的语句通顺性模型训练得到;根据所述预测结果判断所述待识别信息是否为垃圾信息。2.如权利要求1所述的信息识别方法,其特征在于,所述将所述待识别信息输入信息识别模型中进行预测,得到预测结果的步骤之前还包括:创建所述信息识别模型,具体包括:获取训练用的第一样本信息,所述第一样本信息包括第一垃圾信息和第一正常信息;基于第一BERT模型、Transformer编码器、预先创建的语句通顺性模型、预测层、交互层,构建得到初始信息识别模型;将所述第一样本信息输入所述初始信息识别模型,并结合第一损失函数对所述初始信息识别模型进行迭代训练,得到创建后的信息识别模型。3.如权利要求2所述的信息识别方法,其特征在于,所述Transformer编码器包括第一Transformer编码器及第二Transformer编码器,所述待识别信息包括信息文本和拼音文本,所述将所述待识别信息输入信息识别模型中进行预测,得到预测结果的步骤包括:将所述待识别信息输入所述信息识别模型中进行以下处理:通过所述信息识别模型中的第一BERT模型对所述信息文本及所述拼音文本进行文本向量化表示,得到对应的信息矩阵及拼音矩阵;将所述信息矩阵输入预先创建的语句通顺性模型进行判断,得到所述信息文本对应的第一通顺性向量;将所述信息矩阵及拼音矩阵分别对应输入到所述第一Transformer编码器及所述第二Transformer编码器进行特征提取,得到对应的信息特征矩阵及拼音特征矩阵;通过所述交互层对所述信息特征矩阵及所述拼音特征矩阵进行处理,得到对应的信息向量及拼音向量;通过所述预测层对所述信息向量、所述拼音向量及所述第一通顺性向量进行计算,得到预测结果。4.如权利要求3所述的信息识别方法,其特征在于,所述通过所述交互层对所述信息特征矩阵及所述拼音特征矩阵进行处理,得到对应的信息向量及拼音向量的步骤包括:通过所述交互层对所述信息特征矩阵及所述拼音特征矩阵进行交互,得到交互注意力矩阵;基于所述交互注意力矩阵,分别对所述信息特征矩阵及所述拼音特征矩阵进行最大池化操作,得到对应的信息向量及拼音向量。5.如权利要求3所述的信息识别方法,其特征在于,所述预测层包括拼接层、第一全连接层、第一Sigmoid函数,所述通过所述预测层对所述信息向量、所述拼音向量及所述第一通顺性向量进行计算,得到预测结果的步骤包括:通过所述拼接层将所述信息向量、所述拼音向量及所述通顺性向量进行拼接,得到拼接后的预测向量;通过所述第一全连接层及所述第一Sigmoid函数对所述预测向量进行计算,得到所述
待识...

【专利技术属性】
技术研发人员:蔡林杰杨显栋杨岳周钱海蒋海滨
申请(专利权)人:咪咕文化科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1