基于深度神经网络的身份信息预测模型训练方法及装置制造方法及图纸

技术编号：28422407 阅读：28 留言：0更新日期：2021-05-11 18:30

本发明专利技术提供一种基于深度神经网络的身份信息预测模型训练方法及装置，获取姓名的数据集，所述数据集包括姓名以及该姓名所对应的性别，将所述数据集按照预设规则划分为训练集、验证集和测试集；基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型；选取优化器，基于训练集、验证集和测试集中对RNN结构模型、CNN结构模型以及DNN结构模型进行训练，当模型的误差函数连续5次没有下降则停止训练；分别选取3个结构模型中的最优模型进行身份信息预测。本发明专利技术通过深度神经网络模型的优秀参数化建模能力，将数据集中的样本数据中的相关性信息进行训练，经过训练后的模型能够给出较准确的结果，使得身份信息预测的准确性较高。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度神经网络的身份信息预测模型训练方法及装置
本专利技术涉及人工智能技术，尤其涉及一种基于深度神经网络的身份信息预测模型训练方法及装置。
技术介绍
大数据时代，面向用户的系统一般都需要构建用户画像。用户性别是构建用户画像时一个非常重要的标签。通过用户姓名来预测用户的性别的算法逻辑是基于中文文字和性别的相关性，例如凤，丽，娟，洁一般出现在女性姓名中的概率较大，而龙，强，栋，斌出现在男性姓名中的概率较大。现有方法通过贝叶斯公式P(Y|X)＝P(X|Y)*P(Y)/P(X)(Y为类别，X为特定样本)将后验概率转化为先验概率(P(Y),P(X))乘似然P(X|Y)来计算特定姓名属于某种性别的概率。但是，基于贝叶斯公式计算的性别等信息的正确概率较低，误差较大。
技术实现思路
本专利技术实施例提供一种基于深度神经网络的身份信息预测模型训练方法及装置，本专利技术通过深度神经网络模型的优秀参数化建模能力，将数据集中的样本数据中的相关性信息进行训练，经过训练后的模型能够给出较准确的结果，使得身份信息预测的准确性较高。本专利技术实施例的第一方面，提供一种基于深度神经网络的身份信息预测模型训练方法，包括：获取姓名的数据集，所述数据集包括姓名以及该姓名所对应的性别，将所述数据集按照预设规则划分为训练集、验证集和测试集；基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型；选取优化器，基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN...

【技术保护点】
1.一种基于深度神经网络的身份信息预测模型训练方法，其特征在于，包括：/n获取姓名的数据集，所述数据集包括姓名以及该姓名所对应的性别，将所述数据集按照预设规则划分为训练集、验证集和测试集；/n基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型；/n选取优化器，基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练，当模型的误差函数连续5次没有下降则停止训练；/n分别选取RNN结构模型、CNN结构模型以及DNN结构模型中的最优模型进行身份信息预测。/n

【技术特征摘要】
1.一种基于深度神经网络的身份信息预测模型训练方法，其特征在于，包括：
获取姓名的数据集，所述数据集包括姓名以及该姓名所对应的性别，将所述数据集按照预设规则划分为训练集、验证集和测试集；
基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型；
选取优化器，基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练，当模型的误差函数连续5次没有下降则停止训练；
分别选取RNN结构模型、CNN结构模型以及DNN结构模型中的最优模型进行身份信息预测。

2.根据权利要求1所述的身份信息预测模型训练方法，其特征在于，
所述获取姓名的数据集，所述数据集包括姓名以及该姓名所对应的性别，将所述数据集按照预设规则划分为训练集、验证集和测试集包括：
获取所述姓名中的姓和名，将所述姓对应的文字删除；
对所述名进行性别的标注，其中每个名对应唯一的一个性别；
统计所有名，将所有的名按照出现的评率进行倒序排列，选取vocab_size-1的高频字，再加上＂<PAD>＂用于表示填充字符，建立词汇表；
将数据集中的名按照80％，10％，10％的比例随机划分为训练集，验证集和测试集。

3.根据权利要求1所述的身份信息预测模型训练方法，其特征在于，
所述RNN结构模型包括6层，结构包括：
第一层是Embeddinglayer，节点数为embedding_dim；
第二层和第三层分别是双向LSTM构成的RNN层，节点数为hidden_dim；
第四层是全连接层，节点数为hidden_dim，激励函数为relu函数；
第五层是dropout层，keep_prob为0.8；
第六层是输出层，节点数为1，激励函数为sigmoid函数；
其中，所述embedding_dim、hidden_dim为可配置参数，embedding_dim为64，hidden_dim为128。

4.根据权利要求1所述的身份信息预测模型训练方法，其特征在于，
所述CNN结构模型包括7层，结构包括：
第一层是Embeddinglayer，节点数为embedding_dim；
第二层是dropout层，keep_prob为0.8；
第三层为1维卷积层，卷积数为256，卷积核大小为5；
第四层是全局池化层；
第五层是全连接层，节点数为hidden_dim；
第六层为dropout层，keep_prob为0.8；
第7层为输出层，节点数为1，激励函数为sigmoid函数；
其中，所述embedding_dim，hidden_dim为可配置参数，embedding_dim为64，hidden_dim为128。

【专利技术属性】
技术研发人员：邱戴飞，范勇，王凌波，
申请(专利权)人：邱戴飞，杭州巨灵兽智能科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人