当前位置: 首页 > 专利查询>邱戴飞专利>正文

基于深度神经网络的身份信息预测模型训练方法及装置制造方法及图纸

技术编号:28422407 阅读:19 留言:0更新日期:2021-05-11 18:30
本发明专利技术提供一种基于深度神经网络的身份信息预测模型训练方法及装置,获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集;基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型;选取优化器,基于训练集、验证集和测试集中对RNN结构模型、CNN结构模型以及DNN结构模型进行训练,当模型的误差函数连续5次没有下降则停止训练;分别选取3个结构模型中的最优模型进行身份信息预测。本发明专利技术通过深度神经网络模型的优秀参数化建模能力,将数据集中的样本数据中的相关性信息进行训练,经过训练后的模型能够给出较准确的结果,使得身份信息预测的准确性较高。

【技术实现步骤摘要】
基于深度神经网络的身份信息预测模型训练方法及装置
本专利技术涉及人工智能技术,尤其涉及一种基于深度神经网络的身份信息预测模型训练方法及装置。
技术介绍
大数据时代,面向用户的系统一般都需要构建用户画像。用户性别是构建用户画像时一个非常重要的标签。通过用户姓名来预测用户的性别的算法逻辑是基于中文文字和性别的相关性,例如凤,丽,娟,洁一般出现在女性姓名中的概率较大,而龙,强,栋,斌出现在男性姓名中的概率较大。现有方法通过贝叶斯公式P(Y|X)=P(X|Y)*P(Y)/P(X)(Y为类别,X为特定样本)将后验概率转化为先验概率(P(Y),P(X))乘似然P(X|Y)来计算特定姓名属于某种性别的概率。但是,基于贝叶斯公式计算的性别等信息的正确概率较低,误差较大。
技术实现思路
本专利技术实施例提供一种基于深度神经网络的身份信息预测模型训练方法及装置,本专利技术通过深度神经网络模型的优秀参数化建模能力,将数据集中的样本数据中的相关性信息进行训练,经过训练后的模型能够给出较准确的结果,使得身份信息预测的准确性较高。本专利技术实施例的第一方面,提供一种基于深度神经网络的身份信息预测模型训练方法,包括:获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集;基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型;选取优化器,基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练,当模型的误差函数连续5次没有下降则停止训练;分别选取RNN结构模型、CNN结构模型以及DNN结构模型中的最优模型进行身份信息预测。可选地,在第一方面的一种可能实现方式中,所述获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集包括:获取所述姓名中的姓和名,将所述姓对应的文字删除;对所述名进行性别的标注,其中每个名对应唯一的一个性别;统计所有名,将所有的名按照出现的评率进行倒序排列,选取vocab_size-1的高频字,再加上"<PAD>"用于表示填充字符,建立词汇表;将数据集中的名按照80%,10%,10%的比例随机划分为训练集,验证集和测试集。可选地,在第一方面的一种可能实现方式中,所述RNN结构模型包括6层,结构包括:第一层是Embeddinglayer,节点数为embedding_dim;第二层和第三层分别是双向LSTM构成的RNN层,节点数为hidden_dim;第四层是全连接层,节点数为hidden_dim,激励函数为relu函数;第五层是dropout层,keep_prob为0.8;第六层是输出层,节点数为1,激励函数为sigmoid函数;其中,所述embedding_dim、hidden_dim为可配置参数,embedding_dim为64,hidden_dim为128。可选地,在第一方面的一种可能实现方式中,所述CNN结构模型包括7层,结构包括:第一层是Embeddinglayer,节点数为embedding_dim;第二层是dropout层,keep_prob为0.8;第三层为1维卷积层,卷积数为256,卷积核大小为5;第四层是全局池化层;第五层是全连接层,节点数为hidden_dim;第六层为dropout层,keep_prob为0.8;第7层为输出层,节点数为1,激励函数为sigmoid函数;其中,所述embedding_dim,hidden_dim为可配置参数,embedding_dim为64,hidden_dim为128。可选地,在第一方面的一种可能实现方式中,所述DNN结构模型包括5层,结构包括:第一层是embeddinglayer,输入长度为3;第二层是个展开层,将3个embedding拼接成一个向量;第三为全连接层,节点数为128,激励函数是relu函数;第四为全连接层,节点数为64,激励函数是relu函数;第五层为输出层,节点数是1,激励函数为sigmoid函数。可选地,在第一方面的一种可能实现方式中,选取优化器,对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练,当模型的误差函数连续5次没有下降则停止训练包括:所述优化器为Adam,其中learning_rate为1e-3,训练过程中监控accuracy及precision指标,在所述数据集上迭代至少20个批次,当误差函数连续5次没有下降则停止训练。本专利技术实施例的第二方面,提供一种基于深度神经网络的身份信息预测模型训练装置,包括:获取模块,用于获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集;定义模块,用于基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型;训练模块,用于选取优化器,基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练,当模型的误差函数连续5次没有下降则停止训练;预测模块,用于分别选取RNN结构模型、CNN结构模型以及DNN结构模型中的最优模型进行身份信息预测。可选地,在第二方面的一种可能实现方式中,所述获取模块包括:获取单元,用于获取所述姓名中的姓和名,将所述姓对应的文字删除;标注单元,用于对所述名进行性别的标注,其中每个名对应唯一的一个性别;统计单元,用于统计所有名,将所有的名按照出现的评率进行倒序排列,选取vocab_size-1的高频字,再加上"<PAD>"用于表示填充字符,建立词汇表;划分单元,用于将数据集中的名按照80%,10%,10%的比例随机划分为训练集,验证集和测试集。本专利技术实施例的第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述第一方面中任意一项所述的方法。本专利技术实施例的第四方面,提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行上述第一方面中任意一项所述的方法。本专利技术提供的一种基于深度神经网络的身份信息预测模型训练方法及装置,基于深度神经网络模型的优秀参数化建模能力,将样本数据中的相关性信息进行训练,编码在模型参数中,经过训练后的模型能够给出较准确的结果。其实际结果的准确率优于通过贝叶斯获得的性别准确率。附图说明图1为基于深度神经网络的身份信息预测模型训练方法的流程示本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络的身份信息预测模型训练方法,其特征在于,包括:/n获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集;/n基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型;/n选取优化器,基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练,当模型的误差函数连续5次没有下降则停止训练;/n分别选取RNN结构模型、CNN结构模型以及DNN结构模型中的最优模型进行身份信息预测。/n

【技术特征摘要】
1.一种基于深度神经网络的身份信息预测模型训练方法,其特征在于,包括:
获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集;
基于网络结构将神经网络模型分别定义为RNN结构模型、CNN结构模型以及DNN结构模型;
选取优化器,基于训练集、验证集和测试集中的任意一种或多种对所述RNN结构模型、CNN结构模型以及DNN结构模型进行训练,当模型的误差函数连续5次没有下降则停止训练;
分别选取RNN结构模型、CNN结构模型以及DNN结构模型中的最优模型进行身份信息预测。


2.根据权利要求1所述的身份信息预测模型训练方法,其特征在于,
所述获取姓名的数据集,所述数据集包括姓名以及该姓名所对应的性别,将所述数据集按照预设规则划分为训练集、验证集和测试集包括:
获取所述姓名中的姓和名,将所述姓对应的文字删除;
对所述名进行性别的标注,其中每个名对应唯一的一个性别;
统计所有名,将所有的名按照出现的评率进行倒序排列,选取vocab_size-1的高频字,再加上"<PAD>"用于表示填充字符,建立词汇表;
将数据集中的名按照80%,10%,10%的比例随机划分为训练集,验证集和测试集。


3.根据权利要求1所述的身份信息预测模型训练方法,其特征在于,
所述RNN结构模型包括6层,结构包括:
第一层是Embeddinglayer,节点数为embedding_dim;
第二层和第三层分别是双向LSTM构成的RNN层,节点数为hidden_dim;
第四层是全连接层,节点数为hidden_dim,激励函数为relu函数;
第五层是dropout层,keep_prob为0.8;
第六层是输出层,节点数为1,激励函数为sigmoid函数;
其中,所述embedding_dim、hidden_dim为可配置参数,embedding_dim为64,hidden_dim为128。


4.根据权利要求1所述的身份信息预测模型训练方法,其特征在于,
所述CNN结构模型包括7层,结构包括:
第一层是Embeddinglayer,节点数为embedding_dim;
第二层是dropout层,keep_prob为0.8;
第三层为1维卷积层,卷积数为256,卷积核大小为5;
第四层是全局池化层;
第五层是全连接层,节点数为hidden_dim;
第六层为dropout层,keep_prob为0.8;
第7层为输出层,节点数为1,激励函数为sigmoid函数;
其中,所述embedding_dim,hidden_dim为可配置参数,embedding_dim为64,hidden_dim为128。

【专利技术属性】
技术研发人员:邱戴飞范勇王凌波
申请(专利权)人:邱戴飞杭州巨灵兽智能科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1