基于ERNIE模型和DCNN模型的还款预测方法技术

技术编号:27007525 阅读:23 留言:0更新日期:2021-01-08 17:12
本申请公开了一种基于ERNIE模型和DCNN模型的还款预测方法,该方法充分利用电话催收过程中生成的语音数据,并利用预训练后的ERNIE模型生成语音数据的语义表示,最终利用DCNN模型根据该语义表示确定预测结果。由于ERNIE模型在预训练过程中采用字掩码、词掩码、实体掩码和随机掩码四种掩码策略,因此能够学习到字层面、词层面、实体层面等知识信息,使得模型能够更好的捕捉到语义信息。而DCNN模型的宽卷积会使句子的长度增加,避免边缘信息丢失,且DCNN模型的动态池化层,能够保留原来序列的次序,显著提升还款预测的准确性和可靠性。此外,本申请还提供了一种基于ERNIE模型和DCNN模型的还款预测装置、设备及可读存储介质,其技术效果与上述方法相对应。

【技术实现步骤摘要】
基于ERNIE模型和DCNN模型的还款预测方法
本申请涉及自然语言处理
,特别涉及一种基于ERNIE模型和DCNN模型的还款预测方法、装置、设备及可读存储介质。
技术介绍
随着信用卡业务的规模的不断扩大和借贷人群的不断下沉,信用卡贷后催收业务面临着新的挑战。传统催收预测模型采用的数据为用户的申请资料或当前贷后还款信息,基于这些数据预测过程包括:对当前申请资料信息进行预处理,得到当前资料信息的目标自变量特征信息;对此信息采用算法模型搭建,然后通过大量的数据训练得到催收预测模型,从而达到提高预测精度的目的。但是,该方案没有有效利用对用户电话沟通过程中产生的大量语音数据,在催收过程中用户的语音数据是真实且宝贵的,能够为催收预测提供诸多有价值的信息,而这些信息是申请资料和贷后还款信息无法提供的。随着机器学习和深度学习的快速发展,从大规模的对话数据中学到有用信息成为可能。文本分类作为自然语言处理的一个重要分支,在近几年里得到了快速发展,目前一般通过深度学习进行文本分类,基于深度学习的文本分类效果的好坏取决于对如何更好地提取出数据的潜在语义信息特征。传统的机器学习通过one-hot编码、TFIDF、LDA、LSA等算法提取数据潜在信息,但是这些算法存在维度灾难的问题,而word2vec、glove、fasttext等词向量模型虽然有着各自的优点,但是却也存在依赖于输入数据的质量与数量大小,对于不同领域的知识仍然存在需要重新进行训练才能再次使用的尴尬处境。使用大规模语料库训练出预训练模型,然后针对不同任务再来对预训练模型进行微调的方式有效解决了上述问题,其典型代表就是BERT(BidirectionalEncoderRepresentationfromTransformers)模型及其泛化模型。而为了进一步提高分类任务的效果,使用BERT-CNN(ConvolutionalNeuralNetworks)模型是一种非常不错的解决方案。但是,该方案至少存在以下两个缺陷:(1)BERT模型在进行掩码过程中仅仅从字层面进行掩码,没有考虑到词之间存在的相关性,对语言模型联合概率存在偏差估计,同时存在预训练过程和生成过程存在不一致的情况,从而会导致预测精度较差。(2)CNN模型的卷积层的操作会使句子的长度变短,导致边缘信息丢失,且CNN模型池化层的操作会打乱句子的顺序。综上,如何充分利用电话催收过程中生成的语音数据,提升催收预测精度,并克服前述方案的缺陷,是亟待本领域技术人员解决的问题。
技术实现思路
本申请的目的是提供一种基于ERNIE模型和DCNN模型的还款预测方法、装置、设备及可读存储介质,用以解决当前的催收预测方案没有充分利用电话催收过程中的语音数据,导致预测精度较低的问题。其具体方案如下:第一方面,本申请提供了一种基于ERNIE模型和DCNN模型的还款预测方法,包括:利用文本数据集对ERNIE模型进行预训练;将预训练后的ERNIE模型与DCNN模型进行层级连接,得到还款预测模型;获取电话催收过程中生成的语音数据,采用ASR技术将所述语音数据转换为文本数据,并添加标签,得到训练样本;利用所述训练样本,对所述还款预测模型进行训练;将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果。优选的,在所述采用ASR技术将所述语音数据转换为文本数据之后,还包括:利用kenLM纠错模块或pycorrect纠错模块对所述文本数据进行纠错。优选的,所述利用文本数据集对ERNIE模型进行预训练,包括:根据文本数据集和多种掩码策略,构造训练集,所述多种掩码策略包括字掩码策略、词掩码策略、实体掩码策略、随机掩码策略;利用所述训练集对所述ERNIE模型进行预训练。优选的,所述多种掩码策略还包括句子掩码策略,所述句子掩码策略为:对于目标句子,随机选择起始位置进行掩码,掩码比例不超过所述目标句子句长的预设比例。优选的,所述将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果,包括:将待测语音数据对应的文本数据输入训练完成的还款预测模型的ERNIE模型,得到语义表示;将所述语义表示输入训练完成的还款预测模型的DCNN模型,得到预测结果。优选的,所述DCNN模型包括宽卷积层、动态池化层、Folding层、全连接层,所述将所述语义表示输入训练完成的还款预测模型的DCNN模型,得到预测结果,包括:利用宽卷积层对所述输入语义层表示进行卷积操作,提取完整句子信息,得到卷积结果,其中所述完整句子信息包括句首信息和句尾信息;利用动态池化层对所述卷积结果进行池化操作,得到池化结果;利用Folding层对所述池化结果进行降维,得到降维结果;利用全连接层将所述降维结果确定预测结果。优选的,所述ERNIE模型包括文本编码器和知识型编码器,所述将待测语音数据对应的文本数据输入训练完成的还款预测模型的ERNIE模型,得到语义表示,包括:利用文本编码器根据所述文本数据生成文本信息,所述文本信息词法信息和句法信息;利用知识型编码器将所述文本数据的知识信息整合到所述文本信息,得到语义表示。第二方面,本申请提供了一种基于ERNIE模型和DCNN模型的还款预测装置,包括:预训练模块:用于利用文本数据集对ERNIE模型进行预训练;模型构建模块:用于将预训练后的ERNIE模型与DCNN模型进行层级连接,得到还款预测模型;训练样本生成模块:用于获取电话催收过程中生成的语音数据,采用ASR技术将所述语音数据转换为文本数据,并添加标签,得到训练样本;模型训练模块:用于利用所述训练样本,对所述还款预测模型进行训练;预测模块:用于将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果。第三方面,本申请提供了一种基于ERNIE模型和DCNN模型的还款预测设备,包括:存储器:用于存储计算机程序;处理器:用于执行所述计算机程序,以实现如上所述的基于ERNIE模型和DCNN模型的还款预测方法。第四方面,本申请提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如上所述的基于ERNIE模型和DCNN模型的还款预测方法。本申请所提供的一种基于ERNIE模型和DCNN模型的还款预测方法,包括:利用文本数据集对ERNIE模型进行预训练;将预训练后的ERNIE模型与DCNN模型进行层级连接,得到还款预测模型;获取电话催收过程中生成的语音数据,采用ASR技术将语音数据转换为文本数据,并添加标签,得到训练样本;利用训练样本,对还款预测模型进行训练;将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果。可见,该方法充分利用电话催收过程中生成的语音数据,并利用预训练后的ERNIE模型生成语音数据的语义表示,最终利用DCNN模型根本文档来自技高网
...

【技术保护点】
1.一种基于ERNIE模型和DCNN模型的还款预测方法,其特征在于,包括:/n利用文本数据集对ERNIE模型进行预训练;/n将预训练后的ERNIE模型与DCNN模型进行层级连接,得到还款预测模型;/n获取电话催收过程中生成的语音数据,采用ASR技术将所述语音数据转换为文本数据,并添加标签,得到训练样本;/n利用所述训练样本,对所述还款预测模型进行训练;/n将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果。/n

【技术特征摘要】
1.一种基于ERNIE模型和DCNN模型的还款预测方法,其特征在于,包括:
利用文本数据集对ERNIE模型进行预训练;
将预训练后的ERNIE模型与DCNN模型进行层级连接,得到还款预测模型;
获取电话催收过程中生成的语音数据,采用ASR技术将所述语音数据转换为文本数据,并添加标签,得到训练样本;
利用所述训练样本,对所述还款预测模型进行训练;
将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果。


2.如权利要求1所述的方法,其特征在于,在所述采用ASR技术将所述语音数据转换为文本数据之后,还包括:
利用kenLM纠错模块或pycorrect纠错模块对所述文本数据进行纠错。


3.如权利要求1所述的方法,其特征在于,所述利用文本数据集对ERNIE模型进行预训练,包括:
根据文本数据集和多种掩码策略,构造训练集,所述多种掩码策略包括字掩码策略、词掩码策略、实体掩码策略、随机掩码策略;
利用所述训练集对所述ERNIE模型进行预训练。


4.如权利要求3所述的方法,其特征在于,所述多种掩码策略还包括句子掩码策略,所述句子掩码策略为:对于目标句子,随机选择起始位置进行掩码,掩码比例不超过所述目标句子句长的预设比例。


5.如权利要求1所述的方法,其特征在于,所述将待测语音数据对应的文本数据输入训练完成的还款预测模型,得到预测结果,包括:
将待测语音数据对应的文本数据输入训练完成的还款预测模型的ERNIE模型,得到语义表示;
将所述语义表示输入训练完成的还款预测模型的DCNN模型,得到预测结果。


6.如权利要求5所述的方法,其特征在于,所述DCNN模型包括宽卷积层、动态池化层、Folding层、全连接层,所述将所述语义表示输入训练完成的还款预测模型的DCNN模型,得到预测结果,包括:
利用宽...

【专利技术属性】
技术研发人员:李电祥陈学珉
申请(专利权)人:上海畅圣计算机科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1