一种用于电信运营商的个性化电信套餐推荐方法技术

技术编号:24856788 阅读:132 留言:0更新日期:2020-07-10 19:09
本发明专利技术涉及一种用于电信运营商的个性化电信套餐推荐方法,属于深度学习与推荐系统领域。包括步骤:对电信套餐的原始数据集进行预处理;采用SMOTE算法解决预处理后的数据集中样本分类不均衡问题;利用Word2vec训练经过上个步骤处理后的数据集中的文本特征,得到特征X

【技术实现步骤摘要】
一种用于电信运营商的个性化电信套餐推荐方法
本专利技术涉及一种用于电信运营商的个性化电信套餐推荐方法,特别涉及一种将Word2vec模型和深度与交叉网络相结合的推荐方法,适用于电信运营商进行智能化、个性化的套餐推荐,属于深度学习和推荐系统领域。
技术介绍
纵观全球,各国的电信企业逐渐市场化,电信行业的竞争日趋激烈。随着携号转网的正式实施,更是加剧了国内三大电信运营商之间的用户争夺战。为了扩大市场份额,提高自身核心竞争力,各个电信公司推出了多种多样的套餐类型以满足不同层次用户的差异化需求。然而,种类繁多的套餐设计组合虽然让用户有了更多选择空间的同时也往往使得新老用户在选择或者变更套餐时陷入困境。因此兼顾用户自身的实际需求和最大化电信公司的利润,如何精准智能地为用户提供个性化的套餐推荐对电信公司显得尤为重要。针对套餐推荐的问题目前的研究大都是使用机器学习算法来解决。基于K-最近邻模型(KNN)的电信套餐推荐方法,通过寻找相似的用户所选择的套餐,然后为用户推荐这些套餐。但是,当样本的特征维度非常大时,计算量太大,并且对训练数据极度依赖,容错性低。基于协同过滤的方法难以充分挖掘数据中的特征信息。逻辑回归(LR)推荐系统中常用的排序模型,该模型简单易用,在工业界应用广泛,但是该模型是一种线性模型,表达能力有限,没有考虑到特征之间的交叉,并且该模型通常需要人工特征工程。然而,基于人工先验知识的特征工程虽然可以设计出一些效果很好的特征组合,但是需要专门领域的业务知识,耗时费力,并且很有可能遗漏一些重要的交叉特征。基于神经网络的电信套餐推荐方法方法利用了神经网络强大的特征提取能力来挖掘隐含的特征信息,虽然不需要特征工程,但是该方法没有考虑低阶特征对于模型的重要性。同时考虑低阶和高阶特征交互会带来比单独考虑的情况更多的推荐性能的提升。并且,该方法无法利用丰富的文本信息,如果简单采用独热编码,容易造成维度爆炸。
技术实现思路
本专利技术正是为了解决这些问题提出了一种用于电信运营商的个性化电信套餐推荐方法。该方法利用Word2vec模型来训练文本信息并将之转换为一组词向量,不仅避免了维度爆炸,还保持了文本数据的语义信息。该方法是一种端到端的深度学习模型,不需要特征工程。它利用深度与交叉网络不仅能有效地捕获有限阶交叉特征和深层隐藏特征,还能充分利用数据中的文本信息进一步提高模型的推荐精度。本专利技术采用的技术方案是:一种用于电信运营商的个性化电信套餐推荐方法,包括如下步骤:对电信套餐的原始数据集进行预处理;采用SMOTE算法解决预处理后的数据集中样本分类不均衡问题;利用Word2vec训练经过上个步骤处理后的数据集中的文本特征,得到特征Xtex;将特征Xtex与进行过特征转换后的连续特征Xnorm和类别特征Xemb拼接,得到新的数据集;将交叉网络和前馈神经网络以并行方式组合,构建出电信套餐推荐模型;将新的数据集切分为训练集、验证集测试集;利用训练集和验证集训练、优化模型,并在测试集上进行性能测试;本专利技术在深度与交叉网络的基础上,采用Word2vec模型对文本特征进行训练,有效地提高了电信套餐推荐的精度,并且不需要特征工程。所述用于电信运营商的个性化电信套餐推荐方法具体步骤如下:步骤1:数据预处理:对原始的电信数据集进行预处理,剔除无用的数据,并对缺失的数据采用众数或者均值填充;步骤2:过采样:使用SMOTE算法,解决步骤1中预处理后的数据集样本分类不均衡问题;步骤3:给步骤2得到的数据集的每一行数据即每个用户的消费记录增加一个click标签,标签的含义表示用户是否会接受给他推荐的套餐,1表示接受,0表示拒绝;步骤4:将步骤3得到的数据集按照6:2:2的比例进行切分,将60%的数据作为训练集,20%的数据作为验证集,20%的数据作为测试集;步骤5:提取训练集中的文本特征,使用Word2vec文本特征进行训练,进行Word2vec训练得到每一个文本数据的一组上下文相关的词向量,作为数据集的Xtext特征;步骤6:提取训练集中的连续特征和类别特征分别进行标准化处理和embedding转化,得到Xnorm特征和Xemb特征;步骤7:拼接特征:将经过Word2vec训练后得到的文本特征Xtext和embedding转换后的类别特征Xemb以及标准化处理后的连续特征Xnorm进行拼接,得到特征集合x0=[Xemb,Xnorm,Xtext];步骤8:将三层交叉网络和四层前馈神经网络以并行地方式组合,构建电信套餐推荐模型;步骤9:有限阶交叉特征提取:将步骤7中拼接好后的特征集合x0送入交叉网络,利用交叉网络来进行低阶特征交互,得到交叉特征xcross;步骤10:深层高阶特征提取:将步骤7中拼接好后的特征集合x0送入前馈神经网络,利用前馈神经网络形成更加稠密的高层特征表示,得到深层特征xdeep;步骤11:将交叉网络和深度网络的输出再次拼接,得到xstack=[xdeep,xcross];步骤12:将步骤11得到的xstack通过激活函数Sigmoid,得到最终模型的输出;步骤13:模型的优化:利用损失函数计算步骤12的输出结果和步骤3的click标签的误差,再利用反向传播算法和Adam优化器对步骤8构建的电信套餐推荐模型不断优化;步骤:14:模型的验证和测试:对验证集和测试集依次进行步骤5,步骤6,步骤7操作;采用5折交叉验证对步骤13优化后的电信套餐推荐模型进行验证,并选择合适的超参数,使最终的电信套餐推荐模型在验证集上达到最佳性能;最后再对测试集进行模型性能测试。本专利技术的有益效果是:结合Word2vec模型和深度与交叉网络提出了一种端到端的深度学习推荐模型来进行电信套餐推荐,不需要耗时费力的人工特征工程。不仅利用了Word2vec提取文本特征,还能分别利用交叉网络和深度网络抽取有限阶交叉特征和深层次的隐藏特征,较为准确地为电信用户进行了套餐推荐,提高了推荐精度。附图说明图1是本专利技术一种用于电信运营商的个性化电信套餐推荐方法总体流程图;图2是本专利技术所使用的的数据集中的部分特征情况;图3是是本专利技术中用所使用的数据集中的套餐种类的分布情况统计图;图4是本专利技术中的电信套餐推荐模型的框架;图5是本专利技术中前馈神经网络中的激活函数RELU函数图像;图6是本专利技术中最后输出层使用的Sigmoid函数图像;图7是本专利技术中用来评价模型的另一个标准AUC面积;图8是本专利技术中用来评价模型的标准标准之一的LogLoss损失曲线。具体实施方式下面结合附图和具体实施例,对本专利技术做进一步的说明。实施例1:如图1-8所示,一种用于电信运营商的个性化电信套餐推荐方法,包括如下步骤:对电信套餐的原始数据集进行预处理;采用SMOTE算法解决预处理后的数据集中样本分类不均衡问题;利用Word2vec训练经过上个步骤处理后的数据集中的文本特征,得到特征Xtext本文档来自技高网
...

【技术保护点】
1.一种用于电信运营商的个性化电信套餐推荐方法,其特征在于:包括如下步骤:对电信套餐的原始数据集进行预处理;采用SMOTE算法解决预处理后的数据集中样本分类不均衡问题;利用Word2vec训练经过上个步骤处理后的数据集中的文本特征,得到特征X

【技术特征摘要】
1.一种用于电信运营商的个性化电信套餐推荐方法,其特征在于:包括如下步骤:对电信套餐的原始数据集进行预处理;采用SMOTE算法解决预处理后的数据集中样本分类不均衡问题;利用Word2vec训练经过上个步骤处理后的数据集中的文本特征,得到特征Xtext;将特征Xtext与进行过特征转换后的连续特征Xnorm和类别特征Xemb拼接,得到新的数据集;将交叉网络和前馈神经网络以并行方式组合,构建出电信套餐推荐模型;将新的数据集切分为训练集、验证集测试集;利用训练集和验证集训练、优化模型,并在测试集上进行性能测试。


2.根据权利要求1所述的用于电信运营商的个性化电信套餐推荐方法,其特征在于:具体步骤如下,
步骤1:数据预处理:对原始的电信数据集进行预处理,剔除无用的数据,并对缺失的数据采用众数或者均值填充;
步骤2:过采样:使用SMOTE算法,解决步骤1中预处理后的数据集样本分类不均衡问题;
步骤3:给步骤2得到的数据集的每一行数据即每个用户的消费记录增加一个click标签,标签的含义表示用户是否会接受给他推荐的套餐,1表示接受,0表示拒绝;
步骤4:将步骤3得到的数据集按照6:2:2的比例进行切分,将60%的数据作为训练集,20%的数据作为验证集,20%的数据作为测试集;
步骤5:提取训练集中的文本特征,使用Word2vec文本特征进行训练,进行Word2vec训练得到每一个文本数据的一组上下文相关的词向量,作为数据集的Xtext特征;
步骤6:提取训练...

【专利技术属性】
技术研发人员:王文卫守林石聪明
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1