System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,具体而言,涉及一种模型训练方法、装置及运营商套餐的推荐方法。
技术介绍
1、在当前的电信服务市场,套餐种类繁多,涵盖了不同的数据流量、通话时长、短信数量等服务,旨在满足不同用户群体的需求。然而,当前的电信运营商套餐推荐系统由于依赖静态模型和简单的规则系统,难以提供精准且个性化的服务。这些方法虽然能够根据用户的基本信息(如年龄、性别、地区等)和套餐使用历史进行初步推荐,但它们并未充分考虑个体用户需求的多样性和动态变化性,也忽略了用户行为模式的复杂性。这导致推荐准确性和用户满意度有限,因为静态模型难以捕捉用户的实时需求和情绪波动,而简单的统计方法则缺乏个性化和智能的决策机制。
2、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请提供了一种模型训练方法、装置及运营商套餐的推荐方法,以至少解决由于相关运营商套餐推荐方法受限于静态模型,未充分考虑用户需求的动态变化性,造成的对运营商套餐的推荐精准度较低的技术问题。
2、根据本申请的一个方面,提供了一种模型训练方法,包括:获取目标对象的历史运营商套餐数据以及历史语音数据,其中,历史运营商套餐数据为包括关于目标对象的属性信息和历史套餐使用信息的多维度信息,历史语音数据中包括对运营商套餐数据的使用需求信息;生成历史运营商套餐数据对应的第一行向量,对历史语音数据中的使用需求信息进行情感分析,得到第二行向量,其中,第一行向量中的分量为不同类型的针对目标对象的推荐套餐,第二行向量中的分量为目
3、可选地,根据目标概率状态向量、动作向量以及奖励函数,确定目标函数,包括:将当前优化参数下的若干个状态向量及动作向量对确定为观测值,得到包括多个观测值的观测矩阵;根据目标概率、观测矩阵以及奖励函数,确定负对数边际似然函数,将负对数边际似然函作为目标函数;更新优化参数,包括:获取多输出学生t过程中的模型参数,其中,模型参数包括:自由度、均值函数、协方差函数、参数矩阵以及优化参数;计算负对数边际似然相对于多输出学生t过程中的模型参数的导数,并沿着导数的反方向更新模型参数。
4、可选地,根据第一行向量以及第二行向量,确定情感倾向奖励,包括:根据目标对象所使用的历史运营商套餐的活跃度指标,确定第一权重;根据目标对象所使用的历史运营商套餐的套餐价值指标,确定第二权重;根据第一权重、第二权重、第一行向量以及第二行向量,确定情感倾向奖励。
5、可选地,根据情感倾向奖励,确定奖励函数,包括:获取目标对象对目标对象所使用的历史运营商套餐满意度指标、运营商对目标对象所使用的历史运营商套餐的收益指标以及关于目标对象所使用的历史运营商套餐的市场适应性指标;对情感倾向奖励、满意度指标、收益指标以及市场适应性指标进行加权求和,得到奖励函数。
6、可选地,更新优化参数,包括:获取当前优化参数下的若干个状态向量及动作向量对;在每一个状态向量及动作向量中计算奖励函数,并根据计算结果,更新优化参数,直至状态向量及动作向量对的数学期望大于预设阈值。
7、可选地,生成历史运营商套餐数据对应的第一行向量,包括:对历史运营商套餐数据进行数据清洗,并对数据清洗后的历史运营商套餐数据中的缺失数据进行插值补零处理,得到多个维度的初始数据,其中,多个维度包括:目标对象的标识信息、年龄信息、性别信息、地区信息、套餐补贴信息、套餐使用信息、套餐外的通话信息、套餐外的短信信息、套餐外的流量信息;对多个维度的初始数据进行特征提取,得到多个初始特征,对多个初始特征进行归一化处理,得到多个第一特征;基于多个第一特征,生成推荐给目标对象的不同类型的推荐套餐,得到第一行向量。
8、可选地,对历史语音数据中的使用需求信息进行情感分析,得到第二行向量,包括:将历史语音数据转化为文本数据,对文本数据进行特征提取处理,得到文本特征向量,其中,特征提取处理包括以下至少之一:词频统计、语法分析以及主题建模;使用预训练的情感分析模型对文本特征向量进行情感倾向分析,得到目标对象对不同类型推荐套餐的情感倾向的量化评分;将量化评分转化为向量形式,得到第二行向量。
9、根据本申请的再一方面,还提供了一种运营商套餐的推荐方法,包括:获取目标对象的运营商套餐数据以及语音数据,其中,运营商套餐数据为包括关于目标对象的属性信息和套餐使用信息的多维度信息,语音数据中包括对运营商套餐数据的使用需求信息;将向量化处理后的运营商套餐数据以及语音数据输入完成训练的生成对抗网络模型中,得到完成训练的生成对抗网络模型输出的针对目标对象的推荐套餐,其中,生成对抗网络模型为以上的模型训练方法进行训练所得到的。
10、根据本申请的再一方面,还提供了一种模型训练装置,包括:获取模块,用于获取目标对象的历史运营商套餐数据以及历史语音数据,其中,历史运营商套餐数据为包括关于目标对象的属性信息和历史套餐使用信息的多维度信息,历史语音数据中包括对运营商套餐数据的使用需求信息;生成模块,用于生成历史运营商套餐数据对应的第一行向量,对历史语音数据中的使用需求信息进行情感分析,得到第二行向量,其中,第一行向量中的分量为不同类型的针对目标对象的推荐套餐,第二行向量中的分量为目标对象对不同类型的推荐套餐的情感倾向信息;合并模块,用于合并第一行向量以及第二行向量,得到目标矩阵,其中,目标矩阵的行用于表征推荐套餐的套餐类别,列用于表征套餐类别所对应的特征;输入模块,用于将目标矩阵输入生成对抗网络模型,得到生成对抗网络模型中的生成器输出的与目标矩阵具有相似分布的目标数据,以及生成对抗网络模型中的判别器输出的目标数据是真实数据的目标概率;确定模块,用于根据第一行向量以及第二行向量,确定情感倾向奖励,并根据情感倾向奖励,确定奖励函数,将目标矩阵以及目标数据确定为状态向量,将针对目标对象的推荐套餐确定为动作向量,并根据目标概率状态向量、动作向量以及奖励函数,确定目标函数;更新模块,用于将目标概率确定为优化参数,以最大化目标函数以目标,更新优化参数,在判别器中,若关于目标概率的损失函数满足预设收敛条件,得到完成训练的生成对抗网络模型。
11、根据本申请的再一方面,还提供了一种非易失性本文档来自技高网...
【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,根据所述第一行向量以及所述第二行向量,确定情感倾向奖励,包括:
4.根据权利要求1或3所述的方法,其特征在于,根据所述情感倾向奖励,确定奖励函数,包括:
5.根据权利要求1所述的方法,其特征在于,更新所述优化参数,包括:
6.根据权利要求1所述的方法,其特征在于,生成所述历史运营商套餐数据对应的第一行向量,包括:
7.根据权利要求1所述的方法,其特征在于,对所述历史语音数据中的所述使用需求信息进行情感分析,得到第二行向量,包括:
8.一种运营商套餐的推荐方法,其特征在于,包括:
9.一种模型训练装置,其特征在于,包括:
10.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述的模型训练方法以及权利要求8所述的运营商套餐的推荐方法。
12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任意一项所述的模型训练方法以及权利要求8所述的运营商套餐的推荐方法。
...【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,根据所述第一行向量以及所述第二行向量,确定情感倾向奖励,包括:
4.根据权利要求1或3所述的方法,其特征在于,根据所述情感倾向奖励,确定奖励函数,包括:
5.根据权利要求1所述的方法,其特征在于,更新所述优化参数,包括:
6.根据权利要求1所述的方法,其特征在于,生成所述历史运营商套餐数据对应的第一行向量,包括:
7.根据权利要求1所述的方法,其特征在于,对所述历史语音数据中的所述使用需求信息进行情感分析,得到第二行向量,包括:
8.一种运营商套餐的推荐方法,其特征在于,包括...
【专利技术属性】
技术研发人员:李清,王渊,龚志,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。