System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智能ai,具体为基于训练数据采集的ai模型训练方法。
技术介绍
1、人工智能涉及利用计算机系统模拟人类智能的各项功能,而机器学习则专注于通过算法和数据来实现自动学习和预测。如何通过大量的训练数据来优化和提升ai模型的性能。这种方法特别适用于需要处理大量数据并做出智能决策的应用场景,例如智能客服系统。在电信行业,智能客服系统通过这种方法不断优化其服务能力,以更好地满足用户需求
2、当前的智能客服系统在实际应用中常遇到以下缺陷:首先,现有系统对复杂问题的理解能力有限,无法有效处理用户的非标准化问题和投诉。其次,系统的自助服务功能往往依赖于规则和模板,缺乏灵活性和智能化,导致用户问题无法得到满意解决。此外,系统对用户互动数据的分析不够深入,无法准确识别高频问题和潜在的用户需求。因此,人工客服的需求依然很高,系统的自助服务功能未能充分发挥其潜力。
技术实现思路
1、针对现有技术的不足,本专利技术提供了基于训练数据采集的ai模型训练方法,解决了
技术介绍
中提到的问题。
2、为实现以上目的,本专利技术通过以下技术方案予以实现:基于训练数据采集的ai模型训练方法,包括以下步骤:
3、s1、采集用户与客服系统的互通数据,包括语音记录、文本聊天记录、用户反馈、等待时间和解决时长,对互通数据进行处理和提取后组成交互数据组uid;
4、s2、对交互数据组uid进行特征提取,获取用户交互特征信息、问题类型特征信息、反馈评分特征信息、用户状态特征信
5、s3、通过使用特征向量f对用户的互通数据进行初步分类,并获取高频问题比例和低频问题比例,再对特征向量f进行聚类分析,获取问题类别聚类中心ck,同步对问题类别聚类中心ck进行迭代调控;
6、s4、将特征向量f和问题类别聚类中心ck进行拟合,进行识别互通数据,并触发相应的自动响应策略rj;
7、s5、对自动响应策略rj进行评估,统计自动响应策略rj在不同时间段和不同问题类型的表现,获取系统性能评估指数p,并与预设的系统运行性能状态评估阈值yz进行匹配,获取系统运行状态评估结果;
8、s6、根据系统运行状态评估结果进行触发对自动响应策略rj的迭代调控。
9、优选的,其中s1、采集用户与客服系统的互通数据,包括语音记录、文本聊天记录、用户反馈、等待时间和解决时长,并使用语音转文本和自然语言处理技术进行处理,组成互通数据;
10、其中,语音记录的数据具体通过捕捉用户与客服系统之间的语音交互内容,生成语音文件,包括用户提问、客服回应的音频文件以及语音记录标记每次交互的时间戳,包括通过语言录音设备进行记录获取;
11、文本聊天记录通过客服系统的聊天记录功能,实时记录用户与客服的所有文本对话内容,包括用户输入的消息、客服的回复以及每条消息的时间戳;
12、用户反馈通过在每次交互结束后,通过调查问卷或评分系统,收集用户对客服体验的反馈,包括采集用户评分作为用户反馈的表现;
13、等待时间和解决时长通过标记自动跟踪用户从发起请求到首次响应的时间,以及问题解决的总时长,获取等待时间wt和解决时长st,组成交互数据组uid,具体为uid={语音记录,文本聊天记录,用户反馈,wt,st}。
14、优选的,其中,s2还包括s21和s22;
15、s21、对交互数据组uid进行特征提取,获取用户交互特征信息、问题类型特征信息、反馈评分特征信息、用户状态特征信息和解决的问题特征信息;
16、s22、对用户交互特征信息、问题类型特征信息、反馈评分特征信息、用户状态特征信息和解决的问题特征信息进行特征信息标准化和特征信息转换,获取总响应tat、问题类别qty、用户评价eva、客户反馈ctf和问题解决率rsr,并组成特征向量f,具体为f={tat,qty,eva,ctf,rsr};
17、其中,总响应tat通过对用户交互特征信息使用tat=wt+st处理方式获取;
18、问题类别qty通过使用自然语言处理技术对问题类型特征信息进行分析,获取问题的类别信息,具体通过以下s221、s222、s223和s224进行获取问题类别;
19、用户评价eva通过从反馈评分特征信息中的用户反馈数据中提取评分数据,并进行标准化处理,将评分数据的范围调整到0至1之间,所述标准化处理具体通过以下计算公式进行处理:
20、
21、式中,ur表示用户给出的实际评分,maxr表示系统的上限评分,minr表示系统的下限评分;
22、客户反馈ctf通过使用自然语言处理技术和情感分析模型对用户状态特征信息进行分析,获取范围0至1的用户反馈程度值,其中情感分析模型包括vader、textblob和bert模型;
23、问题解决率rsr通过从解决的问题特征信息中提取问题的解决状态,包括解决和未解决并获取下标值1和0,通过统计问题总数和解决的问题总数的比例获取。
24、优选的,其中,s221、s222、s223和s224进行获取问题类别的内容具体为:
25、s221、文本预处理,对文本聊天记录进行分词、去停用词和词干提取处理;
26、s222、特征提取,使用词袋模型和词嵌入将文本转换为特征向量;
27、s223、分类器训练,应用监督学习算法,包括svm、随机森林和深度学习模型对标记的训练数据进行训练,以识别问题类别;
28、s224、类别标注,将每次用户交互文本的特征向量输入分类器,获取问题类别qty。
29、优选的,其中,s3还包括s31和s32;
30、s31、通过使用特征向量f对用户的互通数据进行初步分类,并获取高频问题比例和低频问题比例,再对特征向量f进行聚类分析,获取问题类别聚类中心ck;
31、其中,聚类分析通过以下计算公式进行分析:
32、
33、式中,ck表示问题类别聚类中心,具体表示第k个类别的聚类中心,nk表示属于第k个类别的样本数量,cluster,k表示第k个类别的样本集合,fi表示特征向量f中第i个样本的特征向量。
34、优选的,s32、对问题类别聚类中心ck进行迭代调控,获取更新后的更新聚类中心ck,new和计算样本i到k类别中心的距离d;
35、所述更新聚类中心ck,new通过以下计算公式获取:
36、
37、式中,wi表示第i个样本的权重值;
38、所述距离d通过以下计算公式获取:
39、
40、式中,di,k表示样本i到k类别的中心的距离d,t表示句子的转置,具体用于将列向量转换为行向量。
41、优选的,其中,s4还包括s41和s42;
42、s本文档来自技高网...
【技术保护点】
1.基于训练数据采集的AI模型训练方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于训练数据采集的AI模型训练方法,其特征在于:其中S1、采集用户与客服系统的互通数据,包括语音记录、文本聊天记录、用户反馈、等待时间和解决时长,并使用语音转文本和自然语言处理技术进行处理,组成互通数据;
3.根据权利要求2所述的基于训练数据采集的AI模型训练方法,其特征在于:其中,S2还包括S21和S22;
4.根据权利要求3所述的基于训练数据采集的AI模型训练方法,其特征在于:其中,S221、S222、S223和S224进行获取问题类别的内容具体为:
5.根据权利要求1所述的基于训练数据采集的AI模型训练方法,其特征在于:其中,S3还包括S31和S32;
6.根据权利要求5所述的基于训练数据采集的AI模型训练方法,其特征在于:S32、对问题类别聚类中心Ck进行迭代调控,获取更新后的更新聚类中心Ck,new和计算样本i到k类别中心的距离d;
7.根据权利要求6所述的基于训练数据采集的AI模型训练方法,其特征在于:其中
8.根据权利要求7所述的基于训练数据采集的AI模型训练方法,其特征在于:S42、根据获取的分配样本类别Rj对触发相应的自动响应策略Rj进行二次评估,获取二次评估触发结果,并根据二次评估触发结果进行触发自动响应策略Rj的执行;
9.根据权利要求7所述的基于训练数据采集的AI模型训练方法,其特征在于:其中,S5还包括S51和S52;
10.根据权利要求7所述的基于训练数据采集的AI模型训练方法,其特征在于:其中,S6、根据系统运行状态评估结果进行触发对自动响应策略Rj的迭代调控中的触发方式通过以下方式进行触发:
...【技术特征摘要】
1.基于训练数据采集的ai模型训练方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于训练数据采集的ai模型训练方法,其特征在于:其中s1、采集用户与客服系统的互通数据,包括语音记录、文本聊天记录、用户反馈、等待时间和解决时长,并使用语音转文本和自然语言处理技术进行处理,组成互通数据;
3.根据权利要求2所述的基于训练数据采集的ai模型训练方法,其特征在于:其中,s2还包括s21和s22;
4.根据权利要求3所述的基于训练数据采集的ai模型训练方法,其特征在于:其中,s221、s222、s223和s224进行获取问题类别的内容具体为:
5.根据权利要求1所述的基于训练数据采集的ai模型训练方法,其特征在于:其中,s3还包括s31和s32;
6.根据权利要求5所述的基于训练数据采集的ai模型训练方法,其特征在...
【专利技术属性】
技术研发人员:吉晨亮,蔡晓旭,
申请(专利权)人:上海钛镁网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。