System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,更具体地,涉及一种用户投诉文本处理方法、一种用户投诉文本处理装置、一种电子设备、一种计算机可读存储介质以及一种计算机程序产品。
技术介绍
1、投诉是用户主动进行信息共享和意见反馈的一种行为,能反映出用户遇到的问题,并蕴藏着丰富且宝贵的信息。因而,用户投诉文本是衡量用户对产品或服务的质量的重要指标。
2、对用户投诉文本进行分析不仅可以快速揭示有关产品属性或服务质量的紧急问题,还可以理解和响应用户偏好的变化,从中发现用户的潜在需求,从而指导商品或服务的改进,并防止用户流失。
3、因而,目前亟需一种准确、及时且高效的用户投诉文本处理方法或装置,以在投诉文本与产品的改进、服务的改进之间建立直观联系。
技术实现思路
1、本申请提供了一种可至少部分解决上述问题或其他问题的用户投诉文本处理方法、用户投诉文本处理装置、电子设备、计算机可读存储介质以及计算机程序产品。
2、本申请一方面提供了一种用户投诉文本处理方法,所述方法包括:确定所述投诉文本的分布特征,其中所述投诉文本的分布特征包括投诉问题分类标签;对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词;确定所述主题关键词与所述投诉问题分类标签之间的关联规则;以及基于已与所述投诉问题分类标签确定了所述关联规则的所述主题关键词,对与所述投诉问题分类标签对应的产品或服务进行改进。
3、在本申请一个实施方式中,对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词
4、在本申请一个实施方式中,所述方法还包括:基于情感词典或机器学习,对多个所述投诉文本进行情感分析,以确定多个所述投诉文本中负面情感强度高的投诉文本;以及对所述负面情感强度高的投诉文本进行所述主题建模。
5、在本申请一个实施方式中,所述情感分析包括情感极性和情感强度,所述情感极性包括正面和负面,其中基于情感词典或机器学习,对多个所述投诉文本进行情感分析,以确定多个所述投诉文本中负面情感强度高的投诉文本包括:基于所述情感词典或所述机器学习,确定多个所述投诉文本的情感极性分值;以及将多个所述投诉文本中所述情感极性分值小于第一阈值的文本确定为所述负面情感强度高的投诉文本。
6、在本申请一个实施方式中,对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词包括:利用统计方法以及专家方法中的至少一种,为所述主题建模确定主题数量。
7、在本申请一个实施方式中,利用统计方法以及专家方法中的至少一种,为所述主题建模确定主题数量包括:利用统计方法以及专家方法中的至少一种,确定多个不同的初始化主题数量;基于初始化主题对所述投诉文本进行所述主题建模,并获得与所述初始化主题对应的单词组;基于所述单词组中出现频率相对较高的多个单词之间的语义相似程度值,确定所述初始化主题的一致性得分;将与一致性得分最高对应的初始化主题数量确定为所述主题建模的所述主题数量。
8、在本申请一个实施方式中,对所述投诉文本进行主题建模还包括:基于词袋模型,将所述投诉文本的文本数据转换为词向量,并将所述词向量输入无监督概率模型,以进行所述主题建模;以及对具有不同的出现频率的词向量赋予不同大小的权值参数,其中,出现频率越高的词向量的权值参数越小。
9、在本申请一个实施方式中,确定所述主题关键词与所述投诉问题分类标签之间的关联规则包括:将所述主题关键词和所述投诉问题分类标签进行匹配,以形成项集;基于关联规则算法,对所述项集进行处理,以获得初始规则集;以及基于筛选规则,从所述初始规则集中确定出所述关联规则。
10、在本申请一个实施方式中,基于关联规则算法,对所述项集进行处理,以获得初始规则集包括:基于预定的最小支持度和预定的最小置信度,确定所述初始规则集。
11、在本申请一个实施方式中,基于筛选规则,从所述初始规则集中确定出所述关联规则包括:确定所述初始规则集中每一个的置信度、支持度和提升度;以及基于置信度最小阈值、支持度最小阈值以及提升度最小阈值,确定出所述关联规则。
12、在本申请一个实施方式中,所述方法还包括对所述投诉文本进行预处理,所述预处理包括:删除所述投诉文本中的标点符号、数字、语气词以及稀疏词语,以获得所述投诉文本中的有效数据,其中所述稀疏词语为所述投诉文本中出现概率小于第二阈值的词语;以及对所述有效数据进行切分处理,以获得所述投诉文本的分词。
13、在本申请一个实施方式中,所述投诉文本的分布特征还包括:投诉类别分布以及所述分词的词频分布。
14、本申请另一方面提供了一种用户投诉文本处理装置,所述装置包括:分布特征获取模块,被配置为确定所述投诉文本的分布特征,其中所述投诉文本的分布特征包括投诉问题分类标签;建模模块,被配置为对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词;以及关联规则确定模块,被配置为确定所述主题关键词与所述投诉问题分类标签之间的关联规则;以及改进模块,被配置为基于已与所述投诉问题分类标签确定了所述关联规则的所述主题关键词,对与所述投诉问题分类标签对应的产品或服务进行改进。
15、在本申请一个实施方式中,所述建模模块被进一步配置为采用无监督概率模型,对所述投诉文本进行主题建模,以获取所述主题和所述主题关键词,其中,所述无监督概率模型包括潜在狄利克雷分布主题模型。
16、在本申请一个实施方式中,所述装置还包括情感分析模块,所述情感分析模块被配置为基于情感词典或机器学习,对多个所述投诉文本进行情感分析,以确定多个所述投诉文本中负面情感强度高的投诉文本;以及所述建模模块被进一步配置为对所述负面情感强度高的投诉文本进行所述主题建模。
17、在本申请一个实施方式中,所述情感分析包括情感极性和情感强度,所述情感极性包括正面和负面,所述情感分析模块被进一步配置为基于所述情感词典或所述机器学习,确定多个所述投诉文本的情感极性分值;以及将多个所述投诉文本中所述情感极性分值小于第一阈值的文本确定为所述负面情感强度高的投诉文本。
18、在本申请一个实施方式中,所述建模模块被进一步配置为利用统计方法以及专家方法中的至少一种,为所述主题建模确定主题数量。
19、在本申请一个实施方式中,所述建模模块被进一步配置为利用统计方法以及专家方法中的至少一种,确定多个不同的初始化主题数量;基于初始化主题对所述投诉文本进行所述主题建模,并获得与所述初始化主题对应的单词组;基于所述单词组中出现频率相对较高的多个单词之间的语义相似程度值,确定所述初始化主题的一致性得分;将与一致性得分最高对应的初始化主题数量确定为所述主题建模的所述主题数量。
20、在本申请一个实施方式中,所述建模模块被进一步配置为基于词袋模型,将所述投诉文本的文本数据转换本文档来自技高网...
【技术保护点】
1.一种用户投诉文本处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其中,对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词包括:采用无监督概率模型,对所述投诉文本进行主题建模,以获取所述主题和所述主题关键词,其中,所述无监督概率模型包括潜在狄利克雷分布主题模型;
3. 根据权利要求1所述的方法,其中,所述方法还包括:
4. 根据权利要求3所述的方法,其中,所述情感分析包括情感极性和情感强度,所述情感极性包括正面和负面,其中基于情感词典或机器学习,对多个所述投诉文本进行情感分析,以确定多个所述投诉文本中负面情感强度高的投诉文本包括:
5.根据权利要求1所述的方法,其中,对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词包括:利用统计方法以及专家方法中的至少一种,为所述主题建模确定主题数量;
6.根据权利要求1所述的方法,其中,
7.一种用户投诉文本处理装置,其特征在于,所述装置包括:
8.一种电子设备,其特征在于,包括:
9.一种计算机可读存储介
10.一种计算机程序产品,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-6任一项所述的用户投诉文本处理方法。
...【技术特征摘要】
1.一种用户投诉文本处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其中,对所述投诉文本进行主题建模,以获取所述投诉文本的主题和主题关键词包括:采用无监督概率模型,对所述投诉文本进行主题建模,以获取所述主题和所述主题关键词,其中,所述无监督概率模型包括潜在狄利克雷分布主题模型;
3. 根据权利要求1所述的方法,其中,所述方法还包括:
4. 根据权利要求3所述的方法,其中,所述情感分析包括情感极性和情感强度,所述情感极性包括正面和负面,其中基于情感词典或机器学习,对多个所述投诉文本进行情感分析,以确定多个所述投诉文本中负面情感强度高的投诉文本包括:
5.根据权利要求1所...
【专利技术属性】
技术研发人员:周鹏鹏,蔡华利,李洪涛,黄毅峰,白京,邢宏,赵瑞,陈伟,郑晨曦,李亚丹,王丽影,涂真,
申请(专利权)人:中国民航科学技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。