用户反馈数据的分析方法、装置及计算机设备制造方法及图纸

技术编号:35059972 阅读:48 留言:0更新日期:2022-09-28 11:11
本申请公开了一种用户反馈数据的分析方法、装置及计算机设备,涉及自然语言处理技术,可解决用户反馈数据分析工作量大、效率低,不能更深度挖掘的技术问题。包括:对样本反馈数据进行预处理,提取样本反馈数据的反馈关键词;基于反馈关键词确定样本反馈数据的话题特征以及情感特征;将样本反馈数据作为输入特征,且将反馈关键词、话题特征以及情感特征中的至少一种作为特征标签,训练反馈数据分析模型,以使反馈数据分析模型满足预设训练标准;获取目标用户的用户反馈数据,并将用户反馈数据输入训练完成的反馈数据分析模型中,得到用户反馈数据的分析结果,分析结果包括情感识别结果、话题识别结果以及关键词提取结果中的至少一种。少一种。少一种。

【技术实现步骤摘要】
用户反馈数据的分析方法、装置及计算机设备


[0001]本申请涉及自然语言处理技术,尤其涉及到一种用户反馈数据的分析方法、装置及计算机设备。

技术介绍

[0002]随着计算机技术的发展,越来越多的互联网企业致力于通过大数据分析以提高服务质量。在信息化建设的过程中,为了及时了解用户使用信息系统的感受,促进信息系统更好地服务用户,帮助信息系统健康发展,通常会收集用户使用信息系统后针对该系统的功能、性能、体验等方面反馈的相关意见或建议,进而根据用户反馈意见或建议进行数据分析,以根据数据分析结果对当前信息系统进行性能优化。
[0003]目前在对用户反馈数据的收集与分析时,往往利用APP意见反馈和在线客服信息来收集用户反馈意见或建议,进而人工通过管理后台查询反馈意见,并逐条进行意见反馈信息的分析与跟进。然而由于用户反馈信息的数据量较大,当采用人工分析方式时,会导致分析工作量大、效率低,且不能对用户反馈的问题或实际需求进行更深度的挖掘。

技术实现思路

[0004]有鉴于此,本申请提供了一种用户反馈数据的分析方法、装置及计算机设备,可解决在对用户反馈数据进行分析时,分析工作量大、效率低,且不能对用户反馈的问题或实际需求进行更深度的挖掘的技术问题。
[0005]根据本申请的一个方面,提供了一种用户反馈数据的分析方法,该方法包括:
[0006]对样本反馈数据进行预处理,提取所述样本反馈数据的反馈关键词;
[0007]基于所述反馈关键词确定所述样本反馈数据的话题特征以及情感特征;
[0008]将所述样本反馈数据作为输入特征,且将所述反馈关键词、所述话题特征以及所述情感特征中的至少一种作为特征标签,训练反馈数据分析模型,以使所述反馈数据分析模型满足预设训练标准;
[0009]获取目标用户的用户反馈数据,并将所述用户反馈数据输入训练完成的反馈数据分析模型中,得到所述用户反馈数据的分析结果,所述分析结果包括情感识别结果、话题识别结果以及关键词提取结果中的至少一种。
[0010]根据本申请的另一个方面,提供了一种用户反馈数据的分析装置,该装置包括:
[0011]提取模块,用于对样本反馈数据进行预处理,提取所述样本反馈数据的反馈关键词;
[0012]第一确定模块,用于基于所述反馈关键词确定所述样本反馈数据的话题特征以及情感特征;
[0013]训练模块,用于将所述样本反馈数据作为输入特征,且将所述反馈关键词、所述话题特征以及所述情感特征中的至少一种作为特征标签,训练反馈数据分析模型,以使所述反馈数据分析模型满足预设训练标准;
[0014]输入模块,用于获取目标用户的用户反馈数据,并将所述用户反馈数据输入训练完成的反馈数据分析模型中,得到所述用户反馈数据的分析结果,所述分析结果包括情感识别结果、话题识别结果以及关键词提取结果中的至少一种。
[0015]依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,程序被处理器执行时实现上述用户反馈数据的分析方法。
[0016]依据本申请再一个方面,提供了一种游戏账号的控制设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,处理器执行程序时实现上述用户反馈数据的分析方法。
[0017]借由上述技术方案,本申请提供的一种用户反馈数据的分析方法、装置及计算机设备,可首先对样本反馈数据进行预处理,提取样本反馈数据的反馈关键词,进而基于反馈关键词确定出样本反馈数据的话题特征以及情感特征,此后可将样本反馈数据作为输入特征,将反馈关键词、话题特征以及情感特征中的至少一种作为特征标签,训练反馈数据分析模型,以使反馈数据分析模型满足预设训练标准;最后可在获取目标用户的用户反馈数据后,将用户反馈数据输入训练完成的反馈数据分析模型中,得到用户反馈数据的分析结果。通过本申请中的技术方案,可实现互联网应用系统用户反馈信息数据的快速分类,并能实现关键内容信息提纯和建模分析,挖掘出用户反馈信息数据对现有系统功能提出优化调整建议,降低分析工作量的同时,还能够提高进行信息深度挖掘的可操作性。
[0018]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0019]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0020]图1示出了本申请实施例提供的一种用户反馈数据的分析方法的流程示意图;
[0021]图2示出了本申请实施例提供的另一种用户反馈数据的分析方法的流程示意图;
[0022]图3示出了本申请实施例提供的一种用户反馈数据的分析装置的结构示意图;
[0023]图4示出了本申请实施例提供的另一种用户反馈数据的分析装置的结构示意图。
具体实施方式
[0024]下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0025]为了解决在对用户反馈数据进行分析时,分析工作量大、效率低,且不能对用户反馈的问题或实际需求进行更深度的挖掘的技术问题,本申请提供了一种用户反馈数据的分析方法,如图1所示,该方法包括:
[0026]101、对样本反馈数据进行预处理,提取样本反馈数据的反馈关键词。
[0027]其中,样本反馈数据为在历史预设时间内收集到的用户针对具体信息系统的反馈数据,具体可为文本形式或可转化为文本形式的其他数据展示形式,如图片形式、音频形式、视频形式等。当样本反馈数据为文本形式之外的其他数据展示形式时,在预处理时还需
要利用现有的文本转换方法实现对文本的提取,在获取到文本形式的样本反馈数据后,可进一步利用文本形式的样本反馈数据作为反馈数据分析模型的训练语料,以使训练完成的反馈数据分析模型能够代替人工自动实现对用户反馈数据的智能化分析。
[0028]对于本实施例,在具体的应用场景中,预处理操作可包括切词处理、聚类处理、停用词滤除等部分内容。其中,切词处理可将各个文本形式的样本反馈数据切分为各个独立的词段,但在切分后的词段中,往往会存在一些冗余或者质量不高的词汇,故为了提高特征信息的提取效率,且节省运行的空间占用,故可通过设置需要滤除的停用词,以便筛选出一些对于关键词以及话题特征、情感特征抽取作用不大的词语,并将之滤除。在滤除停用词后,还可根据实际应用需要,进一步利用TF

IDF算法计算各个切分词语的权重值,以便利用权重值实现对反馈关键词的提取。具体的,可根据TF

IDF关键词特征,通过kmeans聚类,对样本反馈数据进行无监督聚类,将短文本形成文档,再对文档内容进行关键词提取,得到反馈关键词。
[0029]对于本实施例的执行主体可为用户反本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户反馈数据的分析方法,其特征在于,包括:对样本反馈数据进行预处理,提取所述样本反馈数据的反馈关键词;基于所述反馈关键词确定所述样本反馈数据的话题特征以及情感特征;将所述样本反馈数据作为输入特征,且将所述反馈关键词、所述话题特征以及所述情感特征中的至少一种作为特征标签,训练反馈数据分析模型,以使所述反馈数据分析模型满足预设训练标准;获取目标用户的用户反馈数据,并将所述用户反馈数据输入训练完成的反馈数据分析模型中,得到所述用户反馈数据的分析结果,所述分析结果包括情感识别结果、话题识别结果以及关键词提取结果中的至少一种。2.根据权利要求1所述的方法,其特征在于,所述对样本反馈数据进行预处理,提取所述样本反馈数据的反馈关键词,包括:利用预设分词工具对所述样本反馈数据进行分词处理,得到包含至少一个第一词语的第一词序列;根据所述第一词语的目标词性确定与预设停用词性匹配的第二词语,以便从所述第一词序列中剔除所述第二词语,得到第二词序列;计算所述第二词序列中的任一第一词语与预设关键词词典中任一预设关键词的语义相似度,在所述第二词序列中提取对应所述语义相似度大于预设阈值的第一词语,作为反馈关键词。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:基于TF

IDF算法计算所述第二词序列中所述第一词语对应所述样本反馈数据的权重值;将所述权重值大于预设权重阈值的第一词语确定为所述样本反馈数据的反馈关键词;判定所述反馈关键词是否存储于所述预设关键词词典中,若否,则将所述反馈关键词更新至所述预设关键词词典。4.根据权利要求2所述的方法,其特征在于,所述基于所述反馈关键词确定所述样本反馈数据的话题特征以及情感特征,包括:提取所述反馈关键词的第一属性特征,并计算所述第一属性特征与预设话题对应第二属性特征之间的第一特征相似度;将对应所述第一特征相似度大于第一预设相似度阈值的预设话题确定为所述反馈关键词所属的目标话题,根据所述目标话题生成所述样本反馈数据的话题特征;在所述反馈关键词和/或所述第二词序列中提取所述样本反馈数据对应情感的第三属性特征,计算所述第三属性特征与预设情感类别对应第四属性特征之间的第二特征相似度;将对应所述第二特征相似度大于第二预设相似度阈值的预设情感类别确定为所述样本反馈数据所属的目标情感类别,生成所述目标情感类别对应的情感特征。5.根据权利要求4所述的方法,其特征在于,所述提取所述反馈关键词的第一属性特征,并计算所述第一属性特征与预设话题对应第二属性特征之间的第一特征相似度,包括:提取所述反馈关键词对应的多维数组,其中,所述多维数组中每一维度用于表示所述反馈关键词的一个特征属性;
计算所述反馈关...

【专利技术属性】
技术研发人员:赵伟关海峰潘兴安孙杰平
申请(专利权)人:中国人民财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1