本发明专利技术提供了一种满意度调查方法及系统,所述方法包括以下步骤:接收用户针对调查问题所输入的答复信息;对所述答复信息中的自然语言进行处理,包括:对答复信息中的自然语言进行分句处理,对分句后的每一个句子去掉其中的停用词后进行分词处理,得到候选词库;根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。采用本发明专利技术提供的满意度调查方法及系统,能提高调查的准确度。
【技术实现步骤摘要】
满意度调查方法及系统
本专利技术涉及互联网
,尤其涉及一种满意度调查方法及系统。
技术介绍
要了解互联网产品的好坏,需要统计用户对互联网产品的满意度。传统的调查方式有针对互联网产品开通客服电话,当用户拨打进客服电话,则自动生成满意度调查问卷供用户填写或选择。另外,还可以开设问答社区,或通过邮件、即时通讯和短信等方式下发调查问卷,这些调查问卷通常会提供许多问题供用户选择。例如,用户在电脑中卸载了某一软件后,界面会弹出调查问卷,该问卷包含了许多问题,每个问题后附带了许多选项,如 “您删除该软件的原因是(1)影响网络速度;(2)程序会不定时的崩溃或出错;(3)我已经习惯了其他版本的同类软件;(4)界面不熟悉,不知道如何使用;(5)程序总是在自己不需要运行的时候弹出来”。同时,问卷调查中还可包含对某个属性进行打分的选项,如“您对上述回答的评价如何? 5分满意,4分基本满意,3分比较满意,2分不太满意,1分不满意”。然而,在传统方式下,由于调查问卷是事先所设定的固定形式,其选项通常繁多复杂,过于死板,内容也只能反映大部分用户的想法。并且,用户往往会不耐烦的随意选择,且还有恶意的用户会利用自动机器人脚本进行自动的反复的回答并提交,往往会得到不真实的回答。因此传统的这种用户满意度调查方式调查的准确度不高。此外,每次需要进行新的问卷调查时,还必须精心的设计调查问卷,不利于调查的扩展。
技术实现思路
基于此,有必要提供一种能提高调查准确度的满意度调查方法。一种满意度调查方法,包括以下步骤接收用户针对调查问题所输入的答复信息; 对所述答复信息中的自然语言进行处理,包括对答复信息中的自然用于进行分句处理,对分句后的每一个句子去掉其中的停用词后进行分词处理,得到候选词库;根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。其中,对答复信息中的自然语言进行处理的步骤还可包括按照排列组合的方式提取每个句子分词处理后的词语组合;对每个词语组合,当该词语组合不在候选词库中时, 将所述词语组合加入候选词库中;对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。所述候选词库中的词语组合中的词的赋分值和权值可以通过如下方式获得按照预先设定的词与分值或权值的对应关系,对词语组合中的每个词赋予分值或权值。其中,根据分值和权值计算答复信息的满意度值的步骤具体可以是提取候选词库中的每个词语组合,获取所述词性和语义分析后得到的赋有分值或权值的词,根据所述词的分值或权值计算得到每个词语组合的分值,根据所述词语组合的分值计算得到答复信息的满意度值。其中,根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值的步骤具体可以是根据所述词语组合中的词的分值或权值计算词语组合的分值,所述词语组合的分值的计算方式如下当词语组合中既包含赋了分值的词又包含赋了权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋了相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋了分值的词时,词语组合的分值为赋了分值的词的分值之和;其中,每个句子的满意度值为该句子的所有词语组合的分值的平均值。此外,还有必要提供一种能提高调查准确度的满意度调查系统。一种满意度调查系统,包括信息获取模块,用于接收用户针对调查问题所输入的答复信息;自然语言处理模块,对所述答复信息中的自然语言进行处理和分析,得到候选词库;统计模块,根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值;自然语言处理模块可以包括分句模块,对答复信息中的自然语言进行分句处理;分词模块,对分句后的每一个句子去掉其中的停用词后进行分词处理。其中,所述自然语言处理模块还可包括候选词库生成模块,用于按照排列组合的方式提取每个句子分词处理后的词语组合,并对每个词语组合,当该词语组合不在候选词库中时,将所述词语组合加入候选词库中;词性和语义分析模块,对候选词库中的词语组合进行词性和语义分析,得到词语组合中赋有分值或权值的词。其中,所述统计模块可以包括赋值模块,按照预先设定的词与分值或权值的对应关系,对词语组合中的每个词赋予分值或权值。其中,所述统计模块还可以包括计算模块,提取候选词库中的每个词语组合,获取所述词性和语义分析后得到的赋有分值或权值的词,根据所述词的分值或权值计算得到每个词语组合的分值,根据所述词语组合的分值计算得到所述答复信息的满意度值。其中,所述计算模块根据候选词库中的词语组合中的词的分值和权值计算答复信息的满意度值具体是当词语组合中既包含赋分值的词又包含赋权值的词时,将分值与权值相乘,得到词语组合的分值,当词语组合中包含两个以上赋相同权值的词时,仅使用一个权值与分值相乘,当词语组合中仅包含赋分值的词时,词语组合的分值为赋分值的词的分值之和;其中,每个句子的满意度值为该句子的词语组合的分值的平均值。上述满意度调查方法及系统,通过对用户输入的答复信息中的自然语言进行处理,并对得到的候选词库中的词语组合中的词赋分值或权值,从而计算得到答复信息中的满意度值,无需提供事先设计好的固定的调查问卷,能够有效得到用户对互联网产品的真实反馈,从而提高了满意度调查的准确度。附图说明图1为一个实施例中满意度调查方法的流程图;图2为一个实施例中对自然语言进行处理和分析的方法流程图;图3为一个实施例中满意度调查系统的结构示意图;图4为另一个实施例中满意度调查系统的结构示意图。具体实施方式如图1所示,一种满意度调查方法,包括以下步骤步骤S10,接收用户针对调查问题所输入的答复信息。在提供问卷调查时,通过提供调查问题和输入框,用户针对调查问题将答复信息填入输入框中。例如用户删除某一应用程序后,提供调查问题“您认为产品的使用效果如何”,用户将答复信息填写在输入框中。步骤S20,对答复信息中的自然语言进行处理,得到候选词库。在一个实施例中,如图2所示,步骤S20的具体过程包括步骤S201中,对答复信息中的自然语言进行分句处理。用户提供的答复信息中会包含多个句子,以标点符号为准,对答复信息中的自然语言进行分句处理,得到答复信息的多个句子。这里的标点符号不包括引号、书名号等非停顿标点符号。步骤S202中,对分句后的每一个句子去掉其中的停用词后进行分词处理。停用词是指如“的”、“得”、“地”等词,对分句后的每一个句子去掉停用词后,再进行分词处理。例如,对于句子“我觉得您的说法非常的不错”,去掉停用词后进行分词的结果为“我觉得您说法非常不错”。步骤S203中,按照排列组合的方式提取每个句子分词处理后的词语组合。例如对于分词后得到的“我觉得您说法非常不错”,按照排列组合的方式提取其中的词语组合,如 “我觉得”、“觉得您”、“您说法”、“说法非常”等,这里提取出的词语组合有三元词,如“我觉得”、“觉得您”,也有四元词,如“说法非常”,可根据需要进行调配。步骤S204中,遍历每个词语组合。步骤S205中,判断词语组合是否在候选词库中,若是,则进入步骤S207,否则进入步骤S206。步骤S206中,将词语组合加入候选词库中。当遍历到的词语组合不在候选词库中时,则将其加入候选词库中,直至遍历完所有的候选词库,则候选词库中包含了提取出的词语组合,本文档来自技高网...
【技术保护点】
1.一种满意度调查方法,包括以下步骤:接收用户针对调查问题所输入的答复信息;对所述答复信息中的自然语言进行处理,包括:对答复信息中的自然语言进行分句处理,对分句后的每一个句子去掉其中的停用词后进行分词处理,得到候选词库;根据所述候选词库中的词语组合中的词的分值和权值计算所述答复信息的满意度值。
【技术特征摘要】
【专利技术属性】
技术研发人员:刘致远,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:94
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。