System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是涉及一种调查问卷的调查结果确定方法及系统。
技术介绍
1、调查问卷作为一种重要的数据收集工具,已经经历了多年的发展。从最早的纸质问卷到如今广泛应用的电子问卷,调查问卷的形式和方法不断演变。传统纸质问卷通过邮寄或面对面发放,尽管便于接触不熟悉电子设备的人群,但数据收集和整理过程耗时费力。电话问卷作为另一种方式,通过电话访谈直接获取受访者反馈,虽然能够实时互动,但人力成本较高。随着互联网和电子邮件的普及,电子问卷成为主流,能够高效、低成本地大规模收集数据。
2、通过系统化设计调查问卷中的题目,调查问卷能够高效地收集大量数据,帮助研究者了解目标群体的特征和需求,分析调查问卷收集的数据,确定调查问卷的调查结果,可以提供有价值的决策支持,优化产品和服务,制定科学合理的策略。
3、但是,分析调查问卷数据,确定调查问卷的调查结果并非易事,存在诸多困难和挑战,例如,问卷题目可能存在误差,调查样本可能存在偏差,无法完全代表目标群体,影响调查问卷结果的可靠性。此外,调查问卷通常包含多维度的数据,涉及定量和定性问题,分析处理复杂。尽管现有的数值化处理方法在很多应用中取得了良好的效果,但在处理调查问卷数据时仍存在一些不足,导致预测不准确。因此,采用科学合理的数值化处理方法,实现准确的问卷结果预测,对于提高问卷结果的可靠性至关重要。
技术实现思路
1、本申请的目的是提供一种调查问卷的调查结果确定方法及系统,以解决调查问卷的调查结果的可靠性低和准确性低的问题。
2、为实现上述目的,本申请提供了如下方案:
3、第一方面,本申请提供了一种调查问卷的调查结果确定方法,包括:
4、获取已填调查问卷,并剔除已填调查问卷中的无效调查问卷,得到目标调查问卷;无效调查问卷包括相近题目填答矛盾的调查问卷和所有题目均选择模糊项的调查问卷;
5、对目标调查问卷中所有题目的答案进行数值化编码,得到数值化后的目标调查问卷;
6、对数值化后的目标调查问卷进行信度检验和效度检验,得到检验后的目标调查问卷;
7、利用皮尔逊相关系数和卡方检验,对检验后的目标调查问卷中所有题目进行特征选择,得到特征选择后的目标调查问卷;
8、对特征选择后的目标调查问卷进行数据整合,得到目标调查问卷的数据特征;
9、将目标调查问卷的数据特征输入至调查问卷的调查结果预测模型中,得到调查问卷的调查结果的预测值;所述调查问卷的调查结果预测模型是采用训练样本对随机森林模型进行训练得到的;所述训练样本包括调查问卷的数据特征样本值和调查问卷的调查结果的样本值。
10、可选地,对目标调查问卷中所有题目的答案进行数值化编码,得到数值化后的目标调查问卷,具体包括:
11、对目标调查问卷中所有题目进行第一类别判定,确定各题目所属的第一类别;所述第一类别为单选题或多选题;
12、基于各题目所属的第一类别,选取对应的数值化编码方法,并根据选取的数值化编码方法对各题目对应的答案进行数值化编码,得到数值化后的目标调查问卷;当题目所属的第一类别为单选题时,对题目对应的答案进行标签编码;当题目所属的第一类别为多选题时,对题目对应的答案进行0-1编码。
13、可选地,标签编码的表达式为:
14、yi=i,i∈{1,2,...,n};
15、其中,yi表示第i个选项对应的数值标签;n表示一个单选题中包含的选项的总数量;
16、0-1编码的表达式为:
17、
18、其中,yij表示第k个题目的第j个选项的二进制编码值;m为一个多选题中包含的选项的总数量。
19、可选地,对数值化后的目标调查问卷进行信度检验和效度检验,得到检验后的目标调查问卷,具体包括:
20、对数值化后的目标调查问卷进行进行预处理,得到预处理后的目标调查问卷;
21、利用克隆巴赫α系数对预处理后的目标调查问卷中的所有题目进行信度检验,得到信度检验后的目标调查问卷;
22、利用公式x=λf+∈对信度检验后的目标调查问卷中的所有题目进行效度检验,得到检验后的目标调查问卷;其中,x为观测变量向量,λ为因子载荷矩阵,f为公共因子向量,∈为误差向量。
23、可选地,克隆巴赫α系数的计算公式为:
24、
25、其中,α为克隆巴赫α系数;n是题目数量;是题目间平均协方差;是题目间方差的平均值。
26、可选地,对数值化后的目标调查问卷进行进行预处理,得到预处理后的目标调查问卷,具体包括:
27、采用均值填补法对数值化后的目标调查问卷中的所有题目的答案进行缺失值处理,得到缺失值处理后的目标调查问卷;
28、采用箱型图法对缺失值处理后的目标调查问卷中的所有题目的答案进行异常值检测,得到异常值检测后的目标调查问卷;
29、对异常值检测后的目标调查问卷中的所有题目的答案进行标准化处理,得到标准化后的目标调查问卷;
30、对标准化后的目标调查问卷进行归一化处理,得到预处理后的目标调查问卷。
31、可选地,采用箱型图法对缺失值处理后的目标调查问卷中的所有答案进行异常值检测,具体包括:
32、采用公式iqr=q3-q1计算缺失值处理后的目标调查问卷中的所有答案的四分位距;其中,q1为第一四分位数;q3为第三四分位数;iqr为四分位距;
33、基于所述四分位数和所述四分位距,判断缺失值处理后的目标调查问卷中的各答案是否满足预设范围,并将未满足预设范围的答案剔除。
34、可选地,利用皮尔逊相关系数和卡方检验,对检验后的目标调查问卷中所有题目进行特征选择,得到特征选择后的目标调查问卷,具体包括:
35、对检验后的目标调查问卷中的所有题目进行第二类别判定,确定题目所属的第二类别;所述第二类别为回归问题或分类问题;
36、当确定题目所属的第二类别为回归问题时,利用皮尔逊相关系数计算题目分数与目标变量之间的相关性,并选择相关性满足第一预设阈值的题目;所述目标变量为目标调查问卷输出结果的样本值;
37、当确定题目所属的第二类别为分类问题时,利用卡方检验计算题目与目标变量之间的卡方统计量,并选择卡方统计量满足第二预设阈值的题目,完成特征选择,得到特征选择后的目标调查问卷。
38、可选地,所述调查问卷结果预测模型的训练过程具体包括:
39、将训练样本输入至随机森林模型中,得到调查问卷结果的样本预测值;
40、根据调查问卷结果的样本预测值与调查问卷结果的样本值构建损失函数,并根据所述损失函数调整随机森林模型的模型参数,得到调查问卷结果预测模型。
41、第二方面,本申请提供了一种调查问卷结果确定系统,所述调查问卷结果确定系统基于任一项所述的调查问卷的调查结果确定方法,所述调查问卷结果确定系统本文档来自技高网...
【技术保护点】
1.一种调查问卷的调查结果确定方法,其特征在于,所述调查问卷的调查结果确定方法包括:
2.根据权利要求1所述的调查问卷的调查结果确定方法,其特征在于,对目标调查问卷中所有题目的答案进行数值化编码,得到数值化后的目标调查问卷,具体包括:
3.根据权利要求2所述的调查问卷的调查结果确定方法,其特征在于,标签编码的表达式为:
4.根据权利要求1所述的调查问卷的调查结果确定方法,其特征在于,对数值化后的目标调查问卷进行信度检验和效度检验,得到检验后的目标调查问卷,具体包括:
5.根据权利要求4所述的调查问卷的调查结果确定方法,其特征在于,克隆巴赫α系数的计算公式为:
6.根据权利要求4所述的调查问卷的调查结果确定方法,其特征在于,对数值化后的目标调查问卷进行进行预处理,得到预处理后的目标调查问卷,具体包括:
7.根据权利要求6所述的调查问卷的调查结果确定方法,其特征在于,采用箱型图法对缺失值处理后的目标调查问卷中的所有答案进行异常值检测,具体包括:
8.根据权利要求1所述的调查问卷的调查结果确定方法,其特
9.根据权利要求1所述的调查问卷的调查结果确定方法,其特征在于,所述调查问卷结果预测模型的训练过程具体包括:
10.一种调查问卷结果确定系统,其特征在于,所述调查问卷结果确定系统基于权利要求1-9任一项所述的调查问卷的调查结果确定方法,所述调查问卷结果确定系统包括:
...【技术特征摘要】
1.一种调查问卷的调查结果确定方法,其特征在于,所述调查问卷的调查结果确定方法包括:
2.根据权利要求1所述的调查问卷的调查结果确定方法,其特征在于,对目标调查问卷中所有题目的答案进行数值化编码,得到数值化后的目标调查问卷,具体包括:
3.根据权利要求2所述的调查问卷的调查结果确定方法,其特征在于,标签编码的表达式为:
4.根据权利要求1所述的调查问卷的调查结果确定方法,其特征在于,对数值化后的目标调查问卷进行信度检验和效度检验,得到检验后的目标调查问卷,具体包括:
5.根据权利要求4所述的调查问卷的调查结果确定方法,其特征在于,克隆巴赫α系数的计算公式为:
6.根据权利要求4所述的调查问卷的调查结果确定方法,其特征在于,对数值化后的目标...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。