【技术实现步骤摘要】
一种量表答案提取算法
[0001]本专利技术涉及量表答案提取
,具体为一种量表答案提取算法
。
技术介绍
[0002]问卷是为了搜集人们对某个特定问题的态度
、
价值观
、
观点或信念等信息而设计的一系列问题,能将有关问题组合起来
。
其中,量表是问卷的一种体现方式
。
[0003]通常,研究者会把问卷打印成纸质形式分发
。
根据研究需要,每一张问卷可能会存在多个量表,题目数量约
70
至
150
以上
。
受测者将按照指导语提示作答,在答题区内勾画
。
根据研究需要,可能会邀请几百人到几千人进行调查
。
[0004]从数据回收角度看,由于题量大
、
人数较多,通常需要耗费大量精力和时间进行录入
。
且在录入过程中,操作者可能会出现“看走眼”、“没保存”、“忘记录没录”等的情况,降低了数据录入质量
。
[0005]除人工录入外,现有自动化产品通常要求对问卷进行特殊设计
。
例如:需要在对应位置增加识别块,对存量问卷
、
新编制问卷要求较高
。
在设计上,需要对答题规则进行严格限定,对特殊题型
、
特殊情况支持较差
。
[0006]针对现有技术中存在的情况,需要对量表答案录入的方式进行改进
。
技术实现思路
【技术保护点】
【技术特征摘要】
1.
一种量表答案提取算法,其特征在于,包括以下步骤:
S1、
读入图像;该步骤通过多种形式输入图像;
S2、
图像矫正;该步骤将裁切背景
、
删除多余边框痕迹,矫正图形;与步骤
S1
连接;
S3、
量表块提取:该步骤将各个量表从问卷图像中分离;与步骤
S2
连接;
S4、
题项分割:该步骤将依次根据行分割题项;与步骤
S3
连接;
S5、
答案识别:该步骤将根据题目特点,采用差异化对应方式识别答案;与步骤
S4
连接;
S6、
结果输出:该步骤可按照用户的需求保存为各种格式的数据结果;与步骤
S5
连接
。2.
如权利要求1所述的一种量表答案提取算法,其特征在于:所述步骤
S2
中,用户根据图像状况,自行选择是否进行旋转
、
裁剪,并通过卷积识别
、
裁切最长宽
、
高的边长,寻找最大面积的矩形
。3.
如权利要求1所述的一种量表答案提取算法,其特征在于:所述步骤
S3
中,包括:利用卷积算法对图像中横线上的点提取坐标,并在删除离群点及合并相近点后,通过判断相邻的两点间的距离判断是否为新一行起点;在此基础上,利用卷积算法对图像中横线提取竖线,判断一个量表块中是否包含多个量表;用户可根据情况手动调整量表块识别结果
。4.
如权利要求1所述的一种量表答案提取算法,其特征在于:所述步骤
S5
中,对于勾选类题项,经多次卷积运算后,将题目变化为面积较大
、
密集相连的矩形,将作答区变换为稀疏线条的效果图,进而使用聚类算法区分作答区及答案区,通过计算每个题项轮廓的面积变化程度,可获得单选或多选答案
。5.
如权利要求1所述的一种量表答案提取算法,其特征在于:所述步骤
S5
中,对于非勾选类客观题项,经矫正后,采用比对用户预先指定的作答模板获取答案,通过判断包括图片相似度
、
色块相差情况确定作答分数
。6.
如权利要求1所述的一种量表答案提取算法,其特征在于:所述步骤
S5
中,对于特殊类题项,采用第三方接口进行判断读取
。7.
如权利要...
【专利技术属性】
技术研发人员:张东篱,曾练平,夏宇,肖媛妮,谭江,黄松,
申请(专利权)人:贵州师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。