The present invention provides a method and apparatus for processing form, through access to N data structure form, analysis form contains the field name and field name, field position and corresponding relation of N forms were screened to determine the target class contains a field name from a M form, according to the relationship between the M form the field name and field position, fusion of M form data, generate the target form, thus, the M form data into a target form, based on the analysis of target form processing, the amount of data for data analysis of the sample in order to enrich, improve data analysis results.
【技术实现步骤摘要】
表单处理方法和装置
本专利技术涉及计算机技术,尤其涉及一种表单处理方法和装置。
技术介绍
表单是非常常见的一种用于收集信息的工具,例如:酒店信息反馈卡、员工个人信息登记表、学生个人信息登记表或者学习成绩单等。不同的表单具有不同的数据结构,其包含的字段名以及字段名对应的字段位置都可能不同,例如:A酒店信息反馈卡包含的字段名为:姓名、性别、联系方式、身份证号码以及消费时间等;B酒店信息反馈卡包含的字段名为:姓名、性别、联系方式以及房间编号等;为了便于信息管理或者其他用途,通常会对多个表单收集的信息进行数据分析,例如:获取某用户的所有联系方式,现有技术中,通常只是针对同一数据结构的表单进行数据分析。然而,采用现有技术的方式,对表单进行数据分析数据量不够丰富,获取到的数据不够全面,分析效果不佳。
技术实现思路
本专利技术提供一种表单处理方法和装置,以丰富进行数据分析的样本的数据量,提高分析效果。第一方面,本专利技术实施例提供一种表单处理方法,包括:获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;对所述目标表单进行分析处理。可选地,所述根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单,包括:获取所述M个表单中每个表单的数据项;其中,每个表单包含多个数 ...
【技术保护点】
一种表单处理方法,其特征在于,包括:获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;对所述目标表单进行分析处理。
【技术特征摘要】
1.一种表单处理方法,其特征在于,包括:获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;对所述目标表单进行分析处理。2.根据权利要求1所述的方法,其特征在于,所述根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单,包括:获取所述M个表单中每个表单的数据项;其中,每个表单包含多个数据项,每个数据项中包含所述表单的字段名对应的赋值;根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项;对所述具有关联关系的数据项进行融合,得到目标数据项;根据所述目标数据项生成所述目标表单。3.根据权利要求2所述的方法,其特征在于,所述根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项,包括:获取S个关键字段名的优先权值,所述S为大于等于1的整数;根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率;确定所述匹配率大于等于预设匹配率的两个数据项具有关联关系。4.根据权利要求3所述的方法,其特征在于,所述根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率,包括:若两个数据项中的同一个关键字段名的赋值相同,则所述关键字段名的匹配率为所述关键字段名的优先权值;若两个数据项中的同一关键字段名的赋值不同,则所述关键字段名的匹配率为0;确定所述S个关键字段名的匹配率的和值为所述两个数据项的匹配率。5.根据权利要求2所述的方法,其特征在于,所述对所述具有关联关系的数据项进行融合,得到目标数据项,包括...
【专利技术属性】
技术研发人员:王琰,
申请(专利权)人:精硕科技北京股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。