表单处理方法和装置制造方法及图纸

技术编号:17138563 阅读:30 留言:0更新日期:2018-01-27 14:31
本发明专利技术提供一种表单处理方法和装置,通过获取N个表单的数据结构,分析表单包含的字段名,以及字段名与字段位置的对应关系,对N个表单进行筛选,从中确定包含目标类字段名的M个表单,根据M个表单的字段名与字段位置的对应关系,对M个表单的数据进行融合,生成目标表单,从而,将M个表单的数据合并为一个目标表单,通过对目标表单进行分析处理,以丰富进行数据分析的样本的数据量,提高数据分析效果。

Form processing method and device

The present invention provides a method and apparatus for processing form, through access to N data structure form, analysis form contains the field name and field name, field position and corresponding relation of N forms were screened to determine the target class contains a field name from a M form, according to the relationship between the M form the field name and field position, fusion of M form data, generate the target form, thus, the M form data into a target form, based on the analysis of target form processing, the amount of data for data analysis of the sample in order to enrich, improve data analysis results.

【技术实现步骤摘要】
表单处理方法和装置
本专利技术涉及计算机技术,尤其涉及一种表单处理方法和装置。
技术介绍
表单是非常常见的一种用于收集信息的工具,例如:酒店信息反馈卡、员工个人信息登记表、学生个人信息登记表或者学习成绩单等。不同的表单具有不同的数据结构,其包含的字段名以及字段名对应的字段位置都可能不同,例如:A酒店信息反馈卡包含的字段名为:姓名、性别、联系方式、身份证号码以及消费时间等;B酒店信息反馈卡包含的字段名为:姓名、性别、联系方式以及房间编号等;为了便于信息管理或者其他用途,通常会对多个表单收集的信息进行数据分析,例如:获取某用户的所有联系方式,现有技术中,通常只是针对同一数据结构的表单进行数据分析。然而,采用现有技术的方式,对表单进行数据分析数据量不够丰富,获取到的数据不够全面,分析效果不佳。
技术实现思路
本专利技术提供一种表单处理方法和装置,以丰富进行数据分析的样本的数据量,提高分析效果。第一方面,本专利技术实施例提供一种表单处理方法,包括:获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;对所述目标表单进行分析处理。可选地,所述根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单,包括:获取所述M个表单中每个表单的数据项;其中,每个表单包含多个数据项,每个数据项中包含所述表单的字段名对应的赋值;根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项;对所述具有关联关系的数据项进行融合,得到目标数据项;根据所述目标数据项生成所述目标表单。可选地,所述根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项,包括:获取S个关键字段名的优先权值,所述S为大于等于1的整数;根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率;确定所述匹配率大于等于预设匹配率的两个数据项具有关联关系。可选地,所述根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率,包括:若两个数据项中的同一个关键字段名的赋值相同,则所述关键字段名的匹配率为所述关键字段名的优先权值;若两个数据项中的同一关键字段名的赋值不同,则所述关键字段名的匹配率为0;确定所述S个关键字段名的匹配率的和值为所述两个数据项的匹配率。可选地,所述对所述具有关联关系的数据项进行融合,得到目标数据项,包括:将所述具有关联关系的数据项进行合并与去重处理。可选地,所述目标类字段名包含R个字段名,所述R为大于等于1的整数;所述从所述N个表单中获取包含目标类字段名的M个表单,包括:从所述N个表单中获取包含所述R个字段名中的任一个字段名的M个表单。第二方面,本专利技术实施例提供一种表单处理装置,包括:获取模块,用于获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;筛选模块,用于根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;处理模块,用于根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;所述处理模块,还用于对所述目标表单进行分析处理。可选地,所述处理模块具体用于获取所述M个表单中每个表单的数据项;其中,每个表单包含多个数据项,每个数据项中包含所述表单的字段名对应的赋值;根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项;对所述具有关联关系的数据项进行融合,得到目标数据项;根据所述目标数据项生成所述目标表单。可选地,所述处理模块具体用于获取S个关键字段名的优先权值,所述S为大于等于1的整数;根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率;确定所述匹配率大于等于预设匹配率的两个数据项具有关联关系。可选地,所述处理模块具体用于若两个数据项中的同一个关键字段名的赋值相同,则所述关键字段名的匹配率为所述关键字段名的优先权值;若两个数据项中的同一关键字段名的赋值不同,则所述关键字段名的匹配率为0;确定所述S个关键字段名的匹配率的和值为所述两个数据项的匹配率。可选地,所述处理模块具体用于将所述具有关联关系的数据项进行合并与去重处理。可选地,所述目标类字段名包含R个字段名,所述R为大于等于1的整数;所述筛选模块具体用于从所述N个表单中获取包含所述R个字段名中的任一个字段名的M个表单。本专利技术提供的表单处理方法和装置,通过获取N个表单的数据结构,分析表单包含的字段名,以及字段名与字段位置的对应关系,对N个表单进行筛选,从中确定包含目标类字段名的M个表单,根据M个表单的字段名与字段位置的对应关系,对M个表单的数据进行融合,生成目标表单,从而,将M个表单的数据合并为一个目标表单,通过对目标表单进行分析处理,以丰富进行数据分析的样本的数据量,提高数据分析效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术表单处理方法实施例一的流程示意图;图2为本专利技术表单处理方法实施例二的流程示意图;图3为本专利技术表单处理装置实施例一的结构示意图;图4为本专利技术表单处理装置实施例二的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。随着大数据的应用日益广泛,对海量的数据进行分析,以获得期望的结果的需求越来越大,例如:通过对海量的数据进行分析,得到用户的特定信息,特定信息例如:联系方式,联系方式可以为手机号码、邮箱地址、微信号、家庭地址或公司地址等信息;再或者,通过对海量的数据进行分析,得到某地区年龄段在25岁-30岁,性别为女的人群的收入水平;再或者,通过对海量的数据进行分析,得到某高校的学本文档来自技高网...
表单处理方法和装置

【技术保护点】
一种表单处理方法,其特征在于,包括:获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;对所述目标表单进行分析处理。

【技术特征摘要】
1.一种表单处理方法,其特征在于,包括:获取N个表单的数据结构,所述数据结构用于指示所述表单包含的字段名,以及每个字段名与字段位置的对应关系,N为大于等于2的整数;根据每个表单包含的字段名,从所述N个表单中获取包含目标类字段名的M个表单,M为小于等于N的整数;根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单;对所述目标表单进行分析处理。2.根据权利要求1所述的方法,其特征在于,所述根据所述M个表单的字段名与字段位置的对应关系以及字段名,对所述M个表单的数据项进行融合,生成目标表单,包括:获取所述M个表单中每个表单的数据项;其中,每个表单包含多个数据项,每个数据项中包含所述表单的字段名对应的赋值;根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项;对所述具有关联关系的数据项进行融合,得到目标数据项;根据所述目标数据项生成所述目标表单。3.根据权利要求2所述的方法,其特征在于,所述根据相同字段名的赋值,获取所述M个表单中具有关联关系的数据项,包括:获取S个关键字段名的优先权值,所述S为大于等于1的整数;根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率;确定所述匹配率大于等于预设匹配率的两个数据项具有关联关系。4.根据权利要求3所述的方法,其特征在于,所述根据所述S个关键字段名的优先权值,匹配任意两个数据项的所述S个关键字段名的赋值,得到所述两个数据项的匹配率,包括:若两个数据项中的同一个关键字段名的赋值相同,则所述关键字段名的匹配率为所述关键字段名的优先权值;若两个数据项中的同一关键字段名的赋值不同,则所述关键字段名的匹配率为0;确定所述S个关键字段名的匹配率的和值为所述两个数据项的匹配率。5.根据权利要求2所述的方法,其特征在于,所述对所述具有关联关系的数据项进行融合,得到目标数据项,包括...

【专利技术属性】
技术研发人员:王琰
申请(专利权)人:精硕科技北京股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1