System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理的方法及装置、非易失性存储介质、电子设备制造方法及图纸_技高网

数据处理的方法及装置、非易失性存储介质、电子设备制造方法及图纸

技术编号:44272779 阅读:4 留言:0更新日期:2025-02-14 22:13
本申请公开了一种数据处理的方法及装置、非易失性存储介质、电子设备。其中,该方法包括:获取输入信息,其中,输入信息包括:表格数据和用户需求,用户需求用于指示依据表格数据生成的文本所满足的要求;根据表格数据改写用户需求,得到目标用户需求,其中,目标用户需求中包括依据表格数据生成的新增字段;根据目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段;根据目标表格片段和目标用户需求生成目标文本,其中,目标文本中包括与新增字段对应的数据。本申请解决了相关技术中对表格数据进行解析和内容再创造时,由于输入的用户需求与表格数据的关联度小造成的基于表格数据进行内容再创造得到的结果不准确的技术问题。

【技术实现步骤摘要】

本申请涉及数据处理,具体而言,涉及一种数据处理的方法及装置、非易失性存储介质、电子设备


技术介绍

1、随着大数据技术的深入发展,信息量的指数级增长对数据处理和知识提取技术提出了更高要求。表格作为承载结构化信息的工具,规范了数据格式,促进了数据的高效交流与分析;在此背景下,对表格数据进行解析和内容再创造的方法得到广泛应用,相关技术中,基于用户输入的查询信息对表格数据进行解析和内容再创造时,存在基于表格数据进行内容再创造得到的结果不准确的问题。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种数据处理的方法及装置、非易失性存储介质、电子设备,以至少解决相关技术中对表格数据进行解析和内容再创造时,由于输入的用户需求与表格数据的关联度小造成的基于表格数据进行内容再创造得到的结果不准确的技术问题。

2、根据本申请实施例的一个方面,提供了一种数据处理的方法,包括:获取输入信息,其中,输入信息包括:表格数据和用户需求,用户需求用于指示依据表格数据生成的文本所满足的要求;根据表格数据改写用户需求,得到目标用户需求,其中,目标用户需求中包括依据表格数据生成的新增字段;根据目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段,其中,多个表格片段是对表格数据进行切分得到的,在多阶段筛选中,将上一阶段筛选得到的结果作为下一阶段的待筛选对象;根据目标表格片段和目标用户需求生成目标文本,其中,目标文本中包括与新增字段对应的数据。>

3、可选地,根据表格数据改写用户需求,得到目标用户需求,包括:对表格数据进行切分处理,得到多个表格片段,其中,表格片段的数量与表格数据的行数相同;在多个表格片段中确定关键字段,其中,关键字段是包含表格数据的表头数据的字段;根据关键字段将用户需求改写为目标用户需求。

4、可选地,根据关键字段将用户需求改写为目标用户需求,包括:将关键字段和用户需求填充到改写模板中,其中,改写模板用于将用户需求与关键字段进行合并,改写模板中至少包括:用于填充用户需求的第一待填充字段、用于填充关键字段的第二待填充字段;将填充了关键字段和用户需求的改写模板确定为目标用户需求。

5、可选地,根据目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段,包括:确定每个表格片段与目标用户需求的第一语义相似度;根据第一语义相似度对多个表格片段进行第一阶段筛选,得到第一筛选结果;采用相似度预测模型确定第一筛选结果中的每个表格片段与用户需求的第二语义相似度;根据第二语义相似度对第一筛选结果进行第二阶段筛选,得到第二筛选结果,其中,包含在第二筛选结果中的表格片段为目标表格片段。

6、可选地,确定每个表格片段与目标用户需求的第一语义相似度,包括:确定每个表格片段对应的多个第三语义相似度,其中,多个第三语义相似度是采用不同的语义相似度算法计算得到的表格片段与目标用户需求的语义相似度;确定每个第三语义相似度对应的权重值,其中,权重值用于指示生成第三语义相似度的语义相似度算法的在多个语义相似度算法中的重要程度,重要程度与权重值正相关;对于每个第三语义相似度,确定每个第三语义相似度与第三语义相似度对应的权重值的乘积,得到多个乘积;将多个乘积相加,得到第一语义相似度。

7、可选地,根据第一语义相似度对多个表格片段进行第一阶段筛选,得到第一筛选结果,包括:按照第一语义相似度从大到小的顺序对组成表格数据的全部表格片段进行排序,得到第一排序结果;将第一排序结果中的前m个表格片段确定为第一筛选结果,其中,m为整数;根据第二语义相似度对第一筛选结果进行第二阶段筛选,得到第二筛选结果,包括:按照第二语义相似度从大到小的顺序对第一筛选结果中的多个表格片段进行排序,得到第二排序结果;将第二排序结果中的前k个表格片段确定为第二筛选结果,其中,k为整数,k小于m。

8、可选地,根据目标表格片段和目标用户需求生成目标文本,包括:将目标表格片段和目标用户需求填充到融合模板中,其中,融合模板用于将目标用户需求与目标表格片段进行合并,融合模板中至少包括:用于填充目标用户需求的第三待填充字段、用于填充目标表格片段的第四待填充字段。

9、根据本申请实施例的另一方面,还提供了一种数据处理的装置,包括:获取模块,用于获取输入信息,其中,输入信息包括:表格数据和用户需求,用户需求用于指示依据表格数据生成的文本所满足的要求;改写模块,用于根据表格数据改写用户需求,得到目标用户需求,其中,目标用户需求中包括依据表格数据生成的新增字段;筛选模块,用于根据目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段,其中,多个表格片段是对表格数据进行切分得到的,在多阶段筛选中,将上一阶段筛选得到的结果作为下一阶段的待筛选对象;生成模块,用于根据目标表格片段和目标用户需求生成目标文本,其中,目标文本中包括与新增字段对应的数据。

10、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有计算机程序,其中,在非易失性存储介质所在设备通过运行计算机程序执行上述的数据处理的方法。

11、根据本申请实施例的另一方面,还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为通过计算机程序执行上述的数据处理的方法。

12、根据本申请实施例的另一方面,还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现上述的数据处理的方法的步骤。

13、在本申请实施例中,采用获取输入信息,其中,输入信息包括:表格数据和用户需求,用户需求用于指示依据表格数据生成的文本所满足的要求;根据表格数据改写用户需求,得到目标用户需求,其中,目标用户需求中包括依据表格数据生成的新增字段;根据目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段,其中,多个表格片段是对表格数据进行切分得到的,在多阶段筛选中,将上一阶段筛选得到的结果作为下一阶段的待筛选对象;根据目标表格片段和目标用户需求生成目标文本,其中,目标文本中包括与新增字段对应的数据的方式,通过对输入的表格进行切分,单独对切分得到的每个表格片段进行解析,减少了单次分析表格数据时的数据处理量;通过多阶段筛选表格片段,将筛选得到的表格片段与用户输入的需求信息融合,达到了根据表格数据架构输入的需求改写为与表格数据更高的需求信息的目的,基于改写后的需求信息对表格数据进行分析和内容再生成,从而实现了提高基于表格数据进行内容再生成得到的结果的准确性的技术效果,进而解决了相关技术中对表格数据进行解析和内容再创造时,由于输入的用户需求与表格数据的关联度小造成的基于表格数据进行内容再创造得到的结果不准确技术问题。

本文档来自技高网...

【技术保护点】

1.一种数据处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述表格数据改写所述用户需求,得到目标用户需求,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述关键字段将所述用户需求改写为所述目标用户需求,包括:

4.根据权利要求1所述的方法,其特征在于,根据所述目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段,包括:

5.根据权利要求4所述的方法,其特征在于,确定每个所述表格片段与所述目标用户需求的第一语义相似度,包括:

6.根据权利要求4所述的方法,其特征在于,根据所述第一语义相似度对多个所述表格片段进行第一阶段筛选,得到第一筛选结果,包括:

7.根据权利要求1所述的方法,其特征在于,根据所述目标表格片段和所述目标用户需求生成目标文本,包括:

8.一种数据处理的装置,其特征在于,包括:

9.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储有计算机程序,其中,在所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至7中任意一项所述的数据处理的方法。

10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任意一项所述的数据处理的方法。

11.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至7中任意一项所述的数据处理的方法的步骤。

...

【技术特征摘要】

1.一种数据处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述表格数据改写所述用户需求,得到目标用户需求,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述关键字段将所述用户需求改写为所述目标用户需求,包括:

4.根据权利要求1所述的方法,其特征在于,根据所述目标用户需求在多个表格片段中进行多阶段筛选,得到目标表格片段,包括:

5.根据权利要求4所述的方法,其特征在于,确定每个所述表格片段与所述目标用户需求的第一语义相似度,包括:

6.根据权利要求4所述的方法,其特征在于,根据所述第一语义相似度对多个所述表格片段进行第一阶段筛选,得到第一筛选结果,包括:

7.根据...

【专利技术属性】
技术研发人员:潘长在张劼李孟祥何忠江武汉铭赵宇李永翔宋双永
申请(专利权)人:中电信人工智能科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1