System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 事项办理标准信息的确定方法、装置、设备及存储介质制造方法及图纸_技高网

事项办理标准信息的确定方法、装置、设备及存储介质制造方法及图纸

技术编号:44980986 阅读:9 留言:0更新日期:2025-04-15 17:00
本申请涉及一种事项办理标准信息的确定方法、装置、设备及存储介质。该方法包括:获取目标文档,根据识别到内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值;然后生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值;再进行事项办理标准族的提取处理,得到多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族;最后进行融合处理,得到融合后的多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族,并作为与目标文档匹配的事项办理标准信息。本申请提供的方案,能够根据目标文档提取得到与目标文档匹配的事项办理标准信息,以便于进行事项办理。

【技术实现步骤摘要】

本申请涉及数据分析,尤其涉及一种事项办理标准信息的确定方法、装置、设备及存储介质


技术介绍

1、相关技术中,政务服务会涉及到多种类型的事项办理。当前许多特定app都开发了在线办事的功能,但该功能通常仅提供搜索展示的功能。

2、实践中当上一级部门对某政务事项做出统一要求时,下一级基层往往会基于自身实际情况,设置符合各自实际情况的事项办理标准。例如,办理某一事项需要提交材料,有的区域支持纸质和电子两种材料形式,有的区域只接受电子材料形式,有的区域只接受网上办理,有的区域接受网上办理和窗口办理,有的区域不仅接受网上办理和窗口办理还接受快递形式。类似的,其它事项要素细节差异还有很多。这些差异给进行事项办理方带来了较大难度,也降低的各方的办事效率。由此可见,当下十分需要一种标准化方法能够梳理政务事项办理标准。仅依赖人工梳理,不仅工作量大,且容易出错,梳理出的政务事项办理标准的准确率稳定性较低。


技术实现思路

1、为解决或部分解决相关技术中存在的问题,本申请提供一种事项办理标准信息的确定方法、装置、设备及存储介质,能够对如事项办事指南等文档数据进行准确的提取处理,且保证了数据一致性;梳理过程中不但能够提取出事项办理标准族,还能够利用融合处理降低提取处理可能带来的知识幻觉干扰,有利于使与目标文档匹配的事项办理标准信息的准确率和稳定性提升。

2、本申请第一方面提供一种事项办理标准信息的确定方法,包括:获取目标文档,识别目标文档的内容并根据识别到内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值;其中,多个第一事项要素字段包括相同事项要素字段和/或不同事项要素字段;根据多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值;其中,多个第二事项要素字段中的各事项要素字段不相同;基于多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值进行事项办理标准族的提取处理,得到多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族;基于多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族进行融合处理,得到融合后的多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族,并将多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族作为与目标文档匹配的事项办理标准信息。

3、在一些实施方式中,获取目标文档,识别目标文档的内容并根据识别到内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,包括:获取目标文档,利用命名实体识别技术、光学字符识别技术和数据分析工具pandas库技术中的一种或多种技术,识别目标文档的内容并根据识别到内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值。

4、在一些实施方式中,根据多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值,包括:根据多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,利用预设递归函数生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值。

5、在一些实施方式中,该方法还包括:在利用预设递归函数进行递归处理过程中,针对第一事项要素字段对应的事项要素值,在确定第一事项要素字段对应的事项要素值的类型为数值型和/或非中文类型的情况下,将数值型和/或非中文类型的事项要素值转化为中文类型的事项要素值;和/或,在利用预设递归函数进行递归处理过程中,针对第一事项要素字段对应的事项要素值,在确定第一事项要素字段对应的事项要素值的文本字符大于阈值的情况下,利用神经网络模型输出与事项要素值对应的摘要文本,并将摘要文本作为第二事项要素字段对应的事项要素值。

6、在一些实施方式中,基于多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值进行事项办理标准族的提取处理,得到多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族,包括:基于多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值,利用大型语言模型和聚类模型分别进行事项办理标准族的提取处理,得到多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族。

7、在一些实施方式中,基于多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族进行融合处理,得到融合后的多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族,包括:针对大型语言模型提取处理得到的多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族,和聚类模型提取处理得到的多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族中的相同的第三事项要素字段对应的事项办理标准族,进行一次去重处理,得到一次去重处理结果;基于去重处理结果,确定多个余弦相似度值,并利用多个余弦相似度值和预设余弦相似度阈值,进行二次去重处理,得到二次去重处理结果;基于二次去重处理结果,利用大型语言模型进行事项办理标准族的提取处理,得到输出结果,并将输出结果作为多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族。

8、本申请第二方面提供一种事项办理标准信息的确定装置,该装置包括:第一确定模块,用于获取目标文档,识别目标文档的内容并根据识别到内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值;其中,多个第一事项要素字段包括相同事项要素字段和/或不同事项要素字段;第一生成模块,用于根据多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值;其中,多个第二事项要素字段中的各事项要素字段不相同;第一获得模块,用于基于多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值进行事项办理标准族的提取处理,得到多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族;第二获得模块,用于基于多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族进行融合处理,得到融合后的多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族,并将多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族作为与目标文档匹配的事项办理标准信息。

9、本申请第三方面提供一种电子设备,包括:

10、处理器;以及

11、存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。

12、本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。

13、本申请提供本文档来自技高网...

【技术保护点】

1.一种事项办理标准信息的确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标文档,识别所述目标文档的内容并根据识别到所述内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值进行事项办理标准族的提取处理,得到多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述多个第三事项要素字段和分别与每一个第三事项要素字段对应的事项办理标准族进行融合处理,得到融合后的多个第四事项要素字段和分别与每一个第四事项要素字段对应的事项办理标准族,包括:

7.一种事项办理标准信息的确定装置,其特征在于,包括:

8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,还用于:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-6中任一项所述的方法。

...

【技术特征摘要】

1.一种事项办理标准信息的确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取目标文档,识别所述目标文档的内容并根据识别到所述内容确定多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一事项要素字段和分别与每一个第一事项要素字段对应的事项要素值,生成多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值,包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述多个第二事项要素字段和分别与每一个第二事项要素字段对应的事项要素值进行事项办理标准族的提取处理...

【专利技术属性】
技术研发人员:吴绍华康明吉王舒
申请(专利权)人:广东亿迅科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1