System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及大数据和人工智能,更具体地涉及一种规则制度文件的处理方法、装置、电子设备和介质。
技术介绍
1、合规性问题一直是企业和组织面临的关键问题之一。然而,由于监管规则的复杂性、多样性和不断变化,以及不同领域之间的监管标准差异,许多企业在掌握监管规则方面存在困难,并对监管规定动作执行有偏差,从而导致了合规风险的暴露,可能导致法律诉讼、罚款和声誉受损等不良后果。
2、随着监管规则的不断升级,企业和组织需要更加高效、智能和精确的方法来应对合规性挑战。然而,传统的合规性管理方法已经无法满足新的监管环境的要求。因此,有必要研究和开发新的技术和方法,以更好地理解、解释和遵守监管规则。
3、目前的智能化技术,包括自然语言处理、机器学习和知识图谱,在帮助企业理解监管规则、跟踪规则的变化和提高合规性管理效率方面提供了重要的支持,然而,当前技术对于复杂的监管规则的识别准确性仍存在局限,从而带来了理解和解释方面的问题。
技术实现思路
1、鉴于上述问题,根据本专利技术的第一方面,提供了一种规则制度文件的处理方法,所述方法包括:获取监管规则信息和企业内部制度信息,其中,所述监管规则信息和企业内部制度信息分别包括多个规则条目和多个制度条目;对所述多个规则条目和所述多个制度条目进行数据预处理和文本分析,获得多个解析化条目;利用预先构建的标签体系对每个解析化条目分配对应的标签,获得多个条目标签组,其中,每一个所述条目标签组包括一个解析化条目和与该解析化条目对应的标签;利用预先构建的
2、根据一些示例性实施例,预先构建关联知识图谱,具体包括:获取历史监管规则的第一文本信息和历史企业内部制度的第二文本信息,其中,所述第一文本信息和所述第二文本信息分别包括多个历史条目;利用预先构建的标签体系对所述第一文本信息和所述第二文本信息分配对应的标签,获得历史条目标签组;对所述历史条目标签组进行知识抽取,获得所述历史条目标签组中的实体和实体间关系;基于所述实体和实体间关系,构建三元组表示,其中,所述三元组表示包括实体、关系和实体的形式;以及基于所述三元组表示,构建所述关联知识图谱。
3、根据一些示例性实施例,预先构建标签体系,具体包括:对所述第一文本信息和所述第二文本信息进行文本分析;基于文本分析的结果,利用合规管理的专家经验,设置标签分类,其中,所述标签分类包括明确内容实质的标签大类和明确内容环节的标签小类;对所述标签分类中每个类别的标签设置标签说明,其中,所述标签说明包括标签之间的关联关系;以及基于所述标签分类和标签说明形成标签体系。
4、根据一些示例性实施例,利用neo4j图数据库对所述关联知识图谱进行存储。
5、根据一些示例性实施例,所述利用所述条目关联关系计算所述规则条目和制度条目之间的匹配性,基于所述匹配性输出所述企业内部制度信息的处理等级,具体包括:基于所述条目关联关系,获取目标监管规则信息和对应的企业内部制度信息;计算所述目标监管规则信息和对应的企业内部制度信息的余弦相似度;以及响应于所述余弦相似度小于预设的阈值,输出所述对应的企业内部制度信息为高处理等级,其中,所述高处理等级表明应基于所述目标监管规则信息更改所述对应的企业内部制度信息。
6、根据一些示例性实施例,所述方法还包括:响应于所述对应的企业内部制度信息的数量大于1,基于所述对应的企业内部制度信息的对应标签条目计算权重;按所述权重对所述对应的企业内部制度信息进行降序排序,获取调整顺序;以及按所述调整顺序对所述企业内部制度信息进行调整处理。
7、根据一些示例性实施例,所述基于所述对应的企业内部制度信息的对应标签条目计算权重,具体包括:基于所述对应标签条目,获取标签使用频率和标签的标注顺序;以及计算所述标签使用频率和标签的标注顺序的加和,获得所述权重。
8、根据一些示例性实施例,在所述利用预先构建的关联知识图谱对所述条目标签组进行遍历,获得条目关联关系之后,所述方法还包括:基于所述条目关联关系,获取无关联监管规则信息,所述无关联监管规则信息用于表示无法关联企业内部制度的监管规则信息;以及基于所述无关联监管规则信息,输出处理提示,以提示企业重新制定企业内部制度。
9、根据一些示例性实施例,所述监管规则信息包括图像信息,所述企业内部制度信息为文本信息;所述对所述多个规则条目和所述多个制度条目进行数据预处理和文本分析,获得多个解析化条目,具体包括:将所述多个规则条目输入版面分析模型,获取有效版面区域;基于所述有效版面区域,利用光学字符识别技术提取多个规则条目的文本信息;以及对所述多个规则条目和所述多个制度条目的文本信息进行数据清洗和分词,利用主题建模算法获得所述解析化条目。
10、根据一些示例性实施例,所述基于所述解析化条目,利用预先构建的标签体系对每个解析化条目分配对应的标签,具体包括;利用关系抽取算法,自动识别所述解析化条目中的关键实体和关系;以及基于所述关键实体和关系,利用预先构建的标签体系对每个条目分配对应的标签。
11、根据一些示例性实施例,所述利用预先构建的标签体系对每个条目分配对应的标签,具体包括:基于预先构建的标签体系,利用自动标注模型对每个条目分配对应的标签,其中,所述自动标注模型包括用于对每个字符进行编码的bert特征表示层、用于进行深度特征提取的idcnn-bilstm特征学习层和用于进行预测的crf知识推理层。
12、根据本专利技术的第二方面,提出了一种企业内部制度文件的处理装置,所述装置包括:信息获取模块,用于:获取监管规则信息和企业内部制度信息,其中,所述监管规则信息和企业内部制度信息分别包括多个规则条目和多个制度条目;解析化规则条目获取模块,用于:对所述多个规则条目和所述多个制度条目进行数据预处理和文本分析,获得多个解析化条目;条目标签组获取模块,用于:利用预先构建的标签体系对每个解析化条目分配对应的标签,获得多个条目标签组,其中,每一个所述条目标签组包括一个解析化条目和与该解析化条目对应的标签;条目关联关系获取模块,用于:利用预先构建的关联知识图谱对所述条目标签组进行遍历,获得条目关联关系,其中,所述关联知识图谱包括多个实体和多条边,每一个所述实体代表所述条目标签组,每一条所述边代表所述条目标签组之间的关联关系,所述条目关联关系用于表明所述规则条目和所述制度条目之间的关联关系;以及处理等级输出模块,用于:利用所述条目关联关系计算所述规则条目和制度条目之间的匹配性,基于所述匹配性输出所述企业内部制度信息的处理等级。
13、根据一些示例性实施例,所述本文档来自技高网...
【技术保护点】
1.一种规则制度文件的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,预先构建关联知识图谱,具体包括:
3.根据权利要求2所述的方法,其特征在于,预先构建标签体系,具体包括:
4.根据权利要求1~3任一项所述的方法,其特征在于,利用Neo4j图数据库对所述关联知识图谱进行存储。
5.根据权利要求1所述的方法,其特征在于,所述利用所述条目关联关系计算所述规则条目和制度条目之间的匹配性,基于所述匹配性输出所述企业内部制度信息的处理等级,具体包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述对应的企业内部制度信息的对应标签条目计算权重,具体包括:
8.根据权利要求5~7任一项所述的方法,其特征在于,在所述利用预先构建的关联知识图谱对所述条目标签组进行遍历,获得条目关联关系之后,所述方法还包括:
9.根据权利要求1~3、5~7任一项所述的方法,其特征在于,所述监管规则信息包括图像信息,所述企
10.根据权利要求9所述的方法,其特征在于,所述利用预先构建的标签体系对每个解析化条目分配对应的标签,获得多个条目标签组,具体包括;
11.根据权利要求10所述的方法,其特征在于,所述利用预先构建的标签体系对每个条目分配对应的标签,具体包括:
12.一种企业内部制度文件的处理装置,其特征在于,所述装置包括:
13.一种电子设备,包括:
14.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~11中任一项所述的方法。
...【技术特征摘要】
1.一种规则制度文件的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,预先构建关联知识图谱,具体包括:
3.根据权利要求2所述的方法,其特征在于,预先构建标签体系,具体包括:
4.根据权利要求1~3任一项所述的方法,其特征在于,利用neo4j图数据库对所述关联知识图谱进行存储。
5.根据权利要求1所述的方法,其特征在于,所述利用所述条目关联关系计算所述规则条目和制度条目之间的匹配性,基于所述匹配性输出所述企业内部制度信息的处理等级,具体包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述对应的企业内部制度信息的对应标签条目计算权重,具体包括:
8.根据权利要求5~7任一项所述的方...
【专利技术属性】
技术研发人员:何明燕,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。