System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于自然语言交互的信审数据获取方法及系统技术方案_技高网

一种基于自然语言交互的信审数据获取方法及系统技术方案

技术编号:43491725 阅读:9 留言:0更新日期:2024-11-29 17:00
本发明专利技术涉及一种基于自然语言交互的信审数据获取方法及系统,包括对第一结构化数据和第二结构化数据分别执行分片操作,组合并识别生成调用数据集,并依据关键词集合匹配调用数据集生成信审数据集合反馈交互信息请求,通过信审人员自然语言交互进行文字总结与意图识别,实现关键信息提取及逻辑计算,降低人工审核在大信息下的分析成本,将复杂流程减化且对业务场景无入侵,提供了一种高效、智能、自动化且灵活的方式,辅助信审工作人员处理信用审核的大量数据集的问题,解决专业信审人员面临的信息过载问题,提高人工信审的决策效率。

【技术实现步骤摘要】

本专利技术涉及金融科技、金融风险控制及数据处理,尤其涉及一种基于自然语言交互的信审数据获取方法及系统


技术介绍

1、在金融业务办理过程中,信用审核是对于业务主体资格的必要检查程序。信用审核是指对个人、企业或其他实体的信用信贷申请进行审核和评估,以确定是否批准借款或信用申请以及授予多大额度的审核过程,这个过程旨在评估申请人的信用可靠性和还款能力,以减少信贷风险。

2、传统处理方式中,信用审核的主要处理方式为人工信审和大数据风控。其中,人工信审需要由经验丰富的信审员操作处理,并严格根据机构的信贷政策和标准来做出决策。这种处理方式下,最终的信用审核审批结果可能会根据信审员个人的判断和专业知识而异,信审员需要阅读识别大量的数据,面临信息量过载和处理效率低,重复工作量大等问题且过分依赖信审员的个人经验,标准化程度低,经验难以复制,同时人工审核过程往往需要较多的时间。

3、大数据风控是一种利用大规模数据集和先进技术来评估和管理风险的方法,主要应用于金融、保险、贷款和其他领域,旨在帮助机构更好地识别、量化和管理不同类型的风险,如信用风险、市场风险、操作风险和合规风险等。现有技术下,大数据风控通常使用自动化算法和模型,以处理和分析大规模数据集,从而降低成本、提高效率和准确性。这类智能风控系统通常希望实现自动化风险决策流程,包括信贷决策、投资组合管理和交易执行,最大化帮助提高决策的效率,并减少人为错误的可能性。但在实际应用中,大数据风控为了实现较高的标准化程度,往往会出现规则固定、灵活性差的问题,因此不能很好的适应复杂信贷项目使用,且容易受到环境变化(例如经济大环境变动)影响,导致审核决策效果下降。

4、在金融领域内为了平衡信用审核准确性和审核效率,现有技术下,往往采用人工信审与大数据风控相结合的实际处理方式。以贷款场景为例,可以优选选择使用大数据风控的自动化系统处理大量的信用申请,并依据条件匹配特殊申请案例,例如高风险借款申请或非标准情况,并将特殊申请案例转入人工信审处理方式以确保信贷决策的准确性和可靠性。

5、但是,现有技术的处理方式实质仍然是人工信审与大数据风控各自独立运行操作的低耦合度处理方式,人工信审过程不能通过大数据风控获得较高的数据支持,实质审核过程仍然完全依赖信审员凭借个人经验人工处理,并未实质改善现有技术的缺陷。


技术实现思路

1、为解决现有技术的不足,本专利技术提出一种基于自然语言交互的信审数据获取方法及系统,通过信审人员自然语言交互进行文字总结与意图识别,实现关键信息提取及逻辑计算,降低人工审核在大信息下的分析成本,将复杂流程减化且对业务场景无入侵,提供了一种高效、智能、自动化且灵活的方式,辅助信审工作人员处理信用审核的大量数据集的问题,解决专业信审人员面临的信息过载问题,提高人工信审的决策效率。

2、为实现以上目的,本专利技术所采用的技术方案包括:

3、一种基于自然语言交互的信审数据获取方法,其特征在于,包括:

4、s1、获取源数据,对源数据执行结构化数据捕获操作,生成第一结构化数据,并判断源数据是否包含非结构化数据;

5、s2、当判断源数据包含非结构化数据时,提取非结构化数据并执行结构化转化操作,生成第二结构化数据;

6、s3、对第一结构化数据和第二结构化数据分别执行分片操作,生成第一文本信息集合与第二文本信息集合,匹配第一文本信息集合与第二文本信息集合组合生成第三文本信息集合;

7、s4、依据第三文本信息集合提取提示词组合并配置文本信息组合规则,生成调用数据集;

8、s5、获取交互信息请求,对交互信息请求执行关键词提取操作,生成关键词集合;

9、s6、依据关键词集合匹配调用数据集生成信审数据集合反馈交互信息请求。

10、进一步地,所述匹配第一文本信息集合与第二文本信息集合组合生成第三文本信息集合包括:

11、以第一本文信息集合为基准,判断第二文本信息集合中的各项第二文本信息与第一文本信息集合的匹配度是否高于预设阈值;

12、当判断第二文本信息与第一文本信息集合的匹配度高于预设阈值时,在第二文本信息集合中删除对应的第二文本信息,生成调整后的第二文本信息集合;

13、组合第一文本信息集合与调整后的第二文本信息集合组合生成第三文本信息集合。

14、进一步地,所述步骤s4还包括:

15、使用调用数据集,配置第一模型负载并执行第一模型参数转换操作,调用第一预设模型生成第一反馈信息集合;

16、所述第一预设模型包括生成式对话模型。

17、进一步地,所述步骤s6包括:

18、依据关键词集合匹配第一反馈信息集合,获取第一信审数据;

19、判断关键词集合中是否存在不匹配第一反馈信息集合的未匹配关键词;

20、当判断存在不匹配第一反馈信息集合的未匹配关键词时,使用未匹配关键词,配置第二模型负载并执行第二模型参数转换操作,调用第一预设模型生成第二反馈信息集合;

21、组合第一信审数据与第二反馈信息集合生成信审数据集合。

22、进一步地,所述方法还包括:

23、依据交互信息请求获取外挂知识库;

24、依据关键词集合匹配外挂知识库,获取第二信审数据;

25、使用第二信审数据对信审数据集合执行修订操作。

26、进一步地,所述方法还包括:

27、将所述信审数据集合作为训练数据集和/或验证数据集对大数据风控模型执行改进训练操作。

28、本专利技术还涉及一种基于自然语言交互的信审数据获取系统,其特征在于,包括:

29、源数据处理模块,用于对源数据执行结构化数据捕获操作,生成第一结构化数据,以及提取非结构化数据并执行结构化转化操作,生成第二结构化数据;

30、文本信息处理模块,用于对第一结构化数据和第二结构化数据分别执行分片操作,生成第一文本信息集合与第二文本信息集合,匹配第一文本信息集合与第二文本信息集合组合生成第三文本信息集合;

31、数据集管理模块,用于依据第三文本信息集合提取提示词组合并配置文本信息组合规则,生成调用数据集;

32、请求提取模块,用于对交互信息请求执行关键词提取操作,生成关键词集合;

33、请求反馈模块,用于依据关键词集合匹配调用数据集生成信审数据集合反馈交互信息请求。

34、本专利技术还涉及一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。

35、本专利技术还涉及一种电子设备,其特征在于,包括处理器和存储器;

36、所述存储器,用于存储第一结构化数据、第二结构化数据和调用数据集;

37、所述处理器,用于通过调用第一结构化数据、第二结构化数据和调用数据集,执行上述的方法。

38、本专利技术还涉本文档来自技高网...

【技术保护点】

1.一种基于自然语言交互的信审数据获取方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述匹配第一文本信息集合与第二文本信息集合组合生成第三文本信息集合包括:

3.如权利要求1所述的方法,其特征在于,所述步骤S4还包括:

4.如权利要求3所述的方法,其特征在于,所述步骤S6包括:

5.如权利要求3所述的方法,其特征在于,所述方法还包括:

6.如权利要求1所述的方法,其特征在于,所述方法还包括:

7.一种基于自然语言交互的信审数据获取系统,其特征在于,包括:

8.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

9.一种电子设备,其特征在于,包括处理器和存储器;

10.一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现权利要求1至6中任一项所述方法的步骤。

【技术特征摘要】

1.一种基于自然语言交互的信审数据获取方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述匹配第一文本信息集合与第二文本信息集合组合生成第三文本信息集合包括:

3.如权利要求1所述的方法,其特征在于,所述步骤s4还包括:

4.如权利要求3所述的方法,其特征在于,所述步骤s6包括:

5.如权利要求3所述的方法,其特征在于,所述方法还包括:

6.如权利要求1所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:董亚鹏孙允辉崔翔游国毅贺世博董旭栋
申请(专利权)人:中信百信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1