一种基于多模型的稽核检索方法、装置及存储介质制造方法及图纸

技术编号：37329098 阅读：23 留言：0更新日期：2023-04-21 23:07

本发明专利技术公开了一种基于多模型的稽核检索方法、装置及存储介质，其中方法包括：根据初步检索过程中用户的点击数据构建训练样本；将多个模型的得分作为特征数据，将特征数据与样本标签进行拼接后得到样本特征数据；根据样本特征数据和训练样本建立机器学习模型；利用机器学习模型对多个模型的检索结果进行融合，得到每篇文档的最终相似度分数；根据最终相似度分数根据每篇文档的相似度分数召回对应的最终召回文档，并对最终召回文档进行排序。本发明专利技术实施例利用机器学习模型对多个模型的检索结果进行融合，对查询语句的相关文档进行分析和检索，从而能够全面返回检索的结果，从而能够有效提高稽核检索的准确性。有效提高稽核检索的准确性。有效提高稽核检索的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模型的稽核检索方法、装置及存储介质

[0001]本专利技术涉及数据稽核
，尤其是涉及一种基于多模型的稽核方法、装置及存储介质。

技术介绍

[0002]目前，证券公司的内部检索主要是依据公司内部的规章制度，对自身进行专业监督自我约束的重要工作，通过加强对公司的控制达到防范经营风险、创造收益的目的。由于证券公司身处高风险的行业，加强内部稽核监督及防范经营风险是证券公司的重要任务。稽核人员在日常的工作中，不仅负责对公司内部制度进行维护与完善，还需要对公司各部门的各项工作及流程进行审计与检查。由于检查事项众多且复杂，各项检查之间的条目、范围、粒度均不一致，因此稽核人员在前期准备工作以及审计检查的过程中会耗费大量的人力进行相关资料的查阅与稽核。而现有稽核方法通常是通过关键字进行匹配，进行文字层面的查找与关联以完成稽核检索，但是现在的稽核检索方法无法全面返回检索结果，导致稽核检索的准确性较低。

技术实现思路

[0003]本专利技术提供了一种基于多模型的稽核检索方法、装置及存储介质，以解决现在的稽核检索方法无法全面返回检索结果，导致稽核检索的准确性较低的技术问题。
[0004]本专利技术的一个实施例提供了一种基于多模型的稽核检索方法，包括：
[0005]训练样本构建步骤：根据初步检索过程中用户的点击数据构建训练样本；
[0006]样本特征获取步骤：将多个模型的得分作为特征数据，将所述特征数据与样本标签进行拼接后得到样本特征数据；
[0007]机器学习模型构建步骤：根据...

【技术保护点】

【技术特征摘要】
1.一种基于多模型的稽核检索方法，其特征在于，包括：训练样本构建步骤：根据初步检索过程中用户的点击数据构建训练样本；样本特征获取步骤：将多个模型的得分作为特征数据，将所述特征数据与样本标签进行拼接后得到样本特征数据；机器学习模型构建步骤：根据所述样本特征数据和所述训练样本建立机器学习模型；相似度分数计算步骤：利用所述机器学习模型对多个所述模型的检索结果进行融合，得到每篇文档的最终相似度分数；检索结果获取步骤：根据所述最终相似度分数根据每篇文档的相似度分数召回对应的最终召回文档，并对所述最终召回文档进行排序，得到最终检索结果。2.如权利要求1所述的基于多模型的稽核检索方法，其特征在于，所述训练样本包括正样本和负样本，所述根据初步检索过程中用户的点击数据构建训练样本，包括：将被用户点击过的数据作为正样本；将向用户曝光过但未被用户点击的数据，以及未向用户曝光的数据合并后作为负样本。3.如权利要求1所述的基于多模型的稽核检索方法，其特征在于，还包括：检测用户的点击数据的数据量，在所述数据量超过预设阈值时，从生产环境点击日志中合并新的数据流，根据所述新的数据流生成新的训练样本，根据所述新的训练样本进行重新训练，得到更新后的机器学习模型。4.如权利要求1所述的基于多模型的稽核检索方法，其特征在于，所述检索结果获取步骤，还包括：对查询语句进行意图解析得到解析结果；若所述解析结果包含员工姓名以及具体稽核项目名称，则返回所述员工的基本信息，以及该员工在所述稽核项目下需要被审核的所有流程链接；若所述解析结果包含部门名称以及具体稽核项目名称时，返回所述部门在所述稽核项目下需要被审核的所有流程链接；若所述解析结果中包含具体事件名称，则返回流程名称中包含所述事件名称的所有流程链接。5.如权利要求1所述的基于多模型的稽核检索方法，其特征在于，所述多个模型包括词袋模型、word2vec模型、lda模型及bert模型。6.如权利要求1所述的基于多模型的稽核检索方法，其特征在于，还包括初步检索步骤：采用多个模型将文档库文档和查询语句转换为不同类型的语义向量；根据所述语义向量，在索引库中查询符合预设条件的文档；根据每个模型在测试集上的表现，对每个模...

【专利技术属性】
技术研发人员：张岩，李衡，邹杰，张汉林，
申请(专利权)人：广发证券股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人