System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及签证管理,更具体地说,本专利技术涉及一种基于机器学习的签证自动化管理系统。
技术介绍
1、申请公开号为cn111798195a的专利公开了一种低成本签证管理系统,包括在线申请子系统、审批系统、签证系统和材料数据库,在线申请子系统与审批系统连接,审批系统与所述签证系统连接,签证系统和所述材料数据库连接;实际应用中,通过在线申请子系统由申请人自己录入申请材料,节省了签证中介费用,错误率低;通过审批系统对用户提供的申请材料进行原件和电子材料快速对比审核,通过签证系统快速出证,减少了外放签证官的费用,申请效率高,错误率低,申请速度快;通过签证系统携带签证人员入境和出境记录,材料数据库存储、加密申请信息后,材料数据库自动对出入境记录进行分析,分析结果可用于指导国家经济或政策制定。
2、现有的签证审批效率低下,人工成本高昂,传统的审批流程多数依赖人工操作,效率较低,且需要大量人力参与,造成人工成本昂贵;其次,审批过程主观性强,缺乏公正性,过于依赖审核员的主观判断,难以全面客观地评估申请人的各方面信息,审批结果的公平性受到质疑;另外,审批决策质量有待提高,人工决策容易受到个人经验和认知偏差的影响,决策质量参差不齐,缺乏科学性和一致性;此外,现有系统缺乏持续优化审批模型的机制,无法根据申请人的实际反馈行为对审批模型进行动态调整和完善,难以持续提升决策能力;缺少对申请人综合素质和信誉水平的全面把握。
3、鉴于此,本专利技术提出一种基于机器学习的签证自动化管理系统以解决上述问题。
技
1、为了克服现有技术的上述缺陷,为实现上述目的,本专利技术提供如下技术方案:一种基于机器学习的签证自动化管理系统,包括:数据输入模块,用于接收签证申请人的个人信息和签证申请材料;
2、机器学习模型训练模块,将个人信息和签证申请材料进行预处理并输入至预先训练完成的基于监督学习算法的分类模型;得到申请人获准签证概率分数;
3、申请处理模块,将个人信息和预测的申请人获准签证概率分数作为状态输入基于强化学习算法的最优策略模型,输出申请行为结果;
4、通知模块,用于向申请人和审查员通知申请行为结果;各个模块之间通过有线和/或无线的方式进行连接,实现模块间的数据传输。
5、进一步地,所述个人信息包括身份信息、教育背景和职业经历;所述签证申请材料包括申请人材料和系统匹配材料;
6、所述申请人材料包括护照期限、申请目的、前往国家和健康状况;系统匹配材料包括社会信用评分和申请人经济状况;
7、所述身份信息包括姓名、出生日期、国籍、婚姻状况和所处城市;所述教育背景包括学历、专业和毕业院校;职业经历包括工作单位、职位和工作年限;申请人经济状况包括月收入、资产和银行流水;所述的申请行为结果包括批准签证、拒绝签证或要求补充材料。
8、进一步地,所述社会信用评分的获取方式包括:
9、利用网络爬虫技术,从申请人的社交媒体账号、网购平台账号、点评网站、信用名单网站的公开渠道,合法的爬取申请人的行为数据;所述行为数据包括行为特征数据和评论信息;
10、将行为数据进行数据预处理,将行为数据转换为结构化数据集;所述预处理包括清洗、去重和格式化;
11、收集历史n个自然人的行为数据,将每个行为数据进行数据预处理;得到预处理行为数据;将预处理行为数据进行人工标注出信用分数;标注出信用分数的n个预处理行为数据构成训练数据集;训练数据集内的数据即为样本;
12、利用卡方检验方法将训练数据集进行筛选,得到评分数据集;
13、将评分数据集划分为评分训练集和评分验证集;将评分训练集内的数据作为评分样本;
14、将类别型或文字型的行为数据进行one-hot编码,将数值型特征进行标准化/归一化;
15、构建评分回归模型的基础框架并初始化评分回归模型的超参数,得到初始评分回归模型;所述评分回归模型的基础框架为逻辑回归、决策树、随机森林、梯度提升树、支持向量机或深度神经网络中的任一;
16、通过定义损失函数、选择激活函数以及运用优化器搜索确定初始化评分回归模型的超参数;
17、将评分训练集划分批次,按批次输入初始评分回归模型,并记录损失函数的函数值;当连续p个批次得到的损失函数的函数值不再下降时,则保存此时以及上b个批次得到的初始评分回归模型;
18、使用验证集对保存的b+1个初始评分回归模型进行评估模型效果;将模型效果最好的初始评分回归模型作为训练完成的评分回归模型;
19、将获取的申请人的行为数据进行筛选,得到实时数据;将实时数据输入至训练完成的评分回归模型,输出的信用分数即为社会信用评分。
20、进一步地,所述将训练数据集进行筛选的方式包括:
21、将行为数据作为特征,将社会信用评分作为目标变量;构建特征与目标变量的列联表;将特征和目标变量的取值分别按行和列构成一个r行c列的列联表;表格中的每个单元格记录了对应取值组合的样本的数量;
22、计算每个单元格在特征和目标变量相互独立的假设下的期望数量式中,w1为行总计;w2为列总计;w为样本总数;计算卡方统计量卡方统计量反映观测值与期望值之间的偏离程度;oij表示第i个特征的取值和第j个目标变量的取值的实际观测样本数量;qij表示第i个特征的取值和第j个目标变量的取值在特征和目标变量独立的假设下的期望样本数量;
23、所述行总计是第i行的样本总数,列总计是第j列的样本总数,总样本数是整个表格的样本总数;
24、计算自由度df=(r-1)×(c-1);
25、给定自由度和显著性水平;在卡方分布表中查询对应的临界值;若卡方统计量大于临界值,则特征与目标变量相关;若卡方统计量小于或等于临界值,则特征与目标变量独立;
26、将所有特征的卡方统计量从大到小排序;选择排名靠前的k个特征,剩余特征被过滤掉。
27、进一步地,所述损失函数包括监督损失部分和信用反馈损失部分;所述激活函数选择sigmoid激活函数,优化器采用adagrad优化器;
28、监督损失部分其中,ytrue,i'为第i'个评分样本的标注的信用分数;ypred,i'为第i'个评分样本的预测的信用分数;n为评分样本的总数;
29、信用反馈损失部分为基于预测的信用分数ypred,i';将ypred,i'作为条件,按照预定分数区间划分风险等级,并对第i'个评分样本对应的申请人执行相应的批准签证或拒绝签证;
30、观测一段时间后,记录该申请人的实际行为反馈,将实际行为反馈对应的数据编码为行为分数ybehav,i';
31、计算行为分数与预测的信用分数的差值作为信用反馈损失部分lfeed;
32、lfeed=λ·|ybehav,i'-ypred,i'|;其中,λ是权重系数,隶属于[0,1];初始为1,全权信任模型预本文档来自技高网...
【技术保护点】
1.一种基于机器学习的签证自动化管理系统,其特征在于,包括:数据输入模块,用于接收签证申请人的个人信息和签证申请材料;
2.根据权利要求1所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述个人信息包括身份信息、教育背景和职业经历;所述签证申请材料包括申请人材料和系统匹配材料;
3.根据权利要求2所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述社会信用评分的获取方式包括:
4.根据权利要求3所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述将训练数据集进行筛选的方式包括:
5.根据权利要求4所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述损失函数包括监督损失部分和信用反馈损失部分;所述激活函数选择Sigmoid激活函数,优化器采用Adagrad优化器;
6.根据权利要求5所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述将个人信息和签证申请材料进行预处理的方式包括:
7.根据权利要求6所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述词嵌入层将编码
8.根据权利要求7所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述最优策略模型的构建方式包括:
9.根据权利要求8所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述建模的过程包括:
10.根据权利要求9所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述向申请人和审查员通知申请行为结果的方式包括:
...【技术特征摘要】
1.一种基于机器学习的签证自动化管理系统,其特征在于,包括:数据输入模块,用于接收签证申请人的个人信息和签证申请材料;
2.根据权利要求1所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述个人信息包括身份信息、教育背景和职业经历;所述签证申请材料包括申请人材料和系统匹配材料;
3.根据权利要求2所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述社会信用评分的获取方式包括:
4.根据权利要求3所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述将训练数据集进行筛选的方式包括:
5.根据权利要求4所述的一种基于机器学习的签证自动化管理系统,其特征在于,所述损失函数包括监督损失部分和信用反馈损失部分;所述激活函数选择sigmoi...
【专利技术属性】
技术研发人员:陆曦,刘全,李云晖,杨楚滢,洪焕辉,廖鹏,游伟建,廖建兰,
申请(专利权)人:深圳市高斯全球信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。