System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于数据处理,涉及一种调整变量解耦的干预效应估计方法及系统。
技术介绍
1、因果推理是指通过干预行为来推断潜在结果的变化,是决策和可解释人工智能相关联的基础研究领域。在潜在结果的框架下,因果推理的目标是在给定一组协变量的情况下估计干预(二元)行为t对结果y的平均效应,如图1(c)所示。例如,研究人员尝试根据某些患者的特征,从人群数据中评估药物(t)对患者康复(y)的平均行为效果(ate)。因果推理的一个基本问题是非随机处理对照组和行为组之间的分配,其中行为分配有一些显式/隐式分配策略,表现为与一些称为混杂因素的预测协变量的相关性(图1(c)中的x)。因此,t对y的直接回归将引入系统偏差,而不考虑不同组之间的不同行为分配。为了克服这个问题,随机对照试验(rct)提供了黄金标准,而伦理问题或昂贵的实际成本成为在现实案例中进行rct的障碍。需要注意的是,观察性研究提供了从非随机数据推断行为效果的实用替代方案。
2、尽管观测研究取得了显著的进步,但实际应用仍出现一个重要但很容易被忽视的问题,即收集到的协变量通常会包含除了混杂变量x外的外生变量,极大地影响了干预效应估计(如图1(b)和1(c)所示)的准确性。
技术实现思路
1、针对上述传统方法中存在的问题,本专利技术提出了一种调整变量解耦的干预效应估计方法、一种调整变量解耦的干预效应估计系统、一种计算机设备和一种计算机可读存储介质,能够大幅提高干预效应估计的准确度。
2、为了实现上述目的,本专利技术实施例采
3、一方面,提供一种调整变量解耦的干预效应估计方法,包括步骤:
4、获取当前干预场景下的数据集;数据集包括干预行为、干预结果和收集到的协变量;
5、调用构建的干预效应的经验估计模型;
6、从数据集中采样获得当前批样本后,输入干预效应的经验估计模型并通过强化学习搜索对应于最优调整变量的二进制变量掩码;
7、采样方差缩减的策略梯度方法更新干预效应的经验估计模型的网络参数;
8、从数据集中采样获得下一批样本后进入下一轮组合优化的迭代计算,直至输出最终二进制变量掩码所对应的最优调整变量;
9、根据最优调整变量输出当前干预场景下的最优干预效应估计结果。
10、另一方面,还提供一种调整变量解耦的干预效应估计系统,包括:
11、数据获取模块,用于获取当前干预场景下的数据集;数据集包括干预行为、干预结果和收集到的协变量;
12、模型调用模块,用于调用构建的干预效应的经验估计模型;
13、学习搜索模块,用于从数据集中采样获得当前批样本后,输入干预效应的经验估计模型并通过强化学习搜索对应于最优调整变量的二进制变量掩码;
14、网络更新模块,用于采样方差缩减的策略梯度方法更新干预效应的经验估计模型的网络参数;
15、迭代跳转模块,用于从数据集中采样获得下一批样本后进入下一轮组合优化的迭代计算,直至输出最终二进制变量掩码所对应的最优调整变量;
16、结果输出模块,用于根据最优调整变量输出当前干预场景下的最优干预效应估计结果。
17、又一方面,还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的调整变量解耦的干预效应估计方法的步骤。
18、再一方面,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的调整变量解耦的干预效应估计方法的步骤。
19、上述技术方案中的一个技术方案具有如下优点和有益效果:
20、上述调整变量解耦的干预效应估计方法及系统,通过提出了一个可计算处理的指标oaf,在非参数化理论保证下衡量所选取的调整变量对干预效应估计的最优性。进而,本文设计了一个基于强化学习的组合优化框架,以最优化oaf指标,生成对应的变量掩码,搜索选取到最优的调整变量,实现更准确的干预效应评估。
本文档来自技高网...【技术保护点】
1.一种调整变量解耦的干预效应估计方法,其特征在于,包括步骤:
2.根据权利要求1所述的调整变量解耦的干预效应估计方法,其特征在于,在每一轮组合优化的迭代计算中,采用非参数化方法计算所述干预效应的经验估计模型的求解过程中的期望奖励并通过熵正则化激励搜索过程的行为搜索。
3.根据权利要求1或2所述的调整变量解耦的干预效应估计方法,其特征在于,在每一轮组合优化的迭代计算中,采用多进程并行训练代表干预效应估计的倾向分数的非线性估计器和代表干预效应估计的条件输出的非线性估计器。
4.一种调整变量解耦的干预效应估计系统,其特征在于,包括:
5.根据权利要求4所述的调整变量解耦的干预效应估计系统,其特征在于,在每一轮组合优化的迭代计算中,采用非参数化方法计算所述干预效应的经验估计模型的求解过程中的期望奖励并通过熵正则化激励搜索过程的行为搜索。
6.根据权利要求4或5所述的调整变量解耦的干预效应估计系统,其特征在于,在每一轮组合优化的迭代计算中,采用多进程并行训练代表干预效应估计的倾向分数的非线性估计器和代表干预效应估计的条件输出的非
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3任一项所述的调整变量解耦的干预效应估计方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3任一项所述的调整变量解耦的干预效应估计方法的步骤。
...【技术特征摘要】
1.一种调整变量解耦的干预效应估计方法,其特征在于,包括步骤:
2.根据权利要求1所述的调整变量解耦的干预效应估计方法,其特征在于,在每一轮组合优化的迭代计算中,采用非参数化方法计算所述干预效应的经验估计模型的求解过程中的期望奖励并通过熵正则化激励搜索过程的行为搜索。
3.根据权利要求1或2所述的调整变量解耦的干预效应估计方法,其特征在于,在每一轮组合优化的迭代计算中,采用多进程并行训练代表干预效应估计的倾向分数的非线性估计器和代表干预效应估计的条件输出的非线性估计器。
4.一种调整变量解耦的干预效应估计系统,其特征在于,包括:
5.根据权利要求4所述的调整变量解耦的干预效应估计系统,其特征在于,在每一轮组合优化的迭代计算中,采用...
【专利技术属性】
技术研发人员:徐利洋,陈幻,郭烨婷,靳若春,王浩天,杨凇源,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。