本公开的实施例涉及一种数据处理方法和电子设备,涉及计算机领域,该方法包括:获取待处理数据,待处理数据指示以下至少一项:第一状态信息、第一动作、以及在满足第一状态信息时执行第一动作后的第二状态信息;利用经训练的数据生成模型,基于待处理数据确定结果数据,结果数据指示在满足第一状态信息时第二动作后的第三状态信息,数据生成模型基于训练集以及与训练集中至少一个数据项对应的因果模型得到;以及输出结果数据。以此方式,本公开的实施例能够基于经训练的数据生成模型输出与待处理数据对应的结果数据,从而能够实现数据的扩充,便于基于数据集的进一步处理。便于基于数据集的进一步处理。便于基于数据集的进一步处理。
【技术实现步骤摘要】
数据处理方法和电子设备
[0001]本公开的实施例主要涉及计算机领域,并且更具体地,涉及数据处理方法、模型训练方法、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]随着技术的发展,人工智能(Artificial Intelligence,AI)已经被应用给到各行各业。在各种领域中的AI的应用都依赖于机器学习、神经网络等算法,而这些AI算法通常基于大量的数据被训练得到的。
[0003]绝大多数算法都是假设数据平衡、环境平衡等条件下设计。一般而言,数据是从各个领域的实际场景中采集得到,但是实际采集到的数据不够全面。例如在医疗领域,针对治愈的数据明显多于未治愈的数据。例如在客户满意度领域,针对满意的数据明显多于不满意的数据。相应地,目前的绝大多数算法是在不够全面的数据的基础上所得到的,这样导致算法的预测性能下降等问题。
[0004]在有限的实际数据条件下,如何获取更多有效的、合理的数据是当前要解决的问题之一。
技术实现思路
[0005]根据本公开的示例实施例,提供了一种数据处理的方案,能够得到反事实数据以用于后续处理。
[0006]在本公开的第一方面,提供了一种数据处理方法,包括:获取待处理数据,该待处理数据指示以下至少一项:第一状态信息、第一动作、以及在满足第一状态信息时执行第一动作后的第二状态信息;利用经训练的数据生成模型,基于待处理数据确定结果数据,该结果数据指示在满足第一状态信息时执行第二动作后的第三状态信息,该数据生成模型是基于训练集以及与训练集中至少一个数据项对应的因果模型而得到的;以及输出该结果数据。
[0007]在本公开的第二方面,提供了一种数据处理方法,包括:获取待处理数据,该待处理数据指示以下至少一项:第一状态信息、第一动作、第一属性信息、具有第一属性信息的对象在第一状态信息时执行第一动作后的第二状态信息;将第一状态信息、第一动作、第二状态信息中的至少一项输入到经训练的数据生成模型的第一子模型,以得到与待处理数据对应的影响参数,影响参数包括第二属性信息和噪声参数;将第一状态信息、第一动作和影响参数输入到经训练的数据生成模型的第二子模型,以得到结果数据,该结果数据指示具有第二属性信息的对象在第一状态信息时执行第一动作后的第三状态信息;以及输出结果数据。
[0008]在本公开的第三方面,提供了一种模型训练方法,包括:构建训练集,训练集包括多个数据项,多个数据项中的每个数据项包括:第一状态信息、动作、以及在第一状态信息时执行动作后的第二状态信息;获取与训练集中至少一个数据项对应的因果模型;以及至
少基于训练集和因果模型,生成经训练的数据生成模型。
[0009]在本公开的第四方面,提供了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,该指令当由至少一个处理单元执行时使得电子设备执行动作,动作包括:获取待处理数据,该待处理数据指示以下至少一项:第一状态信息、第一动作、以及在满足第一状态信息时执行第一动作后的第二状态信息;利用经训练的数据生成模型,基于待处理数据确定结果数据,该结果数据指示在满足第一状态信息时执行第二动作后的第三状态信息,该数据生成模型是基于训练集以及与训练集中至少一个数据项对应的因果模型而得到的;以及输出该结果数据。
[0010]在本公开的第五方面,提供了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,该指令当由至少一个处理单元执行时使得电子设备执行动作,动作包括:获取待处理数据,该待处理数据指示以下至少一项:第一状态信息、第一动作、第一属性信息、具有第一属性信息的对象在第一状态信息时执行第一动作后的第二状态信息;将第一状态信息、第一动作、第二状态信息中的至少一项输入到经训练的数据生成模型的第一子模型,以得到与待处理数据对应的影响参数,影响参数包括第二属性信息和噪声参数;将第一状态信息、第一动作和影响参数输入到经训练的数据生成模型的第二子模型,以得到结果数据,该结果数据指示具有第二属性信息的对象在第一状态信息时执行第一动作后的第三状态信息;以及输出结果数据。
[0011]在本公开的第六方面,提供了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,该指令当由至少一个处理单元执行时使得电子设备执行动作,动作包括:构建训练集,训练集包括多个数据项,多个数据项中的每个数据项包括:第一状态信息、动作、以及在第一状态信息时执行动作后的第二状态信息;获取与训练集中至少一个数据项对应的因果模型;以及至少基于训练集和因果模型,生成经训练的数据生成模型。
[0012]本公开的第七方面,提供了一种电子设备,包括:存储器和处理器;其中存储器用于存储一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据本公开的第一方面或第二方面或第三方面所描述的方法。
[0013]本公开的第八方面,提供了一种计算机可读存储介质,该计算机可读存储介质具有在其上存储的机器可执行指令,该机器可执行指令在由设备执行时使该设备执行根据本公开的第一方面或第二方面或第三方面所描述的方法。
[0014]本公开的第九方面,提供了一种计算机程序产品,包括计算机可执行指令,其中计算机可执行指令在被处理器执行时实现根据本公开的第一方面或第二方面或第三方面所描述的方法。
[0015]本公开的第十方面,提供了一种电子设备,包括:处理电路装置,被配置为执行根据本公开的第一方面或第二方面或第三方面所描述的方法。
[0016]提供
技术实现思路
部分是为了以简化的形式来介绍一系列概念,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分不旨在标识本公开的关键特征或必要特征,也不旨在限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
[0017]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
[0018]图1示出了根据本公开的实施例的示例环境的框图;
[0019]图2示出了根据本公开的实施例的数据项的表示含义的示意图;
[0020]图3示出了根据本公开的实施例的示例训练过程的流程图;
[0021]图4示出了根据本公开的实施例的DAG的示意图;
[0022]图5示出了根据本公开的实施例的示例使用过程的流程图;
[0023]图6示出了根据本公开的实施例的示例使用过程的流程图;
[0024]图7示出了根据本公开的实施例的示例使用过程的流程图;
[0025]图8示出了根据本公开的实施例的示意流程;
[0026]图9示出了根据本公开的实施例的确定目标决策的示例过程的流程图;以及
[0027]图1本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:获取待处理数据,所述待处理数据指示以下至少一项:第一状态信息、第一动作、以及在满足所述第一状态信息时执行所述第一动作后的第二状态信息;利用经训练的数据生成模型,基于所述待处理数据确定结果数据,所述结果数据指示在满足所述第一状态信息时执行第二动作后的第三状态信息,所述数据生成模型是基于训练集以及与所述训练集中至少一个数据项对应的因果模型而得到的;以及输出所述结果数据。2.根据权利要求1所述的方法,其中所述数据生成模型包括第一子模型和第二子模型,所述确定结果数据包括:将所述第一状态信息、所述第一动作、所述第二状态信息中的至少一项输入到所述第一子模型,以得到与所述待处理数据对应的影响参数;以及将所述第一状态信息、所述第二动作和所述影响参数输入到所述第二子模型,以得到所述第三状态信息。3.根据权利要求2所述的方法,其中所述影响参数包括以下至少一项:所述第一状态信息所表示的对象的属性信息、或噪声参数。4.根据权利要求2或3所述的方法,其中所述数据生成模型还包括第三子模型,所述方法还包括:将所述第一状态信息、所述第二动作和所述第三状态信息输入到所述第三子模型,以确定所述结果数据的可用性。5.根据权利要求1至4中任一项所述的方法,还包括:获取来自用户的输入信息,所述输入信息包括输入状态信息;利用经训练的决策模型,基于所述输入信息确定至少一个目标决策,所述经训练的决策模型是至少基于所述结果数据而被生成的;以及输出所述至少一个目标决策。6.根据权利要求1至5中任一项所述的方法,还包括:构建所述训练集,所述训练集包括多个数据项,所述多个数据项中的每个数据项包括以下至少一项:第一状态信息、动作、以及在所述第一状态信息时执行所述动作后的第二状态信息;获取所述因果模型;以及至少基于所述训练集和所述因果模型,生成所述经训练的数据生成模型。7.根据权利要求6所述的方法,其中所述多个数据项中的每个数据项还包括所述第一状态信息所表示的对象的属性信息。8.根据权利要求7所述的方法,其中所述数据生成模型包括第一子模型、第二子模型和第三子模型,并且其中所述第一子模型的输入包括所述第一状态信息、所述动作和所述第二状态信息,所述第二子模型的输入包括所述第一状态信息、所述动作和所述属性信息,所述第三子模型用于确定所述第二子模型的输出与所述第二状态信息之间的差异。9.根据权利要求8所述的方法,其中所述第二子模型的输入还包括影响参数,所述影响参数包括以下至少一项:所述第一状态信息所表示的对象的属性信息、或噪声参数。10.根据权利要求6至9中任一项所述的方法,其中获取所述因果模型包括:
基于所述多个数据项中的至少一个数据项,生成所述因果模型,所述因果模型指示所述至少一个数据项中的多个因素之间的因果关系。11.根据权利要求6至10中任一项所述的方法,其中生成所述经训练的数据生成模型,包括:基于所述因果模型,构建所述数据生...
【专利技术属性】
技术研发人员:王尔立,冯璐,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。