数据处理方法和电子设备技术

技术编号：38199557 阅读：16 留言：0更新日期：2023-07-21 16:40

本公开的实施例涉及一种数据处理方法和电子设备，涉及计算机领域，该方法包括：获取待处理数据，待处理数据指示以下至少一项：第一状态信息、第一动作、以及在满足第一状态信息时执行第一动作后的第二状态信息；利用经训练的数据生成模型，基于待处理数据确定结果数据，结果数据指示在满足第一状态信息时第二动作后的第三状态信息，数据生成模型基于训练集以及与训练集中至少一个数据项对应的因果模型得到；以及输出结果数据。以此方式，本公开的实施例能够基于经训练的数据生成模型输出与待处理数据对应的结果数据，从而能够实现数据的扩充，便于基于数据集的进一步处理。便于基于数据集的进一步处理。便于基于数据集的进一步处理。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法和电子设备

[0001]本公开的实施例主要涉及计算机领域，并且更具体地，涉及数据处理方法、模型训练方法、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]随着技术的发展，人工智能(Artificial Intelligence，AI)已经被应用给到各行各业。在各种领域中的AI的应用都依赖于机器学习、神经网络等算法，而这些AI算法通常基于大量的数据被训练得到的。
[0003]绝大多数算法都是假设数据平衡、环境平衡等条件下设计。一般而言，数据是从各个领域的实际场景中采集得到，但是实际采集到的数据不够全面。例如在医疗领域，针对治愈的数据明显多于未治愈的数据。例如在客户满意度领域，针对满意的数据明显多于不满意的数据。相应地，目前的绝大多数算法是在不够全面的数据的基础上所得到的，这样导致算法的预测性能下降等问题。
[0004]在有限的实际数据条件下，如何获取更多有效的、合理的数据是当前要解决的问题之一。

技术实现思路

[0005]根据本公开的示例实施例，提供了一种数据处理的方案，能够得到反事实数据以用于后续处理。
[0006]在本公开的第一方面，提供了一种数据处理方法，包括：获取待处理数据，该待处理数据指示以下至少一项：第一状态信息、第一动作、以及在满足第一状态信息时执行第一动作后的第二状态信息；利用经训练的数据生成模型，基于待处理数据确定结果数据，该结果数据指示在满足第一状态信息时执行第二动作后的第三状态信息，该数据生成模型是基于训练集以及与训练集中至少...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，包括：获取待处理数据，所述待处理数据指示以下至少一项：第一状态信息、第一动作、以及在满足所述第一状态信息时执行所述第一动作后的第二状态信息；利用经训练的数据生成模型，基于所述待处理数据确定结果数据，所述结果数据指示在满足所述第一状态信息时执行第二动作后的第三状态信息，所述数据生成模型是基于训练集以及与所述训练集中至少一个数据项对应的因果模型而得到的；以及输出所述结果数据。2.根据权利要求1所述的方法，其中所述数据生成模型包括第一子模型和第二子模型，所述确定结果数据包括：将所述第一状态信息、所述第一动作、所述第二状态信息中的至少一项输入到所述第一子模型，以得到与所述待处理数据对应的影响参数；以及将所述第一状态信息、所述第二动作和所述影响参数输入到所述第二子模型，以得到所述第三状态信息。3.根据权利要求2所述的方法，其中所述影响参数包括以下至少一项：所述第一状态信息所表示的对象的属性信息、或噪声参数。4.根据权利要求2或3所述的方法，其中所述数据生成模型还包括第三子模型，所述方法还包括：将所述第一状态信息、所述第二动作和所述第三状态信息输入到所述第三子模型，以确定所述结果数据的可用性。5.根据权利要求1至4中任一项所述的方法，还包括：获取来自用户的输入信息，所述输入信息包括输入状态信息；利用经训练的决策模型，基于所述输入信息确定至少一个目标决策，所述经训练的决策模型是至少基于所述结果数据而被生成的；以及输出所述至少一个目标决策。6.根据权利要求1至5中任一项所述的方法，还包括：构建所述训练集，所述训练集包括多个数据项，所述多个数据项中的每个数据项包括以下至少一项：第一状态信息、动作、以及在所述第一状态信息时执行所述动作后的第二状态信息；获取所述因果模型；以及至少基于所述训练集和所述因果模型，生成所述经训练的数据生成模型。7.根据权利要求6所述的方法，其中所述多个数据项中的每个数据项还包括所述第一状态信息所表示的对象的属性信息。8.根据权利要求7所述的方法，其中所述数据生成模型包括第一子模型、第二子模型和第三子模型，并且其中所述第一子模型的输入包括所述第一状态信息、所述动作和所述第二状态信息，所述第二子模型的输入包括所述第一状态信息、所述动作和所述属性信息，所述第三子模型用于确定所述第二子模型的输出与所述第二状态信息之间的差异。9.根据权利要求8所述的方法，其中所述第二子模型的输入还包括影响参数，所述影响参数包括以下至少一项：所述第一状态信息所表示的对象的属性信息、或噪声参数。10.根据权利要求6至9中任一项所述的方法，其中获取所述因果模型包括：
基于所述多个数据项中的至少一个数据项，生成所述因果模型，所述因果模型指示所述至少一个数据项中的多个因素之间的因果关系。11.根据权利要求6至10中任一项所述的方法，其中生成所述经训练的数据生成模型，包括：基于所述因果模型，构建所述数据生...

【专利技术属性】
技术研发人员：王尔立，冯璐，
申请(专利权)人：日本电气株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人