信息处理装置、信息处理方法以及计算机程序制造方法及图纸

技术编号:35287649 阅读:16 留言:0更新日期:2022-10-22 12:32
提供一种信息处理装置、信息处理方法以及计算机程序。本实施方式涉及的信息处理装置具备:分组部,其对包含多个第1变量和第2变量的第1数据中的所述多个第1变量进行分组,生成包含所述第1变量的多个组;和决定部,其基于所述第1数据,决定对所述多个组所包含的所述第1变量和所述第2变量的预测值进行关联的预测模型的模型架构。的模型架构。的模型架构。

【技术实现步骤摘要】
信息处理装置、信息处理方法以及计算机程序
[0001]本申请以日本特许申请2021

070913(申请日:04/20/2021)为基础,根据该申请享受优先利益。本申请通过参照该申请而包含该申请的全部内容。


[0002]本实施方式涉及信息处理装置、信息处理方法以及计算机程序。

技术介绍

[0003]在气象预测、异常气象预测、防灾、可再生能量、水力发电、股价、风险分析等领域中,广泛进行了使用当前和过去的时间序列数据来预测目标变量的一定时间后的值(将来值)。已知以使得在时间序列数据的全部区间中预测值与实绩值的误差最小化的方式构建模型的方法,但在通过该方法构建的模型中,具有在峰值、即极值处预测误差变得非常大的问题。另外,具有如下倾向:当预测期间变长时,预测误差会在峰值处变得更大。
[0004]在水库的水位预测、风速预测、异常气象预测等中,为了防灾而高精度地预测峰值是非常重要的。虽然能够生成能使用基于深度学习的方法来高精度地预测峰值的模型,但为了对庞大数量的模型参数进行学习,需要收集大量的采样。当所收集的采样数少时,模型的预测精度会变低,难以高精度地预测峰值(极值)。另外,具有如下倾向:当预测期间变长时,预测误差会变大。

技术实现思路

[0005]本专利技术的实施方式提供能够高精度地预测成为预测对象的变量的值的信息处理装置、信息处理方法以及计算机程序。
[0006]用于解决问题的技术方案
[0007]本实施方式涉及的信息处理装置具备:分组部,其对包含多个第1变量和第2变量的第1数据中的所述多个第1变量进行分组,生成包含所述第1变量的多个组;和决定部,其基于所述第1数据,决定对所述多个组所包含的所述第1变量和所述第2变量的预测值进行关联的预测模型的模型架构。
附图说明
[0008]图1是实施方式涉及的预测装置的框图。
[0009]图2是表示峰值的预测精度低的例子和能够高精度地预测峰值的例子的图。
[0010]图3是表示目标变量和说明变量的时间序列数据的例子的图。
[0011]图4是表示使用了说明变量与目标变量之间的相互相关的模型输入数据的制作例的图。
[0012]图5是相互相关的说明图。
[0013]图6是表示使用了变量选择方法的模型输入数据的制作例的图。
[0014]图7是表示使用了变量选择方法的模型输入数据的制作例的图。
[0015]图8是表示预测模型的一个例子的图。
[0016]图9是表示使用了比较例涉及的深度学习的预测模型的模型架构的例子的图。
[0017]图10是表示使用了本实施方式涉及的深度学习的预测模型的模型架构的例子的图。
[0018]图11是表示与模型架构相应的输入输出节点数的例子的图。
[0019]图12是表示与模型架构相应的各层的参数数量的计算例的图。
[0020]图13是表示比较例涉及的深度学习的模型参数数量和本实施方式涉及的深度学习的模型参数数量的比较例的图。
[0021]图14是表示层数、数据分组、参数(n)、模型参数数量、预测精度的关系的图。
[0022]图15是表示时间序列数据的一个例子的图。
[0023]图16是表示决定模型架构的第1例的图。
[0024]图17是表示决定模型架构的第2例的图。
[0025]图18是用于生成预测模型、预测目标变量的将来值的流程图。
[0026]图19是用于决定模型输入数据的数据分组和模型架构的流程图。
[0027]图20是表示用于决定数据分组和模型架构的GUI的图。
[0028]图21是表示生成新的变量的例子的图。
[0029]图22是表示使用遗传编程来制作新的变量的例子的图。
[0030]图23是实施方式涉及的信息处理系统的框图。
[0031]标号说明
[0032]1ꢀꢀꢀ
时间序列数据DB
[0033]2ꢀꢀꢀ
模型输入数据制作部(数据制作部)
[0034]3ꢀꢀꢀ
数据分组部(分组部)
[0035]4ꢀꢀꢀ
模型架构决定部(决定部)
[0036]5ꢀꢀꢀ
超参数部
[0037]6ꢀꢀꢀ
模型生成部
[0038]7ꢀꢀꢀ
模型数据DB
[0039]8ꢀꢀꢀ
评价部
[0040]9ꢀꢀꢀ
预测部
[0041]101 信息处理装置(预测装置)
[0042]102 计划装置(计划部)
[0043]801 文件名
[0044]802 采样数
[0045]803 说明变量和目标变量的个数
[0046]804 预测步长数
[0047]805 变量表
[0048]806 时滞(lag)字段
[0049]807 模型输入数据制作方法
[0050]808 数据分组
[0051]809 文本框
[0052]810 分割方法
[0053]811 层数
[0054]812 模型架构
[0055]813 模型参数数量
[0056]814 评价得分表
[0057]815 模型输出文件
具体实施方式
[0058]以下,参照附图对本专利技术的实施方式进行说明。另外,在附图中,对相同的构成要素赋予相同的编号,适当地省略说明。
[0059]图1是作为本实施方式涉及的信息处理装置的预测装置101的框图。
[0060]图1的预测装置101具备时间序列数据DB(数据库)1、模型输入数据制作部2(数据制作部)、数据分组部3(分组部)、模型架构决定部4(决定部)、超参数部5、模型生成部6、模型数据DB7、评价部8、预测部9、预测值DB10。
[0061]图1的预测装置101是用于基于包含说明变量和目标变量的时间序列数据来高精度地预测目标变量将来的值的装置。例如,进行水库的水位预测(与水力发电站的蓄水量有关的预测)、风速预测、异常气象预测、风险分析预测、股价预测等。作为本实施方式的技术背景,存在目标变量的预测、特别是峰值(极值)的预测困难这一问题。本实施方式使得能够高精度地进行目标变量的峰值的预测。
[0062]图2的左图表示难以预测峰值的例子。本例表示使用了比较例涉及的深度学习的预测结果。根据本事例,最高的峰的预测值与实绩值之差PD1、第二高的峰的预测值与实绩值之差PD2都大,预测的精度低。
[0063]图2的右图表示能够高精度地预测峰值的例子。在全部峰中,预测值与实绩值的差分小,能得到高的预测精度。该预测结果是通过后述的本实施方式涉及的深度学习得到的,在本实施方式中能够进行峰值的高精度的预测。
[0064]时间序列数据DB1保持目标变量的过去和当前的时间序列数据。另外,时间序列数据DB1保持说明变量的过去、当前、将来的时间序列数据。说明变量的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理装置,具备:分组部,其对包含多个第1变量和第2变量的第1数据中的所述多个第1变量进行分组,生成包含所述第1变量的多个组;和决定部,其基于所述第1数据,决定对所述多个组所包含的所述第1变量和所述第2变量的预测值进行关联的预测模型的模型架构。2.根据权利要求1所述的信息处理装置,具备评价部,所述评价部基于所述第2变量的预测值与所述第1数据中的所述第2变量的值的差分,算出所述预测模型的评价值,所述分组部基于所述评价值,进行所述多个第1变量的分组。3.根据权利要求2所述的信息处理装置,所述分组部生成对所述多个第1变量进行分组的多个分组候选,所述分组部根据基于所述评价值从所述多个分组候选中选择出的分组候选,对所述多个第1变量进行分组。4.根据权利要求2或者3所述的信息处理装置,所述决定部基于所述评价值,决定所述模型架构。5.根据权利要求1~4中任一项所述的信息处理装置,具备模型生成部,所述模型生成部基于由所述决定部决定的所述模型架构,生成所述预测模型。6.根据权利要求1~5中任一项所述的信息处理装置,所述预测模型是包括将所述多个组的所述第1变量作为输入的多个子模型、并基于所述多个子模型的输出值来预测所述第2变量的模型。7.根据权利要求1~6中任一项所述的信息处理装置,所述多个第1变量与多个时刻关联,所述分组部按与所述时刻相应的顺序对所述多个第1变量进行分组。8.根据权利要求1~7中任一项所述的信息处理装置,所述多个第1变量包括第1时刻的变量、所述第1时刻之前的第2时刻的变量以及所述第1时刻之后的第3时刻的变量,所述分组部将所述第1时刻的变量分类到第1组,将所述第2时刻的变量分类到第2组,将所述第3时刻的变量分类到第3组。9.根据权利要求8所述的信息处理装置,所述第1时刻与进行基于所述预测模型的预测的时间点的时刻对应。10.根据权利要求1~6中任一项所述的信息处理装置,所述分组部随机地对所述多个第1变量进行分组。11.根据权利要求1~9中任一项所述的信息处理装置,所述预测模型是包括输入层、至少一个中间层以及输出层的神经网络,所述决定部决定所述至少一个中间层中的节点数来作为所述模型架构。12.根据权利要求1~11中任一项所述的信息处理装置,所述决定部决定所述至少一个层的层数来作为所述模型架构。13.根据权利要求1~12中任一项所述的信息处理装置,
所述决定部决定所述预测模型的模型参数数量为所述第1数据的采样数以下的模型架构。14.根据权利要求1~13中任一项所述的信息处理装置,具备数据制作部,所述数据制作部在一个以上的说明变量的时间序列数据和目标变量的时间序列数据中算出所述说明变量与所述...

【专利技术属性】
技术研发人员:峰瑠斗本S
申请(专利权)人:东芝能源系统株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1