System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,尤其涉及神经网络、大模型等,可应用于大规模城市数据分析、交通流量预测、气象预报、环境监测等涉及时空数据的场景。
技术介绍
1、多变量时间序列(multivariate time series,mts)广泛应用于医学、金融、多媒体、交通、环境科学、生物科学等多个领域。传统方法多采用统计手段,如k近邻、期望最大化算法和矩阵分解等。随着深度学习的崛起,循环神经网络和生成对抗网络等技术开始应用于缺失值填充任务。
技术实现思路
1、本公开提供了一种时空模型的预训练方法、装置、设备以及存储介质。
2、根据本公开的一方面,提供了一种时空模型的预训练方法,包括:
3、通过待训练的时空模型的空间特征提取网络基于时空图中的第一时空信息,提取空间特征;
4、通过该待训练的时空模型的时间特征提取网络基于该第一时空信息,提取时序信号特征;
5、通过该待训练的时空模型的时空融合转换网络基于该空间特征和该时序信号特征,得到空间引导时间特征;
6、基于该空间引导时间特征对应的第二时空信息和该第一时空信息,对该待训练的时空模型进行预训练,得到预训练的时空模型。
7、根据本公开的另一方面,提供了一种时空模型的预训练装置,包括:
8、第一提取模块,用于通过待训练的时空模型的空间特征提取网络基于时空图中的第一时空信息,提取空间特征;
9、第二提取模块,用于通过该待训练的时空模型的时间特征提取网络基于该第一时
10、融合模块,用于通过该待训练的时空模型的时空融合转换网络基于该空间特征和该时序信号特征,得到空间引导时间特征;
11、预训练模块,用于基于该空间引导时间特征对应的第二时空信息和该第一时空信息,对该待训练的时空模型进行预训练,得到预训练的时空模型。
12、根据本公开的另一方面,提供了一种电子设备,包括:
13、至少一个处理器;以及
14、与该至少一个处理器通信连接的存储器;其中,
15、该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。
16、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。
17、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。
18、根据本公开,通过待训练的时空模型的包括空间特征提取网络、时间特征提取网络和时空融合转换网络,可以将时空图中的空间特征与时序信号特征融合,利用空间合理地引导时间,使得预训练的时空模型可以达到更优的预测精度。
19、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种时空模型的预训练方法,包括:
2.根据权利要求1所述的方法,其中,所述空间特征卷积网络包括空间图卷积编码器,通过待训练的时空模型的空间特征提取网络基于时空图中的第一时空信息,提取空间特征,包括:
3.根据权利要求2所述的方法,其中,将所述第一时空信息中多个节点的第一时序信号和空间关系,输入所述空间图卷积编码器,得到所述多个节点中一个或多个第一节点的空间特征,包括:
4.根据权利要求3所述的方法,其中,所述中间变量更新方式基于所述第一节点与其相关的各个第二节点之间的空间距离信息、所述各个第二节点在所述当前层的特征、以及可学习参数确定。
5.根据权利要求1至4中任一项所述的方法,其中,所述空间特征卷积网络包括时间信号卷积编码器,通过所述待训练的时空模型的时间特征提取网络基于所述第一时空信息,提取时序信号特征,包括:
6.根据权利要求5所述的方法,其中,将所述第一时空信息中第一节点的第二时序信号,输入所述时间信号卷积编码器,得到所述第一节点的时序信号特征,包括:
7.根据权利要求6所述的方法,其中,将所述第
8.根据权利要求1至7中任一项所述的方法,其中所述时空融合转换网络包括时空融合转换器,通过所述时空模型的时空融合转换网络基于所述空间特征和所述时序信号特征,得到空间引导时间特征,包括:
9.根据权利要求8所述的方法,其中,基于所述空间引导时间特征对应的第二时空信息和所述第一时空信息,对所述待训练的时空模型进行预训练,得到预训练的时空模型,包括:
10.根据权利要求9所述的方法,其中,输入所述空间特征提取网络的所述第一时空信息中的时序信号和/或空间关系是部分掩码的或全部掩码,所述第二时空信息是所述待训练的时空模型基于掩码的第一时空信息预测得到的;基于所述第二时空信息和所述第一时空信息得到损失函数值,包括:
11.根据权利要求10所述的方法,其中,基于所述损失函数值,对所述待训练的时空模型进行预训练,得到所述预训练的时空模型,包括:
12.根据权利要求1至11中任一项所述的方法,其中,所述时空图中的第一时空信息包括所述时空图的多个区域的时空数据,第一节点为所述多个区域中任意的节点;所述多个区域的时空数据用于对所述时空模型进行预训练。
13.根据权利要求12所述的方法,其中,所述时空图中的第一时空信息还包括所述时空图的单个区域的时空数据,所述第一节点为所述单个区域中任意的节点;所述单个区域的时空数据用于对所述预训练的时空模型进行微调。
14.一种时空模型的预训练装置,包括:
15.根据权利要求14所述的装置,其中,所述空间特征卷积网络包括空间图卷积编码器,所述第一提取模块用于将所述第一时空信息中多个节点的第一时序信号和空间关系,输入所述空间图卷积编码器,得到所述多个节点中一个或多个第一节点的空间特征。
16.根据权利要求15所述的装置,其中,所述第一提取模块包括:
17.根据权利要求16所述的装置,其中,所述中间变量更新方式基于所述第一节点与其相关的各个第二节点之间的空间距离信息、所述各个第二节点在所述当前层的特征、以及可学习参数确定。
18.根据权利要求14至17中任一项所述的装置,其中,所述空间特征卷积网络包括时间信号卷积编码器,所述第二提取模块用于将所述第一时空信息中一个或多个第一节点的第二时序信号,输入所述时间信号卷积编码器,得到所述一个或多个第一节点的时序信号特征。
19.根据权利要求18所述的装置,其中,所述第二提取模块包括:
20.根据权利要求19所述的装置,其中,所述第二提取模块还包括:
21.根据权利要求14至20中任一项所述的装置,其中,所述时空融合转换网络包括时空融合转换器,所述融合模块,包括:
22.根据权利要求21所述的装置,其中,所述预训练模块,包括:
23.根据权利要求22所述的装置,其中,输入所述空间特征提取网络的所述第一时空信息中的时序信号和/或空间关系是部分掩码的或全部掩码,所述第二时空信息是所述待训练的时空模型基于掩码的第一时空信息预测得到的;所述损失计算子模块还用于基于所述第二时空信息、未掩码的第一时空信息和掩码信息,得到第一损失函数值和第二损失函数值,所述第一损失函数值表示掩码采样有效值的重构损失,所述第二损失函数值表示未掩码采样有效值的重构损失;基于所述第一损失函数值和所述第二损失函数值,得到第三损失函数值。
...【技术特征摘要】
1.一种时空模型的预训练方法,包括:
2.根据权利要求1所述的方法,其中,所述空间特征卷积网络包括空间图卷积编码器,通过待训练的时空模型的空间特征提取网络基于时空图中的第一时空信息,提取空间特征,包括:
3.根据权利要求2所述的方法,其中,将所述第一时空信息中多个节点的第一时序信号和空间关系,输入所述空间图卷积编码器,得到所述多个节点中一个或多个第一节点的空间特征,包括:
4.根据权利要求3所述的方法,其中,所述中间变量更新方式基于所述第一节点与其相关的各个第二节点之间的空间距离信息、所述各个第二节点在所述当前层的特征、以及可学习参数确定。
5.根据权利要求1至4中任一项所述的方法,其中,所述空间特征卷积网络包括时间信号卷积编码器,通过所述待训练的时空模型的时间特征提取网络基于所述第一时空信息,提取时序信号特征,包括:
6.根据权利要求5所述的方法,其中,将所述第一时空信息中第一节点的第二时序信号,输入所述时间信号卷积编码器,得到所述第一节点的时序信号特征,包括:
7.根据权利要求6所述的方法,其中,将所述第一时空信息中第一节点的第二时序信号,输入所述时间信号卷积编码器,得到所述第一节点的时序信号特征,还包括:
8.根据权利要求1至7中任一项所述的方法,其中所述时空融合转换网络包括时空融合转换器,通过所述时空模型的时空融合转换网络基于所述空间特征和所述时序信号特征,得到空间引导时间特征,包括:
9.根据权利要求8所述的方法,其中,基于所述空间引导时间特征对应的第二时空信息和所述第一时空信息,对所述待训练的时空模型进行预训练,得到预训练的时空模型,包括:
10.根据权利要求9所述的方法,其中,输入所述空间特征提取网络的所述第一时空信息中的时序信号和/或空间关系是部分掩码的或全部掩码,所述第二时空信息是所述待训练的时空模型基于掩码的第一时空信息预测得到的;基于所述第二时空信息和所述第一时空信息得到损失函数值,包括:
11.根据权利要求10所述的方法,其中,基于所述损失函数值,对所述待训练的时空模型进行预训练,得到所述预训练的时空模型,包括:
12.根据权利要求1至11中任一项所述的方法,其中,所述时空图中的第一时空信息包括所述时空图的多个区域的时空数据,第一节点为所述多个区域中任意的节点;所述多个区域的时空数据用于对所述时空模型进行预训练。
13.根据权利要求12所述的方法,其中,所述时空图中的第一时空信息还包括所述时空图的单个区域的时空数据,所述第一节点为所述单个区域中任意的节点;所述单个区域的时空数据用于对所述预训练的时空模型进行微调。
14.一种时空模型的预训练装置,包括:
15.根据权利要求14所述的装置,其中,所述空间特征卷积网络包括空间图卷积编码器,所述第一提取模块用于将所述第一时空信息中多个节点的第一时序信号和空间关系,输入所述空间图卷积编码器,得到所述多个节点...
【专利技术属性】
技术研发人员:查睿,张乐,周景博,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。