System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,更具体地,涉及一种多源交通数据处理方法、装置和电子设备。
技术介绍
1、随着大语言模型的应用和推广,现如今的生成式大模型已经具备了通用知识能力,能够完成机器翻译、问答系统、情感分析、文本生成等一系列内容。
2、在交通领域中,在应用大预言模型时需要将时空数据转化为文本数据,这会丢失许多时空特征,从而导致交通领域下游应用的结果不准确。因此,如何基于预训练大语言模型的通用知识,实现文本与时空数据的多模态融合对提高交通领域下游任务表现是至关重要的。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种多源交通数据处理方法、装置和电子设备,以通过将交通路网的时空特征信息与语言模型获取的文本特征信息进行特征对齐,并将特征对齐后的组合特征应用至语言模型,实现了交通领域中的文本数据与时空数据的融合,使得目标语言模型能够理解交通路网中的时空特征,从而使得目标语言模型能够基于交通路网中的文本上下文信息和时空上下文信息处理交通路网数据,提高了处理交通路网应用的准确度和效率。
2、第一方面,本专利技术实施例提供一种多源交通数据处理方法,所述方法包括:
3、获取交通路网的时空数据和文本数据,所述时空数据包括所述交通路网中的交通实体的时空信息,所述文本数据包括所述交通实体对应的文本描述信息;
4、对所述时空数据进行时空特征提取,获取所述交通路网的时空特征信息;
5、将所述文本数据输入至预先训练的语言模型中进行处理,获取文本特征信
6、将所述时空特征信息和所述文本特征信息进行特征对齐,获取所述交通路网的组合特征;
7、将所述交通路网的组合特征应用至所述语言模型,获取目标语言模型。
8、第二方面,本专利技术实施例提供一种多源交通数据处理装置,所述装置包括:
9、数据获取单元,被配置为获取交通路网的时空数据和文本数据,所述时空数据包括所述交通路网中的交通实体的时空信息,所述文本数据包括所述交通实体对应的文本描述信息;
10、时空特征确定单元,被配置为对所述时空数据进行时空特征提取,获取所述交通路网的时空特征信息;
11、文本特征确定单元,被配置为将所述文本数据输入至预先训练的语言模型中进行处理,获取文本特征信息;
12、特征对齐单元,被配置为将所述时空特征信息和所述文本特征信息进行特征对齐,获取所述交通路网的组合特征;
13、模型确定单元,被配置为将所述交通路网的组合特征应用至所述语言模型,获取目标语言模型。
14、第三方面,本专利技术实施例提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如上所述的方法。
15、第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。
16、本专利技术实施例通过获取交通路网的时空数据和文本数据,对时空数据进行时空特征提取,获取交通路网的时空特征信息,并将文本数据输入至预先训练的语言模型中进行处理,获取文本特征信息,将时空特征信息和文本特征信息进行特征对齐,获取交通路网的组合特征,并将交通路网的组合特征应用至语言模型,获取目标语言模型。由此,本专利技术实施例通过将交通路网的时空特征信息与语言模型获取的文本特征信息进行特征对齐,并将特征对齐后的组合特征应用至语言模型,实现了交通领域中的文本数据与时空数据的融合,使得目标语言模型能够理解交通路网中的时空特征,从而使得目标语言模型能够基于交通路网中的文本上下文信息和时空上下文信息处理交通路网数据,提高了处理交通路网应用的准确度和效率。
本文档来自技高网...【技术保护点】
1.一种多源交通数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述时空数据进行时空特征提取,获得所述交通路网的时空特征信息包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述交通实体的属性信息确定所述交通实体的嵌入向量包括:
4.根据权利要求3所述的方法,其特征在于,所述属性信息的类别包括离散属性和连续属性;所述获取所述交通实体的属性信息中的各个属性的特征嵌入包括:
5.根据权利要求2-4中任一项所述的方法,其特征在于,所述交通实体包括路段实体,所述路段实体的属性信息包括静态属性信息和动态属性信息;
6.根据权利要求2-4中任一项所述的方法,其特征在于,所述交通实体包括兴趣点实体,所述兴趣点实体的属性信息包括以下一项或多项的组合:所述兴趣点实体的坐标信息、所属区域以及兴趣点类型。
7.根据权利要求2所述的方法,其特征在于,所述根据各所述交通实体的嵌入向量确定所述交通路网的时空特征信息包括:
8.根据权利要求7所述的方法,其特征在于,所述根据所述
9.根据权利要求7所述的方法,其特征在于,所述根据所述交通实体中的兴趣点实体的嵌入向量确定兴趣点图对应的兴趣点时空特征包括:
10.根据权利要求7所述的方法,其特征在于,所述根据所述路网时空特征和兴趣点时空特征之间的相互影响关系,确定所述交通路网的时空特征信息包括:
11.根据权利要求1所述的方法,其特征在于,所述语言模型基于预设的微调方法根据预先确定的文本语料库训练获得。
12.根据权利要求1所述的方法,其特征在于,所述将所述时空特征信息和所述文本特征信息进行特征对齐,获取所述交通路网的组合特征包括:
13.一种多源交通数据处理装置,其特征在于,所述装置包括:
14.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-12中任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-12中任一项所述的方法。
...【技术特征摘要】
1.一种多源交通数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述时空数据进行时空特征提取,获得所述交通路网的时空特征信息包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述交通实体的属性信息确定所述交通实体的嵌入向量包括:
4.根据权利要求3所述的方法,其特征在于,所述属性信息的类别包括离散属性和连续属性;所述获取所述交通实体的属性信息中的各个属性的特征嵌入包括:
5.根据权利要求2-4中任一项所述的方法,其特征在于,所述交通实体包括路段实体,所述路段实体的属性信息包括静态属性信息和动态属性信息;
6.根据权利要求2-4中任一项所述的方法,其特征在于,所述交通实体包括兴趣点实体,所述兴趣点实体的属性信息包括以下一项或多项的组合:所述兴趣点实体的坐标信息、所属区域以及兴趣点类型。
7.根据权利要求2所述的方法,其特征在于,所述根据各所述交通实体的嵌入向量确定所述交通路网的时空特征信息包括:
8.根据权利要求7所述的方法,其特征在于,所述根据所述交通实体中的路段实体的嵌入向量确定路...
【专利技术属性】
技术研发人员:马静天,安凯强,刘国平,温翔,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。