System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及网约车,具体涉及网约车平台用完单量的预估及评测,特别涉及用于网约车平台每日完单量的预估方法及系统。
技术介绍
1、网约车平台完单量预估根植于该行业的迅猛发展态势与日益加剧的市场竞争环境,同时亦是对持续优化运营效率和提升用户体验的深切需求之回应。当前,针对网约车平台完单量的预估工作,主要依赖于时间序列分析这一技术手段。然而,时间序列分析方法在面对数据集中的异常值(outliers)时,展现出了较高的敏感性。具体而言,若数据集中掺杂有异常值,则极有可能对分析结果的准确性构成显著干扰,进而导致预测结果偏离实际,降低其应用价值。因此,在运用时间序列分析进行网约车平台完单量预估的过程中,对异常值的有效处理显得尤为关键,其目的在于削弱乃至消除异常值对最终分析结果的潜在负面影响。
2、进一步而言,时间序列数据本身可能蕴含着复杂的非线性关系模式,诸如周期性波动、阶跃性变化等特征。这些特征的存在,对传统线性模型构成了挑战,因为后者往往难以准确捕捉并描述此类非线性关系。鉴于此,当面对具有复杂非线性特征的时间序列数据时,传统的时间序列分析方法可能表现出明显的局限性,其预测精度和适用性均可能受到不同程度的制约。
3、为此,本专利技术提出用于网约车平台每日完单量的预估方法及系统。
技术实现思路
1、有鉴于此,本专利技术希望提供用于网约车平台每日完单量的预估方法及系统,以解决或缓解现有技术中存在的技术问题,即如何让网约车每日完单量模型不受异常值敏感及非线性的干扰,以准确地
2、第一方面,用于网约车平台每日完单量的预估方法:
3、(一)概述:
4、本专利技术提供了结合卷积神经网络(cnn)和transformer的模型架构,旨在准确预估网约车平台的完单量。利用cnn编码器提取这些特征的局部和高层次信息,形成丰富的特征表示。transformer解码器进一步处理这些特征,通过多头注意力机制和前馈神经网络捕获长距离依赖关系,最终输出未来一周内每天的完单量预估结果。
5、(二)技术方案:
6、为实现上述技术目标,本专利技术选择执行如下操作步骤。
7、2.1步骤s1,数据工程:
8、从各个数据源(如数据库、api接口、外部文件等)收集日期和时间特征a、天气特征b、节假日特征c、城市特征d、竞争对手信息e、营销活动数据f、司机车辆信息g以及乘客行为特征h;
9、然后对收集到的数据进行清洗,并对日期和时间a特征进行编码,转换为模型可理解的数值形式;
10、对上述分类特征(天气特征b、节假日特征c、城市特征d和司机车辆信息g)进行one-hot编码;
11、对数值特征(竞争对手信息e、营销活动数据f和乘客行为特征h)进行归一化处理;
12、然后,将上述所有特征统筹为数据集d。
13、2.1.1步骤s100,特征编码:
14、a′=encodedatetime(a);
15、其中,a′是编码后的日期和时间特征,encodedatetime是编码函数。
16、对于特征x=[b,c,d,g]执行one-hot编码:
17、
18、其中,xi′是one-hot编码后的第i个元素,categoryi是特征x的第i个类别。
19、2.1.1步骤s101,归一化:
20、对于特征y=[e,f,h]执行归一化:
21、
22、其中,y′是归一化后的特征,min(y)和max(y)分别是特征y的最小值和最大值。
23、2.1.3步骤s102,统筹所有特征为数据集d:
24、d={a′,b′,c′,d′,e′,f′,g′,h′};
25、其中,a′,b′,c′,d′,e′,f′,g′,h′分别是处理后的日期和时间特征、天气特征、节假日特征、城市特征、竞争对手信息、营销活动数据、司机车辆信息和乘客行为特征。
26、2.2步骤s2,特征推理:
27、将数据集d输入至cnn编码器,基于输入层将其转换为三维张量d’,卷积层通过卷积运算提取三维张量d’的局部特征,并形成高层次特征d”;
28、2.2.1步骤s200,输入层转换:
29、将数据集d输入至cnn编码器的输入层,并将其转换为三维张量d’:
30、d′=inputlayertransform(d);
31、其中,d′是转换后的三维张量,inputlayertransform是输入层的转换函数。
32、2.2.2步骤s201,卷积层特征提取:
33、卷积层通过卷积运算提取三维张量d’的局部特征。对于卷积层中的第l个卷积核,执行如下操作:
34、
35、其中,zl是第l个卷积核的输出,m和n分别是卷积核在输入张量上滑动时的行和列的尺寸,di,j′是输入张量d’在位置(i,j)上的值,kl,i,j是第l个卷积核在位置(i,j)上的权重,bl是第l个卷积核的偏置项。
36、2.2.3步骤s202,形成高层次特征d”:
37、将卷积层将多个卷积核的输出组合:d″=[z1,z2,…,zl];
38、其中,d″是高层次特征表示,l是卷积层中卷积核的数量,
39、[z1,z2,…,zl]表示将各个卷积核的输出在深度方向上拼接起来。
40、2.3步骤s3,生成预估结果序列s:
41、高层次特征d”通过transformer解码器转换为一维序列数据s,并基于多头注意力机制和前馈神经网络捕获输入序列中的长距离依赖关系,并基于全连接层形式的输出层输出包括未来一周内每天完单量的预估结果序列s;
42、2.3.1步骤s300,transformer解码器转换:
43、s=transformerdecoder(d”);
44、其中,transformerdecoder是transformer解码器的转换函数。
45、在transformer解码器中,使用多头注意力机制捕获输入序列中的长距离依赖关系。对于第h个头,其注意力权重为:
46、
47、其中,是第h个头中位置i和位置j之间的注意力分数,n是序列的长度。
48、注意力分数的计算在于:
49、
50、其中,和是第h个头中的查询和键的权重矩阵,qi和kj分别是位置i和位置j的查询和键向量,dk是键向量的维度。
51、2.3.2步骤s301,前馈神经网络:
52、使用前馈神经网络对注意力机制的输出进行进一步处理:
53、ffn(s)=max(0,xw1+b1)w2+b2;
54、其中,f本文档来自技高网...
【技术保护点】
1.用于网约车平台每日完单量的预估方法,其特征在于,包括如下操作步骤:
2.根据权利要求1所述的预估方法,其特征在于:在所述S1中,包括:
3.根据权利要求2所述的预估方法,其特征在于:在所述S1中,所述数据集D={a′,b′,c′,d′,e′,f′,g′,h′};
4.根据权利要求1所述的预估方法,其特征在于:在所述S2中,包括:
5.根据权利要求4所述的预估方法,其特征在于:在所述S2中,将卷积层将多个卷积核的输出组合:D″=[Z1,Z2,…,ZL];
6.根据权利要求1、2或4所述的预估方法,其特征在于:在所述S3中,包括:
7.根据权利要求6所述的预估方法,其特征在于:在所述S300中,使用多头注意力机制捕获输入序列中的长距离依赖关系;对于第h个头,其注意力权重为:
8.根据权利要求7所述的预估方法,其特征在于:注意力分数的计算在于:
9.用于网约车平台每日完单量的预估系统,其特征在于:所述系统包括处理器、与所述处理器连接的存储器,所述存储器中存储有程序指令,所述程序指令被所述
10.根据权利要求9所述的预估系统,其特征在于:所述处理器连接有,
...【技术特征摘要】
1.用于网约车平台每日完单量的预估方法,其特征在于,包括如下操作步骤:
2.根据权利要求1所述的预估方法,其特征在于:在所述s1中,包括:
3.根据权利要求2所述的预估方法,其特征在于:在所述s1中,所述数据集d={a′,b′,c′,d′,e′,f′,g′,h′};
4.根据权利要求1所述的预估方法,其特征在于:在所述s2中,包括:
5.根据权利要求4所述的预估方法,其特征在于:在所述s2中,将卷积层将多个卷积核的输出组合:d″=[z1,z2,…,zl];
6.根据权利要求1、2或4所述的预估方法,其特征在于...
【专利技术属性】
技术研发人员:于志杰,
申请(专利权)人:北京白龙马云行科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。