System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大模型向量的套箱知识库构建方法技术_技高网

一种基于大模型向量的套箱知识库构建方法技术

技术编号:44073380 阅读:11 留言:0更新日期:2025-01-17 16:09
本发明专利技术提供一种基于大模型向量的套箱知识库构建方法,包括以下步骤:S1:对原始订单特征进行分级、分类,并使用大模型向量模型结合权重算法将原始订单特征构建为知识向量;S2:构建向量知识库和待选向量订单池;S3:查询推荐与构建打分矩阵;S4:更新知识库;本发明专利技术通过采用订单特征分类方法以及向量生成方法,构建向量知识库和待选向量订单池,将给定的订单转化为订单向量并在向量知识库和待选向量订单池中进行订单配对,最终构建打分矩阵从多个维度对订单对进行打分,得到分值最高的订单对进行套箱;具有量化依据和明确的套箱流程,提高了套箱的效率;避免了现有技术中依赖调配人员经验进行套箱,人工调配效率低下的问题。

【技术实现步骤摘要】

本专利技术涉及海运物流领域,尤其涉及一种基于大模型向量的套箱知识库构建方法


技术介绍

1、目前,在海运物流领域中,集装箱在运输过程中存在资源浪费和调配知识缺失问题,尤其是空跑(即集装箱在没有货物的情况下运输)和调配人员经验知识无法量化的问题;货车需要在集装箱借还处、港口、客户点之间往返,尤其在进口货物和出口货物的运输过程中,空跑距离较长,增加了人力成本和资源浪费;调配人员通常依据经验将进口单和出口单进行配对,以减少空跑,这种方法虽然在某些情况下能节省资源,但往往时基于直觉和经验,缺乏量化依据和明确的套箱流程,人工调配效率低下;无法有效地利用所有历史数据中的信息,调配人员个人知识难以传播复用,无法量化指标;也无法严格遵循节省路程的最大原则。


技术实现思路

1、本专利技术的目的是为了解决现有技术中存在的缺点,而提出的一种基于大模型向量的套箱知识库构建方法。

2、为实现上述目的,本专利技术采用了如下技术方案:

3、一种基于大模型向量的套箱知识库构建方法,包括以下步骤:

4、s1:对原始订单特征进行分级、分类,并使用大模型向量模型结合权重算法将原始订单特征构建为知识向量;

5、包括如下子步骤:

6、s11:将原始订单特征划分为不同的级别和特征类型;

7、采集原始订单特征,将原始订单特征划分为不同的级别和特征类型;

8、所述原始订单特征包括货物名称、货物类型、港口信息、取货点经纬度、送货点位置信息、箱型、货重、装货时间、做箱时间点、送达时间等;

9、所述级别包括订单级特征和套箱级特征;所述订单级特征是指描述单个订单在运输过程中各种属性的特征,包括货物名称、货物类型、港口信息、取货点经纬度、送货点位置信息等;

10、所述套箱级特征是指评估两个能否合并到同一个集装箱中的特征,包括箱型、装货时间、货重等;

11、特征类型包括连续特征、语义特征、分类特征;所述连续特征是指可以取任意实数值且具有顺序关系的特征,包括货重、距离、装货时间等;所述语义特征是指涉及文本或其他形式的非结构化数据,需要通过自然语言处理或大规模向量化来转换为数值形式的特征,包括、货物名称、货物类型、地址信息等;所述分类特征是指具有离散值、用于标识不同的类别或组的特征,包括箱型、客户标识等;

12、其中,订单级特征包括连续特征、语义特征、分类特征三种特征类型;所述套箱级特征包括分类特征、连续特征两种特征类型。

13、s12:将订单级特征转换为知识向量;

14、包括如下子步骤:

15、s121:将订单级特征转换为原始向量;

16、通过位置向量、大模型语义向量、onehot向量三种向量编码方式将订单级特征转换为原始向量,即将特征类型为连续特征、语义特征、分类特征的原始订单特征转换为原始向量;

17、对于特征类型为连续特征的订单级特征,通过位置向量将其转换为原始向量;本方法中特征类型为连续特征的订单级特征具体指代经纬度等位置特征;

18、具体地,通过理想球体近似法将所述订单级特征中的经纬度(l,b)转换为3d坐标(x,y,z),,,;

19、其中,r为地球半径,l、b为经纬度的弧度值;

20、对于特征类型为语义特征的订单级特征,通过大模型向量模型直接转换为原始向量;所述大模型向量模型包括bert、gpt等;

21、具体地,将语义特征中的文本输入到大模型向量模型中,大模型向量模型生成长向量,根据实际需求截取其中特定维度或通过降维技术减少长向量的维度;并对处理后的向量进行归一化处理,得到原始向量;

22、对于特征类型为分类特征的订单级特征,通过one-hot编码对每个类别进行index处理,得到原始向量;

23、具体地,one-hot编码对每个类别进行index处理,将每个类别转换为一个长度为n的向量,其中n是类别的总数,每个向量只有一个位置为1,其余位置为0;假设类别i的index为i,则,;例如类别有3个,则类别2的onehot编码为[0,1,0];

24、s122:将原始向量转化为知识向量;

25、根据实际需求对步骤s121得到的各个原始向量分别设定权重参数,记权重参数为,记原始向量为;

26、将原始向量与对应权重参数做哈达玛积,得到,将所有哈达玛积结果进行拼接,得到知识向量,记为v,;

27、其中,为维度,如果各个特征维度相加不满足,补充0值维度;

28、进一步地,的权重参数值根据对应订单级特征的重要程度进行调整,例如取货点、送货点较高、还空点的权重参数值居中、货品等信息的权重参数值较低。

29、s2:构建向量知识库和待选向量订单池;

30、工程师创建知识库,所述知识库包含进口侧和出口侧;

31、采集历史套箱订单,所述历史套箱订单包括进口订单、出口订单;

32、将历史套箱的进口订单、出口订单根据步骤s1的方法分别转换为进口向量、出口向量;

33、具体地,将历史套箱中的进口订单、出口订单分别划分为不同的级别和特征类型;根据特征类型通过对应的向量编码方式将进口订单、出口订单转化为原始向量,对原始向量进行哈达玛积处理,将所有哈达玛积结果进行拼接,得到进口向量、出口向量;

34、将得到的各个进口向量、出口向量与知识库中已有的知识向量进行比较,如果知识库中存在与进口向量、出口向量相同的知识向量,则对此向量不做处理;

35、如果知识库中不存在与进口向量或出口向量相同的知识向量,则将对应的进口向量保存到知识库中的进口侧,出口订单保存到知识库的出口侧;

36、根据实际需求将知识库中的出口订单、进口订单依次构成订单对,每条进口订单和出口订单一一对应;

37、进一步地,通过聚类分析计算统计知识库中向量对的频次;通过距离公式分别计算每组向量对的距离,将知识库中距离相同的向量对聚集到同一组中,每个向量的频次为组内包含的向量对条数;

38、通过距离来衡量向量的相似度,并根据聚类算法统计向量的频次,可以将所有向量按照相似性分组,便于了解不同组的结构和分布。

39、将新的进出口订单、尚未截单的进出口订单、未配对的进出口订单据步骤s1的方法分别转换为进口向量、出口向量;将所述进口向量、出口向量保存到待选向量订单池。

40、s3:查询推荐与构建打分矩阵;

41、包括如下子步骤:

42、s31:根据给定的订单进行订单对查询;

43、如果给定的订单为进口订单,将给定的进口订单通过步骤s1的方法转换为进口订单向量,并设定距离阈值l1;

44、具体地,通过向量距离公式分别计算出给定的进口订单向量与知识库进口侧内每一条进口向量的距离,将所述距离小于距离阈值l1的知识库中的进口向量保存到集合r1中;

...

【技术保护点】

1.一种基于大模型向量的套箱知识库构建方法,其特征在于:包括以下步骤:

2.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

3.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

4.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

5.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

6.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

【技术特征摘要】

1.一种基于大模型向量的套箱知识库构建方法,其特征在于:包括以下步骤:

2.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

3.如权利要求1所述的基于大模型向量的套箱知识库构建方法,其特征在于:

...

【专利技术属性】
技术研发人员:张楠蒋帅孟健杨诺张文张中磊刘文婧郭琦于安琪马群
申请(专利权)人:鱼快创领智能科技南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1