System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 嵌入式大模型加速系统平台技术方案_技高网

嵌入式大模型加速系统平台技术方案

技术编号:44888445 阅读:4 留言:0更新日期:2025-04-08 00:25
本申请公开嵌入式大模型加速系统平台,涉及模型加速领域。平台包括CPU处理器和至少一个FPGA处理器;FPGA处理器中内置有AI加速引擎,CPU处理器用于启动和控制模型加速;CPU和FPGA处理器通过设置的万兆XGMII接口直连,其中的CPU处理器基于固定的源MAC地址向FPGA处理器发送以太网数据帧和接收模型加速结果,FPGA处理器基于固定的目标MAC地址接收以太网数据帧,以及基于模型加速结果构建以太帧进行发送。该方案使用万兆网络替代PCIe实现嵌入式AI加速数据传输,提高集成度和降低成本投入;使用固定MAC地址和自定义以太帧类型,在用户态通过原始套接字构建以太帧实现两者间的数据通信。

【技术实现步骤摘要】

本申请实施例涉及模型加速领域,特别涉及一种嵌入式大模型加速系统平台


技术介绍

1、大模型通常指的是参数量庞大、复杂度高的人工智能模型,被广泛应用于自然语言处理、计算机视觉、自动驾驶等众多领域。目前大多ai加速设备是以pcie卡方式使用的,但pcie卡体积庞大,不适合用于嵌入式领域。当前在嵌入式领域大多采用系统级芯片(system on chip,soc)实现ai加速,但soc价格一般比较昂贵,且驱动程序复杂,一旦驱动存在bug,严重时还会造成系统宕机,开发出稳定的驱动软件需要的时间一般也比较长。


技术实现思路

1、本申请实施例提供一种嵌入式大模型加速系统平台,解决相关技术中嵌入式系统集成soc执行ai加速成本过高和缺乏稳定性的问题。

2、所述平台包括设置在同一主板上的cpu处理器和至少一个fpga处理器;所述fpga处理器中内置有ai加速引擎,所述cpu处理器用于启动和控制模型加速;

3、所述cpu处理器和至少一个fpga处理器通过设置的万兆xgmii接口直连,其中的cpu处理器基于固定的源mac地址向fpga处理器发送以太网数据帧和接收模型加速结果,fpga处理器基于固定的目标mac地址接收以太网数据帧,以及基于模型加速结果构建以太帧进行发送。

4、具体的,所述cpu处理器通过系统软件设置,与目标fpga处理器之间使用固定的源mac地址;所述fpga处理器侧使能以太网mac ip核,确定固定的目标mac地址。

5、具体的,所述fpga处理器连接有高带宽内存hbm,其中存储有ai模型参数;

6、所述fpga处理器在接收到cpu处理器的数据帧后,根据设定的目标通信协议进行解析获取控制指令,并根据控制指令启动ai加速操作计算。

7、具体的,所述cpu处理器与fpga处理器之间通过原始套接字构建以太帧数据。

8、具体的,当所述cpu处理器与fpga处理器通信时,创建原始套接字并选定预设的以太帧类型;

9、构建以太帧头,根据预设协议封装控制ai加速的功能码指令,获得以太帧数据;所述功能码指令用于控制ai加速引擎执行对应操作。

10、具体的,所述cpu处理器根据fpga处理器的目标mac地址发送以太帧数据;

11、当所述fpga处理器接收到以太帧数据时,根据预设协议进行解析提取功能码指令;

12、基于所述功能码指令调用ai加速引擎并执行相应操作计算,获得结果数据;

13、构建以太帧头,根据预设协议封装结果数据后返回至cpu处理器。

14、具体的,所述cpu处理器中设置有第一协议处理单元和业务处理单元,第一协议处理单元用于确定与fpga处理器设置的以太帧类型和封装协议类型,封装构建以太帧和对接收的以太帧数据进行解析;

15、所述业务处理单元用于确定和生成对ai加速引擎操作的功能码指令,在确定功能码指令和封装协议类型后执行封装构建步骤。

16、具体的,所述fpga处理器中设置有第二协议处理单元和ai加速引擎;

17、所述第二协议处理单元用于对mac端接收的以太帧数据进行解析,提取功能码指令,以及进行协议封装;

18、所述ai加速引擎中存储有用于模型加速的ai算子,根据功能码指令执行对应操作计算。

19、具体的,所述以太帧数据的格式包含6byte的目标mac地址位、6byte的源mac地址位、2byte的数据类型位,以及46-1500byte的预设协议位;预设协议根据cpu处理器和fpga处理器进行匹配,在匹配一致时进行解析。

20、具体的,所述预设协议位包括2byte的长度字段位、2byte的功能码字段、4byte的地址字段、2byte的校验字段,其余为数据字段。

21、本申请实施例提供的技术方案带来的有益效果至少包括:

22、1.将cpu和fpga处理器放置在同一主板上,通过以太mac直连,无需phy芯片和隔离变压器,可大大减小主板面积且可有效降低硬件成本。

23、2.直接在用户态使用原始套接字构建以太帧实现cpu处理器侧和fpga处理器侧数据通信,无需再额外开发专用驱动程序,稳定可靠并有效缩短开发周期。

24、3.使用万兆网络替代pcie卡实现嵌入式ai加速数据传输,提高集成度和降低成本投入。

25、4.将cpu和fpga处理器的万兆以太mac直连,使用固定mac地址和自定义以太帧类型,在用户态构建以太帧实现两者间的数据通信。

本文档来自技高网...

【技术保护点】

1.一种嵌入式大模型加速系统平台,其特征在于,所述平台包括设置在同一主板上的CPU处理器和至少一个FPGA处理器;所述FPGA处理器中内置有AI加速引擎,所述CPU处理器用于启动和控制模型加速;

2.根据权利要求1所述的嵌入式大模型加速系统平台,其特征在于,所述CPU处理器通过系统软件设置,与目标FPGA处理器之间使用固定的源MAC地址;所述FPGA处理器侧使能以太网MAC IP核,确定固定的目标MAC地址。

3.根据权利要求2所述的嵌入式大模型加速系统平台,其特征在于,所述FPGA处理器连接有高带宽内存HBM,其中存储AI模型参数;

4.根据权利要求1-3任一所述的嵌入式大模型加速系统平台,其特征在于,所述CPU处理器与FPGA处理器之间通过原始套接字构建以太帧数据。

5.根据权利要求4所述的嵌入式大模型加速系统平台,其特征在于,当所述CPU处理器与FPGA处理器通信时,创建原始套接字并选定预设的以太帧类型;

6.根据权利要求5所述的嵌入式大模型加速系统平台,其特征在于,所述CPU处理器根据FPGA处理器的目标MAC地址发送以太帧数据;

7.根据权利要求5所述的嵌入式大模型加速系统平台,其特征在于,所述CPU处理器中设置有第一协议处理单元和业务处理单元,第一协议处理单元用于确定与FPGA处理器设置的以太帧类型和封装协议类型,封装构建以太帧和对接收的以太帧数据进行解析;

8.根据权利要求6所述的嵌入式大模型加速系统平台,其特征在于,所述FPGA处理器中设置有第二协议处理单元和AI加速引擎;

9.根据权利要求5至8任一所述的嵌入式大模型加速系统平台,其特征在于,所述以太帧数据的格式包含6Byte的目标MAC地址位、6Byte的源MAC地址位、2Byte的数据类型位,以及46-1500Byte的预设协议位;预设协议根据CPU处理器和FPGA处理器进行匹配,在匹配一致时进行解析。

10.根据权利要求9所述的嵌入式大模型加速系统平台,其特征在于,所述预设协议位包括2Byte的长度字段位、2Byte的功能码字段、4Byte的地址字段、2Byte的校验字段,其余为数据字段。

...

【技术特征摘要】

1.一种嵌入式大模型加速系统平台,其特征在于,所述平台包括设置在同一主板上的cpu处理器和至少一个fpga处理器;所述fpga处理器中内置有ai加速引擎,所述cpu处理器用于启动和控制模型加速;

2.根据权利要求1所述的嵌入式大模型加速系统平台,其特征在于,所述cpu处理器通过系统软件设置,与目标fpga处理器之间使用固定的源mac地址;所述fpga处理器侧使能以太网mac ip核,确定固定的目标mac地址。

3.根据权利要求2所述的嵌入式大模型加速系统平台,其特征在于,所述fpga处理器连接有高带宽内存hbm,其中存储ai模型参数;

4.根据权利要求1-3任一所述的嵌入式大模型加速系统平台,其特征在于,所述cpu处理器与fpga处理器之间通过原始套接字构建以太帧数据。

5.根据权利要求4所述的嵌入式大模型加速系统平台,其特征在于,当所述cpu处理器与fpga处理器通信时,创建原始套接字并选定预设的以太帧类型;

6.根据权利要求5所述的嵌入式大模型加速系统平台,其特征在于,所述...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:深存科技无锡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1