一种异构的制造技术

技术编号:39771910 阅读:22 留言:0更新日期:2023-12-22 02:22
本申请提供了一种异构的

【技术实现步骤摘要】
一种异构的AI计算平台


[0001]本申请涉及智能计算平台
,尤其涉及一种异构的
AI
计算平台


技术介绍

[0002]相关技术中,异构的智能计算平台通常使用众多基于
AI SoC(
人工智能片上系统
)、GPU(
图形处理器
)

FPGA(
现场可编程门阵列
)
等的类脑计算模块,而且每个类脑计算模块在执行计算任务时均需运行多个应用组件以对其服务,当用户在替换或升级类脑计算模块时,相应的应用组件也需进行移植,如此便需要在
AI SoC

SDK(
软件开发工具包
)
中重新开发应用组件,这将大大增加开发时间和成本;此外,用户在开发应用组件时,必须要去了解底层硬件的架构,并且部署相关操作系统环境,比如需要了解底层每个
CPU(
中央处理器
)、APU(
加速处理器
)、GPU、FPGA
的架构和使用方法,一般需要3~6个月的时间,这也为开发时间和成本带来了很大的不利影响

[0003]因此,有必要对现有的智能计算平台进行改进


技术实现思路

[0004]本申请提供了一种异构的
AI
计算平台,旨在解决相关技术中用户在开发异构的智能计算平台的应用组件时的开发时间和成本较大的问题

[0005]为了解决相关技术中所存在的上述技术问题,本申请实施例提供了一种异构的
AI
计算平台,该
AI
计算平台包括主控模块和若干个计算节点,每个计算节点均配置有计算模块,计算模块用于执行相应的计算任务,各计算模块均通过数据总线与主控模块通讯连接,主控模块中部署有软件系统,软件系统采用分层式架构,软件系统包括硬件层

与硬件层通讯连接的中间件软件层及与中间件软件层通讯连接的应用组件层,应用组件层中部署有若干个应用组件,每个应用组件均具有各自的应用功能,中间件软件层用于屏蔽硬件层的资源并为应用组件层中的各应用组件提供统一的
API
接口,以实现对应用组件层中若干个应用组件的集群式监管

[0006]通过本申请上述技术方案的实施,将软件系统部署在主控模块内,并设置软件系统采用分层式架构,当软件系统的层间耦合度小,层内耦合度大时,如果硬件发生变化,那么仅需修改软件系统中的相关层即可;比如替换或升级计算模块时,由于软件系统中的应用组件层采用的是组件化建模方法
(
即将各种通用系统功能分解为各个应用组件
)
,所以在替换或升级计算模块时仅需修改应用组件层中与之关联的应用组件即可;因此,软件系统的这种分层机制,有效降低了系统升级的复杂度,使软件具有安全性

易维护性

可重构性和快速响应性,充分利用系统资源为任务提供大量可定制的执行空间,对于不熟悉底层硬件架构的软件工程师,一般在培训一周时间之后,就能够直接进行应用软件的编程,大大缩短了开发时间和成本,提高了产品的上市时间;此外,在系统联调时,由于本申请使用的是组件化的服务,故而可快速找到问题所在,缩短系统联调时间,增加整体效率

【附图说明】
[0007]为了更清楚地说明相关技术或本申请实施例中的技术方案,下面将对相关技术或本申请实施例的描述中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,而并非是全部实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0008]图1为本申请实施例提供的
AI
计算平台的结构示意图;
[0009]图2为本申请实施例提供的软件系统的架构图

【具体实施方式】
[0010]为了使本申请的目的

技术方案及优点更加的明显

易懂,下面将结合本申请实施例以及相应的附图,对本申请进行清楚

完整地描述,其中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件

应当理解的是,下面所描述的本申请的各个实施例仅用以解释本申请,并不用于限定本申请,即基于本申请的各个实施例,本领域的普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围

此外,下面所描述的本申请的各个实施例中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合

[0011]相关技术中,异构的智能计算平台通常使用众多的类脑计算模块,每个类脑计算模块在执行计算任务时均需运行多个应用组件以对其服务,当用户在替换或升级类脑计算模块时,相应的应用组件也需进行移植,如此便需要在
SDK
中重新开发应用组件,这将大大增加开发时间和成本;此外,用户在开发应用组件时,必须要去了解底层硬件的架构,并且部署相关操作系统环境,一般需要3~6个月的时间,这也为开发时间和成本带来了很大的不利影响

为此,本申请于下文的实施例中提出了一种异构的
AI
计算平台
(AI
意为人工智能
)
,通过该
AI
计算平台可有效地解决相关技术中所存在的上述技术问题

[0012]图1是
AI
计算平台的结构示意图,在一些实施例中,
AI
计算平台包括主控模块和若干个计算节点,每个计算节点均配置有计算模块,计算模块用于执行相应的计算任务,各计算模块均通过数据总线与主控模块通讯连接,主控模块中部署有软件系统,软件系统采用分层式架构,软件系统包括硬件层

与硬件层通讯连接的中间件软件层及与中间件软件层通讯连接的应用组件层,应用组件层中部署有若干个应用组件,每个应用组件均具有各自的应用功能,中间件软件层用于屏蔽硬件层的资源并为应用组件层中的各应用组件提供统一的
API
接口,以实现对应用组件层中若干个应用组件的集群式监管

优选地,主控模块基于国产
CPU、
且运行国产麒麟操作系统;中间件软件层实际上为异构的类脑中间件;数据总线采用
PCIe(
高速串行计算机扩展总线标准
)
总线;计算模块可采用基于
AI SoC、FPGA、GPU
等的模块;硬件层由操作系统和底层硬件两部分构成,操作系统可采用国产麒麟操作系统和
Linux
等,底层硬件可包括
PCIe、
国产
CPU、GPU、FPGA

AI SoC


[0013]作为其中的一种实施例,
AI
计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种异构的
AI
计算平台,其特征在于,包括:若干个计算节点,每个所述计算节点均配置有计算模块,所述计算模块用于执行相应的计算任务;主控模块,各所述计算模块均通过数据总线与所述主控模块通讯连接,所述主控模块中部署有软件系统,所述软件系统采用分层式架构,所述软件系统包括硬件层

与所述硬件层通讯连接的中间件软件层及与所述中间件软件层通讯连接的应用组件层,所述应用组件层中部署有若干个应用组件,每个所述应用组件均具有各自的应用功能,所述中间件软件层用于屏蔽所述硬件层的资源并为所述应用组件层中的各所述应用组件提供统一的
API
接口,以实现对所述应用组件层中若干个所述应用组件的集群式监管
。2.
根据权利要求1所述的
AI
计算平台,其特征在于,所述
AI
计算平台启动之后,所述中间件软件层读取各所述计算模块的配置文件,所述配置文件中记载有相应所述计算模块工作时所需运行的各所述应用组件,基于每个所述配置文件,建立各所述计算模块与相应的所有所述应用组件之间的通讯连接;其中,针对目标计算模块与相应的各目标应用组件,所述中间件软件层将各所述目标应用组件定义为所述目标计算模块的主组件,并在其它所述计算模块的所述主组件中定义与各所述目标应用组件相对应的备份组件
。3.
根据权利要求2所述的
AI
计算平台,其特征在于,当所述主组件的状态值更改时,所述主组件向相应的所述备份组件发送更改后的状态值,所述备份组件依据更改后的状态值进行自身状态值的更新;其中,所述备份组件始终处于运行状态

且不对外发送数据
。4.
根据权利要求2所述的
AI
计算平台,其特征在于,所述中间件软件层还用于对各所述应用组件进行故障检测,若检测到故障应用组件,则利用相应的所述备份组件接替所述故障应用组件的工作
。5.
根据权利要求2所述的
AI
计算平台,其特征在于,每个所述计算节点还配置有故障监测模块,所述中间件软件层还用于对各所述计算模块进行故障检测,方案为:每个所述故障监测模块均向其它的所述故障监测模块发送试探信息,当除目标故障监测模块以外的其它所述故障监测模块超过预定时长未接收到来自于所述目标故障监测模块的试探信息时,判定与所述目标故障监测模块相应的所述计算模块为故障计算模块;其中,检...

【专利技术属性】
技术研发人员:蒋祺明张博滕桂松
申请(专利权)人:上海领存信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1