当前位置: 首页 > 专利查询>马磊专利>正文

图像识别加速装置及具有图像识别加速装置的微处理器芯片制造方法及图纸

技术编号:2945182 阅读:305 留言:0更新日期:2012-04-11 18:40
一种图像识别加速装置,主要由系统总线仲裁器、内部总线、接入控制单元、指令分配器、直接内存访问控制器、系统任务队列、资源统计器、运行任务保留站、配置存储器、多个指令译码器单元、数据存储器、多个处理单元阵列、数据保留站以及格雷编码器构成,具有相对于现有专用图像识别加速芯片性能高,成本低,应用灵活等优点。

【技术实现步骤摘要】

本专利技术涉及图像处理大规模集成电路技术,更具体的说,涉及对图 像处理加速装置的技术。
技术介绍
随着信息和网络技术的发展,数字内容的内涵日益丰富,从原来单一的文字和图片为主扩展到音频,视频和3D环境等多种承载媒体,涉 及教育、科学、金融、文化、娱乐、商业、通信等各个领域。从技术方 面来讲,数字内容开发、数字内容传递和数字内容安全是数字内容产业 的三大支撑。数字内容开发一方面与文化创意和艺术创造紧密结合,同 时也与图像、音频、视频、Web2.0等技术不可分割;随着宽带技术的发 展,数字内容传递正在由传统的离线配送向互联网在线传递和移动传递 的方向急剧转变,网络门户、搜索引擎、无线宽带、移动交互等技术成 为数字内容传递的核心技术;数字内容安全则包括数字版权管理(DRM)、 非法及有害内容过滤、网络支付安全等重要内容。基于内容的过滤即基于内容的过滤,是数字内容安全的重要内容。 CBF的主要对象包括非法内容和有害内容,如非法广告、黄色信息、惑 众谣言、网络病毒、黑客攻击等。在图像和视频文件过滤方面,文字识别、人脸识别、人体识别、物体识别等图像识别技术是核心。通过这些 技术,可对文件中包含的字牌、标语、广告等反映不同场景的文字,以 M脸、人体、物体等反映不同人物和事件的对象进行识别。获得这些 关键信息后,便可以对图像和视频进行分类和过滤。例如对黄色图片进 行过滤,对毒品广告进行过滤等。在上述图像识别技术中,人脸识别和 物体识别是当前的研究热点。文字识别是开展较早的研究,但图像中的 文字识别有其特殊性,如倾斜和光线的影响等。关于人脸识别和物体识 别,近年来人们给予了极大的关注,并取得了显著的悉艮。在网络环境中,过滤器的效率是一个突出问题。基于智能技术的过滤 器通常具有较高的计算复杂度,时间开销较大。目前的芯片技术中,已 经有了针对图像处理的加速模块,但是基本上都是为了满足于媒体压缩或者是3D效果而特别设置的,如MPEG/H.264的搜索加速,DCT/IDCT 等。也有一些针对哈夫变换等常用图像识别算法的硬件实现,如 A.K.Majumdar Z)e5"/gw y457C/or欲喻/^ //"e afete"/o" Z" fl /附flge .In:Proceedings of the Thirteenth International Conference on VLSI Design, 2000:128 133以及S.Tagzout, K.Achour, O.Djkoune Wo"g/r ^Yi"^/b/7w fl/goW幼附/or FPGL4 /附/ /e/we/i她Vwi . Signal Processing System, 2000-10:384~393。这些实现中,主要做的是采用专用硬件去实 现某些特定的算法单元,如采用CORDIC电路去实现快速的曲线变换计 算和专用累加电路等。由于图像识别算法针对不同的应用,参数的区别 和步骤往往相差很大,因此,针对特定算法的加速电路的有效作用领域 往往很窄;此外,图^^识别算法是不断更新和改进的,针对某一特定算法实现的加速电路,很快随着时间的推移就暴露出了局限性。
技术实现思路
考虑到以上问题而提出了本专利技术。本专利技术的目的是提供一种应用于 微处理器电路的图像识别加速装置。本专利技术的一个有利方面在于,基于可配置的多个并行PE阵列,所述图像识别加速装置能够提供高达 lS3.6Gops的峰值计算能力。本专利技术的另一个有利方面在于,采用基于 交换的数据路由方式,使得各个PE之间的数据通路可以灵活配置,适 应不同的匹配算法的需求。根据本专利技术的一个方面,提供了一种图像识别加速装置,包括系 统总线仲裁器,将外部数据请求发送至所述图4象识别加速装置内部的直 接内存访问控制器,同时将外部任务控制请求发送至系统任务队列,该 系统总线仲裁器连接至外部系统总线;内部总线,其为按内存映射的地 址和数据总线;接入控制单元,将系统任务队列、资源统计器、运行任 务保留站的内部数据按照地址映射规则组织,使所述内部数据能够被所 述内部总线上的读写请求所访问;指令分配器,将计算任务动态分配给 多个处理单元阵列;所述直接内存访问控制器,连接于所述内部总线与 所述系统总线仲裁器之间,将数据按预先设定好的地址读入或读出;所 迷系统任务队列,由一先入先出队列构成,该队列的输入数据为经由所 述系统总线仲裁器输入的外部控制请求,该队列的输出端连接至所述指 令分配器和所述接入控制单元;所述资源统计器,连接到所述接入控制 单元与所述指令分配器,提供所述图像识别加速装置内部资源消耗情况 的实时信息给微处理器以及所述指令分配器;所述运行任务保留站,连 接于所述接入控制单元与所述指令分配器之间,用于保存当前正在执行 的任务的情况和各个任务占用的资源数据;配置存储器,连接到所述内部总线,存储所述多个处理单元阵列内部配置和控制指令字;多个指令 译码器单元,连接于所述指令分配器与所述配置存储器之间,将所述指 令分配器分配给所述多个处理单元阵列或者格雷编码器的控制指令译码 成与它们相应的控制字;数据存储器,连接于所述内部总线与多个处理 单元阵列之间,为多个双端口随机存储器,所述随机存储器的个数与所 述多个处理单元阵列个数相等;所述多个处理单元阵列,均连接于所述 配置存储器与所述数据存储器之间,完成图像识别计算任务,各个阵列 之间为串行连接;数据保留站,连接于所述内部总线,将所述直接内存 访问控制器输入的多个周期的第 一位宽的数据拼接成第二位宽的数据输 出,其中所述第一位宽小于第二位宽;以及,格雷编码器,连接于数据 保留站与所述处理单元阵列之间,将原始图像数据转换成格雷码编码的 图像数据。根据本专利技术的另一个方面,提供一种具有上述图像识别加速装置的 微处理器芯片,该微处理器芯片还具有微处理器内核、系统总线、内 存控制器、直接内存访问控制器、中断控制器、网络控制器、视频控制 器、低速外设桥接器,以及连接于低速外设桥接器的通用IO、 12C总线 控制器、UART控制器以及SPI控制器;其中所述的微处理器内核、图 像识别加速装置、内存控制器、直接内存访问控制器、中断控制器、网 络控制器、视频控制器以及低速外设桥接器均连接至系统总线,其连接 方式为地址映射。附图说明相信通过以下结合附图对本专利技术具体实施方式的说明,能够使人们 更好地了解本专利技术的上述和其它特点、优点和目的。 图l是根据本专利技术的第一实施例的所在系统框图;图2是根据本专利技术的第一实施例的逻辑结构示意图;图3是根据本专利技术的第一实施例的数据保留站的内部逻辑结构示意图;图4是才艮据本专利技术的第一实施例的PE阵列的内部逻辑结构示意图; 图5是才艮据本专利技术的第一实施例的PE单元的内部逻辑结构示意图。具体实施方式下面就结合附图对本专利技术的各个实施例进行详细的说明 图l是根据本专利技术的一个实施例的微处理器系统方框图。图中详细 描述了采用本专利技术的一个嵌入式处理器的芯片内部系统框图。该处理器 由微处理器内核(101)、图像识别加速装置(102)、系统总线(103)、 内存控制器(104)、直接内存访问控制器(105)、中断控制器(106)、 网络控制器(107)、视频控制器(108)、用于连接低速外设的本文档来自技高网
...

【技术保护点】
一种图像识别加速装置,其特征在于,包括:系统总线仲裁器,将外部数据请求发送至所述图像识别加速装置内部的直接内存访问控制器,同时将外部任务控制请求发送至系统任务队列,该系统总线仲裁器连接至外部系统总线;内部总线,其为按内存映射的地址和数据总线;接入控制单元,将系统任务队列、资源统计器、运行任务保留站的内部数据按照地址映射规则组织,使所述内部数据能够被所述内部总线上的读写请求所访问;指令分配器,将计算任务动态分配给多个处理单元阵列;所述直接内存访问控制器,连接于所述内部总线与所述系统总线仲裁器之间,将数据按预先设定好的地址读入或读出;所述系统任务队列,由一先入先出队列构成,该队列的输入数据为经由所述系统总线仲裁器输入的外部控制请求,该队列的输出端连接至所述指令分配器和所述接入控制单元;所述资源统计器,连接到所述接入控制单元与所述指令分配器,提供所述图像识别加速装置内部资源消耗情况的实时信息给微处理器以及所述指令分配器;所述运行任务保留站,连接于所述接入控制单元与所述指令分配器之间,用于保存当前正在执行的任务的情况和各个任务占用的资源数据;配置存储器,连接到所述内部总线,存储所述多个处理单元阵列内部配置和控制指令字;多个指令译码器单元,连接于所述指令分配器与所述配置存储器之间,将所述指令分配器分配给所述多个处理单元阵列或者格雷码编码器的控制指令译码成与它们相应的控制字;数据存储器,连接于所述内部总线与多个处理单元阵列之间,为多个双端口随机存储器,所述随机存储器的个数与所述多个处理单元阵列个数相等;所述多个处理单元阵列,均连接于所述配置存储器与所述数据存储器之间,完成图像识别计算任务,各个阵列之间为串行连接;数据保留站,连接于所述内部总线,将所述直接内存访问控制器输入的多个周期的第一位宽的数据拼接成第二位宽的数据输出,其中所述第一位宽小于第二位宽;以及,格雷编码器,连接于数据保留站与所述处理单元阵列之间,将原始图像数据转换成格雷码编码的图像数据。...

【技术特征摘要】

【专利技术属性】
技术研发人员:冯一名孟路董亮
申请(专利权)人:马磊
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利