System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于GPU的车载毫米波雷达并行信号处理方法技术_技高网

一种基于GPU的车载毫米波雷达并行信号处理方法技术

技术编号:42073106 阅读:4 留言:0更新日期:2024-07-19 16:53
本发明专利技术公开了一种基于GPU的车载毫米波雷达并行信号处理方法。该方法基于CUDA编程模型设计了一套并行算法,用于处理毫米波雷达的差频信号。通过CPU获取车载毫米波雷达的原始ADC数据并动态分配GPU的内存,将ADC数据拷贝至GPU内存中,编写GPU的核函数实现雷达信号处理,具体包括:数据预处理、2D‑FFT、非相干累加、恒虚警检测、解速度模糊、角度估计,这些模块的并行实现。该并行化设计极大提高雷达信号处理的计算效率,提升车载毫米波雷达的实时性。

【技术实现步骤摘要】

本专利技术属于雷达信号处理,具体为一种基于gpu的车载毫米波雷达并行信号处理方法。


技术介绍

1、随着自动驾驶相关技术的发展,毫米波雷达作为一个全天候的传感器,其具有体积小和高分辨率的特点,可以为车辆提供了准确的感知和决策支持,因此,毫米波雷达在自动驾驶领域发挥着越来越重要的作用。目前毫米波雷达大多采用mimo技术,来构建更大孔径的虚拟阵列,以提高雷达的角度分辨率。但是与此同时,更多的虚拟通道也带来了更大规模的数据量和运算量,因此传统的基于cpu的信号处理方式很难满足车载毫米波雷达对实时性的要求。

2、2006年,nvidia基于其gpu芯片发布了cuda编程模型,基于该编程模型和gpu强大的浮点运算能力,使得gpu已经不止应用于图形处理方面,而是在各种适用于其高性能计算逻辑的地方都发挥着相当巨大的作用,也可以利用gpu来高效解决复杂的计算难题。


技术实现思路

1、针对以上问题,本专利技术提出了一种基于gpu的车载毫米波雷达并行信号处理方法,基于cuda编程模型设计了一套并行算法,用于处理毫米波雷达的差频信号。本专利技术提到的毫米波雷达采用的是线性调频连续波体制。

2、实现本专利技术目的的技术方案为:

3、一种基于gpu的车载毫米波雷达并行信号处理方法,通过cpu获取车载毫米波雷达的原始adc数据并动态分配gpu的内存,将adc数据拷贝至gpu内存中,编写gpu的核函数实现雷达信号处理,具体包括以下步骤:

4、步骤1:数据预处理,将雷达的adc数据按照距离维×多普勒维×通道维的顺序重新排列,其中距离维为512个,多普勒维为64个,通道维为192个。

5、步骤2:2d-fft,包括设计gpu核函数对数据矩阵进行加窗,对加窗后的数据利用cufft库函数进行fft计算。

6、步骤3:非相干累加,设计gpu核函数将得到的192个通道的2d-fft数据进行求模计算功率和反三角函数计算相位,再将各个通道的距离-多普勒矩阵的对应单元进行累加得到距离-多普勒图像(range doppler map,rd map)。

7、步骤4:恒虚警检测(constant false alarm rate,cfar),设计gpu核函数对rdmap上的每一个距离维进行最小选择恒虚警检测器(so-cfar),得到目标的距离单元和速度单元信息。

8、步骤5:解速度模糊,设计两个核函数进行解速度模糊,包括求取cfar目标的相位差均值和求取不同多普勒模糊数q对应的aq,选择输出aq取得最小值时所对应的q进行解速度模糊。

9、步骤6:角度估计,采用数字波束形成对目标的输出相位进行加权,对整个空间域进行波束扫描求解出目标角度信息。

10、本专利技术与现有技术相比,其显著优点为:本专利技术基于gpu的cuda编程模型对雷达信号处理的各个模块进行并行算法设计和实现,与传统的cpu处理相比,提升了整体处理的效率,提升了毫米波雷达的实时性。

11、下面结合附图对本专利技术做进一步详细的描述。

本文档来自技高网...

【技术保护点】

1.一种基于GPU的车载毫米波雷达并行信号处理方法,其特征在于,通过CPU获取车载毫米波雷达的原始ADC数据并动态分配GPU的内存,将ADC数据拷贝至GPU内存中,编写GPU的核函数实现雷达信号处理,具体包括:

2.根据权利要求1所述的基于GPU的车载毫米波雷达并行信号处理方法,其特征在于,步骤2中实现的FFT运算采用由Nvidia提供的cufft库中的FFT加速算法库,通过cufftPlan1d函数设置FFT的计算参数,通过cufftExecC2C函数进行FFT计算,具体步骤为:

3.根据权利要求1所述的基于GPU的车载毫米波雷达并行信号处理方法,其特征在于,步骤3中本步骤中设计的非相干累加的GPU核函数实现方法为,设置线程块数量为通道数(192),每个线程块包含的线程数为距离维度数×多普勒维度数(512×64),每个线程内部求取复数的模值及相位。求取完所有通道的功率值后,采用交错配对的并行归约方法来实现对192个通道的功率累加。

4.根据权利要求1所述的基于GPU的车载毫米波雷达并行信号处理方法,其特征在于,步骤4中设计GPU核函数进行SO-CFAR的实现方法为,将RD MAP矩阵划分为512个1×64的矩阵,每个CUDA线程处理一个1×64的矩阵,设计核函数包含1个线程块,每个线程块中包含512个线程对应512个矩阵。在每个线程中采用滑动窗口的思路,可极大地简化了计算量并提高了运行效率。

5.根据权利要求1所述的基于GPU的车载毫米波雷达并行信号处理方法,其特征在于,步骤5中利用GPU对解速度模糊算法进行并行加速的实现方法为,设计核函数计算出每个CFAR目标对应相位差的均值φ,令其线程块数量等于总的CFAR目标数,每个线程块中包含16个线程用于计算16个通道的相位差值,并对相位差值进行解缠绕后,再求取相位差的均值φ。接下来设计核函数根据相位差的均值φ求解模糊数,令线程块数量等于总的CFAR目标数,每个线程块中包含Nq个线程用于计算不同多普勒模糊数q对应的Aq,比较不同q对应的Aq的大小,输出Aq取得最小值时所对应的q即为模糊数。

6.根据权利要求1所述的基于GPU的车载毫米波雷达并行信号处理方法,其特征在于,步骤6中数字波束形成算法所需的矩阵相乘使用CUDA标准库cuBLAS库中的单精度矩阵乘cublasSgemm函数接口进行并行加速计算。

...

【技术特征摘要】

1.一种基于gpu的车载毫米波雷达并行信号处理方法,其特征在于,通过cpu获取车载毫米波雷达的原始adc数据并动态分配gpu的内存,将adc数据拷贝至gpu内存中,编写gpu的核函数实现雷达信号处理,具体包括:

2.根据权利要求1所述的基于gpu的车载毫米波雷达并行信号处理方法,其特征在于,步骤2中实现的fft运算采用由nvidia提供的cufft库中的fft加速算法库,通过cufftplan1d函数设置fft的计算参数,通过cufftexecc2c函数进行fft计算,具体步骤为:

3.根据权利要求1所述的基于gpu的车载毫米波雷达并行信号处理方法,其特征在于,步骤3中本步骤中设计的非相干累加的gpu核函数实现方法为,设置线程块数量为通道数(192),每个线程块包含的线程数为距离维度数×多普勒维度数(512×64),每个线程内部求取复数的模值及相位。求取完所有通道的功率值后,采用交错配对的并行归约方法来实现对192个通道的功率累加。

4.根据权利要求1所述的基于gpu的车载毫米波雷达并行信号处理方法,其特征在于,步骤4中设计gpu核函数进行so-cfar的实现方法为,将...

【专利技术属性】
技术研发人员:李军彭树生王磊李梦生张扬扬
申请(专利权)人:安徽台创智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1