- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HRT5200加速多普勒雷达仿真模型结果比较,多普勒雷达,脉冲多普勒雷达,多普勒天气雷达,多普勒雷达原理,多普勒气象雷达,多普勒雷达图,多普勒雷达传感器,新一代多普勒天气雷达,多普勒雷达测速
HRT5200加速多普勒雷达仿真模型结果比较
1 使用5100
所有模型运行时间设定位0.129秒停止。
使用硬件矩阵库
Ts = 4.096e6
运行到0.128秒时打印数据
t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984
t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984
t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984
实际运行时间
13.117s
12.917s
12.917s
平均=12.9836s
使用CPU解算FFT
Ts = 4e6
运行到0.128秒时打印数据
output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250
output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250
实际运行时间
13.850s
13.867s
13.867s
平均=13.8613
快 0.877s
快了 6.32%
2使用MV5500
2.1使用硬件矩阵库
Ts = 4e6
运行到0.128秒时打印数据
t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984
t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984
t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984
实际运行时间
7.600s
7.600s
7.583s
平均=7.5943
2.2使用CPU解算FFT
运行到0.128秒时打印数据
output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250
output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250
output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250
实际运行时间
10.867s
10.900s
10.883s
平均 10.883
快 3.2881
比CPU解算快了 30.21%
使用多CPU实现高速解算
把一个模型拆分成可以并行运算的多个模型,可以大大加速模型的运算解算速度。而相关联的工作却不多。对于多个CPU之间的模型,和单个CPU是一样的,都是由上一步的模块运算出结果给下一个模块作为输入。以下面模型为例:
单CPU运算时,CPU必须按顺序解算完成ABCD四个模块,才能得到最终结果。如果把模块C放到第二块CPU板上。CPU1只需计算AB的输出,CPU2计算C的输出,然后CPU1计算D的输出就可得到结果。这样CPU1就只运行了3个模块,节省了模块C的运行时间。详细说明如下:
CPU之间是同步触发的。也就是说模块A计算出数据后分发给模块B和CPU2上的模块C,然后在下一个步长时间,两块CPU同时解算B和C。在这个步长完成前,B和C得到结果发送给模块D。
CPU之间的通讯由底层函数通过高速背板硬件实现。用户无需关心实现的编程代码。只需在模块中加入通讯的模块,就可实现数据的交换,如下图所示:
下面的是通讯模块,上面的是延时模块延迟一个步长。来保证与原模型的数据流时序一致。
底层由VXMP实现通过高速背板实现40M或者80M每秒的速度进行CPU板间内存交换数据。
当并行的模块比较多时,采用多CPU将更加加快运算时间。
如上图就可以实现4个CPU的并行。
结论
在matlab平台上用M语言写的模型,运行时间大概是20分钟,改写成C的sfunction 后运行时间加快到5分钟。当生成实时代码在仿真机上运行时间加快到10秒级别。而且这时运行的模型是只运行了一个步长的矩阵运算(fft,转置等,相当于整个循环的1%),如果相关矩阵和向量运算量更多,将会比原matlab运算速度更快。
原模型的开始是一维矩阵,如果使用一维向量来代替进行硬件的数学运算,还将进一步提高速度。
所以使用硬件向量和矩阵运算,将大大提高包含此种运算的仿真过程。
C
D
B
A
C
D
B
A
A(CPU1)
FFT1(CPU1)
FFT2(CPU2)
FFT3(CPU3)
FFT4(CPU4)
B(CPU1)
文档评论(0)