HRT5200加速多普勒雷达仿真模型结果比较.docVIP

HRT5200加速多普勒雷达仿真模型结果比较.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HRT5200加速多普勒雷达仿真模型结果比较,多普勒雷达,脉冲多普勒雷达,多普勒天气雷达,多普勒雷达原理,多普勒气象雷达,多普勒雷达图,多普勒雷达传感器,新一代多普勒天气雷达,多普勒雷达测速

HRT5200加速多普勒雷达仿真模型结果比较 1 使用5100 所有模型运行时间设定位0.129秒停止。 使用硬件矩阵库 Ts = 4.096e6 运行到0.128秒时打印数据 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 实际运行时间 13.117s 12.917s 12.917s 平均=12.9836s 使用CPU解算FFT Ts = 4e6 运行到0.128秒时打印数据 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 实际运行时间 13.850s 13.867s 13.867s 平均=13.8613 快 0.877s 快了 6.32% 2使用MV5500 2.1使用硬件矩阵库 Ts = 4e6 运行到0.128秒时打印数据 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 实际运行时间 7.600s 7.600s 7.583s 平均=7.5943 2.2使用CPU解算FFT 运行到0.128秒时打印数据 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 实际运行时间 10.867s 10.900s 10.883s 平均 10.883 快 3.2881 比CPU解算快了 30.21% 使用多CPU实现高速解算 把一个模型拆分成可以并行运算的多个模型,可以大大加速模型的运算解算速度。而相关联的工作却不多。对于多个CPU之间的模型,和单个CPU是一样的,都是由上一步的模块运算出结果给下一个模块作为输入。以下面模型为例: 单CPU运算时,CPU必须按顺序解算完成ABCD四个模块,才能得到最终结果。如果把模块C放到第二块CPU板上。CPU1只需计算AB的输出,CPU2计算C的输出,然后CPU1计算D的输出就可得到结果。这样CPU1就只运行了3个模块,节省了模块C的运行时间。详细说明如下: CPU之间是同步触发的。也就是说模块A计算出数据后分发给模块B和CPU2上的模块C,然后在下一个步长时间,两块CPU同时解算B和C。在这个步长完成前,B和C得到结果发送给模块D。 CPU之间的通讯由底层函数通过高速背板硬件实现。用户无需关心实现的编程代码。只需在模块中加入通讯的模块,就可实现数据的交换,如下图所示: 下面的是通讯模块,上面的是延时模块延迟一个步长。来保证与原模型的数据流时序一致。 底层由VXMP实现通过高速背板实现40M或者80M每秒的速度进行CPU板间内存交换数据。 当并行的模块比较多时,采用多CPU将更加加快运算时间。 如上图就可以实现4个CPU的并行。 结论 在matlab平台上用M语言写的模型,运行时间大概是20分钟,改写成C的sfunction 后运行时间加快到5分钟。当生成实时代码在仿真机上运行时间加快到10秒级别。而且这时运行的模型是只运行了一个步长的矩阵运算(fft,转置等,相当于整个循环的1%),如果相关矩阵和向量运算量更多,将会比原matlab运算速度更快。 原模型的开始是一维矩阵,如果使用一维向量来代替进行硬件的数学运算,还将进一步提高速度。 所以使用硬件向量和矩阵运算,将大大提高包含此种运算的仿真过程。 C D B A C D B A A(CPU1) FFT1(CPU1) FFT2(CPU2) FFT3(CPU3) FFT4(CPU4) B(CPU1)

文档评论(0)

tianma2015 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档