HRT5200加速多普勒雷达仿真模型结果比较.docVIP

下载本文档

5
0
约1.92千字
约 4页
2015-09-13 发布于重庆
举报
版权申诉

HRT5200加速多普勒雷达仿真模型结果比较.doc

1、本文档共4页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

HRT5200加速多普勒雷达仿真模型结果比较,多普勒雷达,脉冲多普勒雷达,多普勒天气雷达,多普勒雷达原理,多普勒气象雷达,多普勒雷达图,多普勒雷达传感器,新一代多普勒天气雷达,多普勒雷达测速

HRT5200加速多普勒雷达仿真模型结果比较 1 使用5100 所有模型运行时间设定位0.129秒停止。使用硬件矩阵库 Ts = 4.096e6 运行到0.128秒时打印数据 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 实际运行时间 13.117s 12.917s 12.917s 平均=12.9836s 使用CPU解算FFT Ts = 4e6 运行到0.128秒时打印数据 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 实际运行时间 13.850s 13.867s 13.867s 平均=13.8613 快 0.877s 快了 6.32％ 2使用MV5500 2.1使用硬件矩阵库 Ts = 4e6 运行到0.128秒时打印数据 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 t=0.128000,output=276.061951,k1_q = 398.437469,k2_q*1000=0.019984 实际运行时间 7.600s 7.600s 7.583s 平均＝7.5943 2.2使用CPU解算FFT 运行到0.128秒时打印数据 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 output= 0,ck1_q= 398.437500,ck2_q*1000= 0.020250 实际运行时间 10.867s 10.900s 10.883s 平均 10.883 快 3.2881 比CPU解算快了 30.21％使用多CPU实现高速解算把一个模型拆分成可以并行运算的多个模型，可以大大加速模型的运算解算速度。而相关联的工作却不多。对于多个CPU之间的模型，和单个CPU是一样的，都是由上一步的模块运算出结果给下一个模块作为输入。以下面模型为例：单CPU运算时，CPU必须按顺序解算完成ABCD四个模块，才能得到最终结果。如果把模块C放到第二块CPU板上。CPU1只需计算AB的输出，CPU2计算C的输出，然后CPU1计算D的输出就可得到结果。这样CPU1就只运行了3个模块，节省了模块C的运行时间。详细说明如下： CPU之间是同步触发的。也就是说模块A计算出数据后分发给模块B和CPU2上的模块C，然后在下一个步长时间，两块CPU同时解算B和C。在这个步长完成前，B和C得到结果发送给模块D。 CPU之间的通讯由底层函数通过高速背板硬件实现。用户无需关心实现的编程代码。只需在模块中加入通讯的模块，就可实现数据的交换，如下图所示：下面的是通讯模块，上面的是延时模块延迟一个步长。来保证与原模型的数据流时序一致。底层由VXMP实现通过高速背板实现40M或者80M每秒的速度进行CPU板间内存交换数据。当并行的模块比较多时，采用多CPU将更加加快运算时间。如上图就可以实现4个CPU的并行。结论在matlab平台上用M语言写的模型，运行时间大概是20分钟，改写成C的sfunction 后运行时间加快到5分钟。当生成实时代码在仿真机上运行时间加快到10秒级别。而且这时运行的模型是只运行了一个步长的矩阵运算（fft，转置等，相当于整个循环的1％）,如果相关矩阵和向量运算量更多，将会比原matlab运算速度更快。原模型的开始是一维矩阵，如果使用一维向量来代替进行硬件的数学运算，还将进一步提高速度。所以使用硬件向量和矩阵运算，将大大提高包含此种运算的仿真过程。 C D B A C D B A A（CPU1） FFT1（CPU1） FFT2（CPU2） FFT3（CPU3） FFT4（CPU4） B（CPU1）