- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
嵌入式系统实验教学课程
实时系统分析与设计实验 实验用书 《多核程序设计》,浙江大学、复旦大学、清华大学、北京大学、上海交通大学编写,清华大学出版社,2007年9月第1版 1、在Visual Studio.NET之后安装Intel C++编译器试用版 实验一、原始编译 (1)用微软C++编译器编译 将光盘内的code文件夹整个复制到硬盘,如E盘根目录,在上面的命令行界面输入如下命令跳转到RayTrace2目录: cd E: \code\CompilerSwitches\raytrace2\source\RayTrace2\ 然后清理以前生成的文件: nmake /f raytrace2.mak clean 编译文件: nmake /f raytrace2.mak CPP=cl.exe 运行渲染图像程序: raytrace2 320 240 Press ‘g ’ to begin the render Press ‘q ’ to quit the application 将屏幕上显示的运行时间记录下来 ________。 (2)用英特尔C++编译器编译 先清理以前生成的文件: nmake /f raytrace2.mak clean 编译文件: nmake /f raytrace2.mak 运行渲染图像程序: raytrace2 320 240 Press ‘g ’ to begin the render Press ‘q ’ to quit the application 将屏幕上显示的运行时间记录下来 ________。 实验二 高阶优化,参数(-O3) 将屏幕上显示的运行时间记录下来——; 实验三 矢量化优化,参数(-Qxp) 将屏幕上显示的运行时间记录下来——; 实验四 综合优化,参数(-O3、-Qxp、IPO、PGO) 将屏幕上显示的运行时间记录下来——。 实验二: Intel VTune 工具 实验一寻找热点区域 基于时钟事件取样收集gzip.exe的数据,并识别最耗时间的函数。 问题: gzip.exe中哪个函数消耗了最多的时间? gzip.exe中哪个函数CPI最高? gzip.exe源代码中哪一行时钟周期最多? gzip.exe是多线程程序吗? 实验二 采样 问题: (1)观察每个不同进程运行状态,单击Thread\Module按键。 (2)选择某段时间并放大 (3)查看这段时间区域的常规取样视图 实验三 调用曲线图 问题: 哪个函数消耗的时间最多,它被哪些函数调用过? 实验四 使用Windows命令行 问题: (1)查看gzip的分析数据 (2)封装数据并在图形界面中查看图形界面显示样本分析数据。 实验三: MKL 本实验通过分别用原始运算、DDOT、DGEMV、DGEMM编译和运行一个矩阵乘法程序,演示了原始计算、一级BLAS、二级BLAS、三级BLAS的性能特征和它们之间的差异。 实验步骤: 定位到文件夹code\ MKL_Overview\DGEMM,打开文件mkl_lab_solution.c,仔细查看4段不同方法实现同一矩阵乘法的代码; 检查文件Makefile中的include和library路径,修改为与本机一致; 打开开始菜单-所有程序-Intel(R) Software Development Tools-Intel(R) C++ Compiler 9.0-Build Environment for IA-32 Applications,输入:nmake,编译完成后目录下会生成一个matrix.exe文件,输入:matrix.exe运行程序,会提示输入矩阵的维数(输入的数字尽量大些,如1000),记录运行结果并观察它们的差异: roll_your_own: ___________ DDOT: __________ DGEMV: ___________ DGEMM: ___________ MKL默认使用单线程,可以通过改变环境变量OMP_NUM_THREADS来自定义MKL使用的线程数量,输入:set OMP_NUM_THREADS=2,重新运行程序观察结果; 改变不同线程数量,记录各自的运行结果。 问题:当自定义的线程数量超过处理器核的数量时,会发生什么现象? 实验四: OpenMP线程编程 实验一Hello worlds 并行编程实验; 实验二用OpenMP编写用积分方
有哪些信誉好的足球投注网站
文档评论(0)