- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《并行程序设计》课程实验报告 实验1:Intel多核编译器及Intel Parallel Studio XE 姓名 葛书衡 院系 软件学院 学号 1153730109 任课教师 张伟哲 指导教师 实验地点 软件学院三楼机房 实验时间 2017.4.12 实验课表现 出勤、表现得分 实验报告 得分 实验总分 操作结果得分 一、实验目的 要求:需分析本次实验的基本目的,并综述你是如何实现这些目的的? 基本目的: 1.掌握 2.掌握 3.掌握.; .; 实现:通过实验指导书、结合老师上课所讲的知识,在实验室上机实现以上目的 二、实验内容 该部分填写在实验过程中,你都完成了哪些工作。 实验1.1使用intel编译器生成优质代码 步骤一:不使用优化技术构建应用程序 步骤二:使用通用优化 步骤三:使用处理器相关的优化 步骤四:增加过程间优化 步骤五:性能测评指导的优化 步骤六:自动向量化的调优 实验1.2 Parallel Studio XE快速上手 使用Cilk Plus 2、三步骤增加并行性: 步骤1:分析串行程序 步骤2:用Cilk Plus实现并行性 步骤3:调试及错误检查 三、实验结果 不使用优化技术构建应用程序 使用通用优化 /Od /O1 /O2 /O3 /Ox 使用处理器相关的优化 不使用选项,构建和运行应用程序,增加Qvec- 到CFLAGS选项中以关闭自动向量化 使用各种/Qx选项(SSE、SSE3、SSSE3、SSE4.1、SSE4.2、及AVX) SSE SSE2 SSE3 SSE4.1 SSE4.2 使用QaxAVX选项重新构建应用程序 AVX 增加过程间优化 使用/Qipo选项来构建和运行应用程序,添加使用的平台上最高级别的自动向量化,记录运行时间SSE2、SSE3、SSSE3)性能测评指导的优化 Qipo SEE2 SEE4.2 SEE3 (1)打开PGO功能,执行intel.pgo.gen.exe程序,记录实验结果 (2)重新构建应用程序,告诉编译器需要使用刚才产生的动态信息,运行intel.pgo.exe 自动向量化的调优 (1)编译code1.2中的test.cpp程序,要求自动向量化器产生报告 (2)使用GAP (3)根据GAP建议,用命令行选项/Qno-alias-args选项来帮助编译器成功实现向量化,编译代码,要求产生报告 (4)编译运行conde1.2下的所有代码,并对比向量化与未向量化的性能 使用Cilk Plus 使用Ctrl+F5创建和运行程序 三步骤增加并行性 步骤一 分析串行程序 步骤二 用Cilk Plus实现并行性 步骤三 调试及错误检查 单击Start按钮。Inspector开始运行程序,同时执行分析 Inspector被设置成发现死锁和数据竞争,记录下实验结果: 将VERYBIG和外部循环设置好,使用release版本,运行修改好的程序 四、思考题 思考题1:Intel C++ Compiler的基本特点? 答:Intel C++ 编译器的主要特点是自动向量化器,它能够生成 SSE、SSE2 和 SSE3 的 SIMD 指令及其适用于 Intel 无线 MMX 和 MMX 2 的嵌入式变种 思考题2:如何使用Intel C++ Compiler进行应用程序优化,基本步骤包括? 答:在编译时加入优化参数,可以实现应用程序的优化。 思考题3:Intel C++ Compiler的优化性能参数主要有哪些,其优化性能体现在?(实验结果予以说明) 答:优化参数有-O3, -Qipo, -Qxp, PGO 等 思考题4:分析串行程序时,哪些代码有问题?它们产生的原因是什么? 答:见上图(步骤三 调试及错误检查)。 死锁和数据竞争(会令程序运行变慢)。 这些错误是由于多个线程并发地读写相同的数据变量引起的。 五、实验心得体会 本次实验量较大,花费了很长时间去处理,但相对来说操作很简单,基本没遇到大问题。 通过实验,我对使用intel编译器生成优质代码、Parallel Studio XE的快速上手有了更深的理解。 学习了如何使用intel和vs进行调优和检查 指导教师评语: 日期:
有哪些信誉好的足球投注网站
文档评论(0)