- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
cache copyonwrite:tls猜测数据管理机制的研究word格式论文
目录摘要iABSTRACTiii第一章绪论11.1研究背景与意义11.1.1多核/众核处理器发展趋势11.1.2多核多线程并行编程模型的发展31.1.3TLS编程模型的研究现状51.2本文主要工作91.2.1猜测变量的生命周期9Cache Copy-on-Write机制10基于Enhanced Local Memory 的实现方式101.3本文的组织结构11第二章TLS猜测数据管理机制122.1猜测数据生命周期122.1.1猜测数据产生阶段122.1.2猜测数据使用阶段142.1.3猜测数据确认阶段162.2现有技术的分类和比较182.2.1设计空间182.2.2设计空间探索方法192.3 多核/众核平台下TLS面临的挑战212.4本章小结21第三章Cache Copy-on-Write23基于Cache Copy-on-Write的TLS框架23Cache Copy-on-Write的基本思想23基于Cache Copy-on-Write 的TLS系统执行框架243.2猜测数据的管理253.2.1创建253.2.2访问263.2.3提交293.3本章小结30第I 页第四章实现与性能分析314.1实现314.3性能测试与分析414.3.1实验环境414.3.2测试程序集414.3.3实验结果及分析434.4本章小结46第五章结束语485.1工作总结485.2工作展望49致谢50参考文献52作者在学期间取得的学术成果56第II 页表目录表2.1 各阶段的技术要求及实现方法汇总17表4.1模拟器的多核处理器结构41表4.2 Cache Level的硬件结构42表4.3实验中使用的测试程序集43表4.4 程序模拟执行时间(ms)44表4.5 Pi 程序不同优化的情况下程序执行时间(ms)44图目录图1.1共享一级缓存的片上多核处理器结构2图1.2 MPI 基本编程框架4图1.3 OpenMP 并行编程框架5图1.4 Hydra 处理器结构7图1.5 CorD对串行程序并行化机制8图1.6 BOP的并行编程模型9图2.1共享变量在多线程中的问题以及解决方案13图2.2利用硬件方法实现猜测数据的管理14图2.3 CorD的存储空间管理15图2.4 操作系统中Copy-on-Write机制16图2.5 相邻两次迭代之间产生RAW相关16图2.6 根据猜测数据生命周期划分的TLS系统设计空间19图3.1 Cache Copy-on-Write 管理机制的执行流程25图3.2 Cache Copy-on-Write 机制Load 指令执行策略26图3.3显式通信消息处理过程27图3.4共享变量表的结构28图3.5隐式通信的执行流程29图3.6共享变量表数据相关冲突示例29图4.1 带有Enhanced Local Memory 的存储层次结构32图4.2 采用Enhanced Local Memory 的TLS系统硬件结构35图4.3 SESC 功能模拟中类的依赖关系36图4.4程序示例37图4.5 SESC-ELM 程序并行化实例40图4.6 采用线程间通信所获得的性能加速比45图4.7 Cache Copy-on-Write 机制的可扩展性测试结果46摘要随着芯片集成度的不断提高,越来越多的处理器核被集成到单个芯片上,出现了多核和众核处理器。与多核和众核体系结构快速发展所不同的是,并行程序设计却没有实现跨越式发展。传统的并行编程模型——数据并行编程模型、消息传递编程模型、共享内存编程模型,虽然从一定程度上简化程序员程序并行化的工作,但是它们对于一些粗粒度并行缺乏一定的支持,而且它们都不支持线程的猜测执行,这也造成了巨大的计算资源浪费。在以猜测的方式挖掘应用中的粗粒度并行方面,TLS(Thread-Level Speculation线程级猜测执行)就是其中的典型代表。它的最大优点是编程模型非常简洁—— 程序员只需标识出那些可以猜测执行的代码段即可,运行时系统或硬件负责确保猜测线程之间的数据相关不被破坏。但是由于其自身系统开销过高等原因,导致TLS机制的应用并不广泛。本文提出并实现一种编程模型简单、系统开销低的TLS系统猜测数据管理机制,它不仅能够在不降低处理器核主频的情况下,实现高效的猜测数据管理,而且在一定程度上解决了猜测线程间共享数据相关的问题。本文的研究工作和成果有:1、提出猜测变量生命周期的概念猜测变量生命周期包括猜测变量的产生、使用和提交三个阶段,按照猜测变量的生命周期,本文提出了一种新的TLS技术分类方法,并比较了各种已有TLS实现方法的优缺点;根据猜测变量的生命周期,归纳了支持TLS的多核平台的设计空间,提出了探索该设计空间的若干方法;最后,指出了TLS技术当前面临的挑战和未来发展趋势。2、提出基于猜测数据
您可能关注的文档
- binol骨架的手性吡哆醛催化的酮酸不对称转氨化反应的分析word格式论文.docx
- bioz.com无创血流动力学监测系统对mhd患者实时调整超滤率的价值研究word格式论文.docx
- birads病理学基础及其诊断效能的研究word格式论文.docx
- birnbaumsaunders疲劳寿命分布的统计研究word格式论文.docx
- bim技术及其在建筑设计中的应用分析word格式论文.docx
- bis监测下七氟醚在老年患者麻醉中mac及mac awake分析word格式论文.docx
- bisⅷ对移植心脏 il6il10il12和bax表达的影响word格式论文.docx
- bisco3审审pbtio3系高温压电陶瓷的制备和性能调控word格式论文.docx
- bits争端解决机制分析word格式论文.docx
- bittorrent的种子覆盖网技术分析word格式论文.docx
- cac设计院内部会计控制分析word格式论文.docx
- ca04sr06bi4ti4o15粉体的制备及粉末溶胶法制备ca04sr06bi4ti4o15铁电厚膜word格式论文.docx
- cadcae公共服务平台的分析与应用实现word格式论文.docx
- cadcae技术应用公共服务平台构建研究word格式论文.docx
- cadcae技术应用公共服务平台构建分析word格式论文.docx
- cadcaecam技术在家用冰箱压缩机研发中的应用分析word格式论文.docx
- cadcae公共服务平台的研究与应用实现word格式论文.docx
- cadcam技术在逆向工程中的应用研究word格式论文.docx
- cadcae技术在液晶显示器底座的模具设计中的应用word格式论文.docx
- cadcam技术制作树脂 玻璃陶瓷和纯钛三种嵌体微渗漏的实验研究word格式论文.docx
文档评论(0)