- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
cpugpu异构多核虚拟执行环境框架的设计与实现word格式论文
CPU/GPU异构多核虚拟执行环境框架的设计与实现摘要近几年来,拥有着强大并行处理能力的GPU(Graphic Process Unit)得到 了飞速的发展,从而也使得CPU/GPU的架构越来越流行。 目前除了使用显式的 编程方法比如NVIDIA提供的CUDA(Compute Unified Device Architecture)以 及AMD的Stream SDK外,我们并无其它方式来挖掘GPU的并行处理能力。然而在使用显式编程的过程中我们也会碰到重写源代码的耗时问题跟二 进制不兼容性问题。 一方面,当前有着很多的计算型密集型程序是采用C、 C++或其它高级编程语言编写,而这些应用如果想要使用GPU的并行处理能力 来缩短程序的执行时间,那么采用显式编程的方式来修改或是重写整个源代码 是不可避免的,而更为糟糕的是有些时候我们根本拿不到程序的源代码;另一 方面,即使这些应用的源代码按要求被重写后也会产生二进制不兼容性问题: 一个在显式编程环境下编译的可执行程序在不同厂商,哪怕是同一厂商的不同 型号GPU上将无法或无法正常运行。为了解决重写源代码的耗时跟二进制不兼容性问题,本文的研究目的是通 过扩展自主研发的多源多目标的动态二进制翻译系统Crossbit来提供一种虚拟 执行环境,既能有效地解决重写源代码的问题,亦能自动地使用GPU的强大并 行处理能力,最终使得部分的计算密集型应用获得5-8倍的性能提升。 其原理 是通过静态与动态的二进制分析技术从二进制文件中提取潜在的可并行代码, 然后通过多面体模型分析将那些没有数据依赖的可并行代码并将其放到GPU上 加速,最终将执行结果拷贝到主存的相应位置,而那些不可以放到GPU上执行 的部分则采用正常的动态二进制翻译执行。 由于计算密集型应用的大部分时间 用于计算,因而GPU的加速性能使得这些应用的整体性能得到了很大的提升。本文的主要创新点和意义在于:1)提出一种适合于计算密集型应用的虚 拟执行环境,有效地屏蔽了使用显式编程去重写源代码来使用GPU的问题;2) 利用二进制分析技术与多面体模型提取二进制可执行程序中的可并行部分,为 之后的GPU加载并执行这些可并行部分提供了准确的定位;3)通过挖掘GPU— i —上海交通大学硕士学位论文CPU/GPU异构多核虚拟执行环境框架的设计与实现的强大并行处理能力,有效地提高了计算型密集型应用的性能。关键词: 虚拟执行环境,多面体模型,二进制翻译ii —The Design and Implementation of Virtual Execution Environment Framework for GPU/CPU Heterogeneous Multi-coreABSTRACTIn recent years, the rapid development of GPU causes CPU/GPU architecture to become increasingly popular because of GPU’s powerful parallel processing capabil- ity. However, we have no other methods of using that capability of GPU except for CUDA and Stream SDK provided by NVIDIA and AMD respectively, which are all based on explicit programming.There are several constraints for explicit programming: the cost of rewriting the source code as well as binary incompatibility. On one hand, as there are so many computation-intensive programs that are written by advanced programming language such as C, C++, if we want to execute these applications using GPU’s powerful parallel capability to shorten the executing time, rewriting the source code is inevitable and the worse situation is that sometimes we cannot get the source code. On the other hand, e
您可能关注的文档
- buyandsell模式下vs公司的采购策略研究word格式论文.docx
- burkholderia thailandensis e264生产抗癌药物thailandepsina的分析word格式论文.docx
- bv国际检验集团合规管理分析word格式论文.docx
- bwdsp100编译器的研制及优化技术分析word格式论文.docx
- bx公司员工激励问题分析word格式论文.docx
- by公司pc工厂停车安全检修项目管理分析word格式论文.docx
- by公司的运营流程优化分析word格式论文.docx
- bs模式的住房公积金综合信息系统设计与实现word格式论文.docx
- bz化学振荡反应及其在苯胺类物质检测中的应用word格式论文.docx
- bz化学振荡反应在研究检测中的应用word格式论文.docx
- 市残联领导在市委巡察组巡察涉残领域工作动员会议上的表态发言.docx
- 市旅游发展集团关于“党的领导融入公司治理不够有效”专项整治回头看总结报告.docx
- 党课:永葆自我革命精神在正风肃纪中砥砺前行.docx
- 在2025年区委巡察组巡察区教育局党委工作动员会上的表态发言.docx
- 镇党委“三色先锋·旱码头引擎”党建品牌创建工作情况报告.docx
- 村党总支2025年上半年党建引领基层治理工作总结.docx
- 在县委新兴领域党建工作推进会上的讲话.docx
- 2025年村委换届选举大会工作方案.docx
- 党课:站稳政治立场,恪守纪律底线,争做对党忠诚、行有所止的青年干部.docx
- 在2025年公司半年纪检工作座谈会暨“三化”建设年行动推进会上的讲话.docx
文档评论(0)