cuda平台上序列比对并行软件优化word格式论文.docxVIP

cuda平台上序列比对并行软件优化word格式论文.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
cuda平台上序列比对并行软件优化word格式论文

图目录图1.1Smi th-Waterman算法执行过程3图1.2划分原理4图1.3线程负载是否均衡造成执行时间不同6图2.1CUDA编程模型和线程结构9图2.2GT200存储系统11图2.3 GT200架构12图2.4GPU线程访问GPU中多级存储器的方式13图2.5 SM结构14图2.6 CPU和GPU不同的执行方式16图2.7流的同步和异步执行17图3.1两个并行域19图3.2一种用OpenMP实现Smith-Waterman算法的新思路21图3.3block的映射和kernel的执行方式22图3.4每个block内部线程的映射方式22图3.5block之间的并行和block内部线程间的并行23图3.6 block_size为5时线程调度情况24图3.7每个线程执行GSW的计算和访存过程26图4.1GSW和OptimizedGSW流程图对比30图4.2OptimizedGSW计算和访存方式31图4.3CPU和GPU负载平衡情况与执行时间的关系34图4.4两种并行方式36图4.5两个线程实现的细粒度并行36图4.6两种线程组织方式38图5.1 串行程序归一化后三种CUDA版本和串行程序性能比较41图5.2 三种CUDA版本性能比较42图5.3G_OptimizedGSW_4、G_Opti mizedGSW_8、G_GSW性能提升情况46图5.4G_OptimizedGSW_4、G_OptimizedGSW_8、G_GSW和串行程序性能比较46图5.5CG_Opti mi zedGSW_4和CG_OptimizedGSW_8性能加速比48图5.6CG_OptimizedGSW_4和CG_OptimizedGSW_8耗时情况49图5.7G_OptimizedGSW_4和G_OptimizedGSW_8粗细粒度并行开发前后比较51图5.8 grid维度为256时Optimized GSW_4和F_GSW_4比较53图5.9数据库有序时F_GSW_4和OptimizedGSW_4比较53表目录表3.1Smith-Waterman算法的OpenMP实现和串行版本用时比较20表3.2Smith-Waterman算法的CUDA实现和串行版本用时比较23表3.3blocksize为64时的GSW程序和串行程序的比较27表5.1GSW 和OptimizedGSW显存占用情况41表5.2numThreads为64时OptimizedGSW_8和串行程序使用的时钟周期数比较43表5.3numThreads为64时G_OptimizedGSW_8和串行程序使用的时钟周期数比较.47中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:签字日期:中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。必威体育官网网址的学位论文在解密后也遵守此规定。□公开□必威体育官网网址(年)作者签名:导师签名:签字日期:签字日期:第1章绪论1.1研究背景多核处理器已经成为未来很长一段时间的发展趋势,那么并行编程也将成为一种主流。高性能应用的出现推动高性能计算技术的革新和计算机体系结构的发展。程序员不仅需要思考计算密集型、数据密集型和通信密集型等更多特征的应用在现有平台上的优化方案,还需要思考各平台的局限性,从而可以为更多应用找到更好的优化方法和映射平台,也为体系结构设计提供参考。1.1.1流应用和流体系结构研究人员从多个领域中抽象出一类流应用,并且此类应用正成为微处理器上的主要形式。流应用的特征为:(1)计算密集:较高的计算访存比,即每次从内存取出的数据都要进行大量的算术计算。(2)并行性:流应用主要以数据级并行为主。(3)局域性:局域性分为数据重用局域性和生产者-消费者局域性。数据重用局域性指计算单元重复使用某一数据。生产者-消费者局域性指在计算流水线中,一段核心程序写的数据被另一段核心程序读取,且不会出现环路。流应用控制流简单,数据并行度高,因此流体系结构不需要过多管理cache、分支预测、乱序执行、指令调度等复杂控制逻辑,但是要有大量本地寄存器,许多可大规模并行化的,简单快速的计算单元,简单的指令发射逻辑,高效的互连以及巨大的后备存储。NVIDIAGPU是一种成功商业化的流体系结构,C

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档