机群系统OpenMP研究-计算机系统结构专业论文.docx

机群系统OpenMP研究-计算机系统结构专业论文.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要由于性能价格比高和可扩展好等特点,基于COTS技术的机群系统逐渐成为并行计 摘要 由于性能价格比高和可扩展好等特点,基于COTS技术的机群系统逐渐成为并行计 算的主流平台。目前消息传递编程是机群系统上主流的编程模型,而在机群系统上寻求 共享存储编程乃至支持自动并行一直是并行计算的研究热点。OpenMP是共享存储体系 结构的并行编程标准,易于编程且支持增量并行,因此研究在机群系统上支持OpenMP 的共享存储计算环境非常有意义。可扩展性和可编程性是用来衡量并行系统处理能力的 两个重要指标。这种并行计算环境结合了OpenMe语言的可编程性,以及机群系统的可 扩展性,将极大地推动并行应用的开发和普及。 本文采用编译时和软件DSM运行时相结合的技术路线实现机群OpenMP。其中软 件DSM系统在机群的消息传递硬件上提供共享虚拟存储抽象,而编译器实现opeliMP 语言到该编程抽象的翻译及优化。本文实现了一个机群OpenMP系统原型 OpenMP/JLAJIA,具体组件包括一个源对源的编译器前端(OMP2YlA)和一个支持 fork-join执行模式的OMP JnJn运行库后端。在透明支持OpenMl,并行应用方面,本 文的OpenMP/JIAJIA计算环境使得机群系统像硬件ec-NUMA结构的机器一样易用。 本文着重研究了如何提高机群Openl3,位系统的性能,分别从数据分布、循环调度和 系统优化三个方面提出了增强性能的方法。or,enMP标准所针对的UMA体系结构与类 Ⅻ乃咀A的机群体系结构存在着本质差异。例如,机群系统的内存层次结构以及互连的商 品网络使得数据的本地访问和远程访问速度相差很大,所以数据分布模式和进程访问模 式是否匹配直接决定了OpenMO应用的性能。本文以语言扩展的形式,提出了适合机群 体系结构特点的数据分布策略、静态和动态循环调度算法,能方便有效地实现拥有者计 算。另外,本文从程序员、编译器和运行库三个环节上阐述了提高系统性能的途径,尤 其是针对后端运行库做了许多优化工作,例如扩展OpenMP语言支持Y/AJ/A的写向量 协议、Home迁移和数据预取,结合消息传递机制优化reduction归约操作等。 对机群OpenMP系统进行客观评价需要~个覆盖面较广的测试程序集。本文收集了 十二二个应用程序,分别来自不同基准程序集,例如NAS、SPLASH2和SPEC等。该程 序集包括用来测试制导开销的微程序,支持矩阵和偏微分方程等数值计算的核心算法程 序,以及带有输入/输出、解决特定问题的应用级程序等。从程序的访存行为和通信模式 看,这些程序包括规则和非规则应用、内存密集型和通信密集型应用等。 本文从两个方面分析评价了机群OpenlvⅡ)系统的实现。一方面比较了该计算环境和 一个支持OpenMP的硬件cc—NUMA系统(SGI 2100服务器)的性能;另一方面比较了 Open姗和MPI两种编程模型在机群系统上的性能。测试结果表明,本文的 OpenMP/JIAJLa原型系统在八个结点的PC机群平台上获得了与SGl2100服务器相当的 性能;在共享存储和消息传递的比较中,获得了MPI 82%的性能。本文的机群OpenMP T 机群系统Oper,MP研究: 机群系统Oper,MP研究: 摘要 系统能有效地支持很大范围的应用程序。 关键词:机群系统:OpenMP;软件分布式共享存储;数据分布;循环调度算法;JIAJIA Ⅱ Research Research on OpenMP towards Cluster Systems Wu Shaogang(Computer Architecture) Directed By Hu Weiwu Clusters of workstations or PCs utilizing commercial off-the-shelf components have emerged as a cost—effective and scalable alternative to hi曲-end compute platforms.They are effectively used for scientific and engineering applications and are rapidly becoming mainstream.Traditionally,a message-passing programming model is matched to cluster architecture.But a shared—space prograrnnfing model for clustered systems,even automatic parallelization

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档