- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 并行计算基础 并行计算: 并行计算就是将一个大规模的计算问题分解成若干小的任务,通过运行在多个运算部件上的这些小任务的合作来求解一个规模很大的计算问题的一种方法。 强并行计算:如果一个计算由若干子计算构成,若各子计算之间不存在依赖关系,可以并行计算,那么这种计算可以称为强并行计算。 弱并行计算:如果一个计算由若干子计算构成,若各子计算之间存在依赖关系,不能并行计算,但是单个的子计算内又可以分解为若干更小粒度的子计算,且这些更小粒度的子计算是可以并行执行的,这种并行计算可以称为弱并行计算。 第二章 并行计算基础 并行计算的应用 预测模型的构造和模拟、工程设计和自动化、能源勘探、医学、军事以及基础理论研究等领域中都对计算提出了极高的要求。 并行计算三种主要的基本类型: 计算密集型应用,如大型科学工程计算与数值模拟; 数据密集型应用,如数字图书馆、数据仓库、数据挖掘和计算可视化等; 网络密集型应用,如协同工作、遥控和远程医疗诊断等。 并行程序开发方法 并行层次与代码粒度 指令级并行:在多个并行层次中指令级并行是代码粒度最小的并行,也称为微粒度并行、甚细粒度并行; 数据级并行:又称为细粒度并行,它比指令级并行所执行的代码粒度要大一些,一般长度为几百条指令,这类并行通常都是在编译阶段由编译器来负责实现的 ; 控制级并行:也叫中粒度并行,通常是面对过程、子过程,其代码的长度一般为几千条指令。这一级的并行通常需要程序员的参与,一般情况下必须由程序员先对过程间的数据依赖关系进行分析然后再开发出相应的并行性; 任务级并行:任务级并行也叫做作业级并行、粗粒度并行,其代码的长度一般可高达数万条指令,一般是由加载程序和操作系统来负责处理的。 并行程序开发方法 并行程序的开发策略 第一种是采用将已有的串行程序进行自动并行化的方法来开发适合于并行计算机运行的并行程序; 第二种是调用并行库来实现并行程序的开发; 第三种是使用并行语言重新编写能运行于高性能并行计算机上的并行代码。 并行程序设计模式 并行程序设计模式的基本思路 对数据进行分解,将大的数据块分解成若干小块,每个线程处理其中的某些小块; 对计算过程进行分解,将一个大的计算处理过程分解成若干可独立运行的子过程,然后每个线程运行其中的一个或多个子过程; 基于问题进行分解,将一个原问题分解为若干子问题,然后将子问题的解合并起来成为原问题的解。 并行程序设计模式 并行程序设计模式 数据分解模式:将数据分解成若干独立的子数据块,每个线程处理其中的一个或多个子数据块; 分治模式:将一个原问题的求解分解为多个子问题的求解,然后再将多个子问题的解通过一定的计算方法合并为原问题的解; 流水线模式:将一个计算过程分解成流水线式的多个步骤序列,对于每个步骤的处理使用一个或多个线程来实现; 并行程序设计模式 并行程序设计模式 任务并行模式:将一个大的静态计算任务分解成若干独立的小计算任务,让这些小计算任务并行执行; 任务图调度模式:将一个大的静态任务分解成若干小的计算任务时,由于很多时候各个小任务在执行时许多非独立的小任务之间存在依赖关系,将这种依赖关系通过一个无环有向图来描述,这个图就是任务图,对它的并行化方法是任务调度问题,这就是任务图调度模式; 动态任务调度模式:任务图调度模式调度的是静态的任务,但是在很多情况下任务不是静态的而是在运行过程中动态产生的。运用共享资源分布式计算的知识实现的关于动态任务调度的并行模式就是动态任务调度模式,它的突出特点就是可以实现并行计算。 并行计算基础 组成并行计算机的各个部分: 节点(node):每个节点由多个处理器构成,可以直接进行输入输出(I/O)操作; 互联网络(interconnect network):所有节点通过互联网络相互连接通信; 内存 (memory):内存由多个存储模块组成 1、与节点对称的分布在互联网络的两侧; 2、位于各个节点的内部。 并行计算基础 多级存储体系结构 解决内存墙(memory wall)性能瓶颈问题; 节点内部的cache称为二级cache(L2 cache); 处理器内部更小的cache成为一级cache(L1 cache); L1 cache连接CPU寄存器和L2 cache,负责缓存L2 cache中的数据到寄存器中。 多级存储体系结构 并行计算机的多级存储结构主要包括两个问题: Cache的映射策略,即cache如何从内存中取得数据进行存储; 节点内部或者节点之间内存的访问模式 。 cache原理,cache以cache线为基本单位,每条cache包含L个字,每个字8个字节。例如,L=4,则表示cache线包含4*8=32个字节。内存空间分割成块(block),每个块大小与cache
文档评论(0)