- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级计算机体系结构 第四章 互联拓扑
Parallel Computer Architecture并行计算机体系结构Lecture 4 March 22, 2010 Wu junmin (jmwu@ustc.edu.cn) Overview Review of Lec3 Interconnection networks 直接互连网络 间接互连网络 Review of Lec3 并行计算机的性能指标 Review of Lec3 加速比性能定律 并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序)的执行速度相对于串行算法(或串行程序)的执行速度加快了多少倍。 Amdahl 定律 Gustafson定律 Sun Ni定律 可扩放性评测标准 等效率度量标准 等速度度量标准 平均延迟度量标准 程序级性能评测 基准测试程序(Benchmark) 一组标准的测试程序 提供一组控制测试条件 步骤的规则说明(测试平台环境、输入数据、输出结果和性能指标等 ) 基准测试程序的分类 真实程序 :C compiler, Text editor, spice 核心程序 : Livermore 24 loops, Linpack 小测试程序 : 皇后问题、排序问题、求素数 合成测试程序 : Whetstone 、Dhrystone 应用:科学计算、商业应用、网络服务、多媒体应用 宏观测试程序(Macro-benchmark):计算机系统作为一个整体来测试其性能 微观测试程序(Micro-benchmark) :测试机器的某一特定方面的性质 Benchmark Suites 并行算法的设计过程 并行算法(程序)的设计步骤: 任务划分(Partitioning):将整个计算分解为一些小的任务,其目的是尽量开拓并行执行的机会; 通信(Communication):分析确定诸任务执行中所需交换的数据和协调诸任务的执行,由此可检测上述划分的合理性; 任务组合(Agglomeration):按性能要求和实现的代价来考察前两阶段的结果,必要时可将一些小的任务组合成更大的任务以提高性能或减少通信开销; 处理器映射(Mapping):将每个任务分配到一个处理器上,其目的是最小化全局执行时间和通信成本以及最大化处理器的利用率。 Overview Review of Lec3 Interconnection networks 直接互连网络 间接互连网络 第三章 互连网络 系统互连 不同带宽与距离的互连技术 局部总线、I/O总线、SAN和LAN 基本网络部件——链路 链路(link):传输信息的物理介质,也称为通道或电缆 不同的物理介质:双绞线(STP)、同轴电缆、光纤 可用来连接两个Switch或主机与Switch 宽度: 链路所包含的信号线数 频率:信号线上传输数据的频度(rate) 延迟:数据位从一端传输到另一端的时间,通常直接受限于信号线的长度 带宽:等于宽度*频率 基本网络部件——交换开关 基本网络部件——网络接口电路 网络接口电路(NIC): 用来连接主机和网络 包括输入输出端口将数据输入输出到网络上 有如下功能:数据打包/解包、计算路由信息、输入/出数据缓冲(匹配网络和节点的速度)、纠错等 通常包括:处理器、I/O缓冲、控制存储器和控制逻辑 接入位置很重要:I/O总线,Memory 总线 网络性能指标(1) 通信时延:从源节点到目的节点传输一条消息所需的总时间 在网络两端相应收发消息的软件开销 由于通道占用导致的通道时延(即总的消息长度除以通道带宽) 沿选路路径花费在后续交换开关上作选路决策的选路时延 由于网络传输竞争导致的竞争时延 软件开销主要取决于主机内核,与竞争时延均依赖于程序行为 网络时延 :通道时延和选路时延之和 ,完全由网络硬件特征决定,(通常1微秒左右)大大小于软件开销和竞争时延(几十或几百微秒) 网络性能指标(2) 每端口带宽 :从任意端口到另外端口每秒钟传输消息的最大位(或字节)数 如IBM HPS 每端口带宽40MB/s 聚集带宽 :从一半节点到另一半节点,每秒钟传输消息的最大位(或字节)数 如IBM HPS端口数最多为512 ,聚集带宽为512*40/2 = 10.24GB/s 对剖宽度:将网络分成两个相等部分所必须移去的最少边数。 对剖带宽(Bisection Bandwidth) :每秒钟内,在最小的对剖平面上通过所有连线的最大信息位(或字节)数。等于对剖宽度与通道带宽之积。 网络性能指标(3) 节点度(Node Degree):射入或射出一个节点的边数。在单向网络中,入射和出射边之和称为节点度。 网络直径(Network Diameter): 网络中两个节点之间的最长距离,即最大路径长度。 如果从任一节点观看网络都一样
您可能关注的文档
- 老子哲学5.ppt
- Unit 1 Will people have robots重点总结.doc
- 用化学方程式的简单计算1.ppt
- 博菲特学员个性化辅导方案.doc
- 车床拨叉机械加工工艺说明书.doc
- 反倾销对烟台万华的影响.ppt
- 鲁宾逊漂流记英文介绍.doc
- GOT1000画面传输步骤.pdf
- 张嗣同 发酵工程绪论4-2.ppt
- 7年级上unit 5unit6 单元试题.doc
- 2025年中国乙氧苯柳胺软膏市场调查研究报告.docx
- 2025年及未来5年电信设备项目市场数据调查、监测研究报告.docx
- 2025年中国产宝口服液市场调查研究报告.docx
- 2025年及未来5年远红外线热敷按摩仪之瑞颈灵项目市场数据分析可行性研究报告.docx
- 2025年中国2—氨基—4,6—二氯嘧啶市场调查研究报告.docx
- 2025年及未来5年双层风琴帘项目市场数据调查、监测研究报告.docx
- 2025年及未来5年多功能短路定位分析仪项目市场数据调查、监测研究报告.docx
- 2025年中国换芯型烟嘴市场调查研究报告.docx
- 2025年及未来5年印章防伪项目市场数据调查、监测研究报告.docx
- 2025年中国超小型冷冻修边机市场调查研究报告.docx
有哪些信誉好的足球投注网站
文档评论(0)