- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 节 性能指标和基准程序 第2节 性能和成本 并行处理与体系结构.ppt
并行处理与体系结构;第3章 性能指标和基准程序;用户经常提到6种性能: 执行时间 速度 吞吐率 利用率 成本有效性 性能/成本比 对在相同计算机平台上执行相同的应期程序,这些需求可能导致很大差别的结论。;用到的一些概念 工作负载(W)是程序中的计算操作数 Ppeak是处理器的峰值速度; 术语;在256个结点的SP2上所测得的STAP性能;例题:在256个结点的SP2上希望STAP在0.5秒完成 根据上表,只有APT能完成 例题:在256个结点的SP2上希望STAP速度为10GFLOP/S 根据上表,只有HO-PD能完成 ;2.系统吞吐率 是指单位时间处理的作业数 提高系统吞吐率的两个方法 流水化 无相关的分配 ;例题:在256个结点的SP2上 APT程序的吞吐率是单位时间作业数 0.16S一个APT 或1/0.16=6.25 例题:并行APT中吞吐率和速度改进 上表的工作负载=9*0.16=1.44Gflop 用两级流水0.14S,0.11S 吞吐率=1/0.14S=7.14或10.34;二、利用率和成本有效性 执行时间、速度和利用率是最重要的3个指标 利用率: 它是一个给定计算机实际可达到速度与峰值速度之比;例题:执行APT的IBMSP2的利用率 假定每个CPU小时需收费10美元 则由下表,计算APT程序运行在256个结点和1个结点上时的利用率 256个结点和1个结点哪一个更成本有效? ;程序;解:每个SP2结点的峰值速度为266 Mflop/s(见表3-2 136G/512=266) 一个有256个结点的SP2,其峰值速度为: 266x256=68Gflop/s; APT程序在256个结点上可达到的速度为: 9Gflop/s; 在1个结点可求出达到的速度为: 100Mflop/s;;转换成利用率则各自分别为: 利用率Un=Pn/(nPpeak) 256个结点利用率=9G/68G=13.3% 单个结点利用率=100M/266M=37.6% 结论: 表明APT程序在SP2上运行,在一个结点上时是更为成本有效;根据上面的要求: 在256个结点上执行APT需0.16s 执行一个APT的总成本为: $10x 256x0.16/3600=$0.11 这相应于成本有效性为(9 Gflop/s)/$0.11=79Gflop/s每美元。;在一个结点时,执行时间约为14.4s 总的成本仅为: $10x14.4/3600=$0.04, 成本有效性为(9Gflop/s?)/$0.04=225Gflop/s每美元 总结: 该例子表明较高利用率对应地有较高的每美元Gflop/s 当CPU 1小时费用值固定时这总是成立的 CPU一小时的费用在不同机器上对不同类型的作业可能有高有???。;推广 如果用成本来衡量:Gflops/美元 低利用率总是对应一个差的程序或编译器。;经验估计值: 运行在单MPP处理器上: 顺序应用程序(利用率)--5%到40%之间; 典型是--8%到25%之间。 某些个别的子程序可达到75%以上。 对于在多个处理器上运行的并行应用程序利用率在1%到35%之间;典型地则是在4%到20%之间。;一个广为流传的错误概念是: 单结点或顺序计算总是有最高的利用率?(由下图说明) 并行计算有额外通信和闲置开销,这并非总是正确的。;例子: 给出在3个MPP(Intel Paragon,IBM SP2和CrayT3D)上; 运行并行APT和HO基准程序; 测出利用率如下:;23;24;NAS并行基准测试程序的3种MPP的利用率;26;例题:峰值性能/价格比可能产生错误概念 持续性能/价格比都在一个区域之间。 Cray J916的峰值性能/价格比比Convex SPP1000、CrayT3D以及SGIPowerChallenge要低得多。 但它的持续性能/价格比,实际上比它们的都要高。 ;28
您可能关注的文档
- 第3章 节 Stellaris 驱动库 嵌入式计算机系统设计 .ppt
- 第3章 节 VC++图像编程基础 数字图像处理 .ppt
- 第3章 节 Visual FoxPro语言基础 visual foxpro全套资料(计算机国家二级课件).ppt
- 第3章 节 “Timeline”的基本操作——图层 After Effects CS4影视后期设计与制作 .ppt
- 第3章 节 三相交流电动机的电力拖动 《电机与拖动基础及MATLAB仿真》课件.ppt
- 第3章 节 不同集成度智能传感器系统举例 智能传感器系统 .ppt
- 第3章 节 不定期船运输概述 国际货物运输 .ppt
- 第3章 节 中文文字处理软件Word 2003 新编大学计算机基础教程.ppt
- 第3章 节 二维图形的绘制 AutoCAD课件.ppt
- 第3章 节 二维铣削加工 mastercamX课件.ppt
- 第3章 节 性能指标和基准程序 第3节 基本性能指标 并行处理与体系结构.ppt
- 第3章 节 性能指标和基准程序 第4节 基本性能指标 并行处理与体系结构.ppt
- 第3章 节 性能指标和基准程序 第5节 基本性能指标 并行处理与体系结构.ppt
- 第3章 节 恒定磁场 电磁场 电磁波 课件.ppt
- 第3章 节 恶意代码防范原理 恶意代码防范课件.ppt
- 第3章 节 情绪问题与调节控制 青少年心理健康课件.ppt
- 第3章 节 护理伦理学的基本原则 护理伦理学课件.pptx
- 第3章 节 招聘渠道与方法 招聘与录用 .ppt
- 第3章 节 指令系统 单片机原理与实践指导课件.ppt
- 第3章 节 控制系统的时域分析 《物联网控制基础》课件.pptx
最近下载
- 高边坡专项施工方案(专家论证版).pdf VIP
- 《工程化学基础》教案-第3章-2011.ppt VIP
- 抗日英雄王二小.pptx VIP
- 第5课 用发展的观点看问题-【中职专用】2024年中职思想政治《哲学与人生》金牌课件(高教版2023·基础模块).pptx VIP
- 老友记台词剧本第一季第1集中英双语左右对照.pdf VIP
- 形势与政策社会实践报告模板.docx VIP
- 全套SPC表格(很全面) CPK.xls VIP
- T_CI 540-2024 红枣蒸馏酒生产技术规程.pdf
- 施工组织设计方案(高速公路通信迁改).docx VIP
- Part3-4 Unit6 Craftsmanship课件高一英语(高教版基础模块2).pptx
文档评论(0)