众核阵列非满配时的并行编程方法 - 计算机应用与软件.PDFVIP

众核阵列非满配时的并行编程方法 - 计算机应用与软件.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
众核阵列非满配时的并行编程方法 - 计算机应用与软件

第29卷第10期    计算机应用与软件 Vol29No.10 2012年10月   ComputerApplicationsandSoftware Oct.2012 众核阵列非满配时的并行编程方法 王丽一 郑 岩 李岱峰 王 俊 (江南计算技术研究所 江苏无锡214083) 摘 要  研究众核阵列非满配时逻辑线程映射到物理线程的方法。在此基础上提出应用于非满配众核阵列的并行编程方法,此 方法也可以与MPI并行编程相结合,应用于大规模并行集群系统。 关键词  众核 逻辑线程 物理线程 并行编程 中图分类号 TP311.11    文献标识码 A DOI:10.3969/j.issn.1000386x.2012.10.033 PARALLELPROGRAMMINGMETHODOFNONFULLDEPLOYEDMANYCOREARRAY WangLiyi ZhengYan LiDaifeng WangJun (JiangnanInstituteofComputingTechnology,Wuxi214083,Jiangsu,China) Abstract  Themethodofmappinglogicalthreadsontophysicalthreadsinconditionofnonfulldeployedmanycorearrayisstudied.On thisbasis,theparallelprogrammingmethodappliedtononfulldeployedmanycorearrayisproposedaswell.Thismethodcanalsobeinte gratedwithMPIparallelprogrammingandtobeappliedtolargescaleparallelclustersystem. Keywords  Manycore Logicalthread Physicalthread Parallelprogramming 是逻辑线程,映射到硬件上的是物理线程。当一个物理线程运 0 引 言 行一个逻辑线程时,内核的效率最高。如果没有足够的逻辑线 程来让物理线程都运行,那么将导致有部分物理线程空载;如果 当众核的设计到来之时,最棘手的问题不再是基础性建设 逻辑线程比物理线程多,那么将导致超载,此时逻辑线程将分时 问题,而是如何最大效率地分配计算资源问题。随着内核的增 间片来运行。Intel的(TBB)ThreadingBuildingBlocks任务调度 多,这个问题会越来越突出,如果任务得不到有效分配,大量的 器通过选择逻辑线程数来避免空载和超载[1,2]。但是,在硬件 内核会处于空闲状态,而少数几个内核却满负荷运行,显然是不 非满配的情况下,怎么解决逻辑线程到物理线程的映射,才能避 符合众核计算的要求的。此外,随着芯片集成度的提高,更多的 免空载和超载,Intel没有明确解答此问题。 计算资源可以集成在一块芯片上,但这种集成也带来了硬件资 假设有一个核数是64的众核,排成8×8的阵列,如图1所 源管理的困难和对资源的竞争。如何容易地将计算任务进行分 示。 割,映射到众多处理器核上?如何对片上众多资源进行测试和 修复?如何让众多处理器核有数据可算?如何更充分地利用片 上有限存储空间的众核间共享,以避免片外访存?如何充分利 用有限访存带宽,尽量让访存通道繁忙,并能优先满足处于关键 路径处理器核的访存请求?如何在分布的结构中实现共享数据 的分发传播?类似的问题还有很多,这些问题大大制约了众核 计算的发展。 另外,由于工艺的限制,当核数增多时,内核发生故障的概 率也会明显增大,这就使得众核在物理上就不能实现满阵列运

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档