Lenovo Intelligent Computing Orchestration 白皮书.docVIP

Lenovo Intelligent Computing Orchestration 白皮书.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
联想智能超算平台 Lenovo Intelligent Computing Orchestration 产品白皮书v2.1 Lenovo EBG System x Solution Team 目录 Lenovo Intelligent Computing Orchestration 1 产品白皮书v2.1 1 1. 概述 3 1.1 概要 3 1.2 目标读者 3 2. 联想Lenovo Intelligent Computing Orchestration解决方案 4 2.1 解决方案架构 4 2.2 软件架构 8 2.2.1 软件列表 8 2.2.2 推荐硬件列表 9 2.3 联想System x 解决方案团队所做的努力 10 2.4 方案功能和优势 11 2.4.1 功能 11 2.4.2 优势 13 3. 推荐配置 16 3.1 10个节点HPC集群推荐配置 16 3.2 20个节点HPC集群推荐配置 17 3.3 50个节点HPC集群推荐配置 18 3.4 100个节点HPC集群推荐配置 18 4. 典型应用场景功能 20 4.1 机群管理、监控和报警 20 4.2 作业提交与查看 26 4.3 用户及计费管理 29 概述 概要 随着互联网的普及和IT业的高速发展,高性能计算已经不再是少数大公司或大型科研机构的专属要求,而是被越来越多的包括政府,教育科研,石油石化,制造,军工和生命科学类的客户所需要和接受。 当前高性能计算的解决方案中,大多数企业级商用软件产品解决方案如IBM Platform Computing 十分昂贵和庞大。这就造成很大一部分HPC客户无法承受。另外还有一些HPC客户对高性能产品和方案有着很强的定制化和二次开发的需求,他们并不希望自身被复杂的庞大的商业软件所绑架。 基于以上需求和综合考虑,联想EBG组装研发了Lenovo Intelligent Computing Orchestration联想智能超算平台。它是基于主流的高性能计算开源项目,并由Lenovo EBG研发团队加入了一些符合自身的特性功能插件,并且在联想System x平台上测试和验证。 目标读者 本文档主要面向联想公司内部技术人员,销售人员,客户中的技术人员,联想签约合作伙伴和数据中心管理和运维人员。 本文档读者需要具备一定的高性能计算,服务器集群的基础知识,并对服务器和数据中心基础架构以及存储,网络设备有一定的了解。 联想Lenovo Intelligent Computing Orchestration解决方案 解决方案架构 一个完整的 HPC集群由以下五类节点组成: 1.管理节点 管理节点作为HPC集群的核心,肩负着集群管理,监控,调度,策略管理,用户和账户管理等主要功能。 我们选用一台x3650 M4/M5 搭载2块E5-2600 v2/v3 CPU, 64GB的内存,2块300GB的硬盘和相应的网卡或IB卡作为管理节点的硬件平台。 开源软件方面,我们选用xCAT和Ganglia来担负集群管理,部署和监控的任务,xCAT和Ganglia在 HPC集群管理和监控方面有着很多年的沉淀,很多 HPC集群管理员对他们的使用十分熟悉。在任务调度方面,我们选用 TORQUE加MAUI这样的黄金组合,他们也是被市场多年验证过的成熟开源软件产品。计费方面,我们选用和MAUI同属一个社区的Gold,来尽量减少产品间的冲突。 2.计算节点 计算节点的功能顾名思义,就是完成高性能计算的任务。 我们选用非常适合高性能计算的服务器NeXtScale nx360 M4/M5 或Flex x240 M4/M5,搭载2块E5-2600 v2/v3 CPU, 64-128GB memory,1块300GB HDD和相应的网卡或ib卡作为计算节点的硬件平台。 开源软件方面,我们预装了多种开源的MPI运行库,包括MPICH,OpenMPI, MVAPICH2Intel Parallel studio库。同时TORQUE,Ganglia等软件的客户端也需要安装在计算节点上。 3.GPU节点 GPU节点和普通的计算节点十分相像,从硬件上看,它比普通的计算节点多了GPU来专门做浮点运算。从软件上看,我们预安装了 CUDA。 4.登录节点 登录节点是HPC集群联系外部网络或集群之间的纽带。用户需要通过它来完成用户的登录并用它来上传应用数据,开发编译程序,提交调度任务等。 我们选用x3650 M4/M5 搭载2块E5-2600 v2/v3 CPU, 64GB以上内存,2块300GB的硬盘和相应的网卡或IB卡作为登录节点的硬件平台。 开源软件方面,我们预安装多种开源的MPI编译库和运行库,包括MPICH、 OpenMPI、MVAPICH2Intel Pa

文档评论(0)

celkhn5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档