基于ELPA的并行广义本征值求解器GenELPA-上海超级计算中心.PDF

基于ELPA的并行广义本征值求解器GenELPA-上海超级计算中心.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于ELPA的并行广义本征值求解器GenELPA-上海超级计算中心

高性能计算技术 35 基于ELPA的并行广义本征值求解器GenELPA  沈 瑜 中国科学技术大学 超级计算中心合肥 230026  孙广中 中国科学技术大学计算机科学与技术学院 合肥 230026 摘要: 高效率的大规模并行求解广义本征值方程是在计算电子结构等高性能计算学科中的一个重 要课题,也在未来E级计算的发展上有重要的意义。根据马普研究所近几年开发出的一种面向 P级应用的本征值求解库ELPA,针对广义本征值问题,我们开发了一款开源并行广义本征值求 解器GenELPA,实现了从广义本征值问题到一般本征值问题的转换方法,避免了潜在的问题; 然后调用ELPA进行计算,具有良好的计算速度和并行效率;同时采用了类似ScaLAPACK的接 口,更加易于使用。在第一性原理软件ABACUS中的实际应用表明具有理想的计算速度提升。 关键词:广义本征值,ELPA,电子结构,ABACUS 1.前言 绕过求解本征值的步骤从而使得问题复杂度降低到 [4] 在很多需要数值计算的领域,如何高效求解大 O(N)。另一方面,也可以采用大规模并行的方法 型矩阵的本征值和本征向量是常见的问题。例如在 来加速本征值的计算。尤其是近些年超级计算机 电子结构理论中,我们常常要把求解的Kohn-Sham方 的飞速发展,不仅顶级超级计算机的规模迅速扩 [1] 大,而且千核乃至万核级服务器也日趋普及。目 程转换为矩阵形式,然后求出本征值。 很多时候系 统需要通过多次自洽迭代达到稳态,而在每次迭代 前,有很多工作是研究大规模并行本征值求解, [5] [6][7] 中都需要求解该方程,尤其在几百个原子以上的较 例如ScaLAPACK、PLAPACK、eigen_s和eigen_ [8] [9] [10] 大尺度下,该方程的求解成为最耗费时间的步骤, sx,Elemental, EleMRRR等等。同时,基于众核的 [2] PLASMA和基于GPU的MAGMA也随着近年来异构计 所以如何求解Kohn-Sham方程成为影响计算速度的 [11-14] 关键因素之一。 算的发展而开发出来 。 一般情况下,Kohn-Sham方程是一个广义本征值 2011年德国马克斯普朗克学会的科学家们为了 方程,具有如下形式: 解决在FHI-aims全电子结构软件中的针对上千个原子 Ac=Bcλ (1) 体系中需要求解的大规模对称和厄米矩阵的本征值 [15] 其中A和B为已知的N×N的矩阵,c是N×N的本 问题,发展了面向P级应用的本征值求解库ELPA。 征向量矩阵,λ是以本征值为对角元的矩阵。很多情 ELPA具有相对传统ScaLAPACK更好的计算速度和 [16] 况下,A和B都是对称矩阵(如果为实数矩阵)或者 并行效率,除了在FHI-aims里得了应用,也为很 厄米矩阵(如果为复数矩阵),同时B还是正定且非

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档