众核异构新型构架超算上的地球系统模拟不确定性特征研究新进展

2022-09-08251

  近日,由我校筑峰人才工程第一层次教授张绍晴领衔的科研团队,在众核异构新型构架超算上的地球系统模拟不确定性特征研究方面取得新进展。

  传统计算机核芯架构具有高能耗特征,限制了超算性能的提升,导致用于大规模科学计算的超算发展到达瓶颈。由我国自主设计生产的神威超算系统采用众核异构设计理念,芯片内部包含主核和从核两种核芯架构,在大规模提升运算能力的同时,能合理控制系统能耗,符合绿色科技发展的时代潮流。目前,神威超算已完全实现与传统英特尔多核同构超算相同的大规模科学计算能力。

  近年来,张绍晴教授领衔的科研团队潜心致力于高分辨率地球系统模式的研发,明确众核异构架构中浮点数运算不确定性的特征问题是实现高分辨率地球系统模式在神威超算的应用、优化升级国产众核超算能力的关键。为了揭示众核异构计算扰动对地球系统模拟结果的影响,研究团队设计了一个对扰动极其敏感的大气过程模型,该模型由积云对流等典型不连续物理参数化方案组成,通过云底和云顶变化来研究大气过程模型的计算不确定性,并分别应用于多核同构(CPU)和众核异构(基于GPU和神威)超算平台。研究发现,尽管异构计算可以在微小的精度差异内通过扰动改变云底和云顶的结果,但同构和异构环境中的云概率密度函数结果一致。这表明异构计算环境下硬件架构不同所产生的扰动,不影响地球系统模拟结果的科学正确性。

  研究异构计算环境下硬件架构不同所产生的扰动对地球系统模拟结果的影响,是当今信息科学和地球科学的前沿交叉领域。上述研究首次为验证众核异构超算平台的可靠性和讨论地球系统模拟对新的异构体系结构的适应性提供了令人鼓舞的科学依据,将助力推动新型超算和地球系统模式发展。

  国际知名学术期刊Geoscientific Model Development(《地球物理模式研发》)95日以“Characterizing Uncertainties of Earth System Modeling with Heterogeneous Many-core Architecture Computing”(“异构众核超算地球系统模拟不确定性特征研究”)为题对上述成果进行了在线报道。成果由我校海洋与大气学院在读博士研究生于洋洋为第一作者,物理海洋教育部重点实验室张绍晴教授和吴立新院士、清华大学付昊桓教授和国家超级计算无锡中心陈德训教授为共同通讯作者的科研团队共同合作完成。(原文链接:https://doi.org/10.5194/gmd-15-6695-2022