- 课程回放
- 宇宙学N体模拟研究现状与挑战
- 宇宙学N体模拟典型应用CUBE技术详解
- CUBE在异构计算平台的移植与优化
宇宙学N体模拟是研究外太空星系形成、暗物质、暗能量等重大科学问题的重要手段,目前N体模拟常用的算法之一是粒子网络(Particle-Mesh,PM)算法。为准确模拟出宇宙的结构,宇宙学家们需要同时模拟数亿个粒子的演化。在模拟过程中,计算机需要估算所有粒子之间的重力,并在模拟过程中计算所有粒子对,需要超高的算力支持;同时,数十亿个粒子的模拟需要消耗较多的内存容量。因此,超高的算力和内存需求也是宇宙学家们在实际工作研究过程中面临的主要挑战。
厦门大学天文系宇宙科学课题组自主研发了宇宙学数值模拟软件CUBE,并依托上海交通大学π 2.0超算平台,成功完成了4.4万亿粒子的宇宙大尺度结构N体模拟Cosmo-π测试,追踪了137亿年以来的宇宙演化,是目前世界上完成粒子数目最多的宇宙学N体模拟。
CUBE采用定点压缩技术,极大的降低了内存消耗,结合双层PM+PP算法,能将每个N-body粒子的内存消耗减少到仅6个字节,比传统PM算法低一个数量级。并使用包括混合精度计算、通信优化在内的方法对CUBE进行了性能优化,可以在较低的内存消耗下实现较高的计算效率和可扩展性。
除了上述算法层面的优化,课题组还与上海交通大学超算平台团队进行合作,在上海交通大学π 2.0超算平台上进行了CUBE的移植和优化研究,将N体模拟中的热点Particle-Particle引力求解部分尝试性地进行CUDA移植,单步运行速度提升了5.16倍左右,在4台DGX-2共64块V100上的弱扩展效率是83.8%。
1月6日,智东西公开课推出NVIDIA GPU 加速科学计算专场,主题为《宇宙学N体模拟在异构计算平台的移植和优化研究》,由上海交通大学计算机系硕士研究生胡航以视频直播形式进行讲解。
胡航的主要研究方向为高性能计算,协助物理与天文学院完成了宇宙学数值模拟应用在π 2.0超算平台上的移植和优化工作。
本次讲解,胡航将从宇宙学N体模拟研究现状、粒子网络算法原理、面临的计算挑战、CUBE的技术实现及其在异构计算平台上实现GPU端访存、负载均衡、计算指令以及多GPU并行扩展等方面的优化工作,进行系统讲解。