通过ESnet连接DIII-D和NERSC的超级设施模型使DIII-D能够将聚变实验数据发送到NERSC的Perlmutter超级计算机,用于大规模自动化分析和等离子体的高保真重建。
DIII-D/NERSC超级设施数据重建
DIII-D诊断工具收集的数据(左侧)以及利用DIII-D/NERSC超级设施生成的磁场重建图(右侧)
加利福尼亚州圣地亚哥,2024 年 5 月 29 日(GLOBE NEWSWIRE)报道——随着全球人口不断增长,对能源的需求也将增加。满足这一需求的一种潜在变革性方式是利用核聚变产生能源,因为核聚变不会排放碳或消耗稀缺的自然资源。美国能源部 (DOE) 资助的DIII-D 国家聚变设施、国家能源研究科学计算中心(NERSC) 和能源科学网络(ESnet) 的研究人员正在联手实现这一愿景。这次合作巧妙地结合了NERSC的高性能计算资源、DOE的高速数据传输网络ESnet以及DIII-D的先进诊断工具。这一合作的优势不仅让聚变实验产生的数据更加具有价值,还使得全球的聚变研究者能够更方便地访问和利用这些数据,从而推动聚变能源研究向前迈进,加速实现聚变能源的商业化和实用化。
数据 + 高性能网络 + 高速计算 = 突破
DIII-D的研究人员正在进行实验,探索核聚变作为可持续能源的潜力。这些实验需要迅速处理大量数据,而这正是高性能计算设施的专长。为了应对这一挑战,DIII-D、NERSC和ESnet的跨机构团队合作,创建了一个“超级设施”,由DIII-D的实验资源和NERSC的高性能计算资源组成,通过ESnet6这一高速科学网络相连。
“为了达到聚变能源的目标,我们需要动用所有资源,包括高性能计算,来深入分析当前的实验,并为将来的聚变电厂打下基础,”DIII-D项目负责人Sterling Smith解释道。
超级设施模型补充了DOE对综合研究基础设施的宏伟蓝图。它使得在实验过程中对海量数据进行近乎实时的分析成为可能,从而优化实验流程,加快科学实验的步伐。
“我们一直明白,实验科学团队需要更有效的方法来连接实验设施、高速网络和高性能计算资源,”NERSC数据部门负责人Debbie Bard说。
通用原子公司的聚变数据科学高级主管Raffi Nazikian补充说:“我们认为超级设施的理念,以及DOE高级科学计算研究办公室正在构建的综合研究基础设施,将为聚变研究带来革命性的变化。从DIII-D/NERSC超级设施开始,我们期待挖掘其全部潜力。”
让每次实验都发挥最大作用
DIII-D国家聚变设施的核心设备——DIII-D托卡马克,能够产生高温等离子体。在这个托卡马克中,气体原子被加热至极高温度,以至于它们分解成电子和原子核。这些自由的原子核可能会相互碰撞并融合,释放出巨大的能量。在实验期间,研究小组研究了短等离子体放电(称为射击)的行为,这种放电通常以 10 到 15 分钟的间隔进行,每次射击期间近 100 个诊断和仪器系统可捕获千兆字节的数据。在两次射击之间,科学家有短暂的时间来解决任何问题或评估特定参数设置如何影响等离子体行为。
此前,在两次射击之间进行调整需要专家进行大量手动计算,这是一个既耗时又费力的过程,而且提供的信息有限。将其中一些工作自动化一直是一个潜在的解决方案,但 DIII-D 实验的计算需求是标准计算系统无法满足的,而且让单个科学家访问单独的超级计算中心往往是一个极其困难且耗时的过程。
“尽管DIII-D已经在本地计算系统上实现了自动化的快速数据处理,为科学家提供近乎实时的反馈,为实验决策提供信息,但多年来,模型的保真度和对物理学的理解已经有了显著提高,”通用原子公司的DIII-D计算机系统和科学协调员David Schissel说。“现在的实验需要更高分辨率、更高保真的分析,这无法在我们的本地系统上完成。只有通过超级设施模型,才能实现近乎实时的更详细分析,以指导控制室的决策,这将使研究人员能够做出更好的调整,从他们的实验中学习更多。”
建立连接DIII-D和NERSC的超级设施模型的技术过程始于协调代码:首先确保DIII-D用于计算设备的平衡磁场轮廓的EFIT代码能够在NERSC的Perlmutter超级计算机上良好运行。在此基础上,联合团队采用了由普林斯顿大学Egemen Kolemen教授的团队为DIII-D开发的一致自动动力学平衡(CAKE)工作流程,整合了各种分析和建模代码提供的信息,以全面描述DIII-D托卡马克中等离子体的行为。通过监控和调整CAKE工作流程在NERSC上的使用,超级设施团队能够将解决方案的时间缩短80%,从60分钟缩短到11分钟。
“DOE已经投资建立DIII-D,使其成为世界上诊断最好的聚变设施。然而,使用像CAKE这样的工具进行大规模自动化分析,是将所有诊断数据转换为有用信息的唯一方式;超级设施团队正在朝着聚变的未来迈出关键一步,”普林斯顿大学的Egemen Kolemen教授说。
计算速度的提升让研究人员得以在DIII-D实验的两次等离子体放电之间完成必要的数据分析和后续的深入分析。在2008年至2022年间,由于DIII-D尚未实现对高性能计算(HPC)的实时访问,仅完成了4000次手工重建。在DIII-D/NERSC超级设施运营的前六个月,DIII-D实现了超过20000次自动化高分辨率磁场轮廓重建,用于555次DIII-D“射击”。
这些结果现已成为所有DIII-D用户都能访问的高保真数据库的一部分,用户可以利用这些数据来指导实验规划和结果研究,从而为全球聚变能源的研究提供有力的信息支持。
"DIII-D及其在聚变研究领域的应用突显了一个重要场景:快速获取实验结果非常关键,"来自NERSC的团队成员Laurie Stephey解释说。"聚变模拟和数据分析往往计算量巨大,本地资源难以承担,这导致很多分析工作要么无法完成,要么完成得太晚,失去了实际应用的价值。而超级设施项目通过结合DIII-D和高性能计算资源,创造了一个整体效能大于部分之和的成果——它能够及时提供科学洞见,这在以前是不可想象的。"
实现 HPC 资源访问的民主化
DIII-D和NERSC合作开发的超级设施模型不仅标志着当今聚变能源研究的一次重大突破,也为美国能源部(DOE)旗下实验室推广超级设施和综合研究基础设施(IRI)的合作提供了范例。DIII-D团队还与阿贡国家实验室的高性能计算资源进行了联合研究。通过ESnet这一高速网络,DIII-D能够快速进行等离子体脉冲的数据分析,尽管这一过程中采用了与DIII-D/NERSC合作时不同的工作流程。
ESnet科学参与团队的网络工程师Eli Dart说道,"ESnet正在不断探索如何提升网络性能,以更好地服务于DIII-D/NERSC超级设施和其他合作伙伴。随着工作流程的不断优化,我们期待能够推出更高级的服务,使得项目能够更加轻松地扩展到多个高性能计算环境中,同时确保性能和用户体验。"
超级设施模型的推广,不仅提升了科学研究成果,还让实验过程变得更加公平、包容,让更多研究人员受益。它为所有团队成员提供了高性能计算的访问权限,无需个人额外分配计算时间,这为新的研究团队和个人参与实验提供了便利,并加强了实验团队成员之间的联系。超级设施的分布式特点也降低了参与数据分析的专家的参与难度,为早期职业研究人员与领域专家的合作提供了机会。这些变革共同营造了一个更具包容性的研究环境,并有助于培养更广泛的聚变能源领域的专业人才。
DIII-D、NERSC和ESnet之间的合作,成功展示了将实验科学模拟与计算资源整合的强大力量,为实现聚变能源生产的解决方案提供了宝贵的支持。
关于DIII-D国家聚变设施:作为美国最大的磁约束聚变研究设施,DIII-D在聚变能源科学领域取得了多项开创性成果。DIII-D继续与800多个团队成员和600多名积极贡献的科学家合作,代表全球95个机构进行关键研究,推动实际聚变能源的发展。作为美国能源部科学办公室的用户设施,所有感兴趣的各方都可以参与DIII-D研究。
关于通用原子公司:自原子时代开启以来,通用原子公司的创新跨越了科学和技术的多个重要领域,包括核能、国防、医疗和高性能计算。依托于一群才华横溢的全球科学家、工程师和专业人士,公司凭借其独特的经验和专业能力,持续提供既安全又经济的创新解决方案,以应对全球不断增长的需求。