-
您的位置: 首页»行业资讯»数据中心领域国家标准动态»支撑算力基础设施的重要国家标准GB/T44269-2024《信息技术高性能计算系统管理监控平台技术要求》于2025年3月1日起实施
支撑算力基础设施的重要国家标准GB/T44269-2024《信息技术高性能计算系统管理监控平台技术要求》于2025年3月1日起实施
- 2025/4/8 7:04:07 作者:北京米元数据科技有限公司 赵勇祥 来源:《数智元》杂志
-
2024年8月,国家市场监督管理总局(国家标准化管理委员会)发布2024年第17号中国国家标准公告,335项国家标准获批发布。支撑算力设施的重要国家标准GB/T44269-2024《信息技术高性能计算系统管理监控平台技术要求》正式发布,于2025年3月1日起实施。
2024年8月,国家市场监督管理总局(国家标准化管理委员会)发布2024年第17号中国国家标准公告,335项国家标准获批发布。支撑算力设施的重要国家标准GB/T44269-2024《信息技术高性能计算系统管理监控平台技术要求》正式发布,于2025年3月1日起实施。
高性能计算系统是一个国家综合国力的体现,是支撑国家实力持续发展的关键技术之一。高性能计算系统在国防安全、高科技发展和国民经济建设中占有重要的战略地位。
随着高性能机计算技术在科学研究、工业制造、气象预测、生命科学、地质科学等领域的广泛应用,高性能计算系统的计算能力也有着飞速的发展,从2010年的T级(百万亿次),到2015年的P级(千万亿次),到2020年出现E级(百亿亿次)。
随着计算能力的发展,高性能计算系统的复杂度及管理难度也在急剧增大,同时整体系统的功耗也在急剧增长。
高性能计算系统主要硬件设备有:管理节点、计算节点、存储IO节点、Infiniband交换机、高速存储、千兆以太网交换机。
应用软件方面有:64位Linux操作系统、并行开发环境、并行文件系统等,利用高速infiniband网络互联构成计算环境,这些硬件设备及应用程序通过管理监控平台使之协同工作,为用户提供优化设计、分析、验证的手段,最终实现提高科研质量、缩短科研周期、降低科研成本等效果。
但是当前在管理监控平台方面缺乏统一的标准,各厂商管理监控平台的形式及使用方式各不相同,对高性能计算系统性能充分发挥造成障碍,更对用户在不同厂商产品之间的切换造成困扰,严重影响计算效率。
高性能计算系统在用户侧的使用、监控、管理应遵循以下原则:
1)最大限度发挥系统的计算性能:应具有优秀的处理能力,不仅具有符合要求的峰值性能,更应具有稳定的应用性能,各种计算任务能够得到准确、快速的计算结果。
2)最大限度降低能耗比:充分考虑性能与功耗的平衡,通过智能管理调度策略回收或释放计算资源来节约能耗;在计算的低谷时期自动回收计算资源降低功耗,在计算峰值时期自动释放计算资源满足计算需求。
3)开放性和兼容性:系统应符合公认的业界标准,包括体系结构、硬件、I/O、网络、操作系统、开发环境和开发工具等,便于和其他平台上的系统互操作。
4)应用软件丰富:应具有丰富的软件资源,能够提供各类计算任务的解决方案和相应的软件系统。不仅提供处理节点间的协调和通信的中间件,使整个系统节点能够真正实现合作,负载均衡,还能针对不同应用需求提供一系列并行计算应用的管理及支持。
5)简单易用:减少数据中心的设备管理难度,简化架构,底层硬件对用户透明,突破集中式资源部署应用难的屏障。
高性能计算系统应遵循统一规划、统一标准、统一管理,最大程度地保证最大发挥计算性能,极力降低系统功耗。因此,市场对于高性能计算系统管理监控平台的标准制定需求迫切。
高性能计算系统的管理监控平台支撑着高性能计算系统的运行维护工作,是确保高性能计算结果稳定可靠、系统运转稳健的关键平台,本标准规范规定了高性能计算系统的管理监控软件的技术要求,包括管理监控软件对高性能计算系统管理的功能、性能要求,适用于高性能计算系统管理监控软件的设计和开发。
通过实施本标准,规范高性能计算系统的管理监控平台的技术要求,可以从资源调度、作业管理等角度加强对整个系统计算资源的有效利用,有效提高单个计算节点的计算能力和整个系统的功耗比,从而降低系统整体能耗。
在电脑端访问如下网址,可下载标准PDF版。
https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=DAB98BE40AA040804FFE362AF91DEDCD

编辑:Harris
2024年8月,国家市场监督管理总局(国家标准化管理委员会)发布2024年第17号中国国家标准公告,335项国家标准获批发布。支撑算力设施的重要国家标准GB/T44269-2024《信息技术高性能计算系统管理监控平台技术要求》正式发布,于2025年3月1日起实施。
