在日前举行的第三届中国超级算力大会(ChinaSC 2021)上,由中科院计算技术研究所研究员张云泉、清华大学教授陈文光、美国阿贡国家实验室研究员Pavan Balaji和瑞士苏黎世实验室教授Torsten Hoefler联合ACM SIGHPC China委员会共同发起的国际人工智能算力性能排行榜——AIPerf500发布。
这是AIPerf500第二次发榜。榜单显示,首届AIPerf500的榜单冠军“鹏城云脑Ⅱ”蝉联榜首,排在其后的是一台新一代神威高性能计算机,联泰集群研制的一台智算设备位列第三。
相比首届,今年AIPerf500榜单共新增15台机器。其中,新增4台机器进入前10名。新增计算系统中,北京超级云计算中心贡献的数量最为可观。
张云泉称,推动这样一个人工智能算力基准测试程序,有两方面原因。一是公众需要一个简单明晰的指标来判断“哪套计算系统的人工智能算力更强”“整个智能计算领域的发展状况如何”等问题,二是传统的高性能计算机测试结果与人工智能需要的性能不完全一致,因此需要一种新的评测标准。
“AIPerf已经在多种主流的高性能异构系统下稳定运行并评分,并可支持4000张加速卡以上级别的大规模评测,且能有效区分不同规模系统的人工智能算力差异。”张云泉说。
会上,清华大学副教授翟季冬发布了用于评测计算机系统训练大模型能力的测试模型AIPerf-MoE。该模型规模可变、并行模式可调、支持混合精度,能适应不同系统内存、不同网络拓扑及不同计算硬件,可根据系统大小弹性测试上述能力。(记者赵广立)