研究院动态

NEWS

成果速递|研究院多篇论文被高性能计算领域权威国际会议ICS25接收
品牌宣传办公室2025-04-11发布于湖南
      近日,北京大学长沙计算与数字经济研究院(以下简称“研究院”)发表的三篇学术论文被高性能计算领域权威国际会议ACM International Conference on Supercomputing (ICS 2025)接收。论文研究成果分别聚焦高效并行计算、GPU加速、计算资源效率提升等方面,在性能可移植编程模型、算法创新,以及高性能计算平台作业调度等方面取得了突破,显著提升了科学计算应用的性能和高性能资源利用效率,系统回应“如何用好异构算力”的学术难题,深度契合国产超算“软硬协同”发展需求。
 

入选论文【1】

《Leonid:针对科学计算的支持自动算子融合的性能可移植编程模型》

Leonid框架示意图
 

      研究院院长、先进计算研究中心主任杨超教授团队的研究论文《Leonid:针对科学计算的支持自动算子融合的性能可移植编程模型》(Leonid: Exploring Automated Kernel Fusion in Performance-Portable Programming Models for Scientific Computation)提出了一种面向科学计算的支持自动算子融合机制的性能可移植编程模型,目前已支持CPU、GPU以及国产神威超级计算机平台。Leonid通过对底层硬件平台的抽象,提供统一的内存管理和并行计算模式;针对擦板内存(scratchpad memory)设计了缓存式内存池管理方案,统一了GPU共享内存(shared memory)和神威平台的局部设备内存(Local Device Memory),支持神威平台的直接内存访问(Direct-Memory-Access)并消除了内核融合过程中擦板内存导致的重复访存操作;基于算子数据依赖构建有向无环图(DAG),并利用DAG实现自动算子融合,在CPU和神威平台上支持运行时算子融合,而在GPU上采用编译时算子融合。对于带宽受限且适合融合的代码,Leonid相较于缺乏自动内核融合能力的其他性能可移植模型展现出显著优势,为科学计算领域的高效并行计算提供了一种全新的优化范式。北京大学数学科学学院博士生张晨晨为论文第一作者,杨超教授为通讯作者。

 

入选论文【2】

《StructILU:面向GPU求解结构网格偏微分方程的多级并行的依赖保持的不完全LU》

无循环依赖的任务映射策略
 

      杨超教授团队的研究论文《StructILU:面向GPU求解结构网格偏微分方程的多级并行的依赖保持的不完全LU》(StructILU: Dependency-Preserving Incomplete LU with Hierarchical Parallelism for Structured Grid PDEs on GPUs)面向传统不完全LU分解(ILU)预条件算法在GPU加速实现中面临数据依赖性强、并行度低的核心瓶颈,针对结构网格上ILU算法的特征,创新性地提出三级分层并行架构:在网格层级创新设计无循环依赖的任务映射策略,充分释放流处理器(SM)计算潜力;在行内层级构建延迟感知的流水线技术,优化计算延迟;在元素层级利用张量核心实现多物理场问题中的小稠密矩阵计算加速。配合多级并行计算模式,创新的内存转换机制显著提升显存带宽利用率。实验结果表明,该方法在保持收敛效率与串行版本一致的同时,相比现有GPU实现,显著提高了利用ILU预条件的结构化网格PDE求解计算效率。北京大学数学科学学院博士生罗昊为论文第一作者,杨超教授为通讯作者,北京大学集成电路学院梁云教授团队参与合作。

 

入选论文【3】

《ORA:基于在线检索增强语言模型的高性能计算平台作业运行时间预测》

ORA语言模型
 

      算力网络研究中心主任樊春团队的研究论文《ORA:基于在线检索增强语言模型的高性能计算平台作业运行时间预测》(ORA: Job Runtime Prediction for High-Performance Computing Platforms Using the Online Retrieval-Augmented Language Model)提出一种基于在线检索增强语言模型的高性能计算平台作业运行时间预测方法(ORA)。该方法使用大语言模型(LLM)理解作业脚本内容并通过检索历史相似作业帮助集群预测新作业的用时;使用在线更新的历史作业向量数据库,缓解作业分布持续变化导致预测准确低的问题;使用基于diff的上下文学习,高亮历史作业与当前作业存在区别的部分,缓解检索到的历史样本重复内容过高限制预测准确性的问题。该方法显著提升了作业用时预测的准确性,为高性能计算平台作业调度提供了新工具与视角。北京大学刘洪毅博士为论文第一作者,研究院特聘副研究员马银萍为通讯作者。

 

      研究院的发展始终聚焦“前沿探索、国家所急、地方所需”,此次系列成果入选ICS 2025,标志着研究院在相关领域的基础研究能力再次获得国际学界认可。未来,研究院将继续发挥多学科交叉优势,推动系列成果在工程仿真、工业制造等领域实现技术转化及应用推广,为攻克复杂科学难题、突破工程计算瓶颈提供关键技术支撑;同时,进一步深化产学研合作,聚焦国家重大需求与国际科技前沿,以创新成果赋能高质量发展,为建设科技强国贡献智慧与力量。

 

会议简介

      ICS会议是高性能计算领域传统的权威国际会议之一,自1987年起每年举办,由美国计算机协会(ACM)SIGARCH主办。会议主要关注高性能计算系统的架构、软件和应用,涵盖从芯片到高性能计算系统的各个层面,包括处理器、加速器、存储、互连架构以及编程语言、编译器、运行时系统和高性能算法等,尤其关注这些学科间的交叉性研究课题。ICS会议是全球计算领域重要的学术交流平台,是高性能计算领域具有重要学术价值和影响力的会议。

 

研究团队负责人简介

杨 超

教育部长江学者特聘教授,北京大学长沙计算与数字经济研究院院长、先进计算研究中心主任,北京大学数学科学学院教授,北京大学大数据分析与应用技术国家工程实验室副主任

      长期从事与超大规模并行计算相关的模型、算法、软件和应用研究,主持国家自然科学基金重点项目、科技部重点研发项目等国家级科研项目10余项,发表学术论文100余篇,研究成果曾获2016 ACM Gordon Bell Prize(中国首次)、2017 中国科学院杰出科技成就奖、2017 CCF-IEEE CS青年科学家奖、2018茅以升北京青年科技奖、2020 王选杰出青年学者奖、2021-2022中国超算年度最佳应用奖(两次)、2024 ASPLOS最佳论文奖等,并三次入围ACM Gordon Bell Prize Finalist。目前担任National Science Review编委、SIAM Journal on Scientific Computing编委、《数值计算与计算机应用》副主编、中国工业与应用数学学会高性能计算与数学软件专业委员会副主任、中国新一代人工智能产业技术创新战略联盟“AI指令集与开发接口”标准专题组组长、IEEE C/DC 2941标准工作组副主任等职。
 

樊 春

北京大学长沙计算与数字经济研究院算力网络研究中心主任,北京大学计算中心系统管理室主任、正高级工程师,北京大学高性能计算平台主任工程师,中国计算机学会高性能计算专业委员会执行委员

      研究工作主要涉及高性能计算、人工智能算子、计算流体力学和纳米材料计算等领域。担任中国工业与应用数学学会高性能计算专业委员会委员,开放科学计算联盟副理事长。主持建设北京大学校级公共平台多套高性能计算集群,领导建设了算力中心一体化运维管理系统,形成了一套标准化的算力中心管理范式,并在多所高校和科研院所集群中推广应用。主持和参与了科技创新2030-新一代人工智能重大项目、国家重点研发计划、863计划、发改委重点专项、“十三五”国家重大科技基础设施、广东省重点领域研发计划等多个项目。作为北京大学超算队指导老师,带领学生获得第十届、第十一届ASC世界大学生超算竞赛冠军,SC20国际大学生超算竞赛第二名,SC23国际大学生超算竞赛第二名、LINPACK基准性能测试最高性能奖等优秀成绩。