科研创新

SCIENTIFIC RESEARCH INNOVATION

算力网络研究中心
科研成果
具有自主知识产权的算力中心门户和管理平台——SCOW

随着高性能计算行业的快速发展以及国家“东数西算”工程的全面启动,为了解决算力中心在运营管理和使用中存在的不足,满足算力中心的管理和维护需求,樊春老师带领研究团队研发了具有自主知识产权的算力中心门户和管理平台——SCOW(Super Computing On Web)。它基于标准化管理平台,实现异构平台统一抽象,简化集群软件的部署流程、统一平台管理模式、降低用户使用门槛,只需要一个浏览器即可管理集群上的文件、访问终端及桌面、提交和管理作业,以及执行带GUI的交互式任务。实现了算力中心资源易管理、易使用的目标,提高算力资源使用效率。

针对算力中心的实际应用场景和需求,SCOW包含了服务算力中心用户的门户系统以及服务用户和管理员的管理系统。门户系统为用户提供作业管理、文件管理、交互式应用和终端访问等功能。管理系统为用户和管理员提供用户空间、账户管理、租户管理、平台管理等集群管理功能。相比传统超算系统,SCOW系统具有以下几大亮点:

1 图形化界面,使用方便
在SCOW门户平台,算力中心用户无需了解和配置SSH、VNC、命令行等功能,直接在浏览器上就可以使用集群算力资源。不同于传统超算基于命令行的使用模式,平台门户系统提供基于web页面的作业提交、shell连接、远程桌面连接、交互式应用连接以及文件管理相关功能,极大降低了用户使用门槛,让Linux小白用户也能顺利提交作业。
2 功能丰富,管理简单
SCOW管理平台提供了一套标准化的算力中心管理模式以及用户账户模型(租户-账户-用户三级模型)和计费收费模型,并且支持多集群管理,可以在一个系统内管理算力中心的多个集群,能够帮助新建的算力中心快速建立管理和运营制度。管理系统提供了账户管理、租户管理、平台管理、财务管理等功能,管理员和运营人员可以很容易在浏览器上实现管理团队的人员和资源,灵活分配人员权限和机时份额,封锁解封团队用户等精细化操作。
3 一体化部署,开箱即用
SCOW项目提供了简易的部署功能,项目具备了包括调度系统、认证系统、共享存储在内的一体化部署能力,可以快速在新建的集群中部署上线。同时,SCOW项目也提供了基于web的用户导入、认证系统接入等各类接入功能,可以快速接入现有集群。支持门户系统系统和管理系统同时部署,也可根据用户需求只部署门户系统或管理系统。部署几乎无侵入,可与其他管理平台共存。
4 标准化平台,支持算力融合
SCOW实现了一套标准的平台接口,为实现跨中心的算力融合打下了基础。团队正在SCOW实现的异构平台统一抽象基础上,进行一体化算力网络融合平台的研制,旨在打通算力网络中各算力中心的管理、使用、结算通道,连通算力孤岛,实现算力灵活接入、统一调度。解决多应用灵活接入,复杂网络环境下低延迟高性能应用可视化技术,多中心多集群文件传输与管理,算力中心的标准化运营管理,多中心统一结算等问题。
5 开源中立,独立自主
SCOW由团队自主开发,并作为开源项目运营,项目采用木兰宽松许可证,世界各地的平台均可免费部署使用,不依赖任何供应商,实现了真正的开放、中立。
截止目前,SCOW已完成了在北京大学超算平台、国家天文台超算平台、中南大学超算平台、中科院高能物理所超算平台、香侬云超算平台等多个平台的部署。欢迎大家下载和部署SCOW系统。
试用管理员用户:用户名:demo_admin  登录密码:demo_admin
试用普通用户:用户名:demo_user  登录密码:demo_user