使用
本项目面向开发和测试人员,基于Vagrant,采用VirtualBox作为Provider,提供slurm+OpenSCOW集群一键部署方案,极大简化了部署流程和部署门槛。
部署slurm+OpenSCOW四节点集群,节点角色及默认配置如下表所示:
| 节点名称/角色 | 主要服务 | 私网IP | 配置 |
|---|---|---|---|
| scow | scow:portal、mis、auth、gateway | 192.168.88.100 | 4C4G |
| slurm | slurmdbd、slurmctld、slurmd、mariadb、nfs-server、slapd、sssd | 192.168.88.101 | 2C2G |
| login | slurmd、sssd、nfs、Xfce、KDE、MATE、cinnamon | 192.168.88.102 | 2C2G |
| cn01 | slurmd、sssd、nfs、Xfce、KDE、MATE、cinnamon | 192.168.88.103 | 2C2G |
1. 集群一键部署
把scow-vagrant项目clone下来,在这个项目根目录下执行以下命令:
git clone https://github.com/PKUHPC/scow-vagrant.git
部署前准备:
- 下载最新Release的openscow-cli,拷贝至
scow\scow-deployment目录,并命名为cli; - 编译生成最新的适配器可执行程序(CentOS7.9),替换
adapter目录下的scow-slurm-adapter-amd64(默认为与OpenSCOWv1.2.3匹配版本),编译参考文档; - 修改配置文件
scow\scow-deployment\install.yaml,imageTag修改为与cli匹配的版本,例如v1.2.3。
一键部署命令:
vagrant up

- 第一次部署需要从vagrant clould拉取vagrant镜像,速度会比较慢,请耐心等待。