超级计算集群概述
本文介绍超级计算集群高主频型scch5、通用型sccg5、GPU计算型sccgn6ne和GPU计算型sccgn6的特点,并列出了具体的实例规格。
超级计算集群介绍
超级计算集群(Super Computing Cluster,简称SCC)在弹性裸金属服务器基础上,加入高速RDMA(Remote Direct Memory Access)互联支持,大幅提升网络性能,提高大规模集群加速比。因此SCC在提供高带宽、低延迟优质网络的同时,还具备弹性裸金属服务器的所有优点。
SCC主要用于高性能计算和人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用场景。在集群内,各节点间通过RDMA网络互联,提供高带宽低延迟网络,保证了高性能计算和人工智能/机器学习等应用的高度并行需求。同时,RoCE(RDMA over Convergent Ethernet)网络速度达到InfiniBand网络级的性能,且能支持更广泛的基于Ethernet的应用。
SCC与阿里云ECS、GPU云服务器等计算类产品一起,为阿里云弹性高性能计算平台E-HPC提供了极致性能的并行计算资源,实现真正的云上超算。
机型对比
SCC与物理机、虚拟机的对比如下表所示。其中,Y表示支持,N表示不支持,N/A表示无数据。
功能分类 | 功能 | SCC | 物理机 | 虚拟机 |
---|---|---|---|---|
运维自动化 | 分钟级交付 | Y | N | Y |
计算 | 免性能损失 | Y | Y | N |
免特性损失 | Y | Y | N | |
免资源争抢 | Y | Y | N | |
存储 | 完全兼容ECS云盘系统 | Y | N | Y |
使用云盘(系统盘)启动 | Y | N | Y | |
系统盘快速重置 | Y | N | Y | |
使用云服务器ECS的镜像 | Y | N | Y | |
物理机和虚拟机之间相互冷迁移 | Y | N | Y | |
免操作系统安装 | Y | N | Y | |
免本地RAID,提供更高云盘数据保护 | Y | N | Y | |
网络 | 完全兼容ECS VPC网络 | Y | N | Y |
完全兼容ECS经典网络 | Y | N | Y | |
物理机集群和虚拟机集群间VPC无通信瓶颈 | Y | N | Y | |
管控 | 完全兼容ECS现有管控系统 | Y | N | Y |
VNC等用户体验和虚拟机保持一致 | Y | N | Y | |
带外网络安全 | Y | N | N/A |
高主频型超级计算集群实例规格族scch5
scch5的特点如下:
- 均为I/O优化实例
- 仅支持SSD云盘和高效云盘
- 同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
- 具备弹性裸金属服务器的所有特性
- 处理器:3.1 GHz主频的Intel ® Xeon ® Gold 6149(Skylake)
- 处理器与内存配比:1:3
- 适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
scch5包括的实例规格及指标数据如下:
实例规格 | vCPU | 物理内核 | 内存(GiB) | GPU | 网络带宽能力(出/入)(Gbit/s) | 网络收发包能力(出/入)(万PPS) | RoCE网络(出/入)(Gbit/s) | 支持IPv6 | 多队列 | 弹性网卡(包括一块主网卡) | 单块弹性网卡的私有IP |
---|---|---|---|---|---|---|---|---|---|---|---|
ecs.scch5.16xlarge | 64 | 32 | 192.0 | 无 | 10.0 | 450 | 25*2 | 否 | 8 | 32 | 10 |
说明
- ecs.scch5.16xlarge在32个物理内核上提供64个逻辑处理器。
- 您可以前往ECS实例可购买地域,查看实例的可购情况。
- 指标的含义请参见实例规格指标说明。
通用型超级计算集群实例规格族sccg5
sccg5的特点如下:
- 均为I/O优化实例
- 仅支持SSD云盘和高效云盘
- 同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
- 具备弹性裸金属服务器的所有特性
- 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake),计算性能稳定
- 处理器与内存配比:1:4
- 适用场景:
- 大规模机器学习训练
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
sccg5包括的实例规格及指标数据如下:
实例规格 | vCPU | 物理内核 | 内存(GiB) | GPU | 网络带宽能力(出/入)(Gbit/s) | 网络收发包能力(出/入)(万PPS) | RoCE网络(出/入)(Gbit/s) | 支持IPv6 | 多队列 | 弹性网卡(包括一块主网卡) | 单块弹性网卡的私有IP |
---|---|---|---|---|---|---|---|---|---|---|---|
ecs.sccg5.24xlarge | 96 | 48 | 384.0 | 无 | 10.0 | 450 | 25*2 | 否 | 8 | 32 | 10 |
说明
- ecs.sccg5.24xlarge在48个物理内核上提供96个逻辑处理器。
- 您可以前往ECS实例可购买地域,查看实例的可购情况。
- 指标的含义请参见实例规格指标说明。
GPU计算型超级计算集群实例规格族sccgn6ne
sccgn6ne的特点如下:
- I/O优化实例
- 处理器与内存配比为1:4
- 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake),计算性能稳定
- 具备弹性裸金属服务器的所有特性
- 存储支持:
- 支持ESSD云盘、SSD云盘和高效云盘
- 支持高性能并行文件系统CPFS
- 网络互连:
- 支持专有网络VPC
- 支持RoCE V2网络,用于低延迟的RDMA通信
- GPU加速器:V100(SXM2封装)
- 创新的Volta架构
- GPU显存32 GB HBM2
- CUDA Cores 5120
- Tensor Cores 640
- GPU显存带宽900 GB/s
- 支持6个NVLink链路,每个25 GB/s,总共300 GB/s
- 适用场景:
- 超大规模机器学习集群训练场景
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
sccgn6ne包括的实例规格及指标数据如下:
实例规格 | vCPU | 内存(GiB) | 本地存储(GiB) | GPU | GPU显存(GB) | 网络带宽能力(出/入)(Gbit/s) | 网络收发包能力(出/入)(万PPS) | RoCE网络(出/入)(Gbit/s) | 支持IPv6 | 多队列 | 弹性网卡(包括一块主网卡) | 单块弹性网卡的私有IP |
---|---|---|---|---|---|---|---|---|---|---|---|---|
ecs.sccgn6ne.24xlarge | 96 | 768.0 | 无 | V100*8 | 256 | 32 | 480 | 100 | 是 | 16 | 8 | 20 |
说明
- 您可以前往ECS实例可购买地域,查看实例的可购情况。
- 如果查看不到sccgn6ne,请提交工单咨询是否需要先申请再使用。
- 指标的含义请参见实例规格指标说明。
GPU计算型超级计算集群实例规格族sccgn6
sccgn6的特点如下:
- I/O优化实例
- 处理器与内存配比为1:4
- 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake),计算性能稳定
- 具备弹性裸金属服务器的所有特性
- 存储支持:
- 支持ESSD云盘、SSD云盘和高效云盘
- 支持高性能并行文件系统CPFS
- 网络互连:
- 支持专有网络VPC
- 支持RoCE V2网络,用于低延迟的RDMA通信
- GPU加速器:V100(SXM2封装)
- 创新的Volta架构
- GPU显存16 GB HBM2
- CUDA Cores 5120
- Tensor Cores 640
- GPU显存带宽900 GB/s
- 支持6个NVLink链路,每个25 GB/s,总共300 GB/s
- 适用场景:
- 超大规模机器学习集群训练场景
- 大规模高性能科学计算和仿真计算
- 大规模数据分析、批量计算、视频编码
sccgn6包括的实例规格及指标数据如下:
实例规格 | vCPU | 内存(GiB) | 本地存储(GiB) | GPU | 网络带宽能力(出/入)(Gbit/s) | 网络收发包能力(出/入)(万PPS) | RoCE网络(出/入)(Gbit/s) | 支持IPv6 | 多队列 | 弹性网卡(包括一块主网卡) | 单块弹性网卡的私有IP |
---|---|---|---|---|---|---|---|---|---|---|---|
ecs.sccgn6.24xlarge | 96 | 384.0 | 无 | V100*8 | 30 | 450 | 25*2 | 是 | 8 | 32 | 10 |
说明
- 您可以前往ECS实例可购买地域,查看实例的可购情况。
- 指标的含义请参见实例规格指标说明。
计费方式
SCC支持按量付费和包年包月。不同计费方式的区别,请参见计费方式对比。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
评论