资源监控
资源监控功能模块提供Pod监控、VKS(弹性容器集群)监控、Pod资源明细,示例页面如下图所示。
前提条件
操作步骤
Pod监控
查看Pod监控的操作步骤如下所示。
- 使用已注册的企业账号登录平台,点击[产品中心]菜单项,默认进入弹性容器集群列表页面,切换至[资源监控]菜单项,进入资源监控页面。
- 选择待查看的智算中心,本例选择“北京四区”;选配Pod监控各类参数,例如:Pod、运行时间段、运行时长、图表类型等。
- 参数配置完成后,页面加载对应的图表,例如:已选择Pod每个整点的资源占用量、已选择Pod每个整点的资源使用量或者已选择Pod每个整点的资源使用率(资源使用量/资源占用量×100%)。图表示例及说明入下所示。
- 资源占用量
- 资源使用量
- 资源使用率
资源占用量示例页面如下所示,指标说明如下所示。
-
GPU卡数:每个整点该Pod(容器组)在运行过程中占用GPU卡的数量。
-
GPU显存:每个整点该Pod(容器组)所使用的GPU卡的显存量。
-
CPU:每个整点该Pod(容器组)运行时占用的CPU数量。
-
MEM:每个整点该Pod(容器组)运行期间占用系统内存(RAM)的大小。
资源使用量示例页面如下所示,指标说明如下所示。
-
GPU功耗:每个整点该Pod(容器组)在运行过程中使用GPU卡的功耗。
-
GPU卡数:每个整点该Pod(容器组)在运行过程中使用GPU卡的数量。
-
GPU显存:每个整点该Pod(容器组)实际使用GPU卡的显存量。
-
CPU:每个整点该Pod(容器组)运行时实际使用的CPU数量。
-
MEM:每个整点该Pod(容器组)运行期间实际使用系统内存(RAM)的大小。
资源使用率示例页面如下图所示,指标说明如下所示。
-
GPU SM:每个整点该Pod(容器组)实际使用SM卡均利用率。
-
GPU显存:每个整点该Pod(容器组)实际使用GPU利用率。
-
CPU:每个整点该Pod(容器组)运行时实际使用CPU的利用率。
-
MEM:每个整点该Pod(容器组)运行时实际使用RAM的利用率。
VKS监控
查看VKS监控的操作步骤如下所示。
- 使用已注册的企业账号登录平台,点击[产品中心]菜单项,默认进入弹性容器集群列表页面,切换至[资源监控]菜单项,进入资源监控页面。
- 选择待查看的智算中心,本例选择“北京四区”;选配VKS监控各类筛选参数,例如:VKS、运行时间段、运行时长、图表类型等。
- 参数配置完成后,页面加载对应的图表,例如:已选择VKS每个整点的资源占用量、已选择VKS每个整点的资源使用量或者已选择VKS每个整点的资源使用率(资源使用量/资源占用量×100%)。图表示例及说明入下所示。
- 资源占用量
- 资源使用量
- 资源使用率
资源占用量示例页面如下所示,指标说明如下所示。
-
GPU SM:每个整点该VKS(弹性容器集群)运行期间SM卡的利用率。
-
GPU显存:每个整点该VKS(弹性容器集群)运行期间使用的GPU卡的显存量。
-
CPU:每个整点该VKS(弹性容器集群)运行期间使用的CPU数量。
-
MEM:每个整点该VKS(弹性容器集群)运行期间使用系统内存(RAM)的大小。
资源使用量示例页面如下所示,指标说明如下所示。
-
GPU功耗:每个整点该VKS(弹性容器集群)在运行过程中使用GPU卡的功耗。
-
GPU卡数:每个整点该VKS(弹性容器集群)在运行过程中使用GPU卡的数量。
-
GPU显存:每个整点该VKS(弹性容器集群)实际使用GPU卡的显存量。
-
CPU:每个整点该VKS(弹性容器集群)运行时实际使用的CPU数量。
-
MEM:每个整点该VKS(弹性容器集群)运行期间实际使用系统内存(RAM)的大小。
资源使用率示例页面如下图所示,指标说明如下所示。
-
GPU SM:每个整点该VKS实际使用SM卡均利用率。
-
GPU显存:每个整点该VKS实际使用GPU利用率。
-
CPU:每个整点该VKS运行时实际使用CPU的利用率。
-
MEM:每个整点该VKS运行时实际使用RAM的利用率。
Pod资源明细
支持用户查看Pod中GPU、CPU、MEM资源的占用、使用情况 支持权限管理,子用户查看VKS授权管理范围内的Pod。例如下图所示。