跳到主要内容

资源监控

更新时间:2025-07-29 16:44:44

资源监控功能模块提供Pod监控、VKS(弹性容器集群)监控、Pod资源明细,示例页面如下图所示。

1739431477628

前提条件

  • 用户已经获取Alaya NeW企业账户和密码,如果需要帮助或尚未注册,可参考注册账户完成注册。
  • 用户已开通并使用弹性容器集群资源,且集群运行正常。如尚未开通,可参考开通弹性容器集群完成开通。

操作步骤

Pod监控

查看Pod监控的操作步骤如下所示。

  1. 使用已注册的企业账号登录平台,点击[产品中心]菜单项,默认进入弹性容器集群列表页面,切换至[资源监控]菜单项,进入资源监控页面。
  2. 选择待查看的智算中心,本例选择“北京四区”;选配Pod监控各类参数,例如:Pod、运行时间段、运行时长、图表类型等。
  3. 参数配置完成后,页面加载对应的图表,例如:已选择Pod每个整点的资源占用量、已选择Pod每个整点的资源使用量或者已选择Pod每个整点的资源使用率(资源使用量/资源占用量×100%)。图表示例及说明入下所示。

资源占用量示例页面如下所示,指标说明如下所示。

1739431477628

  • GPU卡数:每个整点该Pod(容器组)在运行过程中占用GPU卡的数量。

  • GPU显存:每个整点该Pod(容器组)所使用的GPU卡的显存量。

  • CPU:每个整点该Pod(容器组)运行时占用的CPU数量。

  • MEM:每个整点该Pod(容器组)运行期间占用系统内存(RAM)的大小。

VKS监控

查看VKS监控的操作步骤如下所示。

  1. 使用已注册的企业账号登录平台,点击[产品中心]菜单项,默认进入弹性容器集群列表页面,切换至[资源监控]菜单项,进入资源监控页面。
  2. 选择待查看的智算中心,本例选择“北京四区”;选配VKS监控各类筛选参数,例如:VKS、运行时间段、运行时长、图表类型等。
  3. 参数配置完成后,页面加载对应的图表,例如:已选择VKS每个整点的资源占用量、已选择VKS每个整点的资源使用量或者已选择VKS每个整点的资源使用率(资源使用量/资源占用量×100%)。图表示例及说明入下所示。

资源占用量示例页面如下所示,指标说明如下所示。

1739431477628

  • GPU SM:每个整点该VKS(弹性容器集群)运行期间SM卡的利用率。

  • GPU显存:每个整点该VKS(弹性容器集群)运行期间使用的GPU卡的显存量。

  • CPU:每个整点该VKS(弹性容器集群)运行期间使用的CPU数量。

  • MEM:每个整点该VKS(弹性容器集群)运行期间使用系统内存(RAM)的大小。

Pod资源明细

支持用户查看Pod中GPU、CPU、MEM资源的占用、使用情况 支持权限管理,子用户查看VKS授权管理范围内的Pod。例如下图所示。

1739431477628