本文介绍如何通过云监控控制台或云监控API来实现对CPFS文件系统的监控和报警。

前提条件

已创建文件系统,详情请参见创建文件系统

背景信息

您可以使用云监控查看CPFS文件系统的性能指标,并且配置相应的报警。目前支持的性能指标包括读写吞吐、IOPS、延时和元数据操作QPS,报警方式包括电话、短信、邮件等。性能指标描述如下表所示。

说明 目前CPFS和NAS共用云监控控制台,您可以在文件系统NAS产品中查询CPFS文件系统列表。
性能指标 MetricName 描述
读吞吐 ThruputRead 文件系统读吞吐,单位为Bytes/sec
写吞吐 ThruputWrite 文件系统写吞吐,单位为Bytes/sec
读IOPS IopsRead 文件系统的读数据IOPS
写IOPS IopsWrite 文件系统的写数据IOPS
读延时 LatencyRead 读数据IO时延,单位为毫秒(ms)
写延时 LatencyWrite 写数据IO时延,单位为毫秒(ms)
元数据操作QPS QpsMeta 文件系统元数据操作QPS,例如open、close、stat、create、chmod等

查看性能指标

  1. 登录云监控管理控制台
  2. 选择Dashboard > 云产品监控
  3. 云产品监控页面,选择文件系统NAS及对应的地域和文件系统,查看监控图表。
    查看指标性能 配置监控和报警_用户指南_文件存储 CPFS 阿里云技术文档
    说明 如果图表显示无数据,则说明您选择的文件系统长时间没有向服务端发起任何请求。如果要制造写吞吐监控数据,可以在挂载CPFS的ECS上执行fio命令(假设CPFS挂载目录为/mnt):fio-direct=1-ioengine=libaio-iodepth=1-rw=write-bs=1m-size=1G-numjobs=256 -runtime=600-time_based=1-group_reporting-directory="/mnt" -name=Seq_Write_Testing

配置报警规则

  1. 登录云监控管理控制台
  2. 选择报警服务 > 报警规则,单击创建报警规则
  3. 创建报警规则页面,配置相关信息。
    配置项 说明
    关联资源
    • 产品选项中,选择文件存储NAS
    • 资源范围选项中,选择文件系统
    • 地域选项中,选择目标文件系统所在地域。
    • 文件系统选项中,选择目标文件系统。
    设置报警规则 根据需求设置报警规则,可添加多条报警规则,详细参数说明请参见报警规则参数说明
    通知方式 设置报警通知对象及报警等级等信息。

    单击快速创建联系人组,可创建联系人组,详情请参见创建报警联系人/报警联系组

    说明 如果您要实现电话报警,请单击购买电话报警资源包。根据页面提示完成购买后可勾选电话+短信+邮件+钉钉机器人 (Critical) 选项。
  4. 单击确认,使报警规则设置生效。

    当文件系统的监控项超过设定阈值后会自动发送报警通知,帮您及时得知监控数据异常并快速进行处理。

通过API获取监控数据

CPFS的监控数据还可以通过云监控的API查询,主要API如下所示。

CPFS的请求参数说明如下表所示。

名称
Namespace acs_nas
MetricName IopsRead、IopsWrite、LatencyRead、LatencyWrite、QpsMeta、ThruputRead、ThruputWriteIopsRead
Dimensions {"userId":"xxxxxx","fileSystemId":"cpfs-xxxxx"}