阿里云
阿里云多端小程序中小企业获客首选
发表主题 回复主题
  • 1315阅读
  • 0回复

[云安全技术和产品专区 ]云监控主机监控的监控项说明

级别: 论坛粉丝
发帖
1227
云币
2325
主机监控的监控项分为插件采集的监控项和ECS 原生带的监控项两部分,插件采集频率为15秒一次,ECS 基础监控数据采集频率为1分钟1次。 9j$J}=y  
ptTp63+  
注意事项 n)rSgzI  
您在查看ECS基础监控和操作系统监控数据时,可能会存在数据不一致的情况,主要有以下原因:
  • 统计频率不同。监控图表中提供的数据均为统计周期内的平均值,基础监控统计频率是1分钟,操作系统统计频率是15秒,所以如果监控数据波动比较大时,会出现基础监控数据比操作系统监控数据小的情况,因为数据被削峰填谷了。
  • 数据统计视角不同:基础监控的网络流量统计计费维度数据,除去了ECS和SLB之间不计费的网络流量。操作系统监控的网络流量,记录每张网卡实际的网络流量。所以会出现操作系统监控的网络数据大于基础监控网络数据的情况(即出现插件采集的数据比实际购买的带宽或流量大的情况)。
<is%lx(GDX  
插件采集指标  -to3I  
CPU 相关监控项 ;})s o  
以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。
监控项名称监控项含义单位说明
Host.cpu.idle当前空闲CPU百分比%
Host.cpu.system当前内核空间占用CPU百分比%指系统上下文切换的消耗,该监控项数值比较高,说明服务开了太多的进程或者线程
Host.cpu.user当前用户空间占用CPU百分比%用户进程对CPU的消耗
Host.cpu.iowait当前等待IO操作的CPU百分比%该项数值比较高说明有很频繁的IO操作
Host.cpu.other其他占用CPU百分比%其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗
Host.cpu.total当前消耗的总CPU百分比%指以上各项CPU消耗的总和,通常用于报警
k#<Y2FJa  
d0-T\\U  
内存相关监控项 jn>RE   
以下为内存相关监控项,可参考free命令来理解各项指标含义。
监控项名称监控项含义单位说明
Host.mem.total内存总量bytes服务器的内存总量
Host.mem.used已用内存量bytes用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间
Host.mem.actualused用户实际使用的内存bytes计算方法为(used - buffers - cached)
Host.mem.free剩余内存量bytes计算方法为(内存总量-已用内存量)
Host.mem.freeutilization剩余内存百分比%计算方法为(剩余内存量/内存总量*100%)
Host.mem.usedutilization内存使用率%计算方法为( Actual used/total*100%)
./}W3  
J\\o# -H  
系统平均负载监控项 # |,c3$  
xBAASy  
以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。
监控项名称监控项含义单位
Host.load1过去1分钟的系统平均负载,Windows操作系统没有此指标
Host.load5过去5分钟的系统平均负载,Windows操作系统没有此指标
Host.load15过去15分钟的系统平均负载,Windows操作系统没有此指标
pv,I_"  
8#15*'Y  
磁盘相关监控项 jR{Rd}QtQ  
  • 磁盘使用率与inode使用率可参考Linux df命令。
  • 磁盘读写指标可参考Linux iostat命令。
监控项名称监控项含义单位
Host.diskusage.used磁盘的已用存储空间bytes
Host.disk.utilization磁盘使用率%
Host.diskusage.free磁盘的剩余存储空间bytes
Host.diskussage.total磁盘存储总量bytes
Host.disk.readbytes磁盘每秒读取的字节数bytes/s
Host.disk.writebytes磁盘每秒写入的字节数bytes/s
Host.disk.readiops磁盘每秒的读请求数量次/秒
Host.disk.writeiops磁盘每秒的写请求数量次/秒
GD }i=TK  
]s~%1bd  
文件系统监控项 ;r3|EA35  
监控项名称监控项含义单位说明
Host.fs.inodeinode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标%inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高
yUu+68Z6  
*@[+C~U  
网络相关监控项 @'FOM  
  • 以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。
  • TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:
  1. [backcolor=transparent]Linux[backcolor=transparent]操作系统
  2. [backcolor=transparent]    [backcolor=transparent]您可以将[backcolor=transparent]cloudmonitor[backcolor=transparent]/[backcolor=transparent]config[backcolor=transparent]/[backcolor=transparent]conf[backcolor=transparent].[backcolor=transparent]properties[backcolor=transparent]配置文件的[backcolor=transparent]netstat[backcolor=transparent].[backcolor=transparent]tcp[backcolor=transparent].[backcolor=transparent]disable[backcolor=transparent]改为[backcolor=transparent]false[backcolor=transparent]来开启采集。修改配置后请重启[backcolor=transparent]Agent[backcolor=transparent]
  3. [backcolor=transparent]Windows[backcolor=transparent]操作系统
  4. [backcolor=transparent]    [backcolor=transparent]您可以在[backcolor=transparent]C[backcolor=transparent]:[backcolor=transparent]\”[backcolor=transparent]Program[backcolor=transparent] [backcolor=transparent]Files[backcolor=transparent][backcolor=transparent]\Alibaba\cloudmonitor\config[backcolor=transparent]的配置文件中,将[backcolor=transparent]netstat[backcolor=transparent].[backcolor=transparent]tcp[backcolor=transparent].[backcolor=transparent]disable[backcolor=transparent]改为[backcolor=transparent]false[backcolor=transparent]来开启采集。修改配置后请重启[backcolor=transparent]Agent[backcolor=transparent]
监控项名称监控项含义单位
Host.netin.rate网卡每秒接收的比特数,即网卡的上行带宽bits/s
Host.netout.rate网卡每秒发送的比特数,即网卡的下行带宽bits/s
Host.netin.packages网卡每秒接收的数据包数个/秒
Host.netout.packages网卡每秒发送的数据包数个/秒
Host.netin.errorpackage设备驱动器检测到的接收错误包的数量个/秒
Host.netout.errorpackages设备驱动器检测到的发送错误包的数量个/秒
Host.tcpconnection各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED
G0v<`/|>}  
aT PmW]w6  
进程相关监控项 HH'5kE0;d  
  • 进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。
  • Host.process.openfile 可参考Linux lsof命令。
  • Host.process.number 可参考Linux ps aux |grep ‘关键字’ 命令。
监控项名称监控项含义单位
Host.process.cpu某个进程消耗的CPU百分比%
Host.process.memory某个进程消耗的内存百分比%
Host.process.openfile当前进程打开文件数
Host.process.number指定关键字的进程数
NU!B|l  
,98`tB0  
ECS自带监控项 %ysf FE  
如果您的主机是ECS服务器,以下监控项为购买ECS后,不需要安装插件就可以提供的监控项。指标采集粒度为1分钟。[tr=rgb(239, 251, 255)][td]ECS.SystemDiskWriteOps
监控项名称监控项含义单位
ECS.CPUUtilizationCPU使用率%
ECS.InternetInRate公网入流量平均速率bits/s
ECS.IntranetInRate私网入流量平均速率bits/s
ECS.InternetOutRate公网出流量平均速率bits/s
ECS.IntranetOutRate私网出流量平均速率bits/s
ECS.SystemDiskReadbps系统磁盘每秒读取字节总数Bytes/s
ECS.SystemDiskWritebps系统磁盘每秒写入字节总数Bytes/s
ECS.SystemDiskReadOps系统磁盘每秒读取次数个/秒
系统磁盘每秒写入次数个/秒
ECS.InternetIn公网流入流量bytes
ECS.InternetOut公网流出流量bytes
ECS.IntranetIn内网流入流量bytes
ECS.IntranetOut内网流出流量bytes
TS;?>J-  
[ 此帖被反向一觉在2017-10-31 10:24重新编辑 ]
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您在写长篇帖子又不马上发表,建议存为草稿
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个
      ×
      全新阿里云开发者社区, 去探索开发者的新世界吧!
      一站式的体验,更多的精彩!
      通过下面领域大门,一起探索新的技术世界吧~ (点击图标进入)