阿里云
阿里云多端小程序中小企业获客首选
发表主题 回复主题
  • 1017阅读
  • 0回复

[云安全技术和产品专区 ]云监控E-MapReduce监控

级别: 论坛粉丝
发帖
1227
云币
2325
=#/Kg_RKL  
E-MapReduce L;* s-j6y  
概览 3*& Y'/!  
云监控通过监控 E-MapReduce 集群的 CPU 空闲率、内存容量、磁盘容量等多个监控项,帮助用户监测集群的运行状态,并支持用户对监控项设置报警规则。用户购买 E-MapReduce 服务后,云监控会动对上述监控项收集数据 KW(a@X  
监控服务 VJ=>2'I  
监控项 %rMCiz  
云监控提供的监控指标见如下列表,hadoop 指标含义可参考官网文档
监控项维度单位最小监控粒度
网络流入速率用户维度、集群维度、角色维度bits/s30s
网络流出速率用户维度、集群维度、角色维度bits/s30s
CPU空闲率用户维度、集群维度、角色维度%1分钟
用户态CPU使用率用户维度、集群维度、角色维度%30s
系统态CPU使用率用户维度、集群维度、角色维度%30s
空闲磁盘容量用户维度、集群维度、角色维度Bytes30s
磁盘总容量用户维度、集群维度、角色维度Bytes30s
15分钟平均负载用户维度、集群维度、角色维度-30s
5分钟平均负载用户维度、集群维度、角色维度-30s
1分钟平均负载用户维度、集群维度、角色维度-30s
空闲内存容量用户维度、集群维度、角色维度Bytes30s
总内存容量用户维度、集群维度、角色维度Bytes30s
数据包流入速率用户维度、集群维度、角色维度个/秒30s
数据包流出速率用户维度、集群维度、角色维度个/秒30s
运行中的进程数目用户维度、集群维度、角色维度30s
总进程数目用户维度、集群维度、角色维度30s
阻塞的进程数目用户维度、集群维度、角色维度30s
创建的进程/线程数目用户维度、集群维度、角色维度30s
MemNonHeapUsedM用户维度、集群维度、角色维度Bytes30s
MemNonHeapCommittedM用户维度、集群维度、角色维度Bytes30s
MemNonHeapMaxM用户维度、集群维度、角色维度Bytes30s
MemHeapUsedM用户维度、集群维度、角色维度Bytes30s
MemHeapCommittedM用户维度、集群维度、角色维度Bytes30s
MemHeapMaxM用户维度、集群维度、角色维度Bytes30s
MemMaxM用户维度、集群维度、角色维度Bytes30s
ThreadsNew用户维度、集群维度、角色维度-30s
ThreadsRunnable用户维度、集群维度、角色维度-30s
ThreadsBlocked用户维度、集群维度、角色维度-30s
ThreadsWaiting用户维度、集群维度、角色维度-30s
ThreadsTimedWaiting用户维度、集群维度、角色维度-30s
ThreadsTerminated用户维度、集群维度、角色维度-30s
GcCount用户维度、集群维度、角色维度-30s
GcTimeMillis用户维度、集群维度、角色维度-30s
CallQueueLength用户维度、集群维度、角色维度-30s
NumOpenConnections用户维度、集群维度、角色维度-30s
ReceivedBytes用户维度、集群维度、角色维度-30s
SentBytes用户维度、集群维度、角色维度-30s
BlockCapacity用户维度、集群维度、角色维度-30s
BlocksTotal用户维度、集群维度、角色维度-30s
CapacityRemaining用户维度、集群维度、角色维度-30s
CapacityTotal用户维度、集群维度、角色维度-30s
CapacityUsed用户维度、集群维度、角色维度-30s
CapacityUsedNonDFS用户维度、集群维度、角色维度-30s
CorruptBlocks用户维度、集群维度、角色维度-30s
ExcessBlocks用户维度、集群维度、角色维度-30s
ExpiredHeartbeats用户维度、集群维度、角色维度-30s
MissingBlocks用户维度、集群维度、角色维度-30s
PendingDataNodeMessageCount用户维度、集群维度、角色维度-30s
PendingDeletionBlocks用户维度、集群维度、角色维度-30s
PendingReplicationBlocks用户维度、集群维度、角色维度-30s
PostponedMisreplicatedBlocks用户维度、集群维度、角色维度-30s
ScheduledReplicationBlocks用户维度、集群维度、角色维度-30s
TotalFiles用户维度、集群维度、角色维度-30s
TotalLoad用户维度、集群维度、角色维度-30s
UnderReplicatedBlocks用户维度、集群维度、角色维度-30s
BlocksRead用户维度、集群维度、角色维度-30s
BlocksRemoved用户维度、集群维度、角色维度-30s
BlocksReplicated用户维度、集群维度、角色维度-30s
BlocksUncached用户维度、集群维度、角色维度-30s
BlocksVerified用户维度、集群维度、角色维度-30s
BlockVerificationFailures用户维度、集群维度、角色维度-30s
BlocksWritten用户维度、集群维度、角色维度-30s
BytesRead用户维度、集群维度、角色维度-30s
BytesWritten用户维度、集群维度、角色维度-30s
FlushNanosAvgTime用户维度、集群维度、角色维度-30s
FlushNanosNumOps用户维度、集群维度、角色维度-30s
FsyncCount用户维度、集群维度、角色维度-30s
VolumeFailures用户维度、集群维度、角色维度-30s
ReadBlockOpNumOps用户维度、集群维度、角色维度-30s
ReadBlockOpAvgTime用户维度、集群维度、角色维度ms30s
WriteBlockOpNumOps用户维度、集群维度、角色维度-30s
WriteBlockOpAvgTime用户维度、集群维度、角色维度ms30s
BlockChecksumOpNumOps用户维度、集群维度、角色维度-30s
BlockChecksumOpAvgTime用户维度、集群维度、角色维度ms30s
CopyBlockOpNumOps用户维度、集群维度、角色维度-30s
CopyBlockOpAvgTime用户维度、集群维度、角色维度ms30s
ReplaceBlockOpNumOps用户维度、集群维度、角色维度-30s
ReplaceBlockOpAvgTime用户维度、集群维度、角色维度ms30s
BlockReportsNumOps用户维度、集群维度、角色维度-30s
BlockReportsAvgTime用户维度、集群维度、角色维度ms30s
NodeManager_AllocatedContainers用户维度、集群维度、角色维度-30s
ContainersCompleted用户维度、集群维度、角色维度-30s
ContainersFailed用户维度、集群维度、角色维度-30s
ContainersIniting用户维度、集群维度、角色维度-30s
ContainersKilled用户维度、集群维度、角色维度-30s
ContainersLaunched用户维度、集群维度、角色维度-30s
ContainersRunning用户维度、集群维度、角色维度-30s
ActiveApplications用户维度、集群维度、角色维度-30s
ActiveUsers用户维度、集群维度、角色维度-30s
AggregateContainersAllocated用户维度、集群维度、角色维度-30s
AggregateContainersReleased用户维度、集群维度、角色维度-30s
AllocatedContainers用户维度、集群维度、角色维度-30s
AppsCompleted用户维度、集群维度、角色维度-30s
AppsFailed用户维度、集群维度、角色维度-30s
AppsKilled用户维度、集群维度、角色维度-30s
AppsPending用户维度、集群维度、角色维度-30s
AppsRunning用户维度、集群维度、角色维度-30s
AppsSubmitted用户维度、集群维度、角色维度-30s
AvailableMB用户维度、集群维度、角色维度-30s
AvailableVCores用户维度、集群维度、角色维度-30s
PendingContainers用户维度、集群维度、角色维度-30s
ReservedContainers用户维度、集群维度、角色维度-30s
t|$ jgM  
注意事项 P&uSh?[ ^  
  • 监控数据最多保存31天。
  • 用户最多可连续查看14天的监控数据。
&yvvea]  
查看监控数据 HJ]xZ83pC  
  1. 登录云监控控制台
  2. 进入[backcolor=transparent]云服务监控下的[backcolor=transparent]E-MapReduce实例列表。
  3. 点击实例名称或[backcolor=transparent]操作中的[backcolor=transparent]监控图表即可进入实例监控详情页面,查看各项指标。
  4. 点击页面上方的[backcolor=transparent]时间范围快速选择按钮或精确选择功能,监控数据最长支持查看连续14天的监控数据。
  5. 点击监控图右上角的[backcolor=transparent]放大按钮,可查看监控大图。
V2ih/mh   
报警服务 R>* z8n  
参数说明 Td'Mc-/  
  • 监控项:即 E-MapReduce 服务提供的监控指标。
  • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为1分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。
  • -BH/)$-$  
    统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。
      !1G KpL  
      平均值:统计周期内监控数据的平均值。例如统计方法选择15分钟内采集的所有监控数据的平均值,则当平均值大于80%时,才算超过阈值。
    1. 最大值:统计周期内监控数据的最大值。例如统计方法选择15分钟内采集的所有监控数据的最大值,则当最大值大于80%时,才算超过阈值。
    2. 最小值:统计周期内监控数据的最小值。例如统计方法选择15分钟内采集的所有监控数据的最小值,则当最小值大于80%时,才算超过阈值。
    3. 求和值:统计周期内监控数据的总和。例如统计方法选择15分钟内采集的所有监控数据的求和值,则当求和值大于80%时,才算超过阈值。流量类指标需要用到此类统计方法。
  • $G-<kC}8:  
    连续次数:指连续几个统计周期监控项的值持续超过阈值后触发报警。 ${MzO i  
    例如:设置 CPU 使用率超过80%报警,统计周期为 5 分钟,连续 3 次超过阈值后报警,则第一次探测 CPU 使用率超过 80% 时,不会发出报警通知。5分钟后第二次探测 CPU 使用率超过80%,也不会发出报警。第三次探测仍然超过 80% 时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期×(连续探测次数-1)=5×(3-1)=10分钟。
GLn=*Dh#  
设置单条报警规则  SvT0%2  
  1. 登录云监控控制台。
  2. 进入[backcolor=transparent]云服务监控下的[backcolor=transparent]E-MapReduce实例列表。
  3. 点击实例名称或[backcolor=transparent]操作中的[backcolor=transparent]监控图表即可进入实例监控详情页面。
  4. 点击监控图右上角的[backcolor=transparent]铃铛按钮或页面右上角的[backcolor=transparent]新建报警规则,可对该实例对应的监控项设置报警规则。
Qds<j{2  
设置批量报警规则 <NMJkl-r8r  
  1. 登录云监控控制台。
  2. 进入[backcolor=transparent]云服务监控下的[backcolor=transparent]E-MapReduce监控实例列表。
  3. 实例列表页面选中所需实例后,在页面下方点击[backcolor=transparent]设置报警规则,即可批量添加报警规则。
*O :JECKU  
[ 此帖被反向一觉在2017-10-31 11:34重新编辑 ]
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: ECS是阿里云提供的什么服务? 正确答案:云服务器
上一个 下一个
      ×
      全新阿里云开发者社区, 去探索开发者的新世界吧!
      一站式的体验,更多的精彩!
      通过下面领域大门,一起探索新的技术世界吧~ (点击图标进入)