阿里云
向代码致敬,寻找你的第83行
发表主题 回复主题
  • 452阅读
  • 1回复

[干货分享]如何从零开始搭建ELK+GPE监控预警系统绝对干货

级别: 码农
发帖
128
云币
331
Z[ 53cVT^  
本文可能不会详细记录每一步实现的过程,但一定程度上可以引领小伙伴走向更开阔的视野,串联每个环节,呈现予你不一样的效果。 <eh<4_<qF  
0Yk$f1g  
Fv} Uq\v[  
一、业务规模 r`\6+Ntb.  
cU|tG!Ij?  
 &*Z"r*  
q/h , jM  
u|+Dqe`  
  • 8个平台
  • 100+台服务
  • 10+个集群分组
  • 微服务600+
  • 用户N+
9dO. ,U*`  
X:>,3[hx|  
二、面临问题 uPVO!`N3  
uj~(r=%  
=c ;.cW  
随着分布式微服务容器技术的发展,传统监控系统面临许多问题: $xqX[ocor  
X|'[\v2ld  
h]vu BHJ}  
  • 容器如何监控
  • 微服务如何监控
  • 集群性能如何进行分析计算
  • 如何管理agent端大量配置脚本
8zO;=R A7%  
这些都是传统监控所要面临的棘手问题,如何解决当前遇到的问题,GPE横空出世。 s?Z{LWZ@  
AsfmH-4)  
三、系统监控 xUF5  
$/kZKoF{f  
7Tc^}Q  
=/ +f3  
zi_0*znw  
  • 目标群体:系统日志、服务器、容器、系统软件运行指标
  • 日志架构:ELK (Elasticsearch+Logstash+Kibana+Redis)
  • 监控架构:GPE (Grafana+Prometheus+Exporter+Consul)
  • 报警方式:邮件、短信、钉钉以及定义webhook,监控中心7×24小时
gX~lYdA  
Tl L,dPM  
四、ELK日志 Gm[XnUR7V  
XI>HC'.0  
uC|bC#;  
随着分布式微服务的盛行,功能模块的拆分细化,无论对于开发还是运维,日志的重要性都是不言而喻的,但如何存储分析定位查看日志,一百个公司可能会有两百种做法。有的很少记录日志,有的日志等级都不分,有的写入文本后就不管不问了,有的向MySQL数据库一扔也没有了下文,等到用户投诉或者被发现问题,才会翻一翻。 Kut@z>SK  
那如何正确优雅地记录日志?相信大家对于ELK并不陌生,可能不少小伙伴都接触过,对于中小型互联网创业公司来说,使用ELK搭建日志分析系统的确是一个不错的选择。 /^9=2~b  
K*P:FCz  
五、架构图 g!;a5p6  
&9EcgazV  
Y;{(?0 s  
iBk1QRdn  
工作流 +' SG$<Xv  
6f^IAa|  
hO2W!68  
  • Exporter组件注册到Consul注册中心
  • Prometheus拉取Consul注册中心的servers
  • Exporter组件获取服务器或者系统软件的metrics
  • Grafana配置Prometheus数据源获取其采集数据结合自定义面板实现监控大屏
  • Grafana通过设置Alerting实现监控预警
:{ Lihe~\  
I&f!>y?,Z  
=C- b#4Q  
如文章开头所述,本文并没有一步步详细记录安装使用教程,这些教程网上都有,即使有坑,相信作为程序员的你也能够解决。不才,在这里只是抛砖引玉,希望各位小伙伴可以学到更多知识。还记得许多年前的春天,那时网站还都是静态页面,没有图片也没有绚丽的效果,没有24小时服务的客服,可当初程序员是那么快乐,虽然只有网页三剑客,在网上、在指尖、在BBS中,挥洒着自己的青春热血,如果有一天我老无所依,请把我留在在那互联网浪潮里。现如今,随着云计算、分布式、微服务的盛行,程序员的你是否已经疲倦与自己的CURD,是否已经不屑于与产品汪扯皮,来来来,返回顶部小伙伴们再看看一遍,谁说程序员全部的时间都要敲代码,是时候需要去需找自己的另一片天空了。
级别: 架构狮
发帖
1240
云币
1998
只看该作者 沙发  发表于: 01-31
      
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您在写长篇帖子又不马上发表,建议存为草稿
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个