经常有同事来问我为什么从 Grafana 面板上看不到数据,其实排查思路是基本固定的,按照查询的链路一步一步看 […]
Continue reading…
Posts tagged with '监控'
程序的 Metrics 优化——Prometheus 文档缺失的一章
Prometheus 设计的 Pull 模式监控非常优雅:程序开发者只需要做一件事情,暴露出来一个 HTTP […]
Continue reading…
SRE 线上操作指南
我们每天要进行大量的线上变更操作。怎么保证这些操作安全,不会导致故障,是我每天都在思考的问题。 这篇文章从工作 […]
Continue reading…
Alert 自动诊断系统的设计
在运维系统中,我认为 Alert 光发出来是不够的。每一个 Alert 发出来都需要处理,都要被解决。 我们现 […]
Continue reading…
Prometheus HTTP SD 框架
Prometheus 是现在比较流行的监控系统,它的工作模式是拉的模式:要监控的目标要负责把 metris 数 […]
Continue reading…