摘要: 总结一下社区常见的问题,供大家参考。不过在描述具体问题之前,请先了解 Categraf 的核心职能: 采集监控指标 在即时查询里可以看到机器各个指标的历史趋势图,就是 Categraf 采集的监控指标。比如: 如果这个页面查不到机器的历史监控数据,说明采集、上报、存储链路出了问题。 上报机器元信息 阅读全文
posted @ 2025-12-15 19:54 IT运维监控 阅读(19) 评论(0) 推荐(0)
摘要: 在高性能计算领域,我们习惯于在代码、算法或基础设施中寻找瓶颈。但我遇到过的最棘手的问题却不在这些方面。那是Java虚拟机(JVM)的垃圾回收器与服务器磁盘之间一种无形的交互,导致一个每秒处理数百万请求的服务出现了15秒以上的全局暂停(STW)。 503 突增 我当时正在处理一个大规模的Java服务, 阅读全文
posted @ 2025-12-15 12:12 IT运维监控 阅读(148) 评论(0) 推荐(0)
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 夜莺监控设计思考(三)时序库、agent 的一些设计考量 夜莺监控设计思 阅读全文
posted @ 2025-10-31 16:08 IT运维监控 阅读(89) 评论(0) 推荐(0)
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 夜莺监控设计思考(三)时序库、agent 的一些设计考量 本篇聊聊夜莺里 阅读全文
posted @ 2025-10-29 11:15 IT运维监控 阅读(182) 评论(0) 推荐(0)
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 本篇主要回答: 夜莺和时序库对接的设计逻辑 夜莺和 agent 对接的设 阅读全文
posted @ 2025-10-28 20:20 IT运维监控 阅读(151) 评论(0) 推荐(1)
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 下面开始第2篇。 上一篇我们遗留了一个话题,就是如果贵司有多个数据中心,而且数据中心之间网络链路较差,此时应该怎么办 阅读全文
posted @ 2025-10-16 19:48 IT运维监控 阅读(201) 评论(0) 推荐(1)
摘要: JMX 是什么? JMX 是 “Java Management Extensions” 的缩写,中文通常称为 “Java 管理扩展”。它是 Java 平台提供的一套标准框架,用于对 Java 应用程序、设备、系统资源进行监控和管理。 JMX 的核心作用包括: 监控 Java 程序运行状态(如内存使用 阅读全文
posted @ 2025-10-14 15:50 IT运维监控 阅读(211) 评论(0) 推荐(2)
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 整体定位 了解一个开源项目,最应该了解的就是其定位,或者说它要解决的问题域。 夜莺的定位就是四个字:告警引擎。夜莺对接多种数据源(比如 Prometheus、VictoriaMetrics、MySQL、Cl 阅读全文
posted @ 2025-10-14 09:33 IT运维监控 阅读(345) 评论(0) 推荐(2)
摘要: 夜莺监控从 8.3 版本开始引入了新版的表格,力争对齐 Grafana(Grafana 积累了多年,确实太强了),本文图文并茂手把手教你配置一个 Table 仪表盘出来,用于展示机器列表,当然了,交换机、MySQL 实例等其他监控对象,也可以通过这个方式展示。 先看效果 JSON 文件:https: 阅读全文
posted @ 2025-09-01 15:42 IT运维监控 阅读(436) 评论(0) 推荐(0)
摘要: 可观测性已成为维护系统健康和性能的关键要素。虽然传统的采样方法曾发挥过作用,但尾部采样的出现代表了我们处理追踪数据收集与分析方式的范式转变。这种智能采样策略正在彻底改变各组织处理遥测数据的方式,在优化存储成本和系统性能的同时,以前所未有的精度捕获最有价值的追踪数据。 理解采样格局 在深入研究尾部采样 阅读全文
posted @ 2025-08-26 16:20 IT运维监控 阅读(81) 评论(0) 推荐(0)