摘要: 参考链接: File SD ,Kubernetes SD ,Consul SD 一、服务发现(Service Discovery) 1.1 核心原理 Prometheus 采用 Pull 模型主动抓取指标,因此必须持有所有监控目标的访问地址列表。服务发现(Service Discovery, SD) 阅读全文
posted @ 2026-06-14 21:03 kyle_7Qc 阅读(8) 评论(0) 推荐(0)
摘要: 版本基准:Zabbix 7.0 LTS 数据库:以 PostgreSQL 语法为例,MySQL / TimescaleDB 原理相通 一、整体架构 Zabbix 数据库采用领域驱动设计,以「配置 → 采集 → 事件 → 告警」为主线,同时将权限、代理、辅助功能解耦为独立模块,所有层级通过逻辑外键紧密 阅读全文
posted @ 2026-06-14 15:46 kyle_7Qc 阅读(11) 评论(0) 推荐(0)
摘要: 一、概述 Alertmanager 是 Prometheus 生态的专属告警调度组件,承接 Prometheus Server 推送的告警数据,实现告警的去重、分组、抑制、静默、分级分发。在 Prometheus 架构中,告警由两个相互独立的组件配合完成: Prometheus Server:根据配 阅读全文
posted @ 2026-06-07 19:14 kyle_7Qc 阅读(44) 评论(0) 推荐(0)
摘要: 一、前言 Zabbix 是企业级主流开源分布式监控平台,具备数据采集、阈值告警、图形可视化、自动化运维等核心能力。Zabbix 7.0 为长期支持版本(LTS),生态成熟、稳定性高、适配性广,是企业生产环境首选版本。 本文基于 Ubuntu 24.04 操作系统,严格参照 Zabbix 官方容器文档 阅读全文
posted @ 2026-06-07 12:43 kyle_7Qc 阅读(32) 评论(0) 推荐(0)
摘要: 前言 在现代微服务和容器化架构中,监控需要回答两个不同层次的问题: “应用内部是否健康?” —— 容器 CPU/内存是否异常?OOM 是否发生过? 对应技术:cAdvisor(运行实例资源消耗采集) “从用户视角能否正常访问?” —— 服务是不是真的通了?DNS 解析正常吗? 对应技术:Blackb 阅读全文
posted @ 2026-06-02 23:21 kyle_7Qc 阅读(18) 评论(0) 推荐(0)
摘要: 一、Pushgateway 核心概述 1.1 是什么 Pushgateway 是 Prometheus 生态的独立推送网关服务,是为了弥补 Prometheus 原生 Pull(拉取)模式缺陷而生的中间件。 Prometheus 默认工作模式:主动定时拉取各 Exporter/业务接口的监控指标。 阅读全文
posted @ 2026-06-01 22:34 kyle_7Qc 阅读(26) 评论(0) 推荐(0)
摘要: 一. 什么是消息队列:核心定位与本质 消息队列(Message Queue,简称 MQ)是分布式系统中实现异步通信的中间件。其本质是一个“带存储能力且遵循先进先出(FIFO)原则的智能中转站”,用于在生产者(Producer)与消费者(Consumer)之间可靠地传递消息。 可以把它想象成一个“智能 阅读全文
posted @ 2026-05-30 20:50 kyle_7Qc 阅读(13) 评论(0) 推荐(0)
摘要: 生产环境必备技能:安全升级不停摆,数据备份保无忧 📌Grafana 的升级原则:先备份、小版本递进、测试环境验证、生产环境快速切换。 一、为什么要关注平滑升级与备份? Grafana 官方建议“经常升级以获得最新的修复和增强功能”。跨版本升级时,Grafana 会在启动时自动迁移数据库 schem 阅读全文
posted @ 2026-05-24 22:24 kyle_7Qc 阅读(31) 评论(0) 推荐(0)
摘要: 参考链接 官方文档 下载地址 Grafana Dashboard Grafana Plugins 一、什么是 Grafana? 简单来说,Grafana 是一个开源的数据可视化和分析平台。它就像一个超级强大的 "画图工具",能把各种来 源的枯燥数据,变成漂亮、直观的图表和仪表盘。 二 为什么选择 G 阅读全文
posted @ 2026-05-24 21:50 kyle_7Qc 阅读(39) 评论(0) 推荐(0)
摘要: 第一章:计算机网络基础(运维核心) 运维工程师日常核心工作离不开网络相关操作,高频场景包括:处理各类网络故障(如网络延迟、丢包、端口不通、DNS解析失败)、部署基础网络服务(如DNS、DHCP、防火墙)、优化网络性能、保障网络安全。核心要求是熟练掌握网络分层模型、核心协议、网络设备特性及故障排查方法 阅读全文
posted @ 2026-03-28 19:17 kyle_7Qc 阅读(50) 评论(0) 推荐(0)