摘要: 适用于不登录 Node 的场景(已验证可用) 场景:EMQX 3883 端口抓包 推荐方式:kubectl debug node + tcpdump 抓目标 Pod IP。 不要再用 Pod 内 ephemeral container 写文件再 cp 的方法;在当前环境里不稳定。 标准流程只有 3 阅读全文
posted @ 2026-04-02 16:18 小家电维修 阅读(1) 评论(0) 推荐(0)
摘要: 备注:本文档所述结论基于当前测试结果形成,仅供参考,最终结论仍需通过后续深入测试验证。 测试环境:阿里云公有云(VPC 网络架构) 核心拓扑:阿里云全局加速器(GA)→阿里云四层网络负载均衡(NLB)→EMQ X MQTT 服务器(集群部署) 测试目的:实现客户端真实源 IP 端到端透传至 EMQ 阅读全文
posted @ 2026-02-04 16:31 小家电维修 阅读(19) 评论(0) 推荐(0)
摘要: 1.背景需求 企业在 中国大陆 和 新加坡 各自部署了环境,整体服务逻辑一致。 需求: 中国用户 → 访问中国区源站。 海外用户 → 访问新加坡源站。 源站分为两类: 应用服务源站(双 IP)。 静态资源源站(双 OSS 域名)。 2.源站类型与特点 IP 源站场景:使用 IP 作为源站时无需配置回 阅读全文
posted @ 2025-09-30 13:54 小家电维修 阅读(149) 评论(0) 推荐(0)
摘要: 在云环境中,Web 应用常见架构是: 用户 → CDN → WAF → CLB → ECS/Higress 本文详细解析 WAF 在网络拓扑中的位置、TLS 加解密流程、回源逻辑,以及自定义接入模式下的注意事项,结合阿里云官方推荐实践。 1.WAF 在网络拓扑中的位置 阿里云 WAF 提供两种主要接 阅读全文
posted @ 2025-09-29 16:44 小家电维修 阅读(81) 评论(0) 推荐(0)
摘要: 1.现象 2025/03/11 14:34:57 秒,iot-device-cloud-storage 调用 iot-cloud-storage-center 报错如图 2025/03/28 18:56:34 iot-user 服务滚动发布,iot-message-center 调用 iot-use 阅读全文
posted @ 2025-04-25 15:31 小家电维修 阅读(64) 评论(0) 推荐(0)
摘要: 1.背景信息 目前我们在使用阿里云 SLS 服务,涉及多个环境(如 debug 和 prod)。我们分别收集了 higress 的 stdout 输出日志和业务日志,存储在不同的 logstore 中:debug-cn-xx-higress 和 debug-cn-xx-podlog。问题在于 hig 阅读全文
posted @ 2025-04-15 11:45 小家电维修 阅读(176) 评论(0) 推荐(0)
摘要: 1.背景 在给线上环境的Pod增加HPA时,HPA通过云效的YAML模板自动部署,因此每次更新时,Pod会自动获得HPA能力。 线上如以下配置: 最小副本设置为1,最大副本为10; 扩容阈值设置为CPU和内存的75%; request CPU为1C、内存为1G; 但在发布过程中,Pod 副本从 1 阅读全文
posted @ 2025-04-09 21:38 小家电维修 阅读(134) 评论(2) 推荐(0)
摘要: 1.背景 SkyWalking 是一个用于监控微服务和分布式系统的工具。随着 Kubernetes 的普及,部署和管理 SkyWalking 变得复杂。为了简化这一过程,Helm 提供了一种方便的方式来快速安装和配置 SkyWalking。本篇文档的目的是帮助用户通过 Helm 在 Kubernet 阅读全文
posted @ 2025-03-15 15:56 小家电维修 阅读(569) 评论(0) 推荐(0)
摘要: 1.背景信息 在我们部门规划中,计划使用一套 Kubernetes 集群部署两个环境(pre 和 prod)。目前,pre 环境的节点池名称为 pool01-10,prod 环境的节点池名称为 101-110。为了确保 pre 的 Pod 部署到 pre 的节点池,prod 的 Pod 部署到 pr 阅读全文
posted @ 2025-03-15 15:32 小家电维修 阅读(60) 评论(0) 推荐(0)
摘要: 1.简介 Micrometer 是一个用于收集和报告指标的 Java 库,广泛用于 Spring Boot 和其他 Java 应用。它提供了对系统各项资源的监控支持,包括但不限于 JVM、内存、垃圾回收、线程池、HTTP 请求 等。 Micrometer 支持与多种监控系统的集成,例如 Promet 阅读全文
posted @ 2025-03-14 18:11 小家电维修 阅读(632) 评论(0) 推荐(0)
摘要: 1.背景 “由于阿里云 ACK 中,存活、就绪和启动探针的告警被包含在通用 warn 告警中,且该告警的触发频率为一次性触发,这导致我司项目中三大探针的告警频率过于频繁。因此,需要将这三大探针的告警从‘通用 warn 告警’中剥离。” 2.配置 1.找到ack集群告警配置项:报警配置→运维管理→告警 阅读全文
posted @ 2025-03-14 17:49 小家电维修 阅读(129) 评论(0) 推荐(0)
摘要: 1.引言 SkyWalking Agent 提供了内置的日志功能,用于记录运行过程中的信息、调试信息和错误信息。由于日志采集是通过直接读取本地日志文件的方式,因此需要将日志配置为写入本地文件。由于这里使用的是k8s 2.配置K8S 2.1 配置文件位置 在 SkyWalking Agent 中,日志 阅读全文
posted @ 2025-03-14 17:45 小家电维修 阅读(373) 评论(0) 推荐(0)
摘要: 1.hpa的值为什么是依据request来的?是否不太合理 Horizontal Pod Autoscaler(HPA)是 Kubernetes 中用来根据负载动态扩展或收缩 Pod 数量的控制器。它的扩展决策通常基于一些指标,比如 CPU 使用率、内存使用率,或者自定义的指标。你提到的 HPA 的 阅读全文
posted @ 2025-03-14 17:36 小家电维修 阅读(108) 评论(0) 推荐(0)
摘要: 1.目的 由于 Loki-Stack 是通过 Helm 安装的,而 Grafana 只是其中的一个组件,并且由于特定的 release 版本限制,配置 Grafana 使用 MySQL 存储的方式相对复杂。因此,这里记录了如何通过 Helm 部署 Loki-Stack 并配置 Grafana 使用 阅读全文
posted @ 2025-03-14 17:31 小家电维修 阅读(184) 评论(0) 推荐(0)
摘要: 1.故障背景 由于需要部署新环境,于是在阿里云新建一个ack集群,部署了业务,结果整晚上的存活探针告警,新集群接近30个业务pod,整晚上将近50多条存活探针告警,这个结果明显不正常。 但是查看所有pod状态事件全部正常,阿里云托管的ack也没有事件异常,第一反应确实是集群某些参数不对导致这个问题, 阅读全文
posted @ 2024-11-02 17:34 小家电维修 阅读(417) 评论(0) 推荐(0)