Crash Kernel 是指系统崩溃时启动的一个小型内核,专门用于捕获系统崩溃时的内存状态(称为 crashdump)。在现代 Linux 系统中,通常通过 kexec 机制来实现 crash kernel。 用途: 当系统遇到致命错误或崩溃时,通常会重启系统。但在重启之前,我们希望捕获崩溃时的内存信息,以便后续分析。 Crash kernel …
背景 某应用部署后造成 Containerd 内存持续飙升,透过 ctr pprof 查询后发现函数 redirectLogs 占用了绝大部分的内存,且有 Containerd 配置如下: [plugins."io.containerd.grpc.v1.cri"] max_container_log_line_size = -1 如何找到容…
Atop 记录历史linux top信息
journalctl 命令帮助文档
FailedMount:xxx: timed out waiting for the condition 问题解决
k8s 节点磁盘不足问题解决
使用公网机器代理访问内网机器
k8s ingress如何自定义证书
大量terminated pod 不自动清理问题
From: https://help.aliyun.com/zh/ecs/how-to-use-the-linux-system-atop-monitoring-tools#51eeccf4e1uww Ubuntu操作系统 atop是一款用于监控Linux系统资源与进程的工具,能够报告所有进程的活动。其以一定的频率记录系统和进程活动,采集的数据包含…
journalctl 是 systemd 系统和服务管理器的一部分,用于查询和显示由 systemd 及其组件生成的日志条目。它提供了强大的日志管理和分析功能,适用于各种场景的日志查看和诊断。本文将详细介绍 journalctl 命令的用法和常见选项。 基本用法 查看所有日志: journalctl 显示系统启动以来的所有日志。 常见选项 启动相关…
症状 多个 pod 出现 timed out waiting for the condition 相关 Warning Warning FailedMount 4m kubelet Unable to attach or mount volumes: unmounted volumes=[hubble-tls host-proc-sys-k…
# 处理节点资源告警之磁盘余量不足: # 步骤1 查看根目录存储 root@test-node-003:~# df -h / Filesystem Size Used Avail Use% Mounted on /dev/vda2 197G 149G 40G 80% / # 步骤2 清理未使用容器镜像 root@test-node-003:~# c…
内网机器: a(无公网ip) 外网ip机器:A 域名:test.domain.com (绑定机器A) 通过 test.domain.com 代理访问机器a端口 443: 在机器a 创建remote-autossh服务 cat /etc/systemd/system/remote-autossh.service [Unit] Descript…
https://app.zerossl.com 申请免费证书 下载证书文件: ca_bundle.crt certificate.crt private.key 创建secret:kubectl create secret tls my-tls-secret \--cert=certificate.crt \--key=private.key 修改…
集群存在大量无状态(terminated)pod 切不会自动清理问题: 修改/etc/kubernetes/manifests/kube-controller-manager.yaml里的command命令后追加: https://kubernetes.io/docs/reference/command-line-tools-reference/k…