检测 RDMA 网卡与 NVMe SSD 是否连接在同一个 CPU
检测 RDMA 网卡与 NVMe SSD 是否连接在同一个 CPU 上,可以通过查看设备的 NUMA (Non-Uniform Memory Access) 亲和性来实现。以下是具体步骤: 1. 安装必要的工具 首先,确保系统安装了 numactl 和 lspci 工具。这些工具通常预装在大多数 Linux 发行版中,但如果没有,可以使用以下命令进…
thumbnail
sealos 集群镜像之App镜像构建
全部镜像查看:https://github.com/labring-actions/cluster-image-docs?tab=readme-ov-file#docker-hub-images 单个版本实现 这里我们已新提交 openebs-lvm为例子: 1. fork https://github.com/labring/cluster-im…
thumbnail
在 Pod 中的容器之间共享进程命名空间
此页面展示如何为 Pod 配置进程命名空间共享。 当启用进程命名空间共享时,容器中的进程对同一 Pod 中的所有其他容器都是可见的。 你可以使用此功能来配置协作容器,比如日志处理 sidecar 容器, 或者对那些不包含诸如 shell 等调试实用工具的镜像进行故障排查。 配置 Pod 使用 Pod .spec 中的 …
处理系统崩溃 配置crash kernel crashdump
Crash Kernel 是指系统崩溃时启动的一个小型内核,专门用于捕获系统崩溃时的内存状态(称为 crashdump)。在现代 Linux 系统中,通常通过 kexec 机制来实现 crash kernel。 用途: 当系统遇到致命错误或崩溃时,通常会重启系统。但在重启之前,我们希望捕获崩溃时的内存信息,以便后续分析。 Crash kernel …
containerd 内存无限增长bug
背景 某应用部署后造成 Containerd 内存持续飙升,透过 ctr pprof 查询后发现函数 redirectLogs 占用了绝大部分的内存,且有 Containerd 配置如下: [plugins."io.containerd.grpc.v1.cri"] max_container_log_line_size = -1 如何找到容…
thumbnail
Atop 记录历史linux top信息
From: https://help.aliyun.com/zh/ecs/how-to-use-the-linux-system-atop-monitoring-tools#51eeccf4e1uww Ubuntu操作系统 atop是一款用于监控Linux系统资源与进程的工具,能够报告所有进程的活动。其以一定的频率记录系统和进程活动,采集的数据包含…
journalctl 命令帮助文档
journalctl 是 systemd 系统和服务管理器的一部分,用于查询和显示由 systemd 及其组件生成的日志条目。它提供了强大的日志管理和分析功能,适用于各种场景的日志查看和诊断。本文将详细介绍 journalctl 命令的用法和常见选项。 基本用法 查看所有日志: journalctl 显示系统启动以来的所有日志。 常见选项 启动相关…
2024年6月7日

今日高考,docker被墙,国内部分镜像加速被下架

607 日 , 2024 16:11
k8s 节点磁盘不足问题解决
# 处理节点资源告警之磁盘余量不足: # 步骤1 查看根目录存储 root@test-node-003:~# df -h / Filesystem Size Used Avail Use% Mounted on /dev/vda2 197G 149G 40G 80% / # 步骤2 清理未使用容器镜像 root@test-node-003:~# c…