使用sealos 快速部署 victoria metrics stack 套装 sealos run docker.io/labring/victoria-metrics-k8s-stack:v1.96.0 Vm stack不同于prometheus stack,对于一些需要证书的metrics需要手动生成配置 部署后 vmagent 可以看到如下…
Kubernetes API server pprof性能分析
![thumbnail](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAAGXRFWHRTb2Z0d2FyZQBBZG9iZSBJbWFnZVJlYWR5ccllPAAAABBJREFUeNpi+P//PwNAgAEACPwC/tuiTRYAAAAASUVORK5CYII=)
Kubernetes API server 默认启用了 profiling --profiling 默认值:true通过 Web 接口 host:port/debug/pprof/ 启用性能分析。引用:https://kubernetes.io/zh-cn/docs/re…
iframe嵌套grafana免登录页面
FailedMount:xxx: timed out waiting for the condition 问题解决
k8s 节点磁盘不足问题解决
k8s ingress如何自定义证书
大量terminated pod 不自动清理问题
优秀k8s Prometheus 告警规则示例
pod优化
ingress k8s work节点代理api server 6443
https://bxy4543.hzh.sealos.run/2024/06/14/iframe%e5%b5%8c%e5%a5%97grafana%e9%9d%a2%e6%9d%bf 结合上文iframe嵌套grafana面板后发现grafana每次仍然需要登录,十分麻烦,如果能够无需登录访问嵌套面板也更有意义。 免登录有两种方案实现: grafa…
症状 多个 pod 出现 timed out waiting for the condition 相关 Warning Warning FailedMount 4m kubelet Unable to attach or mount volumes: unmounted volumes=[hubble-tls host-proc-sys-k…
# 处理节点资源告警之磁盘余量不足: # 步骤1 查看根目录存储 root@test-node-003:~# df -h / Filesystem Size Used Avail Use% Mounted on /dev/vda2 197G 149G 40G 80% / # 步骤2 清理未使用容器镜像 root@test-node-003:~# c…
https://app.zerossl.com 申请免费证书 下载证书文件: ca_bundle.crt certificate.crt private.key 创建secret:kubectl create secret tls my-tls-secret \--cert=certificate.crt \--key=private.key 修改…
集群存在大量无状态(terminated)pod 切不会自动清理问题: 修改/etc/kubernetes/manifests/kube-controller-manager.yaml里的command命令后追加: https://kubernetes.io/docs/reference/command-line-tools-reference/k…
awesome prometheus alert rule groups: - name: node_exporter_alerts rules: - alert: Node down expr: up{job="monitoring-pi"} == 0 for: 2m labels: severity: warning annotations: …
pod.securityContext.fsGroupChangePolicy优化: https://blog.devgenius.io/when-k8s-pods-are-stuck-mounting-large-volumes-2915e6656cb8 通过fsGroupChangePolicy 中的字段,securityContext您可以控…
master节点本身带有使用主机网络的api server的静态pod,所以master节点可直接访问api-server,而node节点无法直接访问,因此通过集群ingress 6443端口负载到node节点时无法访问api-server,可以通过node节点代理来实现调整到master节点: apiVersion: apps/v1 kind: …