使用sealos 快速部署 victoria metrics stack 套装 sealos run docker.io/labring/victoria-metrics-k8s-stack:v1.96.0 Vm stack不同于prometheus stack,对于一些需要证书的metrics需要手动生成配置 部署后 vmagent 可以看到如下…
Kubernetes API server pprof性能分析
FailedMount:xxx: timed out waiting for the condition 问题解决
k8s ingress如何自定义证书
大量terminated pod 不自动清理问题
优秀k8s Prometheus 告警规则示例
pod优化
ingress k8s work节点代理api server 6443
k8s 常用kubectl 命令
Kubernetes API server 默认启用了 profiling --profiling 默认值:true通过 Web 接口 host:port/debug/pprof/ 启用性能分析。引用:https://kubernetes.io/zh-cn/docs/re…
症状 多个 pod 出现 timed out waiting for the condition 相关 Warning Warning FailedMount 4m kubelet Unable to attach or mount volumes: unmounted volumes=[hubble-tls host-proc-sys-k…
https://app.zerossl.com 申请免费证书 下载证书文件: ca_bundle.crt certificate.crt private.key 创建secret:kubectl create secret tls my-tls-secret \--cert=certificate.crt \--key=private.key 修改…
集群存在大量无状态(terminated)pod 切不会自动清理问题: 修改/etc/kubernetes/manifests/kube-controller-manager.yaml里的command命令后追加: https://kubernetes.io/docs/reference/command-line-tools-reference/k…
awesome prometheus alert rule groups: - name: node_exporter_alerts rules: - alert: Node down expr: up{job="monitoring-pi"} == 0 for: 2m labels: severity: warning annotations: …
pod.securityContext.fsGroupChangePolicy优化: https://blog.devgenius.io/when-k8s-pods-are-stuck-mounting-large-volumes-2915e6656cb8 通过fsGroupChangePolicy 中的字段,securityContext您可以控…
master节点本身带有使用主机网络的api server的静态pod,所以master节点可直接访问api-server,而node节点无法直接访问,因此通过集群ingress 6443端口负载到node节点时无法访问api-server,可以通过node节点代理来实现调整到master节点: apiVersion: apps/v1 kind: …
通过pod uid查找pod: kubectl get pods -A -o custom-columns=PodNamespace:.metadata.namespace,PodName:.metadata.name,PodUID:.metadata.uid | grep ${pod uid} 获取某节点上未启动pod: kubectl get …