记一次K8s排错实战

- - 掘金后端

这是我参与更文挑战的第3天，活动详情查看：. 收到测试环境集群告警，登陆K8s集群进行排查. 查看kube-system node2节点calico pod异常. 查看详细信息,查看node2节点没有存储空间，cgroup泄露. 登陆node2查看服务器存储信息，目前空间还很充足. 集群使用到的分布式存储为ceph，因此查看ceph集群状态.

CentOS7 安装 K8S

- - 企业架构 - ITeye博客

前提：VirtualBox CentOS7. 物理机IP 192.168.18.8. 虚拟机1IP：192.168.18.100（VMaster master）. 虚拟机2IP：192.168.18.101(VServer1 node1). 虚拟机3IP：192.168.18.102(VServer2 node2).

k8s水平扩容

- - Bboysoul's Blog

k8s 的好处就是可以弹性水平扩容和纵向扩容，平时纵向扩容用的不太多，所以今天说说水平扩容,在创建hpa之前你要确定集群中已经安装了metrics-server，我使用的是k3s，直接自带. 首先创建需要的容器,下面是dockerfile. 原理就是当你访问index.php的时候会进行一个循环计算来提高cpu的使用率.

# [k8s] HPA: Horizontal Pod Autoscaling

- - V2EX - 技术

HPA 是 K8S 的一大利器. 通过 HPA, 我们可以让服务的 pod 数量根据特定指标自动增加或减少, 使得在高峰期有足够的资源服务请求, 在低峰期又可以避免占用过多的资源. 同时, 在 SOA 架构下, 我们也习惯通过 HPA 来避免劳心劳力的为每个微服务计算所需的资源.. minReplicas: 允许的最小 pod 数量.

K8S环境搭建

- - ascotbe

内存：3GB或更多RAM. CPU: 2核CPU或更多CPU. **操作系统：**CentOS 10. 永久关闭是需要关机重启生效的，所以还是要把临时关闭命令也执行下. 不设置也可以，但是要保证主机名不相同，并且修改的hosts内容要与之对应. vi /etc/hosts添加如下内容. 如果kube-proxy 模式为ip_vs则必须加载，本文采用iptables.

在 v1.2x 版本中， Kubernetes 支持的最大节点数为 5000. 更具体地说，我们支持满足以下所有条件的配置：. 每个节点的 pod 数量不超过. Kubernetes v1.20 开始，默认移除 docker 的依赖，如果宿主机上安装了 docker 和 containerd，将优先使用 docker 作为容器运行引擎，如果宿主机上未安装 docker 只安装了 containerd，将使用 containerd 作为容器运行引擎；.

k8s docker集群搭建 - CSDN博客

- -

一、Kubernetes系列之介绍篇. 　　　　- 一次构建，到处运行. 2.什么是kubernetes. 　　首先，他是一个全新的基于容器技术的分布式架构领先方案. Kubernetes(k8s)是Google开源的容器集群管理系统（谷歌内部:Borg）. 在Docker技术的基础上，为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能，提高了大规模容器集群管理的便捷性.

深入掌握K8S Pod - Yabea - 博客园

- -

K8S configmap介绍. Pod是k8s中最小的调度单元，包含了一个“根容器”和其它用户业务容器. 如果你使用过k8s的话，当然会了解pod的基本使用，但是为了更好的应用，你需要深入了解pod的配置、调度、升级和扩缩容等. pod包含一个或多个相对紧密耦合的容器，处于同一个pod中的容器共享同样的存储空间、IP地址和Port端口.

浅谈 k8s ingress controller 选型 - 知乎

- -

大家好，先简单自我介绍下，我叫厉辉，来自腾讯云. 业余时间比较喜欢开源，现在是Apache APISIX PPMC. 今天我来简单给大家介绍下 K8S Ingress 控制器的选型经验，今天我讲的这些内容需要大家对 K8S 有一定的了解，下面是我的分享. 阅读本文需要熟悉以下基本概念：. 集群：是指容器运行所需云资源的集合，包含了若干台云服务器、负载均衡器等云资源.

SkyWalking探针在 k8s 中集成

- - 掘金后端

最近公司需要在 k8s 环境接入 SkyWalking，要让应用无感知接入. 开始打算的是把agent文件放到基础镜像中，这样应用只需要引用包含agent的基础镜像即可. 但是这样会有几个问题，首先不好管理agent，升级需要应用重新打镜像部署，动静太大. 第二，不是所有应用都需要接入，要按需引入不同基础镜像，这样就多个一个步骤，应用会有感知.

记一次K8s排错实战

一背景

二故障定位

2.1 查看pod

2.2 查看存储

三操作

3.1 ceph修复

3.2 进行pod修复

3.3 故障再次定位

3.4 对node2节点进行维护

3.4.1 标记node2为不可调度

3.4.2 驱逐node2节点上的pod

3.4.3 对node02进行重启

四反思

参考链接

相关 [k8s 排错] 推荐：