半夜偷偷烧钱的服务器?用这套方案每年白捡一辆特斯拉

时间:2025-11-26 23:37:39来源:运维技术实践作者:IT资讯

你是半夜白捡一个程序员,前后端是偷偷你,运维还是烧钱斯拉你 。

公司有一批云服务器 ,用套上面部署了视频推荐 ,每年语音识别,辆特前端网页等各种应用服务。半夜白捡

你经常要手动将应用服务挨个部署到各个服务器上 ,偷偷服务器出问题了 ,烧钱斯拉还得跑到别的用套服务器上手动部署一遍。每天都累得嗷嗷叫  。每年

随着业务发展,辆特用户变多,免费模板半夜白捡应用 cpu 使用率变高,偷偷你需要手动部署更多应用到更多服务器上 。烧钱斯拉

可老板发现了问题,服务器实时计费,大晚上的没人用 ,放着也是浪费钱,如果能及时归还,那岂不是能省下一大笔服务器费用 ?

这 。 。 。难不成要你晚上手动归还服务器 ,第二天早上再重新申请新服务器 ,然后手动部署应用服务吗 ?

经常当牛马的源码库兄弟都知道 ,这听起来虽然很离谱,但也并非不可能 。

那有更好的解决方案吗 ?有!没有什么是加一层中间层不能解决的,如果有 ,那就再加一层 。

图片

这次我们要加的中间层有俩 ,分别是 Kubernetes 和 节点伸缩工具 ,比如Cluster Autoscaler和Karpenter 。在介绍它们之前,云计算我们先来了解下 Kubernetes 的几个概念 。

节点扩容工具

k8s 是什么

Kubernetes, 简称 k8s,我们可以把它当做服务器和应用服务之间的中间层 。在腾讯云里,它叫 TKE ,Tencent Kubernetes Engine。

k8s是什么

有了它,你不再需要苦哈哈手动部署服务,你只要写好一份类似 todo list 的配置文件,k8s 就可以自动将应用部署到各个服务器上 ,应用崩了还能自动帮你找到另外一台服务重新部署 。服务器租用

通过yaml文件部署服务

那它是怎么做到的呢?

我们知道 ,公司里通常会维护一批云服务器,它们可以是物理机或虚拟机。

k8s 会将这些服务器分为两类,一部分叫控制平面(control plane) ,另一部分叫工作节点,也就是 Node  。

控制平面和工作节点

control plane决定应用部署到具体哪个 node 上。而 node 则负责实际部署各种应用服务 ,这些千奇百怪的应用服务,我们统一管它叫 pod ,模板下载它们共同构成 k8s 集群 。

k8s集群

举个例子 ,不同的 node 可以是不同规格的服务器  ,有些 4c8g,有些 8c32g. 如果你想要部署一个 4c16g 的视频推荐服务 ,以前你需要手动选择服务器部署 ,但现在你只需要执行一行命令 ,control plane 就会自动帮你选择好 node  , 做自动部署。

并且随着业务发展,用户变多,应用的 cpu 使用率变高,源码下载k8s 还能帮你自动增加 pod,也就是所谓的扩容 。晚上资源利用率下来了,k8s 也能自动减少 pod 数量  ,完成缩容,很省心 ,让你感觉未来可期。

节k点伸缩工具是什么

可是问题又来了,k8s 的扩缩容是针对 pod 的,不是针对 node 的 。也就是说 ,有了 k8s ,你不需要手动部署服务了 ,可一旦 k8s 集群内总的工作节点 CPU 内存不足 ,你就还得手动到腾讯云上开关服务器,并手动将它们加入到 k8s 集群中。那有办法让node节点也支持弹性伸缩吗 ?

k8s的扩缩容维度

有,既然加一层中间层不能解决问题,那就再加一层 。

我们可以在 k8s 和云厂商服务器之间 ,加一层自动化节点管理工具来实现节点自动伸缩。

自动化节点管理工具

这类工具有很多 ,以腾讯云TKE为例,它同时支持 CA (Cluster Autoscaler)和Karpenter两种主流方案 。它们都可以实现节点伸缩功能 ,前者是K8s社区标准方案 ,后者则是新一代弹性伸缩方案 。我们来看下它们有哪些区别 。

TKE同时支持两种节点伸缩方案

节点扩容

不管是Karpenter还是CA ,它们实际上都会以 pod 的形式部署到 node 上 ,然后通过 control plane 获取 k8s 集群资源状态。

当它们识别到 k8s 集群内出现了一些想要部署但却由于 node 资源不足,导致无法部署的 pod 应用服务时,就会尝试去调用腾讯云的接口,创建云服务器 。再将它加入到 k8s 集群内,成为新的 node  ,完成扩容 。

这时,之前得不到资源的 pod 就能部署到新的 node 上 。

节点扩容

不同点在于 ,CA会预先设置好静态服务器的配置 ,相同配置的服务器们构成一个池子,也就是节点池 。资源不足时就在池子里建个新的同配置服务器 。

CA扩容

而Karpenter 则会动态实时计算当前缺了多少 cpu 和内存等信息 ,然后拿着这些信息调用腾讯云接口创建个资源大小合适、成本最优的服务器,相对来说扩容配置参数会少一些 。

Karpenter 扩容

node 扩容看完了 ,我们再来看缩容 。

节点缩容

每当夜幕降临 ,蝙蝠侠在哥谭市到处找你那不成器的兄弟时 ,k8s 的流量就会迎来低峰 ,pod 会缩容 ,此时节点伸缩工具 识别到部分 node 上面长时间没有正在跑的 pod ,就会触发腾讯云的接口,将云服务器回收 ,实现 Node 缩容。对于按时计费的服务器,可以大省一笔 。

节点缩容

这部分能力 ,CA和Karpenter类似,但Karpenter会综合考虑服务器成本,资源分配等更多因素,因此成本控制更精细 。

缩容的差异

节点整合

节点缩容后,剩下的一些 node 上虽然跑着 pod ,但可能会出现 cpu 和内存等资源分配率过低的情况 ,这时候 Karpenter 还能通过计算,重新将多个 node 上的 pod 整合到一个更合适的 node上 。从而提升单个 node 的资源利用率 ,这时候多出来的 node ,就还能进一步缩容 。这样就又省了一大笔。CA虽然不支持节点整合 ,但是也可以通过缩容分配率低的节点 ,提升其他节点的利用率 。

节点整合

节点替换

这还不够 ,当节点出现故障 ,比如底层硬件坏了,状态异常时 , Karpenter 还能立马向腾讯云申请新的云服务器作为 node ,并将 pod 迁移到新 node 上 ,实现节点替换,保证系统正常运行。同样CA也可以通过搭配TKE的节点自动修复功能实现类似的效果。

TKE 的优势

有了CA和Karpenter的加持,腾讯云TKE不仅能根据资源需求自动伸缩 ,还能优化服务器成本,确保你用的每一分钱都花在刀刃上。只需简单的配置,就能轻松将节点伸缩工具集成到你的K8s集群中,是绝对的懒人福音。

图片

同时腾讯云还在持续探索更多降本增效的方案,比如Karpenter on TKE还在原生Karpenter的基础上结合了 TKE FinOps 调度策略优化,助力业务进一步降低资源成本 。

图片

用了它 ,你老板里子有了,面子也有了 。

现在大家通了吗?

相关内容
推荐内容